Hay que tener en cuenta que a partir de los 286 se introdujeron los Wait States (tiempos de espera para que la RAM o componentes del chipset funcionen dentro del rango de frecuencias soportado) y es un dato que no suele conocerse. Es un mecanismo que reduce bastante el rendimiento, pero en su día permitía usar componentes más baratos en sistemas rápidos.
Supongo que los tiempos de espera (en su caso) serían muy similares para un micro 80286/16 y un 80386sx/16 tieniendo en cuenta que tanto el bus de datos externo y el de dirección es el mismo (16 y 24 bits respectivamente) y que los 386sx se montaban en placas madre similares a las del 80286 (con aquitectura ISA 16bits), de hecho creo que Intel tenía un 80386sx compatible con el 286 pin a pin que se podía montar en placas madre 286. Asimismo, la frecuencia de ambos es de 16 MHz (que sería la frecuencia de trabajo a la que deberían sincronizarse el resto de componentes, como la RAM). Por todo ello, en principio, he atribuído el menor rendimiento del 386sx/16 frente al 286/16, al trabajo extra que le supone conmutar los datos de 16bits externos al formato de 32 bits interno del micro.
No estoy muy seguro de si esto es así, pero es lo que tenía entendido, sin duda, distwave, nadie mejor que tú para sacamer de mi error.