El 6809 es un procesador mucho mejor que el Z80; de hecho ese Motorola 6809 es el mejor procesador de 8 bits de la historia, con diferencia, pero llegó más tarde y era más caro, así que en ordenadores quien se comió el mercado fueron el MOS 6502 y el Zilog Z80.
Al 6809 yo lo veo como una gigantesca mejora sobre su antecesor -el 6800 (éste sí que era malo)- y como una gran mejora sobre el MOS 6502 -que era su enemigo comercial-.
El primer procesador que programé fue un 6502, y le tengo un cariño especial. Además tanto el 6502 como el Z80 son los usados en los mejores ordenadores de 8 bits, con lo que ello implica. No obstante lo anterior no me impide alabar al 6809 y ver su superioridad.
Pongo algunos ejemplos de por qué ese 6809 es tan maravilloso, comparándolo especialmente con los otros 8 bits que sí se comieron el mercado:
-El 6809 tiene dos pilas (stacks) ambas de 16 bits: una para el usuario y otra para el sistema. En los 8 bits lo normal es tener solo una: el Z80 tiene una de 16 bits y el 6502 una de 8 bits (sí, solo tiene una capacidad de 256 bytes).
-Lo que es la página cero, que es un área de 256 bytes, puede fijarse en cualquier posición (múltiplo de 256) de la memoria. En el 6502 esa página está fija en la posición 0 [nota 1], ocupa 256 bytes, de la posición 0 de memoria hasta la 255; por contra en el 6809 esa importantísima página se puede ubicar en cualquier posición múltiplo de 256.
¿Por qué es tan importante esa "página cero" (en el 6809 no es ya la página "cero" porque puede estar en cualquier otra página -áreas de 256 bytes empezando por una dirección múltiplo-? Pues porque el acceso a esos datos es más rápido, además de que un progama manipulándolos no solo es más rápido, sino que también requiere menos memoria [Nota 2], y porque además esos 256 bytes se usan como punteros (tienes hasta 128 punteros listos para ser usados).
El Z80 no tiene esa "maravilla" de la página CERO/DIRECTA de los 6502/6809. Y esta página es algo básico dentro de estos procesadores, tanto que a veces no hay que ver por ejm al 6502 como un procesador con 3 registros principales (A, X, Y), sino como un procesador con 256 "registros", los de la página cero, siendo los otros 3 temporales. Y es que esos registros se usan, entre otras cosas, para el direccionamiento como punteros a otras posiciones de memoria.
[nota 1]: En el Commodore 128 esa página (y también la de la pila) puede reubicarse donde se quiera, pero no es gracias a su CPU 8502 (es como un 6502/6510) sino a un chip gestor de memoria (MMU) externo, que hace la relocalización de esas posiciones de memoria de acuerdo a sus registros.
[Nota 2]: La instrucción para cargar por ejm el contenido de una posición de memoria cualquier ocupa 3 bytes (por ejm LDA $1234, que carga el acumulador con la posición de memoria 1234h); por contra la misma instrucción para cargar una posición de la página cero ocupa solo 2 bytes (por ejm LDA $12, para cargar la posición $0012), y se ejecuta más rápidamente.
-El 6809, a diferencia del 6502, tiene casi todos sus registros de 16 bits: el acumulador puede usarse como dos registros de 8 bits o como uno de 16 bits; los registros X e Y son de 16 bits.
-El 6809 tiene los potentes modos de direccionamiento de memoria típicos de un 6502, además con muchas más mejoras, y encima con registros de 16 bits como el Z80. Y encima manteniendo la característica de ser más eficiente: un 6502 o un 6809 necesitan menos ciclos de reloj que un Z80 para completar una misma instrucción (el Z80 compensa yendo a más frecuencia).
-El juego de instrucciones y sus registros complementarios son muy ortogonales en el 6809. Esto quiere decir que por ejm en casi todas las instrucciones tienes los mismos formatos de direccionamiento, lo cual lo hace muy cómodo de programar. En otros procesadores 6502/Z80/Intel 8086 ocurre lo contrario: cierta instrucciones solo soportan ciertos modos de direccionamiento, o ciertas operaciones o direccionamientos solo pueden hacerse en ciertos registros, lo que es "incómodo".
Hablando de ortogonalidad: el Motorola 68000, que fue desarrollado en paralelo por otro equipo (realmente no es una evolución del 6809), lleva ese concepto aún más fuertemente.
-El 6809 permitía hacer código independiente de su posición en memoria; es decir programas (o trozos de programas) que pueden reubicarse en cualquier posición de memoria sin que esa reubicación afecte al resultado. En un 6502 o un Z80 eso es ciencia-ficción,

también en un Intel 8086 (que tiene muchas reminiscencias de 8 bits, en vez de ser un 16 bits puro).
He citado unas cuantas cuestiones -y otras que me dejo- que hacen que el Motorola 6809 sea una impresionante maravilla dentro de los 8 bits, y el mejor procesador de 8 bits con diferencia, y una delicia para el programador (yo no lo he usado, pero puedo imaginar la delicia que es hacerlo, habiendo usado muchos otros).
En cuanto a la velocidad: «6809 a 1,5MHz vs Z80 a 4MHz»: la frecuencia del reloj (los MHz), como sabes, no nos indica la velocidad del procesador ni su potencia, pues ésta depende de la potencia de sus instrucciones y de cuántos ciclos de reloj necesita cada instrucción. El 6809 es mucho más potente en muchos aspectos, y sus instrucciones necesitan menos ciclos de reloj que las del Z80. Yo lo tendría claro: me quedaría a ciegas con el 6809.
También el usar el Z80 para el sonido puede deberse a que ya tenían rutinas para manejar los chips de sonido, en código del Z80, y no tendrían motivo para cambiarlo, pues ese código igual era reutilizado de una máquina anterior, con lo cual se ahorraban ese coste.
Sin duda el 6809 sería el preferido por los programadores... todo un placer para ellos. Y si un programador tiene un procesador que le permite disfrutar mucho más y ser más productivo, se supone que eso debería notarse

Sobre el precio, al menos el original del 6809 era bastante más elevado que el de los otros, pero igual en el precio total de una máquina arcade era algo poco relevante.