Benchmarking con la Raspberry Pi

zup · Mensajepor **zup** » 14 Sep 2013, 20:09

Bueno, después de que me hayan llegado los radiadores para mis dos Raspberry Pi, he estado haciendo unos cuantos benchmarks de rendimiento y temperatura. Probablemente la red esté ya plagada de estas pruebas, pero aquí van las mías.

FASE 0: Definición de equipos y metodología de trabajo

En principio se han utilizado estas configuraciones:
- Viejo: Raspberry Pi modelo B 1.0 (256 megas), usando la distribución Debian recomendada en aquel tiempo (pero actualizada) y sin oveclock.
- Base: Raspberry Pi modelo B 1.0, usando Raspbian actualizada y sin overclock (las frecuencias de reloj son 700/250). Se supone que este equipo es la referencia.
- Normal: Raspberry Pi modelo B 2.0 (512 megas), usando Raspbian y sin overclock (700/250).
- Medio: Raspberry Pi modelo B 2.0, usando Raspbian con overclock medio (900/250).
- Turbo: Raspberry Pi modelo B 2.0, usando Raspberry con overclock turbo (1000/500).
- Pi 2: Raspberry Pi 2 Modelo B, con Raspbian para ARM 7 y sin overclock.

Por el lado de los PCs, tenemos:
- Fujitsu: Fujitsu Siemens Lifebook C6387. Portátil con Celeron a 850Mhz, 512 megas de RAM y una tarjeta i815.
- Probook: HP Probook 6470b. Portátil con i5-3320M (4 cores@2600), 8 Gb de RAM y una tarjeta Intel HD4000.
- ilunator: Clónico con AMD/FX6100 (6 cores@3300), 8 GB de RAM y nvidia GTS450.
- QuaZup: Clónico con AMD/Phenom II X4 965 (4 cores@3400), 8 Gb de RAM y nvidia GTS550.
- dv7: HP Pavillion dv7-1280es. Portátil con Core2duo T6400 (2 cores@2000), 4 Gb de RAM y nvidia 9600M GT.

La configuración de memoria usada en la Raspberry Pi ha sido de 192 megas en la GPU. Para igualar las cosas con los tests en PC, se ha utilizado Puppy Linux 5.5 (slacko) sin PAE. Primero se han compilado nbench e ioquake, y después se han probado en todos los equipos. En aquellos que necesitaban drivers (nvidia), se han instalado los drivers.

La metodología es la siguiente. Lo primero de todo se han compilado nbench e ioquake3 en todas las plataformas. Una vez obtenidos los programas de tests, se ha hecho esta prueba.

Se ha ejecuta un script que hace las siguientes acciones:
- Mide temperatura de la Raspberry.
- Ejecuta nbench.
- Ejecuta ioquake3 durante 5 minutos. Durante este tiempo, ioquake ha estado ejecutando la demo "four" en loop, para mantener entretenidos a los equipos.
- Mide otra vez la temperatura de la Raspberry.

Por último, se ejecuta otra vez ioquake3 y se usa timedemo para comprobar el rendimiento de ioquake. Entre prueba y prueba se apaga el equipo y se deja descansar un tiempo para que los componentes se enfríen.

NOTA 1: nbench únicamente mide el rendimiento de un núcleo, en sistemas multinúcleo no muestra todo el potencial de cálculo.
NOTA 2: Puppy Linux es una distribución de 32 bits, los micros de 64 bits tampoco han salido beneficiados.
NOTA 3: Se han usado estos programas porque funcionan (más o menos) en todos los equipos.

FASE 1: El rendimiento en números

Equipo:\|	Quake 3:\|	Memory:\|	Integer:\|	FPoint:	OLTP:	CPU:
Viejo	14,9	2,100	2,841	0,224	--	--
Base	20,2	2,447	3,091	2,026	389	512.7791s
Normal	21,7	2,444	3,094	2,046	5131	514.1827s
Medio	24,3	3,057	3,955	2,527	5516	397.0525s
Turbo	33,8	3,652	4,525	3,014	6898	352.3676s
Pi 2	66,5	4,344	5,659	4,789	11944	74.5870s

En este test se pueden comprobar una serie de cosas:
- La elección de Debian/armel como distribución de salida para la Raspberry Pi fue bastante desafortunada. Aunque el rendimiento es ligeramente inferior en enteros, el hecho de que no se aproveche de la coma flotante por hardware hace que su rendimiento sea pésimo. Pierde casi un 90% de rendimiento en cálculo y en la vida real (Quake) pierde más del 25%.
- En términos de tests sintéticos, no hay mucha diferencia de rendimiento entre la versión 1.0 (con 256 megas) y la versión 2.0 (con 512 megas). En Quake 3, quizás si que se haya hecho notar la memoria extra, con una subida de rendimiento del 7%.
- Overclockeando la Raspberry se obtiene bastante beneficio. En nivel medio (que es bastante estable sin refrigeración extra), se obtiene una ganancia del 20% en Quake y de alrededor del 25 al 30% en los tests de nbench. Es más que suficiente para que muchas de las cosas que cojean algo empiecen a ir bien.
- Si fuerzas la pobre Raspberry al modo Turbo, las cosas se disparan. En este modo, se sube la frecuencia del core al doble (además de subir un 42% la de CPU). Traducido al castellano: el rendimiento aumenta un 67% en Quake, y entre el 45 y el 50% en el resto de apartados. Eso sí, el modo Turbo es muy inestable (en algunos casos se ha informado de corrupción de las tarjetas SD) y, como se verá luego, la refrigeración va a jugar un papel crítico en este caso. Existe otro modo intermedio entre el medio y el turbo que es más estable y podría ser suficiente para la mayoría de usos.
- Si echamos una ojeada en la tabla de resultados de nbench, en cálculo de enteros nuestra Raspberry Pi (sin overclockear) se situaría cerca de un Pentium III a 900 Mhz o procesadores AMD a 600~700 MHz, siendo más lenta tanto en operaciones con la memoria (¿por la caché?) y mucho más lenta en coma flotante. No tiene ningún equivalente directo, en algunos apartados la Raspberry rinde mejor y en otros peor.
- Si usáramos Quake 3 como benchmark, descubriríamos que la Raspberry Pi machacaría a equipos teóricamente mucho mejores en cálculo. Hay que recordar que la GPU de este bicho es bastante potente y, aunque no sea un rival para equipos recientes, está a un nivel bastante alto... lo suficientemente alto como para correr Quake 3 a 1920x1080 a 20 fps.

FASE 2: La cosa se pone calentita
Hablemos de temperaturas. Las Raspberry no son demasiado propensas a calentarse, y por ello no se incluye ningún tipo de refrigeración adicional de serie. El problema es cuando vas a hacer algo de overclocking porque el rendimiento no te es suficiente. En ese caso, las temperaturas pueden elevarse rápidamente y quizás quieras tener a mano refrigeración extra. Existen juegos de radiadores que se conectan en los tres chips más propensos a calentarse: el SOC, el chip ethernet y el regulador de tensión. En la siguiente tabla podemos ver cómo están de calentitas las cosas:

Modo:	Text\|	Tini\|	Tfin\|	Text*\|	Tini*\|	Tfin*\|
Normal	21.5º	36.9º	54.6º	22.5º	33.6º	53.0º
Medio	21.5º	35.2º	58.4º	21.5º	30.9º	53.5º
Turbo	22.0º	34.2º	64.8º	21.5º	30.9º	60.0º

Las temperaturas indicadas en la tabla son las siguientes:
- Text: Temperatura exterior. Está medida con un reloj-termómetro en las proximidades de la Raspberry Pi. La precisión en el display es de medio grado. Esta medida se ofrece como referencia.
- Tini: Temperatura de la Raspberry al iniciar el benchmark. Se ha medido usando el comando /opt/vc/vcgencmd measure_temp y se ofrece como referencia.
- Tfin: Temperatura de la Raspberry al finalizar el benchmark, medida con el mismo comando que la anterior.

Las medidas marcadas con asterisco son iguales que las anteriores, pero han sido hechas después de instalar un kit de refrigeradores a la Raspberry. El objetivo era verificar cuánto pueden ayudar estos kits en caso de overclocking.

Hay dos fallos en estos tests, y es que los he hecho por la vía rápida (soy un poco ansioso por probar cosas nuevas en mis juguetitos). El primer fallo es que la temperatura inicial (en reposo) se ha tomado nada más arrancar la Raspberry, lo que hace que no sea muy de fiar (después de un rato la temperatura se estabiliza y debería haberla medido). El segundo fallo es que quizás se podría haber dejado bastante más tiempo corriendo ioquake. En el caso de la Raspberry Pi sin refrigeración en modo Turbo no quería fastidiar el SOC, así que he optado por hacer un "sprint" y medir antes de quemar algo. Según algunos artículos, la temperatura máxima recomendable es de 85º en el BCM2835... pero a saber cuándo deja de ser estable del todo.

En cualquier caso, se puede ver que la Raspberry se ha beneficiado bastante del nuevo juego de radiadores. Bastante quiere decir como 3 o 4 grados menos de temperatura en todos los modos, lo que sin duda aportará algo de estabilidad cuando se fuercen las frecuencias... y no olvidemos que parece ser que el estado natural de una Raspberry Pi parece ser con algo de overclocking.

FASE 3: Contra los PCs:
Se ha comparado el rendimiento entre varios PCs y la Raspberry. Los resultados son los siquientes:

Equipo:	ioquake3:	Memory:	Integer:	FPoint:	OLTP:	CPU:	Observaciones:
RPi@700	39,1	2,444	3,094	2,046	5131	514.1827s	Raspberry Pi sin overclock
RPi@900	49,5	3,057	3,955	2,527	5516	397.0525s	Raspberry Pi con overclock medio
RPi@1000	59,8	3,652	4,525	3,014	6898	352.3676s	Raspberry Pi con overclock turbo
RPi2@900	95,1	4,344	5,659	4,789	11944	74.5870s	Raspberry Pi 2
Fujitsu	0,3	4,945	3,930	8,408	6913	92.8005s	Puntuación en Windows: 21,4 fps
Probook	687,0	26,862	21,213	40,305	--	--	---
ilunator	973,7	20,336	15,458	25,140	257551	3.0906s	---
QuaZup	1000,8	26,580	24,892	43,126	343783	4,0756s	Puntuación de ioquake3 en Windows: 951,7 fps
dv7	945,9	15,926	13,237	27,723	116347	7,1482s	---

Unos comentarios:
- La perdedora en potencia de cálculo es claramente la Raspberry Pi... a menos que le apliquemos overclock. Por otra parte, su coste es una fracción del resto de los equipos (salvo los más viejos).
- Esta vez se ha usado Quake 3 ejecutado a 640x480 (no todas las tarjetas de la prueba llegarían hasta los 1920x1080). Se ha utilizado una configuración optimizada para la Raspberry (ver más abajo) en todos los equipos. Eso debería igualar los resultados ya que la versión de ioquake3 para Raspberry y la de Puppy linux no usaban los mismos ajustes.
- Los dos equipos con tarjetas gráficas Intel han dado resultados muy pobres en ioquake3, posiblemente porque los drivers de las tarjetas Intel en Linux no son muy buenos. En ambos casos, ejecutar ioquake3 bajo Windows ha aumentado el rendimiento espectacularmente. Malas noticias para los que tengan tarjeta gráfica integrada. En ambos casos he puesto el resultado de ioquake3 bajo Windows, aunque no es directamente comparable a los de Linux (eso sí, es bonito ver que la Raspberry Pi es casi tan rápida como un i5

). También incluyo el resultado de uno de los equipos de sobremesa, para comparar.
- Intel sigue sin saber hacer tarjetas gráficas decentes. La HD4000 se ha quedado incluso por detrás del dv7 (también portátil, con menos micro y memoria, y varios añitos a sus espaldas).
- La configuración específica para Raspberry mejora un montón el rendimiento (ver la primera tabla, sin optimizar), pero no usa capacidades más avanzadas de las tarjetas gráficas. Como resultado, la Raspberry ha triplicado sus resultados normales en Quake (aunque la diferencia entre los modos 640x480 y 1920x1080 no es tan grande, posiblemente debido a algún antialiasing activo) y los PCs también han subido de rendimiento respecto a configuraciones por defecto. La subida ha sido de un 20% en los sobremesas (tarjetas gráficas muy buenas), y el HP dv7 ha duplicado su rendimiento (está claro que algún efecto se le atragantaba). Curiosamente, los Intel no se han movido de sus sitios.
- Los resultados de nbench pueden parecer "descolocados", con los micros de 4 cores plantando batalla al de 6. Como ya se ha mencionado, nbench mide los resultados de un único core (lo que, por cierto, puede dar idea de lo optimizados que están unos cores en relación a otros). Una aproximación sería multiplicar los resultados por el número de cores. Esto no es muy científico (a fin de cuentas, el diseño de placa, chipset y CPU hará que se pierda más o menos rendimiento cuando los cores procesan en paralelo), pero da una idea general de la potencia de unos micros en relación a otros. Si alguien tiene sugerencias de algún otro benchmark que se pueda usar para multicores, que lo mencione.

P.D.: Que alguien me cuente cómo se definen borde y anchura en las tablas, que estas me han quedado penosas.

Wayfarer · Mensajepor **Wayfarer** » 14 Sep 2013, 22:18

Muy buen trabajo. Esperamos ansiosos los resultados :-)

Por cierto, se me ocurre que si tienes por ahí un viejo Pentium III a 700MHz podrías incluirlo también en la comparativa, para tener una idea del rendimiento de la Pi en comparación con un procesador antiguo de características similares al ARM1176JZF-S. No sé, es una idea :-)

zup · Mensajepor **zup** » 15 Sep 2013, 11:28

Lo veo un poco complicado... tengo tirado por ahí un portátil Fujitsu Siemens que tiene un Celeron 850, y por debajo de eso un Pentium 166MMX y un 486 DX2/66.

Ahora mismo tiene un Windows (para el grabador de EPROM)... tendría que instalarle un Linux para pasar el nbench, y además el test del Q3 sería imposible de pasar (la tarjeta gráfica es una i810 que dudo mucho que llegue a 1920x1080).

Es más fácil que si tienes un equipo de rendimiento aproximado" con un Linux instalado, compiles y ejecutes nbench y postees los resultados; o que mires la tabla de resultados de nbench y busques un rendimiento parecido.

Yo lo he hecho, pero no hay equipos directamente comparables. Quizás lo más sorprendente sea que la Raspberry parece ser algo lenta haciendo operaciones con la memoria... ya me imaginaba que la unidad de coma flotante no iba a estar a la par de procesadores mucho más potentes.

Para igualar un poco los tests, en mi PC he ejecutado nbench y quake3 arrancando debian en modo recuperación (para minimizar influencias de procesos externos). En el caso de quake solo puede arrancar desde las x, así que he usado xinit para que tampoco arrancara ninguna cosa "extraña". Como curiosidad, ioquake3 da 609.9 si se arranca de este modo; en configuración "normal" (arranque normal, ejecutado desde KDE) daba 586 fps. Eso significa que, en mi equipo, se pierde un 4% por demonios y KDE. Quake 3 usa la configuración "por defecto" salvo en el caso de la resolución, para igualar resultados entre ambas plataformas.

zup · Mensajepor **zup** » 16 Sep 2013, 13:35

Añado otra tabla con una comparativa entre la Raspberry y varios PCs.

EDITO: Cambio la configuración de test de ioquake, cambio también la tabla de resultados.

zup · Mensajepor **zup** » 19 Sep 2013, 14:55

Última versión de las tablas de comparación. He "trucado" la competición para beneficiar a la Raspberry Pi en ioquake (parece ser que tiene algunos efectos que no se pueden desactivar y se comen mucha potencia), con lo que todos los equipos han variado su rendimiento excepto los Intel.

Usando Puppy 5.6 en los equipos Intel he logrado que la gráfica funcione. Si, a secas. Con la Puppy 5.5 el Fujitsu iba a "flashazos" y no pudo terminar el test de ioquake 3 (aunque con la nueva versión ha tardado más de una hora en ejecutarlo). De todas formas, los drivers no son muy buenos... a los resultados me remito.

También he usado una versión antigua para poder ejecutar ioquake3 en Windows 2000. Con ello descubrimos que este equipo en concreto en quake tiene el rendimiento... de media Raspberry Pi. Ya sabía que la tarjeta no era muy buena... ¿pero TAN mala?

En fin, si alguien tiene sus propios experimentos... que los postee. Las claves son compilar nbench en el sistema de destino y usar exactamente los ajustes que he puesto para ioquake3. Eso debería igualar los resultados para todos los equipos (de todas formas, el rendimiento de la Raspberry sin ajustes especiales está en la primera tabla). También sería interesante postear resultados de otros sistemas "extraños"... a fin de cuentas nbench puede ser compilado para cualquier sistema que corra variantes de Unix (hay hasta una app para Android).

dondiego · Mensajepor **dondiego** » 19 Sep 2013, 22:50

Sólo decir que ese celeron a 850 ya equivale más o menos a un p3 a 700 y que el fujitsu claramente está corriendo el quake 3 por software o sea que no hay drivers con soporte opengl del intel 815 para linux. El 815 lleva integrado un 752 que es un 740 mejorado y esas gráficas se podría decir que eran clase voodoo1, los gráficos de intel efectivamente nunca han dado un rendimiento bueno.

zup · Mensajepor **zup** » 22 Sep 2013, 23:06

No estoy tan seguro con lo de que los intel estuvieran corriendo quake por software... el Probook tenía activado vsync por defecto y después de desactivárselo temporalmente (no parece que pueda hacerlo globalmente) el rendimiento está más acorde con el equipo. Tabla corregida.

En el caso del fujitsu, glxgears muestra diferencia entre usar el driver vesa (1.4 fps) y el intel (2.0 fps). Eso significa que hay (algo) de aceleración (no mucha, pero menos es nada).

dondiego · Mensajepor **dondiego** » 23 Sep 2013, 12:32

Sale el mensaje repe. Yo si lo tengo claro, tendría que dar mucho más en el fujitsu también esa prueba. Pero eso no quiere decir que no mole el fujitsu.

zup · Mensajepor **zup** » 23 Sep 2013, 12:40

No se por qué cada vez que envío un mensaje con la tablet, sale repetido. Con lo bien que se envían mensajes desde el sofá...

zup · Mensajepor **zup** » 12 Feb 2015, 22:06

Hoy toca nuevo contendiente y nuevos tests. Me ha llegado mi nueva Raspberry Pi 2, así que me ha tocado otra tanda de análisis (que no he completado todavía).

Además de incluir al nuevo contendiente, he metido otros dos tests que podéis probar en vuestros linux.

El primero es OLTP y es un test que mide el rendimiento de una base de datos. Los resultados de este test se van a ver influenciados (y mucho) por la memoria instalada y el tiempo de acceso al disco. Para realizarlo, primero se ha preparado creado una base de datos (dbtest, hay que crearla desde mysql) que luego se ha rellenado con un millón de registros, ejecutando esta instrucción:

Código: Seleccionar todo

sysbench --test=oltp --oltp-table-size=1000000 --mysql-db=dbtest --mysql-user=[USER] --mysql-password=[PASSWORD] prepare

Después, se ha reseteado el equipo y se ha ejecutado esta otra instrucción que es la que nos da los resultados:

Código: Seleccionar todo

sysbench --test=oltp --oltp-table-size=1000000 --oltp-test-mode=complex --oltp-read-only=off --num-threads=32 --max-time=300 --max-requests=0 --mysql-db=dbtest --mysql-user=[USER] --mysql-password=[PASSWORD] run

El resultado anotado es el número de transacciones que ha podido realizar en esos 5 minutos. A números más grandes, mejor rendimiento.

El segundo test que se ha incluído es el de CPU, que medirá la fuerza bruta del equipo (generando primos). La ventaja frente a nbench es que en este test se pueden lanzar varios hilos y medir el rendimiento de CPUs multicore (o placas con varios micros). Para ejecutarlo, hay que teclear esto:

Código: Seleccionar todo

sysbench --test=cpu --num-threads=32 run

En ambos tests he metido 32 hilos, para hacer sudar a los micros. En cierto modo, también van a medir el rendimiento de otros elementos como la gestión de procesos y esas cosas. En el caso de los PCs, los tests se han realizado usando una Knoppix 7.4.2 copiada al disco duro de los equipos, de manera que se beneficiaran de la velocidad de acceso y dieran resultados más reales (los primeros resultados, tirando de USB, estaban por detrás de la Raspberry Pi). La Knoppix ha sido lanzada con los parámetros siguientes:

Código: Seleccionar todo

knoppix 2 nozram noswap fromhd=/dev/sda1

Se ha desactivado el modo gráfico, la zram y el swap ya que la Raspbian que tenía equipada la Raspberry tampoco tiene nada de eso activado. En los equipos con micros a 64 bits se ha utilizado knoppix64.

Ahora los resultados. En el test de CPU, vemos que nuestra nueva Raspberry ofrece mucha más potencia que las tradicionales (más de 5 veces el rendimiento de una Raspberry de 512 megas a igualdad de frecuencia y casi 7 veces si ninguna lleva overclocking).

En el test de bases de datos, hay algunos datos interesantes. De momento, nos podemos quedar con que el rendimiento de la Raspberry Pi 2 solo duplicaría al de una Raspberry Pi de 512 megas (a igualdad de frecuencia). Esto es debido a que este test se ve muy influenciado por el tiempo de acceso a disco, y pasa demasiado tiempo a la espera de la tarjeta SD. Otro dato interesante es que la primera versión de la Raspberry Pi (la de 256 megas) iba demasiado corta de memoria. Los datos son muy claros: un 7.5% de las transacciones que consigue una Raspberry Pi con el doble de memoria, de nuevo comparándolas a la misma frecuencia. No he sacado todavía rel rendimiento de la Raspberry Pi de 256 megas con la distribución original (sin soporte hard-float), pero aunque no espero cambios radicales tampoco espero que mejore los datos.

En cuanto a la comparación con los PCs, no hay mucha sorpresa. La nueva Raspberry Pi adelanta al Fujitsu (Celeron 850) pero queda muy por detrás de los equipos más modernos, sobre todo en el test de base de datos. Ahí se nota (y mucho) el ancho de banda de los discos duros. Ninguno de los equipos tiene instalado disco duro SSD... eso seguro que hubiera empujado los tests (y mucho) hacia arriba. Entre los PCs hay una anomalía: el de 6 cores, da más rendimiento de CPU que el de 4 (normal) pero menos en el de base de datos. Imagino que el disco duro tendrá menos caché o será algo más lento, pero eso es todo. En cuanto al Probook, no hay resultados porque este equipo tiene el disco duro cifrado y no se ha podido instalar la Knoppix como en los demás.

ZONA DE PRUEBAS

Benchmarking con la Raspberry Pi

Benchmarking con la Raspberry Pi

Re: Benchmarking con la Raspberry Pi

Re: Benchmarking con la Raspberry Pi

Re: Benchmarking con la Raspberry Pi

Re: Benchmarking con la Raspberry Pi

Re: Benchmarking con la Raspberry Pi

Re: Benchmarking con la Raspberry Pi

Re: Benchmarking con la Raspberry Pi

Re: Benchmarking con la Raspberry Pi

Nuevo contendiente y nuevos tests.

¿Quién está conectado?