lunes, 19 de abril de 2021

La arquitectura AMD RDNA2 es superior a Nvidia Ampere

Las AMD Radeon RX 6000 Series (RDNA2) y las Nvidia GeForce RTX 30 Series (Ampere) llevan mucho tiempo en el mercado, pero hasta ahora nadie había decidido realizar una prueba de rendimiento en lo que respecta al rendimiento ligado a las latencias de memoria de ambas arquitecturas.

A las puertas de los diseños chiplet para GPU, es bastante interesante medir el rendimiento de la memoria caché y la latencia que presenta, y por ahora AMD lleva ventaja en este aspecto por partida doble, y que con sus CPUs AMD Ryzen estrenó el diseño chiplet, y con sus gráficas ya están hallando el camino con la conocida Infinity Cache.

En Chips and Cheese quisieron probar el rendimiento de la memoria caché y las latencias que presentaba la actual generación de gráficas, y para ello enfrentaron en un benchmark a la AMD Radeon RX 6800 XT con la GPU tope de gama de Nvidia, la GeForce RTX 3090.

El resumen del benchmark es evidente, en este aspecto, la arquitectura RDNA2 es muy superior a Ampere, ya que ofrece unas latencias inferiores a pesar de tener que comprobar dos niveles más de caché en el camino hacia la memoria. El uso de la Infinity Cache sólo añade 20ns sobre la caché L2 y aún sigue siendo más rápida que la integrada en la GPU de Nvidia.

La razón expuesta es que el chip gráfico Nvidia GA102 es una mera GPU mucho más grande y, aunque utiliza un subsistema de memoria de GPU más convencional con sólo dos niveles de caché, tiene que tomar muchos ciclos que da como resultado una latencia de más de 100ns (L1 a L2). En cambio, con el chip gráfico AMD Navi 21 se tiene una latencia de sólo 66ns. La GPU AMD Navi 21 es mucho más pequeña y cuenta con una caché L2 de 4 MB, mientras que la GPU Nvidia GA102 cuenta con una caché L2 de 6 MB.

"La caché de RDNA 2 es rápida y hay mucha. En comparación con Ampere, la latencia es baja en todos los niveles. La Infinity Cache sólo añade unos 20ns de impacto sobre la L2 y tiene una latencia menor que la L2 de Ampere. Sorprendentemente, la latencia de la VRAM de RDNA 2 es más o menos la misma que la de Ampere, a pesar de que RDNA 2 comprueba dos niveles más de caché de camino a la memoria.

En cambio, Nvidia sigue con un subsistema de memoria de GPU más convencional, con sólo dos niveles de caché y una alta latencia L2. Pasar de la L1 privada SM de Ampere a la L2 lleva más de 100ns. La L2 de RDNA está a ~66 ns de la L0, incluso con una caché L1 entre ambas. Sortear el enorme troquel/die del GA102 parece llevar muchos ciclos.

Esto podría explicar el excelente rendimiento de AMD en resoluciones inferiores. Las cachés L2 y L3 de baja latencia de RDNA 2 pueden darle una ventaja con cargas de trabajo más pequeñas, en las que la ocupación es demasiado baja para ocultar la latencia. En comparación, los chips Ampere de Nvidia necesitan más paralelismo para brillar."

Saludos.

 


No hay comentarios:

Publicar un comentario

Por favor sé respetuoso/a y escribe adecuadamente. Gracias.