Hoy tenemos el placer de analizar la tarjeta gráfica más potente que ofrece AMD, la Radeon HD 6990. Esta gráfica de doble GPU no solo representa el tope de gama de AMD, sino que probablemente sea la tarjeta gráfica dual mejor valorada de esta generación.
Para conseguir este "honor" de ser probablemente la tarjeta dual con mejores opiniones de los usuarios, AMD ha prestado atención a todos y cada uno de los detalles a la hora de diseñarla. Partiendo de la potencia bruta, pasando por la calidad del disipador, controlando los consumos y ofreciendo un sistema de overclocking basado en una BIOS dual intercambiable con tan solo un switch integrado.
La potencia de dos GPUs unidas no es suficiente si la unión de ellas no es lo suficientemente potente y versátil (más adelante explicamos cómo lo ha hecho AMD). También la propia arquitectura de cada una de las GPUs y la continua mejora de los drivers son factores vitales para conseguirlo.
Especificaciones serie Radeon HD 6900 |
| HD 6950 | HD 6970 | HD 6990 |
Proceso de fabricacion | 40nm | 40nm | 40nm |
Tamaño | 389 mm2 | 389 mm2 | 2x389 mm2 |
Transistores | 2.64 Billones | 2.64 Billones | 5.28 Billones |
Freq. del núcleo en MHz | 800 | 880 | 830 / 880 OC |
Freq. de la memoria / MHz | 5000 | 5500 | 5000 |
Ancho banda memoria | 160 GBps | 176 GBPs | 320 GBPs |
Tipo de memoria | GDDR5 | GDDR5 | GDDR5 |
Shaders | 1408 | 1536 | 3072 |
Potencia de computación | 2.25 TFLOPS | 2.7 TFLOPS | 5.1 / 5.4 OC TFLOPS |
ROPs | 32 | 32 | 64 |
z/Stencil ROPs | 128 | 128 | 256 |
Consumo con carga | 140 W | 190 W | 350 W |
Consumo en reposo | 20 W | 20 W | 37 W |
La AMD Radeon HD 6990, internamente tiene dos GPUs iguales que la HD 6970, pero funcionando a una frecuencia inferior. Por ello también tiene las evoluciones de la misma, como es el paso del formato VLIW5 a VLIW4.
Este cambio hace que los Stream Processors tengan una arquitectura más compleja y sean más eficientes.
Con la arquitectura VLIW5, las GPUs, tienen 1 shader complejo y 4 simples, lo cual permite ejecutar simultáneamente 5 operaciones de precisión simple o una de doble precisión (la potencia en doble precisión es de un ratio de 1/5 del total de sus Stream Processors (SPs)).
En el caso de la nueva arquitectura VLIW4, se pasa a tener 1 shader super complejo y 3 simples, con lo que puede ejecutar simultáneamente una instrucción de doble precisión o 2 de precisión simple (la potencia en en doble precisión en un ratio de 1/4 (con relación a su número total de SPs)).
Una primera impresión, puede hacernos creer que el rendimiento ha decrecido respecto a la generación anterior. Por el contrario hay que tener en cuenta que muy raramente al procesar gráficos se conseguían utilizar todas las operaciones de precisión simple
(salvo en procesos computación optimizados), por lo cual se perdía eficiencia. Con la nueva arquitectura VLIW4, la eficiencia aumenta ya que ahora se puede elegir entre ejecutar las 5 instrucciones de precisión simple, o 1 de doble precisión y tres simples. Con esta reorganización de shares, AMD dice que consiguen un chip un 10% más pequeño, con lo que es posible integrar más unidades SIMD.
Con el fin de facilitar la comunicación entre los dos núcleos, AMD ha utilizado el switch PCI-E de PLX. Para la HD 6990, se ha utilizado el chip de ultra baja latencia 8647. Éste permite utilizar un total de 48 carriles bidireccionales PCI-E de forma simultánea. Ésto evitará los cuellos de botella que pudimos ver en anteriores generaciones de tarjetas gráficas duales.
Los 48 carriles, son distribuidos entre los dos núcleos. Ésto significa, que cada GPU Cayman tiene el ancho de banda equivalente a 16 carriles PCI-E de segunda generación entre ellos y el PLX. El PLX por sí mismo, tiene un enlace 16X con el puerto PCI-E.
Las ROPs igualmente son más rápidos, pueden duplicar o cuaduplicar el rendimiento de ciertos cálculos de enteros y de coma flotante respectivamente en comparación con la generación anterior.
Otra interesante característica, del nuevo diseño del chip Cayman es la posibilidad de separar el motor gráfico para permitirlo trabajar en paralelo. Gracias a este proceso en paralelo, el fabricante ha conseguido introducir una nueva unidad de Tessellation (igual a las de Barts. Esto unido al motor de Tessellation de octava generación, permite duplicar el rendimiento de la generación anterior.
Además de la optimización de la arquitectura AMD ha trabajado duro para mejorar sus drivers Catalyst. Integrando dentro de los mismos soporte para actualizar los perfiles Crossfire cada vez que algún juego lo requiere sin ser necesaria la aparición de nuevos drivers. Ésto se ha denominado
AMD Catalyst Application Profiles.
La AMD Radeon HD 6990 incorpora varias de salidas de vídeo. Al ser una tarjeta tan potente, es fácil que se destine a utilizarla con varios monitores simultáneamente (AMD Eyefinity), por tanto, se han obviado los puertos HDMI tradicionales y se ha puesto especial atención en los MiniDP para ahorrar espacio:
- 4 x MiniDP
- 1 x DVI (DL-DVI + SL-DVI)
Llevamos varios párrafos y todavía no hemos dicho qué tarjeta ha llegado a nuestras manos para ser analizada. La joya que vamos a probar no es otra que la joya de la corona de AMD: la Radeon HD 6970. Os dejamos unas imágenes de la misma:
Sin más procedemos al análisis de la misma.