martes, 23 de noviembre de 2010

Detalles de la arquitectura de las Radeon HD 6970/6950 “Cayman”

A los datos entregados previamente, aparecen nuevos detalles de las Radeon HD 6900, esta vez en una presentación hecha “en algún lugar del planeta” y donde se revelan detalles respecto a las mejoras en la arquitectura del núcleo “Cayman” de las próximas Radeon HD 6970/6950. Si bien el núcleo “Barts” (que no era el sucesor) introdujo algunas mejoras respecto a “Cypress”, con Cayman el verdadero sucesor de “Cypress” AMD mejora aspectos claves de la arquitectura de sus próximas tarjetas para obtener un mejor rendimiento y cuyos detalles pasamos a revisar en este informe de índole técnico.



Arquitectura: A rasgos generales AMD he mejorado varios aspectos de la arquitectura de “Cayman”, incorporando un motor gráfico dual (Dual Graphics Engine), introduciendo una nueva arquitectura de cores con funciones unificadas (VLIW4), agregando más motores SIMD Engine y más unidades de textura (texture units & SIMD Engine), actualizando el bloque render back-end, entre otros aspectos claves que detallamos a continuación.

Mejoras en el cómputo de la GPU: El aspecto de cóputo AMD no sólo se ha limitado a incrementar el número de Stream Processors en ” Cayman”, sino que también ha hecho mejoras para hacer de cada uno de estos núcleos, unidades más eficientes y con mejor rendimiento, como operaciones de doble precisión más rápidas, mejoras en el control de flujo, modo DMA dual bidireccional para mejorar operaciones de lectura/escritura en la memoria entre otras optimizaciones.

Dual Graphics Engines: A nivel de motor gráfico, donde se realizan las operaciones geométricas, como la teselacion, AMD ha optimizado el diseño mediante una configuración dual para el motor gráfico, dando un paso adelante respecto a lo que vimos en el núcleo “barts” de las Radeon HD 6870/6850. De esta forma Cayman posee dos motores GPE (Graphics Processing Engines) con sus respectivas unidades de procesado geométricos (Rasterizer, Geometry Aseembler, Vertex Aseemgler, Hierarchical z) y cada uno de estos dos motores gráficos están asignados a cada bloque de SIMD Engines.
Esto significa además que Cayman posee efectivamente 2 unidades físicas de teselado de 8º generación, comparado con “Barts” que utiliza una unidad física de teselado (7º generación) para ambos bloques de SIMD Engines.  Esto debería incrementar el poder en teselado de las Radeon HD 6970/6950 por 3 comparado con la Radeon HD 5870. Además de esto el nuevo motor gráfico posee doble unidad de rasterización, lo que le entrega un rendimiento de hasta 32 pixeles por clock, según indica AMD en sus diapositivas.

SIMD Cores con funciones unificadas: A nivel más interno, cada núcleo o Stream Processors también ha sido modificado por AMD para estas tarjetas, con un nuevo diseño denominado VLIW4. Ahora todos los stream processors tienen las mimas capacidades de cómputo matemático ya sea en enteros o punto flotante.
Así, mientras en la generación previa existían 5 Stream Cores con uno de ellos dedicado a funcionales especiales, con “Cayman” existen sólo 4 Stream Cores, pero cada uno de ellos puede cumplir las mismas funciones de cómputo matemático ya sea en enteros o punto flotante, incluyendo las funciones especiales, que en la generación previa sólo las podía ejecutar una unidad dedicada. Según indica AMD, el eliminar esta unidad especial permite tener el mismo rendimiento pero con una reduccion de area del 10%, esto es esencial debido a que se ahorra espacio para la incorporació de núcleos adicionales en “Cayman” (HD 6970/6950).



Actualización de ROPS: El bloque Render Back End (ROPS) también se ha beneficiado de las mejoras hechas por AMD, incrementando su rendimiento tanto en operaciones de enteros como de punto flotante, ya sean utilizando computo de 16-bit en enteros, como de 32-bit en operaciones de punto flotante, lo que le da un poder de 2x a 4x respecto a la generación anterior.

Anti-Aliasing con calidad mejorada: El los niveles de filtrado Antialiasing, AMD también ha mejorado la calidad, esto sin incrementar necesariamente el consumo de memoria al utilizar estos filtros, algo de suma importancia en virtud de aplicar filtrados sin sacrificar recursos. Además ha introducido nuevos modos de MSAA (Multi-Sample Anti Aliasing) con hasta 16 muestras por pixel, adicionalmente el número de colores y muestras pueden ser controladores independientemente.

Mejor rendimiento en Teselación: Cuando NVIDIA lanzó la GeForce GTX 580, menciono en la información técnica de la GTX 580 que ellos (NVIDIA) ofrecían un mayor rendimiento en teselación comparado con AMD, por cuanto la GTX posee 16 motores dedicados para teselación, comparado con AMD que sólo incorpora uno solo en las Radeon HD 5870. Es por esto que como ya mencionamos al inicio de este informe, las nuevas Radeon HD 6970/6950 basadas en el núcleo “Cayman” incrementan su poder de teselado, agregando 2 unidades físicas para estas tareas, comparado con “Barts” y “Cypress” que sólo posee una unidad de teselación.
Por otra parte, al ser de 8º generación la unidad de teselado de “Cayman”, debería ofrecer un mejor rendimiento por sí sola, que la unidad de teselado de 7º generación de “Barts”, y mucho mayor rendimiento comparado con Cypress (ver imagen).
Bueno, AMD ha liberado importante información respecto a los cambios hechos en la arquitectura de las nuevas tarjetas basadas en el núcleo “Cayman” (Radeon HD 6970/6950), aun faltan algunos detalles pero sin duda los cambios hechos con las nuevas tope de línea de AMD, han sido mucho más que los cambios hecho con el núcleo “Bart” (Radeon HD 6870/6850). Ahora sólo queda esperar el (los) review para ver si esto se materializa en rendimiento real.

No hay comentarios:

Publicar un comentario