NVIDIA presentó en la GTC su reciente chip gráfico de alto nivel enfocado en la Inteligencia Artificial, conocido como Blackwell. Este chip no solo es el chip gráfico más grande del mundo, sino que logra incrementar por cinco el desempeño de lo que antes era la GPU más potente a nivel mundial, Hopper (NVIDIA H100).
La GPU NVIDIA Blackwell también es el primer chip gráfico con diseño multicapa (MCM) creado por NVIDIA. En resumen, cada chip Blackwell consiste en dos GPU Blackwell unidas entre sí. Ahora bien, la plataforma utilizada para su funcionamiento combina dos chips Blackwell completos, junto con una CPU Arm Grace. Veamos más detalladamente qué ofrece NVIDIA Blackwell a la industria.
NVIDIA Blackwell aumenta por 5 el desempeño del mejor chip de IA actualmente disponible
La GPU NVIDIA Blackwell está compuesta por 208.000 millones de transistores. Esto representa 128.000 millones más que el chip NVIDIA Hopper. Además, este chip incluye cuatro veces más memoria integrada en el mismo die, lo que se traduce en ofrecer hasta 192 GB de memoria HBM3e, junto con una interfaz de 8.192 bits, resultando en un ancho de banda de 8 TB/s.
Este chip ha sido fabricado por TSMC utilizando su litografía a 4nm 4NP, mientras que cada GPU que forma parte del chip Blackwell se conecta a través de una interfaz con un ancho de banda de 10 TB/s. NVIDIA Blackwell consta de un total de 20.480 CUDA Cores, utiliza chips de memoria HBM3e de 8 capas, y puede alcanzar un TDP de hasta 700W. Este TDP es similar al que presentan las GPU NVIDIA H100 y H200.
NVIDIA Blackwell es capaz de ofrecer un rendimiento en IA de 20 petaFLOPS, lo que significa ser 5 veces más rápido que el chip NVIDIA H100. El chip Hopper de gama alta está orientado a las cargas de trabajo relacionadas con la IA. Como mencionamos anteriormente, dos de estos chips completos se combinan con una CPU Grace para formar el superchip NVIDIA HB200.
Este superchip incluye una CPU con 72 núcleos Arm Neoverse V2 junto con las dos GPU Blackwell, acceso a 384 GB de memoria HBM3e, y una interconexión NVLink-C2C con un ancho de banda de 900 GB/s.
Rendimiento del chip NVIDIA Blackwell en comparación con NVIDIA Hopper:
- 20 PFLOPS FP8 (2.5 veces más rápido Vs. Hopper)
- 20 PFLOPS FP6 (2.5 veces más rápido Vs. Hopper)
- 40 PFLOPS FP4 (5.0 veces más rápido Vs. Hopper)
- 740B Parameters (6.0 veces más rápido Vs. Hopper)
- 34T Parameters/sec (5.0 veces más rápido Vs. Hopper)
- 7.2 TB/s NVLINK (4.0 veces más rápido Vs. Hopper)
Estamos ante el chip gráfico más poderoso del mundo
Gracias a estos avances, NVIDIA presume de que Blackwell es el chip de IA más poderoso del mundo. Esta arquitectura hace uso de los Transformer Engine de 2ª Generación. Estos incluyen un nuevo soporte para escalado de microtensores y los algoritmos avanzados de gestión del rango dinámico de NVIDIA integrados en los frameworks NVIDIA TensorRT™-LLM y NeMo Megatron.
Esto significa que Blackwell admite el doble de tamaños de computación y modelos con nuevas funciones de inferencia de IA en coma flotante de 4 bits. Combinado con la 5ª Generación de la interconexión NVIDIA NVLink, se logra un rendimiento bidireccional de 1,8 TB/s por GPU. Esto garantiza una comunicación de alta velocidad sin interrupciones entre
hasta 576 GPU para los LLM más complejos.
Las GPU NVIDIA Blackwell incorporan mantenimiento preventivo por IA. Esto asegura la confiabilidad, disponibilidad y facilidad de mantenimiento. Esta IA realiza diagnósticos y ayuda a prever problemas de confiabilidad. Así se maximiza el tiempo de actividad del sistema y mejora la capacidad de recuperación para que las implementaciones de IA a gran escala funcionen sin interrupciones durante semanas o incluso meses. Esto resulta en una reducción de los costes operativos.
El GB200 es un componente clave del NVIDIA GB200 NVL72, un
sistema multinodo a escala de bastidor con refrigeración líquida
para las cargas de trabajo más exigentes. Combina 36 superchips
Grace Blackwell, que incluyen 72 GPU Blackwell y 36 CPU Grace
interconectadas mediante NVLink de quinta generación.Además, el GB200 NVL72 incluye unidades de procesamiento de
datos NVIDIA BlueField-3 para permitir la aceleración de la red en
la nube, el almacenamiento componible, la seguridad de confianza
cero y la elasticidad del cálculo en la GPU en nubes de IA a
hiperescala. La GB200 NVL72 proporciona hasta 30 veces más
rendimiento en comparación con el mismo número de GPU
NVIDIA H100 Tensor Core para cargas de trabajo de inferencia LLM
y reduce hasta 25 veces el coste y el consumo de
energía.
En Grupo MET podemos ayudarte a implementar esta y muchas mas herramienta para optimizar tu trabajo. ¡Contáctanos para saber más!