Petite Company, una empresa centrada en proporcionar
aglomerados de computación de Inteligencia Artificial (IA) a costo
asequible, ha comunicado que deja de utilizar el hardware de
AMD. La razón detrás de esto son los significativos
obstáculos encontrados en el desarrollo de sus aglomerados
de IA conocidos como «SmallBox».
En particular, las personas que forman parte de Petite Company
esperaban noticias importantes de AMD a principios de este mes, pero
no recibieron ninguna. Específicamente, estos problemas están
relacionados con el firmware de la GPU de consumo de alta gama de
la empresa, la Radeon RX 7900 XTX. El equipo
de Petite Company tenía una «confianza del 70%» en
que AMD aprobaría la distribución abierta de ciertas partes del
firmware. Sin embargo, parece que AMD no ha hecho nada, ya que la
empresa reveló públicamente que estaba empezando a probar las
tarjetas gráficas Intel Arc. Obviamente, NVIDIA es otra posible
alternativa para la empresa.
Petite Company señala que el firmware de las GPU de AMD es complicado
y no está documentado
En concreto, Petite Company indica que, luego de comunicar en
varias ocasiones a AMD el problema que tenían para crear sus aglomerados de IA, estos
no recibieron ninguna respuesta
satisfactoria, argumentando que AMD estaba «vacilando» en
compartir su trabajo. Con compartir se refieren a que el firmware de las
GPU de AMD es «complejo, sin documentación, de código cerrado y
firmado, todos son problemas que no tendríamos con nuestro
hardware«. Esto conlleva a no poder configurar apropiadamente sus aglomerados
de computación valorados en 15,000 dólares
Estos aglomerados que estaban creando utilizaban seis
tarjetas gráficas AMD Radeon RX 7900 XTX. Con ello
buscaban normalizar el uso de GPUs de consumo para tareas de
trabajo de IA, y todo esto a un precio atractivo para aquellos
profesionales u organizaciones que no podían costear el
costoso hardware diseñado para acelerar tareas de trabajo de IA. Sin embargo, sin un software adecuado, realmente el producto no resultaba muy
útil. Desde el lado de AMD se podría argumentar que
protegen al consumidor, pero hay que recordar que la
propia AMD brindó soporte al software AMD
ROCm para que estas GPU pudieran llevar a cabo tareas de
IA.
«El pequeñacaja de AMD está en espera hasta que podamos crear y
correr el firmware correspondiente en nuestras GPU. El
controlador sigue siendo muy inestable, y cuando se cuelga o se
bloquea no tenemos manera de depurarlo. No poseemos forma de volcar el
estado de una GPU. Al parecer, no es solo el MES el que provoca estos
problemas, sino también el procesador de comandos (CP).
La Alternativa B es recurrir a las Intel Arc A770 y las NVIDIA GeForce
RTX 4090
«Estamos explorando Intel, trabajando en añadir soporte Nivel
Cero a pequeñograd. También hemos añadido una recompensa de 400
dólares por la compatibilidad con XMX. También estamos
(tristemente) explorando una caja con seis GeForce RTX 4090. Al
menos sabemos que el software es bueno allí».
Esa es la continuación del texto anterior. Como podemos
ver, la Alternativa B es recurrir a las Intel Arc
A770. Esta es la GPU de alta gama de Intel compatible con
8 y 16 GB de memoria VRAM. Como se puede
observar, están pagando para que algún desarrollador logre
la compatibilidad con XMX. Al igual que
NVIDIA, las GPU Intel Arc cuentan con hardware especializado para la
aceleración de IA, en este caso los motores XMX.
De esta forma, si desean crear un aglomerado para el aceleramiento de
IA, es esencial utilizar este hardware especializado para su
propósito.
En caso de no lograrlo, o que el rendimiento esperado no
sea el adecuado, ya tienen planeado su Alternativa C. Esta consiste en
recurrir a NVIDIA. Aunque indican que el software
es su mayor punto positivo, el problema radica en el
costo. Esto hará menos competitivos sus aglomerados de
computación de IA. También aumentarán sus gastos.
En Grupo MET podemos ayudarte a implementar esta y muchas mas herramienta para optimizar tu trabajo. ¡Contáctanos para saber más!