Jim Keller, un firme defensor de los estándares abiertos, tuiteó que Nvidia debería haber utilizado el protocolo de comunicación Ethernet de chip a chip en sus GPU GB200 basadas en Blackwell para IA y computación de alto rendimiento. Keller afirma que esto podría haber ahorrado mucho dinero a Nvidia y a los usuarios de sus dispositivos. También habría facilitado a esos clientes la migración de su software a diferentes plataformas de hardware, lo que no es necesariamente lo que Nvidia quiere.
Cuando Nvidia presentó su GPU GB200 para IA y aplicaciones informáticas de alto rendimiento, la compañía se centró principalmente en el rendimiento de la IA y el subsistema de memoria avanzado, y dijo poco sobre cómo se construyó el dispositivo. Mientras tanto, la GPU GB200 de Nvidia incluye dos procesadores informáticos empaquetados juntos utilizando la tecnología de empaquetado CoWoS-L de TSMC y la tecnología de interconexión NVLink, que utiliza un protocolo propietario. Esto no es un problema para quienes ya utilizan hardware y software de Nvidia, pero sí plantea un desafío para la industria a la hora de migrar software de las plataformas Nvidia.
Hay una razón por la que Jim Keller, legendario diseñador de CPU y director ejecutivo de Tenstorrent, el competidor de Nvidia, sugiere que Nvidia debería haber usado Ethernet en lugar del NVLink propietario. Las plataformas Nvidia utilizan tecnología NVLink de baja latencia para comunicaciones de chip a chip y de servidor a servidor (que compite con PCIe con el protocolo CXL en la parte superior) y comunicaciones patentadas InfiniBand para comunicaciones de nivel superior. Para lograr el máximo rendimiento, el software está ajustado para adaptarse a las características específicas de ambas tecnologías. Por razones obvias, esto puede complicar un poco el proceso de portar software a otras plataformas de hardware, lo cual es bueno para Nvidia y completamente desfavorable para sus competidores.
Pero hay un problema. Ethernet es una tecnología omnipresente en hardware y software, y compite con la conectividad InfiniBand de baja latencia y alto ancho de banda (hasta 200 Gigabit) de los centros de datos de Nvidia. En cuanto al rendimiento, Ethernet (especialmente 400GbE y 800GbE de próxima generación) puede competir con InfiniBand.
Sin embargo, InfiniBand todavía tiene algunas ventajas en términos de características de IA y HPC y latencia superior, por lo que algunos pueden decir que las capacidades de Ethernet no satisfacen las cargas de trabajo de IA y HPC emergentes. Mientras tanto, la industria, liderada por AMD, Broadcom, Intel, Meta, Microsoft y Oracle, está desarrollando tecnología de interconexión Ultra Ethernet, que está preparada para ofrecer mayor rendimiento y características para comunicaciones de IA y computación de alto rendimiento. Por supuesto, Ultra Ethernet se convertirá en un competidor más viable para InfiniBand de Nvidia en este tipo de carga de trabajo.
Por supuesto, Nvidia necesita desarrollar plataformas de centros de datos para su uso aquí y ahora, lo que puede ser al menos parte de su deseo de gastar miles de millones en tecnologías patentadas. Si las tecnologías de estándares abiertos como PCIe con CXL y Ultra Ethernet van a superar a las tecnologías NVLink e InfiniBand patentadas de Nvidia en términos de rendimiento y capacidades, Nvidia tendrá que volver a desarrollar sus plataformas, por lo que Keller (o los trolls) aconsejan que Nvidia debería adoptar Ethernet. Sin embargo, esto puede tardar años, por lo que por ahora, los diseños de Nvidia continúan aprovechando las interconexiones patentadas.
«Practicante de la comida. Fanático de los zombis. Estudioso de la música. Devoto ninja del café. Amante de la televisión. Amable fanático del alcohol. Experto en Internet».
More Stories
Microsoft dice que Call of Duty: Black Ops 6 establece un récord en la cantidad de “adiciones de suscriptores de Game Pass el día del lanzamiento”.
Las descargas de Call of Duty: Black Ops 6 maximizan su uso de Internet
Nada hace que el teléfono brille en la oscuridad