- O domínio de longa data da InfiniBand está enfrentando uma pressão real da mudança da Ethernet para padrões abertos.
- Meta e Nvidia apostam na abertura para expandir redes de IA.
- O projeto ESUN conecta concorrentes da indústria através de ambições de networking compartilhadas.
que Projeto de Computação Aberta (OCP) anunciou uma nova iniciativa chamada Ethernet for Scale-Up Networking (ESUN), que visa desenvolver padrões abertos para conectividade de alto desempenho em clusters de inteligência artificial.
A colaboração reúne empresas como Meta, Nvidia, AMD, Cisco, OpenAI e outras para explorar como a Ethernet pode competir com interconexões existentes como InfiniBand em data centers de grande escala.
Outras empresas participantes da colaboração incluem Arista; ARM, Broadcom, HPE Networking, Marvell, Microsoft e Oracle.
Rede aberta para clusters de IA
A InfiniBand domina há muito tempo o mercado de redes de IA de alta velocidade, respondendo por aproximadamente 80% da infraestrutura de conectividade. GPUs e aceleradores.
No entanto, o Grupo ESUN acredita que a maturidade, a relação custo-benefício e a interoperabilidade da Ethernet a tornam uma forte candidata para a expansão do cluster de IA.
Ao contrário dos sistemas proprietários, a Ethernet é difundida entre os engenheiros e pode ajudar a reduzir a complexidade do gerenciamento de cargas de trabalho de IA em grande escala.
Os proponentes argumentam que o uso da Ethernet como um padrão aberto permitirá que as operadoras ampliem sua infraestrutura e, ao mesmo tempo, reduzam os custos.
A nova iniciativa de ferramentas de IA da OCP baseia-se em trabalhos anteriores do programa SUE-Transport (SUE-T), que explorou o transporte Ethernet para sistemas multiprocessadores.
Os participantes da ESUN se reúnem regularmente para definir padrões para operação de switch, incluindo cabeçalhos de protocolo, tratamento de erros e transmissão de dados sem perdas.
O grupo também estuda como o design da rede afeta o balanceamento de carga e a ordenação da memória em sistemas baseados em GPU.
Planejamos trabalhar com o Ultra Ethernet Consortium e o órgão de padrões IEEE 802.3 para garantir a coordenação em todo o ecossistema Ethernet mais amplo.
Várias empresas já desenvolveram produtos baseados em Ethernet destinados a dimensionar a IA. Por exemplo, os switches Tomahawk Ultra da Broadcom suportam até 77 bilhões de pacotes por segundo, e a plataforma Spectrum-X da Nvidia combina Ethernet com hardware de aceleração para clusters de IA.
Mas Meta, que co-fundou a OCP em 2011, vê a ESUN como uma extensão natural do seu impulso para hardware aberto em centros de dados.
No entanto, os observadores observam que a Ethernet precisará provar seu valor nas cargas de trabalho de IA mais exigentes, onde a latência e a confiabilidade são críticas, se quiser substituir as redes InfiniBand estabelecidas.
O sucesso da ESUN depende do equilíbrio entre abertura e desempenho. Os defensores veem um futuro onde os sistemas de IA serão executados em hardware interoperável usando tecnologia Ethernet padronizada.
No entanto, dada a escala e a sensibilidade da infraestrutura de IA, ainda não está claro se a dinâmica da indústria se afastará decisivamente da interconexão proprietária.
Por enquanto, o ESUN representa um esforço ambicioso e resta saber se poderá igualar o desempenho do InfiniBand.
Siga o TechRadar no Google Notícias e Adicione-nos como fonte preferencial Receba notícias, análises e opiniões de especialistas em seu feed. Certifique-se de clicar no botão seguir!
Claro que você também pode Siga o TechRadar no TikTok Confira novidades, análises, unboxings em formato de vídeo e receba atualizações regulares. WhatsApp fazer.