Início ESPECIAIS Jensen Huang, da Nvidia, alertou que executar o DeepSeek em chips Huawei...

Jensen Huang, da Nvidia, alertou que executar o DeepSeek em chips Huawei teria “consequências terríveis” para os EUA.

30
0

Em suma, o CEO da Nvidia, Jensen Huang, alertou no Dwarkesh Podcast que seriam “consequências terríveis” para os Estados Unidos se a DeepSeek otimizasse seus modelos de IA para os chips Ascend da Huawei em vez do hardware dos EUA, enquanto os laboratórios de IA chineses se preparam para lançar modelos baseados em V4 no processador Ascend 950PR da Huawei. A migração do CUDA da Nvidia para a estrutura CANN da Huawei corre o risco de quebrar a dependência de software-hardware que sustenta o domínio da IA ​​nos EUA, mesmo enquanto os legisladores dos EUA pressionam para incluir o DeepSeek na lista de controle de exportação.

O CEO da Nvidia, Jensen Huang, disse no Dwarkesh Podcast na quarta-feira que seria uma “consequência terrível” para os Estados Unidos se a DeepSeek otimizasse seu novo modelo de IA para rodar em chips Huawei em vez de hardware dos EUA. O alerta apresenta uma nova parceria entre os laboratórios de IA mais capazes da China e os seus fabricantes de chips mais avançados como uma ameaça direta à influência tecnológica que sustentou o domínio da IA ​​dos EUA ao longo da última década.

E se os futuros modelos de IA forem otimizados de uma forma muito diferente da pilha de tecnologia dos EUA?-Hwang disse.A IA está se espalhando pelo mundo.” “China com padrões e tecnologia chineses”será superior a” Estados Unidos. Esta declaração é digna de nota porque vem do CEO da empresa que mais se beneficiou do acordo atual, onde praticamente todos os modelos de IA de ponta do mundo são treinados em GPUs Nvidia usando a estrutura de software CUDA da Nvidia.

O que DeepSeek está construindo

DeepSeek está se preparando para lançar V4, seu modelo básico multimodal, esperado ainda este mês. Embora informações relatadas no início de abril de que o V4 funcionaria com o mais recente processador Ascend 950PR da Huawei, um relatório separado da Reuters disse que o modelo foi treinado no chip Blackwell da Nvidia, o que violaria os controles de exportação dos EUA. As duas afirmações não são necessariamente contraditórias. Um modelo pode ser treinado em um conjunto de hardware e implantado para inferência em outro conjunto de hardware.

O que torna a integração da Huawei importante é a migração de software por trás dela. DeepSeek passou meses reescrevendo seu código principal para funcionar com a estrutura CANN da Huawei, afastando-se do ecossistema CUDA onde a Nvidia passou duas décadas construindo a base para o desenvolvimento de IA. O domínio da CUDA vai além dos próprios chips, servindo como uma segunda camada de controle dos EUA sobre a IA. As restrições à exportação podem limitar o fluxo de hardware da Nvidia para a China, mas enquanto os laboratórios chineses escreverem o software para CUDA, continuarão dependentes do ecossistema da Nvidia, mesmo que utilizem processadores alternativos. A transição do DeepSeek para CANN quebrou essa dependência.

Espaço de coworking da cidade de TNW – onde o melhor trabalho acontece

Um espaço de trabalho projetado para crescimento, colaboração e oportunidades infinitas de networking no centro da tecnologia.

O modelo V3 da DeepSeek, lançado no final de 2024, foi treinado em 2.048 GPUs Nvidia H800, chips customizados para o mercado chinês cujas vendas na China serão proibidas em 2023. A empresa já provou que pode produzir. modelo de competição pioneiro Temos menos recursos do que nossos concorrentes nos EUA. O modelo de inferência R1 igualou ou melhorou o desempenho de modelos cujo treinamento custa muito mais. A V4 expandirá essa abordagem, demonstrando que a empresa pode fazer isso sem o hardware dos EUA.

A lacuna de hardware e por que isso não importa

Em termos de desempenho bruto, os chips da Huawei não podem competir com os melhores chips da Nvidia. O antecessor do 950PR, o Ascend 910C, oferece cerca de 60% do desempenho de inferência do Nvidia H100, um chip duas gerações atrás do melhor chip atual da Nvidia. Os chips americanos são atualmente cerca de cinco vezes mais poderosos que os chips chineses, e espera-se que essa diferença aumente para 17 vezes até 2027. A Huawei pretende enviar 750.000 chips de IA em 2026, mas a produção total representará apenas 3-5% do poder computacional total da Nvidia.

Mas a preocupação de Huang não é apenas com a atual lacuna de desempenho. Ele disse no podcast que mesmo que os chips da China sejam inferiores, eles podem alcançar os Estados Unidos no desenvolvimento de IA.energia abundante‘, ‘Grande grupo de pesquisadores de IA’, etc. Isso significa que o desempenho bruto do hardware é apenas uma variável, e a otimização do software, o talento do pesquisador e a disponibilidade de energia podem compensar as deficiências de silício. Se o V4 tiver um bom desempenho nos chips Ascend, ele validará um caminho alternativo para o desenvolvimento de IA que não depende da Nvidia em nenhum ponto da cadeia de fornecimento.

O paradoxo dos controles de exportação

Esta situação expõe tensões no cerne da política de exportação de chips dos EUA. Como Huang confirmou em março passado, a Nvidia retomou a produção de um chip mais potente, o H200, para venda na China. Mas a China tem bloqueado as importações de H200 para proteger os negócios domésticos de chips da Huawei, e o CFO da Nvidia disse que a empresa não registrou nenhuma receita com as vendas chinesas de H200. Os controlos concebidos para limitar as capacidades de IA da China estão, em vez disso, a acelerar o desenvolvimento de alternativas chinesas.

A experiência da DeepSeek com o modelo R2 demonstra as possibilidades e limitações do caminho da Huawei. O R2 foi adiado repetidamente devido a falhas de treinamento no hardware da Huawei. As autoridades chinesas instaram a DeepSeek a treinar em chips domésticos, mas a empresa enfrentou problemas de estabilidade que a forçaram a usar chips Huawei apenas para inferência e a reverter para GPUs Nvidia para treinamento. As diferenças são importantes. O treinamento é a etapa que exige mais computação no desenvolvimento de IA, e o fato de os chips da Huawei não conseguirem lidar com isso de maneira confiável sugere uma lacuna real de hardware. Mas a inferência, a etapa em que o modelo serve o utilizador, é onde o valor comercial é criado, e os chips da Huawei parecem ser adequados para esse fim.

Enquanto isso, os legisladores dos EUA estão pressionando por regulamentações mais rígidas. Na quinta-feira, legisladores e especialistas disseram que a China “o que eles podem fazer“E roubar”o que eles não podem fazer“Ele instou o governo a considerar colocar DeepSeek, Moonshot AI e MiniMax na indústria de inteligência artificial na lista de controles de exportação.

Sobre o que o enxofre está realmente alertando?

O alerta de Huang diz respeito, em última análise, ao co-design de software e hardware. O domínio da Nvidia reside não apenas na fabricação dos chips mais rápidos, mas também na sua posição como CUDA, o principal ambiente de desenvolvimento para IA. Quando os pesquisadores escrevem código, eles escrevem para CUDA. Quando as startups constroem produtos, elas os baseiam em CUDA. Quando os governos investem em infraestrutura de IA, eles compram GPUs Nvidia porque precisam delas para seus softwares. A migração do DeepSeek para CANN corre o risco de criar um ecossistema paralelo onde nenhum deles se aplica.

que Tamanho do negócio da Nvidia Faça bife especificamente. A capitalização de mercado da empresa ultrapassa US$ 3 trilhões. No trimestre mais recente, a receita do data center aumentou 93% ano a ano. O chip suporta treinamento para quase todos os principais modelos de IA fora da China. Se os laboratórios chineses de IA mais capazes demonstrarem que podem construir modelos competitivos sem a Nvidia, o argumento para manter os controlos de exportação será enfraquecido e o argumento para a aquisição da Nvidia será enfraquecido. suposições geopolíticas As empresas que moldaram a política de IA nos últimos três anos estão sob pressão.

Isso não significa que a Huawei ultrapassará a Nvidia tão cedo. A lacuna de desempenho é grande e crescente. A falha no treinamento do R2 mostra que o hardware chinês ainda não está pronto para lidar com as cargas de trabalho de IA mais exigentes. Mas o Imperador não avisa sobre hoje. Ele está alertando sobre o fosso CUDA cujo conceito o DeepSeek provou, a trajetória que outros laboratórios estão seguindo e a mais provável da Nvidia. uma empresa digna As cadeias de abastecimento de IA começam a sofrer erosão.

O facto de o CEO da Nvidia fazer estas afirmações publicamente sugere que ele acredita que os riscos já não são teóricos. O V4 do DeepSeek será seu primeiro grande teste. Se o modelo multimodo funcionar de forma competitiva com silício da Huawei, o alerta de Huang emitido na quarta-feira parecerá um lobby corporativo. previsões mais importantes Na guerra dos chips de IA até agora.

Source link

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui