Início ESPECIAIS ‘Ponto de inflexão’ das habilidades de hacking de IA se aproximando

‘Ponto de inflexão’ das habilidades de hacking de IA se aproximando

28
0

Vlad Ionescu e Ariel Herbert-Voss, cofundador da startup de segurança cibernética executávelficou brevemente confusa em novembro passado, quando sua ferramenta de IA, Sybil, a alertou sobre uma fraqueza no sistema de um cliente.

Sybil usa uma combinação de vários modelos de IA e alguns truques de tecnologia proprietária para verificar os sistemas de computador em busca de problemas que os hackers possam explorar, como servidores não corrigidos ou bancos de dados configurados incorretamente.

Neste caso, Sybil sinalizou. problema Os clientes implantam GraphQL federado, uma linguagem usada para especificar como os dados são acessados ​​pela web por meio de interfaces de programação de aplicativos (APIs). Esse problema significava que o cliente expôs inadvertidamente informações confidenciais.

O que intriga Ionescu e Herbert-Voss é que descobrir o problema requer um conhecimento muito profundo de múltiplos sistemas e de como eles interagem. RunSybil diz que descobriu o mesmo problema com outras implantações do GraphQL antes que alguém o tornasse público. “Nós vasculhamos a Internet e ela não existia”, disse Herbert-Voss. “O que fez esta descoberta foi a etapa de inferência, a mudança radical em termos da funcionalidade do modelo.”

A situação sugere que o risco está aumentando. À medida que os modelos de IA continuam a ficar mais inteligentes, a sua capacidade de encontrar bugs de dia zero e outras vulnerabilidades continua a melhorar. A mesma inteligência que pode ser usada para detectar vulnerabilidades também pode ser usada para explorá-las.

canção do amanhecercientista da computação da UC Berkeley especializado em IA e segurança, diz que avanços recentes em IA criaram modelos que são melhores para encontrar falhas. O raciocínio simulado, que divide um problema em seus componentes, e a IA do agente, como pesquisar na web e instalar e executar ferramentas de software, aprimoraram as capacidades cibernéticas do modelo.

“As capacidades de segurança cibernética do modelo Frontier aumentaram dramaticamente nos últimos meses”, diz ela. “Este é o ponto de inflexão.”

No ano passado, Song co-criou os seguintes benchmarks: ciberginásio Veja como os modelos de linguagem em larga escala encontram vulnerabilidades em projetos de software de código aberto em grande escala. CyberGym contém 1.507 vulnerabilidades conhecidas encontradas em 188 projetos.

Em julho de 2025, Claude Sonnet 4 da Anthropic conseguiu descobrir aproximadamente 20% de vulnerabilidades em seu benchmark. Em outubro de 2025, o novo modelo, Claude Sonnet 4.5, conseguiu identificar 30%. “Os agentes de IA podem encontrar o dia zero a um custo muito baixo”, disse Song.

Song disse que esta tendência mostra a necessidade de novas contramedidas, incluindo a ajuda da IA ​​aos especialistas em segurança cibernética. “Do lado da defesa, precisamos realmente pensar em como a IA pode ajudar mais e podemos explorar diferentes abordagens”, diz ela.

Uma ideia é que as principais empresas de IA compartilhem seus modelos com pesquisadores de segurança antes do lançamento, para que possam usar esses modelos para encontrar bugs e proteger sistemas antes do lançamento geral.

Outra solução, disse Song, é repensar como o software é construído. Seu laboratório mostrou que é possível usar IA para gerar código mais seguro do que o que a maioria dos programadores usa hoje. “No longo prazo, acreditamos que esta abordagem de design baseada na segurança beneficiará enormemente os defensores”, diz Song.

A equipe RunSybil afirma que, no curto prazo, as habilidades de codificação dos modelos de IA podem dar uma vantagem aos hackers. “A IA pode gerar tarefas em computadores e gerar código, duas coisas que os hackers fazem”, diz Herbert-Voss. “Acelerar essas capacidades significa acelerar também as nossas medidas de segurança ofensivas.”


Esta é a próxima edição. Will Knight’s Boletim Informativo do Laboratório de IA. Leia boletins informativos anteriores aqui.

Source link