Anthropic limita lançamento do Mythos, seu mais recente modelo de IA, para evitar ataques cibernéticos

Fonte:

A Anthropic está limitando o lançamento de seu mais recente modelo de inteligência artificial a um pequeno grupo de grandes empresas de tecnologia, alertando que o sistema pode ser capaz de viabilizar ataques cibernéticos caso os desenvolvedores de software não tenham a chance de testá-lo previamente contra suas próprias defesas.

Quem criou o Bitcoin? Repórter descreve sua saga para desvendar o maior mistério da história da criptomoeda

Muse Spark: Meta apresenta nova IA que vai alimentar Instagram, WhatsApp e Facebook

A Anthropic informou na terça-feira que está formando uma iniciativa chamada Project Glasswing com a Amazon.com, a Apple, a Microsoft, a Cisco Systems e outras organizações. As empresas terão acesso ao novo modelo da Anthropic, conhecido como Mythos, para testá-lo em seus próprios produtos e identificar vulnerabilidades. A ideia é que o grupo compartilhe coletivamente suas descobertas entre os participantes.

Enquanto isso, a startup de IA não tem planos de liberar o Mythos ao público em geral por enquanto. A empresa afirmou que usará os resultados do Project Glasswing para definir quais salvaguardas precisam estar em vigor para a tecnologia.

Golpistas: Avaliações do Google são usadas para extorquir pequenas empresas e prestadores de serviço

O acordo reflete preocupações crescentes entre empresas de tecnologia de que modelos mais sofisticados sejam utilizados indevidamente por criminosos e hackers patrocinados por Estados para encontrar falhas em códigos-fonte e contornar defesas cibernéticas.

A tecnologia de IA já está sendo usada para facilitar ataques cibernéticos. Em um caso, um hacker utilizou ferramentas de IA para viabilizar uma invasão que afetou o governo mexicano.

Durante os testes da Anthropic, sua equipe interna de segurança constatou que o Mythos Preview era capaz de identificar e explorar vulnerabilidades “em todos os principais sistemas operacionais e em todos os principais navegadores web quando instruído por um usuário a fazê-lo”, de acordo com uma publicação em blog.

Restrição: Grécia proibirá acesso às redes sociais para menores de 15 anos

As explorações não eram comuns, segundo a equipe. Em um caso, o sistema desenvolveu um tipo de exploração para navegador que encadeava quatro vulnerabilidades.

A rival da Anthropic, a OpenAI, também já havia destacado anteriormente as crescentes capacidades cibernéticas de seus modelos e introduziu um programa piloto com o objetivo de colocar suas ferramentas “primeiro nas mãos dos defensores”.

“Achamos que isso não é apenas um problema exclusivo da Anthropic. É um problema de toda a indústria, que tanto empresas privadas quanto os governos precisam enfrentar”, disse Newton Cheng, que lidera as iniciativas de segurança cibernética dentro da equipe Frontier Red Team da Anthropic. “O que estamos tentando fazer com o Glasswing é dar uma vantagem inicial aos defensores.”

Conselheiro vota para Cade investigar Google por uso de notícias por IA: julgamento é suspenso por pedido de vista

A Anthropic afirmou que discutiu as capacidades do Mythos relacionadas à segurança com autoridades dos Estados Unidos, mas se recusou a dizer quais agências. Cheng apontou para o trabalho já existente da empresa com a Agência de Segurança Cibernética e Infraestrutura (CISA) e o Instituto Nacional de Padrões e Tecnologia (NIST).

O Mythos é um modelo de IA de uso geral e não foi desenvolvido especificamente para fins de cibersegurança, segundo a Anthropic. Ainda assim, o Mythos já descobriu uma série de problemas de segurança, afirmou Cheng, incluindo um bug de 27 anos utilizado em software crítico da internet.

O sistema de IA também encontrou uma vulnerabilidade de 16 anos em uma linha de código de um software de vídeo popular que havia sido analisada cinco milhões de vezes por ferramentas automatizadas de teste, mas nunca detectada, disse a Anthropic.

Dianne Penn, chefe de gestão de produto para pesquisa na Anthropic, afirmou que existem proteções para garantir que os membros do Project Glasswing mantenham controle rigoroso sobre o acesso ao modelo Mythos, mas se recusou a fornecer mais detalhes por motivos de segurança.

A existência do Mythos foi revelada pela primeira vez graças a um vazamento no final do mês passado, após um rascunho de publicação em blog ter sido deixado disponível em um repositório de dados pesquisável publicamente.