Google tem dois modelos de IA para historiadores capazes de "prever o passado"

 

Fonte:


Na última quarta-feira (23), a Google anunciou o primeiro modelo de linguagem com inteligência artificial capaz de contextualizar textos antigos escritos em latim — construído a partir da DeepMind, IA da empresa, o modelo é chamado de Aeneas e foi criado em conjunto com pesquisadores das Universidades de Nottingham, Oxford e Atenas. Em março de 2022, um modelo de linguagem semelhante, usado para decifrar textos em grego antigo, também foi lançado pela empresa, chamado Ithaca. Pesquisadores usam IA para interpretar textos antigos jamais compreendidos IA da DeepMind ajuda historiadores a decifrarem o passado O diferencial principal de Aeneas e Ithaca é sua capacidade de contextualizar o texto — por se tratar de registros centenários e até mesmo milenares, muito do que foi escrito pelos gregos e romanos acabou fragmentado, tirado de seu local de origem ou mesmo propositalmente destruído. Com ajuda de enormes bancos de dados formados por textos já datados, traduzidos e localizados no espaço, os modelos conseguem decifrar novos textos com precisão. Aeneas, Ithaca e a história Até mesmo os nomes dos modelos derivam da história: Aeneas é a grafia inglesa de Enéias, um herói viajante da mitologia greco-romana, e Ithaca é a grafia de Ítaca, ilha grega onde reinou o mitológico Odisseu, protagonista da Odisseia, do escritor helênico Homero. Explicando a tecnologia em seu blog, a Google chama os modelos de “redes neurais generativas”, trabalhando tanto com o texto quanto com a imagem de onde ele vem. -Entre no Canal do WhatsApp do Canaltech e fique por dentro das últimas notícias sobre tecnologia, lançamentos, dicas e tutoriais incríveis.- O modelo de linguagem Aeneas em funcionamento, decifrando o possível texto de um diploma militar da Sardenha, do primeiro século d.C. (Imagem: Google DeepMind/Aeneas/CIL XVI, 60) No caso de Aeneas, foram unidos bancos de dados epigráficos de Roma, Heidelberg e Clauss Slaby para formar a Base de Dados Epigráficos do Latim, com mais de 176 mil inscrições latinas. Para decodificar textos, a IA busca registros semelhantes em seu banco de dados, levando em conta a linguagem utilizada, gramática, referências a acontecimentos e lugares, superfície onde foi escrita e semelhança com outros escritos. Mas os modelos não se limitam a dar uma resposta isolada: eles trazem informações sobre como chegaram à conclusão mais provável, trazendo suas fontes, comparações feitas e outras hipóteses, ajudando os historiadores a decidir a abordagem correta. Eles também são capazes de restaurar textos incompletos, tendo precisão de 73% na recuperação de escritos com até 10 caracteres faltando e 58% quando o tamanho da restauração é desconhecido. Para testar a eficácia do modelo feito para textos em latim, a Google fez um estudo colaborativo com historiadores, convidando 23 profissionais que trabalham com inscrições antigas para datar e localizar geograficamente uma série de textos. Todos elogiaram a velocidade adicionada ao trabalho graças à ajuda de Aeneas, que também expandiu a capacidade de encontrar textos semelhantes e relevantes à localização dos escritos. Ithaca em funcionamento: quanto mais escuro o tom de roxo, maior o grau de confiança na palavra restaurada. A frase traduzida é "Deuses. No governo de Nikophemos. Aliança de Atenienses e Tessalonicenses por todo o tempo" (Imagem: Google DeepMind/Ithaca/CC-BY-3.0) Aeneas consegue localizar um texto na história com precisão de 13 anos. Graças aos dados visuais, também consegue localizar a origem do escrito entre as 62 províncias romanas do passado com 72% de precisão. Tanto esse modelo quanto Ithaca são interativos e estão disponíveis gratuitamente para pesquisadores, estudantes, professores, profissionais de museus e quem mais quiser trabalhar com eles no site predictingthepast.com. O código-fonte e base de dados dos modelos também estão disponíveis gratuitamente, e ambos foram descritos em artigos científicos publicados na revista Nature. Veja também: IA ajuda a traduzir textos cuneiformes de 5 mil anos Riscos em pintura rupestre de 20.000 anos podem ser escrita mais velha do mundo Manuscritos do Mar Morto são mais antigos que se pensava, segundo IA VÍDEO: COMO TRADUZIR TEXTOS COM A CÂMERA DO IPHONE #Shorts   Leia a matéria no Canaltech.