
Novas gerações de modelos de IA da Google tornam robôs mais próximos dos humanos

A Google DeepMind acaba de dar um salto significativo rumo à criação de robôs verdadeiramente inteligentes. Com o lançamento dos novos modelos Gemini Robotics 1.5 e Gemini Robotics-ER 1.5, a empresa promete transformar a forma como as máquinas compreendem o mundo e interagem com ele, tornando os robôs mais próximos dos humanos. Nova IA do Google navega pela web por você com o Gemini Pesquisadores deixam OpenAI, Google e Meta e criam startup para acelerar ciência Os novos modelos são uma evolução direta do Gemini Robotics, apresentado no início do ano e baseado no poderoso LLM Gemini, o mesmo modelo de linguagem que alimenta diversas ferramentas de IA da Google. A primeira versão já era capaz de realizar tarefas simples, como colocar uma banana em uma cesta. Agora, com as versões 1.5, os robôs conseguem lidar com tarefas complexas e de múltiplas etapas, o que representa um avanço gigantesco na autonomia e no raciocínio artificial. -Entre no Canal do WhatsApp do Canaltech e fique por dentro das últimas notícias sobre tecnologia, lançamentos, dicas e tutoriais incríveis.- Em um dos testes, um robô equipado com os novos modelos foi capaz de separar frutas por cor, colocando uma banana, uma maçã e um limão em pratos diferentes, de acordo com o tom correspondente. Durante o processo, a máquina ainda explicava em linguagem natural o que estava fazendo e por que tomava cada decisão — algo impensável até pouco tempo atrás. Como os novos modelos pensam e agem A inteligência dos robôs vem da interação entre dois sistemas complementares: Gemini Robotics-ER 1.5 (“o cérebro”): modelo de visão e linguagem (VLM) que compreende o ambiente, processa comandos e faz o raciocínio avançado; Gemini Robotics 1.5 (“mãos e olhos”): modelo de visão, linguagem e ação (VLA) que executa as tarefas no mundo físico com precisão e autonomia. Essa parceria entre “cérebro” e “corpo” permite que os robôs planejem, ajam e aprendam de forma contínua, recebendo feedbacks do ambiente e ajustando suas ações em tempo real. Um dos exemplos mais impressionantes foi o de um robô que, ao ser solicitado a separar lixo, acessou a internet via Google Search para consultar as regras de reciclagem de São Francisco e aplicá-las corretamente. O caminho para robôs realmente úteis Segundo a equipe da Google DeepMind, o objetivo é criar robôs de propósito geral, capazes de entender o mundo físico, raciocinar de maneira lógica e realizar tarefas cotidianas com segurança. A grande inovação é que o aprendizado obtido em um robô pode ser transferido para outros sistemas, acelerando o progresso coletivo da robótica. A nova geração da IA da Google mostra que a fronteira entre humanos e máquinas está cada vez mais tênue. Leia também: Até a busca por imagem no modo IA do Google está se tornando mais conversacional O Gemini vai ajudar você a não ser mais um péssimo jogador dando dicas ao vivo VÍDEO | IA do Google contrata próprio advogado Leia a matéria no Canaltech.