Gemini Robotics-ER 1.6: O novo "cérebro" da DeepMind que ajuda os robôs a entender o que veem
Se você já viu um vídeo de um robô falhando estrepitosamente em uma tarefa simples porque algo em seu ambiente mudou de lugar, você sabe qual é o verdadeiro gargalo na robótica atual. O problema não é fazer as máquinas se moverem, mas sim fazê-las entender o espaço físico que as cerca e as consequências de interagir com ele.
Justamente para atacar esse problema, o Google DeepMind acaba de lançar Gemini Robotics-ER 1.6, uma atualização profunda de seu modelo de raciocínio para agentes físicos que já está disponível para desenvolvedores através do Google AI Studio e da API do Gemini.
Diferente da versão 1.5 (lançada em setembro de 2025), esta atualização não se limita apenas a mover objetos de um ponto a outro. Ela atua como um cérebro de alto nível que processa o que as câmeras do robô veem, aplica lógica espacial e diz aos sistemas mecânicos inferiores exatamente o que fazer.
As três grandes novidades que traz
O mais interessante desta versão não são promessas abstratas, mas capacidades muito práticas pensadas para o uso industrial:
- Leitura de instrumentos por meio de "visão agêntica": Esta é a função estrela. O modelo agora pode olhar para um manômetro analógico, um medidor de nível de líquido ou uma tela digital industrial, fazer zoom nos detalhes e usar execução de código interna para calcular as proporções exatas e fornecer uma leitura precisa aos operadores.
- Lógica espacial milimétrica: Melhoraram a precisão com que o modelo detecta e sinaliza objetos no mundo real. Agora, um robô pode entender instruções complexas como "sinalize todos os objetos que couberem dentro da caixa azul" ou avaliar se pode mover um item de forma segura respeitando seu peso, espaço ou fragilidade.
- Compreensão multicâmera e uso de ferramentas: Em vez de se confundir se um objeto fica coberto por outro, o modelo agora cruza as informações de várias câmeras ao mesmo tempo para saber se uma tarefa foi concluída com sucesso. Além disso, funciona como um maestro que pode usar ferramentas externas; por exemplo, pode fazer uma busca no Google de forma autônoma se lhe faltar informação de contexto para resolver um problema.
Um aliado da Boston Dynamics, não um concorrente
Havia alguns rumores de que a DeepMind queria lançar hardware para competir com empresas de robótica consolidadas, mas a realidade é muito distinta. De fato, a Boston Dynamics é um dos parceiros-chave nesse lançamento.
Marco da Silva, vice-presidente encarregado do famoso cachorro-robô Spot na Boston Dynamics, confirmou que estão integrando o Gemini Robotics-ER 1.6 em seu sistema. Graças a essa nova capacidade de ler instrumentos e raciocinar espacialmente, o Spot agora pode realizar rondas de inspeção em fábricas e enfrentar obstáculos físicos de maneira completamente autônoma.
Apesar desse grande salto, o modelo não é infalível. Os próprios pesquisadores reconhecem que, quando o ambiente físico do robô sofre mudanças drásticas ou caóticas em tempo real, o desempenho ainda pode decair. O verdadeiro objetivo continua sendo alcançar um raciocínio 100% fluido diante dos imprevistos, mas definitivamente, o Gemini Robotics-ER 1.6 é um enorme impulso na direção certa para a automação industrial.
