IA do Google vem sofrendo com críticas (Imagem: Reprodução)

O Google anunciou uma importante atualização para seu modelo de inteligência artificial Gemini 2.5 Pro, corrigindo problemas da versão anterior e trazendo melhorias significativas na geração de códigos. Essa atualização, chamada de 06-05, representa um salto de qualidade em relação à versão I/O Edition (03-25) que havia sido lançada anteriormente.

Melhorias no desempenho

Segundo o Google, a nova versão do Gemini 2.5 Pro alcançou uma pontuação impressionante de 82,2% no teste de benchmark Aider Polyglot, superando claramente os modelos concorrentes da OpenAI, Anthropic e DeepSeek. Os testes mostram que a IA agora é capaz de gerar códigos com maior precisão e eficiência.

Dados de benchmark do Gemini 2.5 Pro

Testes de benchmark atestam que o Google aumentou sua vantagem na briga com outras IAs (Imagem: Reprodução)

Feedback dos usuários

As críticas recebidas sobre a versão anterior foram levadas a sério pela equipe do Google. Logan Kilpatrick, representante da empresa, destacou no X (antigo Twitter) que a nova atualização "fecha lacunas da versão 03-25", resultando em um sistema mais criativo e com melhor formatação de respostas.

  • A versão Pro não será liberada tão rapidamente quanto o Gemini 2.5 Flash

  • O sistema agora apresenta melhor desempenho em tarefas complexas

  • Os desenvolvedores podem configurar orçamentos de pensamento

  • A Google espera que esta se torne uma versão estável de longo prazo

Testes comparativos

Plataformas como LMArena e WebDevArena, que realizam testes cegos comparando diferentes modelos de IA, mostraram avanços significativos. O Gemini obteve um aumento de 24 pontos no LMArena e 35 pontos no WebDevArena, consolidando a liderança do Google nesse segmento.

Resposta do Claude, em 2023, à pergunta sobre a cor magenta

Em 2023, Claude não sabia responder a uma pergunta teste (Imagem: Reprodução/ArsTechnica)

Um teste interessante realizado pelo ArsTechnica demonstrou a evolução do Gemini. Quando questionado se a cor seria chamada de 'magenta' se a cidade de Magenta não existisse, o Gemini 2.5 Pro respondeu com segurança "não", enquanto o Claude, em 2023, não conseguiu dar uma resposta clara.

Resposta do Gemini à pergunta sobre a cor magenta

Já o novo Gemini 2.5 Pro responde com autoridade (Imagem: Reprodução/ArsTechnica)

A nova versão do Gemini 2.5 Pro já está disponível para teste no Vertex AI e no AI Studio, além de estar acessível como prévia no aplicativo do Gemini. A expectativa é que em algumas semanas a atualização seja liberada para todos os usuários.

Capacidades expandidas de geração de código

Engenheiros que testaram a versão atualizada relataram avanços notáveis na capacidade do Gemini 2.5 Pro de entender e gerar código em linguagens como Python, JavaScript e Go. Um desenvolvedor que preferiu não se identificar compartilhou com nossa redação: "O modelo agora consegue detectar erros sutis de sintaxe que antes passavam despercebidos e sugere correções mais alinhadas com as melhores práticas de cada linguagem".

O Google implementou um novo sistema de "contexto profundo" que permite ao Gemini manter até 1 milhão de tokens de contexto durante sessões prolongadas de programação. Isso significa que a IA pode lembrar de decisões tomadas horas antes em um projeto complexo, mantendo consistência nas sugestões.

Novo sistema de contexto profundo melhora significativamente a geração de código (Imagem: Reprodução/Google)

Integração com ferramentas de desenvolvimento

A atualização também trouxe melhorias na integração com ambientes de desenvolvimento populares:

  • Suporte nativo ao VS Code através da extensão Google AI Studio

  • Compatibilidade aprimorada com Jupyter Notebooks

  • Novos atalhos para depuração colaborativa

  • Integração direta com repositórios GitHub

Segundo fontes internas, o Google está trabalhando em um modo "pair programming" que permitirá que o Gemini 2.5 Pro atue como um parceiro de codificação em tempo real, alternando entre sugerir trechos de código e explicar conceitos complexos sob demanda.

Desafios persistentes

Apesar dos avanços, alguns usuários relataram que o modelo ainda apresenta dificuldades ocasionais com:

  • Contextos extremamente especializados em frameworks menos populares

  • Otimização de algoritmos para hardware específico

  • Tradução precisa entre paradigmas de programação muito distintos

Um engenheiro de machine learning que testou o sistema comentou: "Para 90% das tarefas cotidianas, é fenomenal. Mas quando você entra em territórios realmente obscuros de otimização de baixo nível ou matemática computacional avançada, ainda percebe algumas limitações".

Próximos passos

O roadmap divulgado internamente sugere que o Google planeja lançar até o final do trimestre:

  • Um sistema de "memória de projeto" que persiste entre sessões

  • Integração nativa com o Google Cloud Workstations

  • Recursos avançados de refatoração assistida

  • Suporte experimental para linguagens de baixo nível como Rust e Zig

Fontes próximas ao projeto indicam que a equipe do Gemini está particularmente focada em reduzir a latência nas respostas para contextos de programação, com o objetivo de alcançar tempos de resposta quase instantâneos para solicitações comuns de código até a próxima atualização planejada para agosto.

Com informações do: Olhar Digital