Na conferência de desenvolvedores Google I/O 2024 na terça-feira, a Google anunciou que está integrando o Gemini Nano, o menor de seus modelos de IA, diretamente no cliente desktop do Chrome, começando com o Chrome 126.
Isso, segundo a empresa, permitirá que os desenvolvedores usem o modelo no dispositivo para alimentar seus próprios recursos de IA. A própria Google planeja usar essa nova capacidade para impulsionar recursos como a ferramenta existente 'me ajude a escrever' do Workspace Lab no Gmail, por exemplo.
A empresa afirma que o recente trabalho em suporte ao WebGPU e WASM no Chrome permite que esses modelos funcionem em uma velocidade razoável em uma ampla variedade de hardwares.
Em uma reunião antes do anúncio de terça-feira, Jon Dahlke, diretor de gerenciamento de produtos do Chrome da Google, observou que a Google estava em negociação com outros fornecedores de navegadores para permitir isso - ou um recurso semelhante - em seus navegadores também.
'Começamos a nos envolver com outros navegadores e lançaremos um programa de visualização antecipada para desenvolvedores', escreveu Dahlke no anúncio de terça-feira. 'Com o WebGPU, WASM e Gemini integrados no Chrome, acreditamos que a web ESTÁ pronta para a IA'.
Duvido que a maioria dos concorrentes do Chrome queiram apostar exclusivamente nos modelos de IA da Google, no entanto. O que faz mais sentido é permitir que navegadores - e desenvolvedores - executem o modelo de sua escolha. A Google claramente optaria por executar o Gemini para suas aplicações, mas esses modelos são pequenos o suficiente para permitir que os desenvolvedores escolham qual desejam para suas aplicações.
A aposta da Google, no entanto, é de oferecer uma série de APIs de alto nível no Chrome para traduzir, legendar e transcrever texto no navegador usando seus modelos Gemini.
'Para oferecer esse recurso, ajustamos nossa versão mais eficiente do Gemini e otimizamos o Chrome', disse Dahlke durante a keynote do desenvolvedor de hoje no I/O. 'Agora queremos dar a você acesso aos modelos Gemini no Chrome. Nossa visão é oferecer a você os modelos de IA mais potentes no Chrome para alcançar bilhões de usuários sem ter que se preocupar com engenharia, ajuste fino, capacidade e custo. Tudo o que você precisa fazer é chamar algumas APIs de alto nível - traduzir, legendar, transcrever. Isso é uma grande mudança para a web e queremos acertar'.
Para os desenvolvedores, a Google está agora também utilizando o modelo integrado de Nano Gemini para impulsionar alguns novos recursos no Console Chrome DevTools. Graças a isso, as ferramentas de desenvolvimento do Chrome agora podem explicar erros e fornecer soluções de depuração diretamente no console.
Estamos lançando uma newsletter de IA! Inscreva-se aqui para começar a recebê-la em suas caixas de entrada em 5 de junho.