Há muito em jogo na apresentação da WWDC 2024 da próxima semana. Os riscos da apresentação são muito maiores do que as mudanças de mercado pós-evento padrão. A pressão para Tim Cook e sua equipe entregarem os resultados é, em um sentido muito real, ainda maior do que foi na preparação para o anúncio do Vision Pro do ano passado.
Na segunda-feira, a Apple irá elucidar seus planos de AI. O tema tem sido uma grande incógnita pairando sobre Cupertino nos últimos anos, à medida que concorrentes como Google e Microsoft abraçaram a AI generativa. Existe um amplo consenso na indústria de que sistemas alimentados por grandes modelos de linguagem como ChatGPT e Gemini afetarão profundamente como interagimos com nossos dispositivos.
A Apple deverá anunciar uma parceria com a OpenAI que trará a inteligência da empresa para o iPhone e Mac. A estratégia de curto prazo da Apple é uma integração profunda entre propriedades existentes e AI generativa, com Siri no centro. Desde sua estreia em 2011, a Apple tem buscado tornar o assistente de voz uma parte integral de todos os seus sistemas operacionais.
No entanto, nos últimos 13 anos, a Siri não correspondeu à revolução prometida pela Apple. Há muitas razões para isso, embora a principal seja a capacidade. O conceito de um assistente de voz artificial antecede a Siri por décadas, mas ninguém o resolveu completamente por um motivo. À medida que fabricantes de telefones e desenvolvedores de aplicativos transformaram smartphones em dispositivos multiuso, os trabalhos desses assistentes tornaram-se cada vez mais complexos.
Tão impressionante quanto o trabalho do Instituto de Pesquisa de Stanford foi, a tecnologia necessária para uma experiência sem atritos simplesmente não estava pronta. O co-fundador da Siri, Norman Winarsky, abordou o problema subjacente em 2018, observando que o plano inicial da Apple era um assistente muito mais limitado que lidava com coisas como entretenimento e viagens. "Estes são problemas difíceis, e quando você é uma empresa lidando com até um bilhão de pessoas, os problemas ficam ainda mais difíceis", observou Winarsky na época. "Eles provavelmente estão buscando um nível de perfeição que não podem obter."
A AI generativa ainda não está nesse nível de perfeição, não ainda, pelo menos. As alucinações ainda são um problema. É exatamente por isso que, mesmo após o enorme burburinho dos últimos anos, ainda parece que estamos muito no início. Se algo, eu diria que o Google, por exemplo, tem sido excessivamente agressivo em algumas áreas. O melhor exemplo disso é a decisão da empresa de apresentar resultados do Gemini no topo das pesquisas.
Quando algo é priorizado acima de recursos confiáveis no mecanismo de busca dominante do mundo, é necessário acertar o máximo possível, e não, você sabe, dizer às pessoas para comer cola. O Google rotula os resultados do Gemini como um produto de seus "Laboratórios de Pesquisa", mas certamente a maioria dos usuários não entende o que isso significa em termos de maturidade do produto, nem se incomodam em clicar para obter mais informações.
Ao longo dos últimos anos, encontrei vários pesquisadores que usaram o termo "mágico" para descrever os resultados do "caixa-preta" que envolve grandes modelos de linguagem. Isso não é uma crítica contra todo o incrível trabalho acontecendo no espaço, tanto quanto uma realização de que ainda há muito que não sabemos sobre a tecnologia.
Arthur C. Clarke disse melhor: “Qualquer tecnologia suficientemente avançada é indistinguível da magia.”
Um local onde o Google tem sido mais intencional, no entanto, é com sua integração do Gemini no Android. Em vez de substituir o Assistant completamente, o Google tem integrado sua plataforma de AI generativa em diferentes aplicativos. Os usuários também podem optar por tornar o Gemini o padrão atribuindo-o ao botão Assistant nos dispositivos Pixel. Essa implementação requer ação deliberada da parte do usuário, pelo menos até agora.
Embora o Gemini ainda não tenha totalmente conquistado o Android, o Google está claramente sinalizando um dia no futuro não muito distante em que substituirá o Assistant completamente. Eu meio que esperava um anúncio nesses termos no I / O no mês passado, embora fique feliz que em última análise tenha optado por dar mais tempo ao Gemini para amadurecer.
Se o nome Assistant permanecerá é, em última instância, uma decisão de branding. Por sua parte, a Apple está muito ligada ao nome Siri. Afinal, passou mais de uma década vendendo o produto aos consumidores. Mais cedo ou mais tarde, no entanto, a AI generativa dominará o espaço dos assistentes inteligentes.
Os assistentes de voz em geral estão tendo um momento existencial. Os alto-falantes inteligentes têm sido um termômetro mais amplo para plataformas como Siri, Alexa e Google Assistant. Os embarques diminuíram, após o aquecimento durante a pandemia. Seria injusto caracterizar a categoria como condenada, mas será a longo prazo, sem o tiro certo no braço.
A AI generativa está posicionada para ser a sucessora lógica, mas a primeira rodada de dispositivos de hardware construídos em torno desses modelos, incluindo o Humane Ai Pin e o Rabbit R1, tem sido apenas testemunhos de quão longe a categoria tem que percorrer antes de poder ser considerada uma experiência consistente para os usuários comuns.
A Apple finalmente mostrará suas cartas na segunda-feira. Embora os rumores apontem para a empresa transferir um número de funcionários para operações de AI generativa após a implosão de seu carro elétrico, todos os sinais indicam que a Apple cedeu uma vantagem significativa à concorrência. Como tal, sua jogada mais lógica é uma parceria com um powerhouse reinante como a OpenAI.
Logo após o anúncio da aquisição da Siri, Steve Jobs foi questionado se a empresa estava tentando vencer o Google em seu próprio jogo. “É uma empresa de AI,” Jobs observou. “Não estamos entrando no negócio de busca. Não nos importamos. Outras pessoas fazem bem.”
A abordagem da empresa para a AI generativa está atualmente no mesmo lugar. Nesta fase, a Apple não pode vencer a OpenAI em seu próprio jogo, então está se associando. Mas mesmo os melhores modelos atuais têm um longo caminho a percorrer antes de estarem prontos para substituir completamente a atual safra de assistentes inteligentes.