Microsoft quer transformar o Windows em um sistema operacional de IA, lança PCs Copilot+

A Microsoft quer trazer a IA generativa para a vanguarda do Windows - e os PCs que o executam.

Em um par de palestras durante sua conferência anual de desenvolvedores Build nesta semana, a empresa revelou uma nova linha de máquinas Windows que está chamando de PCs Copilot+, além de recursos alimentados por IA generativa como Recall, que ajuda os usuários a encontrar aplicativos, arquivos e outros conteúdos que visualizaram no passado. O Copilot, a marca de IA generativa da Microsoft, em breve estará muito mais profundamente integrado à experiência do Windows 11. E novos dispositivos Surface da Microsoft estão a caminho.

Aqui estão todas as principais novidades de segunda e terça-feira.

Aplicativos Volumétricos

A Microsoft está trazendo os Aplicativos Volumétricos do Windows - basicamente aplicativos de VR interativos com percepção espacial - para os headsets Meta Quest. Através de uma parceria com a Meta, a Microsoft diz que vai oferecer o Windows 365 e conectividade com PC local para os headsets Quest, permitindo que os desenvolvedores estendam seus aplicativos para o espaço 3D.

Créditos da imagem: Microsoft

Durante a palestra de terça-feira, a Microsoft mostrou uma visão 3D explodida de um controle Xbox do ponto de vista de um headset Meta Quest 3 - um objeto digital que o usuário poderia manipular com as mãos. "Estamos aprofundando nossa parceria com a Meta para tornar o Windows uma experiência de primeira classe nos dispositivos Quest", disse Pavan Davuluri, CVP do Windows e dispositivos da Microsoft, durante a demonstração.

Os desenvolvedores podem se inscrever para uma prévia e receber acesso à nova API volumétrica da Microsoft.

PCs Copilot+

Créditos da imagem: Microsoft

Os PCs Copilot+ são a visão da Microsoft de hardware AI-first de ponta com Windows. Todos incluem chips dedicados chamados NPUs para alimentar experiências de IA como Recall. E eles são enviados com pelo menos 16GB de RAM, emparelhados com armazenamento SSD.

Os primeiros PCs Copilot+ virão com chips Qualcomm Snapdragon X Elite e Plus, que a Microsoft afirma oferecer até 15 horas de navegação na web e 20 horas de vida útil da bateria para vídeos. Os fabricantes de chips Intel e AMD também se comprometeram a construir processadores para dispositivos Copilot+ em parceria com uma variedade de fabricantes, incluindo Acer, Asus, Dell, HP, Lenovo e Samsung.

Os PCs Copilot+ começam em $999, e alguns estão disponíveis para pré-encomenda hoje.

Surface Pro e Surface Laptop

Os novos dispositivos Surface da Microsoft, o Surface Laptop e o Surface Pro, focam em desempenho e bateria.

Créditos da imagem: Microsoft

O último Surface Laptop - disponível com tela de 13,8 ou 15 polegadas - foi redesenhado com "linhas modernas" e molduras de tela mais finas. Dura até 22 horas com uma carga e é até 86% mais rápido que o Surface Laptop 5, segundo a empresa. Ele também suporta Wi-Fi 7 e possui um touchpad com feedback tátil.

Créditos da imagem: Microsoft

Quanto ao novo Surface Pro, a Microsoft diz que é até 90% mais rápido que o Surface Pro da geração anterior (o Surface Pro 9) e possui uma nova tela OLED com HDR, Wi-Fi 7 (e opcional 5G) e uma câmera frontal ultralarga aprimorada. Além disso, seu teclado removível - reforçado com fibra de carbono adicional - agora possui feedback tátil.

Recall

O recurso Recall do Windows 11 pode "lembrar" aplicativos e conteúdos acessados por um usuário em seu PC semanas ou meses atrás, por exemplo, ajudando-os a encontrar um chat da Discord onde estavam discutindo roupas que estavam considerando comprar. Os usuários podem usar a linha do tempo do Recall para "voltar" e ver o que estavam trabalhando no passado recente e aprofundar-se em arquivos como apresentações de PowerPoint para encontrar informações potencialmente relevantes para suas pesquisas.

A Microsoft diz que o Recall pode criar associações entre cores, imagens e mais para permitir que os usuários procurem praticamente qualquer coisa em seus PCs em linguagem natural (parecido com a tecnologia da startup Rewind); os desenvolvedores poderão melhorar o Recall adicionando informações contextuais aos seus aplicativos. E a Microsoft afirma que todos os dados do usuário associados ao Recall são mantidos privados e no dispositivo - e não usados para treinar modelos de IA, importante.

Aqui está mais da Microsoft: "Suas capturas de tela são suas; elas ficam localmente no seu PC. Você pode excluir capturas de tela individuais, ajustar e excluir intervalos de tempo nas Configurações ou pausar em qualquer ponto direto do ícone na Barra de sistema na sua barra de tarefas. Você também pode filtrar aplicativos e sites para nunca serem salvos."

Edição de imagem e traduções ao vivo

Agora há mais IA no Windows do que nunca e parte dela exclusiva dos novos PCs Copilot+.

Um novo recurso chamado Super Resolution pode restaurar fotos antigas aumentando-as automaticamente. E o Copilot agora pode analisar imagens para dar aos usuários ideias para composições criativas. Através de um recurso chamado Cocreator, os usuários podem gerar imagens e também pedir ao modelo de IA para seguir o que estão desenhando para alterar ou reformular a imagem.

Créditos da imagem: Microsoft

Em outros lugares, Legendas ao vivo com traduções ao vivo traduz qualquer áudio que passa por um PC - seja do YouTube ou de um arquivo local - para o idioma escolhido pelo usuário. As traduções ao vivo inicialmente suportarão cerca de 40 idiomas, incluindo inglês, espanhol, mandarim e russo.

Um recurso separado, mas relacionado, no Microsoft Edge oferece tradução de vídeo em tempo real em sites como LinkedIn, YouTube, Coursera, Reuters, CNBC, Bloomberg e outros. Com previsão para ficar disponível em breve, o recurso - que suporta a tradução de espanhol para inglês e inglês para alemão, hindi, italiano, russo e espanhol - traduz conteúdo falado através de dublagem e legendas ao vivo.

Equipe Copilot e extensões

A Equipe Copilot é a mais recente expansão da crescente suíte de tecnologia de IA generativa da Microsoft. Ela se integra ao Teams, o aplicativo de videoconferência da empresa, para ajudar a gerenciar agendas de reuniões e tomar notas que qualquer pessoa na reunião pode coautoria. E se estende ao Loop e ao Planner, plataformas de colaboração e planejamento da Microsoft, para criar e atribuir tarefas, acompanhar prazos e notificar os membros da equipe quando sua contribuição é necessária.

Créditos da imagem: GitHub/Microsoft

Em notícias um tanto relacionadas, a Microsoft lançou (em prévia privada) Extensões do Copilot, que permitem aos desenvolvedores estender a ferramenta de geração de código do GitHub Copilot com aplicativos e habilidades de terceiros. Os parceiros de lançamento incluem DataStax, Docker e LambdaTest; as extensões estarão na GitHub Marketplace, mas os desenvolvedores também poderão criar suas próprias extensões privadas para integrar com seus sistemas e APIs internos.

Windows Copilot Runtime

Créditos da imagem: Microsoft

Alimentando recursos como Recall e Super Resolution está o Windows Copilot Runtime, uma coleção de ~40 modelos de IA generativa que compõem o que a Microsoft descreve como "uma nova camada" do Windows. Em conjunto com o índice semântico, um sistema baseado em vetores local a um PC individual Copilot+, o Windows Copilot Runtime permite que aplicativos alimentados por IA generativa - incluindo aplicativos de terceiros - funcionem sem necessariamente precisar de uma conexão com a internet.

"[O tempo de execução] consiste em APIs de IA prontas para uso como Efeitos de Estúdio, traduções de Legendas ao vivo, OCR, Recall com atividade do usuário e [mais], que estarão disponíveis para desenvolvedores em junho", disse Davuluri na terça-feira.

A Microsoft diz que o CapCut, o popular editor de vídeo do proprietário do TikTok, ByteDance, usará o Windows Copilot Runtime e a nova Biblioteca Windows Copilot, um conjunto de APIs e ferramentas de desenvolvimento de IA, para acelerar seus recursos de IA. E a Meta adicionará os mencionados Efeitos de Estúdio ao WhatsApp para oferecer recursos como desfoque de fundo e contato visual durante chamadas de vídeo.

Criadores de bots atualizados

O Azure AI Studio, conjunto de ferramentas dentro do Azure OpenAI Service da Microsoft que permite aos clientes combinar um modelo de IA e construir um aplicativo que 'raciocina' sobre esses dados, em breve permitirá aos desenvolvedores criar aplicativos usando APIs de inferência pay-as-you-go - as APIs através das quais os desenvolvedores podem acessar e ajustar modelos de IA generativa hospedados na infraestrutura da Azure. A Microsoft chama isso de "modelo-como-serviço" e está lançando com modelos da Nixtla e Core42 para começar.

No conjunto de produtos Copilot Studio adjacente, a Microsoft está lançando agentes do Copilot, que a empresa descreve como bots de IA que podem "orquestrar independentemente tarefas adaptadas a funções e funções específicas." (O Copilot Studio fornece ferramentas para conectar o Copilot para o Microsoft 365, o 'copiloto' de IA em aplicativos como Excel e Word, a dados de terceiros.) Alavancando a memória e o conhecimento de contexto, os agentes do Copilot podem navegar em vários tipos de fluxos de trabalho comerciais, aprendendo com o feedback do usuário e pedindo ajuda quando encontram situações às quais não sabem como lidar.

Kit de Desenvolvimento Snapdragon

Créditos da imagem: Microsoft

Há um novo kit de desenvolvimento da Qualcomm destinado a desenvolvedores que constroem aplicativos para PCs Copilot+ com chips Arm.

O Snapdragon Dev Kit for Windows de $899,99 - que tem aproximadamente a mesma largura, altura e comprimento do Mac Mini da Apple, incidentalmente - abriga o chip Snapdragon X Elite da Qualcomm emparelhado com 32GB de RAM, 512GB de armazenamento e muitas portas de E/S. O Dev Kit suporta Wi-Fi 7 e Bluetooth 5.4 e, através de suas diversas portas USB-C e HDMI, pode suportar até três monitores 4K ao mesmo tempo.

Phi-3

A Microsoft anunciou uma adição à sua família de modelos de IA generativa Phi, o Phi-3-vision, que pode realizar análises visuais e tarefas de raciocínio gerais, como responder a perguntas sobre gráficos e imagens. O modelo pode ler tanto texto quanto imagens e é eficiente o suficiente para ser executado em um dispositivo móvel.

O Phi-3-vision está disponível em prévia, enquanto os modelos textuais anteriormente anunciados - Phi-3-mini, Phi-3-small e Phi-3-medium - estão agora geralmente disponíveis.

Parceria com a Khan Academy

A Microsoft está se unindo à Khan Academy para doar acesso à infraestrutura de computação em nuvem, permitindo que a Khan Academy ofereça aos educadores nos EUA acesso gratuito às ferramentas de IA da Khan Academy. As duas empresas também colaborarão para explorar oportunidades de melhorar os aplicativos de IA para tutoria de matemática através de IA generativa, disse a Microsoft na terça-feira.

Estamos lançando uma newsletter de IA! Inscreva-se aqui para começar a recebê-la em suas caixas de entrada em 5 de junho.