O Google anunciou que o Projeto Astra, sua ambiciosa iniciativa para desenvolver agentes de IA com capacidades de reconhecimento e interação em tempo real, não será lançado antes de 2025. Revelado em maio de 2024, o Astra visa criar experiências em que a IA possa compreender o ambiente ao seu redor, permitindo a realização de tarefas que vão desde o reconhecimento de elementos visíveis pela câmera do smartphone até a execução de ações em nome do usuário.
Durante a teleconferência sobre resultados financeiros do terceiro trimestre, o CEO Sundar Pichai comentou que o desenvolvimento da tecnologia visa possibilitar que a IA perceba e raciocine sobre o mundo em que opera, oferecendo aos usuários um vislumbre do potencial futuro dessa inovação.

Em uma das demonstrações, o Google apresentou um protótipo capaz de responder a perguntas sobre objetos visíveis pela câmera, identificando, por exemplo, bairros e componentes de bicicletas danificadas. Embora houvesse planos de lançar uma versão do agente com funções práticas como realizar compras e reservas ainda em 2024, esses planos foram adiados, refletindo a complexidade do projeto.
Simultaneamente, a Anthropic, empresa que também busca desenvolver modelos de IA multimodais, tem enfrentado desafios semelhantes. O modelo da Anthropic, projetado para interagir com aplicativos e navegadores em PCs, ainda lida com dificuldades para executar algumas funcionalidades básicas, indicando que a criação de agentes de IA capazes de entender o ambiente ainda enfrenta obstáculos técnicos significativos.
Esses avanços reforçam o compromisso do Google com a inovação em IA e sinalizam o caminho a ser seguido para que essas tecnologias se tornem parte do cotidiano dos usuários nos próximos anos.