Google lança aplicativo de ditado com inteligência artificial para dispositivos Apple

A empresa Google disponibilizou nesta segunda-feira, dia 6 de abril, um novo aplicativo focado em ditado de voz, batizado de Google AI Edge Eloquent, projetado exclusivamente para o sistema operacional iOS. A ferramenta tem como principal diferencial a capacidade de realizar o processamento de áudio diretamente no aparelho, sem a necessidade de uma conexão constante com a rede mundial de computadores. Com essa iniciativa, a companhia busca ocupar um espaço relevante em um mercado que já conta com soluções como Wispr Flow, SuperWhisper e Willow, oferecendo uma opção gratuita para usuários que buscam transformar fala em textos escritos de maneira eficiente.

Para que o sistema de reconhecimento automático de fala, tecnicamente conhecido pela sigla ASR, funcione de forma satisfatória no dispositivo, o usuário precisa realizar o download dos modelos baseados na tecnologia Gemma. O Gemma é uma família de modelos de linguagem leves e abertos, desenvolvidos pela própria companhia para permitir que tarefas complexas de inteligência artificial sejam executadas localmente, garantindo mais privacidade e velocidade. Após a instalação desses arquivos, o aplicativo torna-se capaz de realizar a transcrição em tempo real, capturando as palavras ditadas pelo usuário enquanto este fala.

PUBLICIDADE

Um dos recursos mais notáveis do novo aplicativo é a inteligência embutida para promover o refinamento do texto transcrito. Diferente de sistemas convencionais que registram literalmente qualquer som, o Google AI Edge Eloquent é programado para identificar e descartar automaticamente palavras de preenchimento, como hesitações, termos como "hum" ou "ah" e autocorreções feitas durante a fala. O objetivo central é entregar um resultado final limpo, organizado e pronto para utilização profissional, poupando o usuário do esforço de edição manual posterior que é comum em softwares de ditado de voz mais básicos e antigos.

Além da capacidade de transcrição pura e simples, o aplicativo incorpora ferramentas de formatação de texto logo abaixo do conteúdo convertido. O usuário tem a liberdade de ajustar o estilo do texto gerado, podendo transformá-lo em pontos-chave, uma versão mais formal, um formato mais curto ou uma exposição mais longa, dependendo das necessidades específicas de cada documento. Essa versatilidade é possível graças ao suporte da inteligência artificial, que interpreta o significado pretendido da fala para adaptar o registro textual conforme a escolha do utilizador, aumentando significativamente a produtividade.

O Google AI Edge Eloquent também oferece flexibilidade quanto ao uso da tecnologia em nuvem. Embora o foco principal seja o processamento local, o aplicativo permite que o usuário desative a integração com servidores externos, caso prefira manter a privacidade total dos dados. Contudo, para quem deseja ampliar o potencial da ferramenta, é possível optar pelo uso dos modelos de inteligência artificial Gemini, também do Google, que operam na nuvem para aprimorar ainda mais a qualidade, a precisão e o contexto do texto gerado, oferecendo uma camada extra de sofisticação ao resultado final.

A personalização é outro aspecto central da experiência oferecida pelo novo aplicativo. O sistema tem a capacidade de importar termos específicos, jargões técnicos e nomes próprios diretamente da conta do Gmail do usuário, permitindo que a inteligência artificial reconheça melhor o vocabulário particular de cada indivíduo. Além disso, existe a possibilidade de adicionar palavras customizadas à biblioteca do aplicativo de forma manual, o que auxilia no reconhecimento de siglas ou termos incomuns. Toda a sessão de trabalho é armazenada em um histórico, facilitando a recuperação e a busca por transcrições feitas anteriormente.

Embora o lançamento inicial tenha contemplado apenas o ecossistema da Apple, a empresa já indicou que existem planos para levar a ferramenta ao sistema Android. A expansão é aguardada com expectativa, pois a presença em dispositivos Android poderá permitir a integração nativa da ferramenta como o teclado padrão do aparelho, oferecendo uma experiência de uso ainda mais fluida para todo o sistema. A expectativa é de que, em futuras atualizações, os usuários desses dispositivos também possam contar com recursos como botões flutuantes para acionar o ditado a partir de qualquer aplicativo que exija inserção de texto.

Esse lançamento reforça a estratégia do mercado de inteligência artificial em aproximar modelos de linguagem poderosos do uso cotidiano, diminuindo a dependência de servidores centralizados. Ao permitir que a tecnologia opere no dispositivo, o usuário ganha não apenas em agilidade, mas também em soberania sobre seus dados, visto que o áudio não precisa ser enviado para fora do aparelho para ser processado. A iniciativa consolida a tendência de levar a inteligência artificial para a borda da rede, garantindo que recursos avançados de processamento de voz estejam acessíveis mesmo em situações sem conexão com a internet.

Em suma, o Google AI Edge Eloquent surge como uma alternativa robusta para profissionais e estudantes que demandam alta precisão na transformação de áudio em texto. Ao combinar o reconhecimento local, a eliminação inteligente de ruídos linguísticos e opções avançadas de formatação de estilo, o aplicativo se destaca pela funcionalidade. Resta agora acompanhar como o desenvolvimento do projeto evoluirá para outras plataformas e se o suporte a novos idiomas será expandido, consolidando a utilidade da ferramenta em cenários globais de uso produtivo.