A Google coloca no catálogo uma transcrição gratuita de IA “Edge Eloquent”: funciona no telemóvel com Gemma, sem necessidade de ligação à Internet, estreia no iOS

動區BlockTempo

O Google colocou silenciosamente na App Store do iOS, esta semana, uma aplicação gratuita de transcrição de IA offline chamada «AI Edge Eloquent». Usa um modelo Gemma ASR executado no dispositivo; o áudio não sai totalmente do equipamento e, de forma pouco comum, chegou primeiro ao iOS antes do Android.
(Contexto: o Google divulgou o modelo aberto mais inteligente Gemma 4! Adopta totalmente a licença Apache 2.0 e o desempenho chega a níveis semelhantes aos de grandes IAs proprietárias.)
(Complemento de contexto: quebrar o monopólio da NVIDIA? O modelo de IA «Gemma 3» mais forte do mundo da Google, usando apenas 1 H100, superou a DeepSeek e a OpenAI)

Índice do artigo

Toggle

  • Fala e transforma-se em texto: basta falar para começar
  • iOS primeiro, Android depois: a operação pouco habitual do Google
  • Gemma entra no quotidiano: validação de cenários reais de IA no dispositivo

Sem conferências de apresentação e sem qualquer anúncio oficial, o Google simplesmente, mais cedo esta semana, colocou silenciosamente «AI Edge Eloquent» na App Store do iOS. Esta aplicação de transcrição por IA totalmente gratuita tem como foco o reconhecimento de voz offline; por trás, corre o modelo Gemma ASR (reconhecimento automático de fala) no dispositivo da própria Google. Todo o processamento do áudio é feito localmente no equipamento, sem necessidade de ligação à internet.

Fala e transforma-se em texto: basta falar para começar

A lógica de utilização de «AI Edge Eloquent» é bastante intuitiva: após abrir a app e falar para o microfone, o ecrã apresenta em tempo real texto e a forma de onda da voz. Quando termina a gravação, a app filtra automaticamente tiques verbais como «嗯» e «啊», corrige a segmentação das frases, organiza o conteúdo dito em texto limpo, pronto a ser usado, e copia-o automaticamente para a área de transferência.

O design de privacidade também é uma das principais vantagens desta app. No modo totalmente offline, os dados de áudio não saem do iPhone do utilizador e não são enviados para quaisquer servidores. A Google disponibiliza ainda uma opção de «modo de nuvem»: o reconhecimento de voz continua a ser feito no dispositivo; apenas o texto reconhecido (e não o áudio original) é enviado para o modelo Gemini na nuvem para uma limpeza adicional, com melhor qualidade.

O serviço completo é totalmente gratuito, sem custos de subscrição e sem limites de utilização.

iOS primeiro, Android depois: a operação pouco habitual do Google

Em simultâneo, os media de tecnologia notaram um fenómeno raro: quase todos os produtos do Google chegam primeiro ao Android. Especialmente quando se trata de funcionalidades de IA no dispositivo, normalmente são lançadas em primeiro lugar com dispositivos Pixel e o modelo Gemini Nano. Desta vez, «AI Edge Eloquent» faz o contrário: até na descrição da App Store está escrito diretamente que a versão Android será lançada em breve.

Os analistas apresentam duas interpretações possíveis. A primeira é um teste de mercado: a Google pode ter escolhido deliberadamente o iOS, que não é «o seu terreno», para realizar a experiência, avaliando, sem perturbar o ecossistema Android, a aceitação por parte dos consumidores e os hábitos de utilização de transcrição por IA no dispositivo.

A segunda interpretação é que a tecnologia já estará pronta: o modelo Gemma ASR da versão para iOS pode ter ficado disponível mais cedo do que a versão para Android em termos de otimização. Assim, a Google optou por publicar logo em vez de esperar que as duas plataformas sincronizassem.

Gemma entra no quotidiano: validação de cenários reais de IA no dispositivo

Do ponto de vista técnico, o significado de «AI Edge Eloquent» não é apenas o de ser uma ferramenta de transcrição. A Gemma é uma série de modelos de IA ligeiros e de código aberto da Google. A intenção original é fazer com que funcionem de forma eficiente em ambientes com recursos limitados, como dispositivos móveis. O AI Edge é o framework da Google para permitir que os programadores executem modelos de machine learning no dispositivo.

Esta app, na prática, transporta a capacidade de inferência da Gemma no dispositivo para os cenários de uso diário dos consumidores.

Para os programadores, «AI Edge Eloquent» é também um modelo de referência: mostra como os modelos Gemma são aplicados em produtos de consumo e como uma arquitetura híbrida, combinando offline e nuvem, consegue encontrar um equilíbrio entre privacidade e qualidade.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.
Comentário
0/400
Sem comentários