Breadcrumb node

Google destruyó la barrera del idioma: así funciona su traductor en tiempo real para videollamadas

La inteligencia artificial traduce videollamadas en Meet en segundos, respetando la voz, tono y expresiones del interlocutor.

Publicado:
Actualizado:
Miércoles, Mayo 21, 2025 - 11:31
Videollamada en Google Meet
Google revoluciona las videollamadas: así funciona su inteligencia artificial que traduce la voz en tiempo real.
Oficial de Google

Actualmente, las videollamadas hacen parte del día a día de millones de personas en el mundo, especialmente para quienes tienen una rutina laboral y académica en donde es necesario tener una comunicación con video con otras personas. 

En el marco de esta tendencia, Google acaba de dar un paso gigante que promete acabar definitivamente con las barreras del idioma. Se trata de una innovadora función de traducción de voz en tiempo real, incorporada a Google Meet y potenciada por Gemini 2.5, la inteligencia artificial más avanzada desarrollada hasta ahora por la compañía.

Consulte también: Google I/O 2025: Gemini se convierte en el corazón de todo y Google lanza su IA más ambiciosa

Este avance no solo permite que personas que hablan diferentes idiomas se entiendan al instante durante una reunión virtual, sino que también ofrece una experiencia natural, fluida y muy cercana a una conversación presencial.

Chat - videollamada
Chat - videollamada
Freepik - collage

Traducción de voz casi instantánea: ¿cómo lo logra Google?

Esta nueva herramienta funciona gracias a un sistema de inteligencia artificial entrenado para reconocer no solo las palabras, sino también el tono, el ritmo y las expresiones características del hablante original.

Cuando una persona habla en inglés, por ejemplo, el sistema traduce su mensaje al español en cuestión de segundos, manteniendo intacto el timbre de voz y el tono emocional de quien habla. Por lo tanto, el usuario escuchará una traducción más natural, como si estuviera oyendo al interlocutor en su idioma nativo, sin perder matices en la conversación.

Más noticias: Una potente tormenta solar se avecina a la Tierra, sus efectos negativos se sentirían muy pronto

Adicionalmente, este proceso ocurre con una latencia mínima, lo que hace posible mantener conversaciones continuas sin interrupciones o pausas prolongadas, que antes eran requeridas para que el sistema pudiera procesar el audio.

¿Qué tecnología está detrás de esta traducción?

La traducción en tiempo real de Google Meet se apoya en los avances recientes del ecosistema Gemini, en particular, en el modelo Gemini 2.5 Pro. Este sistema es capaz de razonar, interpretar y generar lenguaje con una precisión que supera a todos los modelos anteriores.

Este modelo se ejecuta sobre la nueva infraestructura de procesamiento conocida como Ironwood TPU, la séptima generación de unidades de procesamiento tensorial de Google. Esta arquitectura permite manejar enormes cargas de trabajo de IA con un rendimiento que supera en 10 veces a la generación anterior, logrando una capacidad de 42,5 exaflops por pod.

De interés: ¿El fin de WhatsApp? Esta es la nueva tecnología que podría cambiarlo todo

Por lo tanto, se ofrece una inteligencia artificial más potente, más rápida y, sobre todo, más humana en sus respuestas.

 

Gemini 2.5 Pro
Gemini 2.5 Pro cuenta con la capacidad de razonar antes de generar una respuesta.
Google

¿Quién puede usar la traducción en tiempo real en Meet?

Por ahora, esta función de traducción de voz está disponible en versión beta para los usuarios suscritos a los planes Google AI Pro y Google AI Ultra.

Durante esta primera fase, la traducción cubre únicamente el inglés y el español, aunque Google ya anunció que planea incorporar nuevos idiomas en las próximas semanas. 

También se ha confirmado que las primeras pruebas en entornos corporativos se realizarán con los clientes de Google Workspace Business, quienes podrán evaluar esta tecnología en escenarios reales de trabajo.

Más noticias: ¿Google Chrome está lento? Así puede lograr que sea mucho más rápido y sin usar apps peligrosas

Recomendaciones para usar esta tecnología

Si bien esta innovación abre nuevas posibilidades para la comunicación global, es importante tener en cuenta algunas recomendaciones para aprovecharla al máximo:

  1. Hablar con claridad y naturalidad
  2. Evitar el uso excesivo de jerga local o modismos
  3. Utilizar audífonos con micrófono de buena calidad
  4. Verificar si la función está habilitada antes de iniciar la reunión
  5. Ser paciente ante pequeños retrasos

Una evolución natural de Meet

Esta función de traducción no es un experimento aislado. Forma parte de una serie de innovaciones que Google ha venido integrando en su plataforma de videollamadas para hacerlas más intuitivas y eficaces.

En años anteriores, la empresa ya había introducido subtítulos automáticos, cancelación de ruido de fondo, y ajustes de iluminación por IA. Ahora, con la traducción de voz, se consolida una experiencia de comunicación verdaderamente universal.

Le puede interesar: ¿Compró un celular usado? Así puede saber si es robado y qué hacer para evitar riesgos

¿Y qué sigue después?

Aunque todavía está en fase de pruebas, Google planea ampliar el acceso a esta función a más usuarios a lo largo del año. También se espera que en futuras versiones se integren más idiomas, opciones de personalización del estilo de traducción, y compatibilidad con dispositivos móviles y tablets sin pérdida de calidad.

Además, al combinar esta tecnología con Google Beam, su nueva plataforma de videocomunicación 3D, Google se acerca cada vez más a una experiencia de conversación híbrida en donde la distancia, el idioma y el contexto dejan de ser obstáculos reales.

 

Fuente:
Sistema Integrado Digital