El gigante de la tecnología está aprovechando las capacidades de Gemini para permitir que los usuarios de su aplicación de notas impulsada por IA ahora puedan interactuar con sus transcripciones y documentos de investigación de manera entretenida.
En busca de ayudar a las personas a estudiar sus propios documentos sin tener que sentarse a leerlos, Google añadió a su aplicación de notas con inteligencia artificial una nueva función llamada Audio Overview que convierte los apuntes e investigaciones de los usuarios en conversaciones en audio al estilo de un podcast conducido por dos locutores sintéticos impulsados por IA.
El objetivo del gigante de la tecnología es permitir que las personas puedan descargar estos podcasts generados con inteligencia artificial y llevarlos a donde quiera que vayan, para que así puedan repasar sus notas o aprender nuevos conocimientos de una forma divertida.
“Nos entusiasma incorporar audio a NotebookLM, porque sabemos que algunas personas aprenden y recuerdan mejor al escuchar conversaciones”, escribió Google en el comunicado oficial sobre el lanzamiento de Audio Overview, publicado en su blog.
¿Cómo hace NotebookLM de Google para transformar notas en podcasts con IA?
NotebookLM fue lanzado el año pasado como un asistente de inteligencia artificial personalizado diseñado para “ayudar a las personas a pensar mejor”, según el propio Google. Inicialmente, funcionaba como una herramienta para revisar documentos, en la cual las personas podían cargar diversas fuentes de un mismo tema para posteriormente solicitar resúmenes o hacerle preguntas al respecto.
Hace apenas un par de meses, Google potencializó las capacidades de NotebookLM con la integración de Gemini, el sistema de inteligencia artificial más avanzado que ha desarrollado la compañía hasta ahora, haciendo que su app de notas adquiriera capacidades multimodales los que le permite analizar texto, imágenes, gráficos y diagramas procedentes de los documentos, así como nuevos formatos de fuentes, incluyendo links, presentaciones y documentos de Google o archivos PDF.
Ahora, a partir de este miércoles 12 de septiembre NotebookLM también está adquiriendo la capacidad de analizar las fuentes, extraer la información más importante y generar voces sintéticas que se encargan de presentarla mediante una conversación en la que se tocan a profundidad los temas principales de los documentos.
“Con un solo clic, dos anfitriones de IA inician un debate basado en sus fuentes”, se puede leer en el blog de Google. “Resumen el material, establecen conexiones entre temas, charlan entre sí e incluso, en ocasiones intercambian bromas al respecto”.
Por otro lado, el gigante tecnológico con sede en Mountain View, California subrayó que las discusiones generadas con IA “no necesariamente presentan una visión integral u objetiva de un tema”, ya que son un reflejo de las fuentes que ha cargado el usuario y si estas están sesgadas o abordan la materia desde un ángulo específico es probable que los presentadores también lo hagan.
Las limitaciones de la nueva herramienta de NotebookLM
Google admitió que la nueva función de Audio Overview atraviesa su fase experimental, por lo que aún tiene algunas limitaciones. La primera es que actualmente solo funciona en inglés, por lo que inicialmente estará disponible únicamente para usuarios en Estados Unidos.
En segundo lugar, la compañía aceptó que en el caso de algunos equipos, puede llevar varios minutos generar los podcast. Además, aunque mencionó que es poco probable, admitió que como cualquier otro modelo de IA generativa existente, puede llegar a tener imprecisiones o “alucinaciones”.
Mientras tanto, Google está invitando a los primeros usuarios de Audio Overview en Norteamérica a que les envíen comentarios sobre su experiencia utilizando su nueva tecnología, para tomarlos como retroalimentación y seguir perfeccionándola con miras a lanzarla en otros mercados.