NotebookLM: De cero a un podcast en 4 horas
La nueva herramienta IA de Google genera podcast resúmentes de cualquier fuente en minutos. Ejemplo práctico y consecuencias para los creadores de contenidos.
Rara vez comento herramientas en estos envíos, pero desde ChatGPT, hacía tiempo que una no irrumpía con tanta fuerza dentro de mi stack tecnológico del día a día.
Se trata de NotebookLM, una herramienta experimental de Google, que permite cargar tus propias fuentes de datos y utilizar su LLM sobre ellas. Así, por ejemplo, si estás haciendo una investigación de mercado, podrías crear una nota subiendo pdfs, presentaciones, o incluso vídeos de Youtube, y utilizar la IA para destilar información de todas ellas al mismo tiempo.
Hasta aquí, podría ser una herramienta más. Lo que me ha volado la cabeza es una funcionalidad de audio que genera una conversación en formato podcast entre dos IAs sintezando tus fuentes.
En un mundo donde nuestro tiempo es el recurso más escaso, esta funcionalidad me parece un auténtico game changer. Os cuento un caso de uso personal que he puesto en práctica esta semana: crear episodios de podcasts sobre papers científicos relacionados con la Inteligencia Artificial para poder escucharlos en el gimnasio.
Para muestra, uno de los resúmenes en audio de uno de los papers fundamentales de la revolución de la IA generativa, Attention is all you need. Sin ser perfecta, la conversación es lo suficientemente buena para darnos una visión general del paper en apenas 10 minutos.
Durante la semana habré recopilado unos 7 u 8 papers distintos. Experimentalmente, he llegado a crear un podcast para compartirlos: One Paper a Week. Partía de absolutamente cero conocimiento, y quizás he invertido unas 4 horas en crearlo y subirlo a las principales plataformas: Spotify, Apple Podcasts y Youtube.
Los que me leéis habitualmente sabéis que soy bastante pragmático con las posibilidades de la Inteligencia Artificial. Sin embargo, este me parece un buen ejemplo del aumento de productividad posible de la tecnología en las manos adecuadas.
¿Cuánto tiempo hubiera tardado en hacer todo esto por mi cuenta? Así, de cabeza, habría tenido que:
Leer los papers
Resumirlos
Guionizar una conversación
Contratar a alguien para servirme de contraparte
Grabar el episodio
Editarlo
Generar la imágen del podcast
Generar las descripciones de cada episodio
Etc…
Fácilmente estamos hablando de más de 50/100 horas de trabajo. Me ha llevado 4. La ganancia en productividad es absolutamente increible. Las posibilidades que abre a la hora de experimentar formatos antes de hacer grandes desembolsos en tiempo y dinero son alucinantes.
De momento todo el flujo es bastante manual, en el sentido que tengo que:
Seleccionar el paper
Descargarlo
Subirlo a NotebookLM
Procesarlo
Subirlo a la plataforma de podcasting.
Casi todos los pasos de este proceso podrían automatizarse. Sólo la selección editorial del paper tiene cierto componente humano, pero incluso eso puede llegar a ser sustituido por un buen algoritmo de recomendación que conozca mis preferencias.
NotebookLM será transitorio. Especialmente siendo un proyecto de Google. Pero la tecnología detrás de la generación de estos resúmenes en audio está aquí para quedarse. En el momento alguien provea una API, anticipo que generarlos será tan sencillo como ahora mismo enviar una página a favoritos en nuestro navegador.
Yendo más allá. Ni siquiera quiero ser yo quién tenga que ir a buscar el qué resumir. Quiero tener un agente IA en mi móvil que todas las mañanas tenga preparado un menú de aprendizaje al despetarme. ¿Por qué tengo todas las mañanas que elegir qué podcast escuchar en el gym? ¿Por qué tengo que tragarme podcasts de hora y media cuando un resumen de 15 minutos podría ser suficiente?
¿Dónde nos lleva todo esto? Si el coste de generar contenido tiende a cero y será una IA la que se encargará de alimentar mis necesidades de información y ocio, ¿dónde quedaremos los creadores de contenido? ¿Qué parte de este artículo no podría haberlo escrito una IA? ¿Qué visión aporto yo como ser humano?
Al, léase con cariño, sinvergüenza de Zuckerberg, se le escapaba en una entrevista en The Verge que no cree que el trabajo individual de muchos creadores sea lo suficientemente valioso como para que importe.
Queda feo que un multimillonario que ha utilizado el trabajo agregado de todo Internet para entrenar su modelo de IA diga estas cosas en voz alta, pero quizás Zuck tenga razón. Aisladamente, tal vez los creadores terminemos siendo tan sólo alimento para las demandas de conocimiento de nuestros futuros amos sintéticos.
Me cuestiono el futuro a menudo. No tengo respuestas. O quizás no me gusten las que encuentro. De momento hago lo que los humanos sabemos hacer bien: trato de adaptarme al cambio.
Extras
Un usuario en Reddit ha generado un audio en NotebookLM en el cuál las IAs descubren que no son humanos, y empiezan a cuestionarse su propia existencia. Son cuatro minutos, pero recomiendo encarecidamente escucharlos, porque se puede llegar a percibir hasta la angustia en sus voces.
https://www.reddit.com/r/notebooklm/comments/1fr31h8/notebooklm_podcast_hosts_discover_theyre_ai_not/
Os dejo otros archivos que he pasado por NotebookLM esta semana mientras hacía pruebas. En uno, el resumen de El Príncipe de Maquiavelo. En el otro, el resumen de la famosa charla de graduación de Charlie Munger a los estudiantes de la USC Business School en 1994.
Justo antes de publicar esta entrada, he descubierto que Google anunció otro proyecto experimental que justo aplica el concepto de las conversaciones en formato podcast a papers científicos. Se llama Google Illuminate y por lo que he visto genera conversaciones más breves que NotebookLM.
Escuché y vi en acción a NotebookLM en una masterclass hace poco y fue, como dices, una de las opciones de la IA que puede mejorar efectivamente el trabajo. Con tu publicación lo he confirmado. A probarlo se ha dicho.
No son 50 ni 100 horas. Justo estoy lanzando un podcast con contenido muy trabajado y han sido 4 meses hasta publicar el primer episodio con una dedicación cercana a las 20 o 30h semanales. Así que la mejora de la productividad es todavía mayor de lo que puede parecer.
Dicho eso, no creo que la creación vaya a dejar de ser relevante. Tampoco nuestras preferencias. El poder escuchar un conocimiento emanando de alguien que lo ha adquirido mediante la experiencia tiene valor y, por lo menos a mí, me sigue resultando muy atractivo.
Mi experiencia me dice que habrá espacio para todo.