La semana pasada, el New York Times informó que Google está probando una herramienta de IA que permite a las organizaciones de noticias crear contenido utilizando IA. No está claro cuáles son las capacidades exactas del producto, pero según un comentario de Google, ayuda con tareas como titulares y modificación de estilos de escritura. En medio de los temores sobre el impacto que esto podría tener en los trabajos de los periodistas, Google rápidamente emitió una declaración aclaratoria :
Nuestro objetivo es dar a los periodistas la opción de utilizar estas tecnologías emergentes de una manera que mejore su trabajo y productividad. Sencillamente, estas herramientas no están destinadas a reemplazar, y no pueden reemplazar, el papel esencial que tienen los periodistas para informar, crear y verificar sus artículos.
Esto ha provocado una acalorada conversación sobre el futuro de las noticias con IA generativa. Las empresas que fabrican productos de inteligencia artificial argumentan que esta tecnología permitirá que las organizaciones de medios y los periodistas sean más efectivos, mientras que los críticos sostienen que podría dañar los trabajos de los periodistas, aumentar la información errónea e inundar el mercado con contenido generado por inteligencia artificial de baja calidad.
En este artículo, desglosamos el impacto de la IA generativa en el futuro de las noticias explorando algunas cosas:
Hay varios tipos de contenido de noticias en Internet, cada uno con diferentes niveles de complejidad en su producción. La complejidad generalmente surge de factores como la oportunidad, la cantidad de investigación requerida y la historia que se cuenta.
Noticias fácticas o de datos (p. ej., artículos que enumeran las tasas hipotecarias en San Francisco, artículos con números de la convocatoria de ganancias de una empresa): son relativamente sencillos con opiniones o perspectivas subjetivas mínimas.
Noticias basadas en intereses/informativas (por ejemplo, recetas de verano publicadas en NY Times Cooking, un artículo que explica lo que significa la tasa de interés de la Reserva Federal): hay algo de creatividad en la selección de temas, pero el enfoque es más informativo y atiende a intereses específicos.
Noticias de última hora (por ejemplo, un artículo sobre la renuncia de un director ejecutivo, un artículo que describe un evento meteorológico activo): por lo general, son artículos breves sobre un evento que se desarrolla rápidamente, con información inicial limitada y hechos emergentes.
Cobertura de noticias (con contexto, investigación y hechos): brindan una explicación más detallada de las noticias respaldada por investigación, contexto adicional y, a menudo, entrevistas con personas, lo que requiere más tiempo y esfuerzo para producir; también se verifican exhaustivamente.
Noticias interpretativas: esto incluye artículos de opinión, artículos de opinión y análisis (como este) que brindan interpretaciones/perspectivas/opiniones sobre temas actuales; a menudo son subjetivos y requieren una investigación exhaustiva para respaldar las perspectivas.
Artículos destacados: por lo general, se trata de inmersiones profundas en temas que pueden no ser realmente noticias de actualidad en este momento, pero son temas importantes, el periodismo de investigación entraría en esta categoría; estos requieren una investigación exhaustiva y entrevistas que se extienden a lo largo de meses, y también una narración creativa.
Menciono esta categorización porque el propósito detrás y el proceso involucrado en la producción de estos dos tipos de artículos es muy diferente y, en consecuencia, evolucionará de manera diferente con el uso de la IA generativa. Con esto en mente, hablemos de cómo las noticias generan dinero.
El negocio de las noticias es complicado: la mayoría de las organizaciones de noticias operan con un modelo de medios con publicidad, y un pequeño subconjunto ha logrado pasar con éxito a las suscripciones. Esto tiene implicaciones importantes para el tipo de contenido que produce una organización de noticias.
Los negocios de noticias basados en suscripciones (en particular, NYTimes ahora obtiene ~70 % de los ingresos de las suscripciones) tienen una estrategia de contenido que está directamente relacionada con el valor para el consumidor: se centran en contenido de alta calidad + contenido diverso basado en intereses para que la suscripción valga la pena. Por ejemplo, de los tipos de contenido anteriores, el NYT realiza principalmente cobertura de noticias (que está bien investigada), noticias interpretativas y reportajes para su oferta principal de noticias, respaldado por contenido basado en intereses como NYT Cooking y Wirecutter . Algunas otras publicaciones como el Wall Street Journal y el Washington Post han avanzado mucho con las suscripciones utilizando un enfoque similar.
Sin embargo, la mayoría de las publicaciones aún cuentan con publicidad y seguirán siéndolo en el futuro previsible. Esto significa que están enfocados en generar un alto compromiso: más globos oculares → más inventario de anuncios → más ingresos. La estrategia que ha sido más efectiva para ellos es aumentar el contenido de alta complejidad (como cobertura de noticias, noticias interpretativas) con una tonelada de contenido de alto volumen y baja complejidad (como noticias de hechos/datos, noticias basadas en intereses/informativas).
Esta estrategia funciona porque el contenido de alta complejidad ayuda a brindar valor a largo plazo a los consumidores, mientras que la gran cantidad de contenido de baja complejidad ayuda a llamar la atención y ganar el juego de SEO . El ciclo de SEO se parece a: gran volumen de contenido que obtiene clics → los motores de búsqueda piensan que su contenido es valioso → todo su contenido se clasifica más alto → más ojos.
Esto no es una crítica a la estrategia y la necesidad de jugar el juego de SEO es una necesidad para los medios con publicidad. La realidad es que los medios de comunicación son un negocio terrible : Internet interrumpió la forma en que se creaba y distribuía el contenido (principalmente a través de Google Search / Meta hoy), y las organizaciones de noticias no se han recuperado del impacto de esa interrupción. Hay intentos de corregir el desequilibrio, que aún están evolucionando: Canadá y Australia aprobaron leyes que obligan a Google/Meta a pagar lo que es esencialmente un "impuesto disruptivo" para apoyar el buen periodismo, algunas organizaciones como NPR cuentan con el apoyo parcial de fondos federales y algunas periódicos como el Washington Post están subvencionados por multimillonarios (generalmente bien intencionados) .
Todo esto para decir: los medios de comunicación/periodismo son una utilidad pública absolutamente esencial para una democracia que funcione bien, pero no es un gran negocio. Por lo tanto, cuanto más autosuficientes puedan ser estos negocios de noticias (sin tener que depender de la regulación o de los multimillonarios), más efectivos pueden ser para lograr su misión. La IA generativa no puede resolver todos estos desafíos estructurales (especialmente la distribución de contenido), pero definitivamente puede hacer que la creación de contenido sea más eficiente sin comprometer necesariamente la calidad.
Para comprender en qué parte de la producción de noticias la IA generativa tendrá el mayor impacto, es útil comprender los diferentes pasos involucrados en la publicación de un artículo de noticias.
Podemos dividir el esfuerzo en algunos componentes secuenciales:
Basado en algunas investigaciones y también influenciado por mi experiencia en escritura, estimo el esfuerzo de producir un artículo en algo como: Investigación (30%), Narración (20%), Escritura (20%), Edición (20%) y Distribución. (10%) . Tome los números reales con un grano de sal, pero son direccionalmente precisos.
Ahora, tenga en cuenta que no todos los formatos de artículos de noticias requieren todos los pasos : es posible que las piezas de baja complejidad no necesiten pasar rigurosamente por todos los pasos del ciclo de vida anterior, pero las piezas de alta complejidad sí.
Como ejemplo, este artículo me tomó entre 8 y 9 horas para terminar (al igual que la mayoría de los otros artículos en mi boletín Substack ), y me gustaría pensar que mis artículos se incluyen en las noticias interpretativas. Si escribiera una pieza de baja complejidad, probablemente podría terminarla en aproximadamente 2 horas. Otro punto de datos: este reportero del NYT dice que normalmente puede terminar un artículo de noticias en un par de horas, mientras que un artículo destacado puede tardar hasta 6 meses.
Entonces, ¿en qué puede ayudar realmente la IA generativa? Básicamente se reduce a qué pasos en el proceso de producción de noticias pueden funcionar bien los productos actuales (y futuros).
Aquí está mi opinión sobre cada paso. Spoiler: son algo efectivos para escribir y editar, pueden ser efectivos para la investigación si se crean los productos correctos, y seguirán siendo malos para contar historias.
La mayoría de los productos de IA generativa actuales (como ChatGPT y Google Bard) tienen una capacidad sorprendentemente baja en lo que respecta a la investigación:
Definitivamente hay ciertas capacidades en las que son buenos. Por ejemplo, son buenos para dar argumentos a favor de un punto de vista particular o para inspirar nuevos temas.
Son promedio-buenos para resumir el contenido y, en particular, para responder preguntas basadas en la lectura de un artículo. Por ejemplo, puede pedirles que lean este artículo y enumeren los diferentes pasos involucrados en la producción de noticias.
Sin embargo, a menudo producen información objetivamente incorrecta ("alucinaciones"), no proporcionan enlaces/fuentes a lo que afirman que es la verdad y tienen datos de fuentes cuestionables con una posible infracción de derechos de autor. Vea la captura de pantalla a continuación.
Para un caso de uso genérico (digamos que desea redactar un correo electrónico para una futura conexión de LinkedIn), estos problemas no importan. Pero cuando está escribiendo un artículo de noticias, no verificar los hechos puede afectar gravemente la percepción de su marca.
Si bien las herramientas de investigación se pueden usar para investigaciones de utilidad direccional (por ejemplo, desea saber qué participación de mercado tienen las búsquedas de Bing y Yahoo), los escritores/periodistas aún tienen que hacer un trabajo adicional para encontrar una nueva fuente para vincular porque las herramientas actuales ni proporcionar enlaces ni disponer de datos totalmente exactos.
Usar datos de fuentes limpias + ser capaz de proporcionar respuestas con enlaces confiables es una gran oportunidad para cualquiera que construya un producto de investigación para escritores, y es muy probable que surjan nuevas empresas aquí.
Las capacidades de narración de historias de la IA generativa son bastante débiles en la actualidad. Aquí hay un ejemplo: investigué mucho para este artículo, armé la investigación en un formato organizado y le pedí a ChatGPT que me diera una historia. Vea la captura de pantalla a continuación para ver los resultados.
A primera vista, parece que "tienen sentido". Pero eso es literalmente todo lo que es: tiene sentido a nivel superficial. En realidad, ninguna de estas historias es muy convincente y las notas de investigación que proporcioné tenían muchos más detalles y matices más allá de los resultados superficiales proporcionados aquí. Puede argumentar que todavía son decentes, pero en el contexto de escribir un artículo, esto fue completamente inútil para mí; en el mejor de los casos, esto fue inspiración/ideas, no una historia basada en la investigación que envié.
Si tiene una historia de baja complejidad, hará el trabajo por usted. Si está construyendo una historia matizada, o tiene los datos y necesita ayuda para construir una historia, los productos actuales no hacen el trabajo. Dada la gran cantidad de subjetividad involucrada, no soy optimista, mejorará y esta seguirá siendo la parte donde los escritores pueden agregar más valor.
Si proporciona productos actuales con una historia detallada de lo que quiere decir, puede generar una v1 apenas decente del contenido. El resultado sigue siendo bastante sencillo y es bastante desafiante instruir a los modelos actuales para que elaboren el lenguaje de manera que cuente una historia. Vea la captura de pantalla para ver un resultado de ejemplo después de enviar a ChatGPT notas detalladas sobre la historia de este artículo.
A primera vista, podría pensar que se ve bien para un borrador v1. No lo es: el tono no es el correcto, la historia no fluye y siempre parece que la ha escrito un bot. Es muy genérico y no articula la historia a pesar de estar alimentado con una narrativa muy específica. Si yo publicara ese artículo, no lo leerías. Y ese es el desafío con la capacidad de escritura actual: puede funcionar para artículos de baja complejidad, pero para algo más complejo, básicamente tiene que volver a escribir todo el borrador.
El gran desbloqueo del producto aquí sería permitir una instrucción humana efectiva : los escritores no quieren tomar versiones terribles y rehacer todo línea por línea. Lo que les gustaría es alguna forma de construcción de interacción con el usuario que le permita a un escritor alimentar una historia y crear secuencialmente el artículo sección por sección, mientras brinda retroalimentación activa a la herramienta de IA. La guinda del pastel sería poder personalizar el estilo de escritura alimentando artículos anteriores escritos por el mismo escritor.
Creo que los modelos subyacentes de hoy tienen la capacidad de hacer esto y se necesita innovación en la capa de la interfaz de usuario , lo que creo que sucederá a corto plazo.
Las herramientas de hoy en día tienen una buena cantidad de capacidad para revisar artículos, encontrar errores y hacer correcciones. Estas herramientas también son muy buenas en tareas cosméticas, como generar ideas para titulares llamativos o títulos de secciones que podrían funcionar bien.
Sin embargo, aún se necesita trabajo en la capa de la interfaz de usuario para que se pueda utilizar para la edición; existen algunas soluciones parciales hoy en día, como Notion AI , que le permite mejorar el lenguaje y acortar o alargar las oraciones desde una página de Notion, pero no captura el contexto completo de la página. ChatGPT hace un buen trabajo al realizar ediciones en un artículo completo, pero carece de la capacidad de seguir instrucciones para editar fácilmente secciones específicas y tampoco admite enlaces (es decir, le doy una propaganda con texto que tiene hipervínculos, obtengo texto sin ningún enlace) .
Odio absolutamente la parte de edición del proceso de escritura, y estoy seguro de que varios escritores y periodistas también lo hacen: la IA generativa definitivamente puede minimizar parte de este trabajo duro de edición a corto plazo.
Hay herramientas que están surgiendo aquí hoy que, por ejemplo, lo ayudan a generar fragmentos sociales o identificar partes de su historia que podrían volverse más virales. Es probable que esto continúe mejorando en el futuro.
Con base en el análisis anterior, se puede ver una clara dualidad emergente:
Los formatos de baja complejidad , que requieren una investigación y una narración más sencillas, y que pueden escribirse y editarse con facilidad, empezarán a generarse cada vez más con IA (o con mucha asistencia de IA).
Los formatos de alta complejidad , que requieren capacidades de investigación y narración más complejas que no existen en la actualidad, seguirán siendo creados principalmente por periodistas, pero la IA generativa puede brindar una buena cantidad de eficiencia al minimizar el trabajo pesado de escritura y edición.
Si bien el contenido de baja complejidad generado por IA parece malo a primera vista, estos artículos se escriben principalmente con fines de SEO o para aumentar el contenido de alta calidad existente, y la carrera hacia la mercantilización comenzó mucho antes de la ola generativa de IA. Por ejemplo, Associated Press ha estado usando bots para publicar artículos que informan sobre las ganancias de la compañía desde 2014. La ventaja aquí es que este no es el tipo de contenido que los periodistas quieren dedicar tiempo a crear y automatizar, esto liberará su tiempo para contenido de alta complejidad.
Cada vez surgirán más contenidos de alta complejidad. Las capacidades de investigación y narración de historias con los productos de hoy son limitadas, lo que significa que la capacidad de construir una historia convincente basada en información y contar historias de una manera única seguirá siendo la moneda más importante que tienen los periodistas . Esto, acelerado por las herramientas de escritura y edición de IA que eliminan el trabajo duro de publicar contenido de calidad, será una gran ayuda para los periodistas.
¿Qué pasa con algunas de las preocupaciones planteadas sobre el uso de IA para noticias? Algunos son justos, pero creo que en su mayoría son solucionables:
Una ola de contenido basura de SEO: Google ha tomado la postura de que no penalizará el contenido generado por IA y ha recibido críticas por abrir un mundo de contenido basura, incluidos artículos con hechos incorrectos. Esa es una crítica algo justa, pero creo que Google tomará medidas enérgicas contra esto, no por la bondad de sus corazones, sino porque el quid de un producto de búsqueda es brindarles a los usuarios resultados útiles. Google ya tiene sanciones por las prácticas de piratería de SEO (como el relleno de palabras clave y la agricultura de enlaces) y sería fácil extender este marco al contenido de IA.
Los periodistas perderán sus trabajos: algunos han planteado la preocupación de que los periodistas podrían perder sus trabajos o estar en una posición menos ventajosa (como los escritores de Hollywood que actualmente están en huelga); la gran diferencia aquí es que si bien hay una gran cantidad de escritores en Hollywood, el empleo en las salas de redacción en EE. UU . ha caído un 26 % desde 2008, no porque no necesitemos periodistas sino porque las noticias son un mal negocio; La IA generativa puede ayudar a arreglar la economía del negocio mientras continúa empoderando a los periodistas para que hagan lo que aman.
De ninguna manera soy un maximalista de la IA y creo absolutamente que existen riesgos reales para la IA que deben abordarse a medida que escalamos la tecnología. Sin embargo, creo que es importante analizar cada situación o mercado afectado por la IA por separado y no agruparlos en un gran problema de impacto de la IA.
En el caso de las noticias, la IA generativa puede mejorar enormemente la economía de los negocios de noticias. Los productos no existen hoy en día: existe una clara necesidad de productos de inteligencia artificial que resuelvan cuidadosamente las necesidades de los escritores sin una interfaz de modelo de lenguaje de fuerza bruta basada en chat, pero confío en que surgirán a corto plazo.
La escritura de baja complejidad se generará cada vez más con IA y está bien: puede ayudar a las empresas a ejecutar una máquina de SEO eficiente, mientras que los periodistas (asistidos por IA para el trabajo duro) dan vida a mucho más contenido de alta complejidad que eleva el discurso público.
¡Gracias por leer!
Publicado originalmente aquí.