Preocupaciones y Riesgos en Torno a la IA

Las preocupaciones en torno a la IA son serias. Los riesgos son reales. A veces se expresan de manera histérica, pero, cuando profundizas, el impacto de la IA tiene el potencial de ser enormemente destructivo.

Hay tantos temas y preocupaciones en torno a la IA, que llenan volúmenes por sí solos. Aquí hay una nube de palabras de los temas que monitoreo. Estoy seguro de que me faltan algunos.

Una nube de palabras centrada en el término 'IA', con términos relacionados como 'preocupaciones', 'ética' y 'humanidad' a su alrededor.

Hay mucha información disponible sobre cada uno de estos temas, y te animo a que leas lo más profundamente que puedas. Es posible que concluyas que los riesgos superan los beneficios, y que no quieras seguir el uso de la IA, ya sea personalmente o dentro de tu organización. Esa decisión trae sus propios riesgos; el habitual, de quedarse atrás. Pero es una elección personal.

Si buscas en Google “libros sobre los riesgos de la IA” encontrarás una selección de volúmenes valiosos. Un podcast reciente que encontré particularmente escalofriante fue la charla de Ezra Klein con Dario Amodei, cofundador y CEO de Anthropic (la compañía que desarrolla Claude.ai). Aprenderás que estas compañías son conscientes de los riesgos. Amodei se refiere a un sistema interno de clasificación de riesgos llamado A.S.L., por “Niveles de Seguridad de IA” (no Lengua de Señas Americana). Actualmente estamos en ASL 2, “sistemas que muestran signos tempranos de capacidades peligrosas—por ejemplo, la capacidad de dar instrucciones sobre cómo construir armas biológicas.” Describe ASL 4 como “permitir a actores estatales aumentar significativamente su capacidad… donde nos preocuparía que Corea del Norte, China o Rusia pudieran mejorar enormemente sus capacidades ofensivas en varias áreas militares con IA de una manera que les daría una ventaja sustancial a nivel geopolítico.” Material escalofriante.

Dentro de este contexto sombrío, destacaré los problemas más pertinentes para escritores y editores.

¿Derechos de autor infringidos?

Los problemas de derechos de autor son un miasma de complejidad y ambigüedad. Parece cierto que algunos libros aún bajo derechos de autor se incluyeron en el entrenamiento de algunos MLMs. Pero ciertamente no es el caso, como temen algunos autores, que toda su obra haya sido absorbida por cada uno de los grandes modelos de lenguaje.

Los problemas de derechos de autor son tanto específicos como amplios. Es bien sabido que todos los MLMs se entrenan en la web abierta: todo lo que se puede extraer de los 1.5 mil millones de sitios en la web hoy en día, ya sean artículos de periódicos, publicaciones en redes sociales, blogs y, aparentemente, transcripciones de videos de YouTube.

Es demostrable que al menos uno de los MLMs ingirió el texto real de miles de libros que no están en el dominio público.

¿Fue legal ingerir todo este texto para ayudar a construir compañías de IA valoradas en miles de millones de dólares, sin ninguna compensación a los autores? Las compañías de IA argumentan el uso justo; los tribunales decidirán eventualmente. Incluso si fuera legal, ¿fue ético o moral? La ética parece menos compleja que las consideraciones legales. Tú decides.

Las leyes sobre derechos de autor obviamente no anticiparon los desafíos únicos que la IA trae al problema, y buscar soluciones legales tomará tiempo, quizás años. (Si deseas profundizar en por qué las leyes no son adecuadas para el problema particular en cuestión, lee el excelente artículo de A. Feder Cooper y James Grimmelmann titulado “Los archivos están en la computadora: Derechos de autor, Memorización y IA Generativa.”)

Aquí hay una lista de trece de las demandas más prominentes, no todas relacionadas con libros; también imágenes y música. Y aquí hay otra lista que actualiza el estado de todas las demandas.

Derechos de autor e IA para autores

Los autores enfrentan problemas adicionales relacionados con la posibilidad de otorgar derechos de autor al contenido generado por IA.

La posición de la Oficina de Derechos de Autor de EE.UU. sobre la posibilidad de otorgar derechos de autor al contenido generado por IA establece que la IA por sí sola no puede tener derechos de autor porque carece del estatus legal de un autor. Eso tiene sentido. Pero esto asume que el 100% del trabajo es generado por IA. Como se discute en otros lugares, pocos autores van a permitir que la IA genere un libro completo. Es más probable que sea el 5%, o el 10% o… Y aquí la Oficina de Derechos de Autor tropieza (al igual que yo).

En un fallo más reciente, la Oficina concluyó que una novela gráfica compuesta por texto escrito por humanos combinado con imágenes generadas por el servicio de IA Midjourney constituía una obra susceptible de derechos de autor, pero que las imágenes individuales en sí no podían ser protegidas por derechos de autor. ¡Vaya!

Basta decir que los autores y editores necesitan estar atentos a los problemas de derechos de autor en evolución, en múltiples frentes.

¿Cuáles son las implicaciones a largo plazo?

Algunos comparan la actual litigación con la demanda de Google Books, que tomó 10 años para resolverse legalmente. ¿Quién sabe cuánto tiempo se prolongará el proceso de apelaciones para estas presentaciones? Mientras tanto, es prudente que los editores actúen como si las compañías de IA fueran a perder, lo que, al menos teóricamente, expone a cualquiera que licencie, o tal vez incluso use Chat IA, a algún tipo de responsabilidad contingente.

Pero ese no es el problema más serio de un editor. Es la percepción. Para muchos autores, algunos prominentes, otros desconocidos, el pozo ha sido envenenado. La IA es radiactiva dentro de la comunidad de escritores y editores. Cualquier cosa que siquiera huela a IA atrae críticas intensas.

Hay numerosos ejemplos. En un incidente reciente, Angry Robot, un editor del Reino Unido “dedicado a lo mejor de la ciencia ficción moderna para adultos, fantasía y WTF,” anunció que usaría un software de IA, llamado Storywise, para clasificar un gran lote anticipado de presentaciones de manuscritos. Tomó solo cinco horas para que la empresa abandonara el plan y regresara al “viejo buzón.“

El dilema insoportable para los editores comerciales al usar herramientas de IA internamente: si tus autores se enteran, tendrás dificultades para capear la tormenta resultante. Creo que los editores no tienen más remedio que ser valientes, adoptar (al menos algunas de) las herramientas, explicar claramente cómo se entrenan y utilizan esas herramientas, y seguir adelante.

En el Reino Unido, The Society of Authors adopta un enfoque estricto: “Pide a tu editor que confirme que no hará un uso sustancial de la IA para ningún propósito relacionado con tu trabajo, como corrección de pruebas, edición (incluyendo lecturas de autenticidad y verificación de hechos), indexación, revisión legal, diseño y maquetación, o cualquier otra cosa sin tu consentimiento. Puede que desees prohibir la narración de audiolibros, la traducción y el diseño de portadas realizados por IA.”

The Authors Guild parece aceptar que “los editores están comenzando a explorar el uso de la IA como una herramienta en el curso habitual de sus operaciones, incluidos los usos editoriales y de marketing.” No creo que muchos miembros del Guild sean tan comprensivos.

Licenciamiento de contenido a empresas de IA

La mayoría de los editores, y muchos autores, están buscando formas de licenciar contenido a empresas de IA. Cada uno tiene una idea diferente de cuáles deberían ser los términos de licenciamiento y cuánto vale su contenido, pero al menos las discusiones están en marcha.

Hay varias startups que buscan trabajar con editores (y, en algunos casos, con autores individuales). Calliope Networks y Created by Humans son interesantes en este sentido.

A mediados de julio, Copyright Clearance Center, durante mucho tiempo el principal actor de la industria en licenciamiento colectivo de derechos de autor, anunció la disponibilidad de “derechos de reutilización de inteligencia artificial (IA) dentro de sus Licencias Anuales de Derechos de Autor (ACL), una solución de licenciamiento de contenido a nivel empresarial que ofrece derechos de millones de obras a las empresas suscriptoras.”

Publishers Weekly cubrió el anuncio, citando a Tracey Armstrong, presidenta y CEO de CCC, diciendo “Es posible ser pro-IA y pro-derechos de autor, y combinar la IA con respeto por los creadores.”

Aunque no es todo abarcador, esto probablemente sea un avance en mover la publicación hacia un grado de cooperación con los desarrolladores de modelos de lenguaje amplio.

Es demasiado tarde para evitar la IA

Para los autores y editores que prefieren no ensuciarse con la IA, las noticias son malas: estás usando IA hoy, y la has estado usando durante años.

La inteligencia artificial, en diferentes formas, ya se ha integrado en la mayoría de las herramientas y servicios de software que usamos todos los días. Las personas dependen de correctores ortográficos y gramaticales impulsados por IA en programas como Microsoft Word o Gmail. Microsoft Word y PowerPoint aplican IA para proporcionar sugerencias de escritura, ofrecer recomendaciones de diseño y maquetación, y más. Los asistentes virtuales como Siri y Alexa usan procesamiento de lenguaje natural para entender comandos de voz y responder preguntas. Los servicios de correo electrónico aprovechan la IA para filtrar mensajes, detectar spam y enviar alertas. La IA potencia los chatbots de servicio al cliente y genera recomendaciones de productos basadas en tu historial de compras.

Y mucho de esto se basa en Modelos de Lenguaje Amplio, como es el caso de ChatGPT.

Para que un autor o editor diga, “No quiero que se use IA en mi manuscrito,” en términos generales, es prácticamente imposible, a menos que tanto ellos como sus editores trabajen con máquinas de escribir y lápices.

Podrían intentar decir, “No quiero IA generativa” usada en su libro. Pero esa es una cuestión difícil de desglosar. El software de corrección gramatical no se construyó originalmente con IA generativa. Grammarly la ha añadido como un ingrediente a su producto, como lo harán todos los demás correctores ortográficos y gramaticales. La IA generativa también es fundamental para el software de marketing que se ofrece.

Cuando los autores usan IA

Otro aspecto de los autores y el uso de la IA tiene similitudes con el tema de los derechos de autor discutido anteriormente. En el extremo, estamos viendo contenido 100% generado por IA siendo publicado en Amazon. La mayoría (¿todo?) es de calidad terrible, pero eso no impide que se publique. (Ver también la sección de Amazon.) Más preocupante para los editores son las presentaciones generadas por IA. Sí, la IA aumenta la cantidad, pero los grandes editores ya tienen un filtro para la cantidad. Los filtros se llaman agentes. Ellos son los que van a tener que averiguar cómo manejar el problema de la cantidad, y aparentemente van a tener que encontrar una solución que no emplee IA.

Es algo así como un problema existencial: ¿quiero publicar un libro escrito por ‘una máquina’? Para la mayoría de las editoriales, eso es un ‘no’ rotundo. Fácil. Bien, ¿qué tal un libro donde el 50% del contenido fue generado por una IA, bajo la supervisión de un autor competente? Hmm, intentemos también con un ‘no’. OK: ¿y qué tal un 25%, o un 10%, o un 5%? ¿Dónde trazas la línea?

Y, ahora que has entrado en el negocio de trazar líneas, ¿cómo resuelves el dilema de que las herramientas de corrección ortográfica y gramaticales ahora dependen, al menos en parte, de la IA generativa? ¿Qué hay de las herramientas de transcripción impulsadas por IA, como Otter.ai o la función de transcripción integrada en Microsoft Word?

No encuentro ninguna editorial comercial que haya declarado que no publicará una obra con una cantidad predefinida de texto generado por IA. Aquí está el Gremio de Autores sobre el tema:

“Si una cantidad apreciable de texto, personajes o trama generados por IA se incorporan en tu manuscrito, debes divulgarlo a tu editor y también deberías divulgarlo al lector. No creemos que sea necesario que los autores divulguen el uso de IA generativa cuando se emplea meramente como una herramienta para la lluvia de ideas, generación de ideas o para la corrección de textos.”

Ni que decir tiene que ‘apreciable’ no está definido (Oxford lo define como “lo suficientemente grande como para ser notado o considerado importante”), pero la publicación continúa explicando que la inclusión de más del texto generado por IA “de minimis” violaría la mayoría de los contratos editoriales. De minimis, en términos legales, no está precisamente especificado, pero, en general, significa más o menos lo mismo que apreciable.

¿Se puede detectar la IA en la escritura?

Organicé un seminario web sobre la detección de IA, patrocinado por BISG, en mayo de 2024. La repetición está en línea en YouTube. Jane Friedman ofreció un resumen completo del seminario web en su boletín Hot Sheet.

Para muchos autores, la toxicidad de la IA significa mantenerla lejos de sus palabras. Las editoriales tienen una carga especial: no crean el texto, pero, una vez publicado, asumen una obligación sustancial hacia el texto. Hemos visto muchos libros incendiarios cerca de explosiones, ya sea por las implicaciones sociales del contenido o por el robo plagiario de las palabras e ideas de otros escritores. Ahora con la IA enfrentamos un conjunto completamente nuevo de problemas éticos y legales, ninguno de los cuales se delinearon en la escuela de edición.

Parte de esto parece similar a lo que preocupa a las personas sobre los estudiantes: que usar IA es de alguna manera hacer trampa, similar a copiar de un artículo de Wikipedia o quizás simplemente pedirle a un amigo que escriba tu ensayo.

Uno de nuestros oradores del seminario web, un educador, José Bowen, compartió su divulgación para estudiantes. No es exactamente lo que usarías para un autor, pero demuestra algún tipo de “niveles de riesgo” del uso de IA.

Acuerdo de Divulgación de Plantilla para Estudiantes

Hice todo este trabajo por mi cuenta sin ayuda de amigos, herramientas, tecnología o IA.
Hice el primer borrador, pero luego pedí a amigos/familia, IA parafraseo/gramática/plagio software que lo leyeran y hicieran sugerencias. Hice los siguientes cambios después de esta ayuda:
- Corregí la ortografía y gramática
- Cambié la estructura o el orden
- Reescribí oraciones/párrafos enteros
Me atasqué en problemas y usé un tesauro, diccionario, llamé a un amigo, fui al centro de ayuda, usé Chegg u otro proveedor de soluciones.
Usé IA/amigos/tutor para ayudarme a generar ideas.
Usé asistencia/herramientas/IA para hacer un esquema/primer borrador, que luego edité. (Describe la naturaleza de tu contribución.)

Y así una editorial podría redactar algo como esto para sus autores. Supongamos que el autor revela el nivel superior: Usé IA extensamente, luego edité los resultados. ¿Entonces qué? ¿Rechazas automáticamente el manuscrito? Si es así, ¿por qué?

Y, mientras tanto, si estás prestando atención, aprendes que ese manuscrito que acabas de leer y amar, que el autor juró que no fue siquiera revisado por Grammarly, podría haber sido en realidad generado en un 90% por IA, por un autor experto en ocultar su uso.

Entonces te ves obligado a replantearte la pregunta. Se convierte en, “¿Por qué estoy tan condenado a detectar esta cosa que es indetectable?”

En parte, es la preocupación alarmista en torno a la capacidad de ser protegido por derechos de autor del texto generado por IA. La oficina de derechos de autor no ofrecerá protección a textos generados 100% por IA (o música, o imágenes, etc.). Pero, ¿qué pasa con un texto generado en un 50% por IA? Bueno, solo cubriríamos el 50% generado por el autor. ¿Y cómo sabrías qué mitad? Ya te responderemos sobre eso.

¿No sería genial si pudieras simplemente alimentar cada manuscrito en algún software que te diría si se había usado IA en la creación del texto?

Dejando de lado el problema de que la única forma de hacer esto sería empleando herramientas de IA, la pregunta más importante es, ¿sería el software (suficientemente) preciso? ¿Podría confiar en él para decirme si se había usado IA en la creación de un manuscrito? ¿Y podría depender de que no produjera “falsos positivos”, es decir, que indicara que se había usado IA cuando en realidad no lo había hecho?

Ahora hay mucho software en el mercado que aborda estos desafíos. Muchos de los estudios académicos que evalúan este software señalan su falta de fiabilidad. El texto generado por IA se escapa. Peor aún, se etiqueta falsamente como contaminado el texto que no fue generado por una IA.

Pero los editores de libros querrán tener algún tipo de salvaguardas en su lugar. Parece que, en el mejor de los casos, estas herramientas podrían alertarte sobre posibles preocupaciones, pero siempre necesitarías verificar dos veces. ¿Podría esto alertarte sobre textos que necesitan ser examinados más cuidadosamente que otros? ¿Es esto una eficiencia?

La verdadera eficiencia se encontrará al superar las preocupaciones sobre la génesis de un texto, en lugar de mantener nuestros criterios existentes en cuanto a su calidad.

Pérdida de empleo

“No vas a ser reemplazado por IA. Vas a ser reemplazado por alguien que sepa usar IA.” —Anónimo

La pérdida de empleo debido a la adopción de IA podría ser grave. Las estimaciones varían, pero los números son sombríos. Hay ejemplos obvios: los taxis sin conductor de San Francisco eliminan… conductores de taxis y de servicios de transporte compartido. Los diagnósticos apoyados por IA podrían reducir la necesidad de técnicos médicos.

El optimista en mí señala, como un ejemplo, la introducción de la hoja de cálculo y su impacto en el empleo. Como se ve en el gráfico a continuación, el empleo en “Servicios de Contabilidad, Preparación de Impuestos, Contabilidad y Nómina” casi se ha duplicado desde 1990, lo que difícilmente es una acusación contra las hojas de cálculo y otras tecnologías que han automatizado en gran medida estas tareas.

Un gráfico de líneas que muestra el número de empleados en servicios de contabilidad, preparación de impuestos, contabilidad y nómina desde 1990 hasta 2020.

El estudio de Ethan Mollick con el Boston Consulting Group (BCG) fue un experimento que tenía como objetivo comprender mejor el impacto de la IA en el trabajo, especialmente en tareas complejas e intensivas en conocimiento. El estudio involucró a 758 consultores de BCG, asignados aleatoriamente para usar o no usar GPT-4 de OpenAI para dos tareas: innovación creativa de productos y resolución de problemas empresariales. El estudio midió el rendimiento, comportamiento y actitudes de los participantes, así como la calidad y características del resultado de la IA.

Entre los hallazgos se destacó que “la IA funciona como un nivelador de habilidades. Los consultores que obtuvieron las peores calificaciones cuando los evaluamos al inicio del experimento tuvieron el mayor salto en su rendimiento, un 43%, cuando pudieron usar IA. Los consultores principales también obtuvieron un impulso, pero menor.” El artículo completo es revelador y, como todo el trabajo de Mollick, provocador pero accesible.

Educación

La educación ha estado en el centro de los debates a favor y en contra de la IA. La introducción de la IA en las aulas se ve en gran medida como una maldición, o al menos un desafío. Otros educadores, como el ponente principal de PW, Ethan Mollick, abrazan la IA como una herramienta nueva y notable para los educadores; Mollick insiste en que sus estudiantes trabajen con ChatGPT.

El mejor libro sobre el tema es Teaching with AI: A Practical Guide to a New Era of Human Learning de José Antonio Bowen y C. Edward Watson.

No voy a profundizar en la publicación educativa en este libro; es un tema vasto que demanda un informe separado. Es discutible que la publicación esté volviéndose de interés secundario dentro de la educación: las herramientas de IA son software, no contenido, per se.

El futuro de la búsqueda

La búsqueda es un tema complicado en la IA. Te animo a visitar perplexity.ai y You.com para obtener una visión de hacia dónde se dirigen las cosas. Las próximas veces que pienses en iniciar una búsqueda en Google, ve a Perplexity en su lugar. No parecerá dramáticamente diferente; es similar a los gráficos de conocimiento que Google a menudo muestra en el lado derecho de una pantalla de búsqueda, o a veces en la parte superior de los listados de resultados de búsqueda. En lugar de tener que hacer clic en un enlace, la información está justo ahí para ti.

La Perplejidad va un paso más allá, reformulando la información que recoge de múltiples fuentes para que realmente no tengas que hacer clic en un enlace. Proporciona enlaces a sus fuentes, pero hacer clic en ellos generalmente es innecesario; ya tienes la respuesta a tu pregunta.

Este cambio aparentemente modesto tiene enormes implicaciones para todas las empresas y todos los productos que dependen, al menos en parte, de ser descubiertos a través de motores de búsqueda. Si los buscadores ya no son enviados a tu sitio, ¿cómo puedes involucrarlos y convertirlos en clientes? Respuesta simple, no puedes.

Joanna Penn está a la vanguardia del pensamiento sobre el impacto de las nuevas tecnologías en la escritura y la publicación. Abordó este complejo tema en su podcast y blog el pasado diciembre.

Todavía es temprano para la IA y la transformación de la búsqueda.

Libros basura en Amazon

Los libros basura generados por IA en Amazon son un problema, aunque su gravedad puede ser más visceral que literal. Por un lado, estos libros están llenando la librería en línea con contenido de baja calidad y plagiado, a veces usando los nombres de autores reales para engañar a los clientes y aprovecharse de sus reputaciones. Los libros no solo son una molestia para los lectores, sino también una amenaza para los autores, potencialmente privándolos de regalías ganadas con esfuerzo. Los libros generados por IA también afectan la clasificación y visibilidad de libros y autores reales en el sitio de Amazon, ya que compiten por las mismas palabras clave, categorías y reseñas.

Un lindo gatito sentado en una playa con flores alrededor y una leyenda que dice 'Fotos divertidas y lindas de gatos que no puedes ver en el mundo'.

Amazon ahora requiere que los autores divulguen detalles sobre su uso de IA en la creación de sus libros. Sin duda, esto puede ser mal utilizado.

Intenta buscar en Amazon “libros generados por IA”. Hay muchos. Algunos de los resultados son libros sobre el uso de IA para crear libros. Pero otros son, sin tapujos, generados por IA. “Imágenes divertidas y lindas de gatos- No puedes ver este tipo de fotos en el mundo-PARTE-1” (sic) está acreditado a Rajasekar Kasi. No hay detalles de su biografía en una página de autor, pero seis otros títulos están acreditados a su nombre. El libro, publicado el 26 de agosto de 2023, no tiene reseñas ni rango de ventas. El título gramaticalmente incorrecto del ebook no coincide con el título gramaticalmente incorrecto en la portada del libro impreso.

Pero otros autores claramente están usando IA extensivamente en la creación de sus libros, y no lo divulgan. Como menciono arriba, detectar el uso de IA es casi imposible con ‘falsificadores’ hábiles. Libros para colorear, diarios, libros de viaje y libros de cocina se están generando con herramientas de IA en una fracción del tiempo y esfuerzo de la publicación tradicional.

Busca “libro de cocina vegana coreana” y encontrarás el título número uno, de Joanne Lee Molinaro, en primer lugar. Pero justo detrás de él hay otros títulos que son claramente copias. “El libro de cocina vegana coreana: recetas tradicionales y modernas simples y deliciosas para los amantes de la cocina coreana” tiene dos reseñas, incluyendo una que señala “Este no es un libro de cocina vegana. Todas las recetas tienen ingredientes de carne y huevos.” Pero el libro está en el puesto #5,869,771 en rango de ventas, frente al original, que está en el puesto #2,852 de la lista.

Es difícil determinar la magnitud del daño causado. Nada bueno puede salir de esto, pero ¿qué tan malo es?

Amazon tiene políticas que le permiten eliminar cualquier libro que no “proporcione una experiencia positiva al cliente.” Las directrices de contenido de Kindle prohíben “contenido descriptivo destinado a engañar a los clientes o que no represente con precisión el contenido del libro.” También pueden bloquear “contenido que típicamente decepciona a los clientes.” ¿Es el volumen lo que derrota a los vigilantes de Amazon? ¿O hay otra razón?

Sesgo

Los LLMs se entrenan con lo que ya se ha publicado en línea. Lo que se ha publicado en línea está lleno de sesgo, por lo que los LLMs reflejan ese sesgo. Y, por supuesto, no solo sesgo, sino odio, reflejado en sus aprendizajes, y ahora un posible resultado en palabras e imágenes generadas por IA. El porno es otro beneficiario natural de la notable habilidad de la IA con las imágenes, y hay historias recientes preocupantes de jóvenes mujeres que encuentran imágenes desnudas fabricadas, con sus compañeros masculinos como sospechosos probables. The New York Times informó por separado sobre un aumento en las imágenes en línea de abuso sexual infantil.

Los autores y editores deben ser conscientes de estas limitaciones inherentes al usar herramientas de IA.

Up next

La creatividad puede ser un cliché