Hace unas semanas en nuestro primer reporte dedicamos todo un capítulo a las realidades sintéticas: la manera como nuevos algoritmos basados en inteligencia artificial están rápidamente evolucionando para producir todo tipo de contenidos completamente nuevos (allí donde en el pasado sus usos estaban limitados a cosas como clasificar o recomendar elementos).
Pasaron apenas un par de semanas desde que compartimos esa historia cuando apareció ChatGPT. Se trata de una herramienta interactiva desarrollada por OpenAI para difundir el uso de su algoritmo generativo de texto. Y el resultado ha sido una lo-cu-ra.
No todo el mundo pasa cantidades insanas de tiempo en Twitter como yo, pero desde la aparición de ChatGPT hemos visto una cantidad enorme de personas emocionadas, preocupadas, curiosas, ansiosas, y todo tipo de otras reacciones. Hemos visto también todo tipo de usos, casos, análisis, integraciones, y experimentos que están utilizando ChatGPT para todo tipo de fines. Y creo que no es exagerado decir que somos varios lo que hemos jugado con la herramienta con plena consciencia de como podría comerse todo — o al menos parte de — nuestro trabajo.
Así que es relevante que esta semana nos detengamos un poco a explorar qué es ChatGPT, por qué tanta alharaca, y qué significa esto para diferentes profesiones, actividades, y productos.
¿Qué es ChatGPT?
Vamos por partes.
En el 2015 se formó OpenAI, un grupo de investigación que busca promover usos de la inteligencia artificial que beneficien a toda la humanidad. Entre sus fundadores estuvieron Sam Altman (hoy CEO de OpenAI, antes CEO de Y Combinator), Elon Musk (a quien seguramente casi todos ya conocemos pero es el CEO de Tesla, SpaceX, Twitter, y la primera persona en la historia en perder $200 mil millones), entre otros personajes de la órbita de Silicon Valley — Musk abandonaría luego el directorio de la organización para evitar posibles conflictos de interés con Tesla.
En el 2020 OpenAI anunció el lanzamiento de GPT-3, la versión más reciente de su algoritmo de generación de texto. GPT-3 está entrenado con billones de palabras a través de todo internet para producir textos nuevos: el algoritmo recibe una instrucción en lenguaje natural — por ejemplo, “muéstrame una receta para hacer alitas de pollo” — y el algoritmo genera una respuesta. No busca una respuesta, sino que la genera: un motor de búsqueda como Google toma tu instrucción y devuelve enlaces a páginas web que considera responden a lo que estás buscando. GPT-3 genera directamente ese resultado final.
Ahora, en un principio OpenAI consideraba GPT-3 tan poderoso (y potencialmente peligroso) que limitó significativamente el acceso. La organización estaba preocupada por los potenciales usos nocivos o poco éticos que pudieran hacerse del algoritmo, y no fue sino hasta casi año y medio después del anuncio original, en noviembre 2021, que permitieron a cualquier desarrollador utilizar la API para interactuar con el algoritmo. Durante todo ese tiempo, supervisaron de cerca todos los casos de uso y refinaron el modelo para que tuviera menos vectores expuestos de “ataque” — que existan menos maneras en las que podría ser mal utilizado o abusado.
Ha sido recién un año después de eso que OpenAI ha lanzado ChatGPT: una versión web de GPT-3 optimizada para tener conversaciones interactivas con cualquier usuario, sin necesidad de conectarse con la API. La interfaz funciona exactamente con un chat, con la salvedad importante de que uno está chateando con un algoritmo, no con una persona. Y no con un algoritmo que tiene respuestas preprogramadas o árboles de decisión prescritos como la mayoría de (desastrosos) chatbots que existen, sino con uno que genera una nueva respuesta ante cada mensaje que recibe.
Y aquí que fue que nos volvimos todos locos.
¿Cómo funciona ChatGPT?
ChatGPT, y GPT-3, son grandes modelos de lenguaje (Large Language Models o LLMs en inglés). En simple: son modelos que consumen cantidades enormes de texto disponible en internet, y a partir de eso desarrollan la capacidad de interpretar instrucciones y de generar textos nuevos. Lo hace de manera puramente estadística, y sin tener ningún tipo de conocimiento sobre el contenido que interpreta o produce: cuando le digo “muéstrame una receta para hacer alitas de pollo”, interpreta que lo que busco es una receta, y empieza a producir un texto que, en su análisis estadístico, mejor se ajuste a la descripción de “una receta para hacer alitas de pollo”.
Incluso puedo seguir la conversación, y pedirle alternativas si es que no estoy convencido con su resultado. Si, por ejemplo, no quiero preparar mis alitas al horno, sino a la parrilla, puedo pedirle la corrección:
Hasta ahí todo bien — es una receta perfectamente razonable para preparar alitas de pollo a la parrilla, que ha sido producida más rápido y con menos ruido de lo que me habría tomado encontrar una en la web.
Pero es importante entender que el algoritmo no sabe realmente nada. No sabe qué es un pollo, una parrilla, ni una receta: apenas presenta el resultado que con mejor probabilidad satisface la intención que interpreta de la instrucción, en base a los billones de textos con los que ha sido entrenado. El algoritmo está diciendo: “hay una alta probabilidad de que este texto responda satisfactoriamente a la instrucción que he recibido”, sin que tenga que entender realmente nada sobre la instrucción ni la intención. Por eso, cuando le pido en la misma conversación que me brinde una receta para preparar alitas de chancho, lo hace sin saltarse un compás:
Pero sería equivocado ver este resultado y decir “ah, pero qué bruto, póngale cero”. Muchas personas, especialmente en Twitter, están buscando qué instrucción pueden usar para que ChatGPT produzca resultados inexactos, sesgados, o flagrantemente falsos como para demostrar que no es confiable. Pero ese no es el punto. ChatGPT es muy bueno para procesar y resumir información cuando la instrucción que le damos es confiable. Pero no sabe distinguir lo verdadero de lo falso, ni lo bueno de lo malo, y como cualquier algoritmo exhibe también los sesgos del material con el que se ha sido entrenado.
ChatGPT no debe confundirse con inteligencia artificial general: aquella capaz de responder de manera fluida a cualquier pregunta y aplicarse a cualquier uso o contexto. Es una impresionante maquinaria estadística capaz de producir textos de una calidad bastante aceptable en poquísimo tiempo. Nos equivocamos si nos enfocamos en todo lo que no puede hacer — que es mucho — en lugar de todo aquello para lo que sí puede funcionar.
Jugando con el algoritmo
Me he pasado las últimas semanas haciendo diferentes experimentos con ChatGPT y ya se ha convertido en una de las herramientas más útiles con las que trabajo. Hay tres maneras en las que ChatGPT ya se ha vuelto parte de mi trabajo cotidiano.
La primera es que es un gran asistente de investigación. Para Mutaciones, almacenamos toda la información de interés que encontramos — nombres de personas, organizaciones, y productos, libros, artículos, videos, podcasts, y demás — en una base de datos que llamamos la Mutabase. Utilizando ChatGPT, podemos rápidamente producir resúmenes de suficiente calidad para todos los artículos que almacenamos como para incluir en nuestra base de datos. Esto ayuda muchísimo a la hora de regresar sobre la información almacenada o buscar referencias a elementos en particular: en función al texto, ChatGPT también puede identificar y armar una lista de personas y organizaciones mencionadas en el texto. Si bien no siempre es perfecto, es más que aceptable como punto de partida para refinar.
La segunda es que es sumamente útil como asistente de desarrollo. ChatGPT no solamente es capaz de generar texto, sino que también puede generar código en función a la instrucción recibida. Parecido al caso anterior, me estoy apoyando en ChatGPT para identificar y esquematizar los componentes que necesito para desarrollar una aplicación automatizada de gestión de contenidos, que sea capaz de tomar un enlace, obtener la metadata adecuada, un resumen automatizado, y almacenar todo en una base de datos.
La tercera es que es un gran asistente de contenido, útil para generar ideas o esquematizar contenidos para artículos, presentaciones, talleres, y cursos. Por ejemplo, lo estuve utilizando para generar posibles estructuras para diseñar un taller precisamente sobre ChatGPT, indicando parámetros como el número de módulos, la duración de cada uno, y el tipo de interacción que debería reflejar.
La cuarta y la más rara es que ChatGPT me está ayudando a clonarse. He encontrado tanto uso en la herramienta que estoy explorando la posibilidad de crear mi propio modelo de lenguaje, basado en GPT-3 pero entrenado con todos los textos propios que pueda conseguir — notas, artículos, blog posts, correos, todo lo que pueda utilizar para alimentar mi propio asistente virtual. Y no tenía idea cómo incluso empezaría a hacer algo así. Así que le pregunté a ChatGPT como haría para crear mi propio ChatGPT, y fue muy cortés en explicarme paso a paso lo que tenía que hacer para lograrlo.
Todos estos ejemplos están en inglés porque, si bien ChatGPT entiende múltiples idiomas, la mayor parte de su material de entrenamiento está en inglés — con lo cual se consiguen también los resultados más confiables.
Hay muchas más cosas con las que he estado jugando: creando villancicos anti-navideños, redactar correos y estructuras de propuestas para clientes, responder a preguntas básicas más rápido que utilizando un buscador. Se me ha vuelto normal tener una ventana de ChatGPT abierta todo el tiempo cuando quiero un borrador rápido de una idea o cuando quiero elaborar las partes de un proceso complejo.
Y creo que eso es lo más importante: lo normal que inevitablemente se va a volver contar con estas herramientas, y la manera como afectan y se vuelven parte del proceso de trabajo creativo.
¿A dónde vamos con todo esto?
Durante mucho tiempo, el miedo a la automatización era algo asociado al trabajo de manufactura. En la Revolución Industrial, los obreros empezaron a verse reemplazados por máquinas que podían hacer su trabajo más rápido, más barato, y con una calidad más consistente. Siglos después, con la revolución informática y el desarrollo de la robótica, este reemplazo se volvió tanto más radical. Pero era algo que conceptualmente imaginábamos atado al trabajo manual de producción. Se pensaba comúnmente que la inteligencia artificial nunca podría reemplazar el trabajo de expertos como los médicos o los abogados, y menos aún el trabajo creativo de los artistas o los escritores.
Y luego aparecieron todas estas cosas.
Yo no soy de la idea de que los algoritmos simplemente nos reemplazan. Pero sí reemplazan muchas de las actividades que hacemos, y nos permiten hacer más cosas por nosotros mismos sin requerir de tanta ayuda externa, además de poder hacerlas en muchos menos tiempo. Herramientas como Stable Diffusion o Midjourney me permiten visualizar escenas o conceptos sin requerir de ayuda adicional, mejorando y acelerando mi proceso de trabajo. ChatGPT me ayuda a resumir y ordenar información, y diseñar procesos de pasos a seguir para conseguir cosas, acelerando mi proceso de trabajo. Esto expande enormemente nuestras capacidades creativas y operativas.
Así empezamos a ver que pasan más y más cosas: algoritmos que escriben guiones, diálogos, incluso que son utilizados para armar el esquema, las escenas, y los storyboards para una película — todo por una sola persona. No, estas herramientas no nos reemplazan, pero nos aumentan — y eso tiene consecuencias positivas y negativas. Podemos hacer más por nosotros mismos, pero eso quiere decir que otros roles en la cadena creativa dejan de ser tan necesarios. Roles que, en muchos casos, pueden ser formativos para personas que recién están aprendiendo.
Durante un taller hace un par de semanas con una organización de servicios financieros, hicimos una demo rápido en vivo de ChatGPT — y los asistentes se quedaron con la boca abierta. No les era difícil imaginar todo lo que podrían hacer con una herramienta así, debidamente entrenada y calibrada. Todas las maneras en las que podrían mejoras sus propios procesos, acceder a información que de otra manera estaría perdida. Pero felizmente todos estábamos de acuerdo sobre algo: nada de esto reemplaza a los humanos. Mejora su trabajo, lo hace más fácil, e inevitablemente se vuelve la nueva línea de base, un elemento higiénico en los procesos de trabajo. Pero siguen siendo las personas quienes llevan la conversación, desarrollan relaciones de confianza, y toman la decisión final.
Sin querer sonar hiperbólico, los algoritmos generativos van a transformar de manera importante cómo trabajamos — acostumbrándonos a la idea de tener asistentes virtuales que generan todo tipo de contenidos, así como culturalmente hemos invisibilizado por completo tener herramientas como procesadores de texto u hojas de cálculo. Simplemente se vuelven el nuevo normal y se integran con las herramientas que ya utilizamos: empresas como Google ya están movilizándose internamente para responder a una nueva tecnología que podría distorsionar los fundamentos de su modelo de negocios; mientras que al mismo tiempo Microsoft está redoblando su compromiso con OpenAI para incorporar la tecnología de ChatGPT en Bing, su motor de búsqueda, y su línea de productos de Office.
En los próximos meses y años vamos a seguir viendo una explosión de nuevas herramientas que incorporan algoritmos como GPT-3 (y eventualmente GPT-4). Inevitablemente con eso vendrá una enorme, enorme cantidad de contenido de terrible calidad que no habría existido si no fuera porque estos algoritmos lo permitieron. Pero también un montón de experimentos muy raros pero muy interesantes que van a transformar cómo pensamos en la productividad y la creatividad.