DALL·E 2 ¿Explosión, o destrucción creativa?
¿Es DALL·E 2 un arma de destrucción masiva o una herramienta para democratizar la creación de arte? Casos de uso. ¿El fin de los creadores gráficos? Una nueva profesión: Prompt Engineer.
Esta semana conseguí acceso a la beta privada de DALL·E 2, un sistema de inteligencia artificial capaz de generar imágenes a partir de tan sólo una descripción en texto plano.
Y me ha resultado tan impresionante que tengo muchas preguntas.
¿Es DALL·E 2 un arma de destrucción masiva?
Schumpeter acuñó el término destrucción creativa a mediados del siglo pasado para describir el proceso según el cual el capitalismo se destruye a sí mismo para progresar.
El capitalismo ... es por naturaleza una forma o método de cambio económico y no solo nunca es, sino que nunca puede ser estacionario. ... El impulso fundamental que pone en marcha y mantiene el motor capitalista proviene de los nuevos bienes de consumo, los nuevos métodos de producción o transporte, los nuevos mercados, las nuevas formas de organización industrial que crea la empresa capitalista.
Comentando mi acceso con un amigo ingeniero esta semana, me comentó: “Si estuviera en cuarto de Bellas Artes y veo lo que hace DALL·E 2 me cortaba las venas”.
¿Tiene razón mi amigo? ¿Puede ser DALL·E 2 a los artistas gráficos lo que la imprenta a los escribas del siglo XV?
¿Qué puedo hacer con DALL·E 2? Casos de uso
Ilustración
Para responder a esa pregunta, exploremos primero algunos casos de uso de DALL·E 2. Uno de los más evidentes se da en el ámbito de la ilustración. ¿Necesitas una imagen para ilustrar una historia infantil sobre un niño y su perro? Pídeselo a DALL·E 2.
La calidad de algunas ilustraciones de DALL·E 2 es increíble. No en vano, ha sido entrenada con más de 650 millones de imágenes. Si ha sido ilustrado alguna vez, DALL·E 2 lo conoce, y por tanto puede utilizarlo para “inspirarse” en sus propias creaciones.
Pero no sólo cuentos infantiles. También podemos apoyarnos en DALL·E 2 para diseñar portadas de revistas, como por ejemplo hizo Gloria Liu, reportera de Cosmopolitan. En este vídeo resume el proceso en un minuto.
Generación de fotos de archivo
Otro caso de uso fuera del ámbito de las ilustraciones es la generación de fotos de archivo, o stock photos. Y es que a DALL·E 2 no sólo le puedes pedir que dibuje, también sabe generar fotografías que serían imposibles, como este Spider-Man tallado en alguna pared de la antigua Roma.
DALL·E 2 se convierte así en un banco de imágenes infinito. En lugar de lanzar una búsqueda sobre Unsplash y encontrar una foto que encaje para mi artículo, puedo lanzar la descripción de mi imagen y DALL·E 2 la creará en el momento. Crear en lugar de buscar. Esto lo cambia todo.
Especialmente para las empresas de fotos de archivo, claro.
Inspiración
Otro caso de uso más que interesante de DALL·E 2 puede ser servir de herramienta de inspiración y creación de personajes. Me puedo imaginar perfectamente a un escritor o a un guionista de cine pasando por DALL·E 2 para visualizar a sus personajes mientras los crean.
Por ejemplo, un usuario en Reddit decidió pasar la descripción de los personajes de Harry Potter a través de DALL·E 2.
En el lado de la inspiración, también podríamos utilizarlo para iterar sobre un concepto y encontrar nuevas variaciones del mismo. Por ejemplo, en este vídeo de Youtube, el autor imagina nuevos diseños de mascarillas con la ayuda de DALL·E 2.
Estos son tan sólo algunos de los casos de uso que podríamos considerar para DALL·E 2, pero no los únicos. Las posibilidades son casi infinitas.
¿Es DALL·E 2 el fin de los creadores gráficos?
¿Qué se supone que deben hacer ahora ilustradores, fotógrafos, o diseñadores cuando una inteligencia artificial permite a cualquiera generar una imagen de alta calidad sobre cualquier aspecto imaginable? Podemos revisar la historia para hacernos una idea.
La llegada de DALL·E 2 puede ser al mundo del arte un acontecimiento similar al de la popularización de la fotografía a principios del siglo XX. Los artistas se alejaron de lo que la fotografía ya podía hacer mejor que ellos, representar la realidad con máximo detalle, y se centraron en nuevos estilos como el impresionismo, el surrealismo o el cubismo de Picasso.
DALL·E 2, como inteligencia artificial sólo entiende del pasado. Está entrenado con millones de imágenes de material gráfico creado por el ser humano a lo largo de su historia, pero no puede crear nada nuevo por sí mismo. Los artistas presentes y futuros evolucionarán a nuevos estilos que ninguna Inteligencia Artificial conoce todavía.
¿Supondrá DALL·E 2 una explosión de la creatividad humana?
En mi opinión DALL·E 2 y otras herramientas similares van a suponer una explosión de la creatividad a nivel global.
Del mismo modo que la fotografía facilitó que cualquiera pudiera representar la realidad, DALL·E 2 tiene el potencial de democratizar la creación de arte al gran público.
Por ejemplo, ¿cuánta gente en el planeta puede tener buenas ideas para crear novelas gráficas pero carece de conocimientos para poder llevarlas a cabo? Con DALL·E 2 todo cambia. Los sueños y aventuras más locas pueden ser ilustradas con la imaginación del autor como único input necesario.
En cierto modo, y con sólo unos cientos de miles de cuentas disponibles, ya está habiendo una explosión de la creatividad a nivel mundial. Si queréis echar un ojo a qué se está creando, podéis echar un ojo a este subreddit o hacer una búsqueda en Twitter.
Prompt Engineer, ¿una nueva profesión?
Con DALL·E 2 y otras herramientas similares es posible que nos encontremos ante la aparición de una nueva profesión, la del Prompt Engineer o Prompt Designer.
La entrada para la generación de imágenes se produce a través de un “prompt” en la que describimos en lenguaje natural el tipo de imagen que queremos generar.
Dalle acepta descripciones relativamente largas. Y generalmente, cuánto más detalle introducimos, mejores son los resultados. Como por ejemplo:
“A grey kitten standing on a pizza in outer space. The kitten is eating a piece of pizza. Pizza slices flying with angel wings in background, dark cyan galaxy and stars in background, 4K photoshopped image, look at that detail”
Las posibilidades y combinaciones de estilos son infinitas. La semana pasada Guy Parsons publicó The DALL·E 2 Prompt Book, un libro en formato PDF que aglutina múltiples estilos y comandos que podemos combinar para generar nuestras imágenes.
Mis primeras creaciones en DALL·E 2 han sido relativamente pobres. Estoy bastante convencido que en el futuro existirán “ingenieros o diseñadores del prompt” que serán expertos en obtener los mejores resultados de estos sistemas.
¿Qué nos depara el futuro?
Primero fue la creación de textos con GPT-3. Ahora DALL·E 2 llega a democratizar la creación de arte. ¿Cuál será el siguiente paso?
Me parece innegable que el lenguaje natural va a ser la forma de creación por defecto para la mayor parte de la población. ¿Por qué utilizar herramientas complejas como Photoshop cuando puedo simplemente expresar lo que necesito en un prompt?
Este hecho bajará la barrera de entrada de creación de contenido dando lugar en mi opinión a una explosión de creatividad sin precedentes. Y no se quedará en las imágenes.
El audio será posiblemente el siguiente paso. En lugar de tener que manejar complicados programas para crear audio, le podré decir a un sistema como DALL·E 2 que cree un sonido particular que pueda necesitar en un momento dado en un prompt similar a este:
“Sonido de una puerta cerrándose poco a poco durante 5 segundos con un chillido ahogado de sus bisagras”
Y luego llegará el vídeo. Y luego la programación. Y así, una por una, cualquier herramienta de creación que utilizamos hoy en día, será paso a paso abstraída a un prompt de lenguaje natural.
Y en mi opinión, eso dará lugar a una explosión de creatividad como nunca antes se ha visto.