loader image

Las limitaciones de DALL·E y otras IAs creativas

Recientemente, OpenAI me invito a probar su inteligencia artificial DALL·E con la que se pueden generar imágenes que nunca antes han existido simplemente dando indicaciones como si estuvieses haciendo una búsqueda en Google imágenes o explicando a un diseñador lo que quieres.

Mi interes como diseñador y artista digital era saber hasta que punto esta IA era capaz de darme lo que quería con precisión.

Estos son algunos de los resultados que se podría decir que salieron bien:

busqueda: “doraemon gundam”
Busqueda: “drawing of link from the legend of zelda with medieval style oil picture”
Busqueda: “zelda princess in a oil picture with medieval style”
Busqueda: “Kira from death note as L”

Bueno lo primero que se puede apreciar es que todos los ejemplos son bastante frikis, pero lo segundo es que pasan perfectamente por imágenes editadas y creadas por humanos, pero hay un «pero». Si observamos las imágenes de cerca, o simplemente con detenimiento, podemos percatarnos de que existen deformidades, partes que no encajan a la perfección, aunque en su conjunto y en un primer vistazo nos engañen y creo que aquí esta la clave.

Cómo funciona

basado en lo que nos cuentan sus creadores: DALL·E construye imágenes basándose en una red neuronal de imágenes asociadas a etiquetas, entendiendo términos que se refieren a objetos individuales y combinándolos tal como indica la frase, aprende de las relaciones que existen entre estos objetos. Por ejemplo como un humano puede interactuar con una moto y como lo haría con un tenedor…

según palabras de sus creadores «una imagen puede darnos información de si el sistema nos esta entendiendo o no» esto quiere decir que con prueba y error podemos encontrar donde DALL·E flaquea y donde necesita seguir aprendiendo.

También puede aprender de la forma errónea, por ejemplo, un mal etiquetado de imágenes puede llevar a que DALL·E piense que una cuchara es una navaja, algo como la graciosa escena de los Simpson

Los Simpson - El juego de la navaja cuchara

Una mezcla matemática

Aunque las descripciones que le hacemos a DALL·E son naturales y humanas, el transforma esa información en un lenguaje que puede entender, como todos los programas su lenguaje es matemático y no deja espacio a la interpretación artística a pesar de lo que pueda parecer. DALL·E coge unas cuantas imágenes y las combina tratando de satisfacer nuestra petición, sus cálculos aproximan el resultado combinando elementos tratando de hacerlo lo más verosímil posible, pero por ahora tiene dificultades con muchos elementos.

el realismo y las características humanas

Me he encontrado con bastantes problemas a la hora de pedirle a DALL·E que me de imágenes realistas, o fotografías del mundo real en las que pareciesen caras humanas, lo más cercano ha sido intentar pedirle renders 3D pero siempre me encuentro con que los ojos son bastante amorfos, a veces la nariz o la boca también, creo que esto es debido a que todavía no es capaz de entender la perspectiva y reconocer lo que hace que se vea real un rostro humano en una imagen, pero esto ocurre hasta en las imágenes que he presentado más arriba, los mejores resultados se dan en imagenes que imitan pinturas al oleo, acuarela y otros estilos porque esperamos que no sean 100% realista, es una deformación que pasa más desapercibida y parece natural.

Pero aprende

El motivo por el que el equipo detrás de DALL·E esta interesado en que mucha gente lo use no es solo para hacerlo popular y ganar algo de dinero con ello, si no que la mejora de la inteligencia viene con la práctica. Supongo que con el tiempo lo que aquí comento estará obsoleto porque DALL·E ya será capaz de dar imágenes mucho más realistas y creíbles. Hasta ese momento tiene que seguir aprendiendo y procesar muchas imágenes más. Mucha suerte DALL·E

¿Y el copyright?

Pues la verdad es que hay mucha discusión al rededor del tema, pero estoy bastante convencido de que los artistas de verdad son conscientes de que el arte se basa en la copia, la imaginación humana también tiene limites aunque parezca infinita, nos limitamos a combinar cosas que conocemos, que hemos visto, no podemos imaginar algo que no se pueda deconstruir en las piezas que lo componen, el ejemplo más típico es el de la sirena, un ser humano combinado con un pescado, vete a cualquier otra creación, por absurda que parezca siempre se basa en algo que ya existe. No solo eso, los artistas hacen acopio de referencias para crear sus obras, incluso inconscientemente tu cerebro se esta basando en lo que ya conoce para crear cualquier tipo de pintura.

Por ello creo que no debería existir ningún debate en cuanto a la legalidad de que DALL·E ofrezca estas imágenes y se usen como creaciones originales de la IA, a fin de cuentas es quien ha procesado la imagen en base a la descripción que la persona interesada.

Por supuesto, quienes quieren proteger con uñas y dientes las licencias que les dan de comer lo harán, sean artistas o no, pero eso es un ruido que hay en cualquier debate entorno al arte.

Conclusión

Para los que como yo, vivimos del diseño, DALL·E puede dar algo de miedo. A primeras, puedes pensar que te va a quitar el trabajo y no descarto que muchas personas y empresas lo vayan a usar para sacar imágenes para sus proyectos… pero DALL·E no es un ser humano con imaginación, depende de una mente creativa con criterio que sepa darle indicaciones y escoger las mejores imágenes, en muchos casos estas necesitan retoques y sobre todo hay que tener en cuenta que hay muchas cosas que no es capaz de dar y los artistas y dibujantes siguen siendo los únicos que pueden entender a un cliente humano y dialogar con él para darle realmente el producto/ilustración/fotografía que busca.

Pensemos en DALL·E como una herramienta que nos hará el trabajo más fácil, no hay que tener miedo al progreso si este se hace éticamente y bien, los diseñadores y artistas somo mucho más que máquinas que dibujan y es posible que en un futuro lejano entre nuestras tareas sea la de dar ordenes y filtrar y editar resultados de estas inteligencias artificiales.

Pasad un buen día.

Comparte si te ha gustado:

Conoce al autor:

Deja el primer comentario

Otras publicaciones relacionadas:

es_ESSpanish