La Inteligencia Artificial está presente en muchas de las herramientas y plataformas tecnológicas que utilizamos día a día. Instagram, Netflix, nuestra cámara del móvil o el buscador de Google funcionan con algoritmos de IA que nos ayudan a encontrar y crear mejores contenidos. En este contexto, surgen nuevas herramientas como DALL-E, la inteligencia artificial que revoluciona la creación de imágenes mediante inputs de texto.
Tabla de contenidos
Conociendo a DALL-E
DALL-E es una herramienta de inteligencia artificial multimodal que es capaz de generar imágenes basadas en una descripción en forma de texto que se le ha dado. Detrás de su desarrollo, se encuentra OpenAI que ha trabajado con la versión de GPT-3 de 12 mil millones de parámetros.
Además de crear imágenes desde cero, este algoritmo también tiene la capacidad de editar imágenes e incluso, hacer recreaciones de sus propias imágenes. Aunque, lo verdaderamente interesante de esta herramienta es que es capaz de generar imágenes de cosas reales que sí existen, pero también de entidades y representaciones que no existen. ¿Qué quiere decir exactamente esto? Muy sencillo, igual que es capaz de generar una imagen de una casa en la playa, también podrá crear una imagen de una casa en forma de rombo en la luna. Es decir, algo que actualmente no existe.
Es importante destacar que este algoritmo de IA ya va por su segunda versión. Con el lanzamiento de DALL-E2 la creación de imágenes se ha perfeccionado y mejorado con respecto a la primera versión, llegando a generar imágenes hiperrealistas e incluso rostros humanos. Con el objetivo de evitar el mal uso de la plataforma, DALL-E2 no es capaz de generar imágenes que se consideran violentas o explicitas.
Pero, ¿de dónde procede el nombre? Los responsables de su desarrollo en OpenAI decidieron bautizarlo con este nombre tan peculiar en honor al artista surrealista Salvador Dalí y el personaje de Pixar Wall-e.
Me imagino que con tanta expectativa y con ese nombre tan imponente, te habrás quedad con ganas de ver alguno de «sus trabajos». Por ello, si deseas ver en tiempo real cómo opera este sistema, no te pierdas los resultados que surgieron tras las pruebas realizadas por este grupo de influencers españoles:
Si después de todo esto te has quedado con ganas de probar la plataforma, te dejamos este artículo de nuestros compañeros de Xataka para que puedas ver cómo solicitar el uso BETA de DALL-E2.
Pero, ¿qué es DALL-E Mini?
Sin embargo, DALL-E no está disponible para todos los públicos y solo unos cuantos privilegiad@s pueden usarlo para ponerlo a prueba. Pero, que no cunda el pánico, para cubrir esa necesidad que DALL-E ha generado en los simples mortales, ha llegado al mercado DALL-E Mini. Este primo hermano de la herramienta inicial es un generador de OpenAI open source (GitHub) y, como ya te adelantábamos, está listo para que cualquiera pueda probarlo.
Si quieres hacer uso de este motor de IA, tan solo tendrás que introducir una frase en inglés (es un punto importante aunque también puedes probar a hacer algunas consultas sencillas en castellano) en la que expliques qué es lo que te gustaría que creara. Por ejemplo, «Dogs in the beach«. Este funcionamiento es muy similar al de la herramienta original.
Otros intentos de DALL-E
Dado el impacto mediático que ha tenido el lanzamiento de estas herramientas, otras grandes compañías del sector se han animado a lanzar sus propias soluciones. El primero en reaccionar fue Google que lanzó Imagen, una solución que combina las lógicas de funcionamiento de DALL-E con otras técnicas de Machine Learning.
Por su parte, Tik Tok ha lanzado AI Greenscreen, un filtro que permite a los usuarios introducir un texto descriptivo para generar una imagen de fondo para sus vídeos. El funcionamiento de este nuevo filtro es muy similar al que ya tienen las anteriores herramientas.
Fuente: DALL-E, DALL-E Mini, Xataka y La Vanguardia