OpenAI compartió recientemente detalles sobre DALL·E 3, la última versión del sistema de inteligencia artificial de texto a imagen, que llegará este otoño a ChatGPT Plus, ChatGPT Enterprise, AI Image Creator de Bing y Microsoft Designer.
Esta actualización promete una precisión de imagen mejorada, mayores matices y atención al texto ingresado por el usuario.
Novedades de DALL·E 3
Las iteraciones anteriores de DALL·E requerían que los usuarios ajustaran sus indicaciones mediante un proceso conocido como ingeniería de indicaciones.
DALL·E 3 tiene como objetivo eliminar esa molestia generando imágenes que se apegan más a las instrucciones de texto iniciales del usuario.
Por ejemplo, donde DALL·E 2 podría representar un jugador de baloncesto vagamente nebuloso, DALL·E 3 creará una representación más expresiva y precisa basada en el texto proporcionado.
Grandes noticias: @OpenAI DALL-E 3 pronto estará disponible en ChatGPT Plus y ChatGPT Enterprise 🤯
Este último modelo de DALL-E es absolutamente increíble, me ha dejado boquiabierto lo que es capaz de generar. pic.twitter.com/eTWzxiOHgB
– Logan.GPT (@OfficialLoganK) 20 de septiembre de 2023
El nuevo sistema se basa en ChatGPT, lo que permite una interacción perfecta entre las plataformas de texto e imágenes.
Los usuarios pueden contratar a ChatGPT como un “socio de lluvia de ideas” para refinar sus ideas de imágenes. Si a un usuario le gusta una imagen generada pero quiere cambios menores, una conversación con ChatGPT puede producir esas modificaciones con una oración o dos.
DALL·E 3 Mecanismos de Seguridad
Un enfoque adicional en los mecanismos de seguridad también distingue a DALL·E 3. Estos incluyen mitigaciones para prevenir la generación de contenido violento, para adultos o de odio.
Además, DALL·E 3 se negará a generar imágenes que incluyan personajes públicos vivos o imiten el estilo de artistas vivos.
Estas precauciones se desarrollaron en colaboración con expertos en el dominio conocidos como “equipos rojos”, quienes prueban rigurosamente el sistema en busca de vulnerabilidades de seguridad.
Los desarrolladores también están explorando formas de ayudar a los usuarios a identificar imágenes generadas por IA. Están investigando un “clasificador de procedencia”, una herramienta interna que puede reconocer si una idea se originó en DALL·E 3.
Esta herramienta se encuentra en la fase experimental, pero su desarrollo indica un enfoque proactivo para abordar los problemas de desinformación y manipulación de imágenes.
¿Cuándo estará disponible DALL·E 3?
Está previsto que DALL·E 3 esté disponible para los clientes de ChatGPT Plus y Enterprise en octubre.
OpenAI planea ofrecer licencias liberales, lo que permitirá a los usuarios de ChatGPT usar, vender o comercializar libremente las imágenes que crean sin necesidad de permiso de la plataforma.
Microsoft también planea agregar soporte DALL·E 3 al AI Image Creator and Designer de Bing en las próximas semanas.
Agregando calidad de imagen mejorada con soporte para el último modelo DALL.E 3 ✅ #EventoMicrosoft pic.twitter.com/hLtVQS1VJO
– Bing Bing) 21 de septiembre de 2023
Cómo los artistas y creadores de contenido pueden optar por no participar en la capacitación DALL·E 3
Como ocurre con todos los modelos de IA, DALL·E 3 aprende sus capacidades a partir de una amplia gama de datos públicos, incluidos texto e imágenes. Este proceso de aprendizaje refleja la forma en que los humanos adquieren conocimientos.
Por ejemplo, después de examinar varias imágenes de gatos, la IA puede generar una imagen única y completamente nueva de un gato, muy parecida a cómo una persona podría dibujar un gato después de ver suficientes ejemplos.
Es fundamental tener en cuenta que una vez que estos modelos han asimilado sus datos de entrenamiento, ya no tienen acceso directo a ellos. Cuando un usuario interactúa con el modelo, se basa en sus conceptos internalizados en lugar de extraerlos de una base de datos externa.
OpenAI, en un intento de abordar las consideraciones éticas en torno a la propiedad del contenido, ha ofrecido a los artistas dos formas de optar por no recibir formación en IA.
Los propietarios de sitios web pueden impedir que GPTBot, un rastreador web diseñado para recopilar datos de entrenamiento, acceda a su sitio. Agregar GPTBot a los protocolos robots.txt del sitio puede ser una ruta más eficiente para aquellos con grandes volúmenes de imágenes.
Alternativamente, OpenAI proporcionó un formulario para que las personas solicitaran la eliminación de su contenido de futuros conjuntos de datos de entrenamiento.
Vale la pena señalar que OpenAI también adquiere licencias para conjuntos de datos, por lo que si ha permitido licencias de terceros en otras plataformas, es posible que completar el formulario no garantice la eliminación completa.
El futuro de la creación de contenidos con IA generativa
Esta actualización de la generación de imágenes de IA de OpenAI representa otro avance significativo para los especialistas en marketing y creadores de contenido.
Si bien hará que el diseño gráfico sea accesible a más personas, los avances en esta área abren la puerta a cuestiones legales y éticas más complejas.
Imagen de portada: producción de Vladimka/Shutterstock