General 
octubre 1, 2023

¿Pueden las imágenes generadas por inteligencia artificial reemplazar a las de archivo?

Hemos oído hablar de copias de marketing generadas por IA y plataformas de video generadas por IA. ¿Qué tal las imágenes generadas por IA? Heidi Tolliver-Walker analiza los resultados de tres opciones populares.

Hemos oído hablar de copias de marketing generadas por IA. Hemos oído hablar de plataformas de video generadas por IA. Si la IA puede generar su copia de marketing y convertir sus publicaciones de blog y páginas web en videos pulidos, ¿qué más puede hacer? También puede crear imágenes de marketing, y puede hacerlo de forma gratuita. Hay muchos generadores de imágenes de IA gratuitos disponibles. Echemos un vistazo a los resultados y la capacidad de respuesta de tres plataformas populares: Imagine Art, Wonder Ai y Dall-E.

A diferencia de los generadores de copias de IA, cuyo propósito es ayudarte a generar copias profesionales más rápido de lo que un ser humano puede hacerlo, los generadores de arte de IA se promocionan como capaces de crear imágenes que reflejan tu imaginación. Digamos que no puedes encontrar la imagen adecuada para ese proyecto. Deberías poder indicarle a un generador de imágenes de IA que la cree por ti, ¿verdad?

Después de experimentar, la respuesta es “a veces”. Ya algunas empresas de imágenes de archivo, como FreePik, están añadiendo imágenes generadas por IA a su oferta de productos. Si vas a FreePik y seleccionas la categoría de “imágenes de IA”, encontrarás desde una mujer malaya colocando plátanos en su puesto de mercado hasta una imagen alegre de una abuela y su nieta haciendo muecas ante la “cámara”.

Si buscas imágenes específicas, como un equipo multiétnico sentado alrededor de una mesa de conferencias, estas imágenes generadas por IA funcionan bastante bien. Aquí tienes una selección de imágenes de la colección de IA de FreePik:

Pero nos preguntamos si podríamos crear estas imágenes por nosotros mismos. Nos registramos en las tres plataformas. Imagine.art y Wonder.ai ofrecen versiones gratuitas. Dall-E requiere la compra de créditos, que comienzan en solo $15. Utilizamos estas plataformas para generar nuestras propias imágenes de “un equipo multiétnico sentado alrededor de una mesa de conferencias teniendo una discusión intensa”.

Comenzamos con Wonder.ai. Las instrucciones eran usar frases específicas separadas por comas, por lo que utilizamos el siguiente comando: “imagen de un personal multiétnico sentado alrededor de una mesa de conferencias, están teniendo una discusión intensa”.

La plataforma generó dos imágenes. La primera era un gráfico:

La segunda era una imagen fotorrealista:

A continuación, intentamos el mismo comando con Imagine.art:

La primera imagen incluía miembros del equipo que no eran de raza blanca, pero la etnia era uniforme. Tampoco captamos la sensación de gran intensidad. Así que intentamos el comando nuevamente, siendo más específicos esta vez: “Personal sentado alrededor de una mesa de conferencias, el personal proviene de diferentes orígenes étnicos, están teniendo una discusión intensa”.

Esta vez obtuvimos un poco más de variedad étnica, y el fondo no era tan austero. Sin embargo, no estábamos obteniendo la salida realmente multiétnica que buscábamos. Así que fuimos aún más específicos: “personal de diferentes etnias sentado alrededor de una mesa de conferencias, incluir personas de ascendencia afroamericana, asiática, del Medio Oriente y europea, están teniendo una discusión intensa”.

Aquí está lo que Imagine AI generó:

Ciertamente mejor. Pero, ¿qué hay de la intensidad de la discusión? Para eso, tal vez deberíamos pedir “discutiendo” en su lugar:

Si esto es una discusión, ciertamente es un grupo estoico. Tal vez estén discutiendo con la mirada.

Así que lo intentamos de nuevo utilizando Dall-E:

Obtuvimos un grupo multiétnico, aunque parecían un poco como si los hubiera dibujado Picasso, y Dall-E aún tenía problemas con “discutir”.

Para ser justos, intentamos pedir un equipo multiétnico sentado alrededor de una mesa de conferencias discutiendo a los artistas de IA de FreePik, y descubrimos que no estábamos solos. Obteníamos equipos multiétnicos, pero parece que ya sea que “equipos multiétnicos discutiendo” no es un tema en demanda, o estos artistas tenían problemas para que las plataformas crearan estas imágenes también.

Para reflejar nuestra frustración, decidimos en nuestro experimento final pedir a las plataformas de arte de IA que generaran una diseñadora gráfica mirando su pantalla de computadora, frustrada, con las manos en el aire en señal de exasperación.

Comenzamos con Imagine.art:

Esta imagen refleja la frustración, pero nos falta la exasperación de “las manos en el aire” que estábamos buscando. Así que lo intentamos de nuevo:

Ahora tenemos frustración, pero hay algunas características aquí que, francamente, resultan inquietantes. Intentándolo de nuevo…

Aquí tenemos la frustración y la mano en señal de frustración, pero la diseñadora gráfica no está mirando la pantalla de la computadora, incluso cuando se le indicó que lo hiciera.

Luego, probamos con Wonder.ai:

Una vez más, tenemos dos de tres: la diseñadora gráfica está mirando la pantalla y tiene las manos en alto, pero falta la emoción de la frustración.

A continuación, probamos con Dall-E. Esta plataforma estuvo más cerca de capturar la emoción deseada, pero a un costo:

Dall-E capta claramente la emoción deseada, pero la plataforma es conocida por el desafío que tiene con los rostros. De hecho, los rostros “desfigurados” son una característica bien conocida de la plataforma.

Sin embargo, la plataforma se desempeña excepcionalmente bien con imágenes conceptuales que no involucran personas. Por ejemplo, cuando se le pidió a Dall-E que creara una imagen de montones y montones de basura mixta a lo largo de la costa de una isla, podría haber sido una imagen de los archivos de Getty:

Del mismo modo, lo hace bastante bien si deseas una imagen artística genérica de personas de negocios caminando por los pasillos de una feria comercial de impresión. Pide, y obtendrás algo como esto:

O una imagen de papel pasando por una prensa offset:

La lección aquí es que estos modelos funcionan. Si tienes el tiempo para sentarte y jugar con ellos, y emparejas la plataforma adecuada con el tipo de imagen que estás buscando, descubrirás que diferentes plataformas funcionan bien para diferentes cosas. De hecho, estas imágenes se están utilizando para ilustrar contenido de marketing que ya se está utilizando para miembros de esta industria, como se ilustra en esta imagen creada para una publicación de blog de un fabricante de impresión:

Entonces, estas plataformas funcionan, pero es importante experimentar con varias de ellas y ver en qué se destacan cada una. Investiga cómo crear comandos efectivos y tómate el tiempo para experimentar. Si una plataforma no crea la imagen que estás buscando, prueba con otra. Luego, otra.

Pero si deseas una imagen de un gato con gafas de sol montando en monopatín en las olas junto a una ballena, tal vez no sea necesaria ninguna experimentación. Dall-E resuelve esto de manera excepcional.

Tomado de: ¿Pueden las imágenes generadas por inteligencia artificial reemplazar a las de archivo?

 

 

Compártelo en:

Categorías