Esta IA convierte frases de texto en imágenes artísticas

Desde que las tecnologías basadas en inteligencia artificial (IA) comenzaron a ganar ritmo en la industria de la tecnología, hemos visto numerosos modelos de IA innovadores realizar varios tipos de tareas. Ahora, un equipo de científicos ha creado un algoritmo de inteligencia artificial que puede tomar sus textos y mostrar imágenes coloridas y artísticas basadas en eso..

Apodado como "DALL-E", este robot de inteligencia artificial fue presentado recientemente por la organización de inteligencia artificial sin fines de lucro, OpenAI. El nombre, si te resulta familiar, es en realidad una mezcla del nombre del popular artista español, Salvador Dali (repopularizado por Money Heist) y el nombre del adorable robot del universo de Pixar, Wall-E..

Ahora, DALL-E no es su IA habitual de conversión de texto a imagen. Es una red neuronal única que toma sus oraciones de texto descriptivo y las convierte en imágenes precisas. Entonces, en cierto modo, es como darle descripciones de un escenario u objeto a un dibujante para que él / ella cree la imagen perfecta que está en tu mente..

Como funciona?

Ahora, como afirman los investigadores en su publicación de blog oficial, "DALL · E es una versión de 12 mil millones de parámetros de GPT-3 entrenada para generar imágenes a partir de descripciones de texto, utilizando un conjunto de datos de pares texto-imagen". En sus pruebas, los investigadores encontraron que el modelo tiene numerosas capacidades únicas para convertir textos en imágenes surrealistas pero ridículas..

Si consulta la publicación de su blog oficial, encontrará que hay algunos ejemplos interactivos proporcionados por los investigadores para mostrar cómo funciona el modelo. Estos ejemplos ya tienen frases de texto preestablecidas para que el modelo represente imágenes. Sin embargo, hay algunas palabras clave en estas oraciones que puede cambiar para que el bot represente diferentes imágenes..

Estas palabras clave en su mayoría involucran palabras descriptivas que ayudan a DALL-E a comprender el color, la forma, el patrón o la textura de un objeto. Por lo tanto, tan pronto como cambie estas palabras de una lista desplegable de otras palabras similares, las imágenes cambian instantáneamente según la palabra seleccionada. Además, según los creadores, el modelo mejora cuanto más lo usas..

Ahora, es bastante impresionante ver que una IA comprende las formas, colores y texturas exactas de los objetos para crear imágenes precisas. Ahora, solo estoy esperando el día en que este tipo de modelos de IA se utilicen como dibujantes reales en organizaciones públicas como el departamento de policía.