Connect with us
Google presenta una herramienta de Inteligencia Artificial que genera imágenes a partir de un texto Google presenta una herramienta de Inteligencia Artificial que genera imágenes a partir de un texto

Blogs

Google presenta una herramienta de Inteligencia Artificial que genera imágenes a partir de un texto

Published

on

Google Research, la división de proyectos de investigación del gigante de Internet, presentó Imagen, un sistema de IA que crea imágenes fotorrealistas a partir de una entrada de texto.

Para codificar el texto presentado al sistema, Imagen utiliza un codificador llamado T5-XXL. Lo que hace este sistema es, en base a los datos que domina, desarrollar un bosquejo de 64 x 64 píxeles. Posteriormente, mediante mecanismos de difusión, la IA amplía la resolución a 256 × 256 píxeles y posteriormente a 1024 × 1024 píxeles, obteniendo resultados nítidos y de aspecto realista, al retocar los detalles durante el proceso de ampliación.

Un aspecto interesante de este sistema es su capacidad de autocorrección. Mientras es refinada la imagen durante su proceso de ampliación, la IA es capaz de evaluar hasta qué punto los retoques aplicados establecen una relación entre la frase de referencia y el resultado obtenido.

Desde Google Research afirman que este es un desarrollo sin precedentes, destacando como logros el establecimiento de optimizaciones en el codificador de texto; el establecimiento de un nuevo difusor de umbral, para obtener imágenes de mayor resolución; la optimización del uso de memoria en los equipos que ejecuten este sistema; y la evaluación positiva del índice de correlaciones entre los textos de referencia y las imágenes generadas.

Advertisement

Las demostraciones de momento se limitan a los ejemplos compartidos por Google. Para evitar riesgos de uso indebido, aún no se ha liberado el uso de esta herramienta. “En este momento, hemos decidido no lanzar el código o una demostración pública. En trabajos futuros, exploraremos un marco para la externalización responsable que equilibre el valor de la auditoría externa con los riesgos del acceso abierto sin restricciones”, señala el equipo de Imagen en la web del proyecto.

Otro detalle destacado por el equipo de Imagen es que, para trabajos futuros, necesitarán refinar la muestra de datos con las que entrenan este sistema, para evitar sesgos, ofensas u otros problemas sociales o distorsiones de la realidad. En esta primera instancia, el foco estuvo puesto en el desarrollo de los aspectos más técnicos del sistema, trabajando con conjunto de datos extraídos de la web sin filtrar.

Una completa descripción técnica de este proyecto, junto a ejemplos que ilustran el potencial de esta herramienta, se encuentran disponibles en el sitio web de Google Research.

Blogs

¿Qué es Inflection-2.5 y cómo se compara con otras IA?

Published

on

Inflection-2.5 es un modelo de IA de lenguaje natural avanzado.

(más…)

Continue Reading

Apps

Descubre las increíbles características de IA en los nuevos iPhones

Published

on

Apple ha permanecido notablemente ausente de las conversaciones públicas sobre la IA generativa hasta hace poco.

(más…)

Continue Reading

Almacenamiento

Microsoft dejará de admitir la carga de archivos desde URL en OneDrive el 29 de marzo de 2024

Published

on

A pesar de que Microsoft sigue añadiendo nuevas funciones a OneDrive para mejorar la experiencia general, la compañía no duda en eliminar aquello que los usuarios no encuentran útil.

(más…)

Continue Reading
Advertisement

Subscribete a nuestro Podcast

Lo más popular

Trending