La nueva investigación de AI sobre Facebook es una verdadera revelación


Hay muchas formas de manipular fotos para que se vea mejor, eliminar los ojos rojos o las bengalas de los lentes, y así sucesivamente. Pero hasta ahora, el parpadeo ha demostrado ser un oponente tenaz a las buenas instantáneas. Eso puede cambiar con la investigación de Facebook que reemplaza los ojos cerrados con los abiertos de una manera notablemente convincente.

Está lejos del único ejemplo de "pintura" inteligente, como se llama la técnica cuando un programa llena un espacio con lo que piensa pertenece allí. Adobe en particular ha hecho un buen uso de él con su "relleno sensible al contexto", lo que permite a los usuarios reemplazar funciones no deseadas, por ejemplo, una rama sobresaliente o una nube, con una buena idea de lo que estaría allí si no fuera así. .

Pero algunas funciones están más allá de la capacidad de las herramientas para reemplazar, una de las cuales son los ojos. Su naturaleza detallada y altamente variable hace que sea particularmente difícil para un sistema cambiarlos o crearlos de manera realista.

Facebook, que probablemente tiene más imágenes de gente parpadeando que cualquier otra entidad en la historia, decidió tomar una brecha en esto problema.

Lo hace con una Red de Adversarios Generativos, esencialmente un sistema de aprendizaje automático que trata de engañarse a sí mismo al pensar que sus creaciones son reales. En una GAN, una parte del sistema aprende a reconocer, por ejemplo, las caras, y otra parte del sistema crea imágenes repetidas que, según los comentarios de la parte de reconocimiento, crecen gradualmente en realismo.

De izquierda a derecha: " Ejemplos de imágenes, imágenes de origen, algoritmo revelador de Photoshop y el método de Facebook.

En este caso, la red está entrenada para reconocer y reproducir ojos abiertos y convincentes. Esto ya podría hacerse, pero como puede ver en los ejemplos a la derecha, los métodos existentes dejaron algo que desear. Parecen pegar a los ojos de la gente sin mucha consideración por la coherencia con el resto de la imagen.

Las máquinas son ingenuas de esa manera: no tienen una comprensión intuitiva de que abrir los ojos tampoco cambia el color de la piel alrededor ellos. (Para el caso, no tienen una comprensión intuitiva de los ojos, el color o nada en absoluto.)

Lo que hicieron los investigadores de Facebook fue incluir datos "ejemplares" que mostraban a la persona objetivo con los ojos abiertos, de lo que el GAN ​​no aprende solo los ojos de la persona, pero cómo los ojos de esta persona en particular tienen forma, color, etc.

Los resultados son bastante realistas: no hay discrepancia de color o costura obvia porque la parte de reconocimiento de la red sabe que no es así como se ve la persona.

En las pruebas, la gente confundió las fotos falsas de ojos abiertos con las reales, o dijeron que no podían estar seguros de cuál era cuál, más de la mitad de las veces. Y a menos que supiera que definitivamente se manipuló una foto, probablemente no me percataría si pasara de una página a otra en mi suministro de noticias. Gandhi se ve un poco raro, sin embargo.

Todavía falla en algunas situaciones, creando artefactos extraños si el ojo de una persona está parcialmente cubierto por un mechón de cabello, o a veces no recrea el color correctamente. Pero esos son problemas reparables.

Puede imaginarse la utilidad de una utilidad automática para abrir los ojos en Facebook que verifica las otras fotos de una persona y las utiliza como referencia para reemplazar un parpadeo en la última. Sería un poco espeluznante, pero eso es bastante estándar para Facebook, y al menos podría salvar una foto grupal o dos.



VendeTodito