VASA-1, la inteligencia artificial de Microsoft que genera deepfakes con una imagen y una grabación de audio

VASA-1 es el nombre de la nueva inteligencia artificial desarrollada por Microsoft que ha revolucionado la creación de deepfakes. Esta innovadora tecnología es capaz de generar videos falsos de alta calidad a partir de una simple imagen y una grabación de audio. Mediante algoritmos avanzados de aprendizaje profundo, VASA-1 logra sincronizar los movimientos de los labios de una persona en la imagen con las palabras pronunciadas en el audio, creando así un video que puede resultar difícil de distinguir de uno real. Este avance plantea importantes desafíos éticos y de seguridad en cuanto a la difusión de información falsa y la manipulación de contenidos audiovisuales. Microsoft ha anunciado que VASA-1 será utilizado inicialmente con fines de investigación, pero su potencial impacto en la sociedad es motivo de debate y preocupación.

Index

VASA: La IA de Microsoft que genera deepfakes realistas en segundos
Microsoft presenta VASA: IA generativa que crea deepfakes hiperrealistas en tiempo real

VASA: La IA de Microsoft que genera deepfakes realistas en segundos

Una simple foto y una grabación de audio son suficientes para que VASA-1, la nueva IA generativa de Microsoft, genere un deepfake en cuestión de segundos. Este proceso, nunca antes tan realista y en tiempo real, ha sido posible gracias a VASA-1, una inteligencia artificial que revoluciona la creación de deepfakes. Esta innovadora tecnología solo requiere una foto tipo carnet y una frase de audio para producir un deepfake hiperrealista con sincronización labial, gestos naturales y movimientos de cabeza, como se puede apreciar en este vídeo.

Es destacable que, si bien se puede notar que el vídeo ha sido creado por una IA, el nivel cobra vida a partir de una foto estática, lo cual resulta impresionante. Además, todas las personas que aparecen en las imágenes de la noticia son generadas por una IA, en específico StyleGAN2 y DALL·E 3, lo cual añade un nivel adicional de complejidad y realismo a este avance tecnológico.

VASA-1 representa una innovación destacada debido a su modelo holístico de dinámica facial y generación de movimientos de cabeza, que opera en un espacio latente facial, según explican los expertos de Microsoft Asia, equipo responsable de esta revolucionaria tecnología. Los creadores de VASA-1 aseguran que supera a cualquier otra IA especializada en la creación de avatares virtuales.

Esta IA generativa es capaz de generar vídeos de alta calidad en tiempo real, con una dinámica facial y una cabeza realista, alcanzando una resolución de hasta 512 x 512 píxeles y 40 fps, con una latencia de menos de 170 ms, utilizando una potente tarjeta gráfica RTX 4090. Cabe destacar que VASA-1 no replica la voz, sino que utiliza la grabación suministrada para lograr una sincronización labial espectacular.

Microsoft presenta VASA: IA generativa que crea deepfakes hiperrealistas en tiempo real

Meta estrena su nueva IA generativa Llama 3, asegurando que es mejor que Gemini. OpenAI presenta Voice Engine, una IA que clona tu voz con solo escucharte 15 segundos. Estas tecnologías representan avances significativos en el campo de la inteligencia artificial y la generación de contenido.

Aunque VASA-1 no ha sido desarrollada con el propósito de crear deepfakes, sino para diseñar avatares realistas que imiten comportamientos humanos en conversaciones, su capacidad para generar este tipo de contenido ha captado la atención de muchos. Microsoft tiene en mente emplear estos avatares en servicios de atención al cliente, avatares de juegos y aplicaciones, entre otros usos.

La personalización es clave en VASA-1, ya que cuenta con parámetros que permiten ajustar las características del personaje virtual, como su nivel de gesticulación, expresividad, entre otros aspectos. Sin embargo, Microsoft es consciente de los posibles usos indebidos de esta tecnología, por lo que por el momento no tiene planes de lanzar demostraciones, APIs o versiones comerciales, hasta que estén seguros de que se utiliza con responsabilidad.

Susana Ferrer

Hola, soy Susana, redactora jefe de Digital Soft, un periódico independiente de actualidad que se especializa en tecnología y PCs. Con años de experiencia en el mundo digital, mi pasión por la tecnología se refleja en cada artículo que escribo. En Digital Soft nos esforzamos por brindar las últimas novedades con la más rigurosa objetividad, manteniendo siempre un enfoque imparcial y profesional. ¡Únete a nuestra comunidad y descubre un mundo de información tecnológica de calidad!

Deja una respuesta Cancelar la respuesta