Índice
O VASA-1 es la última IA de Microsoft, diseñado para crear deepfakes hiperrealistas a partir de una sola foto o dibujo de una persona. La herramienta impresiona por su capacidad para reproducir con precisión expresiones faciales y movimientos de la cabeza, dando la ilusión de que la persona de la foto en realidad está expresando algo. En manifestaciones presentadas por Microsoft,el VASA-1 Impresionado al replicar el movimiento de los labios sincronizado con el audio y crear expresiones que no estaban presentes en las fotos originales, lo que resultó en videos extremadamente convincentes.
La nueva herramienta genera preocupaciones sobre el uso ético de las tecnologías deepfake, ya que su capacidad para crear videos realistas con poca información de entrada podría usarse para crear noticias falsas, videos difamatorios e incluso engaños. Por lo tanto, la Microsoft está trabajando para garantizar que el VASA-1 utilizarse de manera responsable y ética.
¿Qué es VASA-1 y cómo funciona?
Parece cierto, pero el vídeo de arriba es sólo una deepfake. O VASA-1 representa un avance significativo en la generación de caras parlantes realistas a través de inteligencia artificial. oh VASA-1 es capaz de producir vídeos de caras parlantes a partir de una única imagen fija, ya sea una fotografía o un dibujo, de un individuo y un clip de audio de una conversación. Estos vídeos resultantes presentan no sólo movimientos de labios sincronizados con el audio, sino también una amplia gama de dinámicas faciales y movimientos de cabeza naturales, logrando un alto nivel de realismo y viveza.
A diferencia de los métodos anteriores, el VASA-1 aborda la generación de caras parlantes de manera integral, considerando todos los movimientos faciales posibles, como expresiones, movimientos oculares y parpadeos, como variables latentes únicas. Además, el VASA-1 incorpora señales condicionantes opcionales, como la dirección principal de la mirada, la distancia de la cabeza y la compensación emocional, en el proceso de aprendizaje. Esto hace que el modelado generativo de distribuciones complejas sea más controlable y aumenta la contabilidad de generación. En el vídeo siguiente, por ejemplo, el VASA-1 demostró diferentes opciones de dirección de la mirada en el deepfake.
Uno de los aspectos más impresionantes de VASA-1 es su capacidad para generar caras parlantes en tiempo real, lo que lo hace ideal para aplicaciones de comunicación interactiva. Al equilibrar la calidad de la generación de vídeo con la eficiencia computacional, el VASA-1 Supera significativamente los métodos existentes, acercándonos a un futuro en el que los avatares digitales impulsados por IA puedan interactuar con nosotros de forma tan natural e intuitiva como las interacciones con humanos reales.
la representación de VASA-1 Puede cambiar la apariencia, la posición tridimensional de la cabeza y la dinámica facial, lo que permite el control por separado de los atributos y la edición del contenido generado. Esto significa que, incluso con una sola foto de entrada, es posible generar videos de caras parlantes con diferentes secuencias de movimiento o aplicar diferentes fotos a la misma secuencia de movimiento, lo que resulta en una amplia variedad de posibilidades de personalización y control sobre el contenido generado.
Peligros de los deepfakes
O VASA-1, a pesar de sus posibles aplicaciones positivas, también presenta importantes riesgos relacionados con la creación de deepfakes. Esta tecnología puede utilizarse indebidamente para crear vídeos falsos extremadamente convincentes en los que se muestra a una persona haciendo o diciendo algo que nunca ocurrió. Estos deepfakes tienen el potencial de causar daños graves, como difundir información errónea, manipular la opinión pública, difamar a personas e incluso incitar conflictos sociales o políticos.
Especialmente durante los períodos electorales, la tecnología podría generar problemas derivados del uso malicioso con creaciones de deepfakes políticos. Con esta tecnología es posible crear vídeos de políticos o figuras públicas pronunciando discursos falsos o realizando acciones comprometedoras. Estos videos pueden usarse para influir en las elecciones, socavar la confianza pública en los líderes y las instituciones y generar inestabilidad política.
El uso de Deepfakes ha despertado la atención y preocupación de varios gobiernos alrededor del mundo. En Brasil, el TSE prohibió el uso de deepfakes en las elecciones, siendo la medida aprobada en febrero de este año. Esta prohibición tiene como objetivo evitar la manipulación de la información y proteger la integridad del proceso electoral, evitando que videos y audios falsos sean utilizados para perjudicar o favorecer a los candidatos. El uso indebido de deepfakes puede tener como resultado la revocación del mandato o el registro de la candidatura.
China, en particular, ha sido pionera en la regulación integral del uso de estas tecnologías. Su legislación, más amplia que la adoptada por algunos gobiernos occidentales, se considera un instrumento para mantener la estabilidad social. Prohíbe explícitamente la creación de deepfakes sin consentimiento y requiere una identificación clara del contenido generado por IA.
Un ejemplo alarmante ocurrió tras la invasión rusa de Ucrania, cuando un vídeo deepfake circuló ampliamente en las redes sociales. En él, el presidente ucraniano Volodymyr Zelensky parecía ordenar a sus tropas que se rindieran, algo que en realidad nunca sucedió. Además, los deepfakes se pueden utilizar más ampliamente en situaciones cotidianas, como la creación de vídeos falsos de celebridades, amigos o familiares, creando confusión y dañando la reputación de las personas involucradas.
Previsión de lanzamiento
A Microsoft reconoce los riesgos asociados con VASA-1 y se compromete a garantizar que la herramienta se desarrolle y utilice de manera responsable. Debido a los posibles problemas éticos, de privacidad y de seguridad que VASA-1 puede generar el Microsoft Aún no hay fecha de lanzamiento para el público en general.
La compañía está trabajando activamente para implementar medidas de seguridad y control que ayuden a mitigar los riesgos del mal uso de la tecnología. Los desarrolladores están trabajando para mejorar la autenticidad de los videos generados y desarrollar métodos de detección de deepfakes que puedan ayudar a combatir el uso indebido de la tecnología, antes de considerar su lanzamiento al público en general.
Vea esta y otras noticias en Showmetech TRIO:
Vea también:
Fontes: PCMag, Microsoft e En pantalones cortos
Revisado por Glaucón Vital en 22 / 4 / 24.
Descubra más sobre Showmetech
Regístrate para recibir nuestras últimas novedades por correo electrónico.