Salvatore De Lellis/Pexels
Matthew Manuel/Unsplash
Uma equipe de pesquisadores da Microsoft Research Lab, em Pequim, na China, apresentou o VASA-1
Freepik
Trata-se de um novo modelo de inteligência artificial (IA) capaz de gerar vídeos realistas em tempo real de rostos humanos a partir de uma única foto e clipe de áudio
Divulgação
O resultado são vídeos curtos que dão à imagem estática movimentos, expressões faciais e sincronia labial extremamente convincentes, capazes de enganar um espectador menos atento
Divulgação
A tecnologia também é capaz de animar imagens artísticas, como personagens fictícios e obras de arte, além de gerar falas e cantorias
Para a geração de fala, é preciso incluir um clipe de áudio da voz desejada (que pode ser do indivíduo da foto ou não)
Freepik
Divulgação
A ferramenta também dá ao usuário controle de expressões faciais, direção do olhar, distância da cabeça, ângulo da câmera e outros ajustes granulares