La inteligencia artificial y el machine learning pueden ser utilizados en muchos campos entre los que están los negocios y el entretenimiento; pero hay algunos que pueden generar problemas de tipo ético o legal si se aplican de manera indebida. Uno de ellos son los Deepfake que básicamente son videos o audios falsificados mediante el uso te técnicas avanzadas de inteligencia artificial y machine learning; usando generalmente algoritmos de "redes neuronales generativas" (GANs) para poner la cara y la voz de una persona en un video o audios falsos de manera que parezcan reales.
Si bien, estos deepfakes son usados para entretenimiento, o incluso para proporcionar voces a personajes de video juegos, existe la posibilidad de hacer un uso malintencionado de estas tecnologías para la generación de noticias falsas o incluso con fines delictivos.
Existen apps como Reface que te permite poner tu cara y las de tus conocidos en clips de películas o videos graciosos.
Un caso de esto se dió en 2020 cuando unos estafadores usando un deepfake de voz y apoyados de correos suplantando la identidad de un cliente importante de un banco de Emiratos Árabes, llamaron as un director de la entidad y le solicitaron transferir nada más que $35 millones de dólares, lo cual hizo pensando que todo era legítimo (Artículo en Forbes)
Un deepfake de voz es una aplicación de técnicas de inteligencia artificial que involucran técnicas de aprendizaje automático profundo (deep learning) para crear voces computarizadas que con solo darles un texto suenan como si fueran de una persona real. El modelo de inteligencia artificial debe ser entrenado con una gran cantidad de grabaciones de voz de la persona cuya voz se desea clonar. Una vez entrenado el modelo, lo cual puede demandar grandes capacidades de cómputo y tiempo, el modelo puede tomar cualquier texto y convertirlo en nuevas grabaciones de voz que suenan como si fueran del individuo original; incluso hay modelos que permiten modificar el estado de ánimo de la voz para que suene feliz, triste, sorprendido etc.
De manera comercial, existen plataformas como Resemble.ai que ofrecen desde voces clonadas de actores de voz profesionales, hasta la posibilidad de crear modelos con voces proporcionadas por los clientes. Esta es la versión comercial del proyecto de tesis de Corentin Jemine que puedes ver e incluso descargar para utilizar en su página de Github Real-Time Voice Cloning. El modelo ofrece la posibilidad de clonar una voz con tan solo 5 segundos de muestra e incluso comenzar a utilizar las voces en tiempo real como se muestra en este video:
Aunque Deepfake de voz se puede utilizar para generar voces de personajes en videojuegos y películas, facilitar la narración de videos comerciales sin tener que contratar actores profesionales o para crear voces de sistemas como anuncios públicos o asistentes de inteligencia artificial, existe el riesgo de que situaciones como al estafa que mencioné antes se vuelvan más frecuentes. Esto va a terminar obligando a las instituciones a generar leyes con respecto al uso de estas tecnologías y a la generación también de aplicaciones de inteligencia artificial que funcionen como contamedidas para detectar estos videos o audios falsos, como por ejemplo el FakeCatcher de Intel que mediante el uso de modelos de inteligencia artificial buscan en los videos claves para definir si es o no una persona como por ejemplo el flujo sanguíneo en los rostros.
También existen investigaciones dedicadas a detectar el deepfake de voz usando técnicas que permiten estimar el tracto vocal del hablante al momento de decir determinadas partes del audio, en pocas palabras del audio tratan de inferir la anatomía del que habla para determinar si la voz salió de una persona o de un modelo de deeplearning (Fuente Inverse)En conclusión, esta tecnología, si bien tiene muchas aplicaciones sanas, también en un futuro nos hará quizás dudar de la persona con quien hablamos por teléfono, o tenemos una video conferencia ya que pueden ser suplantados de igual manera a como sucede ahora con un chat.
Si quieres experimentar con esta tecnología, Resemble.ai ofrece un periodo de prueba donde puedes clontar tu voz o también puedes mirar Coqui.ai que también lo hace, aunque solo
0 Comentarios