Cómo falsifican la voz para timar a las empresas

Hace algunos años, cuando veíamos cómo en las películas falsificaban la voz de alguien poniendo un dispositivo en la garganta, sonreíamos ante tanta ingenuidad. Hoy aún estamos lejos de llegar al nivel James Bond, pero la experiencia demuestra que el Deepfake Voice ha llegado para quedarse, tal y como vimos en el caso del banco en Emiratos Árabes Unidos.

Para los que os perdisteis la noticia, os lo resumo. Unos criminales usaron clonación por voz para hacerse pasar por el alto directivo de una empresa. Llamaron por teléfono al gerente de un banco para autorizar transferencias monetarias de alto importe, y acabaron estafando 35 millones de euros al banco en cuestión.



Los gerentes de los bancos conocen a sus clientes más importantes, y los reconocen fácilmente cuando llaman por teléfono, por lo que el gerente timado no sospechó que detrás de la llamada se encontraba un programa informático capaz de modular la voz para hacerse pasar por otra persona.

Cómo se falsifica la voz

Hay programas de código abierto que pueden realizar ese proceso incluso en tiempo real. Uno de los más conocidos es el publicado por Corentin Jemine en este enlace, donde hay incluso un vídeo mostrando cómo se usa.

La idea es obtener la voz de la persona a la que se quiere clonar, y usarla como fuente en uno de esos programas. Después hay que realizar ediciones con programas de audio tradicionales, como Audacity, para que cambie completamente el tono de nuestra voz para que suene exactamente como la otra persona.

Otra opción es la mostrada en este vídeo:

Utiliza este código, que también puede clonarse y adaptarse.

Como veis, hay varios recursos online que pueden usarse de forma gratuita, aunque todos ellos requieren ciertas habilidades en el mundo de la edición de audio o algunos conocimientos de programación (no muchos, ya que el código ya está creado).

Cómo evitar caer en la trampa

En realidad se ha abierto la puerta de la desconfianza. Ahora ya sabemos que si alguien nos llama con una voz conocida pidiendo algo «raro», podemos estar siendo víctimas de un Deepfake Voice, por lo que tendremos que recurrir a las famosas contraseñas que solo dos personas conocen, tipo frase de paso para entrar en un bar clandestino, o realizar preguntas personales.

El método que debemos usar dependerá mucho del contexto. En el caso de los bancos puede haber un código numérico que deba decirse en voz alta, como se hacía hace años, mientras que en asuntos personales basta con preguntar el color de una mascota o datos que no sean sencillos obtener en Internet.

Fuente: Link