Lo que necesitas saber de este tema
- OpenAI tiene un modelo mejorado de Voice Engine que puede clonar voces con solo una muestra de voz de 15 segundos.
- La tecnología de clonación de voz mediante IA de OpenAI tiene implicaciones de gran alcance y actualmente la compañía está retrasando su lanzamiento generalizado.
- Mientras tanto, OpenAI está implementando varias funciones de seguridad y medidas de protección para detectar y monitorear el uso de la tecnología.
OpenAI Voice Engine, que admite ChatGPT Voice y Read Aloud, está obteniendo una nueva y poderosa capacidad. Usando nada más que entrada de texto y una muestra de voz de 15 segundos, ahora puede generar un clon de voz humana con sonido natural que se parece mucho al hablante original. Y los resultados son terriblemente buenos.
Junto con la actualización de OpenAI general En su web presenta los resultados de varias pruebas de clonación de voz. Cada uno incluye un «sonido de referencia» original seguido de un «sonido generado» clonado. A continuación se muestran algunos ejemplos de lo que es capaz de hacer el modelo Voice Engine:
Audio de referencia 1
Sonido generado 1
Audio de referencia 2
Sonido generado 2
Audio de referencia 3
Sonido generado 3
Con aplicaciones potenciales en educación y atención médica, traducción y llegada a comunidades de todo el mundo, la clonación de voz parece tener muchos mercados esperando absorberla. Pero las consecuencias de dicha tecnología no son todas color de rosa.
El número de llamadas fraudulentas clonadas mediante IA ya está aumentando. Si bien existe un consenso general entre los países para proteger a los usuarios en la era de la inteligencia artificial, no es fácil poner barreras, especialmente cuando la tecnología avanza rápidamente.
OpenAI, sin embargo, está trabajando para implementar su propio conjunto de medidas de seguridad, «incluidas marcas de agua para rastrear el origen de cualquier audio generado por Voice Engine», prohibiendo la suplantación y exigiendo el consentimiento explícito e informado del hablante original.
«Estamos adoptando un enfoque cauteloso y deliberado para una difusión más amplia debido al potencial de uso indebido de la voz sintética», dijo la compañía en un comunicado. Entrada en el blog.