​Eleven Labs lanza doblaje automático impulsado por IA

Fecha:


Eleven Labs ha lanzado un producto de traducción y doblaje de voz que permite a las personas localizar su contenido en 29 idiomas en cuestión de segundos. Además, se han presentado nuevas herramientas de inteligencia artificial en la búsqueda de talento y en el desarrollo de baterías de última generación. También se exploran las posibilidades de los decodificadores basados en transformers para realizar tareas en múltiples idiomas.

​Eleven Labs lanza doblaje automático, reclutador impulsado por IA y Transformers para tareas en múltiples idiomas

Eleven Labs ha lanzado un nuevo producto de traducción y doblaje de voz que permite a las personas localizar su contenido en múltiples idiomas de forma rápida y sencilla. Esta innovadora herramienta soporta hasta 29 idiomas y es capaz de conservar los estilos y características de los hablantes originales. Con esta solución, los creadores de contenido podrán llegar a audiencias internacionales de manera efectiva y eficiente.

Te puede interesar: Guerra con Hamas: Israel logra liberar a soldado rehén en Gaza

En otro ámbito, Aionics, una nueva startup, está utilizando herramientas de inteligencia artificial para acelerar el descubrimiento de materiales óptimos para electrolitos en baterías. Su objetivo es producir baterías de carga más rápida y con mayor densidad de energía, lo que supondría un gran avance en el desarrollo de baterías para vehículos eléctricos.

Por otro lado, Moonhub AI ha presentado públicamente su reclutador impulsado por IA. Esta herramienta ha sido lanzada junto a una lista de más de 100 clientes asociados, entre ellos Inflection, Anthropica, You.com y Verkada. El reclutador de Moonhub AI permite a las empresas iniciar una búsqueda de talento en cuestión de minutos y contratar a profesionales excepcionales de 3 a 5 veces más rápido, ahorrando cientos de horas en el proceso.

Procesamiento del lenguaje natural

En cuanto a mejoras en el ámbito del procesamiento del lenguaje natural, se ha desarrollado Flash Decoding, una técnica que acelera el entrenamiento de modelos de lenguaje. Esta técnica optimiza la generación de tokens y ha demostrado ser especialmente eficiente en la inferencia de grandes modelos de lenguaje.

Además, varios investigadores están explorando el potencial de los decodificadores basados en transformers pre-entrenados para crear representaciones universales tanto de lenguajes naturales como de lenguajes de programación. Estos modelos, con un mínimo entrenamiento en datos en inglés, han demostrado excelentes resultados en tareas de clasificación y búsqueda de código.

Te puede interesar: Apoyo a Damnificados por Huracán Otis en Guerrero

En otro campo de investigación, se ha presentado un nuevo enfoque para la segmentación audiovisual. El modelo conocido como «Explicit Conditional Multimodal Variational Auto-Encoder» (ECMVAE) permite identificar de manera más precisa las fuentes de sonido en videos, lo que podría tener aplicaciones en campos como el reconocimiento automático de habla o la mejora de la calidad del sonido en videos.

Spatio-Temporal Graph Mixformer


Además, se ha desarrollado una nueva red llamada «Spatio-Temporal Graph Mixformer» (STGM) para predecir patrones de tráfico. Esta red utiliza información espacial y temporal para mejorar la precisión de las predicciones, lo que podría ser de gran utilidad en la planificación de rutas y la gestión del tráfico.

Asimismo, se ha introducido un nuevo método de entrenamiento para modelos 3D que combina información en 3D y 2D, lo que ha demostrado mejoras significativas en tareas como la generación de imágenes realistas y el reconocimiento de objetos en entornos tridimensionales.



En el ámbito de la programación, se ha creado un nuevo lenguaje llamado «Sudolang» diseñado para colaborar con modelos de lenguaje basados en IA. Este lenguaje permite interactuar con modelos como ChatGPT, Bing Chat, Anthropica Claude y Google Bard, abriendo nuevas posibilidades en la creación de aplicaciones y servicios basados en IA.

Por último, el artículo hace un repaso a la evolución financiera de OpenAI, destacando que su tasa de ingresos anuales ha alcanzado los $1.3 mil millones, un gran salto desde los $28 millones generados en el año 2022. Sin embargo, también se menciona la dificultad de encontrar empleos en el campo de la investigación en inteligencia artificial, a pesar de la gran cantidad de puestos disponibles.

En resumen, el lanzamiento del producto de doblaje automático de Eleven Labs, el reclutador impulsado por IA de Moonhub AI, los avances en el procesamiento de lenguaje natural y las investigaciones en el campo de la inteligencia artificial demuestran el continuo crecimiento y desarrollo de estas tecnologías en diversos sectores.

LTN

spot_img

Compartir noticia:

spot_img
spot_img

Lo más visto