{"id":10604,"date":"2025-01-15T22:45:10","date_gmt":"2025-01-16T02:45:10","guid":{"rendered":"https:\/\/noticiasveraces.com\/?p=10604"},"modified":"2025-01-15T22:45:10","modified_gmt":"2025-01-16T02:45:10","slug":"meta-desarrolla-un-traductor-simultaneo-de-hasta-101-idiomas-con-una-mayor-precision-que-los-sistemas-actuales-tecnologia","status":"publish","type":"post","link":"https:\/\/noticiasveraces.com\/?p=10604","title":{"rendered":"Meta desarrolla un traductor simult\u00e1neo de hasta 101 idiomas con una mayor precisi\u00f3n que los sistemas actuales | Tecnolog\u00eda"},"content":{"rendered":"<p> \n<\/p>\n<div data-dtm-region=\"articulo_cuerpo\">\n<p class=\"\">Meta quiere recuperar la ambici\u00f3n que impuls\u00f3 la b\u00edblica torre que, seg\u00fan el relato del <i>G\u00e9nesis<\/i> (11:1-9), la humanidad quiso construir para llegar al cielo. \u201cSon un solo pueblo y todos ellos tienen la misma lengua. (\u2026) Ahora, nada de lo que se propongan les ser\u00e1 imposible. Vamos, bajemos y all\u00ed confundamos su lengua, para que nadie entienda el lenguaje del otro\u201d, reaccion\u00f3 Jehov\u00e1. La compa\u00f1\u00eda de Mark Zuckerberg, la multinacional de Facebook, Instagram y WhatsApp quiere conjurar esta maldici\u00f3n y mantener el liderazgo en las comunicaciones personales, para lo que ha desarrollado, seg\u00fan publica hoy mi\u00e9rcoles la revista <i>Naturaleza<\/i>un modelo de inteligencia artificial (IA) capaz de traducir de forma instant\u00e1nea comunicaciones de voz a voz o de texto a voz y viceversa en hasta 101 idiomas, imitando la voz y el tono de los interlocutores.<\/p>\n<p class=\"\">El modelo, llamado SEAMLESSM4T, \u201csupera a los sistemas existentes\u201d, seg\u00fan la investigadora principal Marta Costa-Juss\u00e0, de la divisi\u00f3n de inteligencia artificial de Meta (FAIR, Foundational AI Research), y se pondr\u00e1 a disposici\u00f3n del p\u00fablico siempre que no se utilice con fines comerciales.<\/p>\n<p class=\"\">SEAMLESSM4T puede reconocer hasta 101 idiomas (escritos o hablados) y es capaz de traducirlos a 36 en formato de voz y 96 en un archivo de texto. De acuerdo con los resultados de Costa-Juss\u00e0, \u201ctraduce con entre un 8% y un 23% m\u00e1s de precisi\u00f3n [de acuerdo con la <i>Bilingual Evaluation Understudy<\/i>] que los sistemas existentes, pueden filtrar el ruido de fondo [entre un 42% y un 66% m\u00e1s] y se ajusta a la variaci\u00f3n de voces\u201d.<\/p>\n<h3 class=\"\">Direcci\u00f3n opuesta a las redes<\/h3>\n<p class=\"\">Por otra parte, mientras Meta ha eliminado el sistema de verificaci\u00f3n de datos y la moderaci\u00f3n de contenidos en sus plataformas de comunicaci\u00f3n, abriendo la puerta a bulos, sesgos y discursos de odio, con el sistema de traducci\u00f3n simult\u00e1nea, ha optado por la estrategia contraria. y se ha centrado en la \u201cmitigaci\u00f3n de la toxicidad\u201d que se puede inferir al sistema durante el aprendizaje autom\u00e1tico o en la traducci\u00f3n. En este sentido, Olga Koreneva Antonova, profesora de la Facultad de Traducci\u00f3n e Interpretaci\u00f3n de la Universidad Pablo de Olavide (UPO), advierte que, por ejemplo, los traductores inform\u00e1ticos actuales \u201cno consideran la igualdad de g\u00e9nero\u201d y tienden a sustituir el femenino por el masculino porque las fuentes con la que se entrena ya incluyen ese sesgo.<\/p>\n<p class=\"\">Meta considera toxicidad las blasfemias o resultados que pueden incitar al odio, la violencia o el abuso contra una persona o un grupo (como una religi\u00f3n, raza o g\u00e9nero). Para mitigarla, ha desarrollado una herramienta, denominada Etox, especialmente entrenada en elementos t\u00f3xicos procedentes del habla.<\/p>\n<p class=\"\">Otra de las limitaciones que intenta superar el nuevo sistema es la escasez de idiomas operativos. Aunque m\u00e1s de la mitad de la humanidad habla principalmente media docena de idiomas, la diversidad es tan amplia que quedan fuera del servicio los m\u00e1s de 7.000 existentes en el mundo. El modelo de meta ha intentado paliar esta deficiencia incorporando hasta 101 idiomas, a pesar de la escasez de datos de audio y modelos para incorporarlos a la IA.<\/p>\n<p class=\"\">Tanel Alum\u00e4e, del laboratorio de tecnolog\u00eda del lenguaje de la Universidad de Tallin (Estonia) destaca en <i>Naturaleza<\/i> la alta capacidad del sistema para traducir de forma simult\u00e1nea el habla gracias a los datos de 4,5 millones de horas de audio hablado multiling\u00fce. \u201cEste tipo de entrenamiento ayuda al modelo a aprender los patrones de los datos, lo que facilita el ajuste para tareas espec\u00edficas sin necesidad de grandes cantidades de datos de entrenamiento personalizados\u201d, explica.<\/p>\n<p class=\"\">No obstante, en su opini\u00f3n, \u201cla mayor virtud de este trabajo no es la idea o el m\u00e9todo propuesto, sino el hecho de que todos los datos y el c\u00f3digo para ejecutar y optimizar esta tecnolog\u00eda est\u00e9n disponibles p\u00fablicamente, aunque el modelo en s\u00ed solo se puede utilizar para usos no comerciales\u201d.<\/p>\n<aside class=\"a_ei\">\n<header class=\"a_ei_h _db\">M\u00e1s informaci\u00f3n<\/header>\n<\/aside>\n<p class=\"\">Allison Koenecke, del departamento de Ciencias de la Informaci\u00f3n en la Universidad de Cornell, advierte, tambi\u00e9n en <i>Naturaleza<\/i>de las limitaciones de estos sistemas de traducci\u00f3n, a pesar de su progreso, en entornos donde la precisi\u00f3n es fundamental, como en actividades m\u00e9dicas o legales: \u201cModelos como el ideado por SEAMLESS est\u00e1n acelerando el progreso en este \u00e1mbito, pero los usuarios de estos modelos (m\u00e9dicos y funcionarios de los tribunales, por ejemplo) deben ser conscientes de la falibilidad de las tecnolog\u00edas del habla\u201d.<\/p>\n<p class=\"\">En este sentido, abunda: \u201cEste tipo de error inducido por la m\u00e1quina podr\u00eda inducir un da\u00f1o real, como recetar err\u00f3neamente un medicamento o acusar a una persona. Y el da\u00f1o afecta de manera desproporcionada a las poblaciones marginadas, que probablemente ser\u00e1n mal escuchadas\u201d.<\/p>\n<p class=\"\">Koenecke celebra los esfuerzos por eliminar la \u201ctoxicidad\u201d de las traducciones, pero aboga por \u201campliar el alcance de los sesgos ling\u00fc\u00edsticos estudiados\u201d y advertir a los usuarios de las posibilidades de error.<\/p>\n<h3 class=\"\">Cr\u00edticas<\/h3>\n<p class=\"\">A pesar del avance en el sistema de traducci\u00f3n, el modelo despierta avances entre algunos investigadores. Uno de los m\u00e1s cr\u00edticos es V\u00edctor Etxebarria, catedr\u00e1tico de Ingenier\u00eda de Sistemas y Autom\u00e1tica en la Universidad del Pa\u00eds Vasco (UPV\/EHU). \u201cNo contribuye al avance cient\u00edfico, ya que, partiendo de lo publicado, los especialistas independientes no tienen permiso para reproducir, comprobar o incluso mejorar sus bases tecnol\u00f3gicas. Tan solo tienen acceso a conectarse al traductor para efectuar traducciones superficiales. Este <i>software<\/i> [programa]  no cumple los principios de la IA en c\u00f3digo abierto, tal y como lo define la Open Source Initiative: usar, estudiar, modificar y compartir para cualquier prop\u00f3sito. Esto no lo permite este traductor y, por tanto, no es coherente con los principios de la ciencia abierta\u201d, declara Science Media Center (SMC) Espa\u00f1a.<\/p>\n<p class=\"\">Y aun reconociendo alguna virtud como herramienta de ayuda, el investigador a\u00f1ade: \u201cEl producto no evita los retardos de traducci\u00f3n ni los errores, que no enmienda en tiempo real, como s\u00ed realizan las personas traductoras. Otra limitaci\u00f3n es que solo puede utilizarse por internet a trav\u00e9s de la API (<i>Interfaz de programaci\u00f3n de aplicaciones<\/i>) que impone la empresa. En conjunto, el traductor es un producto tecnol\u00f3gico avanzado y probablemente muy \u00fatil, pero cerrado a los principios de la ciencia abierta y con m\u00faltiples limitaciones tecnol\u00f3gicas y legales\u201d.<\/p>\n<p class=\"\">Maite Mart\u00edn, catedr\u00e1tica de Inform\u00e1tica de la Universidad de Ja\u00e9n e investigadora del grupo SINAI (Sistemas INteligentes de Acceso a la Informaci\u00f3n), destaca la incorporaci\u00f3n de idiomas de pocos recursos (m\u00e1s minoritarios), aunque a costa de una mayor tasa de errores. \u201cEste esfuerzo no solo mejora la accesibilidad de las tecnolog\u00edas de traducci\u00f3n para estas comunidades, sino que tambi\u00e9n marca un avance en la inclusi\u00f3n ling\u00fc\u00edstica al democratizar el acceso a herramientas avanzadas de comunicaci\u00f3n\u201d, explica.<\/p>\n<p class=\"\">Al contrario de Etxebarria, la investigadora s\u00ed considera que s\u00ed se garantiza el acceso a la comunidad cient\u00edfica, y alaba \u201cla interacci\u00f3n en tiempo real, la expresividad de la voz traducida y la mitigaci\u00f3n de sesgos de g\u00e9nero y toxicidad\u201d. \u201cAunque SEAMLESSM4T supone un avance significativo, todav\u00eda queda trabajo por hacer para optimizar su implementaci\u00f3n en escenarios pr\u00e1cticos\u201d, concluye en SMC.<\/p>\n<p class=\"\">En relaci\u00f3n con la toxicidad, Andreas Kaltenbrunner, investigador l\u00edder del grupo AI and Data for Society de la UOC, recuerda la contradicci\u00f3n de Meta con su reciente estrategia de suprimir la moderaci\u00f3n de contenidos y promoverla en el traductor. \u201cEs digno de elogio que el estudio incluya un an\u00e1lisis sobre si las traducciones incrementan la toxicidad de los textos o c\u00f3mo abordan posibles sesgos de g\u00e9nero. Sin embargo, resulta desafortunado que Meta, la empleadora de los investigadores de este estudio, parece haber decidido recientemente abandonar los esfuerzos en este sentido con su nueva pol\u00edtica de moderaci\u00f3n de contenidos\u201d.<\/p>\n<p class=\"\">Kaltenbrunner recuerda en SMC que el desarrollo es una variante de uno presentado en agosto de 2023, pero con mejoras en la unificaci\u00f3n del entorno de uso, los idiomas incluidos, los filtros de ruido y la diversidad de acentos.<\/p>\n<\/div>\n\n","protected":false},"excerpt":{"rendered":"<p>Meta quiere recuperar la ambici\u00f3n que impuls\u00f3 la b\u00edblica torre que, seg\u00fan el relato del G\u00e9nesis (11:1-9), la humanidad quiso construir para llegar al cielo. \u201cSon un solo pueblo y todos ellos tienen la misma lengua. (\u2026) Ahora, nada de lo que se propongan les ser\u00e1 imposible. Vamos, bajemos y all\u00ed confundamos su lengua, para &hellip;<\/p>\n","protected":false},"author":1,"featured_media":10605,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"fifu_image_url":"https:\/\/imagenes.elpais.com\/resizer\/v2\/5DV5Z7RHURBVBJLYZSR67ESFFE.jpeg?auth=00df6b9aa27a89aa80b410f5d4fbee8b591b709935644d31e491b81d9ea8caa6&width=1200","fifu_image_alt":"","footnotes":""},"categories":[2],"tags":[],"class_list":["post-10604","post","type-post","status-publish","format-standard","has-post-thumbnail","","category-tecnologia"],"_links":{"self":[{"href":"https:\/\/noticiasveraces.com\/index.php?rest_route=\/wp\/v2\/posts\/10604","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/noticiasveraces.com\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/noticiasveraces.com\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/noticiasveraces.com\/index.php?rest_route=\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/noticiasveraces.com\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=10604"}],"version-history":[{"count":0,"href":"https:\/\/noticiasveraces.com\/index.php?rest_route=\/wp\/v2\/posts\/10604\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/noticiasveraces.com\/index.php?rest_route=\/wp\/v2\/media\/10605"}],"wp:attachment":[{"href":"https:\/\/noticiasveraces.com\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=10604"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/noticiasveraces.com\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=10604"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/noticiasveraces.com\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=10604"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}