ıllı Internet y Tecnologías de la Información (2018)

internet, Hosting, dominios, seo, antivirus, banco de imágenes, páginas web, tiendas online

[Enciclopedia Online Gratuita] Diccionario de Internet y Tecnologías de la Información y la Comunicación (TIC):

ıllı Google traductor/translate: que es, definición y significado, clasico, ingles a español

videos internet

salud  ıllı Google traductor/traslate : que es, definición y significado, clásico, español.  


Google Translate es un servicio gratuito de traducción automática multilingüe desarrollado por Google para traducir texto. Ofrece una interfaz de sitio web, aplicaciones móviles para Android e iOS, y una API que ayuda a los desarrolladores a crear extensiones de navegador y aplicaciones de software. Google Translate es compatible con más de 100 idiomas en varios niveles y, a partir de mayo de 2017, presta servicios a más de 500 millones de personas al día.

Lanzado en abril de 2006 como un servicio de traducción automática de estadísticas, utilizó las transcripciones de las Naciones Unidas y del Parlamento Europeo para recopilar datos lingüísticos. En lugar de traducir los idiomas directamente, primero traduce el texto al inglés y luego al idioma de destino. Durante una traducción, busca patrones en millones de documentos para ayudar a decidir cuál es la mejor traducción. Su exactitud ha sido criticada y ridiculizada en varias ocasiones. En noviembre de 2016, Google anunció que Google Translate cambiaría a un motor neural de traducción automática -Google Neural Machine Translation (GNMT)- que traduce "oraciones enteras a la vez, en lugar de sólo pieza por pieza". Utiliza este contexto más amplio para ayudarle a encontrar la traducción más relevante, que luego reorganiza y ajusta para que se parezca más a un ser humano que habla con la gramática adecuada". Originalmente habilitado sólo para unos pocos idiomas en 2016, GNMT se está utilizando gradualmente para más idiomas.

Google Translate puede traducir múltiples formas de texto y medios, incluyendo texto, voz, imágenes, sitios o vídeo en tiempo real, de un idioma a otro Soporta más de 100 idiomas en varios niveles y, a partir de mayo de 2017, atiende a más de 500 millones de personas al día En algunos idiomas, Google Translate puede pronunciar el texto traducido, resaltar las palabras y frases correspondientes en el texto de origen y en el texto de destino y actuar como un diccionario sencillo para la introducción de una sola palabra. Si se selecciona "Detectar idioma", el texto en un idioma desconocido puede identificarse automáticamente. Si un usuario introduce una URL en el texto de origen, Google Translate creará un hipervínculo a una traducción automática del sitio web Los usuarios pueden guardar las traducciones en un "libro de frases" para su uso posterior En algunos idiomas, el texto puede introducirse a través de un teclado en pantalla, mediante reconocimiento de escritura a mano o reconocimiento de voz.

Integración de navegadores
Google Translate está disponible en algunos navegadores web como una extensión opcional descargable que puede ejecutar el motor de traducción En febrero de 2010, Google Translate se integró de forma predeterminada en el navegador Google Chrome para la traducción automática opcional de páginas web.

Aplicaciones para móviles
La aplicación Google Translate para Android e iOS soporta más de 100 idiomas y puede traducir 37 idiomas a través de fotos, 32 a través de voz en "modo conversación" y 27 a través de vídeo en tiempo real en "modo realidad aumentada".

La aplicación Android fue lanzada en enero de 2010, y para iOS el 8 de febrero de 2011.

Una versión Android de enero de 2011 experimentaba con un "modo de conversación" que permitía a los usuarios comunicarse con fluidez con una persona cercana en otro idioma Originalmente limitado al inglés y al español, la función recibió soporte para 12 nuevos idiomas, aún en fase de prueba, el 19 de octubre siguiente.

En enero de 2015, las aplicaciones obtuvieron la capacidad de traducir signos físicos en tiempo real utilizando la cámara del dispositivo, como resultado de la adquisición por parte de Google de la aplicación Word Lens El lanzamiento original de enero sólo soportaba siete idiomas, pero una actualización de julio agregó soporte para 20 idiomas nuevos, y también mejoró la velocidad de las traducciones del Modo Conversación.

API
En mayo de 2011, Google anunció que la API de Google Translate para desarrolladores de software había quedado obsoleta y dejaría de funcionar En la página de la API de Translate se indicaba que la razón era la "carga económica sustancial causada por el abuso generalizado", con una fecha límite fijada para el 1 de diciembre de 2011 En respuesta a la presión de la opinión pública, Google anunció en junio de 2011 que la API seguiría estando disponible como un servicio de pago.

Debido a que la API se utilizó en numerosos sitios web y aplicaciones de terceros, la decisión original de desaprobarla llevó a algunos desarrolladores a criticar a Google y a cuestionar la viabilidad de utilizar las API de Google en sus productos.



Asistente de Google
Google Translate también proporciona traducciones para el Asistente de Google y los dispositivos en los que se ejecuta el Asistente de Google, como Google Home y Google Pixel Buds.

En abril de 2006, Google Translate se lanzó con un motor de traducción automática estadística.

Google Translate no aplica reglas gramaticales, ya que sus algoritmos se basan en el análisis estadístico y no en el análisis tradicional basado en reglas. El creador original del sistema, Franz Josef Och, ha criticado la eficacia de los algoritmos basados en reglas a favor de los enfoques estadísticos, basados en un método llamado traducción automática estadística y, más específicamente, en la investigación de Och, que ganó el concurso DARPA para la traducción automática rápida en 2003. Och fue el jefe del grupo de traducción automática de Google hasta su partida para unirse a Human Longevity, Inc. en julio de 2014.

Según Och, una base sólida para desarrollar un sistema de traducción automática estadística utilizable para un nuevo par de idiomas desde cero consistiría en un corpus de texto bilingüe (o colección paralela) de más de 150-200 millones de palabras, y dos corpus monolingües de más de mil millones de palabras cada uno, a partir de los cuales se utilizan modelos estadísticos para traducir entre esos idiomas.

Para adquirir esta enorme cantidad de datos lingüísticos, Google utilizó las transcripciones de las Naciones Unidas y del Parlamento Europeo.

Google Translate no traduce de un idioma a otro (L1 → L2). En cambio, a menudo traduce primero al inglés y luego a la lengua de destino (L1 → ES → L2)..

Cuando Google Translate genera una traducción, busca patrones en cientos de millones de documentos para ayudar a decidir cuál es la mejor traducción. Al detectar patrones en documentos que ya han sido traducidos por traductores humanos, Google Translate hace conjeturas inteligentes sobre lo que debería ser una traducción apropiada.

Antes de octubre de 2007, para idiomas distintos del árabe, chino y ruso, Google Translate se basaba en SYSTRAN, un motor de software que todavía utilizan otros servicios de traducción en línea, como Babel Fish (ya desaparecido). Desde octubre de 2007, Google Translate ha utilizado tecnología propia basada en la traducción automática estadística.


En septiembre de 2016, un equipo de investigación de Google dirigido por el ingeniero de software Harold Gilchrist anunció el desarrollo del sistema de traducción automática neural de Google (GNMT) para aumentar la fluidez y la precisión en Google Translate y en noviembre anunció que Google Translate cambiaría a GNMT.

El sistema de traducción automática neural de Google Translate utiliza una gran red neural de extremo a extremo capaz de un aprendizaje profundo,, en particular, redes de memoria a largo plazo GNMT mejora la calidad de la traducción porque utiliza un método de traducción automática basado en ejemplos (EBMT) en el que el sistema "aprende de millones de ejemplos" Traduce "frases enteras a la vez, en vez, en lugar de hacerlo pieza por pieza. Utiliza este contexto más amplio para ayudarlo a encontrar la traducción más relevante, que luego reorganiza y ajusta para que se asemeje más a un ser humano que habla con la gramática adecuada" La "arquitectura propuesta" de "aprendizaje por el sistema" de la GNMT fue probada por primera vez en más de un centenar de idiomas con el apoyo de Google Translate Con el marco de trabajo integral, "el sistema aprende con el paso del tiempo para crear traducciones mejores y más naturales".


La red GNMT es capaz de realizar traducciones automáticas interlinguales, que codifican la "semántica de la oración en lugar de simplemente memorizar traducciones de frase a frase", y el sistema no inventó su propio idioma universal, sino que utiliza "la similitud que se encuentra entre muchos idiomas" GNMT se habilitó por primera vez para ocho idiomas: desde y hacia el inglés y el chino, el francés, el alemán, el japonés, el coreano, el portugués, el español y el turco.

2] En marzo de 2017, se habilitó para los idiomas hindi, ruso y vietnamita, seguido por los idiomas indonesio, bengalí, gujarati, kannada, malayalam, marathi, punjabi, tamil y telugu en abril.

GNMT tiene la capacidad de traducir directamente de un idioma a otro (L1 → L2), lo que mejora las versiones anteriores de Google Translate, que primero tradujeron al inglés y luego al idioma de destino (L1 → EN → L2). El sistema GNMT también es capaz de traducir sin intervención alguna -traducir entre un par de idiomas (por ejemplo, del japonés al coreano), algo que el "sistema nunca ha visto explícitamente antes".

Crowdsourcing
En 2014, Google lanzó "Translate Community", una plataforma destinada a mejorar el servicio de traducción mediante la búsqueda de voluntarios En agosto de 2016, se lanzó una aplicación de Google Crowdsource para usuarios de Android, en la que se ofrecen tareas de traducción.

Algunos idiomas producen mejores resultados que otros. Google Translate funciona bien, especialmente cuando el inglés es el idioma de destino y el idioma de origen es de la Unión Europea debido a la prominencia de las notas traducidas del Parlamento Europeo. Un análisis de 2010 indicó que la traducción del francés al inglés es relativamente precisa Sin embargo, si el texto original es más corto, las traducciones automáticas basadas en reglas a menudo funcionan mejor; este efecto es particularmente evidente en las traducciones del chino al inglés. Aunque se pueden enviar ediciones de traducciones, en chino específicamente no se pueden editar las frases en su totalidad. En lugar de eso, uno debe editar a veces conjuntos arbitrarios de caracteres, lo que conduce a ediciones incorrectas Un buen ejemplo es de ruso a inglés. Anteriormente se utilizaba Google Translate para hacer un borrador y luego se utilizaba un diccionario y sentido común para corregir los numerosos errores. Desde principios de 2018, Translate es lo suficientemente preciso como para que la Wikipedia rusa sea accesible a aquellos que saben leer en inglés. La calidad de Translate se puede comprobar añadiéndolo como una extensión de Chrome y aplicándolo a los enlaces a la izquierda de cualquier artículo de Wikipedia.

Poco después de lanzar el servicio de traducción por primera vez, Google ganó un concurso internacional de traducción automática inglés-árabe e inglés-chino.

Errores de traducción y rarezas
Dado que Google Translate utilizó la correspondencia estadística para traducir, el texto traducido a menudo puede incluir errores aparentemente absurdos y obvios, a veces intercambiando términos comunes por términos comunes similares pero no equivalentes en el otro idioma, o invirtiendo el significado de la oración. Sitios web novedosos como Bad Translator y Translation Party han utilizado el servicio para producir textos humorísticos traduciendo de un idioma a otro, de manera similar a los susurros chinos de los juegos infantiles.

En 2017, Google Translate se utilizó durante una audiencia judicial cuando los funcionarios del Tribunal de Primera Instancia de Teesside no contrataron un intérprete para un acusado chino.

 

wiki  MÁS DATOS DE INTERÉS (Historia/Guía/Manual de uso):

 

La traducción automática, a veces denominada MT (que no debe confundirse con la traducción asistida por ordenador, la traducción humana asistida por ordenador (MAHT) o la traducción interactiva) es un subcampo de la lingüística computacional que investiga el uso de software para traducir texto o voz de un idioma a otro.

En un nivel básico, la MT realiza la simple sustitución de palabras en un idioma por palabras en otro, pero esto por sí solo no puede producir una buena traducción de un texto porque se necesita el reconocimiento de frases enteras y sus contrapartes más cercanas en el idioma de destino. Resolver este problema con técnicas de corpus estadístico y neurales es un campo en rápido crecimiento que está conduciendo a mejores traducciones, manejando diferencias en la tipología lingüística, traducción de expresiones idiomáticas y el aislamiento de anomalías.

El software de traducción automática actual a menudo permite la personalización por dominio o profesión (como los informes meteorológicos), lo que mejora la producción al limitar el alcance de las sustituciones permitidas. Esta técnica es particularmente eficaz en los ámbitos en los que se utiliza un lenguaje formal o de fórmulas. De ello se deduce que la traducción automática de documentos gubernamentales y jurídicos produce más fácilmente resultados utilizables que la conversación o un texto menos estandarizado.

También se puede mejorar la calidad de la producción mediante la intervención humana: por ejemplo, algunos sistemas son capaces de traducir con mayor precisión si el usuario ha identificado sin ambigüedades qué palabras del texto son nombres propios. Con la ayuda de estas técnicas, la MT ha demostrado ser útil como herramienta para ayudar a los traductores humanos y, en un número muy limitado de casos, incluso puede producir resultados que se pueden utilizar tal cual (por ejemplo, informes meteorológicos).

El progreso y el potencial de la traducción automática se han debatido mucho a lo largo de su historia. Desde la década de 1950, varios estudiosos han cuestionado la posibilidad de lograr una traducción automática de alta calidad, en primer lugar y sobre todo por parte de Yehoshua Bar-Hillel Algunos críticos afirman que existen obstáculos importantes para automatizar el proceso de traducción.

Historia de la traducción automática

La idea de la traducción automática se remonta al siglo XVII. En 1629, René Descartes propone un lenguaje universal, con ideas equivalentes en diferentes lenguas que comparten un mismo símbolo El campo de la ""traducción automática"" aparece en el Memorando sobre la traducción de Warren Weaver (1949). El primer investigador en el campo, Yehosha Bar-Hillel, comenzó su investigación en el MIT (1951). Un equipo de investigación de MT de la Universidad de Georgetown le siguió (1951) con una demostración pública de su sistema experimental Georgetown-IBM en 1954. Aparecieron programas de investigación sobre MT en Japón y Rusia (1955), y la primera conferencia sobre MT se celebró en Londres (1956) Los investigadores continuaron incorporándose al campo a medida que se formó la Association for Machine Translation and Computational Linguistics (Asociación para la Traducción Automática y la Lingüística Computacional) en EE.UU. (1962) y la Academia Nacional de Ciencias formó el Comité Asesor de Procesamiento Automático del Lenguaje (Automatic Language Processing Advisory Committee, ALPAC) para estudiar MT (1964). Sin embargo, el progreso real fue mucho más lento, y después de que el informe de ALPAC (1966), que encontró que la investigación de diez años de duración no había cumplido con las expectativas, la financiación se redujo considerablemente.

El Instituto Textil Francés también utilizó la traducción automática para traducir resúmenes desde y hacia el francés, inglés, alemán y español (1970); la Universidad Brigham Young inició un proyecto para traducir textos mormones mediante traducción automática (1971); y Xerox utilizó SYSTRAN para traducir manuales técnicos (1978). A partir de finales de la década de 1980, a medida que la potencia computacional aumentaba y se hacía más barata, se mostró más interés en los modelos estadísticos para la traducción automática. Se lanzaron varias compañías de MT, incluyendo Trados (1984), que fue la primera en desarrollar y comercializar la tecnología de memorias de traducción (1989).

El primer sistema comercial de MT para ruso/inglés/alemán-ucraniano fue desarrollado en la Universidad Estatal de Kharkov (1991).

La traducción automática en Internet comenzó con SYSTRAN Offering free translation of small texts (1996), seguida de AltaVista Babelfish, que acumulaba 500.000 solicitudes al día (1997). Franz-Josef Och (futuro director de Desarrollo de Traducción AT Google) ganó el concurso de MT de velocidad de DARPA (2003). Otras innovaciones durante este tiempo incluyeron MOSES, el motor estadístico de código abierto MT (2007), un servicio de traducción de texto/SMS para móviles en Japón (2008), y un teléfono móvil con funcionalidad incorporada de traducción de voz a voz para inglés, japonés y chino (2009). Recientemente, Google anunció que Google Translate traduce aproximadamente el texto suficiente para llenar 1 millón de libros en un día (2012).

La idea de utilizar computadoras digitales para la traducción de idiomas naturales fue propuesta ya en 1946 por A. D. Booth y posiblemente por otros. Warren Weaver escribió un importante memorándum ""Traducción"" en 1949. El experimento de Georgetown no fue en absoluto la primera aplicación de este tipo, y en 1954 se hizo una demostración en la máquina APEXC del Birkbeck College (Universidad de Londres) de una rudimentaria traducción del inglés al francés. En ese momento se publicaron varios artículos sobre el tema, e incluso artículos en revistas populares (ver por ejemplo Wireless World, Sept. 1955, Cleave y Zacharov). Una aplicación similar, también pionera en Birkbeck College en ese momento, era la lectura y composición de textos en Braille por computadora.

Detrás de este procedimiento aparentemente simple se encuentra una compleja operación cognitiva. Para descifrar el significado del texto original en su totalidad, el traductor debe interpretar y analizar todas las características del texto, un proceso que requiere un conocimiento profundo de la gramática, la semántica, la sintaxis, las expresiones idiomáticas, etc., del idioma original, así como de la cultura de sus hablantes. El traductor necesita los mismos conocimientos profundos para recodificar el significado en el idioma de destino.

Ahí radica el reto de la traducción automática: cómo programar un ordenador que ""entienda"" un texto como lo hace una persona, y que ""cree"" un nuevo texto en el idioma de destino que suene como si hubiera sido escrito por una persona.

En su aplicación más general, esto va más allá de la tecnología actual. Aunque funciona mucho más rápido, ningún programa o procedimiento de traducción automática, sin participación humana, puede producir un resultado que se acerque a la calidad que un traductor humano puede producir. Lo que puede hacer, sin embargo, es proporcionar una aproximación general, aunque imperfecta, del texto original, obteniendo la ""esencia"" del mismo (un proceso llamado ""esencia""). Esto es suficiente para muchos fines, incluido el de aprovechar al máximo el tiempo limitado y costoso de un traductor humano, reservado para aquellos casos en los que la precisión total es indispensable.

Este problema puede abordarse de varias maneras, a través de cuya evolución ha mejorado la precisión.

La pirámide de Bernard Vauquois muestra la profundidad comparativa de la representación intermediaria, la traducción automática interlingual en el punto álgido, seguida de la traducción por transferencia, y luego la traducción directa.

La traducción automática puede utilizar un método basado en reglas lingüísticas, lo que significa que las palabras se traducirán de manera lingüística - las palabras más adecuadas (oralmente hablando) de la lengua de destino reemplazarán a las palabras de la lengua de origen.

A menudo se argumenta que el éxito de la traducción automática requiere que se resuelva primero el problema de la comprensión del lenguaje natural.

Generalmente, los métodos basados en reglas analizan un texto, generalmente creando una representación intermediaria y simbólica, a partir de la cual se genera el texto en el idioma de destino. Según la naturaleza de la representación del intermediario, un enfoque se describe como traducción automática interlingual o traducción automática basada en la transferencia.

Estos métodos requieren léxicos extensos con información morfológica, sintáctica y semántica, y grandes conjuntos de reglas.

Con datos suficientes, los programas de traducción automática a menudo funcionan lo suficientemente bien como para que un hablante nativo de un idioma obtenga el significado aproximado de lo que está escrito por el otro hablante nativo. La dificultad es conseguir suficientes datos del tipo correcto para apoyar el método en particular. Por ejemplo, el gran corpus multilingüe de datos necesario para que los métodos estadísticos funcionen no es necesario para los métodos basados en la gramática. Pero entonces, los métodos gramaticales necesitan un lingüista experto para diseñar cuidadosamente la gramática que utilizan.

Para traducir entre idiomas estrechamente relacionados, se puede utilizar la técnica denominada traducción automática basada en reglas.

 Traducción automática basada en reglas

El paradigma de traducción automática basada en reglas incluye la traducción automática basada en transferencias, la traducción automática interlingual y los paradigmas de traducción automática basada en diccionarios. Este tipo de traducción se utiliza principalmente en la creación de diccionarios y programas gramaticales. A diferencia de otros métodos, la RBMT implica más información sobre la lingüística de las lenguas de origen y de destino, utilizando las reglas morfológicas y sintácticas y el análisis semántico de ambas lenguas. El enfoque básico consiste en vincular la estructura de la oración de entrada con la estructura de la oración de salida utilizando un analizador y un analizador para el idioma de origen, un generador para el idioma de destino y un léxico de transferencia para la traducción real. La mayor desventaja del RBMT es que todo debe hacerse explícito: la variación ortográfica y las entradas erróneas deben formar parte del analizador del idioma de origen para poder hacer frente a ella, y las reglas de selección léxica deben estar escritas para todos los casos de ambigüedad. Adaptarse a nuevos dominios en sí mismo no es tan difícil, ya que la gramática central es la misma en todos los dominios, y el ajuste específico del dominio se limita al ajuste de la selección léxica.

 

Traducción automática basada en transferencia

La traducción automática basada en transferencia es similar a la traducción automática interlingual en el sentido de que crea una traducción a partir de una representación intermedia que simula el significado de la oración original. A diferencia de la TA interlingual, depende en parte de la pareja de idiomas que interviene en la traducción.

Un ejemplo de los enfoques de traducción automática basados en reglas. En este enfoque, el idioma de origen, es decir, el texto a traducir, se transforma en una lengua interlingual, es decir, una representación ""neutra en términos lingüísticos"" e independiente de cualquier lengua. El idioma de destino se genera a partir de interlingua. Una de las principales ventajas de este sistema es que interlingua se hace más valiosa a medida que aumenta el número de idiomas de destino en los que se puede convertir. Sin embargo, el único sistema de traducción automática interlingual que se ha hecho operativo a nivel comercial es el sistema KANT (Nyberg y Mitamura, 1992), que está diseñado para traducir el inglés técnico de Caterpillar (CTE) a otros idiomas.

 

Traducción automática basada en diccionario

La traducción automática puede utilizar un método basado en las entradas del diccionario, lo que significa que las palabras serán traducidas tal cual por un diccionario intenta generar traducciones utilizando métodos estadísticos basados en corpus de texto bilingües, como el corpus canadiense Hansard, el registro inglés-francés del Parlamento canadiense y EUROPARL, el registro del Parlamento Europeo. Cuando estos corpus están disponibles, se pueden obtener buenos resultados traduciendo textos similares, pero estos corpus son todavía raros en muchos pares de idiomas. El primer software de traducción automática estadística fue CANDIDE de IBM.

En 2005, Google mejoró sus capacidades de traducción interna utilizando aproximadamente 200.000 millones de palabras de materiales de las Naciones Unidas para entrenar su sistema; la precisión de la traducción mejoró Google Translate y otros programas de traducción estadística similares funcionan detectando patrones en cientos de millones de documentos que han sido traducidos previamente por seres humanos y realizando adivinanzas inteligentes basadas en los resultados. En general, cuanto más documentos traducidos por personas están disponibles en un idioma determinado, más probable es que la traducción sea de buena calidad Los enfoques más recientes de la traducción automática estadística, como METIS II y PRESEMT, utilizan un tamaño mínimo de corpus y se centran en la derivación de la estructura sintáctica a través del reconocimiento de patrones. Con un mayor desarrollo, esto puede permitir que la traducción automática estadística funcione a partir de un corpus de texto monolingüe. La mayor desventaja de SMT es que depende de grandes cantidades de textos paralelos, sus problemas con los idiomas ricos en morfología (especialmente con la traducción a dichos idiomas) y su incapacidad para corregir errores de una sola fuente.

 

Traducción automática basada en ejemplos

(EBMT) fue propuesto por Makoto Nagao en 1984 La traducción automática basada en ejemplos se basa en la idea de analogía. En este enfoque, el corpus que se utiliza es el que contiene textos que ya han sido traducidos. En el caso de una frase a traducir, se seleccionan las frases de este corpus que contienen componentes sub-sentenciales similares, las cuales se utilizan para traducir los componentes sub-sentenciales de la frase original al idioma de destino, y estas frases se juntan para formar una traducción completa.

Traducción automática híbrida

(HMT) aprovecha los puntos fuertes de las metodologías de traducción estadística y basada en reglas Varias organizaciones de MT (como Omniscien Technologies (anteriormente Asia Online), LinguaSys, Systran y la Universidad Politécnica de Valencia) afirman tener un enfoque híbrido que utiliza tanto reglas como estadísticas. Los enfoques difieren de varias maneras:

Reglas post-procesadas por las estadísticas: Las traducciones se realizan utilizando un motor basado en reglas. Las estadísticas se utilizan para intentar ajustar/corregir el resultado del motor de reglas.

Estadísticas guiadas por reglas: Las reglas se utilizan para preprocesar los datos en un intento de guiar mejor el motor estadístico. Las reglas también se utilizan para posprocesar la salida estadística para realizar funciones como la normalización. Este enfoque tiene mucho más poder, flexibilidad y control a la hora de traducir. También proporciona un amplio control sobre la forma en que se procesa el contenido, tanto durante la pretraducción (por ejemplo, el marcado del contenido y los términos no traducibles) como durante la postraducción (por ejemplo, las correcciones y ajustes posteriores a la traducción).

Más recientemente, con el advenimiento de la MT neural, está surgiendo una nueva versión de la traducción automática híbrida que combina los beneficios de las reglas, las estadísticas y la traducción automática neural. El enfoque permite beneficiarse del pre y postprocesamiento en un flujo de trabajo guiado por reglas, así como de NMT y SMT. La desventaja es la complejidad inherente que hace que el enfoque sólo sea adecuado para casos de uso específicos. Uno de los proponentes de este enfoque para casos de uso complejo es Omniscien Technologies.

Traducción neural automática

enfoque basado en el aprendizaje profundo de la traducción automática, la traducción neural automática ha progresado rápidamente en los últimos años, y Google ha anunciado que sus servicios de traducción están utilizando esta tecnología en preferencia a sus métodos estadísticos anteriores Otros proveedores, entre los que se incluyen Pangeanic, KantanMT, Omniscien Technologies y SDL, también han anunciado el despliegue de la tecnología de traducción neural automática en 2017.

La traducción automática podría producir algunas frases incomprensibles. Chino roto ""沒有進入"" de la traducción automática en Bali, Indonesia. La frase china rota suena como ""no existe una entrada"" o ""no han entrado todavía.

 

Desambiguación del sentido de la palabra

Se refiere a encontrar una traducción adecuada cuando una palabra puede tener más de un significado. El problema fue planteado por primera vez en la década de 1950 por Yehoshua Bar-Hillel, quien señaló que sin una ""enciclopedia universal"", una máquina nunca podría distinguir entre los dos significados de una palabra, y que hoy en día existen numerosos enfoques diseñados para superar este problema. Pueden dividirse aproximadamente en enfoques ""superficiales"" y enfoques ""profundos"".

Los enfoques superficiales no asumen ningún conocimiento del texto. Simplemente aplican métodos estadísticos a las palabras que rodean a la palabra ambigua. Los enfoques profundos presuponen un conocimiento exhaustivo de la palabra. Hasta ahora, los enfoques superficiales han tenido más éxito.

Claude Piron, traductor de larga data de las Naciones Unidas y la Organización Mundial de la Salud, escribió que la traducción automática, en el mejor de los casos, automatiza la parte más fácil del trabajo de un traductor; la parte más difícil y que requiere más tiempo, por lo general, implica hacer una investigación exhaustiva para resolver las ambigüedades en el texto original, que es lo que las exigencias gramaticales y léxicas del idioma de destino requieren para ser resueltas:

¿Por qué un traductor necesita todo un día de trabajo para traducir cinco páginas, y no una hora o dos? Alrededor del 90% de un texto promedio corresponde a estas condiciones simples. Pero desafortunadamente, está el otro 10%. Es esa parte la que requiere seis horas de trabajo. Hay ambigüedades que hay que resolver. Por ejemplo, el autor del texto fuente, un médico australiano, citó el ejemplo de una epidemia declarada durante la Segunda Guerra Mundial en un ""campo de prisioneros de guerra japonés"". ¿Hablaba de un campo americano con prisioneros japoneses o de un campo japonés con prisioneros americanos? El inglés tiene dos sentidos. Es necesario, por lo tanto, investigar, tal vez hasta el punto de hacer una llamada telefónica a AustraliaEl enfoque profundo ideal requeriría que el software de traducción hiciera toda la investigación necesaria para este tipo de desambiguación por sí solo; pero esto requeriría un grado más alto de inteligencia artificial que el que se ha logrado hasta ahora. Un enfoque superficial que simplemente adivinara el sentido de la ambigua frase en inglés que menciona Piron (basado, tal vez, en qué tipo de campo de prisioneros de guerra se menciona más a menudo en un corpus dado) tendría una posibilidad razonable de adivinar mal con bastante frecuencia. Un enfoque superficial que implique ""preguntar al usuario sobre cada ambigüedad"", según la estimación de Piron, sólo automatizaría alrededor del 25% del trabajo de un traductor profesional, dejando el 75% más difícil aún por hacer por un humano.

Uno de los mayores escollos de la MT es su incapacidad para traducir un lenguaje no estándar con la misma precisión que el lenguaje estándar. La MT basada en heurística o estadística toma información de varias fuentes en forma estándar de un idioma. La traducción basada en reglas, por naturaleza, no incluye usos comunes no estándar. Esto causa errores en la traducción de una fuente vernácula o a un lenguaje coloquial. Las limitaciones de la traducción a partir del habla casual presentan problemas en el uso de la traducción automática en dispositivos móviles.

 

Las entidades de nombre, en sentido estricto, se refieren a entidades concretas o abstractas en el mundo real, incluyendo personas, organizaciones, empresas, lugares, etc. También se refiere a la expresión del tiempo, el espacio, la cantidad, como el 1 de julio de 2011, 79,99 dólares, etc..

Las entidades nombradas aparecen en el texto que se está analizando en la traducción automática estadística. La dificultad inicial que surge al tratar con entidades nombradas es simplemente identificarlas en el texto. Considere la lista de nombres comunes en un idioma en particular para ilustrar esto - los nombres más comunes son diferentes para cada idioma y también están cambiando constantemente.

Si el traductor automático no puede reconocer las entidades nombradas, es posible que se traduzcan erróneamente como sustantivos comunes, lo que probablemente no afectaría la clasificación BLEU de la traducción, pero sí la legibilidad humana del texto También es posible que, si no se identifican, se omitan las entidades nombradas de la traducción final, lo que también tendría implicaciones para la legibilidad y el mensaje del texto.

Otra forma de tratar con entidades nombradas es utilizar la transliteración en lugar de la traducción, lo que significa que se encuentran las letras en el idioma de destino que más se corresponden con el nombre en el idioma de origen. Ha habido intentos de incorporar esto en la traducción automática añadiendo un paso de transliteración en el procedimiento de traducción. Sin embargo, estos intentos todavía tienen sus problemas e incluso han sido citados como un empeoramiento de la calidad de la traducción Las entidades nombradas fueron identificadas incorrectamente, con palabras que no fueron transliteradas cuando debieron serlo o que fueron transliteradas cuando no debieron serlo. Por ejemplo, para ""Southern California"" la primera palabra debe ser traducida directamente, mientras que la segunda palabra debe ser transliterada. Sin embargo, las máquinas a menudo transliteran ambos porque los tratan como una sola entidad. Palabras como estas son difíciles de procesar para los traductores automáticos, incluso para aquellos con un componente de transliteración.

Se ha reconocido que la falta de atención a la cuestión de la traducción de entidades designadas puede deberse a la falta de recursos para dedicarlos a la tarea, además de la complejidad de crear un buen sistema para la traducción de entidades designadas. Un enfoque de la traducción de entidades nombradas ha sido transliterar, y no traducir, esas palabras. Una segunda es crear una lista de ""no traducir"", que tiene el mismo objetivo final: la transliteración en lugar de la traducción.

Un tercer enfoque para una traducción exitosa de entidades nombradas es un modelo basado en clases. En este método, las entidades nombradas se sustituyen por un token para representar la clase a la que pertenecen. Por ejemplo, ""Ted"" y ""Erica"" serían sustituidos por un token de clase ""persona"". De esta manera se puede analizar la distribución estadística y el uso de los nombres de las personas en general en lugar de mirar las distribuciones de ""Ted"" y ""Erica"" individualmente. Un problema que el modelo basado en clases resuelve es que la probabilidad de un nombre dado en un idioma específico no afectará la probabilidad asignada de una traducción. Un estudio de Stanford sobre la mejora de esta área de la traducción da ejemplos de que se asignarán diferentes probabilidades a ""David va a dar un paseo"" y ""Ankit va a dar un paseo"" para el inglés como lengua de destino debido al diferente número de ocurrencias para cada nombre en los datos de formación. Un resultado frustrante del mismo estudio de Stanford (y otros intentos de mejorar la traducción del reconocimiento nominal) es que muchas veces, una disminución en las puntuaciones BLEU para la traducción resultará de la inclusión de métodos para la traducción de entidades nominal.

Se ha trabajado en la utilización de corpus multiparalelos, es decir, un cuerpo de texto que ha sido traducido a 3 o más idiomas. Utilizando estos métodos, un texto que ha sido traducido a 2 o más idiomas puede ser utilizado en combinación para proporcionar una traducción más precisa a un tercer idioma en comparación con si sólo se utilizara uno de esos idiomas de origen.

Una ontología es una representación formal del conocimiento que incluye los conceptos (como objetos, procesos, etc.) en un dominio y algunas relaciones entre ellos. Si la información almacenada es de naturaleza lingüística, se puede hablar de un léxico En PNL, las ontologías pueden ser utilizadas como fuente de conocimiento para los sistemas de traducción automática. En los siguientes ejemplos clásicos, como humanos, somos capaces de interpretar la frase preposicional de acuerdo con el contexto porque usamos nuestro conocimiento del mundo, almacenado en nuestros léxicos:

Un sistema de traducción automática inicialmente no podría diferenciar entre los significados porque la sintaxis no cambia. Con una ontología lo suficientemente grande como fuente de conocimiento, sin embargo, las posibles interpretaciones de palabras ambiguas en un contexto específico pueden ser reducidas.

 

Construyendo ontologías

La ontología generada para el sistema de traducción automática basada en el conocimiento PANGLOSS en 1993 puede servir como ejemplo de cómo se puede compilar una ontología para fines de PNL:.

Una ontología a gran escala es necesaria para ayudar al análisis en los módulos activos del sistema de traducción automática.

En el ejemplo de PANGLOSS, se pretendía que unos 50.000 nodos quedaran subsumidos en la región superior (abstracta) más pequeña de la ontología, construida manualmente. Debido a su tamaño, tuvo que ser creado automáticamente.

El objetivo era fusionar los dos recursos LDOCE online y WordNet para combinar los beneficios de ambos: definiciones concisas de Longman, y relaciones semánticas que permitieran la taxonomización semiautomática a la ontología de WordNet. Utilizando una matriz de similitud, el algoritmo suministrado coincide con los significados, incluyendo un factor de confianza. Por lo tanto, se creó un segundo algoritmo de correspondencia jerárquica que utiliza las jerarquías taxonómicas que se encuentran en WordNet (jerarquías profundas) y parcialmente en LDOCE (jerarquías planas). Esto funciona primero haciendo coincidir significados inequívocos, luego limitando el espacio de búsqueda sólo a los respectivos antepasados y descendientes de esos significados coincidentes. Así, el algoritmo coincidía con significados localmente inequívocos (por ejemplo, mientras que la palabra sello como tal es ambigua, sólo hay un significado de ""sello"" en la subjerarquía animal).

Ambos algoritmos se complementaron entre sí y ayudaron a construir una ontología a gran escala para el sistema de traducción automática. Las jerarquías de WordNet, junto con las definiciones correspondientes de LDOCE, estaban subordinadas a la región superior de la ontología. Como resultado, el sistema PANGLOSS MT pudo hacer uso de esta base de conocimiento, principalmente en su elemento de generación.

Si bien ningún sistema proporciona el santo grial de la traducción automática totalmente automática de alta calidad de textos sin restricciones, muchos sistemas totalmente automatizados producen una producción razonable La calidad de la traducción automática mejora sustancialmente si el dominio está restringido y controlado.

A pesar de sus limitaciones inherentes, los programas de TA se utilizan en todo el mundo. Probablemente el mayor usuario institucional sea la Comisión Europea. El proyecto MOLTO, por ejemplo, coordinado por la Universidad de Gotemburgo, recibió más de 2,375 millones de euros de apoyo a proyectos de la UE para crear una herramienta de traducción fiable que cubra la mayoría de los idiomas de la UE El mayor desarrollo de los sistemas de traducción automática se produce en un momento en que los recortes presupuestarios en la traducción humana pueden aumentar la dependencia de la UE de programas de traducción automática fiables.42] La Comisión Europea contribuyó con 3.072 millones de euros (a través de su programa ISA) para la creación de MT@EC, un programa de traducción automática estadística adaptado a las necesidades administrativas de la UE, que sustituye a un sistema anterior de traducción automática basado en normas.

El motor de traducción estadística utilizado en las herramientas lingüísticas de Google para el árabe <->inglés y el chino <->inglés obtuvo una puntuación global de 0,4281 sobre la puntuación BLEU-4 de IBM de 0,3954 (verano de 2006) en las pruebas realizadas por el Instituto Nacional de Estándares y Tecnología.

Con el reciente enfoque en el terrorismo, las fuentes militares en los Estados Unidos han estado invirtiendo cantidades significativas de dinero en ingeniería de lenguaje natural.

In-Q-Tel (un fondo de capital de riesgo, financiado en gran parte por la Comunidad de Inteligencia de Estados Unidos, para estimular las nuevas tecnologías a través de empresarios del sector privado) creó empresas como Language Weaver. Actualmente, la comunidad militar está interesada en la traducción y procesamiento de idiomas como el árabe, el pashto y el dari Dentro de estos idiomas, el enfoque se centra en las frases clave y la comunicación rápida entre los miembros del ejército y los civiles a través del uso de aplicaciones de telefonía móvil La Oficina de Tecnología de Procesamiento de la Información de DARPA alberga programas como TIDES y el traductor de Babylon. La Fuerza Aérea de EE.UU. ha adjudicado un contrato de un millón de dólares para desarrollar una tecnología de traducción de idiomas.

El notable aumento de las redes sociales en la web en los últimos años ha creado otro nicho para la aplicación de software de traducción automática - en utilidades como Facebook, o clientes de mensajería instantánea como Skype, GoogleTalk, MSN Messenger, etc. - permitiendo a los usuarios que hablan diferentes idiomas comunicarse entre sí. También se han lanzado aplicaciones de traducción automática para la mayoría de los dispositivos móviles, incluyendo teléfonos móviles, PCs de bolsillo, PDAs, etc. Debido a su portabilidad, estos instrumentos han llegado a ser designados como herramientas de traducción móvil que permiten la creación de redes de negocios móviles entre socios que hablan diferentes idiomas, o que facilitan tanto el aprendizaje de idiomas extranjeros como los viajes no acompañados a países extranjeros sin la necesidad de la intermediación de un traductor humano.

A pesar de haber sido calificado como un competidor indigno de la traducción humana en 1966 por el Comité Asesor para el Procesamiento Automatizado de Lenguas, creado por el gobierno de los Estados Unidos, la calidad de la traducción automática ha mejorado hasta el punto de que su aplicación en la colaboración en línea y en el campo médico está siendo investigada. La aplicación de esta tecnología en entornos médicos donde los traductores humanos están ausentes es otro tema de investigación, pero surgen dificultades debido a la importancia de las traducciones precisas en los diagnósticos médicos.

 

Evaluación de la traducción automática

Hay muchos factores que afectan la forma en que se evalúan los sistemas de traducción automática. Estos factores incluyen el uso previsto de la traducción, la naturaleza del software de traducción automática y la naturaleza del proceso de traducción.

Diferentes programas pueden funcionar bien para diferentes propósitos. Por ejemplo, la traducción automática estadística (SMT) suele superar a la traducción automática basada en ejemplos (EBMT), pero los investigadores descubrieron que cuando se evalúa la traducción del inglés al francés, la EBMT funciona mejor El mismo concepto se aplica a los documentos técnicos, que pueden ser traducidos más fácilmente por SMT debido a su lenguaje formal.

En ciertas aplicaciones, sin embargo, por ejemplo, las descripciones de productos escritas en un lenguaje controlado, un sistema de traducción automática basado en diccionarios ha producido traducciones satisfactorias que no requieren intervención humana, excepto para la inspección de calidad.

Existen varios medios para evaluar la calidad de los resultados de los sistemas de traducción automática. El más antiguo es el uso de jueces humanos para evaluar la calidad de una traducción. Aunque la evaluación humana lleva mucho tiempo, sigue siendo el método más fiable para comparar diferentes sistemas, como los sistemas basados en reglas y los sistemas estadísticosLos medios automatizados de evaluación incluyen BLEU, NIST, METEOR y LEPOR.

Confiar exclusivamente en la traducción automática sin editar ignora el hecho de que la comunicación en el lenguaje humano está integrada en el contexto y que se necesita una persona para comprender el contexto del texto original con un grado razonable de probabilidad. Es cierto que incluso las traducciones generadas por el ser humano son propensas al error. 58] El difunto Claude Piron escribió que la traducción automática, en el mejor de los casos, automatiza la parte más fácil del trabajo de un traductor; la parte más difícil y que requiere más tiempo, por lo general, implica hacer una extensa investigación para resolver ambigüedades en el texto original, que requieren resolver las exigencias gramaticales y léxicas del idioma de destino.

Tal investigación es un preludio necesario a la pre-edición necesaria para proporcionar información para el software de traducción automática de tal manera que la salida no carezca de sentido.

Además de los problemas de desambiguación, se puede producir una disminución de la precisión debido a los diferentes niveles de datos de formación para los programas de traducción automática. Tanto la traducción automática basada en ejemplos como la estadística se basan en una amplia gama de frases de ejemplo reales como base para la traducción, y cuando se analizan demasiadas o muy pocas frases se pone en peligro la precisión. Los investigadores encontraron que cuando un programa es entrenado en 203,529 pares de oraciones, la precisión realmente disminuye El nivel óptimo de datos de entrenamiento parece ser un poco más de 100,000 oraciones, posiblemente porque a medida que los datos de entrenamiento aumentan, el número de oraciones posibles aumenta, lo que hace más difícil encontrar una correspondencia exacta entre las traducciones.

Aunque ha habido preocupaciones sobre la precisión de la traducción automática, la Dra. Ana Nino de la Universidad de Manchester ha investigado algunas de las ventajas de utilizar la traducción automática en el aula. Uno de estos métodos pedagógicos se llama ""MT como un mal modelo"" La MT como un mal modelo obliga al estudiante a identificar inconsistencias o aspectos incorrectos de una traducción; a su vez, el individuo (ojalá) posea un mejor dominio del idioma. El Dr. Nino cita que esta herramienta de enseñanza fue implementada a finales de la década de 1980. Al final de varios semestres, el Dr. Nino pudo obtener resultados de encuestas de estudiantes que habían usado la MT como un mal modelo (así como otros modelos). En su mayoría, los estudiantes sintieron que habían observado una mejora en la comprensión, la recuperación léxica y una mayor confianza en su lengua meta.

 

Traducción automática de lenguajes de signos

principios de la década de 2000, las opciones de traducción automática entre los lenguajes hablados y los lenguajes de signos eran muy limitadas. Era una creencia común que las personas sordas podían utilizar traductores tradicionales. Sin embargo, el estrés, la entonación, el tono y el tiempo se transmiten de forma muy diferente en los idiomas hablados que en los de signos. Por lo tanto, un individuo sordo puede malinterpretar o confundirse sobre el significado de un texto escrito que se basa en una lengua hablada.

Los investigadores Zhao, et al. (2000), desarrollaron un prototipo llamado TEAM (traducción del inglés al ASL por máquina) que completó las traducciones del inglés al lenguaje de signos americano (ASL). El programa analizaría primero los aspectos sintácticos, gramaticales y morfológicos del texto en inglés. Siguiendo este paso, el programa accedió a un sintetizador de signos, que actuaba como un diccionario para ASL. Este sintetizador contenía el proceso que uno debe seguir para completar los signos de ASL, así como los significados de estos signos. Una vez analizado todo el texto y localizados en el sintetizador los signos necesarios para completar la traducción, aparece un humano generado por computadora que utilizaría ASL para firmar el texto en inglés al usuario.

Sólo las obras originales están sujetas a la protección de los derechos de autor, por lo que algunos estudiosos afirman que los resultados de la traducción automática no tienen derecho a la protección de los derechos de autor porque la traducción automática no implica creatividad El derecho de autor en cuestión es para una obra derivada; el autor de la obra original en el idioma original no pierde sus derechos cuando se traduce una obra: un traductor debe tener permiso para publicar una traducción.

 


  ELIGE TU TEMA DE INTERÉS: 


autoayuda.es   Internet y Tecnologias 

Está aquí: Inicio > [ INTERNET ] > ıllı Google traductor/translate: que es, definición y significado, clasico, ingles a español

Las cookies nos permiten ofrecer nuestros servicios. Al utilizar nuestros servicios, aceptas el uso que hacemos de las cookies. Ver políticas