ıllı Internet y Tecnologías de la Información (2018)

internet, Hosting, dominios, seo, antivirus, banco de imágenes, páginas web, tiendas online

[Enciclopedia Online Gratuita] Diccionario de Internet y Tecnologías de la Información y la Comunicación (TIC):

ıllı Desambiguación lingüística wiki: info, historia y vídeos

videos internet

salud  Desambiguación lingüística 


En el campo de la lingüística computacional, la desambiguación del significado de las palabras es un inconveniente abierto de procesamiento del lenguaje natural, que incluye el proceso de identificar con qué sentido se utiliza una palabra en los términos de una oración, o bien cuando la palabra en cuestión tiene polisemia, esto es, una pluralidad de significados.


La solución de este inconveniente afecta a otras labores de la lingüística computacional, como el alegato, la mejora de la relevancia en los buscadores web, la resolución de referencia, la congruencia textual (lingüística), la inferencia, y otros.


Si se consideran 2 ejemplos de los diferentes significados que existen para la palabra "candela":



  1. Cilindro de cera o bien sebo, atravesado por una mecha que se prende para iluminar.
  2. Pieza de tela o bien cuadro fuerte que, atada a las vergas, recibe el viento que impulsa la nave.

y las oraciones:



  1. Puso 2 candelas a San Pancracio.
  2. Los egipcios fueron los primeros constructores de navíos de candela de los que se tiene nueva.

Desarrollo de algoritmos


Para un humano, resulta obvio que en la primera oración se utilice la palabra "candela", como primer significado, y en la segunda oración, la palabra "candela" es empleada con el segundo. El desarrollo de algoritmos para reproducir esta capacidad humana (desambiguar el significado) de forma frecuente puede ser una labor realmente difícil.


Relación entre los significados


En casos como el presentado, por lo menos ciertos significados son diferentes. No obstante, en otros casos los diferentes significados pueden estar de manera estrecha relacionados (siendo un significado una extensión metafóricametonímica de otro) y, en semejantes casos, la división de las palabras a sus significados se vuelve todavía considerablemente más bastante difícil.


Diccionarios y tesauros


Los diccionarios y los thesarus dan diferentes divisiones de las palabras en sus significados. Una solución que ciertos estudiosos han utilizado consiste en escoger un diccionario particular, y solo emplear el conjunto de significados allá registrados. No obstante, los resultados de la búsqueda al usar distinciones más extensas en los significados han sido mucho mejores.


Varianza del juez interno: granularidad fina y gruesa


Otro inconveniente es la varianza del juez interno. Los sistemas de desambiguación del significado de la palabra (WSD, por sus iniciales en inglés, word sense disambiguation) en general se ponen a prueba al cotejar sus resultados con los de un humano. No obstante, si se da una lista de significados y oraciones, los humanos no siempre y en toda circunstancia van a coincidir exactamente en qué palabra pertenece a qué significado. No se puede aguardar que una computadora ofrezca un mejor desempeño en esa labor que un humano (en verdad, en tanto que los humanos sirven como estándar, el hecho de que el PC sea mejor que el humano carece de sentido), con lo que el desempeño humano marcha como un límite superior. El desempeño humano, no obstante, es mucho mejor en granularidad gruesa que en granularidad fina, conque otra vez esta es la razón con lo que la investigación sobre las distinciones sobre granularidad gruesa es más útil.


Inteligencia artificial y sentido común


Algunos estudiosos sobre inteligencia artificial, como Douglas Lenat, arguyen que no se pueden examinar los significados de las palabras sin alguna forma de ontología de los pies en el suelo. Por servirnos de un ejemplo, compárense estas 2 oraciones:


"Jill y María son hermanas." - (Son hermanas entre sí.) "Jill y María son madres." - (Cada una es independientemente una madre.)


Para identificar adecuadamente los significados de las palabras, hay que conocer los hechos de los pies en el suelo. Además de esto, en ocasiones el los pies en el suelo es preciso para quitar la vaguedad de palabras como los pronombres, en el caso de que tengan anáforas o bien catáforas en el texto.


Como en todo procesamiento del lenguaje natural, existen 2 enfoques primordiales para la desambiguación del significado de la palabra: enfoque profundo y enfoque superficial.


Enfoque profundo


El enfoque profundo supone el acceso a un extenso conjunto de conocimiento del planeta, que deja determinar exactamente en qué sentido se usa la palabra. Estos enfoques no son muy triunfantes en la práctica, eminentemente por el hecho de que tal cuerpo de conocimientos no existe en un formato inteligible por el ordenador, fuera de campos limitadísimos. No obstante, si ese conocimiento sí existe, entonces los enfoques profundos serían considerablemente más precisos que los enfoques superficiales. Además de esto, hay una larga tradición en la lingüística computacional, de tratar estos enfoques en concepto de conocimientos codificados y en ciertos casos, es bastante difícil decir con claridad si el conocimiento en cuestión es lingüístico o bien conocimiento del planeta. El primer intento fue el de Margaret Masterman y sus colegas, en la Unidad de investigación del Lenguaje de Cambridge, en Inglaterra, en la década de mil novecientos cincuenta. Este intento de emplear como dato una tarjeta horadada, versión del diccionario de sinónimos de Roget y sus cabezas numeradas, como un indicador de los temas y espera para las reiteraciones en el texto, usando un algoritmo de intersección de conjuntos. No tuvo mucho éxito, como lo describen detalladamente Y. Wilks y sus cooperadores (mil novecientos noventa y seis), mas tenía una relación fuerte con el trabajo venidero, singularmente la máquina de Yarowsky para el aprendizaje de optimización de un procedimiento de diccionarios de sinónimos en la década de mil novecientos noventa.


Enfoques superficiales


Los enfoques superficiales no tratan de comprender el texto, sino consideran las palabras circundantes, usando la información como "si candela tiene las palabras mar o bien la pesca cerca, seguramente lo es en el sentido de los peces, y si candela tiene las palabras música o bien canción cerca, probablemente sea en el sentido de la música".Estas reglas se pueden conseguir de forma automática por la computadora, usando un corpus de capacitación de palabras con el sentido de las palabras. Este enfoque, teóricamente tan poderoso como los enfoques profundos, da mejores resultados en la práctica, debido al limitado conocimiento del planeta del PC. No obstante, puede ser confundido por otras oraciones.


Clasificadores de Bayes y árboles de decisión


Estos criterios establecen reglas de trabajo a través de la definición de N palabras del contenido en torno a la vaguedad de cada palabra en el cuerpo, y el análisis estadístico de las N palabras alrededor. 2 enfoques poco profundos empleados son los clasificadores de Bayes y árboles de resolución. En una investigación reciente, los métodos basados en el kernel como, por poner un ejemplo, las máquinas de soporte vectorial, han probado un desempeño superior en el aprendizaje supervisado. Mas en los últimos tiempos no ha habido ninguna mejora en el desempeño de ninguno de estos métodos.


La palabra problema


Es instructivo equiparar la palabra inconveniente en sentido de desambiguación con el inconveniente de la una parte del alegato. Las dos implican vaguedades o bien etiquetado de las palabras, así sea con los sentidos o bien de unas partes de la oración. No obstante, los algoritmos empleados para uno no acostumbran a marchar bien para el otro, primordialmente pues la una parte del alegato de una palabra está determinada primordialmente por las 2 o bien 3 de forma inmediata lindantes, al paso que el sentido de una palabra puede ser determinado por palabras más distanciadas. La tasa de éxito para parte de los algoritmos de alegato es hoy día considerablemente mayor que la de WSD (la técnica está en torno al noventa y cinco por ciento de precisión o bien mejor, en comparación con menos del setenta y cinco por ciento de precisión en la desambiguación de palabras con aprendizaje supervisado). Estas cantidades son comunes en inglés, y pueden ser muy, muy diferentes en otros idiomas.


Disponibilidad de datos de entrenamiento


Otro aspecto de la desambiguación del sentido de la palabra que la hace diferente es la disponibilidad de datos de adiestramiento. Aunque los usuarios pueden memorizar todas y cada una de las posibles palabras de las unas partes del alegato, es imposible para las personas memorizar todos y cada uno de los sentidos que una palabra puede tener. De esta forma, muchos algoritmos usan semi-aprendizaje supervisado en la desambiguación en el sentido de la palabra, que deja tanto los datos etiquetados como los que no lo están. El algoritmo de Yarowsky fue un caso de ese género de algoritmo, en el que las palabras tienden a exhibir un solo sentido en el alegato más específico y en una colocación determinada.


  ELIGE TU TEMA DE INTERÉS: 


autoayuda.es   Internet y Tecnologias 

Está aquí: Inicio > [ INTERNET ] > ıllı Desambiguación lingüística wiki: info, historia y vídeos

Las cookies nos permiten ofrecer nuestros servicios. Al utilizar nuestros servicios, aceptas el uso que hacemos de las cookies. Ver políticas