ıllı Internet y Tecnologías de la Información (2018)

internet, Hosting, dominios, seo, antivirus, banco de imágenes, páginas web, tiendas online

[Enciclopedia Online Gratuita] Diccionario de Internet y Tecnologías de la Información y la Comunicación (TIC):

ıllı Desambiguación léxica basada en ventana deslizante : que es, definición y significado, descargar videos y fotos.

videos internet

salud  ıllı Desambiguación léxica basada en ventana deslizante : que es, definición y significado, descargar videos y fotos.  


La desambiguación léxica basada en ventana deslizante es un procedimiento para desambiguación léxica. La desambiguación léxica asigna la categoría gramatical adecuada a cada palabra de un texto.


Un porcentaje esencial (típicamente alrededor del treinta por ciento , mas en dependencia del idioma) de las palabras en lenguaje natural son palabras a las que, con independencia del contexto, se les puede asignar más de una análisis morfológico. La adecuada resolución de este género de vaguedad es vital en la mayor parte de aplicaciones de procesamiento del lenguaje natural. Por servirnos de un ejemplo, en traducción automática, la traducción equivalente de un término puede ser diferente dependiendo de la categoría gramatical de la palabra.


El etiquetador basado en ventana deslizante es un sistema que asigna una categoría gramatical a una palabra, basado en la información que da una ventana de tamaño fijo formada por las palabras en torno a la palabra que queremos desambiguar.


Sus iniciales en inglés serían SWPoST (Sliding Window Part-of-Speech Tagger).


Sus 2 primordiales ventajas serían:



  • se puede adiestrar de manera automática, eludiendo el etiquetado manual de un corpus
  • este etiquetador se puede incorporar como un androide de estados finitos (una Máquina de Mealy).

Sea G = G el conjunto de etiquetas de la aplicación, esto es, el conjunto de posibles etiquetas que se puede asignar a una palabra, y W = undefined el léxico de la aplicación. Sea T : W ? ?(G) una función de análisis morfológico que asigna a cada palabra w su conjunto de posibles etiquetados T(w) ? G, que puede ser incorporada a través de un lexicón o bien un analizador morfológico. Sea S = el conjunto de clases de palabras, que generalmente va a ser una partición de W con la única limitación de que, para toda s ? S todas y cada una de las palabras w S s reciban exactamente el mismo conjunto de eiquetados, o sea,, todas y cada una de las palabras en casa clase de palabra (s) pertenezcan a exactamente la misma clase de vaguedad. En general se edifica S de forma que, para palabras con alta frecuencia de aparación, cada clase de palabras contiene una sola palabra, al paso que para palabras con poca frecuencia, cada clase de palabras se hace corresponder precisamente con una clase de vaguedades, lo que deja un genial funcionamiento con las palabras equívocas más usuales, al unísono que no son precisos demasiados factores para el funcionamiento del etiquetador.


Con estas deficiones se puede proponer el inconveniente del etiquetador léxico de la próxima forma: dado un texto ww...w ? W*, se le asigna a cada palabra w (a través de un lexicon o bien un analizador morfológico) una clase de palabra T(w) ? S para conseguir un texto etiquetado con ambigüedad ss...s ? W*. La función del etiquetador léxico es conseguir un texto etiquetado ??...? (con ? ? T(s)) lo más adecuado posible.


Un etiquetador estadístico busca el etiquetado léxico 'más probable' de un texto ss...s etiquetado ambiguamente:

?*…?*=argmax??T(s)p(?…?s…s)undefined

que a través de la fórmula de Bayes se transforma en:

?*…?*=argmax??T(s)p(?…?)p(s…s?…?)undefined

donde p(??...?) es la probabilidad de un etiquetado particularmente (probabilidad sintáctica) y p(s...s?...?) es la probabilidad de que ese etiquetado sea el pertinente al texto s...s (probabilidad léxica).


En un Modelo de Markov estas probabilidades se acercan como productos. Las probabilidades sintácticas se modelan a través de un proceso de Markov de primer orden:

p(??…?)=?t=1t=Lp(??)undefined

donde ? y ? son símbolos delimitadores.


Las probabilidades léxicas son independientes del contexto:

p(ss…s??…?)=?t=1t=Lp(s?)undefined

Una forma de etiquetado es acercar la primera fórmula de probabilidad:

p(ss…s??…?)=?t=1t=Lp(?C(-)sC(+))undefined

donde C(-)=ss…sundefined es el 'contexto izquierdo' de tamaño N(-)


y


es el 'contexto derecho' de tamaño N(+).


De este modo el algoritmo de ventana deslizante solo tiene presente un contexto de tamaño N(-)+N(+)+1. Para la mayor parte de las aplicaciones N(-)=N(+)=1. Por poner un ejemplo para etiquetar la palabra equívoca 'vino' en la oración 'el vino de Alicante', se tendría presente el etiquetado de las palabras 'el' y 'de'.


  ELIGE TU TEMA DE INTERÉS: 


autoayuda.es   Internet y Tecnologias 

Está aquí: Inicio > [ INTERNET ] > ıllı Desambiguación léxica basada en ventana deslizante : que es, definición y significado, descargar videos y fotos.

Las cookies nos permiten ofrecer nuestros servicios. Al utilizar nuestros servicios, aceptas el uso que hacemos de las cookies. Ver políticas