ıllı Internet y Tecnologías de la Información (2018)

internet, Hosting, dominios, seo, antivirus, banco de imágenes, páginas web, tiendas online

[Enciclopedia Online Gratuita] Diccionario de Internet y Tecnologías de la Información y la Comunicación (TIC):

ıllı Etiquetado gramatical : que es, definición y significado, descargar videos y fotos.

videos internet

salud  ıllı Etiquetado gramatical : que es, definición y significado, descargar videos y fotos.  


En lingüística computacional, el etiquetado gramatical (conocido asimismo por su nombre en inglés, part-of-speech tagging, POS tagging o bien POST) es el proceso de asignar (o bien etiquetar) a cada una de las palabras de un texto su categoría gramatical. Este proceso se puede efectuar conforme con la definición de la palabra o bien el contexto en que aparece, por servirnos de un ejemplo su relación con las palabras lindantes en una oración, oración (como efectúa el desambiguador léxico en ventana deslizante), o bien en un parágrafo.


Uno de los usos de este etiquetado tiene sitio en el contexto de la lingüística computacional, a través de la utilización de algoritmos que efectúan el etiquetado a través de etiquetas gráficas predefinidas.


El etiquetado morfológico es más complejo de lo que semeja a primer aspecto, puesto que no se reduce a tener una lista de palabras y sus pertinentes categorías gramaticales, pues ciertas palabras pueden tener diferentes categorías gramaticales dependiendo del contexto en que aparecen. Este hecho acostumbra a suceder de manera frecuente en el lenguaje natural (al revés que con los lenguajes artificiales), donde un sinnúmero de las palabras son equívocas. Por poner un ejemplo, la palabra 'dado' puede ser un nombre singular o bien una forma del verbo 'dar'.

Véase también:Lingüística computacional

Las soluciones propuestas en la literatura para el etiquetado léxico se pueden dividir en 2 grandes conjuntos fundamentados en el aprendizaje automático: 'Aproximaciones Lingüísticas' basadas en un conjunto de reglas establecidas manualmente por especialistas o bien aprendidas de forma (semi)automática, y las 'Aproximaciones de Aprendizaje Automático' (basadas en corpus) que emplean textos, normalmente anotados con información lingüística para establecer los modelos latentes. Asimismo se pueden localizar 'Aproximaciones Híbridas' que combinan determinados aspectos de las precedentes.


Aproximaciones Lingüísticas


Estas aproximaciones engloban las primeras tentativas de resolución de la vaguedad léxica en los años sesenta y setenta. Los primeros etiquetadores?? estaban compuestos por un conjunto de reglas, escritas manualmente por lingüistas, con el objeto de limitar o bien pronosticar las posibles categorías de una palabra. En estas aproximaciones está el sistema TAGGIT, que fue empleado para la construcción de grandes corpus como el 'Brown'.?


El inconveniente de estos sistemas es que eran absolutamente dependientes de la lengua para la que se habían desarrollado, y requerían un enorme costo humano para la definición de las reglas. Además de esto empleaban un léxico muy limitado, con lo que aparecían muchas situaciones no contempladas. Debido a esto, la cobertura (conjunto de casos de vaguedad contemplados en las reglas) era baja, y se complicaba enormemente la exportación de las reglas a otros idiomas.


A pesar de que el ahínco humano requerido por estas aproximaciones es muy elevado, la primordial ventaja es que se edifican modelos de lenguaje desde determinado punto de vista lingüístico, con lo que se pueden incluir muchas y complejas fuentes de información, bastante difíciles de apresar de forma automática. Este hecho las hace más expresivas, con lo que generalmente, acostumbran a suministrar mejores posibilidades en labores de desambiguación si se equiparan con otro género de aproximaciones.


Aproximaciones de Aprendizaje Automático


Estas aproximaciones edifican un modelo de lenguaje usando métodos de aprendizaje desde datos. Estas aproximaciones difieren entre sí en el procedimiento de aprendizaje y en la dificultad del modelo construido. Son muchos los formalismos utilizados: Modelos de Markov o bien n-gramas, reglas de transformación, árboles de resolución, redes neuronales, robots y transductores de estados finitos, etc.


La aproximación más usada son los Modelos de Markov Ocultos o bien n-gramas.


Esta técnica consiste en edificar un modelo de lenguaje estadístico, que se emplea para conseguir, desde una oración de entrada, la secuencia de etiquetados léxicos que tiene mayor probabilidad. Por poner un ejemplo, si hemos etiquetado una palabra como artículo, la próxima palabra va a ser un nombre con un cuarenta por ciento de probabilidad, un adjetivo con otro cuarenta por ciento y un número el veinte por ciento sobrante. Conociendo esta información, un sistema puede decidir que la palabra "vino" en la oración "el vino" resulta más probable que sea un nombre a que sea un verbo.


Algunos MMO más avanzados aprenden las probabilidades de pares, triples e inclusive secuencias más largas. Por servirnos de un ejemplo, si terminamos de etiquetar un artículo y un verbo, la próxima palabra seguramente va a ser una preposición, un artículo o bien un nombre, mas difícilmente va a ser otro verbo.


Cuando aparecen múltiples palabras equívocas juntas, las posibilidades se multiplican. No obstante, se puede calcular la probabilidad de cada secuencia de posibles etiquetados y elegir la secuencia de etiquetados con mayor probabilidad. El etiquetador CLAWS emplea este sistema y logra un porcentaje de aciertos en el rango noventa y tres-noventa y cinco por ciento .


El inconveniente de CLAWS es estimar todos y cada uno de los posibles etiquetados, lo que aumenta el tiempo de generación del etiquetado. En mil novecientos ochenta y siete Steve DeRose y Ken Church desarrollaron sendos algoritmos de programación activa afines al Algoritmo de Viterbi que reducían enormemente el tiempo de etiquetado. Los dos algoritmos alcanzaron un porcentaje de aciertos de alrededor del noventa y cinco por ciento .


  ELIGE TU TEMA DE INTERÉS: 


autoayuda.es   Internet y Tecnologias 

Está aquí: Inicio > [ INTERNET ] > ıllı Etiquetado gramatical : que es, definición y significado, descargar videos y fotos.

Las cookies nos permiten ofrecer nuestros servicios. Al utilizar nuestros servicios, aceptas el uso que hacemos de las cookies. Ver políticas