ıllı Internet y Tecnologías de la Información (2018)

internet, Hosting, dominios, seo, antivirus, banco de imágenes, páginas web, tiendas online

[Enciclopedia Online Gratuita] Diccionario de Internet y Tecnologías de la Información y la Comunicación (TIC):

ıllı Búsqueda y recuperación de información wiki: info, historia y vídeos

videos internet

salud  Búsqueda y recuperación de información 


Para el término sicológico, véase Restauración (memoria).

La Busca y Restauración de Información, llamada en inglés Information Search and Retrieval (ISR), es la ciencia de la busca de información en documentos electrónicos y cualquier clase de compilación reportaje digital, encargada de la busca en estos mismos, busca de metadatos que describan documentos, o bien asimismo la busca en bases de datos relacionales, así sea por medio de internet, una intranet, y como objetivo efectúa la restauración en textos, imágenes, sonido o bien datos de otras peculiaridades, de forma pertinente y relevante.


La restauración de información es una investigación interdisciplinario. Cubre tantas disciplinas que eso produce en general un conocimiento parcial desde solo una o bien otra perspectiva. Ciertas disciplinas que se encargan de estos estudios son la sicología cognitiva, la arquitectura de la información, diseño de la información, inteligencia artificial, lingüística, semiótica, informática, biblioteconomía, archivística y documentación.


Para lograr su objetivo de restauración se sosten en los sistemas de información, y siendo de carácter multidisciplinario intervienen bibliotecólogos para determinar criterio de busca, la relevancia y pertinencia de los términos, en conjunto con la informática.


La idea del empleo de computadoras para la busca de pedazos relevantes de información se popularizó a causa de un artículo As We May Think de Vannevar Bush en el año mil novecientos cuarenta y cinco. Los primeros sistemas automatizados de restauración de la información fueron presentados a lo largo de la década de mil novecientos cincuenta a mil novecientos sesenta. A lo largo de mil novecientos setenta se paralizaronn pruebas un conjunto de textos como la compilación Cranfield para un elevado número de diferentes técnicas cuyo desempeño fue bueno. Los sistemas de restauración a larga escala, como el Sistema de Diálogo Lockheed, empezaron a emplearse a inicios de mil novecientos setenta.


En mil novecientos noventa y dos, el Departamento de Defensa de los USA juntamente con el Instituto Nacional de Estándares y Tecnología (NIST por su inicial en inglés), patrocinaron la Conferencia de Restauración de Texto (TREC) como una parte del programa TIPSTER. Esto proveyó ayuda desde la comunidad de restauración de la información al proveer la infraestructura precisa para la evaluación de metodologías de restauración de texto en una compilación a larga escala. La introducción de buscadores web ha elevado todavía más la necesidad de sistemas de restauración con mayor capacidad.


El empleo de métodos digitales para guardar y recobrar información ha desembocado en el llamado fenómeno de la obsolescencia digital, que sucede en el momento en que una fuente digital deja de ser alcanzable pues sus medio físico, el lector usado para la lectura de ese medio o bien el software que lo controla, ya no se halla libre. La información, en un inicio es más simple de recobrar en vez de su fuente en papel, mas dicha información entonces, se pierde claramente.


Los motores de búsqueda, como Google, Google Desktop Search, Lycos y Copernic, son ciertas aplicaciones más populares para la restauración de información. Esencialmente hay que edificar un Léxico, que es una lista de términos en lenguaje natural, un algoritmo que incluya las reglas lógicas de la busca y una valoración de los resultados o bien cantidad de información conseguida o bien posible. Este motor de busca es el que deja proponer una pregunta con no menos de 2 términos (en algunos casos pueden ser menos de 2 términos) y enseñar los resultados mínimos y el logaritmo natural de las interactúes va a ser en torno a 789


Algunos de los estudiosos más señalados en esta subdisciplina son Gerard Salton, W Bruce Croft, Karen Spärck Jones, Keith van Rijsbergen y Ricardo Baeza-Yates.


A veces se proponen algunos inconvenientes en el momento de recobrar información provocados por el empleo del lenguaje natural (entre otras muchas razones) como el silencio (debido a la homonimia), el estruendos (debido a la polisemia), homografía, vaguedad, etc.


Un proceso de restauración de información empieza en el momento en que un usuario hace una consulta al sistema. Una consulta por su parte es una aseveración formal de la necesidad de una información. En la restauración de información una consulta no identifica solamente a un objeto en la compilación. En verdad múltiples objetos pueden ser contestación a una consulta con diferentes grados de relevancia.


Un objeto es una identidad que está representada por información en una base de datos. Dependiendo de la aplicación estos objetos pueden ser ficheros de texto, imágenes, audio, mapas, vídeos, etcétera Muy con frecuencia los documentos no están guardados en el sistema de restauración de información, sino están representados como es lógico.


La mayoría de los sistemas de restauración de información computan un ranking para saber qué bien cada objeto responde a la consulta, ordenando los objetos conforme a su valor de ranking. Los objetos con mayor ranking son mostrados a los usuarios y el proceso puede tener otras iteraciones si el usuario quiere refinar su consulta.


Muchas medidas han sido propuestas para valorar el desempeño de los sistemas de restauración de información. Las medidas precisan una compilación de documentos y una consulta. Ahora van a ser descritas ciertas medidas comunes, las que aceptan que: cada documento se sabe que este es relevante o bien no relevante para una consulta particular. En la práctica pueden haber diferentes matices de relevancia.


La precisión es la fracción de documentos recuperados que son relevantes para la necesidad de información del usuario.

Precisión=|n|

La precisión tiene presente todos y cada uno de los documentos recuperados.Asimismo puede ser evaluada en un corte determinado del ranking, considerando únicamente los primeros resultados logrados del sistema.


Nótese que el significado y empleo de la "precisión" en el campo de la Restauración de Información, difiere de las definiciones de precisión y precisión en otras ramas de la ciencia y la tecnología.


Exhaustividad


La exhaustividad es la fracción de documentos relevantes para una consulta que fueron recuperados.

Exhaustividad=|n|

Resulta trivial conseguir un cien por ciento de exhaustividad si se toman como contestación para cualquier consulta todos y cada uno de los documentos de la compilación. Por tanto, la exhaustividad sola no es suficiente, sino se precisa asimismo medir el número de documentos no relevantes, por poner un ejemplo con el cálculo de la precisión.


Proposición de fallo


La proposición de fallo, llamada en inglés fall-out, es la proporción de documentos no relevantes que son recuperados, fuera de todos y cada uno de los documentos relevantes libres.

fall-out=|n|

Resulta trivial conseguir un 0 por ciento de proposición de fallo si no se devuelve ningún documento de la compilación para cualquier consulta.


La medida F es un cómputo de la precisión y el recobrado:

F=2·Precision·Recobrado(Precision+Recobrado).

Esta es famosa además de esto como la medida F1, puesto que el recobrado y la precisión son pesados uniformemente.


La fórmula general para el factor real no negativo ß es:

Fß=(1+ß2)·(Precision·Recobrado)(ß2·Precision+Recobrado).

Otras 2 medidas F extensamente empleadas son la medida F2, que pondera el recobrado un par de veces sobre la precisión, y la medida F0.5, que pesa la precisión un par de veces sobre el recobrado.


La medida F fue lograda por Van Rijsbergen en mil novecientos setenta y nueve. Fß “mide la eficiencia de la restauración con respecto a un usuario que atribuye ß veces más relevancia al recobrado que a la precisión”. Está basada en la medida de Van Rijsbergen E=1-1aP+1-aR. La relación entre estas 2 medidas es Fß=1-E donde a=11+ß2.


Precisión Promedio


La Precisión y el recobrado son métricas basadas en toda la lista de documentos retornada por el sistema dada una consulta. Para sistemas que hacen ranking a los documentos retornados para una consulta es deseable estimar además de esto el orden en que los documentos retornados son presentados. Si se computa la precisión y el recobrado en todos y cada situación de la secuencia de documentos con ranking, podemos plotear la curva precisión - recobrado, ploteando la precisión p(r) como una función del recobrado r. La Precisión Promedio computa el promedio de los valores de p(r) sobre la integral desde r=0 hasta r=1:

AveP=?01p(r)dr.

Esta integral es remplazada en la práctica por una suma finita sobre todas y cada una de las situaciones en la secuencia de documentos con ranking:

AveP=?k=1nP(k)?r(k)

donde k es el ranking en la secuencia de documentos recuperados, n es el número de documentos recuperados, P(k) es la precisión del corte en la situación k de la lista y ?r(k) es el cambio en el recobrado de los elemrentos k-1 hasta k.


Esta suma finita es equivalente a:

AveP=?k=1n(P(k)×rel(k))number of relevant documents

donde rel(k) es un indicador igual a 1 si el ítem en la situación k del ranking es relevante al documento, y cero en otro caso. Nótese que el promedio es sobre todos y cada uno de los documentos relevantes y que los documentos relevantes que no son recuperados consiguen una precisión igual a cero.


La Precisión Promedio a veces se refiere geométricamente como el área bajo la curva precisión - recobrado.


Media de la precisión promedio


La media de la precisión promedio (asimismo conocido como La media de Isabel, o bien MAP: Orinan Average Precision por su nombre en inglés), para un conjunto de consultas o bien queries es el promedio de las puntuaciones medias de precisión para cada consulta.

MAP=?q=1QAveP(q)Q

donde Q es el número de consultas que se están valorando.


  ELIGE TU TEMA DE INTERÉS: 


autoayuda.es   Internet y Tecnologias 

Está aquí: Inicio > [ INTERNET ] > ıllı Búsqueda y recuperación de información wiki: info, historia y vídeos

Las cookies nos permiten ofrecer nuestros servicios. Al utilizar nuestros servicios, aceptas el uso que hacemos de las cookies. Ver políticas