ıllı Internet y Tecnologías de la Información (2018)

internet, Hosting, dominios, seo, antivirus, banco de imágenes, páginas web, tiendas online

[Enciclopedia Online Gratuita] Diccionario de Internet y Tecnologías de la Información y la Comunicación (TIC):

ıllı Reglas de asociación wiki: info, historia y vídeos


La información contenida en esta web debe ser considerada como información general, de carácter formativo, educativo o divulgativo, y no puede ser utilizada o interpretada como consejo o diagnótico médico, psicológico o de ningún otro tipo. Es posible que algunos datos mostrados no esten actualizados. Por ello, en caso de duda lo recomentable es consultar a un experto cualificado.


 


 

videos internet

salud  Reglas de asociación 


En minería de datos y aprendizaje automático, las reglas de asociación se usan para descubrir hechos que ocurren en común en un determinado conjunto de datos. Se han investigado extensamente distintos métodos para aprendizaje de reglas de asociación que han resultado ser bien interesantes para descubrir relaciones entre variables en grandes conjuntos de datos.


Piatetsky-Shapiro describe el análisis y la presentación de reglas 'fuertes' descubiertas en bases de datos usando diferentes medidas de interés. Basado en el término de regla fuerte, Agrawal et al. presentaron un trabajo en el que señalaban las reglas de asociación que descubrían las relaciones entre los datos compendiados a gran escala en los sistemas de terminales de punto de venta de unos supermercados. Por servirnos de un ejemplo, la próxima regla:

?

Encontrada en los datos de ventas de un súper, señalaría que un consumidor que adquiere cebollas y verdura al unísono, probablemente adquiera asimismo carne. Esta información se puede emplear como base para tomar resoluciones sobre marketing como costos promocionales para determinados productos o bien dónde situar estos en el súper. Aparte del ejemplo precedente aplicado al análisis de la cesta de compra, en la actualidad, las reglas de asociación asimismo son de aplicación en muchas otras áreas como el Web mining, la detección de intrusos o bien la bioinformática.


Según la definición original de Agrawal et al el inconveniente de minería de reglas de asociación se define como:



  • Sea I= un conjunto de n atributos binarios llamados items.


  • Sea D= un conjunto de transacciones guardadas en una base de datos.

Cada transacción en D tiene un ID (identificador) único y contiene un subconjunto de items de I. Una regla se define como una implicación de la forma:



X?Y

Donde:

X,Y?I yXnY=Ø

Los conjuntos de items X y Y se llaman respectivamente "antecedente" (o bien parte izquierda) y "coherente" (o bien parte derecha) de la regla.


Ejemplo práctico

Ejemplo:
Base de datos con cuatro items y cinco transaccionesIDLechePanMantequillaCerveza1110020110300014111050100

Para ilustrar estos conceptos véase el próximo ejemplo sobre ventas en un súper. El conjunto de items es:

I=

A la derecha se muestra una pequeña base de datos que contiene los items, donde el código '1' se interpreta como que el producto (item) pertinente está presente en la transacción y el código '0' quiere decir que dicho producto no está presente. Un caso de regla para el súper podría ser:

?

Significaría que si el usuario adquirió 'leche' y 'pan' asimismo adquirió 'mantequilla', o sea, conforme la especificación formal precedente se tendría que:

X=Y=

Reglas significativas, 'soporte' y 'confianza'


Nótese que el ejemplo precedente es pequeñísimo, en la práctica, una regla precisa un soporte de múltiples cientos y cientos de registros (transacciones) antes que esta pueda considerarse significativa desde cierto punto de vista estadístico. Frecuentemente las bases de datos poseen miles o bien aun millones de registros.


Para escoger reglas interesantes del conjunto de todas y cada una de las reglas posibles que se pueden derivar de un conjunto de datos se pueden emplear limitaciones sobre distintas medidas de "significancia" y también "interés". Las limitaciones más conocidas son los umbrales mínimos de "soporte" y "confianza".


El 'soporte' de un conjunto de items X en una base de datos D se define como la proporción de transacciones en la base de datos que contiene dicho conjunto de items:

sop(X)=|XD|

En el ejemplo precedente el conjunto tiene un soporte de;

sop(X)=25=0.4

Es decir, el soporte es del cuarenta por ciento (dos de cada cinco transacciones).


La 'confianza' de una regla se define como:

conf(X?Y)=sop(XnY)sop(X)=|XnYX|

Por ejemplo, para la regla:

?

La confianza sería:

conf(?)=sop(n)sop()=0.20.4=0.5

Este cálculo quiere decir que el cincuenta por ciento de las reglas de la base de datos que poseen 'leche' y 'pan' en el antecedente asimismo tienen 'mantequilla' en el consecuente; en otras palabras, que la regla:

?

Es cierta en el cincuenta por ciento de los casos.


La confianza puede interpretarse como un estimador de P(Y|X)X), la probabilidad de hallar la parte derecha de una regla condicionada a que se halle asimismo la parte izquierda.


Las reglas de asociación deben satisfacer las especificaciones del usuario en lo que se refiere a umbrales mínimos de soporte y confianza. Para lograr esto el proceso de generación de reglas de asociación se efectúa en 2 pasos. Primero se aplica el soporte mínimo para hallar los conjuntos de items más usuales en la base de datos. Seguidamente se forman las reglas partiendo de estos conjuntos usuales de items y de la limitación de confianza mínima.


Encontrar todos y cada uno de los subconjuntos usuales de la base de datos es bastante difícil en tanto que esto implica estimar todos y cada uno de los posibles subconjuntos de items (combinaciones de items). El conjunto de posibles conjuntos de items es el conjunto potencia de I y su tamaño es de 2n-1 (excluyendo el conjunto vacío que no es válido como conjunto de items). Si bien el tamaño del conjunto potencia medra exponencialmente con el número de items n de I, es posible hacer una busca eficaz usando la propiedad "downward-closure" del soporte (asimismo llamada anti-monótona) que garantiza que para un conjunto de items usual, sus subconjuntos asimismo son usuales, y de igual modo, para un conjunto de items inusual, sus superconjuntos han de ser inusuales. Explotando esta propiedad se han desarrollado algoritmos eficaces (por ejemplo: Apriori y Eclat) para hallar los items usuales.


Mejora de la confianza: "Lift" (1, dos)


El indicador lift expresa cuál es la proporción del soporte observado de un conjunto de productos respecto del soporte teorético de ese conjunto dado el presunto de independencia. Un valor de lift = 1 señala que ese conjunto aparece una cantidad de veces acorde a lo aguardado bajo condiciones de independencia. Un valor de lift > 1 señala que ese conjunto aparece una cantidad de veces superior a lo aguardado bajo condiciones de independencia (con lo que se puede intuir que hay una relación que hace que los productos se hallen en el conjunto más veces de lo normal). Un valor de lift < 1 señala que ese conjunto aparece una cantidad de veces inferior a lo aguardado bajo condiciones de independencia (con lo que se puede intuir que hay una relación que hace que los productos no estén formando una parte del mismo conjunto más veces de lo normal).


  ELIGE TU TEMA DE INTERÉS: 


autoayuda.es   Internet y Tecnologias 





Está aquí: Inicio > [ INTERNET ] > ıllı Reglas de asociación wiki: info, historia y vídeos

Las cookies nos permiten ofrecer nuestros servicios. Al utilizar nuestros servicios, aceptas el uso que hacemos de las cookies. Ver políticas