ıllı Internet y Tecnologías de la Información (2018)

internet, Hosting, dominios, seo, antivirus, banco de imágenes, páginas web, tiendas online

[Enciclopedia Online Gratuita] Diccionario de Internet y Tecnologías de la Información y la Comunicación (TIC):

ıllı Aprendizaje supervisado wiki: info, historia y vídeos

videos internet

salud  Aprendizaje supervisado 


El aprendizaje supervisado puede producir modelos de 2 tipos. En general, produce una función que convierte los datos de entrada en los resultados deseados.


Con el fin de solucionar un determinado inconveniente de aprendizaje supervisado (por servirnos de un ejemplo, aprender a reconocer la escritura) uno debe estimar múltiples pasos:



  1. Determinar el género de ejemplos de adiestramiento. Ya antes de hacer cualquier otra cosa, hay que decidir qué género de datos se marcha a emplear para adiestrar el modelo. Por servirnos de un ejemplo, podría ser un solo carácter a mano, una palabra completa escrita a mano, o bien una línea de escritura a mano.
  2. Reunir un conjunto de adiestramiento. El conjunto de necesidades de capacitación a las peculiaridades propias del empleo del planeta real de la función. Por tanto, un conjunto de objetos de entrada que se compendia y salidas pertinentes se recogen asimismo, así sea humana o bien de los especialistas desde mediciones.
  3. Determinar la función de ingreso de la representación de la función aprendido. La precisión de la función aprendida depende en buena medida de de qué forma el objeto de entrada está representado. Por norma general, el objeto de entrada se convierte en un vector de peculiaridades, que contiene una serie de peculiaridades que son gráficos del objeto. El número de peculiaridades no he de ser demasiado grande, a raíz de la maldición de la dimensionalidad, mas he de ser suficientemente grande para pronosticar con precisión la salida.
  4. Determinar la estructura de la función conveniente para solucionar y el inconveniente y la técnica de aprendizaje pertinente. Por poner un ejemplo, se podría decantarse por emplear red neuronal artificial o bien un árbol de resolución.
  5. Completar el diseño. El ingeniero ahora, ejecuta el algoritmo de aprendizaje en el conjunto de la capacitación conseguida. Factores del algoritmo de aprendizaje puede ser ajustado a través de la optimización de desempeño en un subconjunto de ellas (llamado conjunto de validación) del conjunto de adiestramiento, o bien a través de la validación cruzada. Tras el ajuste de factores y de aprendizaje, el desempeño del algoritmo se puede medir usando un conjunto de pruebas independiente del de adiestramiento.

Otro término para el aprendizaje supervisado es la clasificación. Una extensa gama de clasificadores están libres, cada uno de ellos con sus fortalezas y debilidades. Clasificador desempeño depende en buena medida de las peculiaridades de los datos que deben clasificarse. No hay una clasificación única que marcha mejor en todos y cada uno de los inconvenientes dados, lo que asimismo se conoce como el No hay almuerzo sin coste teorema. Diversas pruebas experimentales se han efectuado para cotejar el desempeño del clasificador y para hallar las peculiaridades de los datos que determinan el desempeño del clasificador. La determinación de un clasificador conveniente para un inconveniente dado, no obstante todavía más un arte que una ciencia.


Los clasificadores más usados son las redes neuronales, como el (perceptrón multicapa); las máquinas de vectores de soporte; el algoritmo de los K-vecinos más próximos, los modelos de mixturas; el clasificador bayesiano ingenuo; los árboles de resolución y las funciones de base radial.


El objetivo del aprendizaje supervisado es localizar una función g, dado un conjunto de puntos de la manera (x, g(x)).


Se supone que el conjunto de puntos para los que el comportamiento de los g es conocido es una muestra de variables azarosas independientes idénticamente distribuidas conforme con una distribución de probabilidad ignota p. Por otro lado, se considera una función de pérdidaL:

L:Y×Y?R=0

donde Y es el codominio de g, y L es una función mapas en el número no negativo real s (nuevas limitaciones pueden ser puestos enL) . La cantidad L(z,y) es la pérdida sufrida en la predicción de z , como el valor de g cuando su valor auténtico es y.


El peligro asociado con una función f es la esperanza de la función de pérdida:

R(f)=?iL(f(xi),g(xi))p(xi)

Si la distribución de probabilidad p es reservada se puede reescribir la fórmula precedente utilizando una integral en vez de un sumatorio..


Ahora la meta es localizar una función f* entre una subclase fijo de funciones para las que el riesgoR( f *) es mínima .


Sin embargo, dado el comportamiento de los g por norma general solo es conocido por un conjunto finito de puntos (x1, y1), ..., (xnyn), uno solo puede acercar el auténtico peligro, por poner un ejemplo con el peligro empírico:

R~n(f)=1n?i=1nL(f(xi),yi).

Selección de la función f* que minimiza el peligro experimental se conoce como el principio de minimización experimental de peligros. Teoría estadística de aprendizaje estudia bajo qué condiciones la minimización del peligro experimental es aceptable y lo bien que las aproximaciones se puede aguardar que sea.


Hay situaciones en las que los datos sin etiqueta es rebosante, mas los datos de etiquetado es costoso. En esta situación, el algoritmo de aprendizaje de forma activa la consulta del usuario / maestro para las etiquetas. Este género de aprendizaje supervisado iterativo lleva por nombre aprendizaje activo. Puesto que el estudiante escoge los ejemplos, el número de ejemplos para aprender un término frecuentemente pueden ser mucho menores que el número requerido en el aprendizaje supervisado normal. Con este enfoque se corre el peligro de que el algoritmo puede centrarse en relevancia ni como unos ejemplos válidos.


El aprendizaje activo puede ser en especial útil en inconvenientes de investigación biológica, como ingeniería de proteínas, donde unas pocas proteínas han sido descubiertos con una cierta función interesante y se quiere determinar cuál de las muchas posibles mutantes que el próximo que va a tener un.


Que T es el conjunto total de todos y cada uno de los datos en cuestión. Por poner un ejemplo, en un inconveniente de ingeniería de proteínas, T se incluyen todas y cada una de las proteínas que se sabe que tienen una determinada actividad interesante y todas y cada una de las proteínas auxiliares que uno podría apreciar poner a prueba para esa actividad.


Durante cada iteración, i, T se divide en 3 subgrupos:



  1. TK,i : Puntos cuya etiqueta es conocida
  2. TU,i : Puntos cuya etiqueta es desconocida
  3. TC,i : Un subconjunto de TU,i elegido para ser etiquetado

La mayoría de las investigaciones actuales en el aprendizaje activo implica que el mejor procedimiento para seleccionar los puntos de datos para TC,i.


Hiperplano marginal mínima


Algunos de los algoritmos de aprendizaje activo se fundamentan en máquinas de vector soporte y aprovechar la estructura de la SVM para determinar qué puntos de datos a la etiqueta. Estos métodos acostumbran a calcular el margen, W, de cada dato sin etiqueta en T(O bien,i) y tratar W como una distancia n-dimensional desde ese dato a la separación de hiperplano.


métodos mínima marginal Hiperplano suponer que los datos con> los más pequeños W son las que el SVM es más seguro sobre, con lo que ha de ser puesto en T(C,i) se etiqueten . Otros métodos afines, como máximo marginal Hiperplano, escoja los datos con> el mayor W. métodos de relaciones de intercambio seleccionar una combinación de la menor y la mayor W s.


Máxima curiosidad


Otro procedimiento de aprendizaje activo, que en general se entera de un conjunto de datos con menos ejemplos de mínima Hiperplano marginal, mas es más intensivo en cómputo y solo para los clasificadores reservado es máxima curiosidad.


curiosidad máxima tiene en cada uno de ellos sin etiqueta de referencia en T(O bien,i) y acepta todas y cada una de las etiquetas posibles ese dato pueda tener. Este dato supone con cada clase se agrega a T(K,i) y después el nuevo T(K,i)cruz ratificados. Se supone que cuando el dato es emparejado con su etiqueta adecuada, la precisión de validación cruzada (o bien relación factor) de T(K,i) va a mejorar más. El dato con la precisión que más ha mejorado se pone en T(C,i) se etiqueten.


  ELIGE TU TEMA DE INTERÉS: 


autoayuda.es   Internet y Tecnologias 

Está aquí: Inicio > [ INTERNET ] > ıllı Aprendizaje supervisado wiki: info, historia y vídeos

Las cookies nos permiten ofrecer nuestros servicios. Al utilizar nuestros servicios, aceptas el uso que hacemos de las cookies. Ver políticas