ıllı Internet y Tecnologías de la Información (2018)

internet, Hosting, dominios, seo, antivirus, banco de imágenes, páginas web, tiendas online

[Enciclopedia Online Gratuita] Diccionario de Internet y Tecnologías de la Información y la Comunicación (TIC):

ıllı Extract, transform and load : que es, definición y significado, descargar videos y fotos.

videos internet

salud  ıllı Extract, transform and load : que es, definición y significado, descargar videos y fotos.  


Extract, Transform and Cargar («extraer, convertir y cargar», habitualmente abreviado ETL) es el proceso que deja a las organizaciones desplazar datos desde múltiples fuentes, reformatearlos y limpiarlos, y cargarlos en otra base de datos, data mart, o bien data warehouse para examinar, o bien en otro sistema operacional para respaldar un proceso de negocio.


Los procesos ETL asimismo se pueden emplear para la integración con sistemas heredados. Se transformaron en un término popular en los años mil novecientos setenta.?


La primera una parte del proceso ETL consiste en extraer los datos desde los sistemas de origen. La mayor parte de los proyectos de almacenaje de datos fusionan datos procedentes de diferentes sistemas de origen. Cada sistema separado puede utilizar una organización diferente de los datos o bien formatos diferentes. Los formatos de las fuentes por norma general se hallan en bases de datos relacionales o bien archivos planos, mas pueden incluir bases de datos no relacionales o bien otras estructuras diferentes. La extracción transforma los datos a un formato listo para empezar el proceso de transformación.


Una parte intrínseca del proceso de extracción es la de examinar los datos extraídos, de lo que resulta un chequeo que comprueba si los datos cumplen la pauta o bien estructura que se aguardaba. De no ser de esta manera los datos son rechazados.


Un requerimiento esencial que se debe demandar a la labor de extracción es que esta cause un impacto mínimo en el sistema origen. Si los datos a extraer son muchos, el sistema de origen se podría frenar e inclusive colapsar, provocando que este no pueda usarse con normalidad para su empleo rutinario. Por tal razón, en sistemas grandes las operaciones de extracción acostumbran a programarse en horarios o bien días donde este impacto sea nulo o bien mínimo.

Paralelismo (informática)

Un desarrollo reciente en el software ETL es la aplicación de procesamiento paralelo. Esto ha tolerado desarrollar una serie de métodos para progresar el desempeño general de los procesos ETL tratándose de grandes volúmenes de datos. Hay tres tipos primordiales de paralelismos que se pueden incorporar en las aplicaciones ETL:

De datosConsiste en dividir un solo fichero secuencial en pequeños ficheros de datos para otorgar acceso paralelo.De segmentación (pipeline)Permitir el funcionamiento simultáneo de múltiples componentes en exactamente el mismo flujo de datos. Un caso de ello sería buscar un valor en el registro número 1 al unísono que se aúnan 2 campos en el registro número 2.De componenteConsiste en el funcionamiento simultáneo de múltiples procesos en diferentes flujos de datos, pertenecientes todos ellos a un solo flujo de trabajo. Esto es posible cuando existen porciones en un flujo de trabajo que son completamente independientes entre ellas a nivel de flujo de datos.

Estos 3 géneros de paralelismo no son excluyentes, sino pueden ser combinados para efectuar una misma operación ETL.


Una complejidad auxiliar es asegurar que los datos que se cargan sean parcialmente consistentes. Las múltiples bases de datos de origen tienen diferentes ciclos de actualización (ciertas pueden ser actualizadas cada pocos minutos, al paso que otras pueden tardar días o bien semanas). En un sistema de ETL va a ser preciso que se puedan detener determinados datos hasta el momento en que todas y cada una de las fuentes estén acompasadas. De igual manera, en el momento en que un almacén de datos debe ser actualizado con los contenidos en un sistema de origen, es preciso establecer puntos de sincronización y de actualización.


Los procesos ETL pueden ser realmente complejos. Un sistema ETL mal desarrollado puede provocar esenciales inconvenientes operativos.


En un sistema operacional el rango de valores de los datos o bien la calidad de estos pueden no coincidir con las esperanzas de los diseñadores en el momento de precisarse las reglas de validación o bien transformación. Es conveniente efectuar un examen completo de la valía de los datos (Data profiling) del sistema de origen a lo largo del análisis para identificar las condiciones precisas a fin de que los datos puedan ser tratados apropiadamente por las reglas de transformación concretadas. Esto va a conducir a una modificación de las reglas de validación incorporadas en el proceso ETL.


Normalmente los data warehouse son alimentados de forma asíncrona desde diferentes fuentes, que sirven a propósitos muy, muy diferentes. El proceso ETL es clave para conseguir que los datos extraídos asíncronamente de orígenes heterogéneos se integren por último en un ambiente homogéneo.


La escalabilidad de un sistema de ETL a lo largo de su vida útil debe ser establecida a lo largo del análisis. Esto incluye la entendimiento de los volúmenes de datos que deberán ser procesados conforme los pactos de nivel de servicio (SLA: Service level agreement). El tiempo libre para efectuar la extracción de los sistemas de origen podría mudar, lo que implicaría que exactamente la misma cantidad de datos debería ser procesada en menos tiempo. Ciertos sistemas ETL son escalados para procesar múltiples terabytes de datos para actualizar un data warehouse que puede contener decenas y decenas de terabytes de datos. El incremento de los volúmenes de datos que pueden requerir estos sistemas pueden hacer que los lotes que se procesaban diariamente pasen a procesarse en micro-lotes (múltiples al día) o bien aun a la integración con colas de mensajes o bien a la atrapa de datos cambiados (CDC: change data capture) en tiempo real para una transformación y actualización continua.


  ELIGE TU TEMA DE INTERÉS: 


autoayuda.es   Internet y Tecnologias 

Está aquí: Inicio > [ INTERNET ] > ıllı Extract, transform and load : que es, definición y significado, descargar videos y fotos.

Las cookies nos permiten ofrecer nuestros servicios. Al utilizar nuestros servicios, aceptas el uso que hacemos de las cookies. Ver políticas