ıllı Internet y Tecnologías de la Información (2018)

internet, Hosting, dominios, seo, antivirus, banco de imágenes, páginas web, tiendas online

[Enciclopedia Online Gratuita] Diccionario de Internet y Tecnologías de la Información y la Comunicación (TIC):

ıllı Huella digital acústica wiki: info, historia y vídeos

videos internet

salud  Huella digital acústica 


Una huella digital acústica (del inglés: acoustic fingerprint) es un identificador para ficheros de audio basados en el contenido del fichero. Con ellas podemos identificar un patrón o bien “firma” de un fichero de audio, a fin de que este pueda ser reconocido desde una base de datos de audio, sin precisar contar con información sobre este. Su empleo se fundamenta en la detección de una muestra de audio y siguiente envío a una base de datos (BD), para una vez analizada buscar coincidencias en esta y devolvernos información sobre la muestra analizada. En la actualidad ha evolucionado sensiblemente en tanto que resulta un sistema rapidísimo y fiable en restauración y también indexación de datos, como la reducción del tamaño de los contenidos guardados al no ser preciso tenerlos en nuestro equipo, y por la asignación de una identidad a cada señal de audio, para más tarde ser tratada.


Basándonos en la detección frecuencial, un algoritmo preciso de detección de huellas acústicas ha de ser capaz de:

- Advertir con precisión un fragmento de audio, con independencia de la compresión, distorsión y/o interferencias del canal de transmisión.- En dependencia de la aplicación, ser capaz de reconocer el título del fichero con una duración de unos pocos segundos, que va a ir determinado por el procedimiento de tratamiento de la señal y sincronización entre la muestra adquirida y la base de datos.- Reconocer la muestra aun si está degradada/modificada por ecualización, pitch (velocidad de reproducción), efectos, ruidos externos, conversión y/o digitalización y codificación.- Sistema eficaz, dependiendo del tamaño de la muestra adquirida, la dificultad del algoritmo de busca y la extracción de las huellas del fichero.

Dado un fragmento de audio y su pertinente huella digital, debemos buscar la vía más veloz para hallar su mejor coincidencia. Desde el número de iteraciones en la busca hasta la longitud de la muestra, pueden resultar computacionalmente costosos. A fin de que la busca sea eficaz, el procedimiento de busca debe ser:

- Rápido: Capacidad de lectura en barrido en grandes bases de datos.- Validez: Devolución de un resultado adecuado y preciso.- Eficacia de la memoria: Necesidad de poco espacio en memoria.- Actualizable: debe permitir actualizaciones, modificaciones y/o supresión de objetos.

Podemos advertir las huellas acústicas de un fichero de 2 formas:

- Temporalmente: Reconocimiento del patrón del fichero dependiendo de la intensidad de la señal y el tiempo. Se fundamenta en la manera de onda dependiendo del tiempo.- Frecuencialmente: Reconocimiento del patrón del fichero en función de las frecuencias y sus picos de intensidad y el tiempo. Se fundamenta en las peculiaridades del sistema auditivo humano.

La primordial diferencia entre las 2, se fundamenta en la precisión. Un análisis temporal implica una detección de estruendos bastante esencial. El alto grado de varianza de las señales de audio hace muy complicado un análisis temporal preciso.


Utilizando el análisis frecuencial, logramos advertir los valores máximos de las frecuencias más representativas, logrando eludir el estruendos de fondo. Esto implica:

- Mayor precisión y detección del fichero de audio.- Menor vulnerabilidad al estruendos y elementos externos.- Menor valor máximo en detección (valor entrada).

Para la detección de un fichero de audio, nos hallamos con 2 procesos. Primeramente extraeremos la información más característica de nuestra señal y la vamos a tratar para poder ser cambiada. Después la enviaremos para revisar si hay alguna información sobre nuestra muestra.


Extracción de huellas digitales


Para la extracción de huellas digitales, debemos tener en consideración que el proceso debe ser capaz de:

- Capacidad de discriminación sobre un elevado número de huellas.- Invariancia por distorsiones.- Sólido en ejecución.- Necesidad computacional baja.

Conseguir estos requisitos requiere un equilibrio entre la reducción de la dimensionalidad y la pérdida de información.


Dicho bloque está compuesto por los bloques front-end y modelado de huellas digitales. Front-end se ocupará de efectuar las medidas y cálculos precisos para extraer la información más esencial del fichero, donde una vez calculada, se mandará al modelado de huellas digitales, para tratar estos datos y su respectiva representación, para su siguiente acceso a la BD.


Convierte la señal de audio en una secuencia de las peculiaridades más relevantes de este. Para su adecuado desarrollo se debe tener en consideración que tiene que conseguir:

- Reducción de la dimensionalidad.- Factores significativos afines a los del sistema auditivo humano.- Invariancia por factores externos.- Relación temporal.

En su interior hallamos múltiples procesos que, en ciertas aplicaciones, pueden contener By-Pass para preconfigurar el proceso.


El audio se digitaliza (si es preciso) y se transforma a un formato de audio genérico (en general PCM dieciseis bits). Se examinará dependiendo del número de canales y el género de audio. Además de esto se normalizará y filtrará por bandas para acomodar la señal al procesado.


Framing y Overlap

Las señales acústicas se consideran estacionarias cuando su duración es del orden de milisegundos. Se subdivide la señal en muestras de tamaño tal que las podamos estimar estacionarias. El tamaño va a ir dependiendo de la velocidad de alteración de la señal.


Transformada. Estimación de espectro

La idea de las transformadas es lograr un nuevo conjunto de peculiaridades para reducir la redundancia de la señal. Hay técnicas perfectas para la transformación, como Karhunen-Lo'eve (KL) o bien Singular Value Decomposition (SVD), mas al tratarse de técnicas computacionalmente complejas, se usan técnicas más fáciles como Lourens, Kurth, etcétera La técnica más frecuente es la Transformada veloz de Fourier (FFT), si bien asimismo son usadas la transformada prudente de coseno (DCT) o bien la transformada Haar, entre otras muchas.


Extracción de características

Una vez conseguida la representación tiempo-frecuencia, debemos aplicar múltiples procesos para lograr el vector característica final. La meta es de nuevo reducir la dimensionalidad y también acrecentar la invariancia por distorsiones. Se van a aplicar diferentes técnicas (Fig. tres) que aprovechan las restricciones del sistema auditivo humano para lograrlo, como mediciones de energía, volumen, detectores de envolvente, etc.


Post-procesado

La mayoría de las peculiaridades descritas hasta el momento son medidas absolutas. Para prosperar la caracterización de la señal, se agregan derivadas de orden mayor. El vector de peculiaridades se va a crear con dicho factor, que cambiará dependiendo del algoritmo usado. Asimismo es común aplicar una resolución bajísima en la cuantificación. Así se gana robusteza a distorsiones. De este modo preparamos los datos a fin de que sean embalados en función de como van a ser mostrados y/o consultados.


Modelado de huellas digitales


Dicho bloque recibe los vectores peculiaridades creados en el proceso precedente. Este se ocupará de procesar los vectores y convertirlos en un solo vector característica (recordemos que hallamos diferentes vectores, para cada banda frecuencial, energías, filtros, etcétera), para más tarde ser mandado. De nuevo es de vital relevancia la dimensionalidad de los algoritmos, para eludir mandar grandes cantidades de información a la BD. La adaptación de los vectores cambiará en función de cada programa, los que administrarán el tamaño de la muestra adquirida y los vectores que usarán, entre otros muchos factores. Estos programas han sido diseñados para trabajar con Metadatos; a través de vamos a recibir la información referente a la muestra analizada. Hoy en día podemos localizar diferentes programas.


Una vez creada la huella digital acústica, el próximo paso es buscar coincidencias para devolvernos información sobre nuestra muestra. Se mandará nuestro “patrón” y toda la posible información auxiliar creada (metadatos, cabeceras, etcétera) a una base de datos, para buscar cualquier coincidencia. Debemos tener en consideración 2 factores que repercuten de manera directa en este proceso:


A la hora de relacionar las peculiaridades de la muestra, es de vital relevancia la distancia tomada entre peculiaridades próximas. Técnicas como la distancia Euclidiana, la longitud Manhattan o bien Hamming, son empleadas para calcular estas distancias. Para una adecuada busca, tanto el vector característica creado como el vector característica de la BD deben usar exactamente las mismas técnicas, a fin de que sus huellas coincidan sin fallo de distancia.


Por otro lado, debemos efectuar de forma eficaz la busca en la BD. Si tras crear un vector de dimensionalidad reducida, no logramos un algoritmo de busca eficaz, nuestro sacrificio va a haber sido en balde. La técnica más frecuente se fundamenta en la creación de índices, para vertebrar la información. Así reducimos sensiblemente el rango de datos a preguntar. Podemos hallar diferentes técnicas de optimización de consulta de datos, basadas en índices, heurística, código de palabras, etcétera Una vez encontrado (o bien no) la consulta, el sistema nos va a devolver toda la información contenida en su BD sobre nuestra muestra, incluyendo título, artista, año, álbum, etc.


Verificación hipótesis


Por último, a lo largo de la consulta en la BD, se crean resultados sobre el vector creado. Dichos resultados son empleados para actualizar la BD. Con ellos se logra actualizar resultados precedentes, incorporar nuevos resultados y prosperar la precisión de las muestras guardadas. En podemos preguntar toda la información y nomenclatura usada en este último proceso.


La mayoría de aplicaciones se hallan en dispositivos móviles y equipos de sobremesa. A pesar de esto se está comenzando a aplicar en medicina y también indexación de datos, por su gran velocidad de acceso a la información (consultas ADN, p.e).


  ELIGE TU TEMA DE INTERÉS: 


autoayuda.es   Internet y Tecnologias 

Está aquí: Inicio > [ INTERNET ] > ıllı Huella digital acústica wiki: info, historia y vídeos

Las cookies nos permiten ofrecer nuestros servicios. Al utilizar nuestros servicios, aceptas el uso que hacemos de las cookies. Ver políticas