[Enciclopedia Online Gratuita] Diccionario de Internet y Tecnologías de la Información y la Comunicación (TIC):
ıllı Huella digital acústica wiki: info, historia y vídeos
La información contenida en esta web debe ser considerada como información general, de carácter formativo, educativo o divulgativo, y no puede ser utilizada o interpretada como consejo o diagnótico médico, psicológico o de ningún otro tipo. Es posible que algunos datos mostrados no esten actualizados. Por ello, en caso de duda lo recomentable es consultar a un experto cualificado.
- Detalles
- Categoría: INTERNET
Huella digital acústica
Una huella digital acústica (del inglés: acoustic fingerprint) es un identificador para ficheros de audio basados en el contenido del fichero. Con ellas podemos identificar un patrón o bien “firma” de un fichero de audio, a fin de que este pueda ser reconocido desde una base de datos de audio, sin precisar contar con información sobre este. Su empleo se fundamenta en la detección de una muestra de audio y siguiente envío a una base de datos (BD), para una vez analizada buscar coincidencias en esta y devolvernos información sobre la muestra analizada. En la actualidad ha evolucionado sensiblemente en tanto que resulta un sistema rapidísimo y fiable en restauración y también indexación de datos, como la reducción del tamaño de los contenidos guardados al no ser preciso tenerlos en nuestro equipo, y por la asignación de una identidad a cada señal de audio, para más tarde ser tratada. Basándonos en la detección frecuencial, un algoritmo preciso de detección de huellas acústicas ha de ser capaz de: Dado un fragmento de audio y su pertinente huella digital, debemos buscar la vía más veloz para hallar su mejor coincidencia. Desde el número de iteraciones en la busca hasta la longitud de la muestra, pueden resultar computacionalmente costosos. A fin de que la busca sea eficaz, el procedimiento de busca debe ser: Podemos advertir las huellas acústicas de un fichero de 2 formas: La primordial diferencia entre las 2, se fundamenta en la precisión. Un análisis temporal implica una detección de estruendos bastante esencial. El alto grado de varianza de las señales de audio hace muy complicado un análisis temporal preciso. Utilizando el análisis frecuencial, logramos advertir los valores máximos de las frecuencias más representativas, logrando eludir el estruendos de fondo. Esto implica: Para la detección de un fichero de audio, nos hallamos con 2 procesos. Primeramente extraeremos la información más característica de nuestra señal y la vamos a tratar para poder ser cambiada. Después la enviaremos para revisar si hay alguna información sobre nuestra muestra. Para la extracción de huellas digitales, debemos tener en consideración que el proceso debe ser capaz de: Conseguir estos requisitos requiere un equilibrio entre la reducción de la dimensionalidad y la pérdida de información. Dicho bloque está compuesto por los bloques front-end y modelado de huellas digitales. Front-end se ocupará de efectuar las medidas y cálculos precisos para extraer la información más esencial del fichero, donde una vez calculada, se mandará al modelado de huellas digitales, para tratar estos datos y su respectiva representación, para su siguiente acceso a la BD. Convierte la señal de audio en una secuencia de las peculiaridades más relevantes de este. Para su adecuado desarrollo se debe tener en consideración que tiene que conseguir: En su interior hallamos múltiples procesos que, en ciertas aplicaciones, pueden contener By-Pass para preconfigurar el proceso. El audio se digitaliza (si es preciso) y se transforma a un formato de audio genérico (en general PCM dieciseis bits). Se examinará dependiendo del número de canales y el género de audio. Además de esto se normalizará y filtrará por bandas para acomodar la señal al procesado. Las señales acústicas se consideran estacionarias cuando su duración es del orden de milisegundos. Se subdivide la señal en muestras de tamaño tal que las podamos estimar estacionarias. El tamaño va a ir dependiendo de la velocidad de alteración de la señal. La idea de las transformadas es lograr un nuevo conjunto de peculiaridades para reducir la redundancia de la señal. Hay técnicas perfectas para la transformación, como Karhunen-Lo'eve (KL) o bien Singular Value Decomposition (SVD), mas al tratarse de técnicas computacionalmente complejas, se usan técnicas más fáciles como Lourens, Kurth, etcétera La técnica más frecuente es la Transformada veloz de Fourier (FFT), si bien asimismo son usadas la transformada prudente de coseno (DCT) o bien la transformada Haar, entre otras muchas. Una vez conseguida la representación tiempo-frecuencia, debemos aplicar múltiples procesos para lograr el vector característica final. La meta es de nuevo reducir la dimensionalidad y también acrecentar la invariancia por distorsiones. Se van a aplicar diferentes técnicas (Fig. tres) que aprovechan las restricciones del sistema auditivo humano para lograrlo, como mediciones de energía, volumen, detectores de envolvente, etc. La mayoría de las peculiaridades descritas hasta el momento son medidas absolutas. Para prosperar la caracterización de la señal, se agregan derivadas de orden mayor. El vector de peculiaridades se va a crear con dicho factor, que cambiará dependiendo del algoritmo usado. Asimismo es común aplicar una resolución bajísima en la cuantificación. Así se gana robusteza a distorsiones. De este modo preparamos los datos a fin de que sean embalados en función de como van a ser mostrados y/o consultados. Dicho bloque recibe los vectores peculiaridades creados en el proceso precedente. Este se ocupará de procesar los vectores y convertirlos en un solo vector característica (recordemos que hallamos diferentes vectores, para cada banda frecuencial, energías, filtros, etcétera), para más tarde ser mandado. De nuevo es de vital relevancia la dimensionalidad de los algoritmos, para eludir mandar grandes cantidades de información a la BD. La adaptación de los vectores cambiará en función de cada programa, los que administrarán el tamaño de la muestra adquirida y los vectores que usarán, entre otros muchos factores. Estos programas han sido diseñados para trabajar con Metadatos; a través de vamos a recibir la información referente a la muestra analizada. Hoy en día podemos localizar diferentes programas. Una vez creada la huella digital acústica, el próximo paso es buscar coincidencias para devolvernos información sobre nuestra muestra. Se mandará nuestro “patrón” y toda la posible información auxiliar creada (metadatos, cabeceras, etcétera) a una base de datos, para buscar cualquier coincidencia. Debemos tener en consideración 2 factores que repercuten de manera directa en este proceso: A la hora de relacionar las peculiaridades de la muestra, es de vital relevancia la distancia tomada entre peculiaridades próximas. Técnicas como la distancia Euclidiana, la longitud Manhattan o bien Hamming, son empleadas para calcular estas distancias. Para una adecuada busca, tanto el vector característica creado como el vector característica de la BD deben usar exactamente las mismas técnicas, a fin de que sus huellas coincidan sin fallo de distancia. Por otro lado, debemos efectuar de forma eficaz la busca en la BD. Si tras crear un vector de dimensionalidad reducida, no logramos un algoritmo de busca eficaz, nuestro sacrificio va a haber sido en balde. La técnica más frecuente se fundamenta en la creación de índices, para vertebrar la información. Así reducimos sensiblemente el rango de datos a preguntar. Podemos hallar diferentes técnicas de optimización de consulta de datos, basadas en índices, heurística, código de palabras, etcétera Una vez encontrado (o bien no) la consulta, el sistema nos va a devolver toda la información contenida en su BD sobre nuestra muestra, incluyendo título, artista, año, álbum, etc. Por último, a lo largo de la consulta en la BD, se crean resultados sobre el vector creado. Dichos resultados son empleados para actualizar la BD. Con ellos se logra actualizar resultados precedentes, incorporar nuevos resultados y prosperar la precisión de las muestras guardadas. En podemos preguntar toda la información y nomenclatura usada en este último proceso. La mayoría de aplicaciones se hallan en dispositivos móviles y equipos de sobremesa. A pesar de esto se está comenzando a aplicar en medicina y también indexación de datos, por su gran velocidad de acceso a la información (consultas ADN, p.e).
Extracción de huellas digitales
Framing y Overlap
Transformada. Estimación de espectro
Extracción de características
Post-procesado
Modelado de huellas digitales
Verificación hipótesis