Research

Publication (Phd Thesis)

Contributions to the Implementation of Sound Source Localization Systems

García Barrios, Guillermo
Abstract:
El problema de la localización de fuentes sonoras consiste en estimar la posición específica de una fuente de sonido. Se han implementado una gran variedad de algoritmos para resolver esta tarea, pero normalmente se diseñan para escenarios acústicos concretos, lo que resulta un problema cuando se tratan de aplicar en condiciones diferentes. Esta tesis se centra en localizar una única fuente en espacios cerrados utilizando el algoritmo SRP-PHAT y sistemas de localización de fuentes sonoras biaurales. Se realiza un análisis detallado para detectar sus puntos débiles y así implementar nuevas técnicas que mejoren su precisión en la estimación de la posición. De esta forma, se propone una nueva versión de la correlación cruzada generalizada que limita el ancho de banda en función de la resolución de los mapas SRP y la distancia entre micrófonos. Se ha demostrado mediante simulación que este nuevo estimador mejora la precisión de localización cuando la fuente sonora se encuentra lejos del array de micrófonos. En relación con el problema de la reverberación que empeora el funcionamiento de los algoritmos de localización, se presenta una técnica novedosa que aprovecha la diversidad espacial cuyos resultados superan a los de técnicas de procesado de la señal complejas. Además, se recopilan las bases de datos más relevantes que se pueden encontrar en la literatura y se realizan grabaciones en diferentes salas para aumentar el número de recursos disponibles para la validación de algoritmos de localización. Finalmente, se propone una red de aprendizaje profundo que aprovecha la información de la rotación de la cabeza para mejorar la precisión de sistemas basados en localización biaural.
Research areas:
Year:
2023
Type of Publication:
Phd Thesis
DOI:
https://doi.org/10.20868/UPM.thesis.76549