Introducción

PROYECTO - Seguimiento de ROI en videos de LSU

La traducción automática de la lengua de señas es un campo emergente en la investigación que abarca diversas disciplinas, incluyendo la lingüística, las ciencias de la computación y el procesamiento de imágenes. Este desafío requiere la construcción de sistemas de aprendizaje automático capaces de realizar tareas de traducción mediante el reconocimiento de patrones y asociaciones en los datos utilizados.

Cada comunidad, región o país tiene su propia lengua de señas, lo que implica que el desarrollo de soluciones en este ámbito requiere la recopilación y curado de conjuntos de datos específicos para cada contexto. En este sentido, la Facultad de Ingeniería ha obtenido, desde la Dirección Nacional de Telecomunicaciones, una serie de grabaciones de video de la televisión pública y sesiones del Parlamento del Uruguay. Estos videos incluyen un intérprete de lengua de señas uruguaya (LSU) en un recuadro rectangular ubicado cerca de la esquina inferior derecha de la pantalla, conocido como región de interés (ROI).

El objetivo de este proyecto es realizar un seguimiento de la ROI a lo largo del tiempo, asegurando que, una vez detectada, el recuadro del intérprete de señas permanezca estable. Esto aplica tanto para los casos donde la ROI permanece fija como para aquellos en los que la ROI es móvil.

Figura 1: Ejemplo de un video del Parlamento Uruguayo con una intérprete de lengua de señas uruguaya

links

social