Experimentos
En esta sección se presentan los siguientes aspectos: la optimización de los métodos mediante la selección de umbrales y los resultados en la estimación de la ROI, considerando los videos con recuadro fijo.
Definición del Umbral
Para definir un umbral global aplicable a diferentes videos, tuvimos que considerar varias características. En primer lugar, el umbral no podía ser demasiado bajo, ya que en ese caso detectaría cualquier cambio mínimo como un posible borde. Por otro lado, tampoco podía ser demasiado alto, ya que esto haría que el umbral se extendiera más allá de los bordes buscados.
Para establecer el umbral adecuado, generamos varias gráficas que mostraban las diferencias entre las bandas de píxeles en cada borde. Estas gráficas nos proporcionaron una idea clara de los rangos de valores razonables para configurar el umbral.
Dado que el contraste del fondo variaba significativamente entre imágenes con fondos transparentes y aquellas con fondos blancos, separamos el análisis en dos casos distintos. La intersección de los umbrales posibles para cada tipo de imagen era nula, por lo que definimos un umbral específico para imágenes con fondos transparentes y otro para imágenes con fondos blancos.
Gráficas de videos con ROI de bordes contrastantes
Gráficas de videos con ROI de bordes no contrastantes
Como se puede observar en las gráficas anteriores, en los primeros videos se destaca claramente la diferencia entre los bordes, ya que las gráficas presentan una forma más plana con un pico evidente en el punto de detección del borde. En contraste, los videos del segundo tipo muestran gráficas más sinuosas, lo que dificulta la identificación precisa del punto que indica la presencia de un borde. Por esta razón, se empleó un umbral de 20 para los videos con fondo blanco, mientras que para los videos del otro tipo se utilizó un umbral de 10.
Verificación del área estimada
En este caso, como se detalló en la sección de métodos, se definieron dos parámetros: el porcentaje máximo para el cambio del área y el movimiento máximo permitido para cada borde individual.
El porcentaje máximo para el cambio de área se estableció mediante experimentación. Inicialmente, se probó un umbral del 5%. Este valor se eligió como punto de partida porque es un umbral conservador que permite identificar cambios menores sin ser demasiado restrictivo. Al usar un umbral bajo, pudimos observar cómo el sistema respondía a variaciones pequeñas en el área. Sin embargo, notamos que este porcentaje resultaba demasiado bajo para captar cambios significativos, por lo que se incrementó al 10%. Este ajuste reveló que el umbral del 10% era excesivo, ya que en algunos casos el área crecía más de lo deseado. Finalmente, se optó por un término medio del 8%, que demostró ser adecuado para equilibrar la detección de cambios relevantes sin introducir errores significativos.
En cuanto al movimiento máximo permitido para cada borde, este valor también se determinó mediante experimentación manual, estableciéndose en 8. Este valor se eligió para lograr un equilibrio óptimo entre sensibilidad y robustez en la detección de cambios. Un valor demasiado bajo, al igual que en el caso anterior, no capturaba las variaciones legítimas en los bordes, mientras que un valor demasiado alto incluía fluctuaciones no relevantes fuera del área de interés. El valor de 8 demostró ser un punto intermedio adecuado, permitiendo la captura de movimientos significativos sin ser excesivamente sensible a pequeñas variaciones.
Cuantificación de Errores
Para evaluar la efectividad de nuestro método en los videos, era necesario cuantificar el error de manera objetiva. Para ello, utilizamos la métrica Intersection over Union (IoU). Esta métrica calcula la intersección entre los dos recuadros detectados y la divide por la unión de estos recuadros. Si los recuadros son idénticos, el valor de IoU debería ser 1.
Este valor nos indica la precisión del resultado obtenido: cuanto más cerca de 1, mayor la similitud entre ambas áreas, mientras que un resultado cercano a 0 indica un error significativo.
Para los videos con ROI fijo, etiquetamos manualmente los puntos correspondientes al recuadro deseado y comparamos el valor de IoU frame a frame. Posteriormente, con todos los valores obtenidos, realizamos una gráfica para observar cómo variaba este error a lo largo del tiempo, calculando tanto el valor promedio como el valor más bajo.
A continuación, presentamos una tabla con los diferentes valores obtenidos para cada tipo de video:
Videos | Fijo | Fondo | IOU medio | IOU mínimo |
---|---|---|---|---|
1 | NO | Constrastante | No procesado | No procesado |
2 | NO | Constrastante | No procesado | No procesado |
3 | Si | No contrastante | 0.8036484090086566 | 0.5436528572254001 |
4 | Si | No contrastante | 0.7845774546699497 | 0.5462046458644417 |
5 | Si | No contrastante | 0.6788032073460226 | 0.543884892086331 |
6 | Si | SEMI contrastante | 0.4607686205048166 | 0.44889779559118237 |
7 | Si | NO contrastante | 0.7142832147124635 | 0.3720814061054579 |
8 | Si | Contrastante | 0.9605703011941806 | 0.6513177101303114 |
9 | Si | Contrastante | 0.9975476748680558 | 0.8930280082380301 |
10 | Si | Contrastante | 0.9981135284429156 | 0.9574468085106383 |
11 | Si | Contrastante | 0.9984662063991452 | 0.9659137577002054 |
12 | Si | SEMI contrastante | 0.5756380217129056 | 0.522316871917658 |
13 | Si | SEMI contrastante | 0.8131729166666719 | 0.715625 |
Figura 13: Tabla comparativa de la métrica IOU
Según la observación de la tabla anterior, los videos con fondo transparente presentan una media de error significativamente mayor en comparación con el resto de los videos. En el caso de los videos con fondo contrastante, el algoritmo detecta los bordes con mayor precisión, alcanzando una media superior a 0.95. Esto indica que el área etiquetada manualmente y la proporcionada por el algoritmo coinciden en su mayoría.
Como se observa en las gráficas adjuntas y según lo indicado en la tabla, los videos con fondo contrastante tienden a ser más estables y presentan un valor de IOU alto. Sin embargo, hay excepciones, como en el caso del video 6, donde el valor de IOU es estable pero bajo. Esto sugiere que, aunque la solución es consistente, no se ajusta adecuadamente a la ROI deseada.
Por otro lado, en algunos videos, la medida de la ROI no es estable. Por ejemplo, en el video 3, el valor de IOU es inicialmente alto, pero en un punto del video, la región delimitada se vuelve incorrecta debido a la confusión entre el fondo transparente y la región deseada. Esta confusión provoca un aumento en el error en este caso.