Zusammenfassung:
Hoy en día la visión por computador o visión artificial es un campo con diversas aplicaciones en areas tales como la seguridad ciudadana, instrumentación médica, líneas de procesos industriales, actividades militares, etc. El uso de algoritmos y técnicas de visión artificial basadas en machine learning y deep learning están haciéndose cada vez más populares por cuanto ya existen a la mano computadores pequeños con gran capacidad de procesamiento tales como los arduinos, raspherry, nvidia y otros. El objetivo de este proyecto es implementar un pequeño prototipo de sistema autónomo de visión artificial capaz de detectar autos y personas en video capturado en tiempo real cuyo detector se basa en el algoritmo YOLOv3 en la versión AlexeyAB-Darknet corriendo sobre una placa de hardware de alto rendimiento NVIDIA Jetson TX2 y un framework basado en Linux-Python-OpencvTensor-Cuda. YOLOv3 es un algoritmo pre-entrenado para detectar ochenta objetos, sin embargo, para propósito de este trabajo, el detector ha sido configurado para mostrar personas y autos livianos. En las pruebas realizadas en el prototipo, se alcanzó una tasa de acierto superior al noventa por ciento con YOLOv3 en la versión completa, aunque la velocidad de procesamiento del detector resultó inferior comparada con la versión liviana del mismo algoritmo al probarse con videos pregrabados y también en videos capturados en tiempo real a través de una webcam conectada en el prototipo