[Publication] Détection des usagers de la route et estimation de leur mouvement dans une séquence vidéo ortho-photographique par deep learning
Dans le contexte des villes intelligentes, la surveillance des mouvements des piétons et des véhicules est essentielle pour reconnaître les événements anormaux et prévenir les accidents.
La méthode proposée par nos chercheurs se concentre sur l'analyse des flux vidéo capturés à partir d'une caméra installée verticalement et sur la détection contextuelle des usagers de la route. La détection finale est basée sur la fusion des sorties de trois réseaux de neurones convolutionnels différents.
Nos chercheurs se sont intéressés simultanément à la détection des usagers, à l’analyse de leurs mouvements et à leur localisation dans l'environnement statique.
Ils ont utilisé YOLOv4 pour la détection d'objets, FC-HarDNet pour la segmentation sémantique de l’arrière-plan et FlowNet 2.0 pour l’estimation du flot optique dense. FC-HarDNet et YOLOv4 ont été entraînés avec leurs datas et images ortho-photographiques. La dernière étape a utilisé un module de fusion de données.
Les résultats montrent que cette méthode permet de reconnaître le type d'usager (piéton, cycliste, automobiliste), d'identifier les surfaces sur lesquelles ils se déplacent (chaussée, trottoir, pelouse) et d'estimer leur vitesse réelle.
Référence :
Titre : Contextual detection of pedestrians and vehicles in orthophotography by fusion of deep learning algorithms
Auteurs : Masoomeh Shireen Ansarnia, Etienne Tisserand, Patrick Schweitzer, Mohamed Amine Zidane et Yves Berviller
Nom de la revue : Sensors
Date de parution (en ligne) : Février 2022
Lien : https://doi.org/10.3390/s22041381
Légende de l'image : Résultats en situation réelle
