[Publication] Détection des usagers de la route et estimation de leur mouvement dans une séquence vidéo ortho-photographique par deep learning

Sous titre
Ce travail combine simultanément trois algorithmes de machine learning dans le but de détecter les usagers traversant une zone filmée en top view, d’identifier leur type, de les localiser dans l’environnement, d’analyser leurs mouvements et d’estimer leurs vitesses.

Dans le contexte des villes intelligentes, la surveillance des mouvements des piétons et des véhicules est essentielle pour reconnaître les événements anormaux et prévenir les accidents.

La méthode proposée par nos chercheurs se concentre sur l'analyse des flux vidéo capturés à partir d'une caméra installée verticalement et sur la détection contextuelle des usagers de la route. La détection finale est basée sur la fusion des sorties de trois réseaux de neurones convolutionnels différents.

Nos chercheurs se sont intéressés simultanément à la détection des usagers, à l’analyse de leurs mouvements et à leur localisation dans l'environnement statique.

Ils ont utilisé YOLOv4 pour la détection d'objets, FC-HarDNet pour la segmentation sémantique de l’arrière-plan et FlowNet 2.0 pour l’estimation du flot optique dense. FC-HarDNet et YOLOv4 ont été entraînés avec leurs datas et images ortho-photographiques. La dernière étape a utilisé un module de fusion de données.

Les résultats montrent que cette méthode permet de reconnaître le type d'usager (piéton, cycliste, automobiliste), d'identifier les surfaces sur lesquelles ils se déplacent (chaussée, trottoir, pelouse) et d'estimer leur vitesse réelle.

Référence :

Titre : Contextual detection of pedestrians and vehicles in orthophotography by fusion of deep learning algorithms

Auteurs : Masoomeh Shireen Ansarnia, Etienne Tisserand, Patrick Schweitzer, Mohamed Amine Zidane et Yves Berviller

Nom de la revue : Sensors

Date de parution (en ligne) : Février 2022

Lien : https://doi.org/10.3390/s22041381

Légende de l'image : Résultats en situation réelle

Image
Résultats en situation réelle