Optic 2000 - Observatoire de la santé visuelle & auditive
Accueil > Demain > Réflexions autour de la santé de demain > Des espaces publics plus sûrs grâce à une analyse automatique des sons

Des espaces publics plus sûrs grâce à une analyse automatique des sons

Des chercheurs toulousains ont développé un outil informatique, appelé Audio Analytic Threat Detection (ATD), capable de détecter automatiquement les évènements sonores caractéristiques d’une situation dangereuse dans les lieux publics. Le système pourrait permettre aux agents de sécurité d’agir de manière plus ciblée et rapide.

©franckreporter

L’analyse sonore, rapide et facile à mettre en place

L’espace public se couvre de caméras de vidéosurveillance. Elles présentent cependant des limites, en plus de leur coût élevé. Les agents de sécurité doivent surveiller de multiples écrans en permanence, quand les caméras ne sont pas rendues inutilisables par des usagers malveillants. De plus, certains évènements gênants passent inaperçus, comme des agressions verbales qui ne dégénèrent pas en gestes. « Nous avions en tête ces limites dans la sécurisation de l’espace public quand nous avons décidé de miser sur l’audition et de développer un outil d’automatisation de la détection sonore » explique Julien Pinquier. Maître de conférences à l’Institut de Recherche en Informatique de Toulouse (IRIT), il a mené ce projet en collaboration avec d’autres chercheurs de l’IRIT et de la Maison des Sciences de l’Homme et de la Société de Toulouse, spécialistes de la perception auditive.

L’automatisation tente également de se développer dans le champ de l’analyse des images mais elle est beaucoup plus coûteuse en temps de calcul et en ressources, avec 25 images par seconde à analyser. « Une automatisation de l’analyse des sons peut donner des résultats une à deux secondes après l’évènement alors que pour les images, on peut espérer une réponse en une à trois minutes, ce qui peut être trop long pour agir dans certaines situations », détaille le chercheur.

L’algorithme développé devrait permettre non pas de se passer d’agents de sécurité mais de leur offrir une aide à la décision appréciable. La technologie permettra d’alerter les équipes de surveillance en utilisant différents niveaux de vigilance. Ces alertes peuvent indiquer à un opérateur de privilégier le visionnage d’une caméra parmi les autres, puis si besoin, de dépêcher une équipe sur place. Ce système s’appuie sur un réseau de microphones, le plus souvent déjà présents dans les espaces concernés et demande peu de puissance. Il est donc théoriquement facilement généralisable.

S’inspirer de l’expérience des agents de sécurité

D’autres projets ont déjà tenté de parvenir à automatiser l’analyse des sons d’ambiance. Ils ont souvent procédé par deep-learning, une intelligence artificielle qui « apprend » automatiquement, à partir de l’analyse d’un nombre très important de données, à repérer des situations anormales. « Les programmes déjà disponibles font souvent des erreurs : le plus souvent c’est le paramètre ‘intensité’ du son, qui est analysé comme un problème, d’où de nombreuses fausses alertes, comme des valises qui tombent. Les utilisateurs abandonnent rapidement l’usage de telles solutions », pointe Julien Pinquier.

Les équipes de Toulouse ont procédé autrement, en combinant des approches de sciences humaines (ergonomie du travail, psychoacoustique) et d’informatique (traitement du signal et apprentissage automatique). En plus de modélisations physiques des évènements sonores, les chercheurs ont inclus des groupes d’agents de sécurité expérimentés. Ils les ont interrogés sur les situations à risque qu’ils connaissent et les sons associés, les ont observés dans leur pratique, puis les ont soumis à des enregistrements pour « valider » les situations sonores. Les résultats obtenus ont été traduits dans un programme informatique. « Cela nous a permis de définir certaines typologies problématiques : par exemple quand une valise tombe, on entend simplement un bruit important, alors que suite à une explosion de pétard par exemple, le même bruit, mais suivi d’une phase anormale de silence, reflet de la sidération du public ». Certaines situations ainsi déterminées sont généralisables, tandis que d’autres devront être définies lieu par lieu (stations de métro, gares, centres commerciaux, aéroports…).

Le système ATD a été à ce jour validé sur des sons enregistrés ou synthétiques et doit être testé en situations réelles. Des partenariats avec des industriels sont déjà envisagés, notamment pour la surveillance de gros entrepôts.

Ne manquez pas les derniers articles de l'Observatoire de la santé visuelle et auditive.
> Inscrivez-vous à la Newsletter mensuelle.