Une intelligence artificielle prédit le comportement des autres conducteurs sur la route
27/05/2022Des chercheurs du Massachusetts Institute Of Technology (MIT) ont conçu une intelligence artificielle capable de prédire efficacement les trajectoires futures de plusieurs usagers de la route.
Une intelligence artificielle pour sécuriser les véhicules autonomes
Via la prédiction du comportement des autres usagers, cette intelligence artificielle pourrait permettre à un véhicule autonome de naviguer de manière plus sûre dans les rues d’une ville. Pour cela, le système prévoit ce que les autres automobilistes, les cyclistes et les piétons sont sur le point de faire.
La prédiction comportementale est problématique. D’une part, les solutions d’intelligence artificielle actuelles peuvent être trop simplistes. Elles peuvent, par exemple, supposer que les piétons se déplacent toujours de manière rectiligne. D’autre part, elles peuvent également être trop conservatrices. Elles immobiliseront dans ce cas la voiture pour éviter les piétons. Enfin, parfois, elles ne sont capables que de prédire les prochains déplacements d’un seul agent alors que plusieurs conducteurs transitent généralement sur les routes.
Les chercheurs du MIT ont développé une solution d’une simplicité trompeuse à ce défi. En effet, ils procèdent à la division de la problématique de prédiction comportementale multi-agents en plus petits morceaux. Ensuite, ils s’attaquent au comportement individuel de chaque agent. Leur intelligence artificielle peut ainsi résoudre cette tâche complexe en temps réel.
Cadre de prédiction de l’IA
Dans un premier temps, les chercheurs ont établi un cadre de prédiction devinant les relations entre deux agents sur la route. L’intelligence artificielle devine quelle voiture, quel cycliste ou quel piéton a le droit de passage. L’IA détermine également quel agent cédera le passage. Elle utilise ensuite ces relations pour fournir une prédiction des mouvements futurs de plusieurs agents.
Les scientifiques ont constaté que la précision des trajectoires estimées par l’intelligence artificielle était supérieure à celle d’autres modèles d’apprentissage automatique. La technique du MIT a donné de meilleurs résultats que le modèle de Waymo, la société de conduite autonome. Par ailleurs, la division de la tâche de prédiction en plusieurs étapes a permis d’utiliser moins de mémoire pour cette technique.
Les chercheurs ont expliqué qu’il s’agissait d’une idée très intuitive que personne n’avait totalement explorée auparavant. Selon eux, cette technique fonctionne toutefois plutôt bien.
Ils ont comparé leur modèle d’apprentissage automatique avec d’autres modèles de pointe de ce secteur tels que celui de Waymo, société leader dans ce domaine.
« Sur ce terrain difficile, notre modèle atteint de meilleures performances », a déclaré Xin « Cyrus » Huang, étudiant diplômé au Département d’aéronautique et d’astronautique, co-auteur de cette recherche.
Plusieurs petits modèles d’intelligence artificielle
Les chercheurs ont nommé leur méthode d’apprentissage automatique « M2I ». Cette intelligence artificielle a deux entrées. La première concerne les trajectoires passées des automobiles, des cyclistes et des piétons interagissant au sein d’un environnement de circulation. Ce milieu peut par exemple être une intersection à quatre voies. La deuxième entrée est une carte où figurent les emplacements des rues et les configurations des voies.
Via ces informations, le prédicteur peut déduire lequel des deux agents peut passer en premier. L’intelligence artificielle classe ensuite un agent comme passeur et l’autre comme cédant. Un autre modèle de prédiction, dénommé « prédicteur marginal », déduit alors la trajectoire de l’agent passant car cet agent agit de manière indépendante.
Par la suite, un second modèle de prédiction, nommé « prédicteur conditionnel », déduit ce que l’agent cédant fera en fonction des actions de l’agent passant. De cette manière, l’intelligence artificielle prédit plusieurs trajectoires potentielles différentes pour l’agent cédant et pour l’agent passant. L’IA calcule ensuite la probabilité de chacune des trajectoires. Finalement, elle sélectionne six résultats ayant la probabilité de réalisation la plus élevée.
M2I établit ainsi une prédiction des déplacements d’un agent au sein du trafic durant 8 secondes. Durant les expériences, cette technique a par exemple fait ralentir un véhicule pour permettre à un piéton de traverser la voie. Le système a ensuite permis au véhicule d’accélérer une fois l’intersection dégagée.
Initialement, cette recherche se concentre sur les interactions entre deux agents. Toutefois, les chercheurs souhaitent que M2I soit capable de prédire les relations entre plusieurs agents. Le système pourrait ainsi deviner leurs trajectoires via la liaison de plusieurs prédicteurs marginaux et conditionnels.
Tests de conduite en situation réelle
Pour la formation de leurs modèles, les chercheurs du MIT ont utilisé l’ensemble de données Waymo Open Motion, une base de données de millions de scènes de circulation réelles. Ces situations sont enregistrées par des capteurs et des caméras Lidar (détection et télémétrie de la lumière) placés sur les véhicules autonomes de l’entreprise. Les scientifiques ont porté leur attention sur les cas avec plusieurs agents. Ils ont adopté une approche semblable à la manière dont un humain pense lors de son raisonnements au sujet des interactions avec les autres.
« Un être humain ne raisonne pas au sujet des centaines de combinaisons de comportements futurs. Il prend ses décisions assez rapidement », a expliqué Huang.
Étant donné que M2I décompose le problème en plus petits morceaux, un utilisateur peut comprendre la prise de décision du modèle plus facilement. De cette manière, les utilisateurs pourraient davantage faire confiance aux véhicules autonomes sur le long terme.
Toutefois, le cadre de prédiction n’est pas capable de tenir compte des situations où deux agents s’influencent mutuellement. Les chercheurs prévoient de remédier à cette limitation durant leurs recherches futures. Ils souhaitent également utiliser leur technique pour effectuer une simulation des interactions réalistes entre les usagers de la route. Cette simulation pourrait être utilisée pour la vérification des algorithmes de planification des voitures autonomes. Elle pourrait également servir à la création d’amples volumes de données de conduite synthétiques afin d’améliorer les performances du modèle d’intelligence artificielle.