Modèle d’Apprentissage par Renforcement pour le Routage des Données dans l’Internet des Véhicules
Date
2025
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
university of bordj bou arreridj
Abstract
Cette thèse propose une approche innovante pour optimiser le routage dans les
réseaux Internet of Vehicles (IoV) en intégrant l’apprentissage par renforcement, et
plus précisément le Q-learning, afin d’améliorer la stabilité des connexions entre les
véhicules. L’objectif principal est de réduire les handovers inutiles qui affectent négati
vement la Qualité de Service (QoS) dans des environnements dynamiques. Après une
étude approfondie des architectures IoV et des limitations des protocoles existants, une
amélioration du protocole DSRC/C-V2X est introduite. Le modèle développé anticipe
intelligemment les décisions de handover en fonction des conditions du réseau, minimi
sant ainsi les basculements fréquents de protocole. Les performances du système ont
été évaluées à travers des simulations réalistes. Les résultats montrent une précision de
97,50%, un rappel de 97,55%, et un F1-score de 97,23%, indiquant une grande fiabilité
du modèle. La stabilité du processus d’apprentissage est confirmée par une perte de
0,0250 et une récompense cumulée de 160255340. Enfin, les tests démontrent une ré
duction significative des handovers inutiles (732 au total, dont 355 sont des ping-pong
handovers), une latence moyenne de 6,34 ms, et un PDR moyen de 0,922, surpassant les
méthodes traditionnelles basées sur des seuils fixes. Ces résultats soulignent l’efficacité
de l’approche proposée pour améliorer la QoS dans les réseaux IoV
Description
Keywords
Routage, Internet des véhicules, Apprentissage Automatique, Ap prentissage par Renforcement, Q-Learning, DSRC, C-V2X, Handovers.