Abstract:
La détection de parole superposée est essentielle dans divers domaines tels que la reconnaissance vocale et la communication. Ce travail explore les techniques de modélisation statistique, en particulier les modèles ensemblistes (Arbre de décision, Random Forest et AdaBoost), pour améliorer la détection des voix simultanées dans les enregistrements audios. Nous analysons les différentes approches, de la collecte des données à l’évaluation des modèles, en mettant l'accent sur l'efficacité des modèles en environnements complexes. Les résultats montrent que la Forêt Aléatoire atteint une précision de 92%, ce qui est supérieur à celle de l'Arbre de décision (78%) et d'AdaBoost (85%). La Forêt Aléatoire se distingue par une capacité améliorée à différencier les classes, avec un taux de faux positifs réduit de 10% par rapport à AdaBoost et une meilleure gestion des bruits de fond dans des enregistrements à faible rapport signal/bruit (SNR).