Résumé:
Ce travail est le résultat d’une simulation et évaluation d’un système de segmentation, la segmentation et le regroupement des locuteurs reposent sur l'utilisation du critère d'information bayésien (BIC). Ce processus consiste à découper l'enregistrement audio en segments de parole et à les regrouper en fonction des caractéristiques identifiées par le BIC.
Nous avons évalué sa précision sur des enregistrements audio courts en réalisant une étude comparative dans deux scénarios : le premier sans interférence entre locuteurs et le second avec interférence.
Pour cette évaluation, nous avons utilisé plusieurs métriques d'évaluation. Pour ces métriques on a trouves les résultats, notamment la pureté (92.47%), la couverture (92.47%) , la fausse alarme (FA) (0%), la détection manquée (MD) (5.26%) et le taux d'erreur de segmentation (DER) est (7.91%).
Ces résultats mettent en évidence l'importance de prendre en compte les métriques d'évaluation appropriées pour évaluer les performances des systèmes de segmentation de locuteurs. Ils soulignent également la nécessité de développer des approches plus robustes pour gérer les situations d'interférence, afin d'améliorer les performances et l'applicabilité de ces systèmes dans des conditions réelles