Générateur de légendes d’image utilisant CNN et LSTM

BESSA Youcef, KOUAR Rezki

→
Faculté des sciences et de la technologie
→
Département Electronique
→
Filière Electronique
→
Voir le document

Générateur de légendes d’image utilisant CNN et LSTM

BESSA Youcef, KOUAR Rezki

URI: https://dspace.univ-bba.dz:443/xmlui/handle/123456789/5002

Date: 2023-07-04

Résumé:

Le générateur de légende d'image est un modèle de réseau de neurones qui peut générer des légendes descriptives pour les images. Le modèle utilise un réseau CNN (convolutional neurone network) pour extraire les caractéristiques visuelles de l'image, qui sont ensuite alimentées dans un réseau LSTM (long short term memory) pour générer la légende. Le CNN est utilisépour extraire des caractéristiques de haut niveau à partir de l'image, telles que la forme et la couleur, tandis que le LSTM est utilisé pour générer une séquence de mots qui décrivent l'image. Le modèle est entraîné sur un grand ensemble de données d'images avec des légendes correspondantes, de sorte qu'il puisse apprendre à associer des descriptions textuelles aux caractéristiques visuelles. Le générateur de légende d'image est utile pour une variété d'applications, telles que la création de descriptions pour les images dans les bases de données d'images et les réseaux sociaux, la création de légendes pour les vidéos et les films, et même l'assistance pour les personnes ayant une déficience visuelle.

Afficher la notice complète