[Rapport de PFE ]Estimateur de mouvement 4SS

Introduction générale

1. Motivation

De nos jours, l'avènement de la vidéo numérique a été rendu possible principalement grâce aux
possibilités de compression. En effet, la compression vidéo permet de réduire le débit nécessaire
à la diffusion d'une émission, et facilite donc son transport sur tout type de réseau (hertzien,
internet, satellite, téléphone mobile, ...). Le coût de diffusion ainsi diminué permet d'envisager
une meilleure qu alité de service. L’évolution des standards de compression vidéo aboutit à
l'amélioration de l'efficacité de codage.

Au début des années 2000, une inflexion s’est produite. A la suite des recherches menées par
différents organismes de normalisation, une no uvelle technologie de compression des données
vidéo (H264) était développée. L’objectif était de réduire de moitié les débits utilisés avec
MPEG- 2. Concrètement, cela devait permettre, non seulement de diffuser de la vidéo sur des
supports qui ne le permettait pas jusqu’alors (Internet, ADSL…) mais aussi de multiplier le
nombre de programmes diffusés dans un même canal.
Les premières orientations de la norme ont été provisoirement reléguées au second plan et n’ont
guère été suivies de réalisations commerci ales concrètes. Seules quelques démonstrations
matérialisant les recherches effectuées par les sociétés phares (Envivio par exemple) ont été
présentées dans des salons spécialisés.

Aujourd’hui c’est cette deuxième piste, la réduction des débits, qui est essentiellement mise en
avant. Toutes les recherches, tous les développements industriels et toutes les démonstrations
vont dans ce sens. H264 sera utilisé dans la télévision numérique terrestre, la haute définition, les
nouveaux DVD mais aussi sur ADSL. Il est vrai que les progrès réalisés sont spectaculaires.
Lorsque les savoir- faire seront parfaitement maîtrisés, lorsque la technologie sera telle que l’on
pourra réaliser des processeurs plus performants et suffisamment rapides, alors les techniques de
codage des objets ressortiront de leurs cartons et les développements reprendront leur cours dans
le sens de l’interactivité. Ainsi, H.264 abaisse le débit nécessaire jusqu'à 50 % par rapport à son
prédécesseur MPEG- 4, ouvrant la voie à de nouveaux services, tels que la vidéo haute définition.
L'amélioration des performances de codage est obtenue au détriment de la complexité des
traitements. La quantité de calcul se révèle ainsi de plus en plus élevée à chaque génération de
codeur. Le passage à des formats, haute définition augmente encore très fortement cette
complexité [1].

L'estimation de mouvement est une opération clé pour la compression vidéo. Cette opération
contribue pour une grande partie à l'efficacité de la compression en éliminant les redondances
temporelles. Cette estimation représente la partie la plus critique dans un codeur vidéo et peut
atteindre (60%- 70%) en termes de complexité et temps de calcul. D’ailleurs la technique
d’estimation n’est pas définie par la norme et est laissée au concepteur de choisir la technique
d’estimation qui lui convient au mieux. Une estimation de faible qualité est souvent source de
problèmes importants comme par exemple des effets de blocs visuellement gênants. Ainsi,
depuis plus de vingt ans, son étude reste un sujet de recherche important. Les applications de
l'estimation de mouvement sont surtout la réduction de la redondance temporelle pour la
compression et l'analyse de scène. Pour cela, beaucoup de chercheurs ont proposé différentes
fonctions dans le but de formaliser un bon critère d’estimation de mouvement.

2. Objectifs

Ces activités de recherche entre nt dans le cadre de la conception d’un estimateur de mouvement.
Plusieurs travaux, concernant les modifications des performances des estimateurs de mouvement
suivant le changement de la nature de la vidéo, ont été effectués dans la littérature. Ces travaux
ont montré que chaque algorithme d’estimation est limité à un type précis de séquence vidéo, et
dans le cas des autres types il donne de mauvais résultats. Dans le cas des séquences rapides,
l’algorithme en quatre pas 4SS a donné des PSNR (sigle de Peak Signal to Noise Ratio : une
mesure de distorsion utilisée en image numérique ) et des taux de compression similaires et
meilleurs que les autres algorithmes en un temps très réduit.
L’algorithme de Recherche Complet (FS) s’adapte mieux aux applications nécessitant une
meilleure qualité vidéo en donnant toujours les meilleurs résultats en taux de compression et en
PSNR. L’inconvénient majeur de cet algorithme réside dans le fait qu’il est plus gourmand en
temps de calcul et en consommation de puissance. (On va détailler des différents algorithmes
dans le chapitre suivant).
L’objectif essentiel de ce travail est de construire une architecture d’un estimate ur de mouvement
qui intègre l’algorithme de recherche en quatre étapes (4SS) en VHDL.

3. Contribution

Pour ce fait nous avons établi, après avoir introduit à notre sujet, une étude bibliographique dans
laquelle nous avons décrit les travaux d’implantation du codec H.264 et de synthèse des
architectures d’estimation de mouvement de la famille Full Search et de la famille Fast Search en
s’intéressant plus particulièrement à l’algorithme 4SS.
Ensuite, une deuxième partie été consacrée à la conception d’un estimateur de mouvement de
type GALS intégrant l’algorithme de recherche en quatre étapes e n utilisant le langage VHDL et
nous nous sommes intéressé s à la simulation en utilisant le ModelSim. Enfin, nous avons élaboré
les conclusions et les perspectives attachées aux travaux menés dans le cadre de ce travail.

[Rapport de PFE ]Estimateur de mouvement 4SS

Introduction générale

1. Motivation

2. Objectifs

3. Contribution

4. Download

Formulaire de contact