StagePFE

[Rapport de PFE ]Estimateur de mouvement 4SS


Introduction  générale

1. Motivation

De nos jours, l'avènement de la vidéo numérique a été rendu possible principalement grâce aux
possibilités de compression. En effet, la compression  vidéo permet de réduire le débit nécessaire
à la diffusion d'une émission, et facilite donc son transport sur tout type de réseau (hertzien,
internet, satellite, téléphone mobile, ...). Le coût de diffusion ainsi diminué permet d'envisager
une meilleure qu alité de service. L’évolution des standards de compression vidéo aboutit à
l'amélioration de l'efficacité de codage.

Au début des années 2000,  une  inflexion  s’est produite.  A  la suite des  recherches  menées par
différents organismes de  normalisation,  une  no uvelle technologie de compression des données
vidéo  (H264)  était  développée.  L’objectif  était  de  réduire  de  moitié  les  débits  utilisés  avec
MPEG- 2. Concrètement, cela devait permettre,  non  seulement de diffuser de  la  vidéo sur des
supports  qui  ne  le  permettait  pas  jusqu’alors  (Internet,  ADSL…)  mais  aussi  de  multiplier  le
nombre de programmes diffusés dans un même canal.
Les premières orientations de la norme ont été provisoirement reléguées au second plan et n’ont
guère  été  suivies  de  réalisations  commerci ales  concrètes.  Seules  quelques  démonstrations
matérialisant  les  recherches  effectuées  par  les  sociétés  phares  (Envivio  par  exemple)  ont  été
présentées dans des salons spécialisés.

Aujourd’hui c’est cette deuxième piste, la réduction des débits, qui est essentiellement mise  en
avant.  Toutes  les  recherches,  tous  les développements  industriels  et  toutes  les démonstrations
vont dans ce sens. H264 sera utilisé dans la télévision numérique terrestre, la haute définition, les
nouveaux DVD  mais aussi sur ADSL. Il est  vrai que  les progrès réalisés sont spectaculaires.
Lorsque les savoir- faire seront parfaitement maîtrisés, lorsque la technologie sera telle que l’on
pourra réaliser des processeurs plus performants et suffisamment rapides, alors les techniques de
codage des objets ressortiront de  leurs cartons et  les développements reprendront leur cours dans
le sens de l’interactivité.  Ainsi, H.264 abaisse le débit nécessaire jusqu'à 50 % par rapport à son
prédécesseur MPEG- 4, ouvrant la voie à de nouveaux services, tels que la vidéo haute définition.
L'amélioration  des  performances  de  codage  est  obtenue  au  détriment  de  la  complexité  des
traitements. La quantité de calcul se révèle ainsi de plus   en plus élevée à chaque génération de
codeur.  Le  passage  à  des  formats,  haute  définition  augmente  encore  très  fortement  cette
complexité [1].

L'estimation  de  mouvement  est  une  opération  clé  pour  la  compression  vidéo.  Cette  opération
contribue pour  une  grande partie à  l'efficacité de  la compression en éliminant  les redondances
temporelles.  Cette estimation représente  la partie  la plus critique dans  un codeur  vidéo et peut
atteindre  (60%- 70%)  en  termes  de  complexité  et  temps  de  calcul.  D’ailleurs  la  technique
d’estimation  n’est pas définie par  la  norme et  est  laissée  au concepteur de choisir  la technique
d’estimation qui  lui  convient  au  mieux. Une estimation de  faible qualité est souvent source de
problèmes  importants  comme  par  exemple  des  effets  de  blocs  visuellement  gênants.  Ainsi,
depuis plus de  vingt  ans, son étude reste  un sujet de recherche  important. Les applications de
l'estimation  de  mouvement  sont  surtout  la  réduction  de  la  redondance  temporelle  pour  la
compression et  l'analyse de  scène.  Pour cela, beaucoup de chercheurs ont proposé différentes
fonctions dans le but de formaliser un bon critère d’estimation de mouvement.

2. Objectifs

Ces activités de recherche entre nt dans le cadre de la conception d’un estimateur de mouvement.
Plusieurs travaux,  concernant les modifications des performances des estimateurs de mouvement
suivant le changement de la nature de la vidéo, ont été effectués dans la littérature. Ces travaux
ont montré que chaque algorithme d’estimation est limité à un type précis de séquence vidéo, et
dans  le cas des autres  types  il donne de  mauvais résultats.  Dans  le cas des séquences rapides,
l’algorithme en quatre pas 4SS a donné des PSNR  (sigle de Peak Signal to Noise Ratio  :  une
mesure  de  distorsion  utilisée  en  image  numérique )  et  des  taux  de  compression  similaires  et
meilleurs que les autres algorithmes en un temps très réduit.
L’algorithme  de  Recherche  Complet  (FS)  s’adapte  mieux  aux  applications  nécessitant  une
meilleure qualité vidéo en donnant toujours les meilleurs résultats en taux de compression et en
PSNR. L’inconvénient  majeur de cet algorithme réside dans  le  fait qu’il est plus gourmand en
temps de calcul et en consommation de puissance.   (On  va détailler  des  différents  algorithmes
dans le chapitre suivant).
L’objectif essentiel de ce travail est de  construire une architecture d’un estimate ur de mouvement
qui intègre l’algorithme de recherche en quatre étapes (4SS) en VHDL.

3. Contribution

Pour ce fait  nous avons  établi, après avoir introduit à notre sujet, une étude bibliographique dans
laquelle  nous  avons  décrit  les  travaux  d’implantation  du  codec  H.264  et  de  synthèse  des
architectures d’estimation de mouvement de la famille  Full Search et de la famille Fast Search en
s’intéressant plus particulièrement à l’algorithme 4SS.
Ensuite,  une deuxième partie été consacrée  à  la conception d’un estimateur  de  mouvement de
type GALS intégrant l’algorithme de recherche en quatre étapes e n utilisant le langage VHDL et
nous nous sommes  intéressé s à la simulation en utilisant  le  ModelSim.  Enfin, nous avons élaboré
les conclusions et les perspectives attachées aux travaux menés dans le cadre de ce travail.

4. Download





Publier un commentaire

0 Commentaires