Up dscussion technique help

Aide pour l'utilisateur

Cette page a pour but de fournir une aide à l'utilisation du progralmme de démonstration de l'analyseur de pitch.

La fenêtre principale

La fenêtre principale se présente comme suit :

MainForm.jpg (31192 bytes)

Elle représente le schéma bloc d'un analyseur de pitch de type SIFT. On peut voir dans la barre supérieure 2 boutons représentant des controles permettant soit de démarrer le traitement(rec.jpg (635 bytes)), soit de l'interrompre(stop.jpg (555 bytes)).  On peut voir dans la fenètre principale les différents blocs constituant l'analyseur. Trois de ces blocs sont configurables :

Emphasis : On peut régler l'importance de la pré-accentuation.

Maximum : On peut régler les paramètres de choix du maximum d'autocorrélation

Threshold : On peut régler les paramètre de décision du pitch et du caractère voisé ou non.

De plus des boutons contenant des flèches indiquant le sens de circulation des informations font apparaître des fenêtres donnant l'évlution du signal à un point particulier en fonction du temps. Voici ci-dessous un exemple type ne correpondant à aucun signal en particulier.

chartForm.jpg (47960 bytes)

Le bloc de pré-accentuation

En  cliquant sur ce bloc ,vous faites apparaître la fenêtre ci -dessous qui permet d'indiquer la quantité de pré-accentuation voulue.

Ce bloc est en fait un filtre FIR du 1er ordre et en jouant sur ce paramète,vous fixez l'importance de l'échantillon précédent dans la sortie du filtre.

emphasis.jpg (9352 bytes)

Le bloc de recherche du maximum

Ce bloc a pour but de retrouver le bon maximum d'autocorrélation de la tranche de signal considérée. Par "bon" maximum,il faut comprendre le maximum d'autocorrélation qui était déjà le maximum d'autocorrélation précédent même si sa fréquence  et sa valeur ont un peut changé. Cela nous permet d'introduire les paramètres suivants :

  1. La stabilité en fréquence : Il s'agit de la variation relative de la fréquence du maximum exprimée en pourcent. Plus ce seuil est faible moins on aura de chance de choisir un mauvais maximum mais plus on aura de chances de perdre le bon maximum si sa fréquence varie de façon trop impotante.
  2. 1ère séparation : Il s'agit du rapport entre la fréquence du premier maximum et celle du  second maximum.
  3. seuil pour la 1ère séparation : Il s'agit de la différence relative de niveaux entre les 2 maximas.
  4. 2ème séparation : Il s'agit du rapport entre la fréquence du premier maximum et celle du  second maximum.
  5. seuil pour la 2ème séparation : Il s'agit de la différence relative de niveaux entre les 2 maximas.

Ces quatre derniers paramètre servent à décider quel des maxima est celui qui résulte du maximum de la tranche précedente quand toutes les deux sont voisée. Ce sont ces paramètres qui permettent de suivre plus ou moins bien l'évolution de la fréquence du pitch.  

maximum.jpg (24655 bytes)

A droite de la fenètre se trouve une zone permettant la visualisation de l'importance de tels paramètres. Sa forme définitive n'est pas fixée et n'est pas fonctionnelle à l'heure actuelle.

Le bloc de discrimination par niveau

Ce bloc a pour but étant donné les informations sur le maximum de déterminer si la tranche de signal considérée est voisée ou non et par conséquence si la valeur du pitch à un sens ou non et ceci en tenant compte de la tranche précédente.

Cette approche "intelligente" requiert des paramètres pour définir les seuils de décisions.

Un première fréquence de discrimination est établie. Suivant celle-ci un seuil est établit par transformation de la fréquence du maximum d'autocorrélation par une fonction linéaire exprimée  par seuil = Si-Si Factor* echMax

Si est la valeur du seuil de référence

Si Factor est un coefficient de correction du seuil

echMax est l'index de l'échantillon maximum

Finalement un dernier paramètre appelé FS2 représente un facteur déterminant un second seuil en fonction du premier si le maximum est inférieur au seuil de référence. Il s'agit d'un seuil de "rattrapage" utilisé uniquement dans le cas où la tranche précédente est voisée.

threshold.jpg (22170 bytes)

A droite de la fenètre se trouve une zone permettant la visualisation de l'importance de tels paramètres. Sa forme définitive n'est pas fixée et n'est pas fonctionnelle à l'heure actuelle.