ANALYSE DE SEQUENCES D'IMAGES POUR LES
APPLICATIONS TRANSPORT
|
|
When?
|
Friday, Jan. 27th, 2006, 10:00
|
|
Who?
|
François Cabestaing
, LAGIS Lab
|
|
What?
|
Dans ce
premier exposé, je présenterai les
activités de recherche menées au LAGIS dans le
domaine du traitement des séquences d'images
numériques, avec comme champ applicatif
l'amélioration de la sécurité dans les
moyens de transports terrestres. Plusieurs aspects liés
à l'intégration d'un système de vision
artificielle dans un véhicule ou dans une infrastructure
sont abordés, à savoir le
développement des algorithmes spécifiques, la
conception d'architectures dédiées servant de
supports à ces algorithmes et la validation
expérimentale des dispositifs. |
CLASSIFICATION DES SIGNAUX DANS UNE INTERFACE
CERVEAU-ORDINATEUR
- (BCI)
|
|
When?
|
Friday, Jan. 27th, 2006
|
|
Who?
|
François Cabestaing
, LAGIS Lab
|
|
What?
|
Dans le
deuxième exposé, je présenterai les
résultats obtenus
avec plusieurs collègues américains durant mon
séjour à Albany
en congé sabbatique en 2003. Nous avons comparé
différentes
techniques de traitement et de classification des signaux d'EEG
permettant d'extraire des informations pertinentes pour la
communication handicapé / ordinateur. La comparaison a
été
réalisée sur des données acquises
pendant plusieurs mois sur
8 individus. |
EXPLOITATION DE LA COULEUR POUR L'ANALYSE
AUTOMATIQUE D'IMAGES NUMERIQUES
|
|
When?
|
Friday, Jan. 27th, 2006
|
|
Who?
|
Ludovic Macaire, LAGIS
Lab
|
|
What?
|
Cette
présentation traite du traitement automatique des images
numériques couleur, dont l'objectif est de parvenir
à interpréter le contenu d'une image
analysée. La chaîne de traitements d'une image
couleur se décompose en plusieurs étapes
successives qui partent de l'analyse de la couleur de chaque pixel pour
obtenir une interprétation du contenu de l'image. Une fois
l'image couleur acquise par la caméra, se pose la question
du choix de l'espace de représentation de la couleur qui est
le mieux adapté aux traitements à effectuer sur
l'image. Dans la première partie, nous décrivons
la détermination d'espaces couleur hybrides
adaptés à des problèmes
spécifiques d'analyse d'images. La seconde partie est
dédiée à la segmentation par
classification de pixels qui tient compte des
propriétés couleur et spatiales des pixels. La
dernière partie est dédiée
à la reconnaissance d'objets éclairés
avec différents illuminants. Nous y présentons un
modèle original qui décrit les variations des
couleurs des pixels provoquées par des changements
d'illuminant. Un des champs d'application potentielle concerne la
surveillance de sites publics. |
MISO Super-Resolution Text
|
|
When?
|
Wednesday, June 15th, 2005, 10:00
|
|
Who?
|
Céline Mancas-Thillou, TCTS
Lab
|
|
What?
|
Due to
the increased use of embedded low-resolution imaging devices, such as
handheld PDAs and mobile phones, coupled with the need to extract
information accurately and quickly, super-resolution (SR) based
techniques are fast becoming a current focus of research in the field
of text recognition. SR processes the information from one (or more)
low-resolution, possibly noisy and blurred, image(s) of a scene to
produce a higher-resolution image (or sequence). SR methods can be
found in a multifarious range of imaging applications, such as remote
sensing,
microscopy and medical imaging, astronomical and space imaging,
surveillance and forensic imaging and many more.
While the area of super-resolution has been dealt with in fair depth in
recent years, it is only just becoming useful as an applicable stage in
improving text images, particularly for further processing,
transmission, and understanding on mobile and handheld devices. After
dealing with the general concepts of super-resolution, static
super-resolution will be highlighted. Then the main processing stages
involved will be described: motion estimation and registration, warping
and reconstruction, and deblurring and denoising. As a specific case
study, a description of a simple algorithm implemented in the
University of Bristol will follow by considering a camera-based text
resolution enhancement algorithm towards an embedded application. |
Étude quantitative et qualitative de
l'interprétation instrumentale et vocale
|
|
When?
|
Friday, June 10th, 2005, 10:00
|
|
Who?
|
Caroline Traube, Université
de Montréal
|
|
What?
|
Le LIAM
est affilié à la fois au secteur composition
électroacoustique et au secteur musicologie de la
Faculté de musique de l'Université de
Montréal et accueille des chercheurs et étudiants
provenant des différents domaines de la recherche en
musique.
Le LIAM se consacre principalement à l'étude
quantitative et qualitative du phénomène de
l'interprétation instrumentale et vocale, aux niveaux
acoustique, gestuel et perceptif (en particulier dimensions perceptives
et vocabulaire descripteur du timbre). Ce type d'étude vise
en particulier à établir les relations entre
paramètres structurels (dépendant de
l'instrument), paramètres de jeu (dépendant de
l'interprète) et attributs perceptifs du timbre
instrumental.
Cette présentation visera à exposer les
recherches menées par différents membres du LIAM
sur plusieurs instruments (guitare classique, piano,
flûte,...). Nous présenterons également
les recherches réalisées en collaboration avec
Nicolas D'Alessandro, doctorant au sein du service de TCTS,
basées sur les analogies perceptives entre sons de guitare
et sons vocaux. |
The Human Visual System (HVS)
|
|
When?
|
Wednesday, April 20th, 2005, 10:00
|
|
Who?
|
Matei Mancas, TCTS Lab
|
|
What?
|
This is
a brief description of the Human Visual System. First, the
"hardware" aspect of vision (acquisition : the eye(s)) will
be treated followed by a quick approach of the "software" aspect of
vision (analysis : the brain).
In the first part the evolution of the "eye" and the different kind of
eyes will be presented. A more detailed description of the human eye
will be achieved.
In the second part, we will see how the information goes to the brain
and where exactly in the brain. Finally some interesting
characteristics of our visual system related to pattern recognition
will be shown. |
Synthèse de l'imitation vocale et
représentation graphique des gestes
phonétiques sous-jacents à la description du
timbre de la guitare classique.
|
|
When?
|
Wednesday, March 23rd, 2005, 10:00
|
|
Who?
|
Nicolas D'Alessandro, TCTS Lab
|
|
What?
|
La
guitare est un instrument qui permet la production d’une
très vaste palette de timbres. Les guitaristes utilisent un
large vocabulaire pour qualifier les timbres qu’ils
produisent sur leur instrument. Ces adjectifs font
référence aux différents domaines
sensoriels : sombre, chocolaté, transparent,
métallique, brillant, etc. Dans un contexte
pédagogique, la signification de ce vocabulaire ne semble
pas toujours être perçue clairement. L'objectif de
cette recherche est de concevoir
un outil informatique produisant la synthèse de l'imitation
vocale ainsi que la représentation graphique des gestes
phonétiques sous-jacents à la description du
timbre de la guitare classique, en fonction des paramètres
du geste instrumental et basé sur des analogies entre les
sons de guitare et les sons vocaux. À l'image de la
méthode traditionnelle d'enseignement du tabla, qui
s'effectue à l'aide d'onomatopées, l'imitation
vocale des timbres de guitare pourrait fournir un langage commun aux
interprètes de la guitare, complémentaire
à l'imagerie mentale qu’ils utilisent couramment. |
The TTSBOX: A matlab toolbox for teaching TTS
|
|
When?
|
Wednesday, March 16th, 2005, 10:00
|
|
Who?
|
Prof. Thierry Dutoit, TCTS Lab
|
|
What?
|
The paper presents a new toolbox for teaching
TTS syn-thesis. TTSBOX performs the synthesis of Genglish (for
”Generic English”), an imaginary language obtained
by re-placing English words by generic words. Genglish therefore has a
rather limited lexicon, but its pronunciation maintains most of the
problems encountered in natural languages.
TTSBOX uses simple data-driven techniques (Bigrams, CA-RTs, NUUs) while
trying to keep the code minimal, so as to keep it readable for students
with reasonable MATLAB practice. TTSBOX was designed with the hope that
it can help to increase the personal involvment of undergraduateand
graduate students in their TTS courses.
The paper providing details about the TTSBOX can
be found at :
http://tcts.fpms.ac.be/publications.html
|
The 'Pronunciation Trainer'
|
|
When?
|
Wednesday, February 23rd, 2005, 10:00
|
|
Who?
|
Thomas Hansen, NISLab, Danmark
|
|
What?
|
My talk today will mainly center around a
project in the area of computer assisted language learning, that I have
been working on for a little over a year. The aim of the program is to
teach pronunciation to foreigners arriving in Denmark for various
reasons.
The 'Pronunciation Trainer' consists of two separate yet interdependent
pieces of programming, namely the so called Listening coach which was
designed to take perception theory into account and the
Pronunciation trainer, which allows you to interact with an
ASR based piece of sofware that evaluates the intelligibility of your
language.
The program(s) attempt to take a pedagogical approach to language
learning while being aware of the shortcomings of present day
technology.
|
Brain-computer interfaces
|
|
When?
|
Friday, April 9th, 2004, 14:00
|
|
Who?
|
Burak Arslan
|
|
What?
|
A Brain Computer Interface is a device, which
enables people to interact with computer-based systems through
conscious (or semi conscious) control of their thoughts. In this talk,
a brief survey on the BCI research will be presented with complimentary
background info. Film lovers and conspiracy theoreticians are also
invited to speculate about its present or possible use.
|
Cross-Lingual Natural Language Technologies
|
|
When?
|
Wednesday, March 31st 2004, 16:00
|
|
Who?
|
Roberto Pieraccini, IBM T.J.Watson
Research Center, Yorktown Heights, NY 10598
|
|
What?
|
The amount of information available and created
each
day is so large that humans cannot take advantage of it without the
help of search and analysis programs. It is estimated today that 85% of
the information is in an unstructured form, such as text, audio, video,
images, etc., thus not readily available for automatic processing. For
textual information we have the additional problem of different
languages, which create a barrier to the consumption of information.
Given the unstructured and multilingual nature of the information,
research has to focus on various analysis techniques that would make it
possible to extract structured information from raw natural language
text in different idioms, alphabets, scripts and encodings. Those
techniques, ranging from cross-lingual information retrieval and
machine translation to semantic information extraction, are
particularly suited to statistical machine learning approaches. In this
talk I will give a general overview of the research in statistical
natural language processing across different languages carried out at
the IBM T.J. Watson Research Laboratories.
|
Procédés d'analyse
automatique du sommeil
|
|
When?
|
Friday 19/09/03, 14:00
|
|
Who?
|
Stéphanie Devuyst, TCTS Lab
|
|
What?
|
Etat de l'art des techniques d'analyse
d'enregistrements polysomnographiques
(Electoencéphalogrammes,
électooculogramme, etc).
L'objectif est de voir ce qui se fait en matière
d'élimination des artéfacts, d'extraction de
"features", et de classification en stades du sommeil.
|
Draft Standard for Part 15.4 : Wireless Medium
Access Control (MAC) and Physical Layer (PHY)
specifications for Low Rate Wireless Personal Area Networks (LR-WPANS)
|
|
When?
|
Friday 08/08/03, 10:00
|
|
Who?
|
Baudry Hanotier, MULTITEL
|
|
What?
|
The new IEEE 802.15.4 protocol defines the
physical layer and the
MAC sublayer of the ISO-OSI stack. 802.15.4 is defined for Low Data
Rate -
Wireless Personal Area Networks (LR-WPANS). Such networks are used to
convey
information over short distances via radio communication. 802.15.4 is
especially targeted for use with low complexity, ultra low cost and
ultra
low power consumption devices. It allows up to 255 devices to
communicate at
data rates of 20kb/s, 40kb/s or 250kb/s in an operating space of at
least 10
meters.
|
OntoCode, Interface multimodale pour la
recherche d’informations guidée par ontologie
|
|
When?
|
Friday 14/02/03, 15:00
|
|
Who?
|
Davy Boonen, MULTITEL
|
|
What?
|
Présentation d’une
interface multimodale
pour la recherche d’informations guidée par une
ontologie.
On a implémenté un assistant d’encodage
de
données bio-médicales en J2SE. Cet outil est
commandé par le clavier, la souris ou la voix.
L’intégration de STRUT est rendue possible par
l’interface JNI. Le vocabulaire pour la reconnaissance vocale
est
recompilé à la volée grâce
à la
structuration hiérarchique des données. Enfin, le
réseau sémantique derrière
l’ontologie
bio-médicale (Unified Medical Language System) permet la
classification automatique des concepts
sélectionnés et
propose des clusters de chemins alternatifs dans le même
voisinage sémantique.
|
A study about multisensor data fusion
algorithms for trains
|
|
When?
|
Friday 07/02/03, 10:00
|
|
Who?
|
Silvio Dupont Fereira, MULTITEL
|
|
What?
|
The presentation describes the results of a
study about multisensor data fusion algorithms that can be used for a
train navigation system. It focuses on algorithms for sensor fault
detection and isolation (FDI). The objective of the study was to
provide Alstom Transport Charleroi with a survey of FDI algorithms in
order to help them in the choice of odometry algorithm. The algorithms
were implemented in Matlab and experimented with sensor measurements
taken in real conditions. The results prove that the most effective FDI
algorithm is based on Kalman filtering. The design is generic in the
sense that it can be applied with any combination of sensors measuring
any state variable (position, speed or acceleration).
keywords: sensor fault detection and isolation ; kalman filtering
|
XML et la standardisation des fichiers et
données médicales
|
|
Quand?
|
Le mercredi 18/12/2002, 14:00
|
|
Qui?
|
M. Dominique Tesse, informaticien, CHU
Charleroi
|
|
Quoi?
|
Un des futurs défis du monde
médical est
le transfert des données médicales via Internet.
Ceci
permet un gain de temps et d’argent. Cependant, ces
transferts
doivent être structurés sous peine
d’anarchie.
C’est à ce niveau qu’interviennent les
technologies
XML, qui permettent de structurer l’information.
Nous verrons :
- Le décor dans lequel se
déroule les différentes conceptualisation (HL7,
Open-EHCR,…)
- La structure des messages et quelques
explications relatives aux dictionnaires ;
- le Xschéma
développé pour les messages
électroniques ;
- la XSLT de validation
complémentaire ;
- une démonstration à
partir du site web du groupe DATA ;
|
Outils d'analyse et de recomposition des images
pour la réalité mélangée
|
|
Quand?
|
Le mercredi 18/12/2002, 14:00
|
|
Qui?
|
Prof. B.
Macq, Labo
TELE, UCL
|
|
Quoi?
|
L'évolution dans les communications
visuelles
va vers le concept de composition de scène. L'objectif n'est
plus seulement de réaliser le meilleur compromis
débit-distorsion mais de fournir un ensemble d'objets
visuels
à un programme qui en fonction des activations de
l'utilisateur
va fournir une scène visuelle adaptée.
Deux normes seront détaillées dans cet esprit. La
norme
MPEG-4 qui permet la composition de scènes hybrides
synthétique-naturel par la segmentation et la re-composition
d'objets et la norme JPEG-2000 qui fournit une
représentation
des images sous forme d'un train binaire flexible,
particulièrement utile pour la navigation dans les
méga-images.
|
Utilisation des technologies Java, XML et PKI
pour l'intégration d'applications eBusiness
|
|
Quand?
|
Le mercredi 11/12/2002, 15:00
|
|
Qui?
|
Eric Charles, Ir.,
Administrateur-délégué, U-Mangate , Parc
Scientifique Initialis, Mons
|
|
Quoi?
|
A préciser.
|
Les technologies vocales :
présentation et applications (Transparents)
|
|
Quand?
|
Le mercredi 11/12/2002, 14:00
|
|
Qui?
|
F. Bataille, Ir, Directeur technique, BABEL TECHNOLOGIES S.A.
|
|
Quoi?
|
Babel Technologies est un fournisseur de
technologies dans le domaine du
traitement de la parole. Les algorithmes qui ont
été développés
permettent l'intégration dans n'importe quelle application :
- de la reconnaissance de la parole
(Automatique Speech Recognition ASR)
- de la synthèse de la parole (Text
To Speech TTS)
- de la vérification du locuteur
Un court résumé des technologies existantes sera
suivi d'une présentation
plus approfondie de celles utilisées par Babel Technologies.
Ensuite, différents types d'applications utilisant ces
technologies seront
présentés.
|
Level Set & Fast Marching methods :
Discussion
|
|
Quand?
|
Le 03/12/2002, 10.30
|
|
Qui?
|
Raphael Sebbe
|
|
Quoi?
|
In this session, Raphael will give an overview
of the Fast Marching & Level Set methods for solving interface
evolution problems, their applications, as well as why and how they are
used for image segmentation.
|
Séminaire exceptionnel "Conception
d'un système embarqué pour le spatial" chez
ALCATEL-ETCA (Charleroi)
|
|
Quand?
|
Exceptionnellement, le JEUDI 28/11/2002,
à 14:00
|
|
Qui?
|
à confirmer
|
|
Quoi?
|
L'après-midi sera
consacrées à 4 exposés (à
confirmer), dans les locaux d'ALCATEL-ETCA :
- - Gestion du projet et contraintes du secteur
- - Technologies utilisables
- - Packaging
- - Exemple de réalisation ETCA
(probablement: système d'alimentation électrique
d'un satellite)
|
StrutSurfer: view, edit and play STRUT files.
|
|
Quand?
|
Le 22/11/2002, à 10.30
|
|
Qui?
|
Geoffrey Wilfart
|
|
Quoi?
|
StrutSurfer is a sound edition tool based on
KTH's WaveSurfer, dedicated to the STRUT toolkit.
|
Acquisition et traitement de signaux
biomédicaux
|
|
Quand?
|
Le mercredi 6/11/2001, à 15:00
|
|
Qui?
|
E. Stanus, Dr Ir, directeur du service
informatique du CHU Tivoli, à La Louvière.
Etienne Stanus était adjoint au directeur gestionnaire de
l'hôpital Erasme jusqu'en janvier
2001. Il a été chef de projet (signal
multidimensionnel)
chez Multitel ASBL, jusqu'en octobre 2002, date à laquelle
il a
pris ses nouvelles fonctions au CHU Tivoli. Il est également
membre de la commission "Normes en matière de
Télématique au service du
secteur des Soins de Santé" (Ministère des
Affaires
Sociales, de la Santé Publique et de l'Environnement
Administration des Soins de Santé)
|
|
Quoi?
|
Aperçu des techniques d'acquisition
et de traitement des signaux les plus courants :
- Électrophysiologie
- EEG
- EMG
magnétoencéphalographie
- cartographie de surface
- ECG
- vectocardiographie
- Détection des ronflements et
sybillances
- Mesures d'audition, ...
- Impédancemétrie:
application en pneumologie
- Imagerie médicale : imageurs RX,
nucléaires, MR
|
Le traitement d'images dans un environnement
temps réel : la visionnique
|
|
Quand?
|
Le mercredi 6/11/2002, à 14:00
(à confirmer)
|
|
Qui?
|
P. REPJUK, Ir., Administrateur
délégué de Capflow S.A.
|
|
Quoi?
|
La s.a. Capflow développe depuis 1995
un outil
logiciel et matériel permettant le prototypage rapide
d'applications visionniques temps réel. L'outil VisioFlex
est constitué de cartes électroniques et de
logiciels
entièrement développés dans
l'entreprise.
- présentation brève de
Capflow
- exposé : les applications de la
visionnique en milieu civil et industriel
- présentation du concept VisioFlex
(matériel et logiciel)
- présentation des applications
existantes construites avec l'outil Visio Flex
- perspectives d'avenir
|
Speech enhancement and the Multitel Aurora3
system
|
|
Quand?
|
Le 25/10/2002, à 10.30
|
|
Qui?
|
Stéphane Dupont
|
|
Quoi?
|
First, the talk will try to show the usefulness
and the limitations of
spectral subtraction and Wiener filtering for speech enhancement and
recognition of speech under noisy/mismatched conditions. A Wiener
filter implementation is available in STRUT. A demo of this
implementation will be presented, based on STRUTSurfer. This talk is
also intended to present the status of in-house work on the Aurora3
set of databases. An experimental setup has been developed as it was
necessary to assess our speech recognition engine on these reference
tasks (in addition to using the ETSI reference system). With the same
kind of acoustic features, this system has similar performance than
the ETSI system. Possible directions to improve the system will be
proposed.
|
Presentation of the strut2 train and log GUI.
|
|
Quand?
|
Le 18/10/2002, à 10.30
|
|
Qui?
|
Anders Eckersand
|
|
Quoi?
|
Installation of necessary packages.
Showing the new GUI, and explanation of new features for training of
models.
|
Application des techniques d'annulation d'echo
acoustique à la reconnaissance vocale
|
|
Quand?
|
Le 11/10/2002, à 10.30
|
|
Qui?
|
Mohammed Ben Aziz (TFE)
|
Scoring - Confidence meausres
|
|
Quand?
|
Le 13/09/2002, à 10.30
|
|
Qui?
|
Laurent Couvreur
|
Train dynamic state estimation by data fusion
techniques
|
|
When?
|
Friday 26/06/02, 15:00
|
|
Who?
|
François Meers, MULTITEL
|
|
What?
|
The problem deals with multi-sensor data fusion
applied to the
localisation of trains. In short, trains are equipped with on-board
speed
and acceleration sensors that are used to provide
an estimation of the position and of the speed of the train. This
estimation must be completed with a confidence interval, as this
odometric
equipment is used for automatic monitoring of
the train, which should be as safe as possible. The main difficulties
arise from the following facts: - the sensors sometimes do not work
properly; for instance, the accelerometer values are
biased by the track slope, and the wheel speed sensors provide
irrelevant
information in case of slipping or sliding of the wheel on the track -
the
level of confidence required is as high as
10e-9, which severely complicates the confidence interval computation
To
cope with these problems, train manufacturers intend to add a radar and
possibly satellite positioning to the
current equipment, composed of wheel sensors and possibly an
accelerometer. In terms of science disciplines, the problem deals with
state estimation with unknown dynamics in a
discrete and stochastic framework.
|
Simulation de lignes
téléphoniques
|
|
Quand?
|
Le 14/06/2002, à 10.30
|
|
Qui?
|
Gregory Lenoir (TFE)
|
Pronunuciation Modeling
|
|
Quand?
|
Le 24/05/2002, à 10.30
|
|
Qui?
|
Sandrine Pouysegur
|
ICSI + distributed speech recognition and the
Aurora3 evaluation
|
|
Quand?
|
Le 17/05/2002, à 10.30
|
|
Qui?
|
Stéphane Dupont
|
|
Quoi?
|
This talk first give an overview of current
research work at the
International Computer Science Institute. Then, I will give a summary
of the ETSI Aurora evaluation, which started 3 years ago and recently
converged to the publication of a standard for distributed speech
recognition. The algorithms that where developed for this competition
will not be discussed here: this will be the subject of a future talk.
|
Speaker Verification
|
|
Quand?
|
Le 26/04/2002, à 10.30
|
|
Qui?
|
Erhan Mengusoglu
|
RAD and VoiceXML
|
|
Quand?
|
Le 26/04/2002, à 10.30
|
|
Qui?
|
Olivier Pietquin
|
Voice Activity Detection
|
|
Quand?
|
Le 19/04/2002, à 10.30
|
|
Qui?
|
Raphael Sebbe
|
Python interface to STRUT
|
|
Quand?
|
Le 19/04/2002, à 10.30
|
|
Qui?
|
Geoffrey Wilfart
|
Le traitement d'images dans un environnement
temps réel : la visionnique
|
|
Quand?
|
Le mercredi 12/12/2001, à 15:00
|
|
Qui?
|
P. REPJUK, Ir., Administrateur
délégué de Capflow S.A.
|
|
Quoi?
|
La s.a. Capflow développe depuis 1995
un outil
logiciel et matériel permettant le prototypage rapide
d'applications visionniques temps réel. L'outil Visio Flex
est
constitué de cartes électroniques et de logiciels
entièrement développés dans
l'entreprise.
- présentation brève de
Capflow
- exposé : les applications de la
visionnique en milieu civil et industriel
- présentation du concept VisioFlex
(matériel et logiciel)
- présentation des applications
existantes construites avec l'outil Visio Flex
- perspectives d'avenir
|
Advantages of System On Programmable Chips
(SoPC)
for multimedia applications - Case Study : Motion JPEG
|
|
Quand?
|
Le mercredi 12/12/2001, à 14:00
|
|
Qui?
|
Olivier Cantineau, Ir, et L. Petit, Ir,
Barco-Silex
S.A.
|
|
Quoi?
|
Présentation d'une (des)
technologie(s)
du type SoPC (précisément un circuit programmable
de type FPGA intégrant
également un coeur processeur - exemple : Excalibur
d'Altera, qui intègre un
coeur ARM), afin d'en dégager les avantages dans le cadre
d'applications
multimédia, mais surtout de présenter un cas
concret de codeur/décodeur
Motion JPEG implémenté sur ce composant.
Ce séminaire abordera - en dehors de l'application - les
technologies très
récentes de SoPC, les contraintes et les atouts d'un
développement sur une
telle plateforme - ce qui constitue un excellent exemple de
développement
conjoint hardware/software sur un seul chip.
|
Automatic sleep-scoring software development
|
|
When?
|
Friday 30/11/01, 15:00
|
|
Who?
|
François Meers, MULTITEL
|
|
What?
|
This presentation will briefly review the
problem of automatic sleep
analysis. This automatization is wished to avoid tedious work to the
technicians, and should provide the doctor with the
hypnogram of the night (that is, the evolution of sleep stages along
the
night). The existing systems still lack of reliability and robustness,
and
this presentation will try to assess the
usefulness of state-of-the-art signal processing and classification
techniques to improve the classification performances.
|
Nouveaux moyens d'acces au WEB
|
|
Quand?
|
Le mercredi 14/11/2001, à 15:00
|
|
Qui?
|
S. Lecomte; Maître de
Conférence, Université de Valenciennes
Sylvain Lecomte est Maître de Conférences
à l'Université de Valenciennes
et est co-responsable de l'organisation du DESS en Technologies
Nouvelles
des Systèmes d'Information.
|
|
Quoi?
|
Le marché des ordinateurs individuels
(de type PC) a un plafond estimé à
100 millions d 'utilisateurs. A l'inverse de nouveaux moyens
d'accès au
WEB sont en plein developpement. On peut notamment citer :
- le Marché mondiale PDA (20
Millions d 'utilisateurs en 2001 dans le
monde, 80 Millions en 2008)
- le Marché mondiale
Téléphone mobile (20 Millions d 'utilisateurs en
2000 en France,500 à 1300 Millions dans le monde en 2004 (d
'après
Cahners In-Stat Group))
- le Marché de la
télévision interactive (la
télévision numérique
devient le support obligé à partir de 2004)
Cet exposé présente ces différents
supports (contrainte, capacité et
technologie)
|
Introduction au Streaming
|
|
Quand?
|
Le mercredi 14/11/2001, à 14:00
|
|
Qui?
|
J. Hanoteau, Ir, chercheur,
unité streaming, MULTITEL
ASBL
|
|
Quoi?
|
- Les bases du Streaming : défis,
solutions, techniques de compression, étude comparative des
produits, étude de marché, perspectives
d'évolution et démonstrations.
- SMIL le langage du Multimédia sur
Internet
|
Feuille de soins informatisée,
archivage,
dossier médical &
paramédical - Aspects techniques, légaux et
éthiques, introduction à la
télémédecine
|
|
Quand?
|
Le mercredi 7/11/2001, à 14:00
|
|
Qui?
|
E. Stanus, Dr Ir, Chef de groupe, MULTITEL ASBL
Etienne Stanus était adjoint au directeur gestionnaire de
l'hôpital Erasme jusqu'en janvier
2001; il est maintenant chef de groupe chez Multitel. Il est
également membre de la commission "Normes en
matière de
Télématique au service du
secteur des Soins de Santé" (Ministère des
Affaires
Sociales, de la Santé Publique et de l'Environnement
Administration des Soins de Santé)
|
|
Quoi?
|
Aspects informatiques : normes de
juré et de facto, ébauche de mise en pratique
Dossier patient : aspects légaux, contraintes INAMI, aspects
éthiques
Aperçu de ce qui existe en
télémédecine et des
problèmes inhérents à ce type de
pratique.
|
Acquisition et traitement des signaux
classiques de 1 à n
dimensions - Introduction aux normes de sécurité
et FDA
|
|
Quand?
|
Le mercredi 7/11/2001, à 14:00
|
|
Qui?
|
E. Stanus, Dr Ir, Chef de groupe, MULTITEL ASBL
Etienne Stanus était adjoint au directeur gestionnaire de
l'hôpital Erasme jusqu'en janvier
2001; il est maintenant chef de groupe chez Multitel. Il est
également membre de la commission "Normes en
matière de
Télématique au service du
secteur des Soins de Santé" (Ministère des
Affaires
Sociales, de la Santé Publique et de l'Environnement
Administration des Soins de Santé)
|
|
Quoi?
|
Aperçu des techniques d'acquisition
et de traitement des signaux les plus courants :
- Électrophysiologie
- EEG
- EMG
magnétoencéphalographie
- cartographie de surface
- ECG
- vectocardiographie
- Détection des ronflements et
sybillances
- Mesures d'audition, ...
- Impédancemétrie:
application en pneumologie
- Imagerie médicale : imageurs RX,
nucléaires, MR
|
A préciser
|
|
Quand?
|
Le mercredi 17/10/2001, à 15:00
|
|
Qui?
|
D. Voituron, Ir,
Administrateur-Délégué de B-Mind, S.A,
BMIND S.A.
|
|
Quoi?
|
A préciser
|
Les technologies vocales :
présentation et applications
|
|
Quand?
|
Le mercredi 17/10/2001, à 14:00
|
|
Qui?
|
F. Bataille, Ir, Directeur technique, BABEL TECHNOLOGIES S.A.
|
|
Quoi?
|
Babel Technologies est un fournisseur de
technologies dans le domaine du
traitement de la parole. Les algorithmes qui ont
été développés
permettent l'intégration dans n'importe quelle application :
- de la reconnaissance de la parole
(Automatique Speech Recognition ASR)
- de la synthèse de la parole (Text
To Speech TTS)
- de la vérification du locuteur
Un court résumé des technologies existantes sera
suivi d'une présentation
plus approfondie de celles utilisées par Babel Technologies.
Ensuite, différents types d'applications utilisant ces
technologies seront
présentés.
|
MULTITEL-TCTS Seminar : Robust Automatic Speech
Recognition in Reverberant Environments by Model Selection
|
|
When?
|
Friday, April 25th, 2001, 12:00 AM
|
|
Who?
|
Laurent Couvreur, Multitel
|
|
What?
|
This paper presents a method for robust
automatic
speech recognition (ASR) in reverberant environments. Our approach
consists in the selection during operation of an acoustic model out of
a library of models trained in various reverberant conditions. The best
model is selected by blindly estimating the full-band reverberation
time. The estimation procedure is entirely based on the short-term
log-energy sequence of the utterance to be recognized. Speech
recognition experiments in simulated and real reverberant environments
show the efficiency of our approach which outperforms standard channel
normalization techniques.
|
|
Where?
|
Faculté Polytechnique de Mons,
MULTITEL-TCTS Lab, Parc Initialis, Salle de réunion (2nd
floor)
Avenue Copernic, B-7000 MONS (see directions)
|
MULTITEL-TCTS Seminar : Introduction to
Reinforcement Learning and dialogue systems applications
|
|
When?
|
Friday, March 30th, 2001, 3:30 PM
|
|
Who?
|
Olivier Pietquin, TCTS Lab
|
|
What?
|
The reinforcement learning problem is defined as
learning how to map actions
to situations by interacting with an environement so as to maximize a
numerical reward. In the most challenging tasks, actions may affect not
only
the immediate reward but the next situation and, through that, all the
following rewards. Trial and error search and delayed rewards are the
most
important distinguishing features of reinforcement learning.
Reinfiorcement learning is different from supervised learning because
the
learning agent interracts directly with its environment to learn and it
doesn't need any examples provided by some knowledgable external
supervisor.
Another main key feature of reinforcement learning is that it
explicitly
considers the whole problem of a goal-directed agent interacting with
an
uncertain environment and does not define sub goals without addressing
how
they might fit into a larger picture. Reinforcement learning problem
may be
formally specified in terms of optimal control of Markov decision
processes.
Dialogue system strategies may also be expressed as Markov decision
processes (in terms of states and actions) and the problem of finding
optimal policies can be solved by using reinforcement learning
algorithms.
In order to simulate interractions with the envirronment, user modeling
may
be used to reduce the real human-machine interractions.
|
|
Where?
|
Faculté Polytechnique de Mons,
MULTITEL-TCTS Lab, Parc Initialis, Salle de réunion (2nd
floor)
Avenue Copernic, B-7000 MONS (see directions)
|
MULTITEL-TCTS Seminar : Prosody Reception in
Aphasia -- An Approach Toward Diagnostics with
Speech Synthesis
|
|
When?
|
Tuesday Jan 23rd, 2001, 11AM
|
|
Who?
|
Vivian Gramley, Ph. D. Student,
University of Bielefeld (dir.: D. Gibbon)
|
|
What?
|
I will talk about receptive dysprosody in
aphasic patients. Aphasic
patients do not only have problems understanding words and producing
them but they also have difficulties comprehending prosody and its
cues.
There do not exist any measures which help diagnose these deficits. I
am
therefore developing a test which will explore which prosodic cues
(duration, amplitude, fundamental frequency) aphasics cannot
understand.
The test sentences I use will be modified in such a way that the focus
of individual words is changed by a modification in the durational
pattern, the fundamental frequency, and the amplitude.
|
|
Where?
|
Faculté Polytechnique de Mons,
MULTITEL-TCTS Lab, Parc Initialis, Salle de réunion (2nd
floor)
Avenue Copernic, B-7000 MONS (see directions)
|
MULTITEL-TCTS Seminar : Bio-inspired methods
for automatic recognition of complex auditory signals
|
|
When?
|
Thursday Dec 7th, 2000, 3PM
|
|
Who?
|
Pierre-Edouard Sottas, EPFL,
Switzerland
|
|
What?
|
In response to complex signals, the peripheral
auditory system accomplishes a non-trivial mapping between an aerial
sound wave into a neural code.
The spike trains resulting from this preprocessing are then transmitted
to higher auditory centers where highly recurrent processing takes
place. This two-step biological mechanism will serve as a framework for
machine speech recognition. First, the auditory periphery is modelled
as a bank of
nonlinear time-varying parallel filters which includes an active and
distributed
feedback
based on physiological evidence from human outer hair cells
functioning. The patterns resulting from this bio-inspired feature
extraction process
were then used as an input to traditional speech recognition tools
based on
Hidden Markov Models. Recognition performance of such a preprocessing
is competitive with traditional methods for performing phone
probability
estimation and shows a high power of information reduction. Finally,
the process of recognition itself can be improved by the use of
"diffusion networks", a
model sharing the properties of both Hidden Markov Models and recurrent
neural networks.
|
|
Where?
|
Faculté Polytechnique de Mons,
MULTITEL-TCTS Lab, Parc Initialis, Salle des Séminaires
Avenue Copernic, B-7000 MONS (see directions)
|
MULTITEL-TCTS Seminar : Digital communications
using chaos
|
|
When?
|
Thursday Dec 7th, 2000, 4PM
|
|
Who?
|
Martin
Hasler, EPFL, Switzerland
|
|
What?
|
The various methods to transmit digital data on
a chaotic carrier signal are
explained and the role of chaos synchronization is elucidated. Then the
classical problem of analyzing the performance of such a communication
system in the presence of channel noise is posed and performance
figures for
simple systems are given and compared with those of classical
modulation
methods. The ideal chaotic receiver is derived in a simple case, its
exponential complexity in the transmitted signal length per bit is
shown and
efficient suboptimal methods of decoding are mentioned.
|
|
Where?
|
Faculté Polytechnique de Mons,
MULTITEL-TCTS Lab, Parc Initialis, Salle des Séminaires
Avenue Copernic, B-7000 MONS (see directions)
|
MULTITEL-TCTS Seminar :
Représentation de données statistiques complexes
à l'aide du son et du 3D
|
|
When?
|
Nov 28th, 2000, 3PM
|
|
Who?
|
M.
Noirhomme-Fraiture
|
|
What?
|
Représentation de données
statistiques complexes à l'aide du son et du 3D (en relation
avec le projet ISO-3D)
|
|
Where?
|
Faculté Polytechnique de Mons,
MULTITEL-TCTS Lab, Parc Initialis, Salle des Séminaires
Avenue Copernic, B-7000 MONS (see directions)
|
MULTITEL-TCTS Seminar : Issues in Concatenative
Speech Synthesis
|
|
When?
|
Nov 21th, 2000, 2PM
|
|
Who?
|
B. Bozkurt
|
|
What?
|
In concatenation based speech synthesizers, the
most important problem is
the proper fusion of units to achieve intelligible and natural sounding
synthetic speech. For that purpose, speech units need to be processed
and
concatenated so that mismatches at boundaries are reduced and target
prosody
features are imposed on synthetic speech with low segment concatenation
artifacts. Currently, there are plenty of techniques used by
researchers to
perform these operations. In this small presentation, mainly
application of
TD-PSOLA(Time domain overlap add), MBROLA(MBE Resynthesis overlap add)
and
HNM (Harmonic-Noise Model) on concatenation problem will be considered
for
discussion. Main concentration will be on problems in MBROLA synthesis
and
how to improve our synthesis technique. This presentation is rather a
problem statement and discussion on possible solutions of the problem
than
reporting the results of a study.
|
|
Where?
|
Faculté Polytechnique de Mons,
MULTITEL-TCTS Lab, Parc Initialis, Salle des Séminaires
Avenue Copernic, B-7000 MONS (see directions)
|
Joint SPHEAR -- RESPITE meeting
|
|
When?
|
Sept 15-17, 2000
|
|
Who?
|
Members of the RESPITE Project
|
|
What?
|
see here
for more info
|
|
Where?
|
Faculté Polytechnique de Mons,
MULTITEL-TCTS Lab, Parc Initialis
Avenue Copernic, B-7000 MONS
|
Confidence Measures in HMM/MLP Hybrid Speech
Recognition for Turkish
|
|
When?
|
Aug 31st, 2000, 10:30 AM
|
|
Who?
|
Erhan Mengusoglu, FPMs, TCTS
Lab
|
|
What?
|
Confidence Measures in HMM/MLP Hybrid Speech
Recognition for Turkish
Language.
Confidence Measure is defined as "posterior
probability of word
correctness given the values of some set of confidence indicators".
Some confidence measures will be presented.
Turkish language is an inflected language. It is
possible to produce a
very high number of words from the same root with suffixes.
Some possible language modelling techniques will be presented for
Turkish
Language.
Preparation of a small database for turkish
language will be presented.
(DUREE: 30' + QUESTIONS)
|
|
Where?
|
Faculté Polytechnique de Mons,
MULTITEL-TCTS Lab, Parc Initialis
Avenue Copernic, B-7000 MONS
|
TCTS group meeting: Where are we now, and where
do we go?
|
|
When?
|
Feb. 14th, 2000, 9:30 AM
|
|
Who?
|
O. Deroo, A. Ruelle, T. Dutoit,
FPMs, TCTS Lab
|
|
What?
|
This is our yearly meeting, where we focus on
past, current, and future projects for each research and development
group: Speech Recognition, Man-Machine Interfaces, Speech Synthesis.
|
|
Where?
|
Faculté Polytechnique de Mons,
MULTITEL-TCTS Lab, Parc Initialis
Avenue Copernic, B-7000 MONS
|
TCTS Seminar: Multi-microphone signal
enhancement
|
|
When?
|
December 21st, 1999
|
|
Who?
|
Simon Doclo, KULeuven, ESAT
Laboratory
|
|
What?
|
In many speech communication applications, like
audio-conferencing and hands-free mobile telephony, the recorded speech
signals contain a considerable amount of acoustic noise. Background
noise causes a signal degradation which can lead to total
unintelligibility of the speech and which decreases the performance of
speech coding and recognition systems. In this talk we will discuss
some multi-microphone
signal enhancement techniques for noise reduction. In the first part of
the talk standard fixed and adaptive beamforming techniques will be
discussed. The second part
of the talk will focus on a GSVD-based optimal filtering technique,
which has a better
noise reduction performance and which is more robust than standard
beamforming
techniques.
|
|
Where?
|
Faculté Polytechnique de Mons,
MULTITEL-TCTS Lab, Parc Initialis
Avenue Copernic, B-7000 MONS
|
ALIF Kick-off meeting
|
|
When?
|
February 24 & 25nd,
1999
|
|
What?
|
First meeting for the INCO-DC ALIF project,
officially started on Jan 1st, 1999.
The goal is to re-examine the technical annex of the project, in the
light of recent developments in TTS synthesis.
A new timetable will be established, for the years 1999-2000.
Participants: TTS
Team of TCTS Lab, IRSIT, OAPAM, UNAT, TANIT, TELMAT, (EPFL).
|
|
Where?
|
Faculté
Polytechnique de Mons (Salle d'Automatique: 3
on the map)
31 Bvd Dolez B-7000 MONS
|
MBROLA meeting
|
|
When?
|
October 2nd, 1998
|
|
What?
|
- What does it take to build an MBROLA
synthesizer in any given language?
- technical: hardware, preparation, time,
expertise
- linguistic: problems of vowel stress and
tone
- What can be done with other MBROLA tools to
build/exploit other language resources in that language, once the
synthesizer has been created?
- What next?
- adding languages: Swahili, Baule, Hausa,
...?
- is a full-IPA synthesizer realizable?
sensible?
Participants: TTS
Team of TCTS Lab, Didier Demolin and his group, Daffyd Gibbon
(Univ. Bielefeld), Peter
Ladefoged (UCLA). See photos
of the meeting.
|
|
Where?
|
Université
Libre de Bruxelles, Institut des Langues Vivantes et de
Phonétique
Campus du Solbosch
|
SPRACH/THISL Review Meetings (internal)
|
|
When?
|
March 24 & 25, 1998
|
|
What?
|
Simultaneous review meetings for two ESPRIT
research projects coordinated by the Faculté Polytechnique
de Mons: SPRACH
(SPeech Recognition Algorithms for Connectionist Hybrids, ESPRIT Long
Term Research RTD Project Ref. 20077) and THISL
(Thematic Indexing of Spoken Language, ESPRIT Long Term Research RTD
Project Ref. 23495.). Presentation of work programmes and advances.
Discussions with partners and reviewers. See the agendas.
|
|
Where?
|
Faculté
Polytechnique de Mons (Salle Macquet: 3
on the map)
31 Bvd Dolez B-7000 MONS
|
Festival Speech Synthesis System
|
|
When?
|
February, 27th, 1998 (10
AM - 11 AM)
|
|
What?
|
Anne Gilman (MULTITEL) gives a walkthrough of
FESTIVAL, a highly versatile, multilingual speech synthesis system. She
analyses the data structures and tools it uses and draws conclusions on
its potential interest for speech science. The talk is in English.
|
|
Where?
|
Faculté
Polytechnique de Mons (Salle de cours de Théorie
des Circuits: 3 on the map)
31 Bvd Dolez B-7000 MONS
|
Quantum Computers
|
|
When?
|
February, 20th, 1998 (2
PM - 3:30 PM)
|
|
What?
|
Video of a talk given by Nobel Prize winner
Richard Feynman at Bell Labs, in 1985.
"I would like to describe a field, in which
little has
been done, but in which an enormous amount can be done in principle.
This field is not quite the same as the others in that it will not tell
us much of fundamental physics (in the sense of, ``What are the strange
particles?'') but it is more like solid-state physics in the sense that
it might tell us much of great interest about the strange phenomena
that occur in complex situations. Furthermore, a point that is most
important is that it would have an enormous number of technical
applications.
What I want to talk about is the problem of
manipulating and controlling things on a small scale. Why cannot we
write the entire 24 volumes of the Encyclopedia Brittanica on the head
of a pin?"
|
|
Where?
|
Faculté
Polytechnique de Mons (Salle de cours de Théorie
des Circuits: 3 on the map)
31 Bvd Dolez B-7000 MONS
|
Plug and Play Software for Designing High-Level
Speech Processing Systems
|
|
When?
|
January, 30th, 1998 (10
AM - 11 AM)
|
|
What?
|
Talk given by T. Dutoit (in French)
PnP software is a simple and efficient way of
using
object oriented languages (and more specifically C++) as an extension
to function-based programming for high-level processes. This
programming paradigm mimics the inclusion and abstraction properties of
block-diagrams by allowing processes to be included into higher-level
processes and by describing each process at three different levels of
abstraction. It is based on a stream-like class hierarchy to be used as
IOs for the abovementioned processes.
|
|
Where?
|
Faculté
Polytechnique de Mons (Salle de cours de Théorie
des Circuits: 3 on the map)
31 Bvd Dolez B-7000 MONS
|
Transmission et codage d'images
numériques
|
|
When?
|
December, 16th, 1997 (2
PM - 5 PM)
|
|
What?
|
Talks on image coding and transmission by
researchers
of the Université de Valenciennes et du Hainaut
Cambrésis, OAE Lab (in French)
- F.X. Coudoux
- Amelioration de la qualité des
images decodees - L. Grimbert, P.Corlay
- Transmission de sequences MPEG2 sur ATM - M.Colin,
M.Gharbi
- Transmission ADSL
|
|
Where?
|
Faculté
Polytechnique de Mons (Salle de cours de Théorie
des Circuits: 3 on the map)
31 Bvd Dolez B-7000 MONS
|
Reconnaissance et codage d'images
numériques
|
|
When?
|
December, 15th, 1997 (2
PM - 5 PM)
|
|
What?
|
Talks on image coding and recognition by
researchers of the Ecole Royale Militaire, Brussels (in French)
- M. Acheroy
- ?
|
|
Where?
|
Faculté
Polytechnique de Mons (Salle de cours de Théorie
des Circuits: 3 on the map)
31 Bvd Dolez B-7000 MONS
|
Journées d'Etudes sur la Parole
|
|
When?
|
November 3rd, 1997 (9 AM
- 5 PM)
|
|
What?
|
A series of talks by specialists in Speech
Processing (in French)
- Nicolas Moreau
(ENST, Paris) - Compression de
sources sonores - Daniel Hirst
(Université d'Aix-en-Provence) - Traitement
du langage naturel - Thierry Dutoit
(Faculté Polytechnique de Mons) -
Synthèse de la parole - Hervé
Bourlard
(IDIAP, Suisse) - Reconnaissance
automatique de la parole
|
|
Where?
|
Faculté
Polytechnique de Mons (Salle Académique: 3
on the map)
31 Bvd Dolez B-7000 MONS
|