Accueil du site > Actualités > Soutenances de thèses > Modélisation et fouille de discussions du Web

Soutenances de thèses

envoyer l'article par mail title= envoyer par mail Version imprimable de cet article Version imprimable Augmenter taille police Diminuer taille police

STAVRIANOU Anna : Modélisation et fouille de discussions du Web

Soutenance : lundi 1 février 2010 à 14h00, à la salle de conférence de l’IUT, 160 BOULEVARD DE L’UNIVERSITE - 69500 BRON (Campus de Bron de l’Université Lumière Lyon2).
Jury : Jean-Gabriel Ganascia (Université Paris 6), Pascal Poncelet (Université Montpellier 2), Marc El-Beze (Université d’Avignon), Stefan Trausan-Matu (Académie Roumaine), Jean-Hugues Chauchat (Université Lyon 2), Julien Velcin (Université Lyon 2).

Le développement du Web 2.0 a donné lieu à la production d’une grande quantité de discussions en ligne. La fouille et l’extraction de données de qualité de ces discussions en ligne sont importantes dans de nombreux domaines (industrie, marketing) et particulièrement pour toutes les applications de commerce électronique. Les discussions de ce type contiennent des opinions et des croyances de personnes et cela explique l’intérêt de développer des outils d’analyse efficaces pour ces discussions.
L’objectif de cette thèse est de définir un modèle qui représente les discussions en ligne et facilite leur analyse. Nous proposons un modèle basé sur des graphes. Les sommets du graphe représentent les objets de type message. Chaque objet de type message contient des informations comme son contenu, son auteur, l’orientation de l’opinion qui y été exprimée et la date où il a été posté. Les liens parmi les objets message montrent une relation de type "répondre à". En d’autres termes, ils montrent quels objets répondent à quoi, conséquence directe de la structure de la discussion en ligne.
Avec ce nouveau modèle, nous proposons un certain nombre de mesures qui guident la fouille au sein de la discussion et permettent d’extraire des informations pertinentes. Les mesures sont définies par la structure de la discussion et la façon dont les objets messages sont liés entre eux. Il existe des mesures centrées sur l’analyse de l’opinion qui traitent de l’évolution de l’opinion au sein de la discussion. Nous définissons également des mesures centrées sur le temps, qui exploitent la dimension temporelle du modèle, alors que les mesures centrées sur le sujet peuvent être utilisées pour mesurer la présence de sujets dans une discussion.
La représentation d’une discussion en ligne de la manière proposée permet à un utilisateur de "zoomer" dans une discussion. Une liste de messages clés est recommandée à l’utilisateur pour permettre une participation plus efficace au sein de la discussion.
De plus, un système prototype a été implémenté pour permettre à l’utilisateur de fouiller les discussions en ligne en sélectionnant un sous ensemble d’objets de type message et naviguer à travers ceux-ci de manière efficace.

Citer cet article : http://www.histoiredesmedias.com/Modelisation-et-fouille-de.html