Cette thèse présente un modèle de construction automatique et approximatif de la représentation du sens d'un texte. On adapte des techniques de documentation automatique à des bases documentaires non indexées. Les techniques classiques reposent sur une indexation vectorielle. Chaque document est représenté par un descripteur, on définit une distance entre ces descripteurs. L'accès aux documents pertinents est basé sur des calculs de proximité entre ces descripteurs. Une structuration du domaine, couvert par des documents, est obtenue par une classification (en anglais "clustering") faisant apparaître des thèmes sémantiques. Il faut améliorer les techniques en leur permettant de traiter les documents non indexés, en améliorant les résultats par une adaptation de connaissances linguistiques et une analyse des relations que marquent les cooccurrences entre termes.
Détails du livre: |
|
ISBN-13: |
978-613-1-56340-9 |
ISBN-10: |
6131563403 |
EAN: |
9786131563409 |
Langue du Livre: |
Français |
By (author) : |
Nicolas Turenne |
Nombre de pages: |
272 |
Publié le: |
09.03.2011 |
Catégorie: |
Informatics, IT |