Retour

Apprentissage statistique et Extraction de concepts à partir de corpus

Editions universitaires europeennes ( 09.03.2011 )

€ 79,00

Cette thèse présente un modèle de construction automatique et approximatif de la représentation du sens d'un texte. On adapte des techniques de documentation automatique à des bases documentaires non indexées. Les techniques classiques reposent sur une indexation vectorielle. Chaque document est représenté par un descripteur, on définit une distance entre ces descripteurs. L'accès aux documents pertinents est basé sur des calculs de proximité entre ces descripteurs. Une structuration du domaine, couvert par des documents, est obtenue par une classification (en anglais "clustering") faisant apparaître des thèmes sémantiques. Il faut améliorer les techniques en leur permettant de traiter les documents non indexés, en améliorant les résultats par une adaptation de connaissances linguistiques et une analyse des relations que marquent les cooccurrences entre termes.

Détails du livre:
ISBN-13:	978-613-1-56340-9
ISBN-10:	6131563403
EAN:	9786131563409
Langue du Livre:	Français
By (author) :	Nicolas Turenne
Nombre de pages:	272
Publié le:	09.03.2011
Catégorie:	Informatics, IT

Apprentissage statistique et Extraction de concepts à partir de corpus

Détails du livre: