L’objectif de ce livre est de définir la recherche des valeurs sémantiques des signes typographiques et de ponctuation. C’est l’un des premiers travaux linguistiques traités selon ce point de vue. En deuxième lieu, on s’intéresse à la segmentation automatique de textes, pour les applications d’extractions d’information par la réalisation de l’application SegATex (Segmentation Automatique de Textes). Cette application qui est destinée à baliser le texte, reste nécessaire et incontournable en linguistique informatique. Elle est fondée sur les marques pivot de ponctuation pour le déclenchement des règles de segmentation, et sur l’étude des contextes de ces marqueurs. SegATex ne se limite pas à la phrase, mais effectue la segmentation de toutes les parties d’un texte (items, des listes et des titres...). En troisième lieu, l’application CitaRE (Citation: Repérage et Extraction) est un outil de filtrage des informations citationnelles. Sa modélisation est fondée sur la recherche d’indices linguistiques et typographiques susceptibles de nous orienter vers la prise de décision adéquate pour confirmer la présence d’un discours rapporté (DR).

Détails du livre:

ISBN-13:

978-3-639-50292-3

ISBN-10:

3639502922

EAN:

9783639502923

Langue du Livre:

Français

By (author) :

Ghassan Mourad

Nombre de pages:

460

Publié le:

28.09.2016

Catégorie:

General and comparative linguistics