Les réseaux collocationnels dans la construction et l'exploitation d'un corpus dans le cadre d'une communauté de discours scientifique

Les corpus sont de plus en plus utilisés dans la lexicographie, en particulier pour les dictionnaires à utilisation pédagogique. bien que de nombreuses études basées sur des corpus spécialisés aient été entreprises, les résultats sont obères par la difficulté à définir clairement la représentativité...

Description complète

Enregistré dans:
Détails bibliographiques
Auteurs principaux : Williams Geoffrey (Auteur), Boucher Paul (Directeur de thèse)
Collectivité auteur : Université de Nantes 1962-2021 (Organisme de soutenance)
Format : Thèse ou mémoire
Langue : français
Titre complet : Les réseaux collocationnels dans la construction et l'exploitation d'un corpus dans le cadre d'une communauté de discours scientifique / Geoffrey Williams; sous la direction de Paul Boucher
Publié : 1999
Description matérielle : 1 vol. (337 p.)
Note de thèse : Thèse de doctorat : Linguistique : Nantes : 1999
Sujets :
Documents associés : Reproduit comme: LES RESEAUX COLLOCATIONNELS DANS LA CONSTRUCTION ET L'EXPLOITATION D'UN CORPUS DANS LE CADRE D'UNE COMMUNAUTE DE DISCOURS SCIENTIFIQUE
Description
Résumé : Les corpus sont de plus en plus utilisés dans la lexicographie, en particulier pour les dictionnaires à utilisation pédagogique. bien que de nombreuses études basées sur des corpus spécialisés aient été entreprises, les résultats sont obères par la difficulté à définir clairement la représentativité de tels corpus. Les communautés de discours c.d.) définies par Swales offrent un modelé intéressant puisqu'elles sont définies par rapport a leurs membres. Au lieu de faire appel à la notion abstraite de représentativité", le contenu peut être justifie comme étant "représentatif" d'une communauté définissable. Pour exploiter un corpus, il est nécessaire de le baliser en SGML afin de retenir les éléments importants de l'aspect physique des textes publi2s et de souligner les éléments à analyser. Notre corpus a été balisé suivant les recommandations de la TEI. L interprétation du balisage est proposée comme norme minimale pour le balisage de ce genre de corpus. L étude exploite surtout la notion distributionnelle de collocation comme facteur de cohérence textuelle. Les différentes théories actuelles de collocation sont illustrées avant de développer une définition plus textuelle des collocations et d'introduire les réseaux de collocations. La mesure statistique d'information mutuelle est employée pour extraire les réseaux d'un corpus sous-divisé par thème. Dans un corpus balisé selon la TEI la balise sert de pivot pour l'utilisation de collocations dans le développement de critères de sélection internes. L hypothèse est qu'en regroupant certains éléments lexicaux par leur balisage les thèmes majeurs d'un corpus peuvent être isolés par la collocation et la théorie des indices de polysémie de clear. Des réseaux de collocation sont extraits des sous-corpus afin d'illustrer les thèmes majeurs de la communauté de discours et les disciplines concernées
Variantes de titre : Collocational networks in the construction and exploitation of a corpus within the framework of a scientific discourse community
Bibliographie : Bibliographie : 145 réfèrences