Les réseaux collocationnels dans la construction et l'exploitation d'un corpus dans le cadre d'une communauté de discours scientifique

Les corpus sont de plus en plus utilisés dans la lexicographie, en particulier pour les dictionnaires à utilisation pédagogique. bien que de nombreuses études basées sur des corpus spécialisés aient été entreprises, les résultats sont obères par la difficulté à définir clairement la représentativité...

Description complète

Enregistré dans:
Détails bibliographiques
Auteurs principaux : Williams Geoffrey (Auteur), Boucher Paul (Directeur de thèse)
Collectivité auteur : Université de Nantes 1962-2021 (Organisme de soutenance)
Format : Thèse ou mémoire
Langue : français
Titre complet : Les réseaux collocationnels dans la construction et l'exploitation d'un corpus dans le cadre d'une communauté de discours scientifique / Geoffrey Williams; sous la direction de Paul Boucher
Publié : 1999
Description matérielle : 1 vol. (337 p.)
Note de thèse : Thèse de doctorat : Linguistique : Nantes : 1999
Sujets :
Documents associés : Reproduit comme: LES RESEAUX COLLOCATIONNELS DANS LA CONSTRUCTION ET L'EXPLOITATION D'UN CORPUS DANS LE CADRE D'UNE COMMUNAUTE DE DISCOURS SCIENTIFIQUE
LEADER 03836cam a2200445 4500
001 PPN053671325
003 http://www.sudoc.fr/053671325
005 20240531154500.0
029 |a FR  |b 1999NANT3023 
035 |a (OCoLC)490605562 
035 |a thL-00084422 
100 |a 20001218d1999 k y0frey0103 ba 
101 0 |a fre  |d fre  |2 639-2 
102 |a FR 
105 |a y m 000yy 
106 |a r 
181 |6 z01  |c txt  |2 rdacontent 
181 1 |6 z01  |a i#  |b xxxe## 
182 |6 z01  |c n  |2 rdamedia 
182 1 |6 z01  |a n 
183 |6 z01  |a nga  |2 RDAfrCarrier 
200 1 |a Les réseaux collocationnels dans la construction et l'exploitation d'un corpus dans le cadre d'une communauté de discours scientifique  |f Geoffrey Williams  |g sous la direction de Paul Boucher 
214 1 |d 1999 
215 |a 1 vol. (337 p.)  |d 30 cm 
320 |a Bibliographie : 145 réfèrences 
328 0 |b Thèse de doctorat  |c Linguistique  |e Nantes  |d 1999 
330 |a Les corpus sont de plus en plus utilisés dans la lexicographie, en particulier pour les dictionnaires à utilisation pédagogique. bien que de nombreuses études basées sur des corpus spécialisés aient été entreprises, les résultats sont obères par la difficulté à définir clairement la représentativité de tels corpus. Les communautés de discours c.d.) définies par Swales offrent un modelé intéressant puisqu'elles sont définies par rapport a leurs membres. Au lieu de faire appel à la notion abstraite de représentativité", le contenu peut être justifie comme étant "représentatif" d'une communauté définissable. Pour exploiter un corpus, il est nécessaire de le baliser en SGML afin de retenir les éléments importants de l'aspect physique des textes publi2s et de souligner les éléments à analyser. Notre corpus a été balisé suivant les recommandations de la TEI. L interprétation du balisage est proposée comme norme minimale pour le balisage de ce genre de corpus. L étude exploite surtout la notion distributionnelle de collocation comme facteur de cohérence textuelle. Les différentes théories actuelles de collocation sont illustrées avant de développer une définition plus textuelle des collocations et d'introduire les réseaux de collocations. La mesure statistique d'information mutuelle est employée pour extraire les réseaux d'un corpus sous-divisé par thème. Dans un corpus balisé selon la TEI la balise <rs> sert de pivot pour l'utilisation de collocations dans le développement de critères de sélection internes. L hypothèse est qu'en regroupant certains éléments lexicaux par leur balisage les thèmes majeurs d'un corpus peuvent être isolés par la collocation et la théorie des indices de polysémie de clear. Des réseaux de collocation sont extraits des sous-corpus afin d'illustrer les thèmes majeurs de la communauté de discours et les disciplines concernées 
456 | |0 246486732  |t LES RESEAUX COLLOCATIONNELS DANS LA CONSTRUCTION ET L'EXPLOITATION D'UN CORPUS DANS LE CADRE D'UNE COMMUNAUTE DE DISCOURS SCIENTIFIQUE  |f Geoffrey Williams  |d 1999  |c Lille  |n Atelier national de reproduction des thèses  |p Microfiches  |s Lille-thèses 
517 | |a Collocational networks in the construction and exploitation of a corpus within the framework of a scientific discourse community 
606 |3 PPN027487717  |a Lexicographie  |2 rameau 
606 |3 PPN033786488  |a Sciences  |x Terminologie  |2 rameau 
608 |3 PPN027253139  |a Thèses et écrits académiques  |2 rameau 
686 |a 410  |2 TEF 
700 1 |3 PPN08871618X  |a Williams  |b Geoffrey  |f 1956-....  |c linguiste  |4 070 
701 1 |3 PPN029644453  |a Boucher  |b Paul  |f 1947-....  |4 727 
711 0 2 |3 PPN026403447  |a Université de Nantes  |c 1962-2021  |4 295 
801 3 |a FR  |b Abes  |c 20240222  |g AFNOR 
979 |a DEC 
930 |5 441092103:811982408  |b 441092103  |j u 
998 |a 963447