c
a
d
r
a
t






  Entrée  
   Études    
    Catégorisation  
     Convention  
 
+  Des ressources en corpus, isotopies et programmes
+  Des articles d’ études sur le traitement automatique de la langue
+  Les pages du site pour des recherches, informations, résumés...

     la description des mots composés      §IV.3. 
Les chapitres exposant la problématique du syntagme, à l’échelle de l’expression figée


 1.      IV.3.1.  classement

La quantité des mots composés, la variété des constructions, les divers degrés de figement et les multiples critères de classement sont tout autant de difficultés à la rédaction d'une base. La catégorisation va fusionner les mots à blanc (chapitre précédent, § IV.2.7.3.) à l'aide du graphème souligné, ou ligature _ . Pour décider de la fusion d'un syntagme, pour le faire entrer ou pas dans la base, nous allons dégager trois groupes de critères qui tiennent de la lexicologie et de l’informatique.

Les premiers sont essentiels, c’est-à-dire déterminants pour le choix du figement. Ils ressortent de la sémantique, avec la distance analogique et l'unicité du signifié. La seconde série fait intervenir les considérations propres au programme de catégorisation, à savoir la fréquence d’apparition, la finalité du traitement et le changement de catégorie. Les troisièmes confirment ou infirment les précédents, ce sont les opérations distributionnelles, les indices morphologiques, modaux et syntaxiques, et à une autre échelle, le contexte lexical.

Les descriptions qui suivent permettront de préciser les difficultés, poser les priorités, amenant à préférer tel ou tel critère. Cette préférence est motivée par la facilité de repérage qui permet de réaliser manuellement une liste. Le trait Cmps ou Locu est accolé à toutes les formes composées en fin de classe avant le genre et le nombre.


 2.      IV.3.2.  critères sémantiques essentiels

 2.1.      IV.3.2.1.  distance analogique

La métaphore est un phénomène récurrent de la langue, de l’étymologie aux figures de style, tout mot étant susceptible d’être imprégné d’un sens « figuré », « imagé » distinct du sens « propre », « littéral ». Il en est de même pour les mots composés : « [...] à toute vapeur, un nuage de (lait, poudre), fleur bleue, voir rouge. La métaphore est un facteur de figement sémantique. » (Lehmann, 1998 : 173).

Certaines métaphores peuvent facilement être reconstituées comme le « nuage de Tchernobyl... de sauterelles... de lait... » qui sont des nuages, sans toutefois répondre aux critères admis « Amas de vapeur [...] dans l’atmosphère. », et que le dictionnaire classe par analogie. En revanche, « la dragée haute », « fleur bleue », supposent une connaissance de l’expression, un contexte approprié, ou une association lexicale, l’emploi du verbe tenir pour le premier ne suffisant pas, celui-ci étant classé par le dictionnaire « locution » et le second « figuré ». 

Une différence est constatée dans les dictionnaires entre le « figuré » et la « locution figurée ». Citons dans Le Robert « arracher » : « Fig. Arracher qqn des bras de la mort, à la mort. Þ sauver. [...] Loc. fig. S'arracher les cheveux : être désespéré. », « accrocher » : « Fig. Arrêter (qqn) au passage pour lui parler. [...] Loc. fig. Il faut avoir le cœur bien accroché, ne pas être facilement écœuré, dégoûté. ».

Comme le montrent nos exemples du dictionnaire la forme seule est plus proche du sens initial. Les multiples distinctions et les différences d’opacités suggèrent qu’il y aurait plusieurs degrés dans la métaphore, que l’on pourrait baptiser distance analogique. Celle-ci ramènerait à la distinction dite componentielle, établissant la quantité de caractères communs à deux formes, et à celle des champs lexicaux, entre champ sémantique et champ notionnel.

Il pourrait être rajouté un degré, lorsque qu’une forme est très proche du sens initial, mais varie sur quelques aspects ou chargée d’un contexte particulier, par exemple pour un évènement historique ou une variante d’un phénomène. Un découpage dessinerait alors trois niveaux : une distance analogique forte relevant du métaphorique, du champ lexical notionnel, de la rareté de sèmes communs, voire de l’absence lorsque la motivation s’est perdue dans l’étymologie ; une distance analogique moyenne avec une partie de sèmes communs, un passage du concret au figuré ; une distance analogique faible, pour une signification proche, qui ne prend son sens complet qu’en fonction d’un contexte, hors énonciation.


Forte nuage noir
 (menace)
être dans le vent
 (mode)
Moyenne nuage de sauterelle
 (géométrie du nuage)
en coup de vent
 (mouvement du vent)
Faible nuage de Tchernobyl
 (l’évènement)
vent cosmique
 (en astronomie)
    A. Distance analogique  

Dans les discours évoquant l’idée d’un classement, la distance est nulle, mais elle se charge d'un certain contexte, par exemple pour les numériques : « Le degré zéro de l’écriture. » contre « Les secousses ont atteint le degré quatre sur l’échelle de Richter. »  ; « Le numéro un du triathlon. » contre « Le numéro 12 du classement officiel. » et suffisant pour un figement.

Le contexte, pour une distance faible, doit être minimal, c’est-à-dire qu’il ne peut se rapporter à la seule métaphore. Une expression telle que « malin comme un renard » ne rapporte qu’aux seules caractéristiques attribuées au renard. Son classement se référera avant tout à sa valeur d’adage, ses composantes syntaxiques, sa fréquence d’emploi, son expressivité. Ainsi, « vieux comme une tortue », n’est pas usité, et ne charge « vieux » que de manière incertaine, de « durée » ? de « lenteur » ? de « parcheminé » ? tandis que dans « vieux comme Hérode », apparaît clairement « le grand âge ». Il y a donc à la fois un contexte, à savoir ce que l’on entend par les caractéristiques du « renard », et un procédé métaphorique, où s’inscrit ce contexte. Le sens d’un mot du syntagme n’est parfois pas modifié par la métaphore, mais seulement précisé ou illustré.

Si le fait de lever une ambiguïté incline à prendre en considération le paramètre de la distance, les ambiguïtés contextuelles et donc souvent insolubles demeurent, qu’elles soient faibles, moyennes : « Elle l’a assommé d’un coup. » au sens de « soudainement », « un seul mouvement », ou fortes : « mettre la puce à l’oreille ».

En tant que paramètre de décision, le degré d’analogie ne serait pas prioritaire en raison de la lenteur de sa mise en œuvre, tout dépend de la transparence du statut du syntagme.


 2.2.      IV.3.2.2.  description de la reconstruction

Le critère de distance décrit au chapitre précédent repose sur le fait qu'il peut exister un décalage de signification entre les mots pris tels quels et le syntagme saisi dans son ensemble, « prédictible ou non prédictible (opaque) » (Eluerd, 41 : 2000). Pour exemple « activité de plein air » qui se laisserait classer parmi les mots composés, en vertu, au premier abord, d'un usage fréquent et d'un signifié abstrait, d’un prolongement concret de par l’équipement qu’il suppose, et se rapportant à une pratique facilement identifiable.

Envisagé en trois mots distincts et donc trois définitions, le sens diffère : il suppose en effet une action de durée conséquente, mais quelconque dans son objet « activité », pour un environnement ayant trait au cadre assez vaste de l’extérieur « air ». En y associant une compétence linguistique, il peut être supposé par exemple qu’il s’agit d’un métier, hyponyme de « activité » et que le cadre est restreint à l’aérien ou l’altitude pour « plein air ».

En connaissance de cause et sans recourt à la métaphore ou au contexte, le syntagme se ramène aux seuls loisirs, dans des lieux très variables pourvu qu'ils ne se déroulent pas en un lieu clos, comme un bâtiment à l'abri des intempéries. L'expression « activité de plein intérieur » est inusitée et « activité d'intérieur » ne rapporte à rien de certain hors contexte, si ce n'est le lointain écho suggéré par l'opposition de « plein air », et l'on préférera « sport de salle » ou à la rigueur ?« loisir d'intérieur ».

En dehors de connaissances idiomatiques mais perçus en contexte « plein air », « mis au propre », « bon sens », pourraient être reconstitués, comme c'est le cas chez des locuteurs étrangers et relativement familiers, en saisissant aussi le décalage sémantique, et sans faire appel à la métaphore. Les syntagmes s’imposent rapidement et assez clairement comme figés.

Une nouvelle illustration détaillée du degré d’analogie est donnée pour les verbes composés § IV.4.4.1.2. .


 2.3.      IV.3.2.3.  unicité du référent

Le fonds de connaissance commun qu’ont les locuteurs d’un mot est baptisé signifié. C’est ce que s’efforce de prolonger le dictionnaire. Quant au référent, il est la représentation dans le réel, la concrétisation, de ce que désigne le mot, en d'autres termes sa manifestation en dehors de la linguistique. Tout référent possède un signifié, le contraire n’est pas exact. Le « cheval » ramène à une chose délimitée, concrète. Le « pégase », bien qu’imaginaire, suppose une même autonomie et un soutien du concret du « cheval » et de l’ « oiseau ». L’ « électricité » est moins délimitable dans l’espace, plutôt en temps que matière, et possède un effet dans le réel. Le « sentiment », quant à lui, se laisse difficilement appréhender dans le réel, seulement par des voies indirectes, de la larme ou du rire, au référent par conséquent absent.

Il convient d'émettre des réserves en ce qui concerne la représentation du réel, par exemple lorsqu'il s'agit d'un édifice abritant une institution, pouvant recouvrir plusieurs lieux : « Sécurité sociale », « Chambre de commerce », et plus diffus encore, la représentation d’un savoir, un fait historique saisi comme un ensemble : « La seconde guerre mondiale », « Égypte des pharaons », ces derniers écartant la notion de référent à cause de leur ampleur. Ils sont toutefois figés dans la mesure où l’unicité s’applique au signifié dès lors qu’il délimite un domaine, historique ou scientifique : « intelligence artificielle », de distance analogique moyenne, « ingénierie linguistique », faible.

Ces notions, aussi fragiles soient-elles du point de vue de leur application, se révèlent efficaces pour distinguer un mot composé, dans la mesure où le signifié et plus encore le référent traduisent une unité et une spécificité de surface immédiatement perceptible. Cette représentation élémentaire du référent fait partie du patrimoine linguistique de n'importe quel locuteur d'une langue, et offre, a priori, une homogénéité dans l'appréciation. L’unicité pourra donc être prioritaire sur les autres critères. Il permet de distinguer clairement celle du référent « nuage de Tchernobyl », faiblement analogique, bien ancré dans le réel, de celle du signifié « nuage de point », plus métaphorique, d’un référent au support variable, sans identité propre, qui se figera du fait de son appartenance à un aspect précis du domaine mathématique, moyennement analogique.

Ce critère d’unicité variable fonctionne aussi pour des notions abstraites : « Puissance de feu contre puissance de foi » (Berroyer, magazine Yéti, déc. 1990, p. 41) est usité pour la première dans le vocabulaire militaire pour désigner le degré d'un armement offensif, tandis que le second syntagme n'est pas une particularité du vocabulaire religieux et désigne quelque chose proprement moins concis, qui se précise dans l’énoncé, ici par le chiasme.


 3.      IV.3.3.  critères propres à la catégorisation

 3.1.      IV.3.3.1.  changement catégoriel

L’on relève que le changement de catégorie ramène par exemple un groupe prépositionnel à un adverbe composé, « à tire d'aile ». Cette problématique rejoint celle de la question de fonction : « il parle à haute voix, il parle lentement, il parle fort,seul lentement peut être défini comme adverbe : à haute voix est simplement un groupe nominal en fonction circonstancielle » (Creissels, 1979 : 149).

La catégorisation fonctionne plus efficacement en transformant un groupe de formes en une seule. Un autre exemple est donné par un critère de soutien, dans la substitution catégorielle de l’ensemble des opérations distributionnelles, § 4.1.2. Ce critère n’est pas en soi déterminant, en revanche, il devrait trancher les hésitations, en raison de cette valeur de simplification.


 3.2.      IV.3.3.2.  finalité de la catégorisation

Le second critère peut infirmer le précédent. Il s'agit de la finalité de la catégorisation. Selon la tâche que l’on destine au corpus catégorisé, il peut être utile ou non de segmenter et fusionner les formes.

S'agissant d'un moteur de recherche, l'usage de mots-clés supposerait un corpus aussi découpé que possible, sauf si la catégorisation des mots composés consiste précisément à débrouiller ses ambiguïtés ; s'il s'agit d'une traduction, la fusion devrait au contraire être importante : selon la langue, un même concept est réalisé par un mot ou par un syntagme équivalent ; s'il s'agit d'un relevé lexicométrique concernant un fait linguistique, certaines fusions parasiteraient les résultats, par exemple sur les locutions verbales pour une étude du fonctionnement des substantifs privés de déterminants ; un corpus oral extrait d’une enquête sociolinguistique se devrait de retenir les figements de modalisation, même longs : « Ce que je veux dire », (voir l’exemple au chapitre 4.5.) ; enfin, si le travail se voue à l'étude littéraire, le texte pourrait se reporter à l'univers et les conventions des grammaires et des dictionnaires, avec l'avantage d'une certaine exhaustivité, mais la primauté apparente du déterminisme métaphorique, ou l'absence d'intérêt pour le critère de la longueur pourrait nous éloigner de nos préoccupations syntaxiques, « prendre la clef des champs » (Dict. élec. Hachette).


 3.3.      IV.3.3.3.  fréquence d’apparition

L’existence d’un fait de langue est pointée par la répétition d’un syntagme tout au long d’un corpus, dans la mesure où il est suffisamment vaste et représentatif. Ce critère de fréquence peut être un indice pour le critère du contexte lexical (§ 4.3.), dans le cadre d’un corpus identifié. L’apparition est quantifiable, ainsi le logiciel Lexico propose une fonction « segment répété », http://www.cavi.univ-paris3.fr/Ilpga/ilpga/tal/lexicoWWW/.

La première difficulté relève de la distinction entre mots pleins et mots-outils, lesquels sont susceptibles d’associations constantes et non nécessairement pertinentes au niveau du figement. Dans un second temps, il serait souhaitable d’établir un réseau de relation afin de juger de l’interconnexion des formes, et ce sur de nombreux plans, impliquant un programme prenant en compte des champs synonymiques, des séquences types et les opérations distributionnelles décrites dans le chapitre suivant.

Toutefois, si l’informatique peut apporter un éclairage non négligeable, son application pourrait rapidement se compliquer : « Mais il faut reconnaître que dans le domaine du syntagme il n’y a pas de limite tranchée entre le fait de langue, marque de l’usage collectif, et le fait de parole, qui dépend de la liberté individuelle. Dans une foule de cas, il est difficile de classer une combinaison d’unités, parce que l’un et l’autre facteurs ont concouru à la produire, et dans des proportions qu’il est impossible de déterminer. » (Saussure, 1916 : 173).


 4.      IV.3.4.  critère lexical et sémantique de soutien

 4.1.      IV.3.4.1.  opérations sur un énoncé

Les opérations distributionnelles visant à modifier le syntagme sont des processus peu intuitifs et longs à mettre en place. Elles consistent en plusieurs types de manipulations sur les formes : suppression, insertion, reprise et substitution. Il s’agit des opérations de base, que l’on pourrait pour un développement enrichir de tests de « passivation [...] focalisation [...] thématisation » (Hagège, 1986 : 323).


 4.1.1.      IV.3.4.1.1.  suppressions et insertions

La suppression d'une partie du syntagme nous permet de juger de la conservation du sens : « piste de danse », garde le sens de « piste », mais il ne reste que quelques sèmes pour la « cage » de la « cage d'ascenseur ». Le dictionnaire emploie les termes par extension ou par analogie. Cette opération permet d’illustrer le critère de productivité, § 4.2. .

D’autres formes ne possèdent quasiment aucune autonomie. Il s’agit des syntagmes cités dans le critère morphologique (§ 4.6.), « philosophale » s’employant difficilement sans sa « pierre ».

L'insertion à l'intérieur du syntagme, par exemple d'un adverbe de degré *« pomme assez de terre » ou d'un adjectif ?« pilote téméraire de transport », mais « avoir maintenant raison » est possible. Il faut donc appliquer cette opération selon le type de construction, nominale ou verbale.

L'avant dernier exemple connaît des variations. Il s'agit des formes au sens susceptible d'être reconstitué. « Le témoin regarda vers le banc vide des accusés », est moins insolite que notre exemple sur le pilote. Le critère du référent pour « banc des accusés » fonctionne pourtant très bien.


 4.1.2.      IV.3.4.1.2.  substitution

La substitution paradigmatique à un élément, nous indique que la « chaise longue » est différente du « fauteuil long » qui qualifie le fauteuil et une qualité de circonstance, et relève donc d’une amplification. Dans ce cas, cette opération appuie le test de l’unicité du référent. Certaines substitutions peuvent aboutir à des constructions inconnues : *« sous le tard », *« sur le tôt » n’existent pas à partir de « sur le tard ». D’autres formes permettent un nombre élevé de constructions, l’on parlera alors de critère de productivité, qui éloigne d’un classement comme mot composé.

La substitution catégorielle de l’ensemble opère pour les composés comme Pré + Nom + Nom , « à coeur joie », qui fonctionne syntaxiquement comme un adverbe, § 3.1. . Cette considération est importante pour la catégorisation car elle réduit le syntagme à un cas qui est peu ambigu, et plus facile à gérer dans la rédaction des règles. Par exemple pour associer l'auxiliaire au participe passé dans un temps composé : « Le recul de la mer avait *avoir Ver:IPqp+SG+P3 /amb en_peu_de_temps *en_peu_de_temps Adv:Temp/Cmps /amb changé *changer Ver:PPas+Mas+SG /amb les distances. » (L'œuvre au noir, Marguerite Yourcenar).


 4.1.3.      IV.3.4.1.3.  reprise

La reprise à l’intérieur de la proposition peut être appliquée en ne laissant apparaître qu’une fois un mot commun aux deux locutions : *« Il ramassa une pomme de terre et de pin. » et constater dans cet exemple que « de pin » n’est plus grammatical. La « pomme d’Adam » rappelle bien la pomme/fruit, pourtant le test ne n’opère toujours pas avec pomme : *« Il touche la pomme d’Adam et de l’arbre. ». Le test fonctionne avec « Il pose le valet de carreau et de trèfle. » Le « valet de cœur » entre dans un système du jeu de carte, et la « pomme de terre » ne connaît pas de système *« pomme de mer », *« pomme de désert ». Il s’agit alors d’une substitution paradigmatique, qui éclaire l’origine de l’unicité du référent : élément d’un tout ou tout lui-même.

La reprise à l’extérieur de la proposition consiste à juger si l’un des mots peut fonctionner seul : *« La pomme de terre est un légume et cette pomme/terre est à la base de la purée. » tandis que : « Le valet de pique est une carte et ce valet/pique bat d’autres cartes. » L’on retrouve notre critère de suppression.


 4.2.      IV.3.4.2.  productivité

Comme développé dans le chapitre suivant sur le contexte lexical et ébauché dans le test de suppression § 4.1.1., certains mots sont particulièrement productifs. Le syntagme « la nation suisse » respecte le critère d’un signifié unique et durable, mais « nation » appelle des adjectifs très variables. De même, « vieux comme Hérode. » montre une construction proverbiale stable, forme + comme + forme , mais difficilement dénombrable, le vocabulaire Robert et Nathan en cite 400.

À l’inverse d’autres le sont faiblement. L’adjectif « pérenne » va volontiers s'asscoier au giron de « emploi », jusqu'à être plus ou moins exclusifs, pour « vairon » avec « oeil ». Les mots devenant syntagmes ne sont donc, productifs ou pas, que des précisions. Mais la différence et qui peut incliner à classer « emploi pérenne » dans les mots composés, est qu’il entre dans un système d’opposition : « emploi précaire », mu par un contexte d’actualité sociale, se chargeant ainsi d’une spécificité, qui ramène au degré faible de la distance analogique. Quant à « œil vairon », il s’agit de déterminer si la caractéristique est suffisamment exceptionnelle ou si elle entre dans un système de complémentarité, à rapprocher du « valet de trèfle », chap. précédent 4.1.3. et du contexte lexical, au suivant, 4.3. .

La séquence « dit-il » qui apparaît en incise dans un discours rapporté serait rapidement pointée par le critère de fréquence. Mais la présence d’un mot-outil et par conséquent sa trop grande productivité « dit l’homme... raconta ce dernier... fit-il remarquer... » en limite le classement, sauf si le critère modal est pris en considération. En somme, en appliquant le critère de permutation paradigmatique ou de suppression, l’on ne fait que révéler la productivité, et donc fournir un indice pour un autre critère.

La productivité est un critère sécondaire car le syntagme doit être étudié en premier lieu pour lui-même, avec des tests distributionnels, ou en fonction de son référent, sa propension à l’adage, sa modalisation… en effet, des structures syntaxiques semblables et des sémantiques voisines ne font que parasiter sa spécificité.


 4.3.      IV.3.4.3.  contexte lexical et la complémentarité

Certains syntagmes tels que « piste de danse », « permis de conduire », « courant électrique », « pilote de ligne » ne connaissent pas de variations sémantiques, ayant même sens mot à mot ou figés, alors de distance analogique nulle. Ils possèdent un référent et un signifié entendu, par exemple « ligne » dans sa définition de « service assuré sur un parcours aérien ».

Ce type de construction fonctionnerait aussi pour « pilote de Simoun », ce qui pourrait entraîner un nombre quasi-illimité de syntagmes figés dès lors que le modèle d'avion entre en jeu, de même que « permis de chasse », « courant alternatif », assez productifs. Il nous faudrait alors éliminer ce type de construction. Mais certains syntagmes charrient tout un ensemble de référence, comme « chasse à courre », plus chargé que « chasse à la bécasse », et ramène à une distance analogique faible, d’autant que le premier est marqué d’un indice morphologique.

Le syntagme « pilote de ligne » prend son sens par rapport à « pilote de chasse », qui est une approche différente de la fonction de pilote et pas seulement des spécialités ou des compétences. L’on constate qu'un syntagme comme « pilote de métier » fonctionne de la même manière. S’il est retenu cette notion de différence de rôle ou de champ d'action, il faudrait ajouter à la liste un nouveau groupe d'associations « pilote amateur », « pilote instructeur ».

Pour résoudre ces problèmes de démultiplication, il convient de prendre en compte le contexte ou le corpus dans lequel se trouve le syntagme. Certains mots composés le sont parce qu'ils entrent dans un système lexical de complémentarité ou d'opposition, et donc susceptible de varier d'un corpus à l'autre.

L’on pourrait opposer par exemple « pilote de ligne » à « pilote de guerre », comme l’opposition civil/militaire, ou « pilote de reconnaissance », « pilote de bombardier » dans le contexte de la doctrine du bombardement massif des villes allemandes durant la seconde guerre mondiale.

Dans le cas de l'œuvre éponyme de Saint Exupéry, ceux-ci n'entrent pas de façon explicite dans un système de relation, par l'absence de séquences pilote + □/de/d' + Nom / Adj dans le corpus, et conserve son statut d’hapax. Il nous faudrait par conséquent juger du syntagme en fonction du corpus, ou de la finalité de l'application, § 4.5., selon des critères de répétitions et de réseau de relation, § 3.2.

Si cette démarche ajoute une difficulté supplémentaire au critère du référentiel, que nous nous sommes efforcés d'envisager dans sa simplicité et sa rentabilité, elle complète celui de la productivité.

Les sous-critères de répétition et de relation sont lexicalement liés au corpus, présentant la particularité de pouvoir faire l'objet d'une règle et ainsi entrer dans la chaîne de traitement. Cet outil n'est pas d'actualité pour notre programme de catégorisation, toutefois il est important à travers ce critère de prendre techniquement en compte la dimension du corpus et l'englober dans notre problématique sur la structuration du cotexte.


 4.4.      IV.3.4.4.  construction syntaxique

La construction syntaxique est un aspect du repérage des mots composés, pour les : « [...] expressions telles que prendre la mouche, forcer la main à quelqu’un, rompre une lance, ou encore avoir mal à la (tête, etc.), à force de (soins, etc.), que vous ensemble ?, pas n’est de besoin de... etc., dont le caractère usuel ressort des particularités de leur signification ou de leur syntaxe. » (Saussure, 1916 : 172). Les énoncés « raison garder », « qui plus est », relèvent d’un tour stylistique. Le premier exemple par l’absence de déterminant, « Il faut raison garder. », « Tu dois raison garder. ». Le second par l’auxiliaire qui n’appelle aucun complément, et son statut d’adverbe, déplaçable, possible en incise, donc syntaxiquement autonome.

Des constructions facilement repérables tiennent de l’adage : « riche comme Crésus », ou de l’interjection « devant Dieu ». Ils posent la question de leur dénombrement (voir § IV.5.9. sur comme), mais aussi de leur degré de figement (exemple § IV.6.7. sur la complétive et la relative) question qui articule notre conclusion sur les syntagmes (§ 7. sur les perspectives).


 4.5.      IV.3.4.5.  modalisation

Certaines expressions particulièrement imagées ou les connecteurs argumentatifs que nous avons rangés dans les adverbes de liaisons sont classés comme composé. Ce sont les traces d’énonciation qui vont ici déterminer la séquence en lui attribuant une fonction. Une enquête sociolinguistique autour d’un discours argumentatif relève la fréquence élevée de l’« appel au consensus » (Bernstein, 1971 : 95) du type : « je pense », « je veux dire ».

L’expression « aller de soi » se classe chez les composés, avec sa position syntaxique, sa fréquence d’emploi, l’impossibilité d’une substitution paradigmatique *« cela va de lui », *« ceux-ci vont de soi », la reprise qui ne fonctionne à peu près qu’avec des variations morphologiques de temps ?« cela va de soi et ira de soi », sa signification dans l’acte de parole qui ne consiste pas seulement à confirmer un fait d’une logique évidente, à tisser un lien d’approbation avec un propos, en invoquant le topos du bon sens, type « c’est bien connu », qui par ailleurs se manifeste dans des constructions en guise d’annonce, « il est évident que », « on sait bien que bien », « personne n’ignore que », à la différence qu’elle amène une proposition, ne se suffisant pas syntaxiquement à elle-même.

Ce critère, en dehors de l’argumentation, possède ses limites intrinsèques, étant lié à l’acte de parole. Relevant donc ni d’une base de données, ni d’une règle syntaxique, il faudrait, pour se l’approprier, l’inclure dans le critère du contexte lexical.


 4.6.      IV.3.4.6.  spécificité morphologique et lexicologique

La formation de certains syntagmes nous suggère un vocabulaire. Il peut s'agir d'un mot inusité, « d’ores et déjà », « parce que », « à l’instar de », « à bon entendeur salut », d'une orthographe latine « a priori », d’une association exclusive « loi du talion », d'un fonctionnement atypique d’une classe, ici d’ordinaire classé comme verbe « Il marche à reculons. », ou d’une orthographe et association exclusives « court de tennis ».

Il peut s'agir aussi de la présence d'une majuscule comme « La numéro Un de la natation française. », et, pour le même exemple, de l'absence d'un accord alors que le féminin pourrait aussi bien être employé. Un néologisme, un emprunt ou un changement de registre est une marque particulièrement visible : « La number one de la natation française. ». De même, l’argot ou le registre familier créent des formes composées, mais leur productivité incline à bien appliquer les critères distributionnels et à considérer les conditions d’énonciation.

Au plan morphologique on pourrait joindre : « le plan phonique », qui consiste à remarquer des indices de prononciation : « [...] On en résumera ici le principe en disant que ce qui a la fréquence et, par conséquent, la spécificité d’un monème unique tendra à être traité comme un monène unique. » (Martinet, 1970 : 194). D’où l’intérêt de disposer de corpus oraux.


 5.      IV.3.5.  résumé de la terminologie


- mot : « untel », « mégaoctet », « faitout » ;
- mot à trait d’union : « kilo-octet », « fait-tout » ;
- mot composé à blanc : « un tel » ;
- mot composé ligaturé : « un_tel ».
 


 6.      IV.3.6.  synthèse des critères

Le paramètre principal serait celui de la finalité de l'application. Si elle se situe dans la traduction ou la littérature, l'univers de référence pourrait dessiner un canevas, mais aussi déplacer la difficulté sur un autre plan, de norme en usage pour une langue ou de correspondance entre deux langues. Le stade d’avancement de nos travaux le relègue à une considération expérimentale.

Le paramètre déterminant revient à l’unicité du référentiel, en vertu de sa rapidité de décision, bien qu'il s'agisse d'un critère où « rien n'est parfaitement délimitable » (Eluerd, 2000 : 40). La base a pour l'heure été concrétisée sous cet angle, influencée par la norme lexicologique des dictionnaires.

Aucun n'est satisfaisant en terme de rentabilité. En cas de difficulté, il convient d'appliquer les critères d'interrogations sémantiques et métaphoriques, de longueur du syntagme (adage ou simple locution), d'indices morphosyntaxiques manifestes et d'opérations de distribution. Parmi celles-ci une productivité (§ 4.2.) élevée en fonction du type de construction peut permettre d’infirmer le choix comme composé. Enfin l'indécision s’aiguille selon le type de corpus, à savoir le contexte lexical et la modalisation. La suppression d'une forme appuie le critère de distance analogique, et la substitution paradigmatique celui du référentiel. L'insertion apparaît comme efficace et nécessiterait un approfondissement, mais semble "trop bien" fonctionner pour les noms composés. Reste la substitution catégorielle qui se révèle un critère essentiellement informatique.

Certains syntagmes peu perméables à une réflexion sur leur unicité, mêlent ainsi plusieurs critères : « courir comme un dératé », est une construction de type comparative et donc très productive, qualifiant le verbe sans en modifier la sémantique, mais « dératé » est inusité en dehors de cet emploi, donnant le sentiment d’un caractère d’exception. Il convient donc de hiérarchiser les critères dès lors qu’ils sont manifestes. Dans cet exemple la comparative associée à la présence d’un déterminant nous incline immédiatement à ne pas le classer comme mot composé. C’est cette notion d’exceptionnel dans un emploi qui attire l’attention. De même : « être à la merci de » supposerait une locution verbale, mais le verbe peut permuter « tomber, se mettre... », plus deux prépositions et un déterminant. Le syntagme ne devait son classement qu’au seul emploi de « merci », que l’on retrouve dans « à merci ». Le dictionnaire classe les syntagmes comme locution. Il convient simplement de décider si le critère lexicologique est déterminant (§ 4.6.).

De même que les deux critères du contexte lexical (répétition, relation), les opérations syntaxiques présentent la caractéristique de pouvoir être exploitées par informatique, et donc offrir des perspectives intéressantes pour enrichir les conventions de considérations moins intuitives.


 7.      IV.3.7.  perspectives

L'idéal serait d'envisager plusieurs bases de données couplées à plusieurs types de mots composés manifestant le degré dans le figement, gradué en plus ou moins figé : « [...], les expressions idiomatiques ne présentent pas toutes le même degré d’opacité. » (Hagège, 1986 : 323) La base de données contiendrait les index des différents critères et des applications possibles, (une base pour l'anglais ; pour le corse ; pour la lexicométrie...), afin d'adapter le corpus et de pouvoir mettre en œuvre des recherches spécifiques sur les mots composés dans le texte. C’est quantitativement astreignant sauf si l’on se focalise sur une application et développe parallèlement ce critère du contexte lexical, § 4.3. .

La différence déjà existante entre locution, mot composé, expression, tour de phrase, les diverses formes d’adage ou les travaux sur les verbes supports, la collocation et la dislocation pouvant être un point de départ sur le degré de figement. Les traits impliqueraient le type de construction (comparative, négative : « non coupable », chiffre...) les critères qui auraient pu être quantifiés (opérations distributionnelles, contexte lexical...) et le décalage sémantique (figuré, métaphore... ).

Lors d’une énonciation les sens se chargent les uns aux autres, c’est donc une problématique du type de lien qui unit les mots. Cette compréhension du degré de cohésion de syntagmes en discours est indispensable : « Au delà de ces domaines assez faciles à délimiter [idiotismes...] on entre dans un maquis d’expressions où le traducteur doit dépister l’unité lexicologique. Les dictionnaires en donnent de nombreux exemples, mais il n’existe pas, et pour cause, de répertoires complets. » (Vinay, 1977 : 42).

Dans le cadre d’une traduction toutes les formes composées, y compris les locutions proverbiales, sont susceptibles d’être étiquetées. Ce qui en fait une problématique aussi syntaxique que lexicale et implique une catégorisation qui prenne en compte les groupes de mots, au même rang que les compléments circonstanciels ou les propositions, donnant un cadre encore plus étendu à la question du syntagme. Une difficulté de fond du classement des mots composés apparaît ici en ce qu’ils sont à cheval entre le découpage lexical et l’analyse logique : « les CVS [Constructions à Verbe Support] ont été reconnues comme un phénomène spécial qui affecte autant le lexique que la grammaire » (Alonso Ramos, 1998 : §2). Le déterminant (chapitre IV.3.4) nous en donne un exemple.

Cette perspective d'attribuer une étiquette selon plusieurs bases nous ramène au concept de l'interface de paramétrage, et le traitement complexe du mot composé, de notre approche sur les opérations du cotexte et la combinatoire des ressources.


 .8.    Bibliographie

     ALONSO RAMOS Margarita, Étude sémantico-syntaxique des constructions à verbes support, thèse soutenue en août 1998 à l’université de Montréal, 384 p.
     BERNSTEIN Basil, Langage et classes sociales, 1971, éd. de Minuit, 1975, 346 p.
     CREISSELS Denis, Unités et catégories grammaticales, réflexions sur les fondements d’une théorie générale des descriptions grammaticales, publications de l’Université des langues et lettres de Grenoble, 1979, 209 p.
         ELUERD Roland, La lexicologie, PUF, coll. Que sais-je ?, n°3548, 2000, 127 p.
         HAGÈGE Claude, L’homme de parole, Folio coll. Essai, n°49, 1986, 406 p.
     LEHMANN Alise, MARTIN-BERTHET Françoise, Introduction à la lexicologie, sémantique et morphologie, Dunod, coll. Lettre Sup, 1998, 200 p.
     MARTINET André, Élément de linguistique générale, Armand Colin/Masson 1970 coll. Cursus, 1996, 213 p.
         SAUSSURE Ferdinand de, Cours de linguistique générale, Payot, 1916, rééd. 1995, 520 p.
     VINAY J.-P. , DARBELNET J., Stylistique comparée du français et de l’anglais, 1977, Didier, 1985, 331 p.

 9.      IV.3.9.  instructions

 9.1.      IV.3.9.1.  suppression

Pour supprimer la prise en compte des mots composés, il faut ôter cette ligne (ou lui rajouter un dièse pour la transformer en commentaire et pouvoir ainsi la retrouver).




# Rajoute mot composé
corp=RajoutCompo(corp,M)

 9.2.      IV.3.9.2.  désambiguïsation

Un mot composé, selon les critères mis en oeuvre, n'est pas nécessairement ligaturé, mais ses éléments doivent cependant être désambiguïsés. L'on peut alors ne retenir le mot composé que dans le cadre d'une règle. Elle est une séquence avec les marqueurs de forme @.




# Le pour et le contre
corp=RajoutCompo(corp,M)
amb="@contre"
amb_r="nom"
sui=[["@pour","@et","@le","?"]]
corp=Regle(corp,amb,amb_r,sui)


     La convention grammaticale, pour Notule 1.1   IV.  
     Le récapitulatif des balises en usage dans Notule 1.1
     Adjectifs, noms et déterminants
     Adverbes et pronoms
     Prépositions et conjonctions
     Verbes conjugués et infinitifs
     Participes passés et présents
     Étiquette 
     Forme
     Subordonnée
     Ontologie
     La page d’accueil
     Le sommaire des pages
       Imprimer  

       Site       motte 0.5  
     Rédaction : 01.04.2004      Publication : 10.10.2006
      http://cadrat.saynete.net2003 - 2018