c
a
d
r
a
t






  Entrée  
   Études    
    Réflexion  
     Préalable  
 
+  Des ressources en corpus, isotopies et programmes
+  Des articles d’ études sur le traitement automatique de la langue
+  Les pages du site pour des recherches, informations, résumés...


     une stratégie de programmation pour l’objet langue     §I.4. 
La présentation de la stratégie informatique adoptée pour la catégorisation

 1.  Conception de la programmation

Pour éclairer l’état de l’art en technologie linguistique, il a été relevé l’éclectisme du sujet, avancé de quelle manière elle parviendrait à un développement, puis argumenté en faveur d'un recadrage vers le culturel. L’obtention de résultats pourrait-elle se détacher de travaux déjà effectués, dans la sphère cognitive ou pas, et se cantonner à la seule association codage/linguistique ? F. de Saussure affirmait les possibilités de : « La langue, au contraire, est un tout en soi et un principe de classification. » (1916 : 25), répondant précisément aux principes de l'informatique : « techniques de la collecte, du tri [...] » (Le Robert).

Ailleurs dans son ouvrage, la comparaison du linguiste entre un fait langagier et un jeu d'échec mettait en lumière l'importance des liens entre chaque pièce, et de manière implicite l'évolution de celles-ci en une aire délimitée. Fonctionnement en vase clos, interaction entre éléments et image du damier fait se souvenir d’une réalisation aussi convaincante que légendaire, lorsqu'en 1997 le logiciel Deep Blue parvenait à faire mat au jeu de Gary Kasparov, soulignant l’extraordinaire réussite d’un programme : « Ceci était un grand moment pour l’IA, même si les développeurs soulignaient que leur système n’utilisait pas de l’intelligence artificielle. » (Van Aeken, 1999 : 34).

Une correspondance s’établissant entre démarche structuraliste et architecture logicielle affine notre interrogation et se conclut par une nouvelle série de questions : un système d'une langue peut-il être ramené à une convention suffisamment structurée pour se voir réécrite en ligne de code ? Sans concession à la qualité des objets adaptés ? Comment gérer avec efficacité, flexibilité et clarté, toutes les interactions ? Enfin, les travaux connexes existants pourraient-ils directement s’arrimer au résultat ?

Si l'heure est à l'interdisciplinarité et l'objectif à la modélisation, la seule formation littéraire n’est pas appropriée à la fabrication d'une application logicielle. Toutefois, conférant la mécanique syntaxique et les dimensions de la textualité, elle s'impose comme source de ce travail. Une compétence technique sur la langue en temps que structure, dans ses champs d'action, son fonctionnement lexical et sémantique est conférée par les sciences du langage. L'entrée dans la sphère informatique se développe progressivement, en explorant des passerelles, certaines défrichées par la lexicométrie, de laquelle ont par exemple été retenues les conceptions de manipulation des listes de mots. Enfin, l'exploration spécifique du domaine de l'ingénierie linguistique se porte sur les questions de représentation graphique des données textuelles, susceptibles d'apporter une dimension synthétique.

La rédaction d’une application pourrait donc découler d'une démarche volontairement limitée à la linguistique où l'informatique est un outil et la littérature une matière. Il nous appartient ainsi de développer les trois précédentes questions et de préparer le terrain à la quatrième.

Commençant l’approfondissement de l’étiqueteur morphosyntaxique, le système a été finalement l’objet de toutes les attentions, dans la mesure où il a été possible de ne plus utiliser les outils existants mais de fabriquer sa propre application, ouvrant des perspectives plus intéressantes encore que les travaux qui les ont initiées.

Les travaux sur les représentations graphiques ont montré que le texte répondait à des schémas visibles à l’œil nu et donc formalisables par informatique sans faire appel aux instruments mathématiques. L’application du principe d’un cotexte quantifié et d’une multiplicité des indices peut se dérouler à l’échelle non plus des occurrences mais de la syntaxe, c’est-à-dire au niveau de l’articulation et de la taille du syntagme. Ces indices considèrent que les formes immédiates et non ambiguës sont des marques suffisamment solides pour appuyer une catégorisation : « La taille du contexte nécessaire est variable : Le bois reste virtuellement ambigu, mais je le bois ou dans le bois ne le sont plus » (Fuchs, 1996 : 94) et que la cohérence syntagmatique est plus une aide qu’une contrainte pour l’enchaînement d’ambiguïtés. Les formes alors renseignées pouvaient fournir des informations toujours plus précises, en s’épaulant les unes les autres.

Le catégoriseur n’est pas chose nouvelle mais son développement apparaît riche en perspectives. Il permettrait d’approfondir les détails morphologiques et les attributs syntaxiques, et à progressivement solidariser l’architecture du texte, comme les structures propositionnelles, phrastiques, ou celle, emblématique, du sens.

Nos interrogations sur l'ingénierie linguistique posent la structuration du cotexte d'un mot comme réflexion de fond et la catégorisation grammaticale comme cadre théorique et réalisation.


 2.  Références bibliographiques

     SAUSSURE Ferdinand de, Cours de linguistique générale, Payot, 1916, rééd. 1995, 520 p.
     VAN AEKEN, Francis, Les systèmes multi-agents minimaux, Thèse de doctorat, soutenue le 30 mars 1999, à l’Institut National Polytechnique de Grenoble, Leibniz / IMAG.
     FUCHS Catherine, Les ambiguïtés du français, Ophrys, 1996, 183 p.


     Les langages de programmation   II.3.  
     La page d’accueil
     Le sommaire des pages
       Imprimer  


       Site       motte 0.5  
     Rédaction : 01.04.2004      Publication : 01.06.2007
      http://cadrat.saynete.net2003 - 2024