.1. Introduction | 0.1. Résumé | ||
.0.2 Abstract | 0.3. Mots-clefs | ||
.2. Changement de sujet } | A. B. |
Graphique des phrases dans Hamlet Tableau des tirades dans Hamlet |
|
.3. Continuité du discours } | C. D. |
Graphique des phrases, Terre des hommes Tableau des paragraphes de Terre des hommes |
|
.4. Autres figures | E. | Graphique des phrases dans Pilote de guerre | |
.4.1 Constance | F. | Tableau sur la continuïté, Pilote de guerre | |
.4.2 Déclin | G. | Tableau sur le déclin pour Pilote de guerre | |
.4.3 Accroissement | H. | Tableau sur l'accroissement, Pilote de guerre | |
.4.4 Chute | I. | Tableau sur la chute pour Pilote de guerre | |
.4.5 Superposition | J. | Tableau sur la superposition, Pilote de guerre | |
.5. Application d’un nuage de bulles aux mots-outils | K. | Graphique sur les mots-outils, Le Petit Prince | |
.6. Conclusion | |||
.7. Une bibliographie indicative sur le longueur des phrases |
.A. | Graphique en secteur du volume de l'œuvre |
.B. | Graphique du volume de l'œuvre avec Citadelle |
.C. | Tableau du relevé des occurrences pour l'étude |
.D. | Tableau du relevé des occurrences dans Frantext |
.A. Mots commençant par e | |
.B. Prénoms, pays et communes fr. | .F. Caractères spéciaux |
.C. Abréviations | .G. Interjections |
.D. Mots-outils et assimilés | .H. Dictionnaire des catégories |
.E. Mots composés | .I. Dictionnaire des noms propres |
Pour éclairer l’état de l’art en technologie linguistique, il a été relevé l’éclectisme du sujet, avancé de quelle manière elle parviendrait à un développement, puis argumenté en faveur d'un recadrage vers le culturel. L’obtention de résultats pourrait-elle se détacher de travaux déjà effectués, dans la sphère cognitive ou pas, et se cantonner à la seule association codage/linguistique ? F. de Saussure affirmait les possibilités de : « La langue, au contraire, est un tout en soi et un principe de classification. » (1916 : 25), répondant précisément aux principes de l'informatique : « techniques de la collecte, du tri [...] » (Le Robert).
Ailleurs dans son ouvrage, la comparaison du linguiste entre un fait langagier et un jeu d'échec mettait en lumière l'importance des liens entre chaque pièce, et de manière implicite l'évolution de celles-ci en une aire délimitée. Fonctionnement en vase clos, interaction entre éléments et image du damier fait se souvenir d’une réalisation aussi convaincante que légendaire, lorsqu'en 1997 le logiciel Deep Blue parvenait à faire mat au jeu de Gary Kasparov, soulignant l’extraordinaire réussite d’un programme : « Ceci était un grand moment pour l’IA, même si les développeurs soulignaient que leur système n’utilisait pas de l’intelligence artificielle. » (Van Aeken, 1999 : 34).
Une correspondance s’établissant entre démarche structuraliste et architecture logicielle affine notre interrogation et se conclut par une nouvelle série de questions : un système d'une langue peut-il être ramené à une convention suffisamment structurée pour se voir réécrite en ligne de code ? Sans concession à la qualité des objets adaptés ? Comment gérer avec efficacité, flexibilité et clarté, toutes les interactions ? Enfin, les travaux connexes existants pourraient-ils directement s’arrimer au résultat ?
Si l'heure est à l'interdisciplinarité et l'objectif à la modélisation, la seule formation littéraire n’est pas appropriée à la fabrication d'une application logicielle. Toutefois, conférant la mécanique syntaxique et les dimensions de la textualité, elle s'impose comme source de ce travail. Une compétence technique sur la langue en temps que structure, dans ses champs d'action, son fonctionnement lexical et sémantique est conférée par les sciences du langage. L'entrée dans la sphère informatique se développe progressivement, en explorant des passerelles, certaines défrichées par la lexicométrie, de laquelle ont par exemple été retenues les conceptions de manipulation des listes de mots. Enfin, l'exploration spécifique du domaine de l'ingénierie linguistique se porte sur les questions de représentation graphique des données textuelles, susceptibles d'apporter une dimension synthétique.
La rédaction d’une application pourrait donc découler d'une démarche volontairement limitée à la linguistique où l'informatique est un outil et la littérature une matière. Il nous appartient ainsi de développer les trois précédentes questions et de préparer le terrain à la quatrième.
Commençant l’approfondissement de l’étiqueteur morphosyntaxique, le système a été finalement l’objet de toutes les attentions, dans la mesure où il a été possible de ne plus utiliser les outils existants mais de fabriquer sa propre application, ouvrant des perspectives plus intéressantes encore que les travaux qui les ont initiées.
Les travaux sur les représentations graphiques ont montré que le texte répondait à des schémas visibles à l’œil nu et donc formalisables par informatique sans faire appel aux instruments mathématiques. L’application du principe d’un cotexte quantifié et d’une multiplicité des indices peut se dérouler à l’échelle non plus des occurrences mais de la syntaxe, c’est-à-dire au niveau de l’articulation et de la taille du syntagme. Ces indices considèrent que les formes immédiates et non ambiguës sont des marques suffisamment solides pour appuyer une catégorisation : « La taille du contexte nécessaire est variable : Le bois reste virtuellement ambigu, mais je le bois ou dans le bois ne le sont plus » (Fuchs, 1996 : 94) et que la cohérence syntagmatique est plus une aide qu’une contrainte pour l’enchaînement d’ambiguïtés. Les formes alors renseignées pouvaient fournir des informations toujours plus précises, en s’épaulant les unes les autres.
Le catégoriseur n’est pas chose nouvelle mais son développement apparaît riche en perspectives. Il permettrait d’approfondir les détails morphologiques et les attributs syntaxiques, et à progressivement solidariser l’architecture du texte, comme les structures propositionnelles, phrastiques, ou celle, emblématique, du sens.
Nos interrogations sur l'ingénierie linguistique posent la structuration du cotexte d'un mot comme réflexion de fond et la catégorisation grammaticale comme cadre théorique et réalisation.