.1. Introduction | 0.1. Résumé | ||
.0.2 Abstract | 0.3. Mots-clefs | ||
.2. Changement de sujet } | A. B. |
Graphique des phrases dans Hamlet Tableau des tirades dans Hamlet |
|
.3. Continuité du discours } | C. D. |
Graphique des phrases, Terre des hommes Tableau des paragraphes de Terre des hommes |
|
.4. Autres figures | E. | Graphique des phrases dans Pilote de guerre | |
.4.1 Constance | F. | Tableau sur la continuïté, Pilote de guerre | |
.4.2 Déclin | G. | Tableau sur le déclin pour Pilote de guerre | |
.4.3 Accroissement | H. | Tableau sur l'accroissement, Pilote de guerre | |
.4.4 Chute | I. | Tableau sur la chute pour Pilote de guerre | |
.4.5 Superposition | J. | Tableau sur la superposition, Pilote de guerre | |
.5. Application d’un nuage de bulles aux mots-outils | K. | Graphique sur les mots-outils, Le Petit Prince | |
.6. Conclusion | |||
.7. Une bibliographie indicative sur le longueur des phrases |
.A. | Graphique en secteur du volume de l'œuvre |
.B. | Graphique du volume de l'œuvre avec Citadelle |
.C. | Tableau du relevé des occurrences pour l'étude |
.D. | Tableau du relevé des occurrences dans Frantext |
.A. Mots commençant par e | |
.B. Prénoms, pays et communes fr. | .F. Caractères spéciaux |
.C. Abréviations | .G. Interjections |
.D. Mots-outils et assimilés | .H. Dictionnaire des catégories |
.E. Mots composés | .I. Dictionnaire des noms propres |
La traduction convaincante d’un texte par la machine est un des points d’orgue d’une informatique instrument idéal d’une communication universelle. Une réclame d’IBM le réduit au cliché, comme produit d’appel, mettant en scène la conversation de deux hommes d’affaire au téléphone, à chacun sa langue traduite en temps réel, assimilant du même coup la question phonétique. Les avis divergent. Tantôt un point de vue indique qu’elle est théoriquement impossible, en raison de l’interdépendance d’une multitude de facteurs pris dans un flot combinatoire, tantôt un second avance qu’elle est la conséquence inévitable d’un ordinateur toujours plus proche de l'intelligence.
Sans prendre un parti catégorique, en s'en tenant au fait que traduction et signification sont deux champs indissociables, et en admettant le point de vue du linguiste, sa résolution apparaît en contradiction avec notre stratégie de programmation. Tout peut dépendre, d'une part de l'exigeance du rendu, et d'autre part de l'objet de la traduction. Pour le premier le lecteur s'en tient à dégrossir le texte cible pour n'en retenir que la thématique ou une aide au vocabulaire. Dans cette optique, des méthodes tenant du mot à mot sur des dictionnaires cyclopéens est une stratégie opérante, de même qu'une stratégie dite progressive, retenant le principe : grammaire complexe égale sémantique élémentaire. Pour le second, un bulletin météo anglais vers le français peut se contenter de la stratégie rudimentaire, c'est-à-dire basée sur un remplacement hiérarchique locution par locution puis mot par mot, concernant un vocabulaire restreint, pour un résultat pleinement satisfaisant. Si des erreurs surviennent, elles amènent un rendu dans la langue d'origine ou une superposition de remplacements, autrement dit des erreurs logiquement visibles.
Le principe de la traduction, par rapport à nos travaux, se signale par lui-même, s’agissant d’une double catégorisation et d’un nouveau programme faisant le lien entre les deux corpus enrichis. La multiplication des traitements rend alors déterminant le facteur de rapidité. Mais avant que d’envisager la forme et le code de ce programme, il convient de réfléchir à la portée de la traduction, c’est-à-dire sa modalité de mise en oeuvre et son lien au catégoriseur.
De même que notre approche du " deuxième lecteur " et les " calques de lectures " évoqués dans l’introduction, le domaine pourrait se voir extrait du concept de l’automatisme pour entrer dans celle de l’interactivité. Il devient une " aide à la traduction ", distinguant la T.A (Traduction Automatique) de la T.A.O (Traduction Assisté par Ordinateur).
Beaucoup de phrases n’ont pas la même équivalence, ni exactement la même traduction en une autre langue, de même que le rendu par informatique peut varier d’un logiciel à l’autre. En fait, il est difficile de poser un seuil qualitatif, l’on constate simplement qu’à l’heure actuelle, cette qualité de traduction d’un énoncé ordinaire varie entre passable, confus ou opaque. Une précision grammaticale plus importante serait susceptible de l’amplifier en acceptable.
L’on peut citer le choix d’une étiquette multiple (pendant, § IV.4.22. ; le verbe, § IV.4.4.) : l’utilisateur lèverait l’incertitude sur certaines polysémies et homographies. Le plus intéressant est de loin celui des mots composés, puisqu’ils s’attachent directement à résoudre la question des idiotismes, pour dégager, dans un premier temps, les sens figurés, § IV.3.2.1.. L’intégration d’un autre type de syntagme, disloqué, à savoir les corrélatives, § IV.6.6., caractérise une progression vers les constructions complexes, autre difficulté cruciale de la traduction. Enfin, les quelques tests sur les traducteurs présentent d’autres perspectives de développement, § II.5. .
En somme, toutes les acquisitions grammaticales sont autant de possibilités de résoudre les problèmes spécifiques de traduction, pour un texte en attente de renseignement avant la version finale.
Même si elle en demeure au niveau de l’élagage, l’intervention de l’utilisateur pour certains cas de polysémie y gagnerait largement en qualité, d’autant que le renseignement est censé à nouveau éclairer les traitements informatiques, analogue au principe de notre catégoriseur où les formes à l’étiquette unique épaulent les multiples. Tout dépend de la capacité du programme à déduire les cas ambigus, et l’interface, à les exposer de manière suffisamment conviviale pour pallier les manques de connaissance de l’utilisateur dans la langue cible et les nécessités de temps consacré.
Une application possible du catégoriseur à la traduction, dans le cadre d'un outil pédagogique, serait des dépêches d'actualité étiquetées. Le lecteur étranger parcourt l'actualité et lorsqu'un mot lui pose problème, il lui suffit de se positionner dessus pour voir apparaître la traduction. Ce type d'outil existe avec les modules de dictionnaire de Firefox, sous la forme d'un dictionnaire infobulle. L'innovation consisterait à partiellement désambiguïser le mot, et à le lemmatiser. L'intérêt est donc de pouvoir traduire les verbes conjugués et les emplois féminin/pluriel.
La modeste amorce de ce pont entre deux catégoriseurs a pris pour notre travail la forme d’une ressource. Il s’agit d’un travail lexicologique, chaînon entre la grammaire et la sémantique (conclusion du chap. I.2.). Une liste de mot a été extraite du site sur la langue et culture corse, http://www.adecec.net/adecec-net/lexiques/franghju/. Il s’agit du thème du pressoir à huile et de l’olive (voir graphique chap. II.2.2.A.). Il a été remis en forme, très sommairement corrigé, faute de connaissances suffisantes dans la langue et le domaine, puis relisté en : forme, lemme, traduction, pour une liste exploitable. Ensuite, la catégorie grammaticale est attribuée en partie en manuel, en partie avec notre catégoriseur, l’entière automatisation n’étant rentable qu’avec des listes plus importantes. Au final, la base offre une nouvelle ontologie, les équivalences corse/français, les étiquettes grammaticales pour le corse, et une liste de mots composés pour le français dans le cadre d’une traduction. L’ensemble prend sa place dans notre convention, un ensemble homogène étant la fondation solide d’une entreprise plus importante.
Les moteurs de recherche V.2. Les agrégateurs V.3. Des tests de catégorisation et de traduction II.5. |
La page d’accueil Le sommaire des pages |
Imprimer |
Rédaction
: 01.04.2004 Publication : 01.04.2007
http://cadrat.saynete.net2003 - 2024 |