c
a
d
r
a
t






  Entrée  
   Études    
    Représentation  
     Lexicométrie  
 
+  Des ressources en corpus, isotopies et programmes
+  Des articles d’ études sur le traitement automatique de la langue
+  Les pages du site pour des recherches, informations, résumés...


 
     le volume lexical en secteurs   
Le relevé statistique des oeuvres d’Antoine de Saint Exupéry

 1.  présentation de l’étude

De la lettre à l’encyclopédie et de la nouvelle au pavé, la longueur d’un ouvrage peut être très variable, jusqu’à en influencer la lecture et la classification dans tel ou tel genre. Pour juger de la taille d’une œuvre il suffit naturellement de jeter un oeil sur le nombre de page. L’on peut aussi affiner l’observation avec le nombre de caractère. Les deux graphiques ci-dessous dessinent une vue d’ensemble sur l’œuvre d’Antoine de Saint Exupéry et nous permet quelques commentaires. Les tableaux qui les complètent détaillent des occurrences comme la ponctuation et les mots. Un second tableau est extrait des statistiques de la base Frantext.

Le choix du caractère évite la problématique de la notion de mot et offre une parfaite stabilité pour la comptabilisation. D'un point de vue quantitatif, il semble qu’au-delà d’un certain seuil, le nombre de mots recoupe toujours le nombre de caractères.

Dans le découpage du texte, les majuscules ont été ignorées. Chaque séquence entre blanc compte pour un mot. Ont été séparés : les ponctuations, les mots apostrophés et les mots composés du type verbe+tiret+pronom.


 
 
          A. Graphique en secteur du volume de l’œuvre            B. Graphique en secteur du volume de l’œuvre avec Citadelle    


 2.  commentaires

Vol de nuit n’est finalement pas beaucoup plus important que le Petit Prince. La lettre à un otage était déjà à vue d’oeil un texte court, mais ce type de représentation en secteur lui redonne, peut-être, un peu de son poids dans l’œuvre.

Nos deux récits autobiographiques se distinguent des deux fictions par leur importance. La taille des œuvres en nombre de signes alimenterait ainsi un découpage en chronologie et genre plutôt qu’en thème. Les autobiographies sont de même longueur pour deux contextes distincts de la vie de l’auteur, facilitant une disposition en miroir.

           
   Œuvres
Caractère
Ponctuation
Mot
Vocable
 Courrier Sud
146.689
5.663
26.004
4.859
 Vol de nuit
108.824
4.205
18.869
3.705
   Terre des hommes
250.371
8.079
45.279
7.213
 Pilote de guerre
248.597
8.662
44.554
6.494
 Le Petit Prince
83.101
3.432
15.774
2.441
 Lettre à un otage
36.923
1.045
6.599
1.875
 Corpus
874.505
31.086
157.079
14.088
        C.   Relevé statistique des occurrences pour l’étude    
 
 
   Œuvres
Date
Genre
Nombre
d’occurrences
 Courrier Sud
1928
Roman
32.096
 Vol de nuit
1931
Roman
23.328
   Terre des hommes
1939
Prose, mélanges littéraires
54.214
 Pilote de guerre
1942
Prose, Roman
53.787
 Le Petit Prince
1943
Prose, Roman
18.747
 Lettre à un otage 
1943
Prose, mélanges littéraires
7.756
 Nombre total d’occurrences du corpus
189.928
 Citadelle
1944
Prose, mémoires
225.811
 Nombre total d’occurrences du corpus avec Citadelle
415.739
        D.   Relevé statistique des occurrences dans Frantext    
 

 Citadelle n’apparaît pas dans le tableau de droite, car si son appropriation numérique ne pose pas de difficulté majeure, sa mise en forme et sa vérification nécessite un travail très important. En revanche le corpus est suffisamment propre pour être associé aux autres écrits dans les graphiques ci-dessus.

Ceux-ci sont surtout l’occasion d’un premier contact avec l’oeuvre, et de dégager quelques tendances.

Le relevé du nombre de vocables est d’emblée plus précis. Il permet de dessiner des pistes comme la richesse du vocabulaire de Terre des hommes, la ponctuation importante de Pilote de guerre qui suppose un style plus télégraphique ou des dialogues plus nombreux.

Les statistiques de base permettent aussi de comparer l’œuvre à celle d’autres auteurs qui ont le même type de comptabilisation.

En observant le résultat du premier tableau au second, il est à remarquer que le type découpage influe fortement sur les résultats.



 3.  liens

     Proust, extraits et commentaires à partir des travaux d'E.Brunet, « univ-mlv.fr »
http://www-syscom.univ-mlv.fr/~vignat/Html/Proust/techniq.html
     Maupassant, étude du vocabulaire et comparatif « Maupassant.free.fr »
http://maupassant.free.fr/cadre.php?page=voc


     La lexicométrie , ou statistique lexicale
     Les livres flottants pour Saint Exupéry en Flash
     La page d’accueil
     Le sommaire des pages

       Site       motte 0.5  
       Imprimer  

     Rédaction : 10.01.2002      Publication : 01.04.2004
      http://cadrat.saynete.net2003 - 2024