c
a
d
r
a
t






  Entrée 
   Études    
    Programmation  
     Langage  
 
+  Des ressources en corpus, isotopies et programmes
+  Des articles d’ études sur le traitement automatique de la langue
+  Les pages du site pour des recherches, informations, résumés...


 
     le langage PHP      §II.3.3. 
La page de description du langage PHP

 1.      II.3.3.1.  présentation

PHP, ou Hypertext Preprocessor est créé en 1994, par Rasmus Lerdorf, à partir de bibliothèques Perl. Il est sous licence PHP, mais de fait peut être considéré, du moins dans son usage, comme un logiciel libre. À l'heure actuelle ce langage est employé pour la création de sites internet, où sa domination peut s'apprécier au nombre de pages existantes sur la toile en extension .php. Il permet de travailler l’architecture du site, en rajoutant une couche de programmation sur le DHTML (la mise en page dynamique du site), puis sur JavaScript (le langage qui gère cette partie dynamique dans le navigateur). Il n'opère pas directement depuis le navigateur contrairement au HTML et JavaScript, mais à partir du serveur, ce qui permet par exemple de gérer une base de données et les fichiers du site, ou encore de faciliter la rapidité de traitement en évitant d'avoir à recourir à l'ordinateur de l'internaute. Il peut toutefois être testé à partir du navigateur avec un logiciel comme EasyPHP. Le langage en est à la version 5, avec des changements portant sur la gestion XML et la programmation objet. La version 4 est encore largement utilisée. La version 6 est en gestation.


 

 2.      II.3.3.2.  traitement du texte

Comme il a été décrit dans la comparaison entre PHP et Python, le premier n’apparaît pas comme dédié au traitement du texte et présente quelques lacunes en la matière. Ces lacunes sont toutefois rééquilibrées par les qualités du langage, avec un jeu d’instructions abouti. Si notre préférence va à Python, PHP possède un atout majeur car il entretient un lien indirect avec la programmation du texte par le biais de ses facilités à opérer sur un vaste domaine du TAL : Internet lui-même. PHP est en effet le langage le plus courant et sans doute le plus performant pour traiter les pages HTML. Il s’interface avec SQL et XML et permet ainsi d’entrer de plein pied dans des bases de données textuelles complexes. Il possède aussi des instructions spécifiques pour les expressions régulières. Toutefois PHP reste un langage script, donc lent, et ses qualités en ce qui concerne les bases de données posent le problème de la gestion des ressources. mySQL piloté par PHP plafonne en nombre d’enregistrements parcourus et en simultanéité de connexion, sur un serveur standard. Passés 10.000 enregistrements, une boucle en PHP peut patiner, et un nombre de consultations trop rapprochées est une cause fréquente de plantage d’un site. En ce qui concerne XML, son langage de requête, XSL, est moyennement valorisé par PHP, et le module simpleXML, contrairement à ce que suggère son nom, est quelque peu rebutant. Tout dépend en somme de la taille du corpus. Un traitement en aval, par exemple en l’indexant ou le partitionnant, peut être nécessaire. La solution d’enfermer le texte dans une base de données a déjà été critiqué en terme de restrictions : étant une différence de stratégie entre texte plein et texte structuré.



     Un spicilège de codes 
       Le programme de conversion en minuscule en PHP
       Les programmes de nivellement de caractères à encodages multiples en PHP

     La page d’accueil
     Le sommaire des pages


       Site       motte 0.5  
       Imprimer  
     Rédaction : 01.05.2006      Publication : 01.04.2008     Révision : 12.03.2012
      http://cadrat.saynete.net2003 - 2018