Le collier de perles de ce mois-ci a été rédigé par Stéphane Payrard (stef@mongueurs.net), de Paris.pm.

Vous pourrez en récolter de nombreuses autres à la prochaine conférence Perl francophone, Les Journées Perl 2005, qui aura lieu à Marseille les 9 et 10 juin 2005.

Chapeau

Perl a été conçu par un programmeur à formation de linguiste, Larry Wall. D'après lui, le langage Perl et les langues naturelles obéissent à des principes similaires. Le principe de Huffman et celui du chunking, que nous exposons, sont incompatibles avec le minimalisme syntaxique aujourd'hui de rigueur dans la conception des langages informatiques. Comme les langues naturelles, ces langages évoluent avec le temps. Nous décrirons l'évolution de Perl1 vers Perl4, jusqu'au futur Perl6.

L'évolution de Perl

Perl a été à l'origine conçu comme un awk amélioré. Il est devenu un langage beaucoup plus puissant sans sacrifier la compatibilité avec ses versions les plus anciennes.

Les langues naturelles évoluent naturellement vers la simplification et la concision. C'est vrai dans la limite imposée par les académies qui tendent à considérer l'évolution naturelle des langues comme une dégénérescence.

Mais les langages informatiques ont plus de difficulté à se libérer des bagages inutiles accumulés en cours de route sauf à évoluer de manière incompatible. Mais c'est perdre l'avantage acquis des bibliothèques écrites pour ce langage. Ce pas difficile et nécessaire sera franchi par Perl6

Il supporte maintenant l'écriture de programmes complexes mais au prix d'une syntaxe souvent malcommode. Pour les amateurs de linguistique diachronique, il est passionnant de voir l'évolution du langage Perl de Perl1 au futur Perl6.

Le concepteur d'un langage se trouve face à un dilemme. Doit-il commencer par un petit langage qu'il va étendre ou concevoir immédiatement un gros langage ? Larry Wall a choisi la première solution. On va voir à travers l'introduction et l'évolution de quelque fonctionalités comment le langage évolue sans sacrifier la compatibilité. Le critère de Huffman et le chunking seront nos critères d'analyse. On voit les choix dictés par ces critères évoluer avec les types de programmes écrits en Perl.

J'ai donné les dates d'introduction des versions du langage. On voit le langage évoluer rapidement pour atteindre une maturité avec Perl5.

perl1 -- 18 décembre 87

Dans les regex, les métacaractères, comme les parenthèses pour la capture, sont très courants. Donc contrairement à l'usage établi par sed, ils ne sont pas précédés d'antislash. Le principe de Huffman est déjà à l'œuvre.

Les programmes étant courts, les appels de routines (définies par l'utilisateur) sont rares par rapport à ceux de fonctions (prédéfinies). Routines et fonctions vivent dans deux espaces de noms différents et sont invoquées via une syntaxe différente, ce qui permettra de pouvoir rajouter plus tard des fonctions au langage sans risque de conflit avec des noms de routines.

Puisque plus rare, l'invocation des routines est plus verbeuse que celle des fonctions. Appel de routine : do routine ( liste ). Appel de fonction : function( liste ).

Perl1 introduit la convention lexicale des sigils pour définir et accéder à trois types de données : les scalaires, les tableaux et les hash. Cette distinction entre tableau et hash est originale. La plupart des langages de script comme awk ou javascript utilisent la syntaxe C d'accès aux tableaux, mais pour accéder aux hash. Dans ces langages, les tableaux ne sont que des hash dont les clés sont des chaînes représentant des entiers.

Ces langages étant interprétés, la différence de performance entre véritables tableaux et hash utilisés comme des tableaux est minime. Néanmoins, tableau et hash sont des concepts différents et méritent d'être distingués. De plus avec Perl6, qui pourra être compilé, la différence de performance ne sera plus négligeable.

Perl1 se pose en remplacement de sed et de awk et propose des convertisseurs de ces langages vers Perl. Le convertisseur de sed en perl, s2p, est écrit en Perl et fait déjà 552 lignes. La syntaxe de awk nécessite un vrai parser ; a2p, le convertisseur de awk en perl est donc écrit en C et comporte un parser. L'option -n permet à Perl de se comporter comme awk par l'emballage du programme dans une boucle.

Perl2 -- 5 Janvier 1988

Dès la version 2, Larry satisfait le besoin d'avoir des portées pour les variables mais les variables sont locales et non lexicales. L'opération de substitution pour créer une nouvelle variable est jugée tellement courante qu'elle est supportée par la syntaxe :

   ($obj = $src) =~ s/\.c$/.o/;

Perl3 -- 18 octobre 1989

Les fonctions pack et unpack permettent de manipuler des structures de données binaires. La variable $; permet de simuler des tableaux multidimensionnels.

Perl4 -- 21 mars 1991

Perl4 n'apporte rien de fondamentalement nouveau à Perl3. Sa sortie est conjointe avec celle de la première édition de Programming Perl chez O'Reilly.

Perl5 -- 12 mars 1995

Le langage supporte enfin des structures de données composites et l'objet. Les comportements par défaut deviennent malheureusement inadéquats.

La liste des fonctions prédéfinies étant jugée stable, ces fonctions et les routines peuvent partager le même espace de nom et la même syntaxe d'appel.

Dans un langage avec des structures de données complexes, il est nauturel de passer par défaut les valeurs composites comme les tableaux ou hash par référence. Par compatibilité, ce n'est pas le cas.

  appel_fun( @a, %a );    # défaut malheureux expanse @a et %a 
  appel_fun( \@a, \%a );  # la compatibilité impose un syntaxe lourde 
                          # pour le passage de paramètre par référence

Références

[1] Syntactic Theory, a formal introduction, par Ivan A. Sag et Thomas Wasow (ISBN 1-57586-160-7)

Ces deux exemples savoureux sont donnés au tout début de ce livre qui décrit les développement récents des grammaires génératives à la Chomsky.

[2] Principles of Psychological Chunking in Perl - http://www.wall.org/~larry/chunking

Ce courriel de Larry Wall l'explique dans le contexte de Perl.
[3] Natural Language Principles in Perl - http://www.wall.org/~larry/natural.html
[4] "Dr. Dobb's Journal February 1998 - A Conversation with Larry Wall" :

N'est plus disponible via Dr. Dobb's mais inclus dans la page http://www.softpanorama.org/People/Wall/larry_wall_articles_and_interviews.shtml
[5] Apocalypses : http://dev.perl.org/perl6/apocalypse/
[6] Synopsis : http://dev.perl.org/perl6/synopsis/
[7] Exégèses : http://dev.perl.org/perl6/exegesis/
[8] Listes pour le développement de Perl6, Parrot et Pugs : http://dev.perl.org/perl6/lists/
[9] http://people.mandrakesoft.com/~rgarciasuarez/slides/perl510/perl510.html

Perles de Mongueurs (13)

Chapeau

Larry Wall et la linguistique

Larry dans le texte

Le principe de Huffman

Le principe de Huffman appliqué au méta-langage

Langages à syntaxe minimaliste, gros programmes

problème d'œuf et de poule

Le chunking

Trop de morceaux similaires cache la structure

Les maths comme déconstruction

La surconstruction

L'évolution de Perl

perl1 -- 18 décembre 87

Perl2 -- 5 Janvier 1988

Perl3 -- 18 octobre 1989

Perl4 -- 21 mars 1991

Perl5 -- 12 mars 1995

Le futur Perl6

Apocalypses, Exégèses et Synopsis

Le processus de création de Perl6

Références

À vous !