Méthodologie

Une des premières choses qui s'apprennent dans la douleur sur une production est l'erreur humaine. Combien ont pu passer des nuits entières à essayer de corriger des problèmes qui ne seraient pas survenus avec un peu plus de méthode ou si l'impétrant s'était accordé le temps de la réflexion ?

La méthodologie est donc essentielle, et d'autant plus nécessaire que l'équipe de production s'agrandit.

Nous distinguerons trois types de méthodologies, complémentaires :

La méthodologie personnelle :

De même qu'on nous apprenait étant petits à tourner sept fois la langue dans notre bouche avant de parler, il faudra nous (ré-)apprendre à réfléchir à ce que l'on fait, et pourquoi on le fait.

Je ne reprendrai pas l'exemple de celui qui redémarre un serveur pour résoudre un problème en espérant que cela résoudra le plantage. C'est typique d'un enfant qui comprend rapidement que sa console de jeu est plantée, et qui n'a pour seule issue que de l'éteindre et de la rallumer. Idem pour une certaine catégorie de systèmes d'exploitation pour serveurs qui sont suffisamment robustes pour supporter plusieurs redémarrages hebdomadaires. Mais ce n'est pas de la faute de leurs administrateurs, ils n'ont pas (toujours) les moyens techniques de faire l'analyse des problèmes rencontrés.

Rebooter un serveur Unix n'a jamais résolu un problème. Que ce soit dit.

De plus, toujours en terme de méthodologie personnelle, il faut s'astreindre à plusieurs comportements :

Pas de modifications de configuration d'un serveur critique sans avoir au préalable testé sur un serveur du même type, mais non critique ;
Pas de modifications ou d'opérations sur des serveurs avant un week-end, sans avoir prévu de surveiller les effets de bord ce même week-end. Sinon, il y a de fortes chances que le lundi suivant soit un lundi noir... ;
Toujours faire une copie de sauvegarde des fichiers de configuration qui vont être modifiés. Soit par cp, soit par d'autres biais tels que des gestions de configuration logicielle (GCL en français, SCCS, RCS, CVS, SVK, Subversion et bien d'autres étant des outils tombant (!) dans cette catégorie). Idéalement, tout cela sera bien évidemment centralisé ;
Enfin, et c'est du vécu, on ne modifie pas un fichier de configuration influant sur le redémarrage d'un serveur sans vérifier ce redémarrage dans la foulée. Ça permet d'éviter qu'un serveur reboote tout seul suite à une panne de courant, et perde sa configuration réseau parce qu'une erreur de syntaxe a été commise là où il ne fallait pas. Ou encore de découvrir 3 mois plus tard qu'un serveur ne reboote pas sans qu'on se souvienne ce qui avait été fait et qui peut être à l'origine du problème. Ça m'est arrivé, et dans l'urgence, avec une gateway SSH dont j'avais changé quelques jours auparavant de boot-loader (LiLo vers GRUB). Et de découvrir de la pire façon que le GRUB fourni ne supportait pas les noms de devices autres que /dev/[sh]d[a-h][0-9]... Dommage lorsqu'on travaille avec des cartes RAID matérielles...
Et j'oubliais ce conseil-ci, corollaire du précédent : ayez TOUJOURS (je n'aime pas hurler, mais il le faut bien de temps en temps) les CD bootables à proximité de vos serveurs. Car charger une image ISO d'un serveur sur le PC où il y a le graveur (jamais les mêmes, sinon c'est pas drôle ;-)) prend du temps, et graver aussi. Et tester des CD bootables d'autres distributions peut aussi faire perdre du temps. Autant aller droit à la cible...

Méthodologie de travail en équipe

Bah non, on n'est pas seul au monde.

Et bosser en équipe demande une sacrée coordination, d'autant plus que les gens n'ont pas tous les mêmes compétences, et donc ne bossent pas forcément ensemble sur le même sujet. Imaginez par exemple qu'un décorateur viennent poser du papier peint dans votre maison en construction alors que les fenêtres ne sont pas posées. La première pluie ajoutera une note, disons, artistique... Le problème est ici le même.

Un autre problème à résoudre dans une équipe est le passage de compétences. Que ce soit pour permettre à un nouvel arrivant de se mettre rapidement dans le bain (en évitant de devoir toujours refaire le même discours), que ce soit pour fixer les procédures (et il y en aura), ou pour préparer les départs des plus anciens qui vont changer de mission.

Ces deux problèmes vont trouver des débuts de solutions, plus ou moins satisfaisantes (il n'en existe pas de parfaite), dans la mise en place de quelques outils, pour assurer le suivi des plannings, des incidents, et pour mettre en place la capitalisation des connaissances.

Du point de vue coordination, les logiciels ne manquent pas :

Suivi des demandes :
Mon préféré, et aussi le premier à avoir été installé, j'ai nommé : Request Tracker ;
Gestion de planning :
Un corrolaire du précédent, à une échelle plus macroscopique. Une feuille de calcul -- ou chiffrier pour mes amis de l'autre côté de la grande baignoire -- peut suffire, voire un calendrier électronique partagé peut suffire pendant un bout de temps) : nous n'avons pas encore utilisé de libre ici. Remarquez que Request Tracker peut aussi être utilisé dans ce cadre.
Capitalisation des connaissances :
Là, j'ai détourné un outil fort sympathique car conjuguant le meilleur de la forme et du fond : SPIP.

À la base logiciel de publication web simplifié (ne veut pas dire simplet), à la portée de tous en terme de facilité d'utilisation. Si vous préférez le POD, pas de souci, ça peut aussi se faire (cet article est tapé, sur mon temps libre, dans un éditeur texte en POD, transformé puis d'abord publié sur un de nos SPIP en intranet).

J'ai donc détourné SPIP de son rôle de facilitateur de webmestre pour en faire la « killer-application » des bases de connaissances. En fait, je n'ai pas fait grand chose, j'ai juste commencé à écrire dedans ce que je faisais, et l'ai montré à mes collègues. Comme souvent avec les outils groupware, l'émulation a joué et c'est maintenant à qui aura le plus grand nombre d'articles publiés (je tiens encore la corde, mais j'ai commencé avant les autres, gniark, gniark). Ces articles font maintenant partie de notre fond de commerce en terme de service, et pourront profiter à tous.
Gestion d'équipe :
Comme le logiciel TUTOS, qui peut aller jusqu'au calcul des temps réalisés sur différents clients, facilitant la facturation. TUTOS est un couteau suisse qui peut cependant marcher sur les pieds d'autres outils comme RT ou un CRM.

Il existe d'irréductibles récalcitrants à ce genre d'outil, mais surtout à ce genre d'exercices. Du type de ceux qui ont de l'or dans les doigts et dans la tête, mais qui le gardent pour eux. J'en ai eu l'expérience il y a quelques temps, où nous avons dû refaire intégralement une installation SAP (ce qui prend du temps, croyez-moi) parce que celui qui l'avait fait l'avait fait à la va-vite. Cela peut se comprendre, il avait commis quelques erreurs, ce qui encore peut se comprendre, mais surtout n'a rien documenté. Même pas le résultat de la commande script(1), même pas ne serait-ce que deux/trois lignes sur ses principes d'installation. Le seul problème avec ça, c'est qu'il était censé faire cette installation, mais aussi la rendre reproductible. Au total, en voulant (consciemment ou non) gagner une heure (ce qui suffit à faire un copier/coller en nettoyant le résultat de script et en ajoutant deux commentaires de ci de là), tout son travail est perdu. Et comme il n'était pas là, quelqu'un d'autre a recommencé, remettant en cause les choix techniques, ou ne les comprenant pas (tout le monde ne réfléchit pas de la même façon), perdant du temps, etc. Au bout du compte, cette installation aura pris trois fois le temps qui aurait dû lui être imparti, choix d'architecture et documentation compris. Et ce genre d'exemples, j'en ai à la pelle.

Donc certes, oui, la documentation prend du temps, oui, tout le monde n'a pas envie d'écrire de la littérature, mais ce n'est pas non plus l'exercice demandé. Ce qui est demandé, c'est une vue synthétique des choix, et quelques précisions sur les points de détails techniques sortant de l'ordinaire. Pas de discuter sur 10 lignes du fait qu'on préfère ls à echo *.

La méthodologie institutionnalisée

Ce type de méthodologie a l'avantage d'être souvent exhaustive, mais tout aussi souvent sclérosante. ITIL (Information Technology Information Library) est un exemple de méthodologie en passe de devenir un standard, au moins de fait.

Ces méthodologies permettent de définir un cadre systématique complet autour de la production informatique. Cela va de la mise en œuvre d'un service à sa mort, avec le suivi et la gestion de toutes les phases, dont le changement, en alliant les visions risque et stratégique du service.

Introduction à la production informatique

Remarque préliminaire

Chapeau de l'article

Définitions

De quoi a-t-on besoin, et pour faire quoi ?

Choix du logiciel adapté

Méthodologie

La méthodologie personnelle :

Méthodologie de travail en équipe

La méthodologie institutionnalisée

À suivre

Auteur