Écrire des programmes scientifiques et créer une interface avec Tcl/Tk

1.1.Le choix du langage n'est pas primordial

Réglons de suite la question du langage à utiliser. Nous parlons ici de calculs longs dont il est important de minimiser le temps de traitement. En conséquences, l'utilisation de langages compilés s'imposent, sauf pour des applications spécifiques ou si on doit utiliser une base existante. Les langages interprétés type Perl ou Tcl/Tk peuvent être assez rapides, mais pour de la véritable programmation scientifique ils sont encore trop long.

Il est souvent intéressant d'utiliser un langage largement disponible sur tous les systèmes informatique. Actuellement le transfert vers d'autres systèmes ne pose plus de difficulté, mais j'essaie d'éviter les outils propriétaires type Windev ou la suite .net. Les choix les plus courants sont le C, le C++, le Pascal et le Fortran. Dans la suite je traiterais principalement du C.

Le Fortran est un très bon choix, mais il faut éviter les Fortrans 77 ou antérieurs qui sont obsolètes bien que très rapides.

L'écriture orientée objet n'est pas toujours un plus, même si la protection des variables est une bonne technique. Je conseille d'éviter les "héritages de classes". ils compliquent souvent la lecture du programme et ralentissent son exécution.

1.2.un premier exemple

Commençons par un tout petit exemple ! (s.v.p. cliquer sur la ligne)

Remarquons en premier l'entête, c'est un commentaire qui commence par /** @brief. Il contient diverses indications : version date bug,... Elles sont formatées pour être interprétées par doxygen. Cet utilitaire permet rapidement de faire une documentation technique, nous y reviendrons plus loin.

Mais l'indication principale est ce que fait le programme. Cette indication primordiale est parfois absente ! Dans l'exemple ce n'est bien grave car le code est minuscule, mais dès que le traitement se complique c'est très gênant pour réutiliser du code ancien et même pour simplement comprendre ce qu'il fait.

Sinon cet exemple a beaucoup de défauts:

les données ne sont pas testées,
ni la validité des calculs,
le calcul n'est pas daté
les résultats ne sont pas enregistrés (tracés)

Voici mes astuces qui permettent de les gommer.

2.1.Lecture au clavier, dans la ligne de commandes

2.1.a.Entrées au clavier à consommer avec modération

Lors de l'apprentissage de la programmation, les données sont souvent introduites au clavier comme c'est le cas dans l'exemple précédent. Pour un tout petit utilitaire, c'est suffisant. Mais si il a plus que quatre valeurs, les humains ont du mal à les entrer sans se tromper en tout cas c'est vrai pour moi !. Mais le véritable inconvénient est que cela allonge notablement le temps, au point qu'il est fastidieux de réaliser une série de calculs. Donc demander des informations à l'écran est une technique à réserver aux cas extrèmement simples.

Il est possible d'intercepter les certaines erreurs de frappe. Ceci peut être fait en comptant le nombre de valeurs décodées par scanf comme ci dessous.

Version corrigée qui teste la valeur entrée (s.v.p. cliquer sur la ligne)

Le test de la validité est une "dérivation" par rapport au déroulement normal. Il faut le commenter, y compris la variable locale nb. Il existe une meilleure solution avec strtod qui permet d'afficher la donnée lue mais mal interprétée.

Si le programme demande 4 valeurs et que l'on se trompe dans la dernière, il faut tout refaire ! Cela peut être crispant.

2.1.b.Mettre les données dans la ligne de commandes

Il y a deux solutions pour éviter de lire une donnée au clavier: la première la lire dans un fichier, l'autre l'ajouter comme argument de la ligne de commandes. Nous allons examiner la seconde solution qui est naturelle en Linux, mais peut aussi être utilisée avec Windows. Les fignes de commandes peuvent être rapellées, cela facilite la correction d'erreur de frappes.

La librarie getopt facilite la gestion des arguments en ligne de commande. Elle est standard dans l'environnement Linux et il existe des portages pour Windows (par exemple dans Analyser les options passées en ligne de commande).

Exemple de valeur entrée en ligne de commandes (s.v.p. cliquer sur la ligne)

/**  @brief calcul du carré d'un nombre
 **************************************
 *  @author Moi-même
 *  @version 1.2
 *  @date    2006
 *  @bug possible overflow
 *
 *  exemple de programme C
 *  lit un nombre sur la ligne dans commandes, puis affiche son carré
 */


/* Declare standard librairies
   --------------------------- */
#include <stdio.h>
#include <stdlib.h>
#ifdef _WIN32
#include "getopt.h"
#else
#include <getopt.h>
#include <sys/times.h>
#endif

/* Declare common variables
   ------------------------ */

/* procedure attached to main
   -------------------------- */

/** petite aide en ligne
 ***********************
 */
void usage(void) {
    fprintf(stdout, "command line : carre -x value\n");
    fprintf(stdout, "  -x value : double dont on veut calculer le carré\n");
    fprintf(stdout, "  -h       : aide en ligne\n");
    fprintf(stdout,"\n");
    fprintf(stdout, "Calcule le carré d'un nombre\n");
    fprintf(stdout,"\n");
}      /* usage */

/** main program with standard args
 **********************************
 *  @param argc : number og arguments in the command line
 *  @param argv** : list of arguments
 *  @return error code
 */
int main (int argc, char **argv) {

/*  Declaration des variables locales
    ---------------------------------*/
    int         k;
    int         opt;
    char        *err = NULL;

    extern char *optarg;                         // valeur de l'argument (si il existe)
    extern int  optind;                          // indice de l'option (dans getopt)
    extern int  opterr;                          // indicateur d'affiche erreur (dans getopt)

    double x,                                    // données récupérée dans la ligne de commandes
           x2;                                   // son carré

/** 1) décode la ligne de commandes
       ****************************/
    if (argc==1) {
      usage();                                   // affiche l'aide minimale
      exit(99);
    }
/** &nbsp; possible options hx: (see getopt) */
    opterr = 0;                                  // n'écrit pas sur stderr si un argument non reconnu est rencontré
    while ((opt = getopt(argc, argv, "hx:")) != EOF) {
      switch (opt) {
      case 'x':                                   // recupère la valeur
        x = strtod(optarg,&err);
        if (optarg == err) {                      // erreur decodage
            printf("erreur! x n'est pas un nombre ! %s\n",optarg);
            return(EXIT_FAILURE);
        }
        break;
      case 'h':
        usage();
        exit(99);
      case '?':                                                      // unknown
         printf("argument de la ligne de commande non connu: %s",argv[optind-1]);
         usage();
       }
    }

/** 2) Début du traitement
       ****************************/
    x2 = x*x;
    printf("son carré vaut : %g\n",x2);

    return(EXIT_SUCCESS);                                   // sortie normale
} /* main */

D'accord, c'est long juste pour le calcul du carré d'un nombre ! Le lancement du programme se fait par :

[ codes]$ ./carre -x 28
son carré vaut : 784

Un appel sans argument donne la forme correcte de la ligne de commandes et un petit message indiquant ce que fait le programme (ceci est important).

[ codes]$ ./carre3
command line : carre -x value
  -x value : double dont on veut calculer le carré
  -h       : aide en ligne

Calcule le carré d'un nombre

Et un appel incorrect

[ codes]$ ./carre3 -x bidule
erreur! x n'est pas un nombre ! bidule

Remarquez dans le code:

Une directive de compilation permet de distinguer le système Linux qui a getopt.h en standard de Windows où il faut l'adjoindre au programme.
La mini "aide en ligne" est appelée lorsqu'il n'y a pas d'argument ou si un d'eux n'est pas reconnu.
Le test du nombre entré qui utilise strtod. Le message d'erreur reporte l'argument invalide. Ce test n'est pas parfait car il se fait avoir avec quelques cas comme les appels ./carre3 -x 3,4 ou ./carre3 -x 1 456 m.
Le programme retourne une valeur standard (définie dans stdlib.h) EXIT_SUCCESS ou EXIT_FAILURE en cas de problème.

2.2.Lecture dans un fichier

Lorsqu'il y a un grand nombre de données nécessaires au calcul, il n'est plus question de les demander à l'écran, ni de les mettre en arguments de la ligne de commande. Elles sont lues dans un fichier de données.

Pas de nom de fichier en dur dans le code

Il est préférable de ne pas inscrire le nom du fichier en dur dans le code. D'une part cela oblige à de nombreuses opérations de copies si il y a plusieurs cas à effectuer, et d'autre part c'est une source de non portabilité du programme. Implicitement le nom en dur suppose que l'arborescence des fichiers soit identique dans l'ordinateur hôte et dans celui du développeur.

A mon avis, le mieux est d'introduire le nom de fichier comme argument de la ligne de commandes.

Exemple de ligne de commandes : nomprogramme -i fichin -o fichout (s.v.p. cliquer sur la ligne)

/** main program with standard args
 **********************************
 *  @param argc : number of arguments in the command line
 *  @param argv** : list of arguments
 *  @return error code
 */
int main (int argc, char **argv) {

/*  Declaration des variables locales
    ---------------------------------*/
    int         opt;
    extern char *optarg;                         // valeur de l'argument (si il existe)
    extern int  optind;                          // indice de l'option (dans getopt)
    extern int  opterr;                          // indicateur d'affiche erreur (dans getopt)

    FILE    *dat;                                // stream for data file
    FILE    *imp;                                // stream for output file

    char *fichimp=NULL;                          // result file name
    char fichimp_def[] = "data.dat";             //!< default input file name
    char *fichdat=NULL;                          // data file name
    char fichdat_def[] = "result.res";           //!< default output file name

/** 1) Décode la ligne de commandes
       ****************************/
    if (argc==1) {
      usage();                                   // affiche l'aide minimale
      exit(99);
    }
/** &nbsp; possible options hi:o: (see getopt) */
    opterr = 0;                                  // n'écrit pas sur stderr si un argument non reconnu est rencontré
    while ((opt = getopt(argc, argv, "hi:o:")) != EOF) {
      switch (opt) {
      case 'i':                                  // data file name
        //fichdat = optarg;
        fichdat = (char*)calloc(MAXCHAR,sizeof(char));
        strcpy_s(fichdat, MAXCHAR, optarg);      // je préfère une copie que pointer vers un endroit inconnu       
        break;
      case 'o':                                  // result file name
        fichimp = optarg;                        // correct mais !!!
        break;
      case 'h':
        usage();
        exit(99);
      case '?':                                  // unknown
         printf("argument de la ligne de commande non connu: %s",argv[optind-1]);
         usage();
      }
    }

Il faut également modifier l'aide en ligne (procédure usage)

Avez vous remarqué qu'un nom de fichier par défaut est prévu ? Il faut prévoir le cas ou l'utilisateur oublie un argument, sinon il faut vérifier que tous les arguments obligatoires sont présents, puis éventuellement signaler à l'utilisateur qu'il en manque.

Voici l'ouverture des fichiers.

    if (fichdat==NULL) fichdat=fichdat_def;
    fprintf(stdout,"Ouvre fichier données %s\n",fichdat); fflush(stdout);
    if ((dat=fopen(fichdat, "r"))==NULL) {
       printf("error during opening: %s %s\n",fichdat,strerror(errno));
       exit(errno);
    }

La première ligne fait pointer fichdat vers le nom par défaut. La seconde ligne est uniquement un message pour suivre l'avancement du programme à l'écran. Elle est terminée par l'ordre flush pour forcer l'affichage immédiat. D'après la norme, celui ci est implicitement rajouté après une écriture à l'écran, mais il m'est arrivé que cela ne soit pas le cas.

L'ouverture du fichier se fait par fopen. La réussite de l'opération est testée, comme c'est une opération courante, la librairie errno aide à la gestion de ces erreurs. Il faut dans ce cas ajouter en début de programme :

#include <errno.h>

2.3.Les données ont des unités !

Il m'est arrivé, il y a longtemps, de voir des fichiers de données contenant uniquement les valeurs à lire. La maintenance de ce type de fichier est délicate et même impossible sans une documentation précise.

Cas d'un mauvais fichier de données C'est un exemple vécu !!!

Dans ce cas, une lecture minutieuse et quelques suppositions ont permis de comprendre la signification de chaque valeur. Mais le risque d'une mauvaise interprétation existe.

Pour les programmes scientifiques chaque donnée est plus que uniquement un nombre. Implicitement une donnée est l'ensemble de :

exemple de valeur "complète"

son type (scalaire, vecteur, tableau, arborescence, ...)
sa valeur : 1.231
sa signification : "longueur du tuyau"
son unité : (m) ou (cm) ...
sa plage de validité : [0 : 3]
sa précision : 0,7 %
son origine : "relevé sur le plan XXXX" ou "mesuré par Paul le DD/MM/YY"

Pour faire bien, il faudrait indiquer tout ces aspects dans le fichier de données. La structure naturelle du fichier de données devrait utiliser le format <XML>.
Ce n'est pas ce que ce que j'utilise car l'écriture et la lecture des fichiers <XML> est un peu verbeuse et fastidieuse. De plus il n'est pas toujours facile de comprendre le fichier avec un simple éditeur de texte.

J'utilise une technique de lecture plus simple. C'est un fichier texte avec possibilité d'ajouter des commentaires.

Fichier texte avec commentaires

En fait, dans une ligne contenant une donnée, tout ce qui est après le "!" n'est pas interprété, mais reporté dans le fichier de résultats. Ce n'est pas parfait mais cela permet de garder une lecture facile du fichier de données avec un éditeur classique. En contre partie, le fichier devient rapidement long car on ne peut mettre qu'une valeur par ligne.

Voici l'utilitaire de lecture (s.v.p. cliquer sur la ligne)

/** @file litreel.c miscellaneous functions incl. reading with parsing */
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <errno.h>

// define boundaries for all tables in the model
// ---------------------------------------------
#ifndef _BOUNDARIES_
# define _BOUNDARIES_
# define MAXCAP     50                                                          /**< max lenght of a caption                 */
# define MAXLINE   255                                                          /**< max lenght of line                      */
# define NAMELENGTH 64                                                          /**< fixed name length                       */
#endif /* _BOUNDARIES_ */


/** removes spaces at both ends of a string
 ******************************************
 * @param input     : chaine de caracteres a traiter
 */
void trimboth(char* input) {
    char* pos;                                                                 // current position non-space-char
    char* pos2;                                                                // current position original string
    char* beg;                                                                 // pointer to the beginning of non-space char
    char* end;                                                                 // pointer to the end of non-space char

// find actual start of line
    beg = input;
    while isspace((unsigned char)*beg)) {
      ++beg;
    }

    // find last non space charater (and replace by /0)
    //
    end = input + strlen(input)-1;
    while (end > beg && isspace((unsigned char)*end)) {
         *end = '\0';                                                              // replace space by '/0' (= right trim)
         end--;
    }

   // Move if needed.
   //
   if (beg == input) return;                                                    // no space at the line start (we are done)
   pos = beg;
   pos2 = input;
   while (pos <= end) {
       *pos2 = *pos;                                                            // move characters one by one
       pos++;
       pos2++;
   }

   while (pos2 <= end) {
       *pos2 = '\0';                                                            // pad with '/0'
       pos2++;

   }
}


/* Read a line and skips non meaning lines
 ******************************************
 *
 *  non meaning lines are empty lines or line containing only spaces, tab (see isspace function)\n
 *  or\n
 *  comment lines, starting by # or !
 */
bool read_skip(FILE* lec,FILE* imp, char* ligne) {
    bool line_OK;

    do {
        if (fgets(ligne,MAXLINE,lec)==NULL) {                                  // Read & check if end of file is reached
            return false;
        }
        trimboth(ligne);

        line_OK= true;
        if (strlen(ligne) == 0) {                                              // Empty line : not OK
            line_OK =false;
        } else if ((ligne[0] =='#')||(ligne[0] =='!')) {                         // Comment line : not OK
            line_OK= false;
            if (ligne[1] =='>')                                                 // print this comment in the trace file
                if(debug >= 2) fprintf(imp,"\t\t%s\n",ligne);
        }
        
    } while (!line_OK);                                                         // loop until not empty and not a comment
    return true;
}


/** splits a line into data and caption (attention internal of util.c)
 **************************************
 * @param ligne     : input string to split
 * @param data_txt  : redurn string containing data part
 * @param caption   : return string containing caption part
 */
void split_line(char* ligne, char* data_txt, char* caption) {
    char* legende;                                                          // label as read
    char* donnee;

    memset(data_txt,' ',MAXLINE);                                           // fill data_txt with spaces
    memset(caption,' ',MAXLINE);                                            // fill caption with spaces

    donnee = ligne;
	  legende = strpbrk(ligne,"!#");
    if (legende != NULL) {
        legende++;
        strcpy_s(caption,256,legende);
        strncpy_s(data_txt,256,donnee, strlen(ligne)-strlen(caption)-1);
    } else {
        strcpy_s(caption,256,"without caption");
        strcpy_s(data_txt,256,ligne);
    }
}


/** fill the end of caption with dots
 ************************************
 */
void pad_caption(char* caption) {
    char* end;                                                                // pointer to the end of non-space char
    char *pos2;                                                               // current position original string
    int leglen;

    leglen = strlen(caption);
    if (leglen >= MAXCAP) return;                                             //  long caption = nothing to fill

    pos2 = caption + leglen;
    end = caption + MAXCAP -1;
    while (pos2 < end) {
        *pos2 = '.';                                                          // pad with '.' 
        pos2++;
    }
    *pos2= '\0';                                                              // add final NULL
}


/** reads a double escaping comments and parsing legend
 ******************************************************
 *  @param  tra : file to trace reading
 *  @param  lec : file to read
 * the line to read has the form \n
 *  data   ! label
 * the following output will be send to tra stream
 *  caption........: data
 * where caption is a formated label (50 char max, dot are append at the end to reach 50 char)
 *
 * comments are lines where first nonblank charater is '#' or '!'
 * if a comment starts with '#>' or '!>' it is printed in tra
 */
double litreel(FILE *tra, FILE *lec) {
    double data;                                                                // double to read
    char ligne[MAXLINE];
    char caption[MAXLINE];
    char data_txt[MAXLINE];
    char*     err;

/* Read string buffer while skipping comments
   ------------------------------------------ */
    if (read_skip(lec, imp, ligne)== false)
            alarme(98,imp,GRAVE,"litreel","End of file while reading");

/* split string buffer into data and label
   --------------------------------------- */
    split_line(ligne, data_txt, caption);
    trimboth(data_txt);
    trimboth(caption);

/* decode data part
   ----------------------- */
    if ((data_txt[0]=='*')&&(data_txt[1]=='*')) {                               // '**' = asks data on the standart input
        fprintf(stdout,"(enter) %s :",caption);
        fgets(data_txt,MAXLINE,stdin);
    }

    err = data_txt;
//    data = 0.0; 
    data = strtod(data_txt,&err);
    if (err == data_txt) {                                                       // an error occured during conversion
        sprintf_s(er_msg,MAXLINE,"error: data is not a valid double \n %s",err);
        alarme(99,imp,GRAVE,"litreel",er_msg);
    }
 
/* print the result in a formatted way  "caption......: data"
   ---------------------------------------------------------- */
    pad_caption(caption);
//    if(verbo)    fprintf(stdout,"%s: %g\n",caption,data);
    if(debug >=2) fprintf(imp,"\t%s: %g\n",caption,data);

    return data;
}

qui se lit de la façon suivante:

extern char        er_msg[MAXCHAR];                                    // error message
double longueur;                                                   // Pipe length (m)

    longueur = litreel(tra,dat);                                   // Pipe length
    if ((longueur<1e-6) || (longueur>1.e3)) {                      // Validity range ]0:1000]
       sprintf(er_msg,"Pipe length is out range ]0 ; 1000] %g",longueur);
       alarme(13,imp,CORRECTION,"nom_du_module",er_msg);
       longueur = 0.84;
    }

Le programme alarme est décrit plus loin. Ce qui est important ici est que le test de validité de la donnée est effectué immédiatement après la lecture. Un numéro interne au programme (le 13) a été attribué à cette erreur.

Quelques commentaires sur l'utilitaire de lecture:

- Les premières fonctions adjustl et trim sont de simples suppressions des blancs aux extrémités des chaînes de caractères (manque des bibliothèques standard). Toutes ces fonctions sont dans un fichier ce qui permet la compilation séparée.

- Une fois la mémoire allouée et les chaînes initialisées, la fonction de lecture commence par sauter les lignes blanches et traiter les lignes de commentaires (les imprime dans le fichier de sortie si il commences par #<). Lorsque la fonction de lecture trouve la première ligne qui n'est pas vide et ne commence pas par "#", elle essaie de la décoder. Pour cela, la ligne lue est coupée en deux au niveau du premier caractère "!" ou "#". La partie de gauche doit contenir le nombre à lire et celle de droite est considérée comme étant la légende. Le nombre est décodé, avec un test de réussite, et l'ensemble est formaté pour l'écriture.

Avec le contenu de l'exemple précédent, le fichier pointé par tra doit contenir:

 Ce commentaire débutant par "#>" ou "!>" sera lu comme chaîne de caractères puis imprimé dans le fichier de résultats.
longueur du tuyau (m)...............................: 1.231

Attention Si le fichier de données est mal constitué, par exemple lorsque l'ordre des lignes n'est pas respecté. Il ne sera pas possible de le repérer facilement dans le fichier de trace. L'erreur est affichée avec la fonction alarme qui est décrite plus loin.

Il existe une fonction similaire pour lire une chaîne de caractères (voir le chapitre exemples pour servir de point de départ ).

J'ai un peu modifié mes fonctions de lecture pour intercepter au plus tôt les lignes mal formées et mieux retourner les erreurs. Maintenant il se présente de la façon suivante:

Voici l'utilitaire de lecture amélioré (s.v.p. cliquer sur la ligne)

/** @file litreel.c miscellaneous functions incl. reading with parsing */
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <errno.h>


// define boundaries for all tables in the model
// ---------------------------------------------
#ifndef _BOUNDARIES_
# define _BOUNDARIES_
# define MAXCAP     50                                                          /**< max lenght of a caption                 */
# define MAXLINE   255                                                          /**< max lenght of line                      */
# define NAMELENGTH 64                                                          /**< fixed name length                       */
#endif /* _BOUNDARIES_ */


/** removes spaces at both ends of a string
 ******************************************
 * @param input     : chaine de caracteres à traiter
 */
void trimboth(char* input) {
    char* pos;                                                                 // current position non-space-char
    char* pos2;                                                                // current position original string
    char* beg;                                                                 // pointer to the beginning of non-space char
    char* end;                                                                 // pointer to the end of non-space char

// find actual start of line
    beg = input;
    while isspace((unsigned char)*beg)) {
      ++beg;
    }

    // find last non space character (and replace by /0)
    //
    end = input + strlen(input)-1;
    while (end > beg && isspace((unsigned char)*end)) {
         *end = '\0';                                                              // replace space by '/0' (= right trim)
         end--;
    }

   // Move if needed.
   //
   if (beg == input) return;                                                    // no space at the line start (we are done)
   pos = beg;
   pos2 = input;
   while (pos <= end) {
       *pos2 = *pos;                                                            // move characters one by one
       pos++;
       pos2++;
   }

   while (pos2 <= end) {
       *pos2 = '\0';                                                            // pad with '/0'
       pos2++;

   }
}



/** replace all character oldc by newc
 *************************************
 * @param str  : string to modify
 * @param oldc : character to replace
 * @param newc : character to set
 * @return   number or replaced characters
 */
int strrepl(char *str, int oldc, int newc){
    int lindex = 0;
    int i = 0;

    if (oldc == '\0') return 0;                                                 // Do not replace NULL character !
    while(str[lindex] != '\0')) {                                                // Check until a char 13 is found
       if (str[lindex] == oldc) {
         str[lindex] = newc;
         ++i;
       }
       ++lindex;
    }
    return i;
}


/* Read a line and skips non meaning lines
 ******************************************
 *
 *  non meaning lines are empty lines or line containing only spaces, tab (see isspace function)\n
 *  or\n
 *  comment lines, starting by # or !
 */
long read_skip(FILE* lec, FILE* imp, char* ligne) {
    int line_OK = false;                                                 // found a line to analyse
    long      ErrCode = EXIT_SUCCESS;                                          // variable to report error codes

    do {
        if (fgets(ligne, MAXLINE, lec) == NULL) {                              // Read & check if end of file is reached
            if (feof(lec) != 0) {
                ErrCode = EOF;                                                 // dans <stdio.h> vaut -1
            } else {
               ErrCode = READ_ERROR;                                           // defined in util.h
            }
            return ErrCode;
        }
        trimboth(ligne);                                                       // compulsory to have a true empty line 
                                                                               // the trailing '\n' was removed
        line_OK = true;
        if (strnlen_s(ligne, MAXLINE) == 0) {                                  // Empty line : not OK
            line_OK = false;

        } else if ((ligne[0] == '#') || (ligne[0] == '!')) {                  // Comment line : not OK
            line_OK = false;
            if ((ligne[1] == '>') && (debug >= 2)) {                               // print this comment in the trace file
                ligne[0] = '>';
                fprintf(imp,"\t%s\n",ligne);
            } else if (strstr(ligne, "#N/A") != 0) {                           // special case, Excel error reporting can be confused with comment
                ErrCode = EXCEL_NAN;                                           // defined in util.h
                return ErrCode;
            }
        }
        
    } while (!line_OK);                                                         // loop until not empty and not a comment

    return ErrCode;
}


/** splits a line into data and caption (attention internal of util.c)
 **************************************
 *
 * @param ligne     : input string to split
 * @param data_txt  : return string containing data part
 * @param caption   : return string containing caption part
 */
long split_line(char* ligne, char* data_txt, char* caption) {
    char*     legende;                                                         // label as read
    char*     donnee;                                                          // data part (as string)
    long      ErrCode = EXIT_SUCCESS;                                          // variable to report error codes

    memset(data_txt,'\0',MAXLINE);                                             // fill data_txt with NULL character
    memset(caption,'\0',MAXLINE);                                              // fill caption with NULL character

    donnee = ligne;
    legende = strpbrk(ligne,"!#");
    if (legende != NULL)> {
        legende++;
        ErrCode = strncpy_s(caption, MAXLINE, legende,_TRUNCATE);
        if (ErrCode != EXIT_SUCCESS) return ErrCode;                           // EINVAL (zero length legende ou caption) ; ERANGE when MAXLINE=NULL  defined in <errno.h>
        ErrCode = strncpy_s(data_txt, MAXLINE, donnee,strlen(ligne)-strlen(caption)-1);   // ne pas mettre _TRUNCATE
    } else {
        ErrCode = strncpy_s(caption, MAXLINE, "without caption",_TRUNCATE);
        if (ErrCode != EXIT_SUCCESS) return ErrCode;                           // pb dans la copie
        ErrCode = strncpy_s(data_txt, MAXLINE, ligne,_TRUNCATE);
    }

    return ErrCode;                                                            // returns an error code
}


/** Fill the end of caption with dots
 ************************************
 */
void pad_caption(char* caption) {
    char* end;                                                                // pointer to the end of non-space char
    char* pos2;                                                               // current position original string
    int leglen;

    leglen = strlen(caption);
    if (leglen >= MAXCAP) return;                                             //  long caption = nothing to fill

    pos2 = caption + leglen;
    end = caption + + MAXCAP - 1;
    while (pos2 < end) {
        *pos2 = '.';                                                          // pad with '.'
        pos2++;
    }
    *pos2 = '\0';                                                             // add final NULL
}


/** Reads a double escaping comments and parsing legend
 ******************************************************
 *  @param  imp : file to trace reading
 *  @param  lec : file to read
 * the line to read has the form \n
 *  data   ! label
 * the following output will be send to imp stream
 *  caption........: data
 * or
 *  - caption......: data
 * where caption is a formated label (50 char max, dot are append at the end to reach 50 char)
 *
 * comments are lines where first nonblank charater is '#' or '!'
 * if a comment starts with '#>' or '!>' it is printed in imp
 *
 * @param  imp      : file to trace reading
 * @param  lec      : file to read
 * @param[out]  data     : double to read
 * @return error code
 */
long litreel(FILE* lec, FILE* imp, double* data) {
    char*     ligne = NULL;                                                    // string to read
    char*     caption = NULL;
    char*     data_txt = NULL;                                                 // data to read as a string
    char*     err;
//    char      er_msg[MAXLINE];                                                 // Error message
    char*     er_msg = NULL;                                                   // Error message (not allocated)
    long      ErrCode = EXIT_SUCCESS;                                          // variable to report error codes
    long      ErrSever;                                                        // Error severity

    ligne = (char*)calloc(MAXLINE,sizeof(char));
//    memset(ligne,'\0',MAXLINE);                                                // fills with zeros
    caption = (char*)calloc(MAXLINE,sizeof(char));
    data_txt = (char*)calloc(MAXLINE,sizeof(char));
    er_msg = (char*)calloc(MAXLINE,sizeof(char));


/* Read string buffer while skipping comments
   ------------------------------------------ */
    ErrCode = read_skip(lec, imp, ligne);
    if (ErrCode != EXIT_SUCCESS) {
        ErrSever = FATAL;                                                      // stop run
        if (ErrCode == EOF) {
            alarme(ErrCode, imp, ErrSever, "litreel", "End of file while reading");
        } else if (ErrCode == EXCEL_NAN) {
            if(debug >=1) fprintf(imp,"%s\n",ligne);
            alarme(ErrCode, imp, ErrSever, "litreel", "Excel Not a Number in the line");
        } else {
            alarme(ErrCode, imp, ErrSever, "litreel", "IO error while reading file");
        }
    }

/* Split string buffer into data and label
   --------------------------------------- */
    ErrCode = split_line(ligne, data_txt, caption);
    trimboth(data_txt);
    strrepl(data_txt,',','.');                                                 // replace coma by dot (french Excel !)
    trimboth(caption);

/* decode data part
   ----------------------- */
    if ((data_txt[0] == '*') && (data_txt[1] == '*')) {                              // '**' = asks data on the standard input
        fprintf(stdout, "(enter) %s :",caption);
//        fgets(data_txt, MAXLINE, stdin); 
        if( fgets(data_txt, MAXLINE, stdin) == NULL) {
            ErrCode = KEYB_READ;
            ErrSever = FATAL;                                                  // stop run
            alarme(ErrCode, imp, ErrSever, "litreel", "error while entering data in keyboard");
        }
    }

    err = data_txt;
//    data = 0.0;
    *data = strtod(data_txt,&err);
    if (err == data_txt) {                                                     // an error occured during conversion
        ErrCode = ERANGE;                                                      // dans <math.h> = 34
        ErrSever = FATAL;
        sprintf_s(er_msg, MAXLINE, "error: data is not a valid double \n %s", err);
        alarme(ErrCode, imp, ErrSever, "litreel", er_msg);
    }
 
/* print the result in a formatted way  "caption......: data"
   ---------------------------------------------------------- */
    pad_caption(caption);

//    if(verbo)    fprintf(stdout,"%s: %g\n",caption,data);
//    if(debug > =2) fprintf(imp,"\t%s: %g\n",caption,data);     // for html
    if(debug >= 2) fprintf(imp, "- %s: %g\n",caption, *data);       // for markdown list

    free(er_msg);
    free(data_txt);
    free(caption);
    free(ligne);
    return ErrCode;
}


/** reads a long int escaping comments and parsing legend
 ********************************************************
 *  @param  imp : file to trace reading
 *  @param  lec : file to read
 *
 * the line to read has the form                     \n
 *  data   ! caption                                 \n
 * the following output will be send to imp stream   \n
 *  \tcaption........: data                          \n
 * or                                                \n
 * - caption........: data 
 * where caption is a formated label (MAXCAP char max, dot are append at the end to reach 50 char)
 *
 * comments are lines where first nonblank charater is '#' or '!'
 * if a comment starts with '#>' or '!>' it is printed in imp
 *
 * When the line starts by two stars '**', the data is not read from the normal stream but from the keybord (stdin) 
 *
 * @param  imp      : file to trace reading
 * @param  lec      : file to read
 * @param[out]  data     : integer to read
 * @return error code
 */
long int litentier(FILE* lec, FILE* imp, long* data) {
    char*     ligne = NULL;                                                    // string to read
    char*     caption = NULL;
    char*     data_txt = NULL;                                                 // data to read as a string
    char*     err;
//    char      er_msg[MAXLINE];                                                 // Error message
    char*     er_msg = NULL;                                                   // Error message (not allocated)
    long      ErrCode = EXIT_SUCCESS;                                          // variable to report error codes
    long      ErrSever;                                                        // Error severity

    ligne = (char*)calloc(MAXLINE,sizeof(char));
//    memset(ligne,'\0',MAXLINE);                                                // fills with zeros
    caption = (char*)calloc(MAXLINE,sizeof(char));
    data_txt = (char*)calloc(MAXLINE,sizeof(char));
    er_msg = (char*)calloc(MAXLINE,sizeof(char));

/* Read string buffer while skipping comments
   ------------------------------------------ */
    ErrCode = read_skip(lec, imp, ligne);
    if (ErrCode != EXIT_SUCCESS) {
        ErrSever = FATAL;                                                      // stop run
        if (ErrCode == EOF)> {
            alarme(ErrCode, imp, ErrSever, "litentier", "End of file while reading");
        } else if (ErrCode == EXCEL_NAN) {
            if(debug>=1) fprintf(imp,"%s\n",ligne);
            alarme(ErrCode, imp, ErrSever, "litentier", "Excel Not a Number in the line");
        } else {
            alarme(ErrCode, imp, ErrSever, "litentier", "IO error while reading file");
        }
    }

/* split string buffer into data and label
   --------------------------------------- */
    ErrCode = split_line(ligne, data_txt, caption);
/*    if (ErrCode != EXIT_SUCCESS) {
        ErrSever = FATAL;                                                      // stop run
        if (ErrCode == EINVAL) {
            alarme(ErrCode, imp, ErrSever, "litentier", "data_txt or caption not allocated");
        } else if (ErrCode == ERANGE) {
            alarme(ErrCode, imp, ErrSever, "litentier", "MAXLINE = 0 !");
        }
    } */
    trimboth(data_txt);
    trimboth(caption);

/* decode data part
   ----------------------- */
    if ((data_txt[0] == '*') && (data_txt[1] == '*')) {                              // '**' = asks data on the standard input
        fprintf(stdout,"(enter) %s :",caption);
//        fgets(data_txt, MAXLINE, stdin);
        if( fgets(data_txt, MAXLINE, stdin) == NULL) {
            ErrCode = KEYB_READ;
            ErrSever = FATAL;                                                  // stop run
            alarme(ErrCode, imp, ErrSever, "litentier", "error while entering data in keyboard");
        }
    }

    err = data_txt;
//    *data = 0;
    *data = strtol(data_txt,&err,10);                                          // 10 means base 10
    if (err == data_txt) {                                                     // an error occured during conversion
        ErrCode = ERANGE;
        ErrSever = FATAL;
        sprintf_s(er_msg,MAXLINE," %s is not a valid integer \n",err);
        alarme(ErrCode, imp, ErrSever, "litentier", er_msg);
    }

/* print the result in a formatted way  "caption......: data"
   ---------------------------------------------------------- */
    pad_caption(caption);

//    if(verbo)    fprintf(stdout,"%s: %ld\n",caption,*data);
//    if(debug>=2) fprintf(imp,"\t%s: %ld\n",caption,*data);                     // html
    if(debug >= 2) fprintf(imp, "- %s: %ld\n",caption, *data);       // for markdown list

    free(er_msg);
    free(data_txt);
    free(caption);
    free(ligne);
    return ErrCode;
}

qui se lit de la façon suivante:

extern char        er_msg[MAXCHAR];                                    // error message
double longueur;                                                   // Pipe length (m)

    ErrCode = litreel(tra,dat,&longueur);                             // Pipe length
    if ((longueur<1e-6) || (longueur>1.e3)) {                      // Validity range ]0:1000]
       sprintf(er_msg,"Pipe length is out range ]0 ; 1000] %g",longueur);
       alarme(13,imp,CORRECTION,"nom_du_module",er_msg);
       longueur = 0.84;
    }

lecture de résultats d'expériences ou de données production. Chaque ligne correspond à un enregistrement à un temps donné ou à un produit.
lorsque les données sont tabulées, par exemple table de la conductivité en fonction de la température.

La première question à se poser est: A t-on besoin d'avoir lu tout le tableau pour faire les calculs ?

Si la réponse est non, ce qui est souvent le cas lors de l'utilisation de données de production. Alors, il n'y a pas réellement de manipulation de tableau dans le programme. Les variables contenant les données d'une ligne peuvent être déclarées en entête de programme. Dans ce cas le déroulement du calcul est :

Tant qu'il reste des données à lire faire

lire une ligne (soit une série de données) qui remplace les anciennes valeurs
effectuer les calculs à partir de ces valeurs
recommencer jusqu'a ce que tout le fichier soit parcouru

2.4.a.Données tabulées et un de leurs inconvénients

Ici il faut lire toutes les valeurs avant calcul. Si, par chance, la taille du tableau est fixe et connu lors de la conception, il est possible de déclarer le tableau entièrement lors de l'écriture du code.

Mais ce n'est pas toujours la bonne solution. Toute la place mémoire du tableau est réservée dans le fichier exe qui devient rapidement très volumineux. Même si l'époque des disquettes est révolue cela peut être gênant. La bonne solution est d'utiliser les tableaux dynamiques, elle est expliquée dans le paragraphe suivant.

Mais avant, un petit mot sur un inconvénient peu connu des données tabulées. Leur utilisation demande beaucoup de temps CPU !

Prenons le cas classique ou une conductivité est tabulée par pas de 10 degrés entre 0 et 1000 C. Pour estimer la conductivité à 753 C, il faut parcourir tout le tableau, puis interpoler à partir des valeurs les plus proches. A ma grande surprise, lors du profilage du code c'est cette phase qui prend le plus de temps CPU ! Je l'ai remarqué dans plusieurs cas distincts.

La bonne solution est de remplacer le tableau de chiffres par une formule interpolée. Cela demande plus de travail de la part de l'utilisateur et du concepteur, mais le gain en temps est appréciable.

2.4.b.tableaux dynamiques

Ils n'existent pas en Fortran 77, et c'est pour cela que je conseille de ne plus l'utiliser. J'ai longtemps été un adepte enthousiaste du Fortran 77 avant de passer au Fortran 90 puis au C.

Avant de lire le tableau, il faut "allouer la mémoire" (ce qui veut dire réserver de la place et se souvenir de l'adresse de début) avec la fonction malloc ; calloc. Pour réserver une place suffisante il faut connaître la taille du tableau. Aussi, tant que c'est possible j'indique le nombre de lignes à lire dans le fichier avant le tableau. Il faut pour cela connaître sa taille avant la constitution du fichier :

xx  ! Nombre de point dans la table
température1   conductivité1
température2   conductivité2
...
[END]

Malheureusement, souvent la taille du tableau ne peut pas être connue avant l'exécution du programme.

La technique simple est de lire une première fois le tableau pour compter les lignes, puis faire l'allocation de mémoire, revenir en début de tableau (avec les fonctions fsetpos et fgetpos et enfin lire réellement le tableau. Avec la fonction realloc, ce n'est pas nécessaire la place mémoire est augmentée avec les besoins.

Voici un exemple


#include <stdio.h>
#include <stdlib.h>
#include <string.h>

#define MSG             0	                                           /* message simple */
#define AVERTISSEMENT   1	                                           /* avertissement sans correction */
#define CORRECTION      2	                                           /* avertissement avec correction */
#define GRAVE           3	                                           /* erreur grave (fatal) */

#define MAXCHAR         255	                                          /* taille maximale d'une ligne */

/** @struct matable

 ************************
 * thermal table of materials
 */
struct matable {
    double       Temp;                                               //!< temperature T (K)
    double       Rho;                                                //!< volumic mass (kg/m3)
    double       QSpec;                                              //!< heat capacity (W/m3/K)
    double       Diffu;                                              //   Diffusivité (not used)
    double       Lambda;                                             //!< themal conductivity (W/m/K)
};


/** Decode a double in a string and check if an alam occured
 ***********************************************************
 * @param deb pointer to string (see strtod)
 * @param[out] err pointer to next data (see strtod)
 * @param nmodule  calling module
 * @param imp  trace file
 * @return decoded double
 * @remarks possible error number: 99
 */
double decodealarm (const char* deb, char **err, const char *nmodule, FILE * imp) {
    char       er_msg[255];                                          //message d'erreur
    double     data;

    data = strtod(deb,err);
    if (deb == (char*)&err) {                                         // erreur 97
        sprintf(er_msg,"data conversion error: %s\n",deb);
        alarme(97,imp,GRAVE,nmodule,er_msg);
    }
    return data;
}


/** Read  table for thermal data
 *******************************
 * column contains :
 * 1 = Temperature T
 * 2 = Masse volumique Rho
 * 3 = Chaleur Specifique QSpec
 * 4 = Diffusivity a
 * 5 = Thermal conductivity Lambda
 * @param mat input stream
 * @param imp trace stream
 * @return an array of thermal data
 */
struct matable *LitThermophys(FILE *mat, FILE *imp) {
    struct matable *tabcar;
//    const int       DataPerLine = 5;                                 // could be a parameter

    unsigned int    row,col;                                         // indice row, column
    unsigned int    nbrow;                                           // actual number of row
    char           *ligne,*pligne;
    char           *err = NULL;
    int             len;

    pligne = (char*)malloc((MAXCHAR+1)*sizeof(char));                // allocate space for ligne
    tabcar = (struct matable *)calloc(0,sizeof(struct matable));     // allocate memory for table

/* read data and expand size if necssary
   ------------------------------------- */
    row = 0;
    while (fgets(pligne,MAXCHAR,mat)) {
        ligne = pligne;
        len = adjleft(ligne);
        if (strncmp(ligne,"[END]",5) == 0 ) break;                   // end of table
        if (len == 1) continue;                                      // skip empty lines
        if ((ligne[0]=='#')||(ligne[0]=='!')) continue;              // skip comments lines
        tabcar = (struct matable *)realloc(tabcar, (row+1)*sizeof(struct matable));  // increase size of tabcar
        tabcar[row].Temp   = decodealarm(ligne, &err,"LitThermophys",imp);
        ligne = err;
        tabcar[row].Rho    = decodealarm(ligne, &err,"LitThermophys",imp);
        ligne = err;
        tabcar[row].QSpec  = decodealarm(ligne, &err,"LitThermophys",imp);
        ligne = err;
        tabcar[row].Diffu  = decodealarm(ligne, &err,"LitThermophys",imp);
        ligne = err;
        tabcar[row].Lambda = decodealarm(ligne, &err,"LitThermophys",imp);
        row++;
   }
    nbrow = row;
    free(pligne);

/* print table
   ----------- */
    for (row=0; row<nbrow; row++) {
        fprintf(imp,"%i>%g\t%g\t%g\t%g\t%g\n",row,tabcar[row].Temp,tabcar[row].Rho,
                tabcar[row].QSpec,tabcar[row].Diffu,tabcar[row].Lambda);
    }
    return tabcar;
}

Les lignes sont ajoutées au tableau jusqu'à celle qui contient [END] (ou que l'on atteigne la fin de fichier). Les éléments du tableau sont stockés dans des structures. Notez que l'ordre scan et ses variantes n'est pas utilisé, ce qui permet d'utiliser ses propres tests de validité des données.

3.1.Contrôler la quantité d'information à l'écran et dans le fichier de trace

Lors de leurs exécutions, mes programmes écrivent des messages sur leur déroulement à la fois à l'écran (sur stdout) et dans un fichier (de trace ou de log). Les messages à l'écran permettent de rassurer l'utilisateur en l'informant que le programme n'est pas planté. Le fichier de trace permet d'analyser un calcul terminé surtout en cas d'erreur.

3.1.a.affichage à l'écran

Les messages à l'écran doivent être succincts et peu nombreux pour éviter de trop ralentir le calcul. D'ailleurs de trop nombreux messages ne sont en général pas lisibles car ils défilent trop vite sur les ordinateurs modernes. Dans le cas ou le programme est lancé automatiquement et régulièrement en tâche de fond, il est préférable de ne pas envoyer du tout de messages.

C'est pourquoi il faut laisser le choix à l'utilisateur d'afficher ou non ces messages. Pour cela, une variable globale (appelée verbo) contrôle chaque écriture à l'écran.

if (verbo>0) {fprintf(stdout,"Open data file : %s\n",fichdat); fflush(stdout); }

L'ordre fflush(stdout) permet de forcer l'affichage immédiat (nécessaire avec Mingw).

Dans le programme, la variable verbo ne peux prendre que la valeur 0 (pas d'affichage) ou 1. Sa valeur par défaut est à 1, mais elle peut être modifiée dans la ligne de commande. Dans le cas ou le programme comporte plusieurs fichiers séparés, elle doit être déclarée dans chaque module avec le qualificatif extern sauf dans le programme principal.

3.1.b.messages dans le fichier trace

Le fichier trace doit contenir plus d'informations pour permettre l'analyse du calcul. Pour mieux contrôler la quantité d'information j'utilise une technique similaire à la précédente, la variable debug peut prendre plusieurs valeurs.

Voici leurs déclarations

/* Declare common variables
   ------------------------ */

int         verbo=1;                           //!< trace flag (display)
int         debug=2;                           //!< trace flag (file)
                                               //!< 0 = no message
                                               //!< 1 = main steps
                                               //!< 2 = 1 + global results
                                               //!< 3 = all results

Il existe aussi la possibilité d'utiliser les directives de compilation pour contrôler la quantité de messages écrits. Avec cette technique, le code est mieux optimisé. Mais l'utilisateur n'a plus la main. De plus il faut produire plusieurs exécutables, un avec l'affichage des messages et un sans, ce qui complique la gestion exécutables installés chez les utilisateurs.

4.1.Difficile mais aussi important que le manuel

L'idée est d'éviter d'avoir un programme qui s'arrête brusquement et laisse l'utilisateur perplexe sans indications pour surmonter l'erreur. Malheureusement, il n'y a pas de recette simple. Les techniques existantes de vérification des codes sont relativement complexes et sont une branche à part du métier de développeur.

L'introduction des données est un point crucial où sont introduites la majorité des erreurs pour un programme stable. Une attention particulière doit être portée sur la vérification de la validité des valeurs. C'est pour cela qu'il faut se forcer à définir un plage de validité pour chaque donnée lue.

Vous trouverez un example de test de validité dès la lecture des données un peu plus haut. Cet example affiche les erreur avec un utiliaire "alarme"."

La façon de faire précédente peut encore être améliorée. Avec cette façon simple d'écrire, les numéros d'erreur ainsi que leurs libellées sont définis un peu n'importe où dans le programme. Il y a un risque d'utiliser deux fois le même numéro pour deux erreurs différentes.

Une astuce est d'utiliser un enum pour définir les n° d'erreurs dans un fichier "header". En effet, le numéro de l'erreur n'a pas de signification en lui même, c'est juste un code interne au programme.

Un enum, permet de attribuer un pseudo-indicateur plus explicite. Appeler l'erreur BUFFER_FULL au lieu de l'erreur n°163, c'est plus lisible pour le programmeur.

Leur forme est souvent de peu d'importance, il est rare que ces fichiers soient utilisés tel quels. Mais autant le rendre facile à lire une fois ouvert dans un éditeur de texte. Nous y reviendrons dans faire de belles sorties.

Ici il n'y a qu'un point important: pas de fichier orphelin, c'est à dire dont on a le résultat mais pas d'indications sur les données initiales, le nom et la version du programme de calcul, la date et l'heure du calcul.

6.1.La documentation fait la qualité du programme

Écrire la documentation prend beaucoup de temps en fait autant que d'écrire le programme. Cette phase est souvent négligée alors que c'est une part importante de la qualité perçue d'un programme.

Sur le long terme il est payant d'écrire une bonne documentation, aussi considérez ce travail avec la même valeur et la même priorité que d'écrire le programme lui même.

6.2.Le HTML pour son universalité

J'écris la documentation en html, car c'est le langage de description d'hypertexte le plus simple et le plus universel. Il existe d'autres choix comme le postscript, le pdf, chm (standard Windows), voir doc Word. Mais html reste universel et il est relativement facile de le convertir dans les autres formats. Son principal défaut est d'être souvent mal paginé une fois imprimé.

La notice est souvent lue sur un écran, donc je vous conseille de privilégier une police de caractère simple comme Helvética. Certaines notices écrites avec la police "Times new roman" sont très jolies une fois imprimées, mais difficiles à lire à l'écran.

6.3.Un contenu pour plusieurs niveaux de lecture de la documentation

La documentation est lue par plusieurs catégories de personnes (Utilisateur, programmeur mainteneur, informaticien système, contrôleur qualité). Donc elle doit contenir de divers items dont voici une liste non exhaustive.

Pour tous: l'objet du programme, ce que fait le modèle
le domaine d'utilisation en confiance, hors confiance,
la théorie sur lequel il est basé,
la liste de l'évolution des versions
Pour l'utilisateur: la description du fichier de données (avec exemples),
les limites de validité,
la description du fichier de résultats,
l'utilisation du modèle en ligne de commande et/ou avec un GUI,
liste des erreurs reconnues,
FAQ
Pour informaticien: l'installation avec la liste des fichiers utiles, la désinstallation,
les programmes tiers,
ressource machine, temps utilisateur,
évolution des versions
Pour le développeur mainteneur: La liste des fichiers source, de la notice et des exemples
le nom du compilateur utilisé,
la description de la technique numérique si elle est particulière,
un lien vers la sortie de doxygen,
liste des bugs connus,
liste des souhaits de développement
Pour le contrôleur qualité: un lien vers le compte rendu d'audit

Ne pas oublier de rappeler la date de dernière mise à jour et le numéro de version.

6.4.Fiche de vie du programme

Les professionnels recommandent d'établir une fiche de vie du programme. C'est en fait un tableau regroupant les évolutions datées des versions avec un rappel succinct des modifications, accompagné des validations (jeux test et résultats de calcul), du nom du valideur. Il peut y avoir une liste de bogues et une liste de souhaits d'améliorations.

A chaque évolution notable (version stable), il faut archiver tous les fichiers. Il arrive de faire des améliorations qui n'en sont pas et de devoir reprendre la version antérieure.

Le contenu minimal de la fiche de vie est :

Identification du logiciel
Historique des versions
bugs ouverts ou todo list

Exemple du contenu de l'historique des versions.


Date	Numéro de version	Nature des modifications Remarques	Identification des jeux tests associés	Visa du responsable de la validation

Oct 2005	0.01	Ecriture initiale de toto	jeux1	Moi même
Nov 2005	0.02	Version développement, ajout du module bidule	jeux2	encore moi même
Oct 2006	0.03	Correction de bug dans le module bidule	jeux2	son pote

6.5.Bien commenter le code

Ce sujet fait l'objet de très nombreuses discussions sur le net, elles sont parfois passionnées. J'ai tendance à être un peu verbeux et redondant.

rendre le code agréable à lire, c'est à dire l'aérer
montrer la structure du code au premier coup d'oeil, mettre des titres, indenter, ...
expliquer la fonctionnalité attendue de chaque élément de la structure
expliciter chaque variable par un nom explicite et un commentaire (spécialement pour les variables globales ou communes)
avertir sur les exceptions possibles et sur les cas particuliers

Penser au développeur nouveau sur ce projet. Souvent des commentaires qui paraissent clairs voir superflus lors de l'écriture deviennent hermétiques lorsque le contexte du développeur n'est pas connu ou a été oublié.

C'est encore plus vrai pour les astuces et les corrections. De fait la majorité des parties obscures d'un programme viennent de la chasse initiale aux bogues. Le développeur stressé parce que son programme ne réagit pas comme il le devrait ne commente pas les modifications.

Si vous le pouvez, utilisez l'anglais pour les commentaires. En français, l'audience informatique est vraiment réduite.

6.6.Eviter les inclusions multiples

Enscript est fourni avec toutes les distribution Linux. Il effectue la mise en page de listings avant impression. Il est possible de s'en servir pour se faire un beau listing coloré en html.

$enscript -E --color --language=html --toc -pfoo.html *.h *.c

kwrite et la pluspart des éditeurs modernes permet également de sauvegarder la coloration syntaxique dans un fichier html.

doxygen extrait certains commentaires du code et les assemble dans une documentation technique hypertexte. Cette documentation est orientée pour les développeurs et la maintenance de l'application. Elle ne dispense donc pas d'une notice d'utilisation et de description du contenu scientifique.

Utiliser doxygen nous invite à commenter correctement le contenu de chaque fonction, la nature des paramètres d'entrée, les bugs et autre. L'avantage principal est de retrouver rapidement ces informations sans avoir à "fouiller" dans tous les fichiers.

Documenter un code pour que doxygen en fasse une bonne documentation n'est pas si évident que cela. Voici quelques conseils, très loin d'être exaustifs.

@mainpage explications : indique à doxygen ou il trouvera les info générales sur le code à mettre dans la page d'accueil de la documentation
@author
@version
@date
@bug s'il y en a de connus
@copyright

@file explications : à mettre pour chaque fichier

Seul l'utilisateur final est juge de la justesse et stabilité du code. Pour le satisfaire, la qualité commence dès l'écriture et un code bien structuré et documenté facilite l'atteinte de cet objectif.

7.1.La validation lors de l'écriture

Le développeur prend rapidement l'habitude de tester chaque blocs de lignes nouvellement écrites. Le piège est de ne vérifier que dans les cas attendus, les plus courants que le résultat est conforme aux attentes. Par exemple dans le programme simple du début il faut tester son comportement lorsque l'entrée:

n'est pas un nombre,
est un nombre très grand
à un séparateur virgule ex: 45,6 au lieu de 45.6
à un séparateur de millier ex: 1 023.5 au lieu de 1023.5

Notez que dans certains cas, le programme semble avoir fonctionné normalement (cas du nombre avec virgule). Le programme ne proteste pas et le résultat semble plausible. Mais il est faux !!!

Les deux derniers cas ne sont pas si exotiques, surtout lorsque ces données sont issues d'un autre programme. Excel #@$ m'a déjà causé beaucoup de misères de ce type !

Citons au passage un grand classique du bug: les noms de fichier comportant un espace comme le célèbre "Mes Documents". Un programme insuffisamment testé ne lit que la première partie du nom Mes et bien sur ne trouvera pas le dossier.

7.2.Les exemples ou jeux tests

Les fichiers de validation (ou jeux tests) ont beaucoup de valeur. Il faut absolument archiver les fichiers de données avec leurs résultats à coté du code source et de la notice.

Ils servent aux utilisateurs novices, mais aussi aux futurs développeurs. Cela permet de vérifier que les améliorations ne dégradent pas les résultats.

C'est la rançon du succès et aussi un effet de la mondialisation. Pour l'instant tous les messages du code de calcul sont de préférence en anglais.

Un utilitaire comme gettext permet de traduire les messages et de maintenir le fichier de traduction. Le principal inconvénient est qu'il n'est pas possible de préciser complètement le dossier où se trouvent les messages traduits. Ils sont placés dans le sous dossier xxxx/fr/LC_MESSAGES ou xxxx est le nom du dossier qui peut être défini par le développeur.

Cela peut poser des difficultés lors de l'installation de l'ensemble sur un autre ordinateur.

Un petit ajout sur la création d'une DLL. Je ne reviens pas sur l'utilité d'une DLL, même si en pratique il y aurait à dire.

Ce n'est pas ma spécialité, donc cette section sera très basique. Je me suis beaucoup inspiré des documents "Tutorial : Utiliser des DLL" des auteurs "Charles « Xs » « Delire8 » « Xcept » Langevin" et "La compilation séparée en C" par Jessee Michaël C. Edouard.

9.1.Première étape : création de trois dossiers

Commençons par créer le dossier du projet que j'appelle ici "essai_dll". Nous aurons besoin d'un minimum de trois sous dossiers.

un pour écrire et compiler la DLL, appelé ici "ma_dll"
un pour écrire et compiler le programme utilisant la DLL, il est appelé ici "test_dll"
un pour executer les tests, il est applelé simplement "bin"

Les second et troisième dossiers pourraient être rassemblés. On risque alors de le pas repérer un appel à la DLL par un lien "en dur", c'est pourquoi je préfère les séparer.

9.2.seconde étape créons la DLL

Ouvrons dans DevC++ un nouveau projet de type "DLL" ! Le template propose alors deux fichiers (.c et . h) que nous allons légèrement modifier pour obtenir ceci.

DLL très simple (s.v.p. cliquer sur la ligne)

Le fichier de déclaration contient :

C'est un peu abscon, et il ne faut pas chercher à comprendre ! Par rapport aux références citées au dessus j'ai ajouté __stdcall. Je ne sais pas exactement ce que cela fait mais ceci est nécessaire pour pouvoir appeler la DLL à partir de Excel.

Je sais, l'addition est fausse, mais ici c'est fait exprès !

Pour info le fichier make file contient (simplifié seulement la partie en C)

Compiler, puis vérifier que le fichier ma_dll.dll est bien créé.

9.3.Troisième étape : créer un programme de test

Dans DevC++ créer un nouveau projet de type "console" et enregistrer sous le nom "test_dll".

Remplacer le contenu du fichier exemple par celui ci :

Utilisation simple de la DLL (s.v.p. cliquer sur la ligne)

A ce stade, la compilation se passe bien, mais pas l'édition des liens. Il faut indiquer au programme que l'on utilise "ma_dll.dll" comme "library". Cela se voit le make file suivant sur la ligne LIBS.

Pour info le fichier make file contient (simplifié seulement la partie en C)

A ce stade l'executable test_dll.exe doit avoir été créé.

9.4.Quatrième étape : tester le fonctionnement

Mettre le fichier test_dll.exe dans le dossier bin, puis le "double cliquer". Comme le programme ne trouve pas la DLL, il doit afficher une erreur.

Ajouter le fichier ma_dll.dll dans le dossier bin et recommencer. Cette fois ci cela marche on doit obtenir ceci :

Le calcul dans la DLL est faux ! Normal, on l'a fait exprès pour vérifier que l'opération est bien réalisée par la nouvelle DLL. On peut maintenant retourner à l'étape 1 et corriger la fonction addition. Recréer une DLL et remplacer la première version dans le dossier bin.

Double cliquer sur le fichier exe, et normalement ont doit obtenir ceci :

L'erreur est corrigée sans que l'on ait besoin de modifier ni de réinstaller le programme test_dll.exe.

10.1.A quoi sert vraiment d'écrire une DLL ?

La justification habituelle de passer à l'écriture DLL est la possibilité de corriger des erreurs (bugs) sans tout réinstaller (comme c'est décrit juste avant). En pratique et dans le cas d'une amélioration du noyau de calcul, il est aussi facile de remplacer tout l'exe, celui-ci étant rarement excessivement volumineux. Une autre utilisation classique est de confier des tâches spécifiques à des fonctions écrites par d'autres développeurs. Cette technique permet de développer tout en ne concervant qu'un conctact minimal vial l'API avec le concepteur du module. Celles-ci étant génériques et disponible sur le net.

Pour nous, la véritable utilité d'une DLL est de pouvoir relier le noyau de calcul à un autre environnement. En particulier, cela permet d'utiliser Excel comme interface utilisateur.

Il y a plusieurs étapes à réaliser pour faire un programme de calcul en se servant d'Excel comme interface

1) écrire les données dans une feuille Excel, que l'on appelle "Data" ou "Données" (un peu par manque d'imagination et surtout parce que c'est le plus logique !).

2) créer un bouton pour activer une fonction VBA qui envoie les données vers une fonction de la DLL

3) créer un bouton qui active une fonction VBA qui lance le calcul et indique uand celui ci est terminé.

4) créer un bouton qui copie les résultats et les affiche dans un feuille de calcul, que l'on appelle "Result" ou "Résultats".

Voici un module VBA de taille minimale, ici le calcul est tellement simple qu'il n'y a pas lieu de faire des copies locales des variables:

contenu du module VBA (s.v.p. cliquer sur la ligne)

La première ligne avec le nom du module est facultative.

Mais pour chaque fonction de la DLL, il y a deux parties: en premier les déclarations des fonctions de la DLL (obligatoire), puis des fonctions ou subroutines en VBA qui appellent les fonctions de la DLL proprement dites.

Revenons au chemin de la DLL, j'utilise une astuce d'un collègue Belge. La lettre du disque et le chemin d'accès sont indiqués dans la feuille Excel. Le script suivant permet de changer le dossier de travail et ainsi charger correctement la DLL. L'utilisateur n'a qu'à indiquer le chemin dans le bonnes cellules lors de l'installation du fichier de la DLL.

Avec cette astuce, il n'est plus nécessaire d'indiquer le chemin dans les déclarations des fonction en VBA, on peut se contenter de donner le nom de la DLL.

Localisation de la DLL flexible (s.v.p. cliquer sur la ligne)

La localisation doit être executée chaque fois que le classeur du modèle est ouvert. Je n'ai pas cherché à la faire exécuter automatiquement à l'ouverture, elle est activée paril suffiet d'appuyer sur un Bouton [INIT] sur la feuille de données.

La première modification concerne la lecture des données en entrée. Celle-ci sont regroupées dans une feuille appelée Data page. Il faut remplacer les fonctions de lecture dans un fichier. Cela nous demande de créer trois objets:

- Des fonctions qui acceptent les données envoyées par VBA.

- Une ou plusieurs subroutines VBA qui récupèrent les données dans cette feuille et les envoient à la DLL.

- Un boutton dans Excel pour activer cette fonction (il y a plusieurs façons de faire).

Il est possible d'envoyer des long, double, char (un seul dans le send DLL vers VBA!), un table par l'adresse du premier élément et même des structures..

Le noyau de calcul

Sommaire (svp cliquer sur la ligne)

1.Ecrit en C ou autres langages compilés

1.1.Le choix du langage n'est pas primordial

1.2.un premier exemple

Commençons par un tout petit exemple ! (s.v.p. cliquer sur la ligne)

2.Lecture des données

2.1.Lecture au clavier, dans la ligne de commandes

2.1.a.Entrées au clavier à consommer avec modération

Version corrigée qui teste la valeur entrée (s.v.p. cliquer sur la ligne)

2.1.b.Mettre les données dans la ligne de commandes

Exemple de valeur entrée en ligne de commandes (s.v.p. cliquer sur la ligne)

2.2.Lecture dans un fichier

Exemple de ligne de commandes : nomprogramme -i fichin -o fichout (s.v.p. cliquer sur la ligne)

Voici l'ouverture des fichiers.

2.3.Les données ont des unités !

Cas d'un mauvais fichier de données C'est un exemple vécu !!!

Fichier texte avec commentaires

Voici l'utilitaire de lecture (s.v.p. cliquer sur la ligne)

Voici l'utilitaire de lecture amélioré (s.v.p. cliquer sur la ligne)

2.4.Lecture de tableaux dynamiques

2.4.a.Données tabulées et un de leurs inconvénients

2.4.b.tableaux dynamiques

Voici un exemple

3.Affichage lors du déroulement

3.1.Contrôler la quantité d'information à l'écran et dans le fichier de trace

3.1.a.affichage à l'écran

3.1.b.messages dans le fichier trace

4.Gestion des erreurs

4.1.Difficile mais aussi important que le manuel

4.2.Filtrer les entrées

Voici la fonction d'affichage de l'erreur

4.3.Regrouper la liste des erreurs

5.La présentation des résultats dans un fichier

6.Documentation, fichier de test, fiche de vie, etc

6.1.La documentation fait la qualité du programme

6.2.Le HTML pour son universalité

6.3.Un contenu pour plusieurs niveaux de lecture de la documentation

6.4.Fiche de vie du programme

6.5.Bien commenter le code

6.6.Eviter les inclusions multiples

6.7.Se faire un beau listing avec enscript

6.8.Utiliser doxygen

7.Validation et jeux tests

7.1.La validation lors de l'écriture

7.2.Les exemples ou jeux tests

8.Internationalisation

9.Créer une DLL avec DevC++

9.1.Première étape : création de trois dossiers

9.2.seconde étape créons la DLL

DLL très simple (s.v.p. cliquer sur la ligne)

Le fichier de déclaration contient :

Pour info le fichier make file contient (simplifié seulement la partie en C)

9.3.Troisième étape : créer un programme de test

Utilisation simple de la DLL (s.v.p. cliquer sur la ligne)

Pour info le fichier make file contient (simplifié seulement la partie en C)

9.4.Quatrième étape : tester le fonctionnement

10.Faire fonctionner un programme de calcul en se servant de Excel comme interface

10.1.A quoi sert vraiment d'écrire une DLL ?

10.2.Commençons par écrire une fonction VBA pour connecter une DLL

contenu du module VBA (s.v.p. cliquer sur la ligne)

10.3.Localiser la DLL

Localisation de la DLL flexible (s.v.p. cliquer sur la ligne)

10.4.Modifications pour rendre un modèle compatible avec une DLL pour Excel

Fonction VBA d'envoi des données (s.v.p. cliquer sur la ligne)

Voici la fonction de la DLL qui récupère ces données

10.5.Quelles types de variables peut-on communiquer entre la DLL et Excel