• Billet écrit dans : SQL 02.12.2008 Quelqu'un a réagi !

    Pour un projet d’annuaire de Flux RSS, j’ai du faire en sorte que l’on puisse importer ses Flux dans l’annuaire via un fichier XML opml que tout bon agrégateur (google reader, netvibes) fournit. Donc admettons que l’on a 100 flux RSS à importer il faut pour chaque flux vérifier si le flux n’existe pas déjà sinon le créer en base. Donc il faut prévoir un maximum de 200 requêtes SQL.

    Seulement voilà, si on fait les instructions de test d’existence et d’insertion au niveau PHP, cela fait 200 aller retour entre PHP et la base Mysql. Hors ce qui plombe un script c’est souvent ces aller retour incessants .. Un moyen d’optimiser ce traitement a été de créer une procédure stocké qui prend en paramètre le fichier XML (où plutôt une représentation épuré plus strict), et de faire exécuter les 200 requêtes DANS Mysql. Chouette non ? Plus rapide, plus stable, plus optimisé .. que du bonheur.

    Procédure Stocké en Mysql

    Vous allez rire, mais d’après mes recherches googlidiennes très peu de personnes font des procédures en Mysql. Cela vient sans doute du fait qu’elles sont apparru avec mysql 5 et que c’est encore « neuf ».

    Tous les exemples que l’on trouve sur le sujet sont pour SQL serveur PRo, donc du transact-SQL. Et le souci c’est qu’il n’y pas forcement d’équivalence entre les fonctions transact-SQL et les fonctions mysql. La synthaxe n’est décidement pas la même.

    Outil utilisé

    Mysql query browser !

    L’exemple que je donne n’est valable qu’a travers sont interface .. zarb.. m’enfin c’est un très bon outil quand même, rien à voir avec un phpMyAdmin tout POURRI !

    Création de la requête

    Voilà la précédure allégé que j’ai crée (je fais d’autres test en version un peu plus lourde). Je vais essayer de la commenter au mieux.

    La procédure s’appelle import, elle est dans la base de donné nommé « Fluxe » et on l’appelle et l’utilise comme ceci

    1
    2
    3
    4
    
    call import(
    "premier flux|http://monsite|http://monsite/fluxrss|description;
    deuxieme flix|http://monsite2|http://www.google.fr/bidule.xml|autre description;
    troisieme|http://monsite3|http://monsite2/rss.xml|description;",3);

    Le premier paramètre est la chaine retravaillé coté PHP qui correspond à chaque ligne de l’XML, et le deuxième paramètre est le nombre de flux. Une entré se fini via un « ; » et chaque colonne est séparé via un  » | « . Bon je sais, mes délimiteurs ne sont pas assez complexe dans cet exemple et cela serait risque de bug si une description ou url comporterait des points virgules et des pipes…

    Voici la requête :

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    43
    44
    45
    
    DELIMITER $$  -- pas trop compris l'interet O_o
    DROP PROCEDURE IF EXISTS `fluxe`.`import` $$
    -- Supprime la procédure si elle existe (je suis fort en anglais hein ? ^^) 
     
    CREATE DEFINER=`root`@`localhost` PROCEDURE `import`(In myCsv Text, In nbElement Int)
    -- crée la procédure avec deux paramètres "IN" de type Text et Int. C'est à dire que c'est deux paramètres obligatoires pour exécuter la requête.  
     
    BEGIN -- Debut de la procédure
     
    -- Declare mes variables correspondant aux colonnes de ma table Flux
    DECLARE nom varchar(255);
    DECLARE urlSite varchar(255);
    DECLARE myurlFlux varchar(255);
    DECLARE description text;
    DECLARE  ligne_flux VARCHAR(1000); -- correspondra à une ligne de Flux
    DECLARE cpt int; -- un petit compteur pour faire une jolie boucle While
     
    set cpt = nbElement;  -- / !  Voilà comment on définit une variable SET var = valeur; 
     
    WHILE cpt <= nbElement and cpt > 0 do  -- j'aurais pu utiliser une boucle Loop aussi.
     
      select replace(substring(substring_index(myCsv, ';', cpt), length(substring_index(myCsv, ';', cpt - 1)) + 1), ';', '') as ligne into ligne_flux;
     
      -- Outch "KEKECER ?" vous devez vous pausez comme question :)
      -- c'est simple, je découpe le premier paramètre In pour en extraire la 1er ligne trouvé.
      -- Les fonctions appellés ne sont pas du php mais bien du SQL ! Puissant non ?
      -- l'idée de récupèrer la 1er ligne DANS une variable "ligne_flux", d'où le "select ... INTO variable" 
     
      -- Parsage de la chaine "ligne_flux" pour en extraire les colonnes, rebelote quoi ..
      select  replace(substring(substring_index(ligne_flux, '|', 1), length(substring_index(ligne_flux, '|', 1 - 1)) + 1), '|', '') into nom;
      select  replace(substring(substring_index(ligne_flux, '|', 2), length(substring_index(ligne_flux, '|', 2 - 1)) + 1), '|', '') into urlSite;
      select  replace(substring(substring_index(ligne_flux, '|', 3), length(substring_index(ligne_flux, '|', 3 - 1)) + 1), '|', '') into myurlFlux;
      select  replace(substring(substring_index(ligne_flux, '|', 4), length(substring_index(ligne_flux, '|', 4 - 1)) + 1), '|', '') into description;
     
      -- Insertion que si la ligne n'existe pas. Le critère est l'url du flux.
      if(NOT EXISTS (select * from flux where urlFlux = myurlFlux)) THEN
           insert into flux (nom,urlSite,urlFlux,description) values (nom,urlSite,myurlFlux,description);
       end if;
     
     -- on décrémente le compteur
     set cpt = cpt - 1;
    end while;
     
    END $$
    DELIMITER ;

    Et voilà c’est fini !

    Lien de référence

    La base :http://dev.mysql.com/doc/refman/5.0/fr/stored-procedure-syntax.html

    les variables : http://dev.mysql.com/doc/refman/5.0/fr/variables-in-stored-procedures.html
    If, while, case, et tous les contrôles : http://dev.mysql.com/doc/refman/5.0/fr/flow-control-constructs.html

    Mis à part la documentation officiel, j’ai rien trouvé d’autres à me mettre sous la dent ..

    Billet écrit dans : SQL 02.12.2008 Quelqu'un a réagi !
CV Guillaume chave