Pour un projet d’annuaire de Flux RSS, j’ai du faire en sorte que l’on puisse importer ses Flux dans l’annuaire via un fichier XML opml que tout bon agrégateur (google reader, netvibes) fournit. Donc admettons que l’on a 100 flux RSS à importer il faut pour chaque flux vérifier si le flux n’existe pas déjà sinon le créer en base. Donc il faut prévoir un maximum de 200 requêtes SQL.
Seulement voilà, si on fait les instructions de test d’existence et d’insertion au niveau PHP, cela fait 200 aller retour entre PHP et la base Mysql. Hors ce qui plombe un script c’est souvent ces aller retour incessants .. Un moyen d’optimiser ce traitement a été de créer une procédure stocké qui prend en paramètre le fichier XML (où plutôt une représentation épuré plus strict), et de faire exécuter les 200 requêtes DANS Mysql. Chouette non ? Plus rapide, plus stable, plus optimisé .. que du bonheur.
Procédure Stocké en Mysql
Vous allez rire, mais d’après mes recherches googlidiennes très peu de personnes font des procédures en Mysql. Cela vient sans doute du fait qu’elles sont apparru avec mysql 5 et que c’est encore « neuf ».
Tous les exemples que l’on trouve sur le sujet sont pour SQL serveur PRo, donc du transact-SQL. Et le souci c’est qu’il n’y pas forcement d’équivalence entre les fonctions transact-SQL et les fonctions mysql. La synthaxe n’est décidement pas la même.
Outil utilisé
L’exemple que je donne n’est valable qu’a travers sont interface .. zarb.. m’enfin c’est un très bon outil quand même, rien à voir avec un phpMyAdmin tout POURRI !
Création de la requête
Voilà la précédure allégé que j’ai crée (je fais d’autres test en version un peu plus lourde). Je vais essayer de la commenter au mieux.
La procédure s’appelle import, elle est dans la base de donné nommé « Fluxe » et on l’appelle et l’utilise comme ceci
1 2 3 4 | call import( "premier flux|http://monsite|http://monsite/fluxrss|description; deuxieme flix|http://monsite2|http://www.google.fr/bidule.xml|autre description; troisieme|http://monsite3|http://monsite2/rss.xml|description;",3); |
Le premier paramètre est la chaine retravaillé coté PHP qui correspond à chaque ligne de l’XML, et le deuxième paramètre est le nombre de flux. Une entré se fini via un « ; » et chaque colonne est séparé via un » | « . Bon je sais, mes délimiteurs ne sont pas assez complexe dans cet exemple et cela serait risque de bug si une description ou url comporterait des points virgules et des pipes…
Voici la requête :
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 | DELIMITER $$ -- pas trop compris l'interet O_o DROP PROCEDURE IF EXISTS `fluxe`.`import` $$ -- Supprime la procédure si elle existe (je suis fort en anglais hein ? ^^) CREATE DEFINER=`root`@`localhost` PROCEDURE `import`(In myCsv Text, In nbElement Int) -- crée la procédure avec deux paramètres "IN" de type Text et Int. C'est à dire que c'est deux paramètres obligatoires pour exécuter la requête. BEGIN -- Debut de la procédure -- Declare mes variables correspondant aux colonnes de ma table Flux DECLARE nom varchar(255); DECLARE urlSite varchar(255); DECLARE myurlFlux varchar(255); DECLARE description text; DECLARE ligne_flux VARCHAR(1000); -- correspondra à une ligne de Flux DECLARE cpt int; -- un petit compteur pour faire une jolie boucle While set cpt = nbElement; -- / ! Voilà comment on définit une variable SET var = valeur; WHILE cpt <= nbElement and cpt > 0 do -- j'aurais pu utiliser une boucle Loop aussi. select replace(substring(substring_index(myCsv, ';', cpt), length(substring_index(myCsv, ';', cpt - 1)) + 1), ';', '') as ligne into ligne_flux; -- Outch "KEKECER ?" vous devez vous pausez comme question :) -- c'est simple, je découpe le premier paramètre In pour en extraire la 1er ligne trouvé. -- Les fonctions appellés ne sont pas du php mais bien du SQL ! Puissant non ? -- l'idée de récupèrer la 1er ligne DANS une variable "ligne_flux", d'où le "select ... INTO variable" -- Parsage de la chaine "ligne_flux" pour en extraire les colonnes, rebelote quoi .. select replace(substring(substring_index(ligne_flux, '|', 1), length(substring_index(ligne_flux, '|', 1 - 1)) + 1), '|', '') into nom; select replace(substring(substring_index(ligne_flux, '|', 2), length(substring_index(ligne_flux, '|', 2 - 1)) + 1), '|', '') into urlSite; select replace(substring(substring_index(ligne_flux, '|', 3), length(substring_index(ligne_flux, '|', 3 - 1)) + 1), '|', '') into myurlFlux; select replace(substring(substring_index(ligne_flux, '|', 4), length(substring_index(ligne_flux, '|', 4 - 1)) + 1), '|', '') into description; -- Insertion que si la ligne n'existe pas. Le critère est l'url du flux. if(NOT EXISTS (select * from flux where urlFlux = myurlFlux)) THEN insert into flux (nom,urlSite,urlFlux,description) values (nom,urlSite,myurlFlux,description); end if; -- on décrémente le compteur set cpt = cpt - 1; end while; END $$ DELIMITER ; |
Et voilà c’est fini !
Lien de référence
La base :http://dev.mysql.com/doc/refman/5.0/fr/stored-procedure-syntax.html
les variables : http://dev.mysql.com/doc/refman/5.0/fr/variables-in-stored-procedures.html
If, while, case, et tous les contrôles : http://dev.mysql.com/doc/refman/5.0/fr/flow-control-constructs.html
Mis à part la documentation officiel, j’ai rien trouvé d’autres à me mettre sous la dent ..






