skip to main | skip to sidebar
Code 18
Manuel du savoir-faire à l'usage des geeks et des curieux
RSS
  • Accueil
  • Le web au Québec
  • Liens
  • Twitter
  • Facebook
  • À propos

jeudi 3 juin 2010

Fonction strip_tags pour PostgreSQL

Publié par Infinite Loop, à 16 h 10 2 commentaires

Voici la situation dans laquelle je me trouvais cet après-midi. Nous avons développé un site web qui repose sur une base de données PostgreSQL. Certains formulaires du CMS possèdent des champs text qui sont interfacés avec un contrôle RTE (Rich Text Editor) comme TinyMCE. Le contenu créé par ce contrôle génère du HTML pour la mise en page (paragraphes, gras, italique, style, etc) qui est stocké tel quel dans la base de données.

Pour implémenter une fonction de recherche dans le contenu des tables, on effectue une requête SQL avec une clause LIKE, ILIKE ou SIMILAR TO sur le champ text. Ce qui veut dire qu'il est possible que des enregistrements soient proposés comme résultats alors que le mot clé de la recherche ne corresponde pas au texte mais bien à une portion du code d'une balise HTML.

Assez ordinaire non ? Heureusement, j'ai trouvé du code que j'ai encapsulé dans une fonction pour retirer les balises HTML d'une chaîne de caractère passée comme argument. Elle utilise les fonctions natives des expressions régulières de Postgres. Pour le moment, contentez-vous de l'utiliser. Moi-même, je tenterai de la comprendre plus tard.

CREATE OR REPLACE FUNCTION "public"."strip_tags" (
text
)
RETURNS text AS
$body$
SELECT regexp_replace(regexp_replace($1, E'(?x)<[^>]*?(\s alt \s* = \s* ([\'"]) ([^>]*?) \2) [^>]*? >', E'\3'), E'(?x)(< [^>]*? >)', '', 'g')
$body$
LANGUAGE 'sql'
VOLATILE
CALLED ON NULL INPUT
SECURITY INVOKER;


Tags: PostgreSQL

2 réponses à "Fonction strip_tags pour PostgreSQL"

  1. Unknown a dit...
    3 juin 2010 à 16 h 40

    Ah ouais, c'est quand même de la grosse regex qui fait bien mal au crâne ça...

    Mathieu Bossaert a dit...
    2 décembre 2010 à 06 h 21

    Bonjour,

    je viens de mon coté de faire une fonction complémentaire qui remplace les codes html des caractères spéciaux par ces caractères :
    http://sig.cenlr.org/creation_bdd/fonctions/no_html_special_char


Publier un commentaire

Message plus récent Messages plus anciens Accueil
S'abonner à : Publier des commentaires (Atom)
    Suivre @code18 sur Twitter

    Catégories

    • Apache (21)
    • Citations (167)
    • Club Vidéo (24)
    • Coffre à outils (56)
    • CSS (8)
    • Curiosités (117)
    • Design Pattern (2)
    • Drupal (8)
    • Easter Eggs (22)
    • Extensions Firefox (20)
    • GIMP (7)
    • Histoire (21)
    • HTML (32)
    • Humour (57)
    • Intégration (34)
    • iPod (12)
    • JavaScript (110)
    • Jeu de combat (6)
    • Le coin du geek (128)
    • Liens (12)
    • Linux (56)
    • Livres (78)
    • Lois et principes (46)
    • Marché des saveurs (26)
    • Mathématique (18)
    • Mobile (5)
    • Montréal (32)
    • Musique (112)
    • Pancartes et écriteaux (16)
    • Perl (8)
    • Pérou (1)
    • PHP (130)
    • PostgreSQL (44)
    • Programmation (105)
    • Saviez-vous que (55)
    • Sécurité (22)
    • SEO (5)
    • SQL Server (22)
    • Vieilles publicités (6)
    • Virtualisation (8)
    • Voyages (1)
    • Zend Framework (26)

    Divers

    Archives

    • ►  2015 (6)
      • ►  août 2015 (1)
      • ►  juillet 2015 (1)
      • ►  février 2015 (3)
      • ►  janvier 2015 (1)
    • ►  2014 (8)
      • ►  décembre 2014 (1)
      • ►  novembre 2014 (1)
      • ►  octobre 2014 (1)
      • ►  août 2014 (2)
      • ►  juillet 2014 (2)
      • ►  janvier 2014 (1)
    • ►  2013 (53)
      • ►  décembre 2013 (2)
      • ►  novembre 2013 (1)
      • ►  octobre 2013 (3)
      • ►  septembre 2013 (2)
      • ►  août 2013 (5)
      • ►  juillet 2013 (3)
      • ►  juin 2013 (5)
      • ►  mai 2013 (3)
      • ►  avril 2013 (7)
      • ►  mars 2013 (7)
      • ►  février 2013 (11)
      • ►  janvier 2013 (4)
    • ►  2012 (105)
      • ►  décembre 2012 (8)
      • ►  novembre 2012 (5)
      • ►  octobre 2012 (4)
      • ►  septembre 2012 (1)
      • ►  août 2012 (8)
      • ►  juillet 2012 (7)
      • ►  juin 2012 (7)
      • ►  mai 2012 (10)
      • ►  avril 2012 (13)
      • ►  mars 2012 (15)
      • ►  février 2012 (15)
      • ►  janvier 2012 (12)
    • ►  2011 (146)
      • ►  décembre 2011 (14)
      • ►  novembre 2011 (11)
      • ►  octobre 2011 (12)
      • ►  septembre 2011 (13)
      • ►  août 2011 (15)
      • ►  juillet 2011 (17)
      • ►  juin 2011 (18)
      • ►  mai 2011 (15)
      • ►  avril 2011 (9)
      • ►  mars 2011 (7)
      • ►  février 2011 (3)
      • ►  janvier 2011 (12)
    • ▼  2010 (398)
      • ►  décembre 2010 (29)
      • ►  novembre 2010 (28)
      • ►  octobre 2010 (32)
      • ►  septembre 2010 (34)
      • ►  août 2010 (22)
      • ►  juillet 2010 (35)
      • ▼  juin 2010 (42)
        • L'art de l'ordinateur analogique
        • L'effet du deuxième système de Brooks
        • La vérité sur la gestion de projets
        • Simulation de combat - Étape 6
        • Citation no. 88 sur la politique
        • Faire de la musique avec un bonzaï
        • Simulation de combat - Étape 5
        • Musique métal : CTRL+C, CTRL+V
        • Bande-annonce de Java 4-ever
        • Histoire de Saint-Jean-Baptiste
        • Zone réservée aux chaises roulantes
        • Mais qu'est-ce qu'Adobe veut dire ?
        • SOAP en PHP : retourner un objet ou array ?
        • 1er Tweet de Google en binaire
        • Utilisation CSS de @font-face avec OpenType
        • Citation no. 87 sur la dépression
        • Japadog : hot dog à la japonaise
        • Exclure un domaine d'une campagne AdWords
        • Plus aucune raison de croire à ça en 2010 !
        • Décharger les idées de ma tête
        • Ajouter un ancre hash tag dynamiquement
        • Retour sur l'anti-conférence pour un Web musical Q...
        • Deux erreurs d'inattention à l'intégration
        • Chocolat pour les geeks
        • PHP : preg_replace() et le symbole $ comme valeur
        • Un montréalais en tourisme à Montréal
        • Citation no. 86 sur Linux et Windows
        • Trois lois de la robotique d'Asimov
        • Expérimentations Canvas HTML 5 et JavaScript
        • Joke informatique dans un livre
        • Démystifier le dollar américain
        • HTML 5 et CSS - Astuce pour coder plus vite
        • Sac de chips extrêmes format géant
        • Fin du 17ème Mondial de la bière de Montréal
        • Laptop Toshiba - Réinitialisation "out of the box"
        • Citation no. 85 sur l'alcool
        • Branchement Digitech RP155 sur l'ordinateur
        • Réflexion sur la suite de Fibonacci (PHP)
        • Fonction strip_tags pour PostgreSQL
        • C'est là que la chicane a pognée...
        • Illusion d'optique impossible
        • Convertir du Flash à HTML 5 et JavaScript
      • ►  mai 2010 (36)
      • ►  avril 2010 (37)
      • ►  mars 2010 (34)
      • ►  février 2010 (32)
      • ►  janvier 2010 (37)
    • ►  2009 (430)
      • ►  décembre 2009 (32)
      • ►  novembre 2009 (34)
      • ►  octobre 2009 (33)
      • ►  septembre 2009 (37)
      • ►  août 2009 (37)
      • ►  juillet 2009 (39)
      • ►  juin 2009 (38)
      • ►  mai 2009 (37)
      • ►  avril 2009 (35)
      • ►  mars 2009 (37)
      • ►  février 2009 (32)
      • ►  janvier 2009 (39)
    • ►  2008 (84)
      • ►  décembre 2008 (34)
      • ►  novembre 2008 (39)
      • ►  octobre 2008 (11)

    Abonnés

Copyright © All Rights Reserved. Code 18 | Converted into Blogger Templates by Theme Craft