skip to main | skip to sidebar
Code 18
Manuel du savoir-faire à l'usage des geeks et des curieux
RSS
  • Accueil
  • Le web au Québec
  • Liens
  • Twitter
  • Facebook
  • À propos

jeudi 17 septembre 2009

Extraire des parties du DOM avec Zend Framework

Publié par Infinite Loop, à 21 h 01 0 commentaire

Ça m'arrive souvent de venir brancher des éléments dynamiques à l'intérieur d'un gabarit HTML. D'autres fois, c'est plutôt le contraire : je veux pouvoir extraire des parties du DOM pour les utiliser dans un contexte de programmation dynamique.

Par exemple en récupérant une portion d'une page locale ou distante, avec fopen(), file_get_contents() ou CUrl. De façon plus concrète, disons que j'ai une page web où je voudrais prélever le titre du document, c'est-à-dire le texte se trouvant entre les balises <title></title>, je peux utiliser un moyen facile d'y arriver, sans utiliser une expression régulière. Il s'agit de l'objet Zend_Dom_Query qui fait partie du Zend Framework.

En fait, il faudra se familiariser avec quelques notions :

  • Zend_Dom
  • XPath (XML path language)
  • DomElement
En premier lieu, il faut ajouter ZF à son projet et lier la librairie Zend/Dom/Query.php à sa page. On peut aussi utiliser l'objet Zend_Loader et AutoLoad pour inclure les librairies nécessaires au moment de leur instanciation.
require_once('Zend/Dom/Query.php');
Deuxièmement, il faut lire le fichier modèle. Dès qu'on possède une variable qui contient le code HTML, on peut procéder à l'extraction.
$html = file_get_contents('template.php');
$dom = new Zend_Dom_Query($html);
Comme l'objet $dom contient maintenant le code HTML, on est prêt à le questionner. Ceci peut se faire par requête XPath ou par sélecteur CSS. Dans mon cas, la balise "title" ne possède pas de classe CSS donc je privilégerai le XPath. Le XPath permet de traverser un document structuré en XML ou XHTML et de lui demander d'obtenir la liste des nodes se trouvant sous un élément.

Le titre étant à la racine (//) du document, on y accédera par : //title
$listDomElements = $dom->queryXpath('//title');
Si vous faites imprimer le résultat, vous verrez apparaître quelque chose qui ressemble à ceci :

Zend_Dom_Query_Result Object ( [_count:protected] => [_cssQuery:protected] => [_document:protected] => DOMDocument Object ( ) [_nodeList:protected] => DOMNodeList Object ( ) [_position:protected] => 0 [_xpath:protected] => [_xpathQuery:protected] => //title )

Il s'agit d'une structure Zend_Dom_Query_Result qui contient un DomElement de PHP. Ce n'est pas un array mais comme l'objet implémente les interfaces Countable, Iterator, on peut appeler foreach() sur le jeu de résultats.
echo 'Nombre de nodes trouvés : ' . count($result);

foreach($result as $node){
// textContent est une propriété de DOMElement
echo $node->textContent;
}
Si on préférerait obtenir une référence sur tous les DIV à l'intérieur du BODY (toujours en XPath) :
$result = $dom->queryXpath('//body/div');
Ou si le document contient plusieurs listes (UL) et qu'on veut extraire les LI de celle qui possède la classe CSS "main" :
$result = $dom->query('.main li');
Notez ici la différence : on utilise query() pour une requête par sélecteur CSS plutôt que queryXpath().

Enfin, si ce qui vous intéresse n'est pas le contenu du node mais ses attributs (ou si une vérification s'impose), DOMElement permettra d'en connaître davantage, par exemple pour détecter s'il possède un ID à la bonne valeur :
if( $node->hasAttribute('id') && $node->getAttribute('id') == 'liDefault' ){
echo "c'est celui que je cherche";
}


Tags: PHP, Zend Framework

0 réponse à "Extraire des parties du DOM avec Zend Framework"


Publier un commentaire

Message plus récent Messages plus anciens Accueil
S'abonner à : Publier des commentaires (Atom)
    Suivre @code18 sur Twitter

    Catégories

    • Apache (21)
    • Citations (167)
    • Club Vidéo (24)
    • Coffre à outils (56)
    • CSS (8)
    • Curiosités (117)
    • Design Pattern (2)
    • Drupal (8)
    • Easter Eggs (22)
    • Extensions Firefox (20)
    • GIMP (7)
    • Histoire (21)
    • HTML (32)
    • Humour (57)
    • Intégration (34)
    • iPod (12)
    • JavaScript (110)
    • Jeu de combat (6)
    • Le coin du geek (128)
    • Liens (12)
    • Linux (56)
    • Livres (78)
    • Lois et principes (46)
    • Marché des saveurs (26)
    • Mathématique (18)
    • Mobile (5)
    • Montréal (32)
    • Musique (112)
    • Pancartes et écriteaux (16)
    • Perl (8)
    • Pérou (1)
    • PHP (130)
    • PostgreSQL (44)
    • Programmation (105)
    • Saviez-vous que (55)
    • Sécurité (22)
    • SEO (5)
    • SQL Server (22)
    • Vieilles publicités (6)
    • Virtualisation (8)
    • Voyages (1)
    • Zend Framework (26)

    Divers

    Archives

    • ►  2015 (6)
      • ►  août 2015 (1)
      • ►  juillet 2015 (1)
      • ►  février 2015 (3)
      • ►  janvier 2015 (1)
    • ►  2014 (8)
      • ►  décembre 2014 (1)
      • ►  novembre 2014 (1)
      • ►  octobre 2014 (1)
      • ►  août 2014 (2)
      • ►  juillet 2014 (2)
      • ►  janvier 2014 (1)
    • ►  2013 (53)
      • ►  décembre 2013 (2)
      • ►  novembre 2013 (1)
      • ►  octobre 2013 (3)
      • ►  septembre 2013 (2)
      • ►  août 2013 (5)
      • ►  juillet 2013 (3)
      • ►  juin 2013 (5)
      • ►  mai 2013 (3)
      • ►  avril 2013 (7)
      • ►  mars 2013 (7)
      • ►  février 2013 (11)
      • ►  janvier 2013 (4)
    • ►  2012 (105)
      • ►  décembre 2012 (8)
      • ►  novembre 2012 (5)
      • ►  octobre 2012 (4)
      • ►  septembre 2012 (1)
      • ►  août 2012 (8)
      • ►  juillet 2012 (7)
      • ►  juin 2012 (7)
      • ►  mai 2012 (10)
      • ►  avril 2012 (13)
      • ►  mars 2012 (15)
      • ►  février 2012 (15)
      • ►  janvier 2012 (12)
    • ►  2011 (146)
      • ►  décembre 2011 (14)
      • ►  novembre 2011 (11)
      • ►  octobre 2011 (12)
      • ►  septembre 2011 (13)
      • ►  août 2011 (15)
      • ►  juillet 2011 (17)
      • ►  juin 2011 (18)
      • ►  mai 2011 (15)
      • ►  avril 2011 (9)
      • ►  mars 2011 (7)
      • ►  février 2011 (3)
      • ►  janvier 2011 (12)
    • ►  2010 (398)
      • ►  décembre 2010 (29)
      • ►  novembre 2010 (28)
      • ►  octobre 2010 (32)
      • ►  septembre 2010 (34)
      • ►  août 2010 (22)
      • ►  juillet 2010 (35)
      • ►  juin 2010 (42)
      • ►  mai 2010 (36)
      • ►  avril 2010 (37)
      • ►  mars 2010 (34)
      • ►  février 2010 (32)
      • ►  janvier 2010 (37)
    • ▼  2009 (430)
      • ►  décembre 2009 (32)
      • ►  novembre 2009 (34)
      • ►  octobre 2009 (33)
      • ▼  septembre 2009 (37)
        • #songsincode sur Twitter
        • Histoire du Monopoly
        • Autoloader dans Zend Framework
        • Souris Comfort Optical Mouse 3000 sur Ubuntu
        • Citation no. 50 sur la sagesse
        • Démarrer Silverjuke en mode kiosque
        • Vidéo du 10ème anniversaire de MSN
        • Citation no. 49 sur le suicide
        • Obtenir le numéro de série de Windows XP
        • Submit n'est pas une fonction
        • Trouver des eBooks grâce à Google
        • Présenter du code PHP en couleur
        • Qualité de la langue française sur Canada 411
        • Recyclage de CD et DVD
        • Citation no. 48 sur le débogage
        • @todo dans NetBeans
        • Particularité mathématique sur les multiples de 9
        • Extraire des parties du DOM avec Zend Framework
        • Nouveau héros obscur dans la NHL
        • La réponse de la vie est 42
        • Traiter des fichiers CSV avec SplFileObject
        • Sweet Home 3D
        • Citation no. 47 sur la civilisation
        • Créer une image ISO d'un disque
        • Chercher un nom de champ dans une BD PostgreSQL
        • Redimensionner une partition existante sans perdre...
        • La preuve que Google utilise du .NET
        • Netbook sans CD-ROM, utilisez la clé USB !
        • Formater une clé USB en NTFS
        • Commande Alias sur Linux
        • Comprendre la technologie informatique
        • Citation no. 46 sur les mathématiques
        • Lookahead dans une regex
        • Microserfs de Douglas Coupland
        • Ascii Art sur Google
        • Algorithmes de tri
        • Protéger un service web avec un mot de passe
      • ►  août 2009 (37)
      • ►  juillet 2009 (39)
      • ►  juin 2009 (38)
      • ►  mai 2009 (37)
      • ►  avril 2009 (35)
      • ►  mars 2009 (37)
      • ►  février 2009 (32)
      • ►  janvier 2009 (39)
    • ►  2008 (84)
      • ►  décembre 2008 (34)
      • ►  novembre 2008 (39)
      • ►  octobre 2008 (11)

    Abonnés

Copyright © All Rights Reserved. Code 18 | Converted into Blogger Templates by Theme Craft