skip to main | skip to sidebar
Code 18
Manuel du savoir-faire à l'usage des geeks et des curieux
RSS
  • Accueil
  • Le web au Québec
  • Liens
  • Twitter
  • Facebook
  • À propos

samedi 10 juillet 2010

Ouvrir un PDF à la bonne page par le shell

Publié par Infinite Loop, à 08 h 49 4 commentaires

Pour un projet personnel, je suis en train de développer un prototype d'application qui permettra d'indexer le contenu texte d'une large collection de documentation enregistrée au format PDF. À l'aide d'une interface, on pourra lancer une recherche et chaque résultat de la liste pointera à la page exacte où le terme a été trouvé.

Pour ce faire, je dois être en mesure de savoir comment ouvrir un PDF à la bonne page, à partir d'une commande avec le shell.

Sous Windows, Adobe Acrobat Reader permet de définir des arguments de lancement lors de l'ouverture d'un PDF par le shell. Par exemple, l'exécutable AcroRd32.exe suivi de /A permettra de fournir une liste de clé/valeur, dont le numéro de page d'un document spécifique.

C:\Program Files\Adobe\Reader 9.0\Reader>AcroRd32.exe /A page=10 "c:\document.pdf"

Ce que je suis en train de développer pourrait aussi être portable sous Linux puisqu'Adobe développe aussi une version pour ce système d'exploitation. Cependant, le produit propriétaire n'est généralement pas la solution retenue par les distributions Linux et n'est pas le lecteur par défaut installé sur Ubuntu. En cas de besoin, on peut forcer l'installation en modifiant les sources acceptées du repository et en lançant la commande : sudo apt-get install acroread.

Sous Ubuntu (environnement Gnome), c'est le programme Evince (document viewer) qui se charge d'ouvrir les PDF. Par le shell, on pourra ouvrir un PDF à la bonne page avec une commande comme celle-ci :

evince document.pdf -p 10

Dans mes recherches, j'ai découvert qu'on peut ouvrir un PDF en spécifiant la page par l'URL. Si j'opte de faire une interface web, je n'aurai qu'à afficher les résultats en faisant suivre le nom du PDF par le symbole dièse (#), la clé "page" et son numéro. Comme dans l'exemple HTML suivant :

<a href="/static/document.pdf#page=10">Page 10</a>
La beauté ici, c'est que ça fonctionne aussi bien si la visionneuse est Evince ou Acrobat Reader.

Pour la suite et la liste complète des paramètres pris en charge au moment de l'ouverture par Acrobat, je mets à votre disposition le lien exact vers la documentation Parameters for Opening PDF Files (remarquez l'URL).


Tags: Coffre à outils, HTML, Linux

4 réponses à "Ouvrir un PDF à la bonne page par le shell"

  1. Patrick M. Lozeau a dit...
    13 juillet 2010 à 00 h 34

    Est-ce que tu as pensé explorer Evernote comme solution à ton besoin? Tu peux t'ouvrir un compte gratuit pour te familiariser avec la plateforme et par la suite payer 5$ pour un mois et faire l'importation massive. Après, tu as accès à tous tes fichiers sans restriction et tu peux même retourner à la version gratuite sans pénalité.

    Infinite Loop a dit...
    13 juillet 2010 à 06 h 54

    Je l'ai installé il y a quelques semaines (j'avais vu un gars qui portait un t-shirt avec le logo) mais j'avoue que je ne l'ai pas testé à fond dans ses capacités.

    Ça semble un produit intéressant mais la première chose qui m'avait refroidit, c'est que même avec la version premium (500 mb/mois), ce n'est pas suffisant pour mon projet (j'ai environ 8 Gb à indexer).

    J'ai aussi essayé Calibre (que je commence à apprécier de plus en plus) mais il ne fait pas d'indexation de contenu. Soit que je me limite dans la quantité de données avec Evernote, soit je développe un hybride entre les deux.

    Je ne me cache pas que pour moi, ça représenterait un bon défi de programmation.

    Patrick M. Lozeau a dit...
    19 juillet 2010 à 20 h 02

    Est-ce que tu as jeté un coup d'oeil à ceci:
    http://pdfbox.apache.org/

    C'est ce qui est utilisé par DSpace pour l'indexation des fichiers PDF.

    Infinite Loop a dit...
    21 juillet 2010 à 10 h 42

    Merci Patrick, je ne connaissais pas PDFBox. L'intégration avec Lucene pourrait effectivement répondre à mon besoin.

    Si ça t'intéresses de travailler là-dessus avec moi, fais moi signe.


Publier un commentaire

Message plus récent Messages plus anciens Accueil
S'abonner à : Publier des commentaires (Atom)
    Suivre @code18 sur Twitter

    Catégories

    • Apache (21)
    • Citations (167)
    • Club Vidéo (24)
    • Coffre à outils (55)
    • CSS (8)
    • Curiosités (117)
    • Design Pattern (2)
    • Drupal (8)
    • Easter Eggs (22)
    • Extensions Firefox (20)
    • GIMP (7)
    • Histoire (21)
    • HTML (32)
    • Humour (57)
    • Intégration (34)
    • iPod (12)
    • JavaScript (110)
    • Jeu de combat (6)
    • Le coin du geek (128)
    • Liens (12)
    • Linux (56)
    • Livres (78)
    • Lois et principes (46)
    • Marché des saveurs (26)
    • Mathématique (18)
    • Mobile (5)
    • Montréal (32)
    • Musique (112)
    • Pancartes et écriteaux (16)
    • Perl (8)
    • Pérou (1)
    • PHP (130)
    • PostgreSQL (44)
    • Programmation (105)
    • Saviez-vous que (55)
    • Sécurité (22)
    • SEO (5)
    • SQL Server (22)
    • Vieilles publicités (6)
    • Virtualisation (8)
    • Voyages (1)
    • Zend Framework (26)

    Divers

    Archives

    • ►  2015 (6)
      • ►  août 2015 (1)
      • ►  juillet 2015 (1)
      • ►  février 2015 (3)
      • ►  janvier 2015 (1)
    • ►  2014 (8)
      • ►  décembre 2014 (1)
      • ►  novembre 2014 (1)
      • ►  octobre 2014 (1)
      • ►  août 2014 (2)
      • ►  juillet 2014 (2)
      • ►  janvier 2014 (1)
    • ►  2013 (53)
      • ►  décembre 2013 (2)
      • ►  novembre 2013 (1)
      • ►  octobre 2013 (3)
      • ►  septembre 2013 (2)
      • ►  août 2013 (5)
      • ►  juillet 2013 (3)
      • ►  juin 2013 (5)
      • ►  mai 2013 (3)
      • ►  avril 2013 (7)
      • ►  mars 2013 (7)
      • ►  février 2013 (11)
      • ►  janvier 2013 (4)
    • ►  2012 (105)
      • ►  décembre 2012 (8)
      • ►  novembre 2012 (5)
      • ►  octobre 2012 (4)
      • ►  septembre 2012 (1)
      • ►  août 2012 (8)
      • ►  juillet 2012 (7)
      • ►  juin 2012 (7)
      • ►  mai 2012 (10)
      • ►  avril 2012 (13)
      • ►  mars 2012 (15)
      • ►  février 2012 (15)
      • ►  janvier 2012 (12)
    • ►  2011 (146)
      • ►  décembre 2011 (14)
      • ►  novembre 2011 (11)
      • ►  octobre 2011 (12)
      • ►  septembre 2011 (13)
      • ►  août 2011 (15)
      • ►  juillet 2011 (17)
      • ►  juin 2011 (18)
      • ►  mai 2011 (15)
      • ►  avril 2011 (9)
      • ►  mars 2011 (7)
      • ►  février 2011 (3)
      • ►  janvier 2011 (12)
    • ▼  2010 (398)
      • ►  décembre 2010 (29)
      • ►  novembre 2010 (28)
      • ►  octobre 2010 (32)
      • ►  septembre 2010 (34)
      • ►  août 2010 (22)
      • ▼  juillet 2010 (35)
        • Les Inuits débarquent sur le web
        • Boucler sur des propriétés JSON
        • Nettoie tes oreilles ou articule quand tu parles!
        • Redémarrer l'univers
        • En quête de la tablette Android
        • Fabriquer un coin-coin en papier
        • Citation no. 92 sur l'Amazonie
        • Règlement de la route farfelu en Ontario
        • Classer des éléments du DOM avec jQuery
        • Grrrrr, bark, woof !
        • Lister les champs d'une table PostgreSQL par SQL
        • Séparés à la naissance : Georges Laraque et Vigo
        • Évaluation des variables en PHP
        • Corona glacée instantanément
        • Linux : pourquoi locate est plus rapide que find
        • Citation no. 91 sur l'appartement
        • Autres références à Hitchhiker's Guide to the Galaxy
        • Dictionnaire Français - Francine
        • Performance de Zend_ACL
        • Quand j'étais petit, j'étais con
        • L'âne de Sam Loyd
        • Super Mario Bros et la réalité augmentée
        • Origine du Babel Fish
        • Citation no. 90 sur les fesses
        • Ouvrir un PDF à la bonne page par le shell
        • La 9ème vie d'Internet Explorer
        • Tap Tap Revolution sur la guitare
        • Redirection .htaccess ASP vers PHP
        • Comme une odeur de Milliblatts
        • Un peu de simplicité volontaire
        • Installer XDebug pour PHP
        • Citation no. 89 sur les fonctionnaires
        • Performance de Zend Framework
        • Réinventer la roue en programmation
        • Pourquoi il y a si peu de femmes ingénieures
      • ►  juin 2010 (42)
      • ►  mai 2010 (36)
      • ►  avril 2010 (37)
      • ►  mars 2010 (34)
      • ►  février 2010 (32)
      • ►  janvier 2010 (37)
    • ►  2009 (429)
      • ►  décembre 2009 (32)
      • ►  novembre 2009 (34)
      • ►  octobre 2009 (33)
      • ►  septembre 2009 (37)
      • ►  août 2009 (37)
      • ►  juillet 2009 (39)
      • ►  juin 2009 (38)
      • ►  mai 2009 (37)
      • ►  avril 2009 (35)
      • ►  mars 2009 (36)
      • ►  février 2009 (32)
      • ►  janvier 2009 (39)
    • ►  2008 (84)
      • ►  décembre 2008 (34)
      • ►  novembre 2008 (39)
      • ►  octobre 2008 (11)

    Abonnés

Copyright © All Rights Reserved. Code 18 | Converted into Blogger Templates by Theme Craft