skip to main | skip to sidebar
Code 18
Manuel du savoir-faire à l'usage des geeks et des curieux
RSS
  • Accueil
  • Le web au Québec
  • Liens
  • Twitter
  • Facebook
  • À propos

lundi 3 janvier 2011

Fonctionnalité manquante au Sony Reader PRS-650

Publié par Infinite Loop, à 21 h 19 0 commentaire

Quand j'ai magasiné pour mon livre électronique Sony Reader PRS-650 Touch, une des critiques sur les fonctionnalités manquante par rapport à d'autres était l'absence du Wi-Fi et de la technologie Text-To-Speech (TTS). Sans nécessairement ressentir le besoin d'utiliser ce dernier, je me suis posé la question sur ce que ça aurait pris pour ajouter cette capacité à l'appareil lors d'une future mise à jour du firmware. Après tout, il est muni d'une prise pour écouteurs et d'un système d'exploitation MontaVista Linux sur lequel on peut développer à l'aide de DevRocket pour Eclipse.

L'autre point qui m'indique une possible faisabilité est l'existence du projet PRS+ (GPL) dont l'auteur a déjà porté son code pour plusieurs modèles de liseuses Sony et qui songe à attaquer le PRS-650 lorsqu'il aura suffisamment de dons pour se procurer l'appareil pour des fins de tests.

Enfin, du point de vue purement théorique, l'utilisation du programme Festival sous Linux serait probablement l'outil qui rendrait possible l'ajout de la fonctionnalité text-to-speech.

Sauf qu'il y aurait deux inconvénients majeurs :

  • reconnaissance limitée au vocabulaire anglais (pour la prononciation)
  • lecture limitée aux fichiers textes (il faudrait d'abord extraire le texte des fichiers ePub, BBeB ou PDF)
Pour extraire automatiquement le texte d'un PDF, j'opterais pour l'utilitaire pdftotext :

pdftotext document.pdf

Cette commande aura pour effet de créer un fichier du même nom mais portant l'extension .txt. Sinon, le logiciel Calibre pourrait convertir un ePub ou tout autre format de livre électronique pour en extraire le texte sous forme de txt ou pdf mais ça devra être fait avant le transfert du fichier sur l'appareil.

Ensuite, une fois en possession du texte brut, il faudrait le faire lire par Festival. Il s'utilise comme suit. On entre d'abord dans festival :

$ festival

La première façon est d'entrer le texte à dicter, avec les parenthèses :

festival> (SayText "Hello, I'm a robot.")

Ou encore, par une ligne de commande :

$ festival --tts fichier.txt

Pour que le text-to-speech entre en fonction, on pourrait convertir en audio chaque phrase à la volée ou l'ensemble du document. Si ce n'est pas possible de l'envoyer directement en sortie aux écouteurs, il faudra peut-être passer par un fichier audio temporaire. Festival vient avec un utilitaire nommé text2wave qui permet de convertir le texte lu dans un fichier au format .wav :

cat fichier.txt | text2wave -o audio.wav
ou
text2wave -o audio.wav fichier.txt

Les spécifications du PRS-650 indiquent qu'il peut lire uniquement les formats audio mp3 et les AAC. Donc un .wav ne serait d'aucune utilité, à moins de le compresser en un format supporté. Lame serait parfait pour réaliser cette étape :

lame audio.wav fichier.mp3

À bien y penser, l'idéal serait de faire un petit programme wrap-up qui lirait le fichier et qui séparerait les phrases du texte pour les interpréter individuellement avant de les envoyer directement en sortie audio. Ou encore que le texte serait lu lorsqu'on le sélectionnerait par l'interface touchscreen. Festival n'offre pas nécessairement la meilleure voix pour écouter un récit (surtout quand on constate où est rendu AT&T Labs avec la recherche en matière de TTS) mais le concept est là. Peu importe le résultat, je me suis amusé et ça m'a permis d'explorer et de découvrir quelques outils pratiques sous Linux. Maintenant, il ne me reste qu'à attendre de recevoir mon Reader Touch pour pousser plus loin mes recherches.


Tags: Coffre à outils, Linux

0 réponse à "Fonctionnalité manquante au Sony Reader PRS-650"


Publier un commentaire

Message plus récent Messages plus anciens Accueil
S'abonner à : Publier des commentaires (Atom)
    Suivre @code18 sur Twitter

    Catégories

    • Apache (21)
    • Citations (167)
    • Club Vidéo (24)
    • Coffre à outils (56)
    • CSS (8)
    • Curiosités (117)
    • Design Pattern (2)
    • Drupal (8)
    • Easter Eggs (22)
    • Extensions Firefox (20)
    • GIMP (7)
    • Histoire (21)
    • HTML (32)
    • Humour (57)
    • Intégration (34)
    • iPod (12)
    • JavaScript (110)
    • Jeu de combat (6)
    • Le coin du geek (128)
    • Liens (12)
    • Linux (56)
    • Livres (78)
    • Lois et principes (46)
    • Marché des saveurs (26)
    • Mathématique (18)
    • Mobile (5)
    • Montréal (32)
    • Musique (112)
    • Pancartes et écriteaux (16)
    • Perl (8)
    • Pérou (1)
    • PHP (130)
    • PostgreSQL (44)
    • Programmation (105)
    • Saviez-vous que (55)
    • Sécurité (22)
    • SEO (5)
    • SQL Server (22)
    • Vieilles publicités (6)
    • Virtualisation (8)
    • Voyages (1)
    • Zend Framework (26)

    Divers

    Archives

    • ►  2015 (6)
      • ►  août 2015 (1)
      • ►  juillet 2015 (1)
      • ►  février 2015 (3)
      • ►  janvier 2015 (1)
    • ►  2014 (8)
      • ►  décembre 2014 (1)
      • ►  novembre 2014 (1)
      • ►  octobre 2014 (1)
      • ►  août 2014 (2)
      • ►  juillet 2014 (2)
      • ►  janvier 2014 (1)
    • ►  2013 (53)
      • ►  décembre 2013 (2)
      • ►  novembre 2013 (1)
      • ►  octobre 2013 (3)
      • ►  septembre 2013 (2)
      • ►  août 2013 (5)
      • ►  juillet 2013 (3)
      • ►  juin 2013 (5)
      • ►  mai 2013 (3)
      • ►  avril 2013 (7)
      • ►  mars 2013 (7)
      • ►  février 2013 (11)
      • ►  janvier 2013 (4)
    • ►  2012 (105)
      • ►  décembre 2012 (8)
      • ►  novembre 2012 (5)
      • ►  octobre 2012 (4)
      • ►  septembre 2012 (1)
      • ►  août 2012 (8)
      • ►  juillet 2012 (7)
      • ►  juin 2012 (7)
      • ►  mai 2012 (10)
      • ►  avril 2012 (13)
      • ►  mars 2012 (15)
      • ►  février 2012 (15)
      • ►  janvier 2012 (12)
    • ▼  2011 (146)
      • ►  décembre 2011 (14)
      • ►  novembre 2011 (11)
      • ►  octobre 2011 (12)
      • ►  septembre 2011 (13)
      • ►  août 2011 (15)
      • ►  juillet 2011 (17)
      • ►  juin 2011 (18)
      • ►  mai 2011 (15)
      • ►  avril 2011 (9)
      • ►  mars 2011 (7)
      • ►  février 2011 (3)
      • ▼  janvier 2011 (12)
        • Citation no. 116 sur le casque protecteur au hockey
        • Toc toc toc, qui est là ?
        • Montréal, la nuit
        • Catalogue d'objets introuvables
        • Citation no. 115 sur les anglais
        • Origine des noms de villes du Québec
        • Piège JavaScript no. 9 avec undefined
        • libcaca pour voir les vidéos en ASCII dans un term...
        • Fonctionnalité manquante au Sony Reader PRS-650
        • Les entreprises qui maganent le français sur le web
        • Citation no. 114 sur l'éducation
        • Calcul pour obtenir 24 avec 5, 5, 5 et 1
    • ►  2010 (398)
      • ►  décembre 2010 (29)
      • ►  novembre 2010 (28)
      • ►  octobre 2010 (32)
      • ►  septembre 2010 (34)
      • ►  août 2010 (22)
      • ►  juillet 2010 (35)
      • ►  juin 2010 (42)
      • ►  mai 2010 (36)
      • ►  avril 2010 (37)
      • ►  mars 2010 (34)
      • ►  février 2010 (32)
      • ►  janvier 2010 (37)
    • ►  2009 (430)
      • ►  décembre 2009 (32)
      • ►  novembre 2009 (34)
      • ►  octobre 2009 (33)
      • ►  septembre 2009 (37)
      • ►  août 2009 (37)
      • ►  juillet 2009 (39)
      • ►  juin 2009 (38)
      • ►  mai 2009 (37)
      • ►  avril 2009 (35)
      • ►  mars 2009 (37)
      • ►  février 2009 (32)
      • ►  janvier 2009 (39)
    • ►  2008 (84)
      • ►  décembre 2008 (34)
      • ►  novembre 2008 (39)
      • ►  octobre 2008 (11)

    Abonnés

Copyright © All Rights Reserved. Code 18 | Converted into Blogger Templates by Theme Craft