Plop!
Le titre n'est pas tout à fait juste. C'est plus : comment faire un epub ou mobi depuis un PDF en "recréant la mise en page"
Une fois la méthode maitrisée, je pense que ça ne prend pas plus de 5mn.
Niveau informatique requis :
- Savoir faire une recherche sur un texte
- Savoir faire un copier coller de fichier
- Savoir dezipper
Logiciel nécessaire :
- Notepad ++ edition portable disponible ICI (prendre la version Notepad++ zip package ou Notepad++ 7z package
- Calibre disponible ICI
- Fichier zip fourni en bas du post
Etape 1 : Préparation de notepad ++:
- Dézipper Notepad ++
- Dézipper le zip Shortcuts
- Remplacer dans le répertoire unicode de notepad++ le fichier "shortcuts.xml" par celui que je vous fournis dans mon zip.
Etape 2 : première transformationSous Calibre, ajouter le PDF que vous souhaitez transformer. Remplissez les métadonnées etc... comme vous le souhaitez. Sélectionner votre livre en PDF
Ensuite cliquer sur "Convertir des livres"
Et sélectionner à gauche PDF et à droite txt
Dans traitement heuristique, la case "activer le traitement heuristique doit être décocher. Ce n'est pas calibre qui va traiter la mise en page à ce stade
Cliquer sur Ok et patienter le temps du traitement
Ensuite activer la vue couverture si vous ne l'avez pas activer (bouton en bas à droite sous forme de livre) vous aurez alors accès aux formats de vos livres. Cliquez sur "TXT"
Si vous arrivez à lire le contenu du fichier, c'est que le PDF n'était pas "coder ou sous forme d'image". Bref il est lisible et c'est une bonne chose, on va pouvoir poursuivre. Si ce n'est pas le cas. Je ne peux rien faire
Fermer le fichier texte qui s'est très certainement ouvert avec le bloc note de windows.
Cliquez maintenant sur "cliquer pour ouvrir" (juste en dessous des formats de texte)
Vous avez désormais le chemin d'accès de votre fichier txt.
Etape 3 : Mise en forme du fichier texteOuvrez le fichier txt avec NotePad ++ que vous avez télécharger et mis à jour précédemment.
Cliquez sur Macro puis SuppNumPage, cela déclenche la suppression des numéros de pages. Cette macro supprime tous les numéros de pages... mais 1 chiffres à la fois en début de lignes. S'il y a entre 100 et 999 pages, cela veut dire qu'il faut lancer la macro 3 fois.
Refaite cette étapes jusqu'à ce que toutes les "pop-up" soit à "0".
Cliquez à nouveau sur Macro puis MiseEnPage. Une fois de plus cliquez sur "Ok" pour toutes les Pop-Up. Attention cela peut être un peu long entre certaines pop-up. Pas d'inquiétude.
Cette macro est plus complexe. Elle met dans un premier temps des "##" en fin de ligne si le dernier caractère est un signe de ponctuation. Je pars du principe que si en fin de ligne il y a une ponctuation ( . : ! ? ou ; ) c'est que c'était la fin d'un paragraphe. Je les identifie ainsi. Ensuite, on supprime tous les passages à la ligne en les remplaçants par un espace. Là il y a un problème, s'il y avait plusieurs passage à la ligne, il va donc y avoir plusieurs espaces. Les espace "double" sont remplacer 2 fois par des espaces simple. Enfin, on modifie les "##" pour refaire les passages à la ligne de fin de paragraphe. En gros, ça fonctionne bien si la ponctuation est bien respectée.
Une fois fini : faites "Ctrl+F" (sur le clavier touche en bas à gauche et la touche F en même temps) pour ouvrir la fenêtre de "Rechercher"
Chercher Chapitre (ou chapter, si le PDF est en anglais) ou toute marque de chapitre
Il va falloir faire tous les passages à ligne avant ou après les chapitres à la main. Chaque Chapitre doit être sur sa ligne tout seul. Ça dépend de la gestion de la ponctuation. Je n'ai pas pu faire de macro pour ça.
Faites "Suivant" autant de fois que nécessaire.
Enregistrer votre fichier et fermer Notepad ++
Etape 4 : transformation txt en epub.On retourne sur Calibre, comme à l'étape 2, cliquez sur "convertir des livres"
Ce coup-ci "TXT" à gauche et "EPUB" ou "MOBI" à droite
Etape optionnelleCette étape est optionnelle, elle apporte juste un confort de lecture (le sommaire et le changement de page au chapitre)
Sur la fenêtre de conversion allez dans "Détection de la structure"
Dans le champs "détecter les chapitres" mettez :
- Code:
-
//h:p[re:test(., 'CHAPITRE [0-9]', 'i')]
Sur la fenêtre de conversion allez dans "Table des matières"
Dans le champs "Niveau 1 TDM" mettez :
- Code:
-
//h:p[re:test(., 'CHAPITRE [0-9]', 'i')]
Oui c'est le même code ^^
Fin de l'étape optionnelleCliquez sur Ok
Et voilà !