formats_de_documents_ouverts
Différences
Ci-dessous, les différences entre deux révisions de la page.
— | formats_de_documents_ouverts [2024/01/28 23:48] (Version actuelle) – créée - modification externe 127.0.0.1 | ||
---|---|---|---|
Ligne 1: | Ligne 1: | ||
+ | ====== Les différents formats de documents ouverts ====== | ||
+ | |||
+ | ===== OpenDocument ===== | ||
+ | |||
+ | * Format ouvert de données pour la bureautique. | ||
+ | * Basé sur la notation XML, assez proche du HTML | ||
+ | * Plusieurs types de documents: | ||
+ | * Traitement de texte | ||
+ | * Tableur | ||
+ | * Présentation | ||
+ | * Diagramme | ||
+ | * Base de données | ||
+ | * Norme publiée par OASIS | ||
+ | |||
+ | |||
+ | ---- | ||
+ | |||
+ | ==== OpenDocument: | ||
+ | |||
+ | * Interopérabilité: | ||
+ | * Microsoft Office ne gère pas bien le format OpenDocument afin de lui donner une impression de mauvaise qualité. | ||
+ | * Abri contre la péremption des données | ||
+ | * Permet un formatage riche du contenu | ||
+ | * Permet l' | ||
+ | |||
+ | ==== OpenDocument: | ||
+ | |||
+ | * Les fichiers sont lourds | ||
+ | * Il peut être difficile d' | ||
+ | * L' | ||
+ | * Intégration limitée de contenu scientifique tel que des équations ou des diagrammes | ||
+ | |||
+ | |||
+ | ---- | ||
+ | |||
+ | ==== OpenDocument: | ||
+ | |||
+ | * OpenOffice.org | ||
+ | * LibreOffice | ||
+ | * NeoOffice | ||
+ | * KOffice | ||
+ | * AbiWord | ||
+ | |||
+ | Installation de Abiword: | ||
+ | |||
+ | <code bash> | ||
+ | sudo apt-get install abiword | ||
+ | </ | ||
+ | |||
+ | ---- | ||
+ | |||
+ | ==== OpenDocument: | ||
+ | |||
+ | * [[https:// | ||
+ | * [[http:// | ||
+ | |||
+ | |||
+ | ---- | ||
+ | |||
+ | ===== ===== | ||
+ | |||
+ | * est un système de préparation de document. | ||
+ | * Constitue un ensemble de macros développées par Leslie Lamport servant à faciliter l' | ||
+ | * Conçu pour la production de documents techniques et scientifiques. | ||
+ | |||
+ | |||
+ | ---- | ||
+ | |||
+ | ==== : Avantages ==== | ||
+ | |||
+ | * Standard reconnu par la plupart des publications scientifiques. | ||
+ | * Permet de ne pas avoir à se soucier de l' | ||
+ | * Permet de structurer efficacement de très grands documents | ||
+ | * Table des matières | ||
+ | * Création d' | ||
+ | * Numérotation automatique des chapitres, sections et sous-sections | ||
+ | * Permet d' | ||
+ | * Permet de générer des figures et des graphiques très complexes | ||
+ | * Bien intégré avec la plupart des langages de programmation pour la génération automatique de contenu et de documentation. | ||
+ | |||
+ | |||
+ | ---- | ||
+ | |||
+ | ==== : Inconvénients ==== | ||
+ | |||
+ | * Apprentissage difficile. | ||
+ | * C'est un langage de programmation compilé. | ||
+ | * Déboguer un document qui ne compile pas peut être ardu. | ||
+ | * Le document produit est à la base dans un format imprimable, ce qui peut être contraignant (surtout sur la largeur du document). | ||
+ | |||
+ | |||
+ | ---- | ||
+ | |||
+ | ==== Distributions de ==== | ||
+ | |||
+ | * [[https:// | ||
+ | * [[https:// | ||
+ | * [[http:// | ||
+ | |||
+ | Installation de TeX Live (attention, prévoir environ 3 Go de données et 1h !): | ||
+ | |||
+ | <code bash> | ||
+ | sudo apt-get install texlive-full | ||
+ | </ | ||
+ | |||
+ | ---- | ||
+ | |||
+ | ==== : Éditeurs libres ==== | ||
+ | |||
+ | * [[https:// | ||
+ | * [[http:// | ||
+ | * [[https:// | ||
+ | * [[https:// | ||
+ | * [[http:// | ||
+ | |||
+ | |||
+ | ---- | ||
+ | |||
+ | ==== : Références ==== | ||
+ | |||
+ | * [[http:// | ||
+ | * [[http:// | ||
+ | * [[https:// | ||
+ | |||
+ | |||
+ | ---- | ||
+ | |||
+ | ===== Markdown ===== | ||
+ | |||
+ | * Markdown est un langage de balisage léger | ||
+ | * Inspiré du courriel en mode texte | ||
+ | * Il en existe plusieurs variantes, dont le GitHub Flavored Markdown, le Pandoc Markdown et le R Markdown | ||
+ | * Très populaire pour produire de la documentation | ||
+ | * Presque toujours converti vers un format HTML | ||
+ | |||
+ | |||
+ | ---- | ||
+ | |||
+ | ==== Markdown: Éditeurs libres ==== | ||
+ | |||
+ | * [[https:// | ||
+ | * [[https:// | ||
+ | * [[https:// | ||
+ | |||
+ | |||
+ | ---- | ||
+ | |||
+ | ==== Markdown: Références ==== | ||
+ | |||
+ | * [[http:// | ||
+ | * [[https:// | ||
+ | |||
+ | |||
+ | ---- | ||
+ | |||
+ | ===== DocBook ===== | ||
+ | |||
+ | * DocBook est un schéma XML très large qui permet de définir sémantiquement le contenu d'un livre ou d'un article. | ||
+ | * Il ne définit pas comment l' | ||
+ | |||
+ | ==== DocBook: Références ==== | ||
+ | |||
+ | * [[http:// | ||
+ | |||
+ | |||
+ | ---- | ||
+ | |||
+ | ====== Pandoc ====== | ||
+ | |||
+ | Pandoc est un outil et une librairie écrit en Haskell qui permet de convertir des documents entre plusieurs formats ouverts. | ||
+ | |||
+ | Il y a aussi une librairie très utilisée par plusieurs autres logiciels. Si votre éditeur permet d' | ||
+ | |||
+ | Pandoc est multi-plateformes, | ||
+ | |||
+ | Installation | ||
+ | |||
+ | <code bash> | ||
+ | sudo apt-get install pandoc | ||
+ | </ | ||
+ | Installation avec Cabal, pour avoir la version la plus récente: | ||
+ | |||
+ | <code bash> | ||
+ | cabal install pandoc | ||
+ | </ | ||
+ | |||
+ | ---- | ||
+ | |||
+ | ===== Pandoc: Formats d' | ||
+ | |||
+ | Les formats d' | ||
+ | |||
+ | * markdown | ||
+ | * DocBook | ||
+ | * LaTeX | ||
+ | * OpenDocument | ||
+ | * Epub | ||
+ | * ... | ||
+ | |||
+ | |||
+ | ---- | ||
+ | |||
+ | ===== Pandoc: Formats de sortie ===== | ||
+ | |||
+ | Les formats de sortie incliuent: | ||
+ | |||
+ | * HTML | ||
+ | * OpenDocument | ||
+ | * EPub | ||
+ | * DocBook | ||
+ | * LaTeX | ||
+ | |||
+ | * markdown | ||
+ | * MediaWiki | ||
+ | * DokuWiki | ||
+ | |||
+ | |||
+ | ---- | ||
+ | |||
+ | ===== Pandoc Markdown ===== | ||
+ | |||
+ | Le Pandoc Markdown est un des formats d' | ||
+ | |||
+ | Référence: | ||
+ | |||
+ | |||
+ | ---- | ||
+ | |||
+ | ===== Pandoc Markdown: Blocs de lignes ===== | ||
+ | |||
+ | Les **blocs** de lignes permettent de séparer le texte manuellement. Par exemple, pour les adresses: | ||
+ | |||
+ | **Code:** | ||
+ | |||
+ | < | ||
+ | | Centre de loisirs St-Louis-de-France | ||
+ | | 1560 Route De L’Église | ||
+ | | Québec, G1W 3P5 | ||
+ | </ | ||
+ | **Résultat: | ||
+ | |||
+ | Centre de loisirs St-Louis-de-France\\ | ||
+ | 1560 Route De L’Église\\ | ||
+ | Québec, G1W 3P5 | ||
+ | |||
+ | |||
+ | ---- | ||
+ | |||
+ | ===== Pandoc Markdown: Tables simples ===== | ||
+ | |||
+ | Il faut spécifier l' | ||
+ | |||
+ | **Code:** | ||
+ | |||
+ | < | ||
+ | Droite | ||
+ | ------- | ||
+ | | ||
+ | 123 | ||
+ | |||
+ | Table: | ||
+ | </ | ||
+ | **Résultat: | ||
+ | |||
+ | Demonstration de la syntaxe des tables simples. | ||
+ | ^Droite | ||
+ | |12 |12 | 12 |12 | | ||
+ | |123 | ||
+ | |||
+ | |||
+ | ---- | ||
+ | |||
+ | ===== Pandoc Markdown: métadonnées ===== | ||
+ | |||
+ | Les métadonnées permettent d' | ||
+ | |||
+ | **Code:** | ||
+ | |||
+ | < | ||
+ | % Les formats de documents ouverts | ||
+ | % François Pelletier | ||
+ | % 25 novembre 2017 | ||
+ | </ | ||
+ | |||
+ | ---- | ||
+ | |||
+ | ===== Pandoc Markdown: mathématiques ===== | ||
+ | |||
+ | Pandoc permet de traiter les équations mathématiques saisies avec la syntaxe LaTeX à l'aide de différents outils tout dépendamment du format de document en sortie. | ||
+ | |||
+ | Les principaux outils utilisés sont MathML et AMS | ||
+ | |||
+ | |||
+ | ---- | ||
+ | |||
+ | ===== Pandoc Markdown: mathématiques ===== | ||
+ | |||
+ | On saisis les contenus mathématiques entre signes '' | ||
+ | |||
+ | **Code:** | ||
+ | |||
+ | < | ||
+ | $$ | ||
+ | {\begin{aligned}/ | ||
+ | &\gamma _{ij}(x,t) \\ | ||
+ | =&\sum _{k=1}^{N}\sigma _{ik}(x, | ||
+ | \end{aligned}} | ||
+ | $$ | ||
+ | </ | ||
+ | **Résultat: | ||
+ | |||
+ | $$ | ||
+ | {\begin{aligned} | ||
+ | &\gamma _{ij}(x,t) \\ | ||
+ | =&\sum _{k=1}^{N}\sigma _{ik}(x, | ||
+ | \end{aligned}} | ||
+ | $$ | ||
+ | |||
+ | |||
+ | ---- | ||
+ | |||
+ | ===== Produire des présentations facilement ===== | ||
+ | |||
+ | Un exemple: cette présentation a été écrite avec le langage Markdown et exportée en PDF et en HTML avec Pandoc. | ||
+ | |||
+ | <code bash> | ||
+ | #!/bin/bash | ||
+ | pandoc -f markdown+simple_tables+pandoc_title_block \ | ||
+ | -t beamer -s presentation.md -o presentation.pdf | ||
+ | pandoc -f markdown+simple_tables+pandoc_title_block \ | ||
+ | -t slidy -s presentation.md -o presentation.html | ||
+ | </ | ||
+ | |||
+ | ---- | ||
+ | |||
+ | ===== Publier sur un wiki ou un site web ===== | ||
+ | |||
+ | Il est aussi possible d' | ||
+ | |||
+ | <code bash> | ||
+ | pandoc -f markdown+simple_tables+pandoc_title_block \ | ||
+ | -t dokuwiki -s presentation.md -o presentation.dokuwiki | ||
+ | </ | ||
+ | |||
+ | ---- | ||
+ | |||
+ | ====== Numériser un document papier: Simple Scan ====== | ||
+ | |||
+ | Simple Scan est un logiciel de numérisation de documents qui s' | ||
+ | |||
+ | Source: [[https:// | ||
+ | |||
+ | ====== Numériser un document papier: Tesseract ====== | ||
+ | |||
+ | Tesseract est un logiciel libre de reconnaissance optique de caractères. Il est très utile pour extraire le contenu d'un document numérisé. | ||
+ | |||
+ | Installation: | ||
+ | |||
+ | <code bash> | ||
+ | sudo apt-get install tesseract-ocr tesseract-ocr-fra | ||
+ | </ | ||
+ | Il faut au préalable préparer le document à la reconnaissance des caractères. | ||
+ | |||
+ | |||
+ | ---- | ||
+ | |||
+ | ===== Exemple de document ===== | ||
+ | |||
+ | {{: | ||
+ | |||
+ | |||
+ | ---- | ||
+ | |||
+ | ===== Exemple de document (suite 1) ===== | ||
+ | |||
+ | En utilisant ImageMagick, | ||
+ | |||
+ | **Code:** | ||
+ | |||
+ | <code bash> | ||
+ | convert DOC-20171024-215135.jpg -deskew 40% jpg:- | \ | ||
+ | | ||
+ | </ | ||
+ | |||
+ | ---- | ||
+ | |||
+ | ===== Exemple de document (suite 2) ===== | ||
+ | |||
+ | **Résultat: | ||
+ | |||
+ | < | ||
+ | Les pâtes Caielii Smari® soni une source trè:æ élevée | ||
+ | _ de fibres alimentaires. Voici une manièm déiicic‘sum | ||
+ | __ _‘3_/ d' | ||
+ | £J’ alimentation. il suffit de préparer les pâtes Cai9iii Smart“ | ||
+ | dela même manière que les pâtes ordinaires et de proiitg; | ||
+ | ensuite d'un goût exceptionneiiement savoureux. Voilà la umyun | ||
+ | d' | ||
+ | </ | ||
+ | |||
+ | ---- | ||
+ | |||
+ | ====== Manipuler des documents PDF: pdftk ====== | ||
+ | |||
+ | pdftk est un outil qui permet de manipuler des fichiers PDF. Il permet de: | ||
+ | |||
+ | * Fusionner et extraire des section de documents | ||
+ | |||
+ | <code bash> | ||
+ | pdftk a1.pdf a2.pdf cat output a1+a2.pdf | ||
+ | </ | ||
+ | * Extraire une section de document | ||
+ | |||
+ | <code bash> | ||
+ | pdftk a1+a2.pdf cat 1 output b1.pdf | ||
+ | </ | ||
+ | * Éclater un document en pages séparées | ||
+ | |||
+ | <code bash> | ||
+ | pdftk a1+a2.pdf burst | ||
+ | </ | ||
+ | * Pdfshuffle est une interface graphique qui permet de faire un travail similaire | ||
+ | |||
+ | |||
+ | ---- | ||
+ | |||
+ | ===== pdftk: Appliquer un filigrane ou ajouter un logo ===== | ||
+ | |||
+ | On peut ajouter une image en superposition en utilisant l' | ||
+ | |||
+ | **Code:** | ||
+ | |||
+ | <code bash> | ||
+ | pdftk presentation.pdf stamp confidentiel.pdf \ | ||
+ | | ||
+ | </ | ||
+ | |||
+ | ---- | ||
+ | |||
+ | ===== Versionnement de documents ===== | ||
+ | |||
+ | Il existe plusieurs logiciels de versionnement de code, dont git, qui peuvent aussi être utilisés pour versionner les documents avec un syntaxe en format texte, tels que markdown, et les formats Wiki. Cependant, il peut être difficile de versionner des documents de format OpenDocument ou PDF, car ils incluent de la compression de données ou des insertions binaires qui ne sont pas réversibles avec un outil tel que Pandoc. | ||
+ | |||
+ | |||
+ | ---- | ||
+ | |||
+ | ==== Outils de versionnement ==== | ||
+ | |||
+ | Une solution est d' | ||
+ | |||
+ | * [[http:// | ||
+ | * [[http:// | ||