diff --git a/presentation.md b/presentation.md index be151cc..108eca6 100644 --- a/presentation.md +++ b/presentation.md @@ -56,6 +56,8 @@ sudo apt-get install abiword - [OASIS Open Document Format for Office Applications (OpenDocument) TC](https://www.oasis-open.org/committees/tc_home.php?wg_abbrev=office) - [Document Freedom Day](http://www.documentfreedom.org/index.php) +--- + ## \LaTeX - \LaTeX\ est un système de préparation de document. @@ -290,7 +292,7 @@ On saisis les contenus mathématiques entre signes `$` ou `$$` pour les expressi ```markdown $$ -{\begin{aligned} +{\begin{aligned}/home/francois/nextCloud/LinuQ/20171025_pandoc/20171025_formats_ouverts &\gamma _{ij}(x,t) \\ =&\sum _{k=1}^{N}\sigma _{ik}(x,t)\sigma _{jk}(x,t) \end{aligned}} @@ -333,7 +335,14 @@ pandoc -f markdown+simple_tables+pandoc_title_block \ --- -# Tesseract +# Numériser un document papier: Simple Scan + +Simple Scan est un logiciel de numérisation de documents qui s'utilise avec un numériseur à plat ou avec alimentation automatique. +Il permet de créer des documents PDF facilement. Cette application est développée par le projet GNOME. + +Source: [GitHub: GNOME/simple-scan](https://github.com/GNOME/simple-scan) + +# Numériser un document papier: Tesseract Tesseract est un logiciel libre de reconnaissance optique de caractères. Il est très utile pour extraire le contenu d'un document numérisé. @@ -380,7 +389,7 @@ d'obtenir plus de fibres pour toute la iamiiie. --- -# pdftk +# Manipuler des documents PDF: pdftk pdftk est un outil qui permet de manipuler des fichiers PDF. Il permet de: @@ -399,7 +408,7 @@ pdftk est un outil qui permet de manipuler des fichiers PDF. Il permet de: --- -## Appliquer un filigrane +## pdftk: Appliquer un filigrane ou ajouter un logo On peut ajouter une image en superposition en utilisant l'option stamp. Par exemple, pour identifier un document comme confidentiel. @@ -407,4 +416,19 @@ On peut ajouter une image en superposition en utilisant l'option stamp. Par exem ```bash pdftk presentation.pdf stamp confidentiel.pdf \ output presentation-conf.pdf -``` \ No newline at end of file +``` + +--- + +## Versionnement de documents + +Il existe plusieurs logiciels de versionnement de code, dont git, qui peuvent aussi être utilisés pour versionner les documents avec un syntaxe en format texte, tels que markdown, \LaTeX et les formats Wiki. Cependant, il peut être difficile de versionner des documents de format OpenDocument ou PDF, car ils incluent de la compression de données ou des insertions binaires qui ne sont pas réversibles avec un outil tel que Pandoc. + +--- + +### Outils de versionnement + +Une solution est d'utiliser un extracteur de texte. En voici quelques uns: + +- [pdftohtml](http://pdftohtml.sourceforge.net/), un utilitaire simple qui convertis un document PDF en document HTML. Il est ensuite possible d'utiliser Pandoc pour convertir vers un autre format. C'est la meilleure solution pour faire un coup vite. +- [Apache Tika](http://tika.apache.org/), une arme de guerre pour extraire le contenu textuel et les métadonnées d'une multitude de formats de données. Disponible sous forme de serveur web ou de librairie Java. C'est la meilleure solution pour gérer une masse de documents. \ No newline at end of file diff --git a/presentation.pdf b/presentation.pdf index b2522e6..093745f 100644 Binary files a/presentation.pdf and b/presentation.pdf differ