ajout versionnement

This commit is contained in:
François Pelletier 2017-10-25 13:41:08 -04:00
parent 25d1d744ce
commit 7a7fd8c213
2 changed files with 29 additions and 5 deletions

View file

@ -56,6 +56,8 @@ sudo apt-get install abiword
- [OASIS Open Document Format for Office Applications (OpenDocument) TC](https://www.oasis-open.org/committees/tc_home.php?wg_abbrev=office)
- [Document Freedom Day](http://www.documentfreedom.org/index.php)
---
## \LaTeX
- \LaTeX\ est un système de préparation de document.
@ -290,7 +292,7 @@ On saisis les contenus mathématiques entre signes `$` ou `$$` pour les expressi
```markdown
$$
{\begin{aligned}
{\begin{aligned}/home/francois/nextCloud/LinuQ/20171025_pandoc/20171025_formats_ouverts
&\gamma _{ij}(x,t) \\
=&\sum _{k=1}^{N}\sigma _{ik}(x,t)\sigma _{jk}(x,t)
\end{aligned}}
@ -333,7 +335,14 @@ pandoc -f markdown+simple_tables+pandoc_title_block \
---
# Tesseract
# Numériser un document papier: Simple Scan
Simple Scan est un logiciel de numérisation de documents qui s'utilise avec un numériseur à plat ou avec alimentation automatique.
Il permet de créer des documents PDF facilement. Cette application est développée par le projet GNOME.
Source: [GitHub: GNOME/simple-scan](https://github.com/GNOME/simple-scan)
# Numériser un document papier: Tesseract
Tesseract est un logiciel libre de reconnaissance optique de caractères. Il est très utile pour extraire le contenu d'un document numérisé.
@ -380,7 +389,7 @@ d'obtenir plus de fibres pour toute la iamiiie.
---
# pdftk
# Manipuler des documents PDF: pdftk
pdftk est un outil qui permet de manipuler des fichiers PDF. Il permet de:
@ -399,7 +408,7 @@ pdftk est un outil qui permet de manipuler des fichiers PDF. Il permet de:
---
## Appliquer un filigrane
## pdftk: Appliquer un filigrane ou ajouter un logo
On peut ajouter une image en superposition en utilisant l'option stamp. Par exemple, pour identifier un document comme confidentiel.
@ -407,4 +416,19 @@ On peut ajouter une image en superposition en utilisant l'option stamp. Par exem
```bash
pdftk presentation.pdf stamp confidentiel.pdf \
output presentation-conf.pdf
```
```
---
## Versionnement de documents
Il existe plusieurs logiciels de versionnement de code, dont git, qui peuvent aussi être utilisés pour versionner les documents avec un syntaxe en format texte, tels que markdown, \LaTeX et les formats Wiki. Cependant, il peut être difficile de versionner des documents de format OpenDocument ou PDF, car ils incluent de la compression de données ou des insertions binaires qui ne sont pas réversibles avec un outil tel que Pandoc.
---
### Outils de versionnement
Une solution est d'utiliser un extracteur de texte. En voici quelques uns:
- [pdftohtml](http://pdftohtml.sourceforge.net/), un utilitaire simple qui convertis un document PDF en document HTML. Il est ensuite possible d'utiliser Pandoc pour convertir vers un autre format. C'est la meilleure solution pour faire un coup vite.
- [Apache Tika](http://tika.apache.org/), une arme de guerre pour extraire le contenu textuel et les métadonnées d'une multitude de formats de données. Disponible sous forme de serveur web ou de librairie Java. C'est la meilleure solution pour gérer une masse de documents.

Binary file not shown.