version presque finale

This commit is contained in:
François Pelletier 2017-10-24 23:41:30 -04:00
parent 0ee90bce8a
commit 25d1d744ce
5 changed files with 262 additions and 11 deletions

BIN
DOC-20171024-215135.jpg Normal file

Binary file not shown.

After

Width:  |  Height:  |  Size: 210 KiB

9
compile.sh Executable file
View file

@ -0,0 +1,9 @@
#!/bin/bash
pandoc -f markdown+simple_tables+pandoc_title_block \
-t beamer -s presentation.md -o presentation.pdf
pandoc -f markdown+simple_tables+pandoc_title_block \
-t slidy -s presentation.md -o presentation.html
pandoc -f markdown+simple_tables+pandoc_title_block \
-t dokuwiki -s presentation.md -o presentation.dokuwiki
pdftk presentation.pdf stamp confidentiel.pdf \
output presentation-conf.pdf

BIN
confidentiel.pdf Normal file

Binary file not shown.

View file

@ -43,6 +43,12 @@
- KOffice
- AbiWord
Installation de Abiword:
```bash
sudo apt-get install abiword
```
---
### OpenDocument: Références
@ -84,9 +90,15 @@
### Distributions de \LaTeX
- [MikTeX](https://miktex.org/), la distribution recommandée pour Windows. Aussi disponible sur macOS via Homebrew.
- [TeX Live](https://www.tug.org/texlive/), la distribution la plus courante et celle par défaut sur les distributions majeures de GNU/Linux
- [TeX Live](https://www.tug.org/texlive/), la distribution la plus courante et celle par défaut sur les distributions majeures de GNU/Linux.
- [MacTeX](http://www.tug.org/mactex/), distribution TeX Live adaptée pour macOS
Installation de TeX Live (attention, prévoir environ 3 Go de données et 1h !):
```bash
sudo apt-get install texlive-full
```
---
### \LaTeX\ : Éditeurs libres
@ -105,6 +117,8 @@
- [\TeX Users Group web site](http://tug.org/)
- [\LaTeX\ Wikibook](https://en.wikibooks.org/wiki/LaTeX)
---
## Markdown
- Markdown est un langage de balisage léger
@ -113,17 +127,23 @@
- Très populaire pour produire de la documentation
- Presque toujours converti vers un format HTML
### Markdown:nÉditeurs libres
---
### Markdown: Éditeurs libres
- [Remarkable](https://remarkableapp.github.io/), Windows et GNU/Linux
- [Visual Studio Code](https://github.com/Microsoft/vscode), Multi-plateforme
- [Stackedit](https://stackedit.io/), Multi-plateforme, application web
---
### Markdown: Références
- [Site officiel](http://daringfireball.net/projects/markdown/)
- [Un guide pour bien commencer avec markdown](https://blog.wax-o.com/2014/04/tutoriel-un-guide-pour-bien-commencer-avec-markdown/)
---
## DocBook
- DocBook est un schéma XML très large qui permet de définir sémantiquement le contenu d'un livre ou d'un article.
@ -133,36 +153,258 @@
- [What is DocBook?](http://docbook.org/whatis)
---
# Pandoc
Pandoc est un outil et une librairie écrit en Haskell qui permet de convertir des documents entre plusieurs formats ouverts.
Il y a aussi une librairie très utilisée par plusieurs autres logiciels. Si votre éditeur permet d'exporter votre travail dans une multitude de formats, c'est probablement du à Pandoc.
Pandoc est multi-plateformes, mais certaines fonctionnalités peuvent être limitées. Par exemple, il faut avoir Microsoft Word ou LibreOffice pour produire des DOCX.
## Exploiter Pandoc Markdown
Installation
```bash
sudo apt-get install pandoc
```
Installation avec Cabal, pour avoir la version la plus récente:
```bash
cabal install pandoc
```
---
## Pandoc: Formats d'entrée
Les formats d'entrée incluent:
- markdown
- DocBook
- LaTeX
- OpenDocument
- Epub
- ...
---
## Pandoc: Formats de sortie
Les formats de sortie incliuent:
- HTML
- OpenDocument
- EPub
- DocBook
- LaTeX
- PDF
- markdown
- MediaWiki
- DokuWiki
---
## Pandoc Markdown
Le Pandoc Markdown est un des formats d'entrée les plus vertatiles. Il s'agit d'une variante de Markdown supportant plusieurs fonctionnalités additionnelles.
Référence: [Anthoring Pandoc Markdown](http://rmarkdown.rstudio.com/authoring_pandoc_markdown.html)
---
## Pandoc Markdown: Blocs de lignes
Les **blocs** de lignes permettent de séparer le texte manuellement. Par exemple, pour les adresses:
**Code:**
```markdown
| Centre de loisirs St-Louis-de-France
| 1560 Route De LÉglise
| Québec, G1W 3P5
```
**Résultat:**
| Centre de loisirs St-Louis-de-France
| 1560 Route De LÉglise
| Québec, G1W 3P5
---
## Pandoc Markdown: Tables simples
Il faut spécifier l'extension `+simple_tables`
**Code:**
```markdown
Droite Gauche Centre Defaut
------- ------ ---------- ------
12 12 12 12
123 123 123 123
Table: Demonstration de la syntaxe des tables simples.
```
**Résultat:**
Droite Gauche Centre Defaut
------- ------ ---------- ------
12 12 12 12
123 123 123 123
Table: Demonstration de la syntaxe des tables simples.
---
## Pandoc Markdown: métadonnées
Les métadonnées permettent d'identifier le titre, l'auteur et la date dans l'entête du document. On utilise l'extension `+pandoc_title_block`
**Code:**
```markdown
% Les formats de documents ouverts
% François Pelletier
% 25 novembre 2017
```
---
## Pandoc Markdown: mathématiques
Pandoc permet de traiter les équations mathématiques saisies avec la syntaxe LaTeX à l'aide de différents outils tout dépendamment du format de document en sortie.
Les principaux outils utilisés sont MathML et AMS \LaTeX
---
## Pandoc Markdown: mathématiques
On saisis les contenus mathématiques entre signes `$` ou `$$` pour les expressions multilignes.
**Code:**
```markdown
$$
{\begin{aligned}
&\gamma _{ij}(x,t) \\
=&\sum _{k=1}^{N}\sigma _{ik}(x,t)\sigma _{jk}(x,t)
\end{aligned}}
$$
```
**Résultat:**
$$
{\begin{aligned}
&\gamma _{ij}(x,t) \\
=&\sum _{k=1}^{N}\sigma _{ik}(x,t)\sigma _{jk}(x,t)
\end{aligned}}
$$
---
## Produire des présentations facilement
Un exemple: cette présentation a été écrite avec le langage Markdown et exportée en PDF et en HTML avec Pandoc.
```bash
pandoc -t slidy -s presentation.md -o presentation.html
#!/bin/bash
pandoc -f markdown+simple_tables+pandoc_title_block \
-t beamer -s presentation.md -o presentation.pdf
pandoc -f markdown+simple_tables+pandoc_title_block \
-t slidy -s presentation.md -o presentation.html
```
```bash
pandoc -t beamer -s presentation.md -o presentation.pdf
```
---
## Publier sur un wiki ou un site web
Il est aussi possible d'exporter le contenu d'un document vers la syntaxe dokuwiki, ce qui peut être très utile !
```bash
pandoc -f markdown+simple_tables+pandoc_title_block \
-t dokuwiki -s presentation.md -o presentation.dokuwiki
```
---
# Tesseract
Tesseract est un logiciel libre de reconnaissance optique de caractères. Il est très utile pour extraire le contenu d'un document numérisé.
Installation:
```bash
sudo apt-get install tesseract-ocr tesseract-ocr-fra
```
Il faut au préalable préparer le document à la reconnaissance des caractères.
---
## Exemple de document
![](DOC-20171024-215135.jpg)
---
## Exemple de document (suite 1)
En utilisant ImageMagick, on peut aligner le document. On utilise ensuite Tesseract pour extraire le texte. On peut combiner les deux commandes en utilisant un `pipe`.
**Code:**
```bash
convert DOC-20171024-215135.jpg -deskew 40% jpg:- | \
tesseract stdin -l fra -psm 1 DOC-20171024-215135
```
---
## Exemple de document (suite 2)
**Résultat:**
```
Les pâtes Caielii Smari® soni une source trè:æ élevée
_ de fibres alimentaires. Voici une manièm déiicicsum
__ _3_/ d'augmenter votre apport en iihrea ei d'améliumr vuinî
£J alimentation. il suffit de préparer les pâtes Cai9iii Smart“
dela même manière que les pâtes ordinaires et de proiitg;
ensuite d'un goût exceptionneiiement savoureux. Voilà la umyun
d'obtenir plus de fibres pour toute la iamiiie.
```
---
# pdftk
## Concaténer des documents
pdftk est un outil qui permet de manipuler des fichiers PDF. Il permet de:
## Extraire une section d'un document
- Fusionner et extraire des section de documents
```bash
pdftk a1.pdf a2.pdf cat output a1+a2.pdf
```
- Extraire une section de document
```bash
pdftk a1+a2.pdf cat 1 output b1.pdf
```
- Éclater un document en pages séparées
```bash
pdftk a1+a2.pdf burst
```
# imagemagick
---
## Appliquer un filigrane
## Ajouter un logo
On peut ajouter une image en superposition en utilisant l'option stamp. Par exemple, pour identifier un document comme confidentiel.
**Code:**
```bash
pdftk presentation.pdf stamp confidentiel.pdf \
output presentation-conf.pdf
```

BIN
presentation.pdf Normal file

Binary file not shown.