diff --git a/Billets/Billet001 - Introduction.ipynb b/Billets/Billet001 - Introduction.ipynb new file mode 100644 index 0000000..bc5d5b4 --- /dev/null +++ b/Billets/Billet001 - Introduction.ipynb @@ -0,0 +1,146 @@ +{ + "cells": [ + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "# Utiliser les données ouvertes géospatiales: explorer, comprendre, agir\n", + "\n", + "Le portail du gouvernement ouvert déborde de jeux de données géospatiales. Cependant, il peut être difficile d'exploiter ces données à leur plein potentiel. Nous ne pouvons pas les utiliser avec les logiciels de bureautique. On doit donc recourir à des outils plus spécialisés : les systèmes d'information géographique. J'ai pour objectif d'aider les citoyens et les entreprises à découvrir ceux-ci. Ils nous permettront d'explorer les données géospatiales ouvertes. Nous pourrons générer nos propres cartes. Nous pourrons ensuite mieux comprendre différents enjeux locaux. Enfin, nous pourrons créer des guides pour favoriser la prise de décision." + ] + }, + { + "cell_type": "code", + "execution_count": 32, + "metadata": { + "scrolled": true + }, + "outputs": [], + "source": [ + "textbloc001=\"\"\"\n", + "Le portail du gouvernement ouvert déborde de jeux de données géospatiales. Cependant, il peut être difficile d'exploiter ces données à leur plein potentiel. Nous ne pouvons pas les utiliser avec les logiciels de bureautique. On doit donc recourir à des outils plus spécialisés : les systèmes d'information géographique. J'ai pour objectif d'aider les citoyens et les entreprises à découvrir ceux-ci. Ils nous permettront d'explorer les données géospatiales ouvertes. Nous pourrons générer nos propres cartes. Nous pourrons ensuite mieux comprendre différents enjeux locaux. Enfin, nous pourrons créer des guides pour favoriser la prise de décision.\n", + "\"\"\"" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "## Les données géospatiales\n", + "\n", + "Les jeux de données géospatiales incluent des références géographiques. Ce sont les limites, les trajets et les points d'intérêt. Ils sont souvent décrits sous forme de coordonnées : longitude et latitude. Nous associons de l'information à chacune de ces références pour construire une base de données. Celle-ci entrepose deux principaux types de données : vectorielles et matricielles. Les données vectorielles sont composées de formes géométriques. Les cartes routières en sont un exemple. Les données matricielles sont formées de lignes et de colonnes de cellules qui contiennent de l'information. Les photos aériennes et les images radar en font partie." + ] + }, + { + "cell_type": "code", + "execution_count": 50, + "metadata": { + "collapsed": true + }, + "outputs": [], + "source": [ + "textbloc002=\"\"\"\n", + "Les jeux de données géospatiales incluent des références géographiques. Ce sont les limites, les trajets et les points d'intérêt. Ils sont souvent décrits sous forme de coordonnées : longitude et latitude. Nous associons de l'information à chacune de ces références pour construire une base de données. Celle-ci entrepose deux principaux types de données : vectorielles et matricielles. Les données vectorielles sont composées de formes géométriques. Les cartes routières en sont un exemple. Les données matricielles sont formées de lignes et de colonnes de cellules qui contiennent de l'information. Les photos aériennes et les images radar en font partie.\n", + "\"\"\"" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "## Hors-Publication: Mesures de lisibilité\n", + "\n", + "### The Flesch Reading Ease formula\n", + "\n", + "* 90-100 : Very Easy\n", + "* 80-89 : Easy\n", + "* 70-79 : Fairly Easy\n", + "* 60-69 : Standard\n", + "* 50-59 : Fairly Difficult\n", + "* 30-49 : Difficult\n", + "* 0-29 : Very Confusing\n", + "\n", + "### The Flesch-Kincaid Grade Level\n", + "\n", + "Returns the grade score using the Flesch-Kincaid Grade Formula." + ] + }, + { + "cell_type": "code", + "execution_count": 4, + "metadata": { + "collapsed": true + }, + "outputs": [], + "source": [ + "from textstat.textstat import textstat as ts" + ] + }, + { + "cell_type": "code", + "execution_count": 39, + "metadata": {}, + "outputs": [], + "source": [ + "def stat_paragraphe(textes):\n", + " for texte in textes:\n", + " yield {\n", + " \"word_count\":ts.lexicon_count(texte),\n", + " \"flesch\":ts.flesch_reading_ease(texte), \n", + " \"flesch-kincaid\": ts.flesch_kincaid_grade(texte)\n", + " }" + ] + }, + { + "cell_type": "code", + "execution_count": 51, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "[{'flesch': 61.02, 'flesch-kincaid': 7.3, 'word_count': 93},\n", + " {'flesch': 52.15, 'flesch-kincaid': 8.6, 'word_count': 96}]" + ] + }, + "execution_count": 51, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "[i for i in stat_paragraphe([textbloc001,textbloc002])]" + ] + }, + { + "cell_type": "code", + "execution_count": null, + "metadata": { + "collapsed": true + }, + "outputs": [], + "source": [] + } + ], + "metadata": { + "kernelspec": { + "display_name": "Python 3", + "language": "python", + "name": "python3" + }, + "language_info": { + "codemirror_mode": { + "name": "ipython", + "version": 3 + }, + "file_extension": ".py", + "mimetype": "text/x-python", + "name": "python", + "nbconvert_exporter": "python", + "pygments_lexer": "ipython3", + "version": "3.6.1" + } + }, + "nbformat": 4, + "nbformat_minor": 2 +}