No description
Find a file
François Pelletier 59a5e53f33 ajout des png
2021-02-27 21:24:25 -05:00
data ajout des données 2020-02-02 20:27:00 -05:00
slides ajout création des pdf des slides automatisée 2020-02-04 22:34:27 -05:00
visuels slides et visuels 2020-01-20 23:58:28 -05:00
.gitignore ajout des données 2020-02-02 20:27:00 -05:00
analyse_articles.ipynb ajout des png 2021-02-27 21:24:25 -05:00
commentaires.ipynb préparation données terminée 2019-12-16 18:25:47 -05:00
commentaires_reseaux_sociaux.mm ajout quelques paragraphes au rapport 2019-12-21 15:39:12 -05:00
g000.png ajout des png 2021-02-27 21:24:25 -05:00
g001.png ajout des png 2021-02-27 21:24:25 -05:00
g002.png ajout des png 2021-02-27 21:24:25 -05:00
g003.png ajout des png 2021-02-27 21:24:25 -05:00
g004.png ajout des png 2021-02-27 21:24:25 -05:00
g005.png ajout des png 2021-02-27 21:24:25 -05:00
g006.png ajout des png 2021-02-27 21:24:25 -05:00
g007.png ajout des png 2021-02-27 21:24:25 -05:00
Makefile corrections pour que ça roule encore 2021-02-19 22:38:43 -05:00
NLP-TP3.bib version finale 2019-12-28 00:35:13 -05:00
parsing_functions.py commit initial 2019-12-15 20:31:38 -05:00
pretraitement.py préparation données terminée 2019-12-16 18:25:47 -05:00
rapport.md corrections pour que ça roule encore 2021-02-19 22:38:43 -05:00
README.md corrections pour que ça roule encore 2021-02-19 22:38:43 -05:00
textes_articles.ipynb corrections pour que ça roule encore 2021-02-19 22:38:43 -05:00
traitement_articles.ipynb corrections pour que ça roule encore 2021-02-19 22:38:43 -05:00
traitement_commentaires.ipynb corrections pour que ça roule encore 2021-02-19 22:38:43 -05:00
transactions-on-speech-and-language-processing.csl ajout début du rapport 2019-12-19 00:25:23 -05:00
wn_pos_from_ud_pos.py ajout de plusieurs graphiques et métriques dans le rapport 2019-12-27 00:26:38 -05:00

Travail pratique 3

Cours: IFT-7022 Session: Automne 2019 Auteur: François Pelletier

Installation des dépendances du projet

Installer Anaconda3 depuis https://www.anaconda.com/distribution/#download-section

Installer ces paquets additionnels dans l'environnement

pip install newspaper3k
pip install emoji
pip install git+https://github.com/ClaudeCoulombe/FrenchLefffLemmatizer.git

Installations des dépendances de nltk

import nltk
nltk.download('wordnet')
nltk.download('omw')
nltk.download('punkt')

Obtenir CoreNLP

Télécharger CoreNLP depuis

https://stanfordnlp.github.io/CoreNLP/download.html

  • Le fichier principal: stanford-corenlp-full-2018-10-05.zip
  • Les fichiers de modèles pour le français, à mettre dans le même dossier que CoreNLP: stanford-french-corenlp-2018-10-05-models.jar

Démarrer le serveur CoreNLP

Exécuter cette commande dans le répertoire de CoreNLP

java -mx8g -cp "*" edu.stanford.nlp.pipeline.StanfordCoreNLPServer -serverProperties StanfordCoreNLP-french.properties -preload tokenize,ssplit,pos,lemma,ner,parse,depparse -status_port 9000 -port 9000 -timeout 15000 & 

Compilation du rapport en PDF (requiert pandoc et texlive, a installer depuis les paquets de la distribution linux utilisée):

make