Personal tools
You are here: Home Data Mining Linguastream Notes sur Linguastream
Document Actions

Notes sur Linguastream

by François Rioult last modified 2008-09-19 15:39

Lemmatisation

  • télécharger le TreeTagger : http://www.ims.uni-stuttgart.de/projekte/corplex/TreeTagger/DecisionTreeTagger.html
  • LS ayant un problème pour stocker les préférences, il faut à chaque fois reparamétrer le TreeTagger (indiquer le chemin d'accès à bin/tree-tagger, lib/french-utf8.par)
  • le composant treeTagger de LS doit être bien paramétré (passer en mode expert), en particulier pour les encodings.
  • le composant SimpleTokenizer rale quand la déclaration XML de l'entrée est incorrecte :
    <?xml version="1.0" encoding="UTF-8"?>
    et pas
    <?xml encoding="UTF-8" version="1.0"?>

Autre possibilité pour lemmatiser :
  • PILAF http://www-clips.imag.fr/demonstrations/index.php#1
  • LEFFF : http://www.labri.fr/perso/clement/lefff/
  • SYGMART : http://www.lirmm.fr/~chauche/PresentationSygmart.html
  • ATALA : http://www.atala.org/-Outils-pour-le-TAL-
« June 2011 »
Su Mo Tu We Th Fr Sa
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30
 

Powered by Plone, the Open Source Content Management System

This site conforms to the following standards: