Personal tools
You are here: Home Data Mining Linguastream Plug-ins pour Linguastream
Document Actions

Plug-ins pour Linguastream

by François Rioult last modified 2006-12-04 22:03
Il y a cinq plug-ins pour Linguastream qui permettent d'exécuter des commandes système :
  1. MVconcentrator
  2. MVdispatcher
  3. MVsegment
  4. MVsource
  5. MVsynchro

Chaque plug-ins évalue les paramètres de Linguastream dans la commande finale à exécuter.

Ces plug-ins utilisent des fichiers temporaires pour passer du formalisme des flux à la Linguastream à des fichiers réels. Ces fichiers sont stockés dans /tmp et de la forme LinguaStream_<id>.tmp. Chaque commande exécutée est tracée à l'écran, ce qui permet d'effectuer des ajustements de syntaxe. Veiller au débordement d'espace dans /tmp.

La chaîne de commande constituée par Linguastream n'est pas interprété par le système préalablement à son exécution. Cela signifie que les caractères seront tous traités équitablement, les caractères spéciaux perdent leur usage. Pour les utiliser quand-même, préfixer la commande avec l'utilitaire mveval.sh, qui demande explicitement au shell d'évaluer la commande.

MVconcentrator

C'est le plug-in le plus utilisé pour effectuer des commandes systèmes évoluées que le piped executable ne peut pas prendre en charge.
mvconcentrator.png
Il dispose de quatre entrées Linguastream, qui seront transférées dans des fichiers temporaires (supposons que le nom de ces fichiers est IN1, IN2, IN3, IN4). La sortie standard de l'exécution système est dirigée vers la sortie du composant Ses propriétés sont :
  • la commande à exécuter
  • les quatres préfixes pour les noms de fichier
  • les paramètres à insérer au début (params1)
  • les paramètres à insérer à la fin (params2)

La commande exécutée par le système est :

command params1 input1 IN1 input2 IN2 input3 IN3 input4 IN4 params2
Les quatres entrées ne sont pas obligatoires, une seule suffit.





Voici par exemple pour l'utilisation du programme mvminer, qui extrait les motifs delta libres. Son usage est :
mvminer -i <input> -s <minsup> -d <delta>
L'implémentation en Linguastream, pour minsup = 1%, et delta = -1 (recherche des fréquents uniquement) est la suivante :

mvminer.png






















MVdispatcher

mvdispatcher.png






Ce composant dispose d'une entrée (préfixée par la propriété input) et de deux sorties (préfixées par output1 et output2).
Il est par exemple utilisé pour produire un fichier d'apprentissage et un fichier de test à partir d'un fichier d'entrée, à l'aide de la commande mvrepartcurrent.sh.









MVsegment

mvsegment.png




Pour l'instant, ce composant n'a servi qu'une fois : pour effectuer la tâche de binarisation des données, qui requiert des données et un fichier de colonnes, et produit des données binarisées et un fichier de traduction. Les fichiers d'entrée et de sortie sont préfixables.











MVsource

mvsource.png




Ce composant n'a pas d'entrée : il sert uniquement à générer un flux Linguastream à partir d'une commande shell par exemple.




« June 2011 »
Su Mo Tu We Th Fr Sa
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30
 

Powered by Plone, the Open Source Content Management System

This site conforms to the following standards: