267 views
# 🚕 1.6. La stop list ## Quelle est la logique qui sous-tend la présélection des *stop word* ? > __Réponse rapide :__ les *stop word* ou *stop terms* sont les termes que vous ne voulez plus jamais voir dans aucune analyse future. GarganText dispose d'une liste de stop word "standards" issues de la litterature académique pour vous faciliter le travail, et apprend des stop termes que vous introduisez pour ne plus jamais vous les proposer dans vos futures analyses. ## Les stop words de GarganText L'extraction automatique de termes fait parfois des erreurs en vous proposant des termes "creux" comme par exemple "same time" ou "the" qui bien que très présents dans les corpus ne sont pas très informatifs. Pour éviter que ce type de termes ne viennent polluer vos analyses Les stop termes prédéfinis dans GarganText viennent de listes standard en fouille de données textuelle : the, of, le, des, même, etc... Gargantext ne vous proposera jamais ces stop termes sauf si vous décidez de les valider comme terme pertinent dans l'une de vos analyses. Vous pouvez à tout moment vérifier qu'aucun stop word n'est pertinent pour vous en allant dans une analyse "Terms" puis en choisissant "Stop terms". ![](/uploads/upload_f701100dbc8fc4a6283c3ce6939dfb5e.png =500x) Pour "rétablir" un "stop word" en candidat ou même l'intégrer aux analyses, il suffit de cliquer dessus pour le faire changer de statut. ## Ajouter ses propres stop words Vous pouvez également mettre en stop word des expressions qui vous sont proposées lors d'une analyse par GaranText si ce sont des expressions qui ne vous apporteront jamais d'info dans une carte future. Comme par exemple des expressions courante d'une communauté telle que "nos recherches" ou "nos résultats". Mettre des expressions non informatives en *stop word* vous permet de faire de la place pour des expressions plus pertinents dans vos futures analyses car par défaut GarganText injecte dans la table des termes quelques centaines de termes qu'il juge pertinent et qui peuvent être ajoutés/retirés très rapidement d'une analyse.