# đ 2.1. Le Corpus STAR WARS
DĂšs la requĂȘte dans les moteurs de recherche, lâutilisateur peut associer plusieurs mots clĂ©s pour dĂ©finir clairement les conditions dâexploration :
- Les paramÚtres booléens (AND/OR/NOT) et des guillemets,
- La date de publication (publicationDate:[2010 TO *]),
- Les auteurs (author.name:*)
- La prĂ©sence dâun rĂ©sumĂ© (abstract:*)
- L'élimination des PDF image (qualityIndicators.pdfWordCount:[500 TO *])
Ces formulations ne sont pas reconnues par toutes les bases de donnĂ©es. Cela dĂ©pend du degrĂ©s dâenrichissement des mĂ©tadonnĂ©es. La base ISTEX constitue lâun des rĂ©servoirs les plus garnis en mĂ©tadonnĂ©es. Vous pouvez retrouver lâensemble des fonctions prĂ©sentent sur le dĂ©monstrateur ISTEX (un outil pĂ©dagogique grĂące Ă la fonction de recherche avancĂ©e).
Lâoutil de cartographie GarganText analyse les termes dâun corpus documentaire et propose Ă lâutilisateur plusieurs modĂšles de visualisation quâil peut modifier. Quand on dĂ©bute un travail dâexploration documentaire, une premiĂšre recherche sur une base pluridisciplinaire comme HAL ou ISTEX permet de baliser les grandes axes (clusters) de lâĂ©tude documentaire.
ProblĂ©matique de recherche : quelle est lâinfluence de lâunivers de « Star Wars » sur la culture populaire moderne chez les jeunes ?
On rĂ©alise une premiĂšre carte avec Gargantext sur le corpus ISTEX en indiquant comme mots-clĂ©s "Star Wars" pour explorer lâenvironnement large du sujet de recherche.
On obtient la carte suivante organisĂ©e en 5 groupes de couleur (clusters) reprĂ©sentant chacun un regroupement thĂ©matique : un ensemble de termes proche dans lâunivers de « Star Wars » (contexte, synonyme, etc.)

La requĂȘte nâest pas assez fine pour donner des rĂ©sultats pertinents et exploitables sur le sujet de recherche. NĂ©anmoins, cette premiĂšre requĂȘte permet de dĂ©finir les grandes thĂ©matiques et de cibler plusieurs mots-clĂ©s pour amĂ©liorer la requĂȘte initiale.
Termes pivots vs Mots-clés
- Termes pivots : Les termes principaux de notre recherche déjà identifiés. Par exemple Star Wars, culture populaire, jeunes, etc.
- Mots-clĂ©s : mots liĂ©s Ă nos termes pivots qui se trouvent gĂ©nĂ©ralement dans le mĂȘme cluster et renseigne sur la nature de liaison.
## Etude des clusters
A cette Ă©tape, lâobjectif est de dĂ©finir la thĂ©matique de chaque cluster et de dĂ©terminer les mots-clĂ©s qui pourraient ĂȘtre reliĂ©s au sujet dâĂ©tude.

Le cluster bleu foncĂ© contient le termes pivot « Star Wars » dans ces points de liaison. Cet ensemble rĂ©vĂšle essentiellement des mots-clĂ©s sur les thĂ©matiques de lâespace, de lâarmĂ©e, de la politique, etc. Ce cluster est assez Ă©loignĂ© de notre sujet de recherche.

Le cluster vert regroupe les termes techniques sur la vidĂ©o, le montage, les effets spĂ©ciaux et les flux de donnĂ©es. On ne retrouve aucun terme pivot et il ne permet pas de valoriser notre angle dâanalyse.

Le cluster bleu clair rĂ©vĂšle la structuration de lâunivers « Star Wars » et met en avant lâapprentissage, la connaissance, lâinformation, les concepts, etc. Ce regroupement est particuliĂšrement intĂ©ressant puisque le terme « learning » peut se rĂ©fĂ©rer Ă la transmission de savoir auprĂšs dâun jeune public.

Le cluster rouge fait rĂ©fĂ©rence au dĂ©veloppement technologique, Ă la temporalitĂ© et Ă la science-fiction. Si lâon cible le point « science-fiction », on remarque lâapparition pour la premiĂšre fois du terme pivot « popular culture ».
Ce dernier ne possĂšde quâune unique liaison avec le mot-clĂ© « science-fiction ». NĂ©anmoins, on retrouve le mot-clĂ© « education » qui nâa pas de liaison directe avec le terme pivot « popular culture » mais se situe dans le mĂȘme environnement spatial.

Enfin, le cluster jaune sâintĂ©resse Ă lâidentitĂ© des protagonistes et de leur mise en scĂšne (film, livre et jeux vidĂ©o). Par rapport au sujet initial, il serait intĂ©ressant dâaffiner la prochaine requĂȘte avec un mot clĂ© sur le public visĂ© comme « children » pour faire apparaitre des points de liaison avec le cluster rouge.
Cette premiÚre exploration large permet de délimiter les thématiques du sujet de recherche et de repérer de nouveaux types de mots clés pour affiner la recherche initiale
# Explorer des bases de données
## Moteur de recherche ISTEX (pluridisciplinaire)
Utilisation du dĂ©monstrateur ISTEX (www.demo.istex.fr), un outil pĂ©dagogique de construction de requĂȘte informatique, pour affiner la requĂȘte initiale.
RĂ©alisation de nouvelles requĂȘtes/cartes pour interprĂ©ter les nouvelles relations entre les mots-clĂ©s identifiĂ©s sur la premiĂšre carte dans trois clusters diffĂ©rents : « popular culture », « learning » et « children ».
REQUETE N°2
"Star Wars" AND "popular culture" AND (abstract:*)

La seconde requĂȘte permet dâĂ©tudier la spatialisation et les liaisons des mots-clĂ©s qui relient « Star Wars » à « culture populaire ». Lâobjectif est de trouver des liens directs ou dâidentifier des mots-clĂ©s en communs qui permettrait de les relier entre eux.
Les trois mots-clĂ©s identifiĂ©s sur la carte prĂ©cĂ©dente sont spatialement proches. Câest le mot « educationnal research » qui se rapproche le plus du terme « learning » et qui fait la liaison avec la « popular culture », « children » et « young people ».
Pour rĂ©ussir Ă les relier directement, il faut prĂ©ciser une nouvelle fois la requĂȘte dâexploration. Nous allons prĂ©fĂ©rer cibler « young people » plutĂŽt que « children » pour orienter la liaison vers la liaison sur le rĂ©fĂ©rentiel des « popular film ».
REQUET N°3
"Star Wars" AND "popular culture" AND "young people" AND (abstract:*) AND qualityIndicators.pdfWordCount:[500 TO *]

La troisiĂšme requĂȘte rĂ©vĂšle un rĂ©sultat particuliĂšrement intĂ©ressant puisquâil rĂ©unit termes pivots et mots-clĂ©s identifiĂ©s au sein dâun mĂȘme cluster. En effet, le mot « popular culture » est directement liĂ© à « learning » qui lui-mĂȘme est rattachĂ© à « children » et à « educationnal research ».
Les deux nouvelles requĂȘtes sont intĂ©ressantes et exploitables. LâĂ©tape suivante est de les tester sur dâautres bases de donnĂ©es et de complĂ©ter au fur et mesure un tableur CSV comme un « journal de bord ».
## Moteur de recherche Isidore (SHS)
Le sujet choisi est davantage une thĂ©matique de SHS. Le premier rĂ©flexe est dâutiliser le moteur de recherche Isidore de la TGIR Huma-Num qui regroupe les rĂ©sultats de plusieurs bases de donnĂ©es en SHS.

La requĂȘte sur Isidore donne 93 rĂ©sultats repartis sur plusieurs plateformes comme OpenEdition, Scielo, HAL, ThĂšse.fr, etc.
En explorant plus en dĂ©tail les ressources signalĂ©es dans Isidore, on effectue un premier filtre pour garder les publications dâintĂ©rĂȘt puisque la sĂ©lection nâest pas encore terminĂ©e.
# Importer un tableur au format CSV
Le tableur va permettre Ă lâopĂ©rateur de tenir un journal de bord pour dĂ©velopper son propre corpus de donnĂ©es.
En effet, il est possible dâutiliser la puissance de calcul et de traitement de Gargantext pour analyser un corpus autre que ceux proposĂ©s dans la liste des bases de donnĂ©es interrogeables. Puis de venir agrĂ©ger les rĂ©sultats dans le tableur.
Il suffit de complĂ©ter une feuille de calcul sous le modĂšle dâun export de corpus Gargantext qui se prĂ©sente en sept colonnes principales (peu importe lâordre) :
* Colonne 1 "title" : titre de la publication
* Colonne 2 "abstract" : résumé de la publication
* Colonne 3 "authors" : auteurs de la publication
* Colonne 4 "source" : éditeur ou la revue de la publication
* Colonne 5 "publication_year" : année de publication
* Colonne 6 "publication_month" : mois de publication
* Colonne 7 "publication_day" : jour de publication
[Le détail précis de l'import de fichiers CSV se trouve sur cette page](https://write.frame.gargantext.org/970190a1f295b48009a8bb1f850462851395794d9b28bd90fa218b0df5b4676c?view#)
## Formatage du fichier
Le journal de bord sous forme de tableur peut etre édité sur un tableur Framacalc directement sur l'interface GarganText
REQUETE N°2
"Star Wars" AND "popular culture" AND (abstract :*)

Il faut convertir le tableur au format CSV avec lâoption de tĂ©lĂ©chargement « des valeurs sĂ©parĂ©es par des virgules ».

La carte du corpus personnalisĂ© au format CSV ressemble beaucoup Ă celle de la requĂȘte n°2 effectuĂ©e exclusivement sur ISTEX. Le terme « educational » a Ă©tĂ© remplacĂ© par « teachers ». Lâapparition du terme « cultural convergence » est intĂ©ressant pour relier « Star Wars » à « popular culture » afin de poursuivre la recherche de mot-clĂ©s.
## Liste de termes
A ce niveau de lâĂ©tude, le travail de la liste de termes (catĂ©gorie et regroupement) est primordial pour orienter la visualisation sur un angle spĂ©cifique du sujet de recherche. Ces termes se regroupent sur le modĂšle suivant : validĂ© (vert), suggĂ©rĂ© (noir), rejetĂ© (rouge barrĂ©).

# Carte finale - distance conditionnelle

La carte finale analyse le « journal de bord » (corpus personnalisé) qui regroupe les 15 résultats de la recherche ISTEX et 15 résultats de la recherche sur Isidore.
Dans ce corpus les termes pivots et mots-clés « learning », « popular culture » et « young people » ont été réparti sur trois clusters distincts.

La topologie des clusters est construite sur un modĂšle centralisĂ© (thĂ©orie des graphs), une architecture oĂč tous les sommets sont rattachĂ©s Ă un seul pĂŽle.
Cette répartition est intéressante pour identifier les publications qui sont rattachées spécifiquement à chaque mot-clé.

En fonction, de la liaison considérée, on va pouvoir naviguer dans les publications en associant deux termes comme « popular culture » et « star wars ».

Cette liaison regroupe 8 articles scientifiques comme celui sur Star Wars : les origines du mythe populaire qui pourrait alimenter une section sur lâinspiration mythologique de lâunivers de Star Wars.

Enfin, on remarque lâapparition dâun nouveau cluster sur la culture, la fiction populaire et les Ă©tudes des fans. Il serait intĂ©ressant dâexplorer davantage ce cluster pour comprendre lâimplication des communautĂ©s de fans dans la transmission de la culture populaire.

# Conclusion
Cette Ă©tude sur la problĂ©matique de « lâinfluence de lâunivers de Star Wars sur la culture populaire moderne chez les jeunes » a permis dâexplorer plusieurs bases de donnĂ©es comme ISTEX, HAL, OpenEdition, Cairn, Scielo, etc.
Un premier travail cartographique Ă partir du rĂ©servoir ISTEX sur la recherche de mots-clĂ©s a permis dâidentifier plusieurs termes pour prĂ©ciser lâangle de la recherche : « learning », « educational research », « teachers », « children », « young people », « adolescent », « fans studies », etc.
Cette exploration des mots-clĂ©s a permis dâĂ©tablir de nouvelles requĂȘtes plus prĂ©cises (cibler lâangle dâanalyse) en combinant plusieurs conditions de requĂȘte.
Une fois la requĂȘte fixĂ©e, on lâessaye sur plusieurs bases de donnĂ©es pour constituer un son corpus personnalisĂ© (journal de bord) au sein dâun tableur. Ce document sera ensuite exportĂ© au format CSV pour ĂȘtre importĂ© dans le logiciel Gargantext.
La carte finale rĂ©partie en quatre clusters rĂ©vĂšle quatre grandes sections thĂ©matiques permettant dâidentifier Ă chaque Ă©tape les publications clĂ©s.
Voici un exemple de rĂ©partition des parties qui pourraient ĂȘtre dĂ©veloppĂ©es pour rĂ©pondre Ă la problĂ©matique initiale :
- La culture populaire rattachée aux mythes antiques
- Lâinfluence des supports de diffusion (livre et film)
- Lâenseignement et les pratiques de recherche Ă©ducative chez les enfants et le jeunes
- Les études de fans sur la fiction populaire et la culture