293 views
# 🐉 2.1. Le Corpus STAR WARS DĂšs la requĂȘte dans les moteurs de recherche, l’utilisateur peut associer plusieurs mots clĂ©s pour dĂ©finir clairement les conditions d’exploration : - Les paramĂštres boolĂ©ens (AND/OR/NOT) et des guillemets, - La date de publication (publicationDate:[2010 TO *]), - Les auteurs (author.name:*) - La prĂ©sence d’un rĂ©sumĂ© (abstract:*) - L'Ă©limination des PDF image (qualityIndicators.pdfWordCount:[500 TO *]) Ces formulations ne sont pas reconnues par toutes les bases de donnĂ©es. Cela dĂ©pend du degrĂ©s d’enrichissement des mĂ©tadonnĂ©es. La base ISTEX constitue l’un des rĂ©servoirs les plus garnis en mĂ©tadonnĂ©es. Vous pouvez retrouver l’ensemble des fonctions prĂ©sentent sur le dĂ©monstrateur ISTEX (un outil pĂ©dagogique grĂące Ă  la fonction de recherche avancĂ©e). L’outil de cartographie GarganText analyse les termes d’un corpus documentaire et propose Ă  l’utilisateur plusieurs modĂšles de visualisation qu’il peut modifier. Quand on dĂ©bute un travail d’exploration documentaire, une premiĂšre recherche sur une base pluridisciplinaire comme HAL ou ISTEX permet de baliser les grandes axes (clusters) de l’étude documentaire. ProblĂ©matique de recherche : quelle est l’influence de l’univers de « Star Wars » sur la culture populaire moderne chez les jeunes ? On rĂ©alise une premiĂšre carte avec Gargantext sur le corpus ISTEX en indiquant comme mots-clĂ©s "Star Wars" pour explorer l’environnement large du sujet de recherche. On obtient la carte suivante organisĂ©e en 5 groupes de couleur (clusters) reprĂ©sentant chacun un regroupement thĂ©matique : un ensemble de termes proche dans l’univers de « Star Wars » (contexte, synonyme, etc.) ![](/uploads/upload_b0892d6a0bc6f43d27a1c44b589a5a62.png) La requĂȘte n’est pas assez fine pour donner des rĂ©sultats pertinents et exploitables sur le sujet de recherche. NĂ©anmoins, cette premiĂšre requĂȘte permet de dĂ©finir les grandes thĂ©matiques et de cibler plusieurs mots-clĂ©s pour amĂ©liorer la requĂȘte initiale. Termes pivots vs Mots-clĂ©s - Termes pivots : Les termes principaux de notre recherche dĂ©jĂ  identifiĂ©s. Par exemple Star Wars, culture populaire, jeunes, etc. - Mots-clĂ©s : mots liĂ©s Ă  nos termes pivots qui se trouvent gĂ©nĂ©ralement dans le mĂȘme cluster et renseigne sur la nature de liaison. ## Etude des clusters A cette Ă©tape, l’objectif est de dĂ©finir la thĂ©matique de chaque cluster et de dĂ©terminer les mots-clĂ©s qui pourraient ĂȘtre reliĂ©s au sujet d’étude. ![](/uploads/upload_f95e9261b32550998e1c3878188dffdb.png) Le cluster bleu foncĂ© contient le termes pivot « Star Wars » dans ces points de liaison. Cet ensemble rĂ©vĂšle essentiellement des mots-clĂ©s sur les thĂ©matiques de l’espace, de l’armĂ©e, de la politique, etc. Ce cluster est assez Ă©loignĂ© de notre sujet de recherche. ![](/uploads/upload_178bbf10c460ce487195e88ca4001ce9.png) Le cluster vert regroupe les termes techniques sur la vidĂ©o, le montage, les effets spĂ©ciaux et les flux de donnĂ©es. On ne retrouve aucun terme pivot et il ne permet pas de valoriser notre angle d’analyse. ![](/uploads/upload_ec2230f2de37767489c9338bedcc190b.png) Le cluster bleu clair rĂ©vĂšle la structuration de l’univers « Star Wars » et met en avant l’apprentissage, la connaissance, l’information, les concepts, etc. Ce regroupement est particuliĂšrement intĂ©ressant puisque le terme « learning » peut se rĂ©fĂ©rer Ă  la transmission de savoir auprĂšs d’un jeune public. ![](/uploads/upload_b71bb70834e3c2a2505825b2d2dd5d24.png) Le cluster rouge fait rĂ©fĂ©rence au dĂ©veloppement technologique, Ă  la temporalitĂ© et Ă  la science-fiction. Si l’on cible le point « science-fiction », on remarque l’apparition pour la premiĂšre fois du terme pivot « popular culture ». Ce dernier ne possĂšde qu’une unique liaison avec le mot-clĂ© « science-fiction ». NĂ©anmoins, on retrouve le mot-clĂ© « education » qui n’a pas de liaison directe avec le terme pivot « popular culture » mais se situe dans le mĂȘme environnement spatial. ![](/uploads/upload_b16fddd04bd778e183c4d81fb9deace8.png) Enfin, le cluster jaune s’intĂ©resse Ă  l’identitĂ© des protagonistes et de leur mise en scĂšne (film, livre et jeux vidĂ©o). Par rapport au sujet initial, il serait intĂ©ressant d’affiner la prochaine requĂȘte avec un mot clĂ© sur le public visĂ© comme « children » pour faire apparaitre des points de liaison avec le cluster rouge. Cette premiĂšre exploration large permet de dĂ©limiter les thĂ©matiques du sujet de recherche et de repĂ©rer de nouveaux types de mots clĂ©s pour affiner la recherche initiale # Explorer des bases de donnĂ©es ## Moteur de recherche ISTEX (pluridisciplinaire) Utilisation du dĂ©monstrateur ISTEX (www.demo.istex.fr), un outil pĂ©dagogique de construction de requĂȘte informatique, pour affiner la requĂȘte initiale. RĂ©alisation de nouvelles requĂȘtes/cartes pour interprĂ©ter les nouvelles relations entre les mots-clĂ©s identifiĂ©s sur la premiĂšre carte dans trois clusters diffĂ©rents : « popular culture », « learning » et « children ». REQUETE N°2 "Star Wars" AND "popular culture" AND (abstract:*) ![](/uploads/upload_5badd4477a9dbcc01d0925c723d0ef47.png) La seconde requĂȘte permet d’étudier la spatialisation et les liaisons des mots-clĂ©s qui relient « Star Wars » Ă  « culture populaire ». L’objectif est de trouver des liens directs ou d’identifier des mots-clĂ©s en communs qui permettrait de les relier entre eux. Les trois mots-clĂ©s identifiĂ©s sur la carte prĂ©cĂ©dente sont spatialement proches. C’est le mot « educationnal research » qui se rapproche le plus du terme « learning » et qui fait la liaison avec la « popular culture », « children » et « young people ». Pour rĂ©ussir Ă  les relier directement, il faut prĂ©ciser une nouvelle fois la requĂȘte d’exploration. Nous allons prĂ©fĂ©rer cibler « young people » plutĂŽt que « children » pour orienter la liaison vers la liaison sur le rĂ©fĂ©rentiel des « popular film ». REQUET N°3 "Star Wars" AND "popular culture" AND "young people" AND (abstract:*) AND qualityIndicators.pdfWordCount:[500 TO *] ![](/uploads/upload_2fda8fcf1fa6718dfe871746a6568a5b.png) La troisiĂšme requĂȘte rĂ©vĂšle un rĂ©sultat particuliĂšrement intĂ©ressant puisqu’il rĂ©unit termes pivots et mots-clĂ©s identifiĂ©s au sein d’un mĂȘme cluster. En effet, le mot « popular culture » est directement liĂ© Ă  « learning » qui lui-mĂȘme est rattachĂ© Ă  « children » et Ă  « educationnal research ». Les deux nouvelles requĂȘtes sont intĂ©ressantes et exploitables. L’étape suivante est de les tester sur d’autres bases de donnĂ©es et de complĂ©ter au fur et mesure un tableur CSV comme un « journal de bord ». ## Moteur de recherche Isidore (SHS) Le sujet choisi est davantage une thĂ©matique de SHS. Le premier rĂ©flexe est d’utiliser le moteur de recherche Isidore de la TGIR Huma-Num qui regroupe les rĂ©sultats de plusieurs bases de donnĂ©es en SHS. ![](/uploads/upload_3caae31654925be2b3c1eb4eca9057b7.png) La requĂȘte sur Isidore donne 93 rĂ©sultats repartis sur plusieurs plateformes comme OpenEdition, Scielo, HAL, ThĂšse.fr, etc. En explorant plus en dĂ©tail les ressources signalĂ©es dans Isidore, on effectue un premier filtre pour garder les publications d’intĂ©rĂȘt puisque la sĂ©lection n’est pas encore terminĂ©e. # Importer un tableur au format CSV Le tableur va permettre Ă  l’opĂ©rateur de tenir un journal de bord pour dĂ©velopper son propre corpus de donnĂ©es. En effet, il est possible d’utiliser la puissance de calcul et de traitement de Gargantext pour analyser un corpus autre que ceux proposĂ©s dans la liste des bases de donnĂ©es interrogeables. Puis de venir agrĂ©ger les rĂ©sultats dans le tableur. Il suffit de complĂ©ter une feuille de calcul sous le modĂšle d’un export de corpus Gargantext qui se prĂ©sente en sept colonnes principales (peu importe l’ordre) : * Colonne 1 "title" : titre de la publication * Colonne 2 "abstract" : rĂ©sumĂ© de la publication * Colonne 3 "authors" : auteurs de la publication * Colonne 4 "source" : Ă©diteur ou la revue de la publication * Colonne 5 "publication_year" : annĂ©e de publication * Colonne 6 "publication_month" : mois de publication * Colonne 7 "publication_day" : jour de publication [Le dĂ©tail prĂ©cis de l'import de fichiers CSV se trouve sur cette page](https://write.frame.gargantext.org/970190a1f295b48009a8bb1f850462851395794d9b28bd90fa218b0df5b4676c?view#) ## Formatage du fichier Le journal de bord sous forme de tableur peut etre Ă©ditĂ© sur un tableur Framacalc directement sur l'interface GarganText REQUETE N°2 "Star Wars" AND "popular culture" AND (abstract :*) ![](/uploads/upload_fa6926c36da5e26d494957ca4c557797.png) Il faut convertir le tableur au format CSV avec l’option de tĂ©lĂ©chargement « des valeurs sĂ©parĂ©es par des virgules ». ![](/uploads/upload_768f9204486e34955b1af020669a3683.png) La carte du corpus personnalisĂ© au format CSV ressemble beaucoup Ă  celle de la requĂȘte n°2 effectuĂ©e exclusivement sur ISTEX. Le terme « educational » a Ă©tĂ© remplacĂ© par « teachers ». L’apparition du terme « cultural convergence » est intĂ©ressant pour relier « Star Wars » Ă  « popular culture » afin de poursuivre la recherche de mot-clĂ©s. ## Liste de termes A ce niveau de l’étude, le travail de la liste de termes (catĂ©gorie et regroupement) est primordial pour orienter la visualisation sur un angle spĂ©cifique du sujet de recherche. Ces termes se regroupent sur le modĂšle suivant : validĂ© (vert), suggĂ©rĂ© (noir), rejetĂ© (rouge barrĂ©). ![](/uploads/upload_30aff70a58f23588472ff4e80a3c3d3f.png) # Carte finale - distance conditionnelle ![](/uploads/upload_72e2016575a3eb77bc9fcc0f55d1f3c3.png) La carte finale analyse le « journal de bord » (corpus personnalisĂ©) qui regroupe les 15 rĂ©sultats de la recherche ISTEX et 15 rĂ©sultats de la recherche sur Isidore. Dans ce corpus les termes pivots et mots-clĂ©s « learning », « popular culture » et « young people » ont Ă©tĂ© rĂ©parti sur trois clusters distincts. ![](/uploads/upload_f8e7663aa7547b03e68e6cde07b5cfeb.png) La topologie des clusters est construite sur un modĂšle centralisĂ© (thĂ©orie des graphs), une architecture oĂč tous les sommets sont rattachĂ©s Ă  un seul pĂŽle. Cette rĂ©partition est intĂ©ressante pour identifier les publications qui sont rattachĂ©es spĂ©cifiquement Ă  chaque mot-clĂ©. ![](/uploads/upload_6fb25ed304f054ea2107590f730676e8.png) En fonction, de la liaison considĂ©rĂ©e, on va pouvoir naviguer dans les publications en associant deux termes comme « popular culture » et « star wars ». ![](/uploads/upload_62b7c5275d4c652b2e201b02155a03f6.png) Cette liaison regroupe 8 articles scientifiques comme celui sur Star Wars : les origines du mythe populaire qui pourrait alimenter une section sur l’inspiration mythologique de l’univers de Star Wars. ![](/uploads/upload_db7c35c94fc9c316b6349fc0932f51f3.png) Enfin, on remarque l’apparition d’un nouveau cluster sur la culture, la fiction populaire et les Ă©tudes des fans. Il serait intĂ©ressant d’explorer davantage ce cluster pour comprendre l’implication des communautĂ©s de fans dans la transmission de la culture populaire. ![](/uploads/upload_94998268d485f6bd4df4a6fab52e395c.png) # Conclusion Cette Ă©tude sur la problĂ©matique de « l’influence de l’univers de Star Wars sur la culture populaire moderne chez les jeunes » a permis d’explorer plusieurs bases de donnĂ©es comme ISTEX, HAL, OpenEdition, Cairn, Scielo, etc. Un premier travail cartographique Ă  partir du rĂ©servoir ISTEX sur la recherche de mots-clĂ©s a permis d’identifier plusieurs termes pour prĂ©ciser l’angle de la recherche : « learning », « educational research », « teachers », « children », « young people », « adolescent », « fans studies », etc. Cette exploration des mots-clĂ©s a permis d’établir de nouvelles requĂȘtes plus prĂ©cises (cibler l’angle d’analyse) en combinant plusieurs conditions de requĂȘte. Une fois la requĂȘte fixĂ©e, on l’essaye sur plusieurs bases de donnĂ©es pour constituer un son corpus personnalisĂ© (journal de bord) au sein d’un tableur. Ce document sera ensuite exportĂ© au format CSV pour ĂȘtre importĂ© dans le logiciel Gargantext. La carte finale rĂ©partie en quatre clusters rĂ©vĂšle quatre grandes sections thĂ©matiques permettant d’identifier Ă  chaque Ă©tape les publications clĂ©s. Voici un exemple de rĂ©partition des parties qui pourraient ĂȘtre dĂ©veloppĂ©es pour rĂ©pondre Ă  la problĂ©matique initiale : - La culture populaire rattachĂ©e aux mythes antiques - L’influence des supports de diffusion (livre et film) - L’enseignement et les pratiques de recherche Ă©ducative chez les enfants et le jeunes - Les Ă©tudes de fans sur la fiction populaire et la culture