# Cas Usage : Corpus STAR WARS Dès la requête dans les moteurs de recherche, l’utilisateur peut associer plusieurs mots clés pour définir clairement les conditions d’exploration : - Les paramètres booléens (AND/OR/NOT) et des guillemets, - La date de publication (publicationDate:[2010 TO *]), - Les auteurs (author.name:*) - La présence d’un résumé (abstract:*) - L'élimination des PDF image (qualityIndicators.pdfWordCount:[500 TO *]) Ces formulations ne sont pas reconnues par toutes les bases de données. Cela dépend du degrés d’enrichissement des métadonnées. La base ISTEX constitue l’un des réservoirs les plus garnis en métadonnées. Vous pouvez retrouver l’ensemble des fonctions présentent sur le démonstrateur ISTEX (un outil pédagogique grâce à la fonction de recherche avancée). L’outil de cartographie GarganText analyse les termes d’un corpus documentaire et propose à l’utilisateur plusieurs modèles de visualisation qu’il peut modifier. Quand on débute un travail d’exploration documentaire, une première recherche sur une base pluridisciplinaire comme HAL ou ISTEX permet de baliser les grandes axes (clusters) de l’étude documentaire. Problématique de recherche : quelle est l’influence de l’univers de « Star Wars » sur la culture populaire moderne chez les jeunes ? On réalise une première carte avec Gargantext sur le corpus ISTEX en indiquant comme mots-clés "Star Wars" pour explorer l’environnement large du sujet de recherche. On obtient la carte suivante organisée en 5 groupes de couleur (clusters) représentant chacun un regroupement thématique : un ensemble de termes proche dans l’univers de « Star Wars » (contexte, synonyme, etc.) ![](/uploads/upload_b0892d6a0bc6f43d27a1c44b589a5a62.png) La requête n’est pas assez fine pour donner des résultats pertinents et exploitables sur le sujet de recherche. Néanmoins, cette première requête permet de définir les grandes thématiques et de cibler plusieurs mots-clés pour améliorer la requête initiale. Termes pivots vs Mots-clés - Termes pivots : Les termes principaux de notre recherche déjà identifiés. Par exemple Star Wars, culture populaire, jeunes, etc. - Mots-clés : mots liés à nos termes pivots qui se trouvent généralement dans le même cluster et renseigne sur la nature de liaison. ## Etude des clusters A cette étape, l’objectif est de définir la thématique de chaque cluster et de déterminer les mots-clés qui pourraient être reliés au sujet d’étude. ![](/uploads/upload_f95e9261b32550998e1c3878188dffdb.png) Le cluster bleu foncé contient le termes pivot « Star Wars » dans ces points de liaison. Cet ensemble révèle essentiellement des mots-clés sur les thématiques de l’espace, de l’armée, de la politique, etc. Ce cluster est assez éloigné de notre sujet de recherche. ![](/uploads/upload_178bbf10c460ce487195e88ca4001ce9.png) Le cluster vert regroupe les termes techniques sur la vidéo, le montage, les effets spéciaux et les flux de données. On ne retrouve aucun terme pivot et il ne permet pas de valoriser notre angle d’analyse. ![](/uploads/upload_ec2230f2de37767489c9338bedcc190b.png) Le cluster bleu clair révèle la structuration de l’univers « Star Wars » et met en avant l’apprentissage, la connaissance, l’information, les concepts, etc. Ce regroupement est particulièrement intéressant puisque le terme « learning » peut se référer à la transmission de savoir auprès d’un jeune public. ![](/uploads/upload_b71bb70834e3c2a2505825b2d2dd5d24.png) Le cluster rouge fait référence au développement technologique, à la temporalité et à la science-fiction. Si l’on cible le point « science-fiction », on remarque l’apparition pour la première fois du terme pivot « popular culture ». Ce dernier ne possède qu’une unique liaison avec le mot-clé « science-fiction ». Néanmoins, on retrouve le mot-clé « education » qui n’a pas de liaison directe avec le terme pivot « popular culture » mais se situe dans le même environnement spatial. ![](/uploads/upload_b16fddd04bd778e183c4d81fb9deace8.png) Enfin, le cluster jaune s’intéresse à l’identité des protagonistes et de leur mise en scène (film, livre et jeux vidéo). Par rapport au sujet initial, il serait intéressant d’affiner la prochaine requête avec un mot clé sur le public visé comme « children » pour faire apparaitre des points de liaison avec le cluster rouge. Cette première exploration large permet de délimiter les thématiques du sujet de recherche et de repérer de nouveaux types de mots clés pour affiner la recherche initiale # Explorer des bases de données ## Moteur de recherche ISTEX (pluridisciplinaire) Utilisation du démonstrateur ISTEX (www.demo.istex.fr), un outil pédagogique de construction de requête informatique, pour affiner la requête initiale. Réalisation de nouvelles requêtes/cartes pour interpréter les nouvelles relations entre les mots-clés identifiés sur la première carte dans trois clusters différents : « popular culture », « learning » et « children ». REQUETE N°2 "Star Wars" AND "popular culture" AND (abstract:*) ![](/uploads/upload_5badd4477a9dbcc01d0925c723d0ef47.png) La seconde requête permet d’étudier la spatialisation et les liaisons des mots-clés qui relient « Star Wars » à « culture populaire ». L’objectif est de trouver des liens directs ou d’identifier des mots-clés en communs qui permettrait de les relier entre eux. Les trois mots-clés identifiés sur la carte précédente sont spatialement proches. C’est le mot « educationnal research » qui se rapproche le plus du terme « learning » et qui fait la liaison avec la « popular culture », « children » et « young people ». Pour réussir à les relier directement, il faut préciser une nouvelle fois la requête d’exploration. Nous allons préférer cibler « young people » plutôt que « children » pour orienter la liaison vers la liaison sur le référentiel des « popular film ». REQUET N°3 "Star Wars" AND "popular culture" AND "young people" AND (abstract:*) AND qualityIndicators.pdfWordCount:[500 TO *] ![](/uploads/upload_2fda8fcf1fa6718dfe871746a6568a5b.png) La troisième requête révèle un résultat particulièrement intéressant puisqu’il réunit termes pivots et mots-clés identifiés au sein d’un même cluster. En effet, le mot « popular culture » est directement lié à « learning » qui lui-même est rattaché à « children » et à « educationnal research ». Les deux nouvelles requêtes sont intéressantes et exploitables. L’étape suivante est de les tester sur d’autres bases de données et de compléter au fur et mesure un tableur CSV comme un « journal de bord ». ## Moteur de recherche Isidore (SHS) Le sujet choisi est davantage une thématique de SHS. Le premier réflexe est d’utiliser le moteur de recherche Isidore de la TGIR Huma-Num qui regroupe les résultats de plusieurs bases de données en SHS. ![](/uploads/upload_3caae31654925be2b3c1eb4eca9057b7.png) La requête sur Isidore donne 93 résultats repartis sur plusieurs plateformes comme OpenEdition, Scielo, HAL, Thèse.fr, etc. En explorant plus en détail les ressources signalées dans Isidore, on effectue un premier filtre pour garder les publications d’intérêt puisque la sélection n’est pas encore terminée. # Importer un tableur au format CSV Le tableur va permettre à l’opérateur de tenir un journal de bord pour développer son propre corpus de données. En effet, il est possible d’utiliser la puissance de calcul et de traitement de Gargantext pour analyser un corpus autre que ceux proposés dans la liste des bases de données interrogeables. Puis de venir agréger les résultats dans le tableur. Il suffit de compléter une feuille de calcul sous le modèle d’un export de corpus Gargantext qui se présente en sept colonnes principales (peu importe l’ordre) : * Colonne 1 "title" : titre de la publication * Colonne 2 "abstract" : résumé de la publication * Colonne 3 "authors" : auteurs de la publication * Colonne 4 "source" : éditeur ou la revue de la publication * Colonne 5 "publication_year" : année de publication * Colonne 6 "publication_month" : mois de publication * Colonne 7 "publication_day" : jour de publication [Le détail précis de l'import de fichiers CSV se trouve sur cette page](https://write.frame.gargantext.org/970190a1f295b48009a8bb1f850462851395794d9b28bd90fa218b0df5b4676c?view#) ## Formatage du fichier Le journal de bord sous forme de tableur peut etre édité sur un tableur Framacalc directement sur l'interface GarganText REQUETE N°2 "Star Wars" AND "popular culture" AND (abstract :*) ![](/uploads/upload_fa6926c36da5e26d494957ca4c557797.png) Il faut convertir le tableur au format CSV avec l’option de téléchargement « des valeurs séparées par des virgules ». ![](/uploads/upload_768f9204486e34955b1af020669a3683.png) La carte du corpus personnalisé au format CSV ressemble beaucoup à celle de la requête n°2 effectuée exclusivement sur ISTEX. Le terme « educational » a été remplacé par « teachers ». L’apparition du terme « cultural convergence » est intéressant pour relier « Star Wars » à « popular culture » afin de poursuivre la recherche de mot-clés. ## Liste de termes A ce niveau de l’étude, le travail de la liste de termes (catégorie et regroupement) est primordial pour orienter la visualisation sur un angle spécifique du sujet de recherche. Ces termes se regroupent sur le modèle suivant : validé (vert), suggéré (noir), rejeté (rouge barré). ![](/uploads/upload_30aff70a58f23588472ff4e80a3c3d3f.png) # Carte finale - distance conditionnelle ![](/uploads/upload_72e2016575a3eb77bc9fcc0f55d1f3c3.png) La carte finale analyse le « journal de bord » (corpus personnalisé) qui regroupe les 15 résultats de la recherche ISTEX et 15 résultats de la recherche sur Isidore. Dans ce corpus les termes pivots et mots-clés « learning », « popular culture » et « young people » ont été réparti sur trois clusters distincts. ![](/uploads/upload_f8e7663aa7547b03e68e6cde07b5cfeb.png) La topologie des clusters est construite sur un modèle centralisé (théorie des graphs), une architecture où tous les sommets sont rattachés à un seul pôle. Cette répartition est intéressante pour identifier les publications qui sont rattachées spécifiquement à chaque mot-clé. ![](/uploads/upload_6fb25ed304f054ea2107590f730676e8.png) En fonction, de la liaison considérée, on va pouvoir naviguer dans les publications en associant deux termes comme « popular culture » et « star wars ». ![](/uploads/upload_62b7c5275d4c652b2e201b02155a03f6.png) Cette liaison regroupe 8 articles scientifiques comme celui sur Star Wars : les origines du mythe populaire qui pourrait alimenter une section sur l’inspiration mythologique de l’univers de Star Wars. ![](/uploads/upload_db7c35c94fc9c316b6349fc0932f51f3.png) Enfin, on remarque l’apparition d’un nouveau cluster sur la culture, la fiction populaire et les études des fans. Il serait intéressant d’explorer davantage ce cluster pour comprendre l’implication des communautés de fans dans la transmission de la culture populaire. ![](/uploads/upload_94998268d485f6bd4df4a6fab52e395c.png) # Conclusion Cette étude sur la problématique de « l’influence de l’univers de Star Wars sur la culture populaire moderne chez les jeunes » a permis d’explorer plusieurs bases de données comme ISTEX, HAL, OpenEdition, Cairn, Scielo, etc. Un premier travail cartographique à partir du réservoir ISTEX sur la recherche de mots-clés a permis d’identifier plusieurs termes pour préciser l’angle de la recherche : « learning », « educational research », « teachers », « children », « young people », « adolescent », « fans studies », etc. Cette exploration des mots-clés a permis d’établir de nouvelles requêtes plus précises (cibler l’angle d’analyse) en combinant plusieurs conditions de requête. Une fois la requête fixée, on l’essaye sur plusieurs bases de données pour constituer un son corpus personnalisé (journal de bord) au sein d’un tableur. Ce document sera ensuite exporté au format CSV pour être importé dans le logiciel Gargantext. La carte finale répartie en quatre clusters révèle quatre grandes sections thématiques permettant d’identifier à chaque étape les publications clés. Voici un exemple de répartition des parties qui pourraient être développées pour répondre à la problématique initiale : - La culture populaire rattachée aux mythes antiques - L’influence des supports de diffusion (livre et film) - L’enseignement et les pratiques de recherche éducative chez les enfants et le jeunes - Les études de fans sur la fiction populaire et la culture
{}