DataMining : Répartition des recherches concernant les documents « jeunesse »

Activité réalisée :

  • Activité d’analyse de données (DataVisualisation): Activité menée conjointement avec mon collègue Aristide Criquet.
  • Nous avons étudié le jeu de données fourni par la plateforme ouverte de données publiques françaises Data.gouv.fr afin de trier/classifier/représenter des données sur le thème des « 1000 titres les plus recherchés au catalogue des bibliothèque de la Mairie de Paris » (1er semestre 2014) . Par la suite, notre étude s’est focalisée sur le nombre de recherches concernant les documents réservés à la jeunesse entraînant pour cela les actions suivantes :
    • Identification et traitement des données
      • Filtrage des données sur les champs réservés à la jeunesse (colonne « support ») (sous OpenOffice Calc) :
      • Fusion de certains types de support (sous OpenOffice Calc) : Bande Dessinée jeunesse avec Bande Dessinée jeunesse > 12
        DVD jeunesse avec DVD-Vidéo > 12
        Livre de section jeunesse > 12 avec Livre jeunesse
      • Intégration dans un visualisateur graphique (avec DataWrapper)
      • Le document graphique réalisé (sous datawrapper)

Répartition des documents

    • Si l’on s’en réfère ainsi au graphique, on s’aperçoit que la recherche effectuée sur les livres occupe une place largement prioritaire, secondée par celle concernant les bandes dessinées.
    • Mais, la prospection de documents audios tels que les DVDs ainsi que les livres sonores reste marginale.
Publicités