Différences entre les versions de « Initiation à la création d’un graphe de connaissances »

De WIKOM

Ligne 8 : Ligne 8 :
=== Premier Jeu de données : Liste des CNPEs ===
=== Premier Jeu de données : Liste des CNPEs ===
Le premier jeu de données est en lien avec le [https://fr.wikipedia.org/wiki/Liste_des_r%C3%A9acteurs_nucl%C3%A9aires_en_France Parc Nucléaire de Production Français].
Le premier jeu de données est en lien avec le [https://fr.wikipedia.org/wiki/Liste_des_r%C3%A9acteurs_nucl%C3%A9aires_en_France Parc Nucléaire de Production Français].
[[Fichier:WikipediaCNPEs.jpg|alt=Fiche Wikipédia CNPEs|centré|cadre|Fiche Wikipédia CNPEs]]




A partir de la page wikipédia ci dessus et des pages afférentes le jeu de données :  
A partir de la page wikipédia ci dessus et des pages afférentes le jeu de données :  
 
[[Fichier:CNPEsCSV.jpg|centré|cadre|CNPE en csv]]
 
Disponible au format csv ici : [https://docs.google.com/spreadsheets/d/e/2PACX-1vRmy95-d9KoFcDtsC9t4VTDPRF2ZG2cWaa4BSj3kRVFtSUGxZRw186SsgQvF7RZYv1J96tUFOVu7Tr6/pub?output=csv]
 
Disponible ici au format csv : <nowiki>https://docs.google.com/spreadsheets/d/e/2PACX-1vRmy95-d9KoFcDtsC9t4VTDPRF2ZG2cWaa4BSj3kRVFtSUGxZRw186SsgQvF7RZYv1J96tUFOVu7Tr6/pub?output=csv</nowiki>


Les en-têtes de colonnes sont les suivantes :  
Les en-têtes de colonnes sont les suivantes :  
Ligne 34 : Ligne 33 :
* longitude,
* longitude,
* latitude
* latitude
=== Concevoir le modèle de connaissances ===
=== Concevoir le modèle de connaissances ===
A partir d’une analyse des colonnes et de leur contenu il s’agit identifier les types de noeuds que vous souhaitez créer ainsi que les relations liants ces derniers.  
A partir d’une analyse des colonnes et de leur contenu il s’agit identifier les types de noeuds que vous souhaitez créer ainsi que les relations liants ces derniers.  


Il s’agit d’identifier les objets élémentaires qui vont permettre que votre graphe de connaissance soit une représentation la plus riche possible à partir des données disponibles. Regarder les colonnes et leur contenu est une bonne stratégie. Par exemple, employez Excel pour explorer les données avec les filtres automatiques.
Il s’agit d’identifier les objets élémentaires qui vont permettre que votre graphe de connaissance soit une représentation la plus riche possible à partir des données disponibles. Regarder les colonnes et leur contenu est une bonne stratégie. Par exemple, employez Excel pour explorer les données avec les filtres automatiques.
 
[[Fichier:ExcelCNPEs.jpg|centré|cadre|Données CNPE dans Excel]]
 
Vous pouvez dessiner votre modèle à la main ou dans un éditeur graphique de votre choix :  
Vous pouvez dessiner votre modèle à la main ou dans un éditeur graphique de votre choix :  



Version du 16 janvier 2022 à 22:21

Objectif

L’objectif est de vous initier à la création d’un graphe de connaissances en exploitant la technologie Neo4J. Il s’agit à partir d’un jeu de données de créer un modèle de connaissances et à partir de ces deux éléments de charger la base de graphe.

Préparer son environnement de travail

Concevoir un modèle de connaissances

Premier Jeu de données : Liste des CNPEs

Le premier jeu de données est en lien avec le Parc Nucléaire de Production Français.

Fiche Wikipédia CNPEs
Fiche Wikipédia CNPEs


A partir de la page wikipédia ci dessus et des pages afférentes le jeu de données :

CNPE en csv

Disponible au format csv ici : [1]

Les en-têtes de colonnes sont les suivantes :

  • Trigramme_centrale,
  • Centrale_nucleaire,
  • Commune,
  • Département,
  • id_reacteur,
  • Nom_du_reacteur,
  • Rang,
  • Palier,
  • Puissance_therm_MWt,
  • Puissance_brute_MWe,
  • Puissance_nette_MWe,
  • Debut_construction,
  • Raccordement_au_reseau,
  • Mise_en_service,
  • longitude,
  • latitude

Concevoir le modèle de connaissances

A partir d’une analyse des colonnes et de leur contenu il s’agit identifier les types de noeuds que vous souhaitez créer ainsi que les relations liants ces derniers.

Il s’agit d’identifier les objets élémentaires qui vont permettre que votre graphe de connaissance soit une représentation la plus riche possible à partir des données disponibles. Regarder les colonnes et leur contenu est une bonne stratégie. Par exemple, employez Excel pour explorer les données avec les filtres automatiques.

Données CNPE dans Excel

Vous pouvez dessiner votre modèle à la main ou dans un éditeur graphique de votre choix :

  • Powerpoint
  • Yedgraph : https://www.yworks.com/products/yed
  • Mermaid.js : https://mermaid-js.github.io/mermaid-live-editor/
  • viz.js : http://viz-js.com/
  • Xmind : https://www.xmind.net/
  • ….

Indice  : Il faut penser des phrases (sujet)(“verbe”)(“complement”) à partir des données disponibles.

Par exemple, à partir des colonnes “commune” et “département” je peux déduire :