Le programme ci-dessous permet de simuler des données dépendantes sur un graphe connu. Dans le contexte d'analyse de signaux EEG, il faut s'imaginer une donnée comme la valeur du signal EEG à un instant fixé. Chaque région cérébrale est représentée par un nœud du graphe et chaque connexion est représentée par une arête du graphe. Les valeurs simulées doivent l'être en respectant les dépendances induites par les connexions entre régions. La simulation est basée sur une loi de probabilité relative à ces valeurs, telle que la valeur d'un nœud est une moyenne des valeurs des nœuds voisins, plus un bruit. En réalité la problématique abordée ci-dessus en neurosciences relève plutôt d'un problème inverse : à partir de la valeur observée en chaque nœud, l'analyse statistique vise à retrouver le graphe des connexions. Une autre manière de voir le problème direct est de l'assimiler à un programme aléatoire qui part d'un graphe connu pour générer des données et le problème inverse, comme un programme qui part de données et vise à retrouver le graphe sous-jacent au problème direct.
Nous construisons ici un graphe à partir d'une configuration de points dans un espace en deux dimensions (chaque point étant repéré par une abscisse x et une ordonnée y). Il s'agit ici d'un graphe de Delaunay, qui est une collection de triangles ayant ces points pour sommets, telle qu'aucun point n'est à l'intérieur du cercle circonscrit d'un des triangles. Une définition plus détaillée est disponible sur https://fr.wikipedia.org/wiki/Triangulation_de_Delaunay Noter que d'autres approches seraient possibles - l'essentiel étant ici que l'on part d'un graphe connu avec pour objectif de simuler des valeurs en chacun des sommets du graphe (ci-dessous).
Choix du paramètre de dispersion tau, doit être compris entre 0.001 et 0.999.
La dépendance entre un point et ses voisins est d'autant plus forte que tau est proche de 0.999
Le graphe ci-dessous, dit "diagramme de Moran", vise à indiquer la dépendance entre la valeur d'un nœud et celle de ces voisins à la fois visuellement et via un indicateur numérique. L'idée est d'essayer de prédire la valeur d'un nœud (en ordonnées) à l'aide de la moyenne de ses voisins (en abscisses). S'il existe une relation linéaire entre les deux, le nuage de points doit suivre une orientation le long d'un axe non horizontal, représenté en rouge ici. Dans le cas contraire, le nuage de points est circulaire et/ou l'axe en rouge est horizontal. La corrélation indique l'intensité de la dépendance aux voisins.
Noter qu'on a utilisé une loi normale pour simuler les valeurs, cependant un en sens, chaque valeur simulée a une moyenne qui dépend de celle de ses voisins. Ceci n'est pas visible quand on trace l'histogramme de toutes les valeurs simulées : cet histogramme est visuellement semblable à celui qu'on aurait obtenu si toutes les valeurs avaient été simulées indépendamment des valeurs des voisins.
Moyenne empirique des valeurs simulées :