Regroupements thématiques des cours du MPRI


Voici l'arbre phylogénétique des cours du MPRI, qui rapproche au sein d'un même sous-arbre des cours suivis par un même groupe d'élèves en 2005/2006.

Plus précisément, en prenant 2 cours, C1 et C2, et en notant n1 le nombre d'élèves ayant suivi (passé l'exam de) C1, n2 le nombre d'élèves ayant suivi C2, et n12 le nombre d'élèves ayant suivi les deux cours, on définit la distance entre les cours C1 et C2 comme d(C1,C2) = 1 - (n12/n1 + n12/n2) / 2.

La matrice de distance obtenue est alors codée au format nexus, et le fichier obtenu fourni en entrée du logiciel Splitstree qui reconstruit l'arbre phylogénétique qui permet de visualiser une certaine proximité thématique pour les cours d'un même sous-arbre (les élèves ont visiblement fait preuve d'une certaine cohérence en choisissant de suivre des cours similaires).

Arbre phylogénétique des cours du MPRI
Arbre phylogénétique des cours du MPRI réalisé avec Splitstree 4 [3], l'algorithme BioNJ [2],
puis une optimisation Daylight [1] pour le dessin de l'arbre. On peut remarquer la
séparation très claire entre le sous-arbre "algorithmique" et "programmation".


On peut faire la même chose pour les élèves, afin de savoir qui a suivi à peu près les mêmes cours : fichier nexus, arbre phylogénétique, un groupement d'élèves de Cachan apparaît sur la gauche. Suite à une remarque avisée de Maxime, je dénie toute responsabilité en cas d'utilisation de cet arbre pour un remix du film Le Couperet.

On peut aussi essayer de faire un "multidimensional scaling" (retrouver un positionnement 2D des points qui reflète le mieux possible la matrice des distances), mais l'image construite avec le logiciel PERMAP 11.5 à partir de ce fichier source semble moins expressive que l'arbre phylogénétique.


Bibliographie

[1] P. Gambette, D.H. Huson: Improved layout of phylogenetic networks, submitted, 2005.
[2] O. Gascuel: BIONJ: an improved version of the NJ algorithm based on a simple model of sequence data, Mol. Biol. Evol, 1997.
[3] D.H. Huson and D. Bryant: Application of Phylogenetic Networks in Evolutionary Studies, Molecular Biology and Evolution, 23(2):254-267, 2006, software available from http://www.splitstree.org.