Regroupements thématiques des cours du MPRI
Voici l'
arbre phylogénétique des cours
du MPRI, qui rapproche au sein d'un même sous-arbre
des cours suivis par un même groupe d'élèves en 2005/2006.
Plus précisément, en prenant 2 cours,
C1 et
C2, et en
notant
n1 le nombre d'élèves ayant suivi (passé l'exam de)
C1,
n2 le nombre d'élèves ayant suivi
C2, et
n12 le nombre d'élèves ayant suivi
les deux cours, on définit la distance entre les cours
C1 et
C2 comme
d(
C1,
C2) = 1 -
(
n12/
n1 +
n12/
n2) / 2.
La matrice de distance obtenue est alors codée
au format nexus,
et le fichier obtenu fourni en entrée du logiciel
Splitstree
qui reconstruit l'arbre phylogénétique qui permet de visualiser une certaine
proximité thématique
pour les cours d'un même sous-arbre (les élèves ont visiblement fait preuve d'une certaine
cohérence en choisissant de suivre des cours similaires).

Arbre phylogénétique des
cours du MPRI réalisé
avec Splitstree 4 [3], l'algorithme BioNJ [2],
puis une optimisation Daylight [1] pour le dessin de l'arbre. On peut remarquer la
séparation très claire entre le sous-arbre "algorithmique" et "programmation".
On peut faire la même chose
pour les élèves, afin de savoir qui a suivi à peu près les mêmes cours :
fichier nexus,
arbre phylogénétique, un groupement
d'élèves de Cachan apparaît sur la gauche. Suite à une remarque avisée
de
Maxime, je dénie toute
responsabilité en cas d'utilisation de cet arbre pour un remix du
film
Le Couperet.
On peut aussi essayer de faire un "multidimensional scaling" (retrouver un positionnement 2D des points qui reflète le mieux possible la matrice des distances), mais l'
image construite avec le logiciel
PERMAP 11.5 à partir de
ce fichier source semble moins expressive que l'arbre phylogénétique.
Bibliographie
[1] P. Gambette, D.H. Huson:
Improved layout of phylogenetic networks, submitted, 2005.
[2] O. Gascuel:
BIONJ: an improved version of the NJ algorithm based on a simple model of sequence data, Mol. Biol. Evol, 1997.
[3] D.H. Huson and D. Bryant:
Application of Phylogenetic Networks in Evolutionary Studies, Molecular Biology and Evolution, 23(2):254-267, 2006, software available from
http://www.splitstree.org.