Introduction
Cet article présente les principes fondamentaux des scores d'isnulation, une méthode développée par le laboratoire Dekker pour caractériser les domaines d'association topologique (TAD) dans les données Hi-C. Nous détaillons le processus de calcul et son application pratique.
Définition
Le score d'insulation a été introduit dans une publication de Nature en 2015, intitulée « Condensin-driven remodelling of X chromosome topology during dosage compensation ». Il sert principalement à identifier les frontières des TAD en mesurant l'isolation entre régions génomiques.
Méthode de Calcul
Calcul du Score d'Insulation
En parcourant la matrice d'interaction le long de la diagonale, une fenêtre carrée glissante est utilisée pour sommer les valeurs d'interaction dans chaque segment. Les régions aux frontières des TAD présentent des scores faibles, tandis que l'intérieur des TAD affiche des scores élevés. Les minima de ces scores correspondent aux limites potentielles des TAD.
Normalisation du Score
Le score d'insulation est normalisé en le divisant par la moyenne de tous les scores, notée ISavg, pour obtenir une valeur relative facilitant la comparaison entre échantillons.
Calcul des Valeurs Delta
Pour identifier les vallées dans le profil du score d'insulation, on calcule une valeur delta pour chaque bin en utilisant une fenêtre définie. Les points où la courbe delta traverse l'axe horizontal indiquent les positions des frontières des TAD.
Détermination des TAD
Les frontières identifiées permettent de délimiter les domaines des TAD, nécessitant une transformation supplémentaire pour obtenir les coordonnées exactes des régions.
Application Pratique avec FAN-C
Installation
Installer FAN-C via pip ou conda pour l'analyce des scores d'insulation.
pip install fanc -i https://pypi.tuna.tsinghua.edu.cn/simple
Alternative avec conda :
conda create -n environnement_fanc python=3.8
conda activate environnement_fanc
conda install -c bioconda fanc
Exemple de Calcul
Calculer les scores d'insulation avec différentes tailles de fenêtres et exporter en format BED.
fanc insulation ./donnees.hic ./resultats.insulation \
-w 1000000 2000000 3000000 4000000 \
-f bed
Visualisation
Générer un graphique de l'intensité des frontières des TAD pour évaluer l'isolation entre domaines.
fancplot -o ./carte_insulation.png chr18:18mb-28mb \
-p ./donnees.hic -m 3000000 -vmin 0 -vmax 0.06 \
-p ./resultats.insulation
Créer une courbe comparative pour différentes tailles de fenêtres.
fancplot --largeur 7 -o ./comparaison.png \
chr18:18mb-28mb -p triangular ./donnees.hic -m 3000000 \
-vmin 0 -vmax 0.06 -p line ./resultats_1mb.bed \
./resultats_2mb.bed -l "1Mo" "2Mo"