Calcul et Analyse des Scores d'Insulation pour la Détection des TAD

Introduction

Cet article présente les principes fondamentaux des scores d'isnulation, une méthode développée par le laboratoire Dekker pour caractériser les domaines d'association topologique (TAD) dans les données Hi-C. Nous détaillons le processus de calcul et son application pratique.

Définition

Le score d'insulation a été introduit dans une publication de Nature en 2015, intitulée « Condensin-driven remodelling of X chromosome topology during dosage compensation ». Il sert principalement à identifier les frontières des TAD en mesurant l'isolation entre régions génomiques.

Méthode de Calcul

Calcul du Score d'Insulation

En parcourant la matrice d'interaction le long de la diagonale, une fenêtre carrée glissante est utilisée pour sommer les valeurs d'interaction dans chaque segment. Les régions aux frontières des TAD présentent des scores faibles, tandis que l'intérieur des TAD affiche des scores élevés. Les minima de ces scores correspondent aux limites potentielles des TAD.

Normalisation du Score

Le score d'insulation est normalisé en le divisant par la moyenne de tous les scores, notée ISavg, pour obtenir une valeur relative facilitant la comparaison entre échantillons.

Calcul des Valeurs Delta

Pour identifier les vallées dans le profil du score d'insulation, on calcule une valeur delta pour chaque bin en utilisant une fenêtre définie. Les points où la courbe delta traverse l'axe horizontal indiquent les positions des frontières des TAD.

Détermination des TAD

Les frontières identifiées permettent de délimiter les domaines des TAD, nécessitant une transformation supplémentaire pour obtenir les coordonnées exactes des régions.

Application Pratique avec FAN-C

Installation

Installer FAN-C via pip ou conda pour l'analyce des scores d'insulation.

pip install fanc -i https://pypi.tuna.tsinghua.edu.cn/simple

Alternative avec conda :

conda create -n environnement_fanc python=3.8
conda activate environnement_fanc
conda install -c bioconda fanc

Exemple de Calcul

Calculer les scores d'insulation avec différentes tailles de fenêtres et exporter en format BED.

fanc insulation ./donnees.hic ./resultats.insulation \
-w 1000000 2000000 3000000 4000000 \
-f bed

Visualisation

Générer un graphique de l'intensité des frontières des TAD pour évaluer l'isolation entre domaines.

fancplot -o ./carte_insulation.png chr18:18mb-28mb \
-p ./donnees.hic -m 3000000 -vmin 0 -vmax 0.06 \
-p ./resultats.insulation

Créer une courbe comparative pour différentes tailles de fenêtres.

fancplot --largeur 7 -o ./comparaison.png \
chr18:18mb-28mb -p triangular ./donnees.hic -m 3000000 \
-vmin 0 -vmax 0.06 -p line ./resultats_1mb.bed \
./resultats_2mb.bed -l "1Mo" "2Mo"

Étiquettes: TAD insulation score Hi-C FAN-C bioinformatique

Publié le 1 juillet à 17h29