Costruzione della libreria di BAC, fingerprinting e
montaggio dei contigs
Inizialmente sono state costruite due librerie di cloni BAC analizzando su agarosio il DNA ad alto peso molecolare del genoma di riso. Per fare ciò il DNA fu parzialmente digerito nei siti di restrizione HindIII ed EcoRI e successivamente rilegati. La trasformazione è stata effettuata su E. Coli piastrato su terreno selettivo. La libreria fatta con HindIII consiste in 36,864 cloni ognuno dei quali contenente in media 129kb, mentre quella effettuata con EcoRI consiste in 55,296 cloni con una media di 121kb ciascuno. È stato calcolato che circa il 5% dei cloni di ogni libreria erano contaminati o non contenevano l’inserto, quindi sono stati in seguito eliminati.
I 65,287 cloni BAC sono stati sottoposti a fingerprinting.
Il fingerprinting è una tecnica che serve per determinare l’impronta digitale di un clone (in questo caso). Tale tecnica si effettua digerendo il DNA dei cloni in determinati Siti di restrizione specifici, come HindIII e EcoRI, e successivamente fatto correre su gel. Dopo la corsa saranno visibili le bande dei frammenti generati di ogni contigs. Confrontando il bandeggio dei vari contigs è possibile determinare quali di essi possiedono lo stesso frammento, sono chimerici o non contengono l’inserto d’interesse. Tali analisi viene ottimizzata attraverso un approccio in silico, reso possibile grazie all’utilizzo di appositi programmi come il software IMAGE. I cloni individuati attraverso l’analisi del fingerprinting vengono poi scartati.
Il DNA è stato digerito
completamente con HindIII e fatto
correre su gel di agarosio ad alta risoluzione. Successivamente ogni clone è
stato sottoposto a fingerprinting grazie al software IMAGE che ha analizzato la distanza di ogni frammento di
restrizione. Mediamente per ogni clone sono stati trovati 28 frammenti di
fingerprinting. Grazie al questa tecnica è stato possibile eliminare i cloni
chimerici o ridondanti. La libreria di contigs ottenuta rappresenta circa le
453Mb del genoma di riso. Tale sovrastima è dovuta al fatto che i cloni che
compongono il contigs contengono sequenze sovrapponibili fra loro. L’analisi di
tutti gli scaffolds ancorati alla mappa genetica ha permesso di risalire a
quella fisica. In seguito a questo passaggio è stato fatta una correzione
manuale, in modo da eliminare eventuali gap o errori nella mappatura.
Il montaggio dei contigs migliora
la mappa fisica in due modi. Primo, identifica i punti di continuità fra i
contigs riducendo quindi il numero dei gap. Secondo, identifica i potenziali
contigs chimerici individuando false sovrapposizioni o individuando dati in
conflitto.
Ancoraggio dei cloni BAC alla mappa genetica
Sono stati utilizzati quattro
passaggi per correlare la mappa genetica a quella fisica del genoma di riso.
Per primo sono state progettate delle probe partendo dai marcatori genetici
utilizzati nel Japanese Rice Genome
Program per la mappa genetica. Ogni probe di DNA per l’ibridazione su gel è
stata costruita a partire da marker localizzati a intervalli di 3-5 cM su
ognuno dei 12 cromosomi di riso, in modo da coprire tutto il genoma (vedi tabella 1). In questo modo è stato possibile
assegnare la corretta collocazione del clone sul genoma confrontando i
marcatori presenti nei cloni e sulla mappa genetica.
Tabella 1: la tabella mostra i
primer, i marker e i contigs usati per il mappaggio di ogni cromosoma.
I sequence tagged connectors (STCs)
sono le estremità sovrapponibili dei diversi conting. Cercando gli STCs è
possibile determinare l’ordine dei contigs anche senza conoscerne l’intera
sequenza.
La RFLP viene utilizzata per
quella classe di marcatori basata su tecniche di ibridazione. Infatti,
l’RFLP deve la sua origine alla scoperta degli enzimi di restrizione e
all’invenzione della Southern Blot. Questa tecnica è basata sulla
disponibilità di sequenze di DNA note, che possono essere utilizzate per
individuare sequenze omologhe presenti su genomi in corso di studio e che
manifestano una variazione a livello del DNA. Tale variazione è definita
polimorfismo, che in questo caso è dovuta ad una variazione della lunghezza
dei frammenti di DNA digeriti con gli enzimi di restrizione.
|
In secondo luogo è stata fatta un ibridazione in silico. Sono state sequenziale entrambi le estremità di ogni clone
BAC delle librerie HindIII e EcoRI, generando 110.438 STCs.
Tutte le STCs sono state usate nel tentativo di ancorare i contigs basandosi
sulle sequenze di omologia attraverso la RFLP. Dal confronto della mappa ottenuta in silico e quella in vivo è stato
possibile verificare se il mappaggio era avvenuto in maniera corretta.
Terzo, per verificare se i
contigs ancorati agli estremi del cromosomi fossero esattamente nella posizione
corretta, sono state sequenziate le rispettive estremità destra e sinistra. Da
quest’ultime sono stati generati dei primer per amplificare le regioni estreme
dei cromosomi. L’amplicone ottenuto è stato utilizzato come sonda nelle
librerie HindIII e EcoRI dei cloni
BAC per selezionare gli individui che effettivamente contengono le sequenze
fiancheggianti dei cromosomi. Per verificare che i cloni ibridati fossero gli
stessi dai quali sono stati generati i primer, sono stati confrontanti i
fingerprinting.
Quarto, partendo dai dati
ottenuti da una precedente bozza di sequenziamento fatta da Monsanto, sono stati associate in silicio le sequenze dei BAC Monsanto e
quelle dei cloni CUGI in modo da ottimizzare la mappa fisica eliminando
eventuali errori e chiudendo i gap.