giovedì 29 agosto 2013

Integrazione della Mappa Fisica e Genomica di Riso parte 2


Costruzione della libreria di BAC, fingerprinting e montaggio dei contigs


Inizialmente sono state costruite due librerie di cloni BAC analizzando su agarosio il DNA ad alto peso molecolare del genoma di riso. Per fare ciò il DNA fu parzialmente digerito nei siti di restrizione HindIII ed EcoRI  e successivamente rilegati. La trasformazione è stata effettuata su E. Coli piastrato su terreno selettivo. La libreria fatta con HindIII consiste in 36,864 cloni ognuno dei quali contenente in media 129kb, mentre quella effettuata con EcoRI consiste in 55,296 cloni con una media di 121kb ciascuno. È stato calcolato che circa il 5% dei cloni di ogni libreria erano contaminati o non contenevano l’inserto, quindi sono stati in seguito eliminati.

 I 65,287 cloni BAC sono stati sottoposti a fingerprinting.

Il fingerprinting è una tecnica che serve per determinare l’impronta digitale di un clone (in questo caso). Tale tecnica si effettua digerendo il DNA dei cloni in determinati  Siti di restrizione specifici, come HindIII e EcoRI, e successivamente fatto correre su gel. Dopo la corsa saranno visibili le bande dei frammenti generati di ogni contigs. Confrontando il bandeggio dei vari contigs è possibile determinare quali di essi possiedono lo stesso frammento, sono chimerici o non contengono l’inserto d’interesse. Tali analisi viene ottimizzata attraverso un approccio in silico, reso possibile grazie all’utilizzo di appositi programmi come il software IMAGE. I cloni individuati attraverso l’analisi del fingerprinting vengono poi scartati.


Il DNA è stato digerito completamente con HindIII e fatto correre su gel di agarosio ad alta risoluzione. Successivamente ogni clone è stato sottoposto a fingerprinting grazie al software IMAGE che ha analizzato la distanza di ogni frammento di restrizione. Mediamente per ogni clone sono stati trovati 28 frammenti di fingerprinting. Grazie al questa tecnica è stato possibile eliminare i cloni chimerici o ridondanti. La libreria di contigs ottenuta rappresenta circa le 453Mb del genoma di riso. Tale sovrastima è dovuta al fatto che i cloni che compongono il contigs contengono sequenze sovrapponibili fra loro. L’analisi di tutti gli scaffolds ancorati alla mappa genetica ha permesso di risalire a quella fisica. In seguito a questo passaggio è stato fatta una correzione manuale, in modo da eliminare eventuali gap o errori nella mappatura.

Il montaggio dei contigs migliora la mappa fisica in due modi. Primo, identifica i punti di continuità fra i contigs riducendo quindi il numero dei gap. Secondo, identifica i potenziali contigs chimerici individuando false sovrapposizioni o individuando dati in conflitto.

Ancoraggio dei cloni BAC alla mappa genetica

Sono stati utilizzati quattro passaggi per correlare la mappa genetica a quella fisica del genoma di riso. Per primo sono state progettate delle probe partendo dai marcatori genetici utilizzati nel Japanese Rice Genome Program per la mappa genetica. Ogni probe di DNA per l’ibridazione su gel è stata costruita a partire da marker localizzati a intervalli di 3-5 cM su ognuno dei 12 cromosomi di riso, in modo da coprire tutto il genoma (vedi tabella 1). In questo modo è stato possibile assegnare la corretta collocazione del clone sul genoma confrontando i marcatori presenti nei cloni e sulla mappa genetica.

Tabella 1: la tabella mostra i primer, i marker e i contigs usati per il mappaggio di ogni cromosoma.
 
   
I sequence tagged connectors (STCs) sono le estremità sovrapponibili dei diversi conting. Cercando gli STCs è possibile determinare l’ordine dei contigs anche senza conoscerne l’intera sequenza.

La RFLP viene utilizzata per quella classe di marcatori basata su tecniche di ibridazione. Infatti, l’RFLP deve la sua origine alla scoperta degli enzimi di restrizione e all’invenzione della Southern Blot. Questa tecnica è basata sulla disponibilità di sequenze di DNA note, che possono essere utilizzate per individuare sequenze omologhe presenti su genomi in corso di studio e che manifestano una variazione a livello del DNA. Tale variazione è definita polimorfismo, che in questo caso è dovuta ad una variazione della lunghezza dei frammenti di DNA digeriti con gli enzimi di restrizione.
   
 In secondo luogo è stata fatta un ibridazione in silico. Sono state sequenziale entrambi le estremità di ogni clone BAC delle librerie HindIII e EcoRI, generando 110.438 STCs. Tutte le STCs sono state usate nel tentativo di ancorare i contigs basandosi sulle sequenze di omologia attraverso la RFLP. Dal confronto della mappa ottenuta in silico e quella in vivo è stato possibile verificare se il mappaggio era avvenuto in maniera corretta.

 Terzo, per verificare se i contigs ancorati agli estremi del cromosomi fossero esattamente nella posizione corretta, sono state sequenziate le rispettive estremità destra e sinistra. Da quest’ultime sono stati generati dei primer per amplificare le regioni estreme dei cromosomi. L’amplicone ottenuto è stato utilizzato come sonda nelle librerie  HindIII e EcoRI dei cloni BAC per selezionare gli individui che effettivamente contengono le sequenze fiancheggianti dei cromosomi. Per verificare che i cloni ibridati fossero gli stessi dai quali sono stati generati i primer, sono stati confrontanti i fingerprinting.

Quarto, partendo dai dati ottenuti da una precedente bozza di sequenziamento fatta da Monsanto, sono stati associate in silicio le sequenze dei BAC Monsanto e quelle dei cloni CUGI in modo da ottimizzare la mappa fisica eliminando eventuali errori e chiudendo i gap.
 

mercoledì 28 agosto 2013

Integrazione della Mappa Fisica e Genomica di Riso Parte 1

Introduzione

 
Il riso è il più importante cibo per l’alimentazione umana, infatti, per oltre due miliardi e mezzo di uomini questo cereale è l'elemento principale dell'alimentazione e in alcuni paesi asiatici arriva a fornire addirittura i tre quarti dell' apporto calorico. Il riso è molto studiato come organismo modello per il sequenziamento genomico poiché è economico, ha un piccolo genoma (430 Mb divise in 37.000 geni), presenta moltissime interconnessioni evolutive con genomi di altre specie vegetali e perché sono disponibili notevoli informazioni sul suo genoma come mappe fisica, collezione di ESTs e librerie di lievito (YAC).
 
Le Expressed Sequence Tags (ESTs) sono dei brevi frammenti di DNA trascritti e sequenziati a partire dal cDNA, rappresentano parti di geni espressi e possono essere utilizzate come sonde per identificare quali proteine vengono espresse in una cellula.    

 

 
L’International Rice Genome Sequencing Project (RGP) ha portato a termine la determinazione ed il sequenziamento dell’intero genoma di riso nel 2005 usando la tecnica clone-by-clone. Questa tecnica era stata precedentemente provata con efficacia per il sequenziamento del genoma di uomo, Caenorhabditis elegans e Arabidopsis. Il mappaggio fisico del genoma di riso è fondamentale per il successivo sequenziamento, inoltre, completato anche quest’ultimo è possibile determinare i geni importanti dal punto di vista biologico ed agricolo.

 

In passato fu ottenuta una mappa fisica utilizzando  YAC che ha permesso di coprire il 63% del genoma di riso. Tuttavia, l’alta frequenza di chimere, la difficile manipolazione e purificazione hanno reso YAC un vettore non ideale per questo mappaggio. Per tale motivo è stato preferito BAC. Questo clone può contenere larghi inserti ed ha un basso numero di copie di cloni. È stata quindi fatta una libreria BAC della variante di riso Japonica che è stata sottoposta a fingerprinting sfruttando i siti di restrizione HindIII ed utilizzata per determinare la mappa fisica.
I vettori chimerici sono sequenze che contengono frammenti di DNA che ibridizzano su differenti regioni del genoma. Questo può essere dovuto o alla presenza di due frammenti diversi all'interno dello stesso clone o alla presenza di elementi ripetuti all'interno del genoma stesso.
 
La mappa fisica di riso è stata organizzata in 65,287 cloni di BAC sovrapposti, di cui 62,509 sono stati organizzati in 458 contigs, di cui 284 contengono circa 362.9 Mb e sono stati messi in correlazione con la mappa genetica, determinando quindi che il 90.6% del genoma di riso è rappresentato da tali cloni.
 


Contigs

Per l’ottenimento di una mappa fisica è necessario partire da una mappa genetica ottenuta analizzando la disposizione dei marcatori all’interno della progenie. Successivamente si procede con la digestione del DNA e la creazione di una libreria BAC (in questo caso). Questi cloni vengono poi sottoposti a fingerprinting per eliminare quelli ridondanti o chimerici. Infine, analizzando la posizione dei marcatori utilizzati per la strutturazione della mappa genetica è possibile trovare una corrispondenza fra il frammento di DNA contenuto nel clone e la sua effettiva collocazione all’interno del genoma. I cloni ancorati sono detti contigs e nel loro complesso formano degli scaffolds.