Il DNA
L’informazione genetica di ogni individuo risiede nel DNA (acido desossiribonucleico). Il DNA è una lunga molecola composta da singole unità fondamentali, unite tra loro come in una catena, dette nucleotidi. Ogni nucleotide è formato da una base azotata, uno zucchero ed un gruppo fosfato. Le basi azotate presenti nel DNA sono quattro: adenina, citosina, guanina e timina. Tali basi, indicate rispettivamente con le lettere A, C, G, T costituiscono l’alfabeto con cui è codificata l’informazione nel DNA. Ogni base azotata è in grado di accoppiarsi, mediante la formazione di legami, detti ponti idrogeno, soltanto con la base ad essa complementare (A con T e viceversa , C con G e viceversa). Ogni filamento di DNA pertanto si appaia con un filamento complementare costituendo un doppio filamento di DNA che si intreccia su se stesso andando a formare quella che viene definita doppia elica di DNA.
Ereditarietà
Il DNA si trova all’interno del nucleo di ogni cellula (DNA nucleare) organizzato in cromosomi, cioè lunghe catene di DNA densamente impacchettate con delle proteine strutturali. In ogni cellula è contenuto l’intero patrimonio genetico di un individuo.
L’uomo possiede 23 coppie di cromosomi, per un totale di 46. Ogni cromosoma è presente in doppia copia, una di origine paterna e una di origine materna (detti cromosomi omologhi). Il patrimonio genetico di un individuo si costituisce infatti al momento della fecondazione quando la fusione del gamete maschile (spermatozoo), che porta i 23 cromosomi paterni, con quello femminile (ovulo) che porta i 23 cromosomi materni, ristabilisce l’assetto cromosomico completo di 46 cromosomi. I gameti si formano negli organi riproduttori dove cellule con patrimonio genetico completo di 46 cromosomi, danno origine, tramite un complesso processo chiamato meiosi, a cellule (i gameti) contenenti soltanto una copia di ogni cromosoma, quindi 23 cromosomi.
Figura 1: I cromosomi omologhi (per semplicità indicati come se fossero uguali), in rosa quelli della madre e in blu quelli del padre, si duplicano (si mescolano) e si separano durante la meiosi originando i gameti. I gameti contengono una sola copia di ogni cromosoma (nell’uomo sono 23). Durante la fecondazione un gamete maschile si fonde con uno femminile e si ristabilisce così il corretto assetto cromosomico nel figlio. In figura si può vedere come la coppia di cromosomi omologhi che il figlio ha ereditato sia composta da uno di origine paterna, indicato in blu, e da uno di origine materna, in rosa.
Prelievo ed estrazione del DNA
Per effettuare indagini di parentela il prelievo viene eseguito mediante un tampone boccale (simile ad un grosso cotton fioc), che viene passato sulle pareti interne delle guance allo scopo di raccogliere le cellule di sfaldamento dell’epitelio boccale. Il DNA viene quindi estratto, mediante apposite metodologie messe a punto per analisi forensi ed indagini di parentela, e portato in soluzione in modo da essere disponibile per le successive fasi di analisi.
Regioni STR
Per effettuare indagini di parentela oggi è possibile analizzare specifiche regioni di DNA (marcatori) per comprendere quale parte è stata ereditata dalla madre e quale dal padre. A tale scopo si utilizzano dei marcatori altamente polimorfici in lunghezza e molto variabili nella popolazione, conosciuti come regioni Microsatelliti o STR (Short Tandem Repeat). Una sequenza STR è costituita da un’unità, di lunghezza di 2-6 basi, ripetuta un numero variabile di volte. Per ogni marcatore STR esistono numerose varianti alleliche distribuite nella popolazione che differiscono tra loro proprio per il numero di ripetizioni di tali unità. Per ragioni tecniche le sequenze STR in uso oggi sono costituite tipicamente da ripetizioni di unità di quattro basi (tetranucleotidi).
Figura 2: Regione STR. Nel locus TH01, l’unità fondamentale di 4 basi, TCAT, è ripetuta un numero variabile di volte; nell’esempio A sono presenti 4 ripetizioni mentre nell’esempio B ne sono presenti 6.
Analisi delle STR
L’analisi delle STR viene effettuata mediante una reazione enzimatica di amplificazione del DNA, detta PCR (Polymerase Chain Reaction), che permette tramite una reazione in vitro di ottenere migliaia di copie della regione di DNA di interesse (figura 3). Per la determinazione del profilo genetico, le regioni STR che vengono amplificate sono fino a 24.
Figura 3: Reazione di amplificazione mediante PCR. Utilizzando primer specifici per un particolare sito sul DNA (piccoli frammenti di DNA di 15-20 nucleotidi a sequenza nota, che servono da innesco per la reazione), e sfruttando cicli successivi di replicazione si ottengono, anche partendo da un esiguo quantitativo di DNA, migliaia di copie della regione da analizzare (nel nostro caso le regioni STR).
Determinazione del profilo genetico
Effettuata la reazione di PCR è necessario stabilire la dimensione delle regioni amplificate al fine di ricavare il numero di ripetizioni dell’unità fondamentale di cui sono composte. La caratterizzazione dei frammenti amplificati viene effettuata mediante corsa elettroforetica su sequenziatori automatici a tecnologia fluorescente. Se un marcatore STR è presente in forme diverse (alleli) sui due cromosomi, quello di origine paterna e quello di origine materna, si otterranno dalla reazione di PCR due frammenti (regioni amplificate) di lunghezza diversa (eterozigosi), mentre, se su entrambi i cromosomi è presente la stessa variante allelica, si otterranno frammenti di identiche dimensioni (omozigosi).
Figura 4: Cliccare sull’immagine per ingrandirla. Cromatogramma d’esempio, relativo ai 5 marcatori STR nel canale verde, in cui si vedono i picchi corrispondenti ai diversi frammenti amplificati con alla base l’indicazione del numero di ripetizioni dell’unità fondamentale di cui sono composti. Il nome del marcatore è indicato nei rettagolini grigi al di sopra di ogni cromatogramma. Nel caso di eterozigosi sono visibili due picchi per ogni marcatore corrispondenti ai due frammenti amplificati di diversa dimensione. Nel caso di omozigosi ci sarà invece un unico picco per ogni marcatore, dato che il soggetto possiede due copie dello stesso allele (D13S317 e D2S1338 nell’area superiore e TH01 in quella inferiore).
Al termine dell’analisi si ottiene una tabella con il profilo genetico dell’individuo in esame.
Marcatore | Allele 1 | Allele 2 |
D8S1179 | 12 | 14 |
D21S11 | 29 | 31.2 |
D7S820 | 11 | 11 |
CSF1PO | 10.2 | 12 |
D3S1358 | 17 | 20 |
TH01 | 9 | 9 |
D13S317 | 23 | 13 |
D16S539 | 14 | 14 |
D2S1338 | 16 | 17 |
D19S433 | 16 | 18 |
vWA | 20 | 22 |
TPOX | 16 | 12 |
D18S51 | 18 | 18 |
D5S818 | 12 | 17 |
FGA | 10 | 20 |
AMEL | X | Y |
Tabella 1 Esempio di profilo genetico. I numeri indicano il numero di ripetizioni dell’unità fondamentale di cui sono costituiti gli alleli rilevati.
Il Test di paternità
La trasmissione dei marcatori genetici segue le leggi della trasmissione ereditaria, per cui il profilo genetico di un figlio è per metà di provenienza materna e per metà paterna. Nel classico test di paternità, trio madre-padre-figlio, si effettua inizialmente una valutazione dell’insieme delle varianti alleliche che costituiscono il profilo genetico del figlio, della madre e del padre. Tutti gli alleli del figlio che non sono presenti nella madre devono essere stati obbligatoriamente ereditati dal padre biologico. Se il figlio è omozigote per un marcatore (cioè possiede due alleli uguali) tale marcatore deve apparire in entrambi i genitori. Qualora il genitore presunto possieda nel suo profilo genetico queste caratteristiche risulta essere compatibile con l’ipotesi di paternità o maternità. Se al contrario, il genitore presunto non possiede queste caratteristiche genetiche, egli viene escluso come genitore biologico. Nel caso sia possibile fare riferimento soltanto a un genitore l’esclusione sarà determinata dalla completa assenza nel figlio di entrambi gli alleli di cui il genitore presunto è portatore. In pratica, se il profilo genetico del figlio e del genitore presunto differiscono per più di 2 loci tra quelli considerati, l’ESCLUSIONE è certa (0% di probabilità di essere il genitore biologico). Se si ottiene la COMPATIBILITÀ con l’ipotesi di paternità o maternità, viene effettuata un’analisi statistica dei risultati (calcolo biostatistico) e viene quindi fornita una percentuale di attribuzione.
Seguono due tabelle d’esempio che illustrano un caso di compatibilità (Tabella 2) ed un caso di esclusione (tabella 3). Nel caso specifico sono stati analizzati 16 loci.
Marcatore | Padre presunto | Madre | Figlio |
D8S1179 | 9/18 | 10/12 | 12/18 |
D21S11 | 24/31 | 29/33 | 24/33 |
D7S820 | 6/6 | 8/9 | 6/8 |
CSF1PO | 10/11 | 10/15 | 10/10 |
D3S1358 | 16/16 | 12/15 | 15/16 |
TH01 | 5/13.3 | 8/8 | 5/8 |
D13S317 | 12/14 | 8/14 | 14/14 |
D16S539 | 10/14 | 11/12 | 10/11 |
D2S1338 | 21/28 | 19/28 | 21/28 |
D19S433 | 17/17 | 12.2/15 | 15/17 |
vWA | 11/16 | 20/20 | 11/20 |
TPOX | 7/8 | 10/12 | 7/12 |
D18S51 | 10/19 | 14/17 | 10/14 |
D5S818 | 8/8 | 8/11 | 8/8 |
FGA | 17/20 | 25/25 | 20/25 |
AMEL | X/Y | X/X | X/Y |
Tabella 2 Profili genetici del trio padre presunto, madre e figlio. In questo caso il padre presunto risulta compatibile con l’ipotesi di paternità in quanto possiede per ogni locus l’allele di origine non materna presente nel figlio. Sono stati evidenziati in rosso gli alleli che il figlio ha ereditato dalla madre e quelli che potrebbe aver ereditato dal padre presunto.
Marcatore | Padre presunto | Madre | Figlio |
D8S1179 | 9/18 | 10/12 | 12/18 |
D21S11 | 29/31 | 29/33 | 24/33 |
D7S820 | 6/6 | 8/9 | 7/8 |
CSF1PO | 8/11 | 10/15 | 10/10 |
D3S1358 | 16/16 | 12/15 | 15/16 |
TH01 | 5/13.3 | 8/8 | 5/8 |
D13S317 | 12/13 | 8/14 | 14/14 |
D16S539 | 5/14 | 11/12 | 10/11 |
D2S1338 | 20/27 | 19/28 | 21/28 |
D19S433 | 17/17 | 12.2/15 | 15/17 |
vWA | 11/16 | 20/20 | 11/20 |
TPOX | 7/8 | 10/12 | 7/12 |
D18S51 | 9/19 | 14/17 | 10/14 |
D5S818 | 8/8 | 8/11 | 8/8 |
FGA | 17/30 | 25/25 | 20/25 |
AMEL | X/Y | X/X | X/Y |
Tabella 3 Profili genetici del trio padre presunto, madre e figlio. In questo caso il profilo del padre presunto non è compatibile con quello del figlio, infatti, per 8 loci, evidenziati in verde, non possiede l’allele di origine paterna presente nel figlio. L’ipotesi di paternità è pertanto esclusa con certezza.
Analisi statistica
Profili genetici del trio padre presunto, madre e figlio. In questo caso il profilo del padre presunto non è compatibile con quello del figlio, infatti, per 8 loci, evidenziati in verde, non possiede l’allele di origine paterna presente nel figlio. L’ipotesi di paternità è pertanto esclusa con certezza.
Accertata la compatibilità, si esegue l’analisi biostatistica per calcolare la probabilità di paternità a posteriori. Tale probabilità è calcolata a partire dai risultati di compatibilità dei caratteri genetici facendo riferimento alle frequenze dei diversi marcatori nella popolazione di appartenenza del soggetto in esame. A tal fine si considerano due ipotesi:
Hp = il genitore presunto è il genitore biologico (ipotesi di paternità)
Hn = il genitore presunto NON è il genitore biologico (ipotesi di non paternità)
Applicando il teorema di Bayes viene valutato il favore che gode la probabilità dell’ipotesi di paternità P(Hp|G) nei confronti della probabilità dell’ipotesi di non paternità P(Hd|G).
Più è elevato il valore di O(Hp|G) tanto più è probabile l’ipotesi Hp di paternità nei confronti dell’ipotesi Hn di non paternità. In altre parole, più è elevato il valore O(Hp|G) più è probabile che il genitore presunto sia realmente il genitore biologico.
Il rapporto p(Hp)/P(Hn) nella seconda parte dell’equazione 1) rappresenta la probabilità a priori che gode l’ipotesi di paternità nei confronti dell’ipotesi di non paternità. Nel calcolo si assume che l’ipotesi di paternità e non paternità siano a priori equiprobabili cioè P(Hp) = P(Hn) = 0,5 per cui il loro rapporto assume valore uguale a 1.
Il rapporto p(G|Hp)/P(G|Hn) rappresenta il rapporto di verosimiglianza (LR likelihood ratio) definito anche paternity index (PI). Il valore al numeratore P(G|Hp) indica la probabilità complessiva che il presunto genitore abbia fornito l’allele non ereditato dal genitore certo al figlio oggetto di indagine di paternità. Il valore al denominatore P(G|Hn) rappresenta invece la probabilità di compatibilità casuale tra il presunto genitore e il figlio. Tale probabilità viene calcolata considerando la frequenza delle varianti alleliche rilevate nella popolazione di riferimento. La probabilità di paternità si può quindi calcolare secondo la derivazione di Essen-Möller (1938):
Utilizzando 15 marcatori STR il valore della probabilità di paternità è >99,99%. Nell’accertamento di paternità quando la probabilità di paternità supera il valore del 99,72% (valore soglia), la paternità è da considerarsi come “praticamente certa”. Questo stesso valore è infatti definito dal Ge.F.I (Genetisti Forensi Italiani) come paternità scientificamente provata.
Glossario
Allele: forma alternativa di un marcatore o di un gene che si trova in una posizione definita su di un cromosoma (locus).
Cromosoma: struttura composta da un lungo filamento in doppia elica di DNA avvolto con delle proteine. Ogni cromosoma è presente in doppia copia all’interno di una cellula, una copia di origine materna e una di origine paterna. L’uomo possiede 23 coppie di cromosomi.
DNA: acido desossiribonucleico; è la molecola che contiene l’informazione genetica di un individuo.
Genotipo: complesso dei caratteri ereditari di un individuo che gli sono stati trasmessi geneticamente dai genitori.
Genoma: l’intero patrimonio genetico di un individuo.
Locus: posizione di un marcatore genetico (o di un gene) all’interno di un cromosoma.
Marcatore: regione del DNA, mappata in una unica localizzazione nel genoma, polimorfica nella popolazione (cioè con molteplici varianti alleliche nella popolazione).
PCR: reazione a catena della polimerasi; reazione che permette di amplificare specifiche regioni del DNA consentendone l’analisi.