What makes us human?
Measures of genome size
1. Chromosome number
2. DNA length
3. Number of genes 4
K
-value paradox: Complexity
does not correlate with
chromosome number .
Homo sapiens Lysandra atlantica Ophioglossum reticulatum
46 250 ~1260
6
C
-value paradox: Complexity
does not correlate with
g
enome size
.
9 11
10
3.4 10 bp 6.8 10 bp
1.5 10 bp
× ×
×
Homo sapiens Amoeba dubia
Allium cepa 8
The amount of TE correlate positively with
genome size
Mb Genomic DNA
3000
2500 TE DNA
2000 Protein-coding
1500 DNA
1000
500
0
ium ld
st ora o t
s
t a ir
hila uit
si
as
o de
yea sh
c ze
e qu
m
od op
si
sp
e c use
gu an
sq
to i
i
Ri op
y as af
s
Ma
me
m id
ro
ing ma o m
Fu
n a
br o
Br os
as ab M
u
io Se Hu
Sli M
Ne
dd Ze
Ne
Dr
Pl ss Ar
Bu Fi Feschotte & Pritham 2006
The proportion of protein-coding genes decreases with genome size,
while the proportion of TEs increases with genome size
TEs
Protein-coding
genes
Gregory, Nat Rev Genet 2005
Comparative Genome Sizes
Genebuild last updated: October 2008
Known protein-coding genes: 21,343
Novel protein-coding genes: 73
Pseudogenes: 9,899
RNA-specifying genes: 5,732
Exons: 297,252
RNA transcripts: 62,877
SNPs: 15,040,632 14
N
-value paradox: Complexity
does not correlate with
protein-coding g
ene number
.
~25,000 genes ~25,000 genes ~60,000 genes
15
Genomic paradox:
Lack of correspondence between
measures of g
enome size and the
presumed amount of genetic
information “ needed ” by the
organism (its “
com p lexit y ”
). 16
The human genome is:
•
small
•
empty
•
unoriginal
•
repetitive 17
EVOLUZIONE
CROMOSOMICA?
At the genome level
1) Structural variations
Evoluzione
Homo Sapiens
Cromosomi minidi
- O
Compazione delle bande
I 6 cromosomi umani (Hu) più lunghi
sono comparabili con 7 cromosomi delle tre
specie delle grandi scimmie.
Example: the
Evolutionary Hypothesis
of Common Ancestry
Chromosome Numbers in
the great apes:
human (Homo) 46
chimpanzee (Pan) 48
gorilla (Gorilla) 48
orangutan (Pogo) 48
Testable prediction:
If these organisms share a common
ancestor, that ancestor had either
48 chromosomes (24 pairs) or
46 (23 pairs).
ANATOMIA DI UN
CROMOSOMA
Head I Cromosomi hanno i
Telomero telomeri alle estremità
Centromero
Tail I telomeri hanno sequenze
Telomero di DNA uniche …
ttagggttagggttagggttagggttagggttaggg…
||||||||||||||||||||||||||||||||||||
aatcccaatcccaatcccaatcccaatcccaatccc…
Ancestral
Chromosomes Fusion
Chromosome Numbers in Homo sapiens
the great apes
(Hominidae): Inactivated
centromere
human (Homo) 46
chimpanzee (Pan) 48 Telomere
sequences
gorilla (Gorilla) 48
orangutan (Pogo) 48 Centromere
Telomere
Testable prediction:
Common ancestor had 48 chromosomes (24 pairs) and
humans carry a fused chromosome; or ancestor had 23
pairs, and apes carry a split chromosome.
DOMANDA…
Perchè sono necessari
DUE piccoli cromosomi
di scimpanzè per fare il
cromosoma #2 umano?
Il cromosoma #2 umano potrebbe essersi formato
FUSIONE
dalla di DUE piccoli cromosomi di
scimpanzè (#12 e #13)?
Human
Chimp #2
#13
Chimp
#12 PREDIZIONE
Chimp
#13 Se una fusione è occorsa,
Human essa dovrebbe aver
#2 lasciato una traccia nel
DNA dell’unione testa-
testa dei due telomeri al
centro circa del
Chimp cromosoma #2
#12 Area di
Fusione? DNA
Head
Telomero Sequenze di DNA dei Telomeri:
ttagggttagggttaggg…
||||||||||||||||||
Centromero aatcccaatcccaatccc…
NOTARE:
Tandem Repeats nei Telomeri:
ttagggttagggttaggg…
||||||||||||||||||
Tail aatcccaatcccaatccc…
Telomero Repetuti 800-1600 volte
in ciascun Telomero
PREVISIONI
• Cosa cercare?
• tandem repeats nell’area di fusione
• Dove cercare?
• al centro del cromosoma #2 umano
• Come cercarli?
• nei database di DNA
• Se NON ci sono?
• la fusione potrebbe non essere avvenuta
RISULTATI
108061 agcacagacc tgggggtcac cgtaaaggtg gagcagcatt cccctaagca cagaggttgg
108121 ggccactgcc tggctttgtg acaactcggg gcgcatcaac ggtgaataaa atctttcccg
108181 gttgcagccg tgaataatca aggttagaga ccagttagag cggttcagtg cggaaaacgg
108241 gaaagaaaaa gcccctctga atcctgggca gcgagattct cccaaagcaa ggcgaggggc
108301 tgcattgcag ggtgagggtg agggttaggg tttgggttgg gtttggggtt ggggttgggg
108361 taggggtggg gttggggttg gggttggggt taggggtagg ggtaggggta ggggtagggt
108421 cagggtcagg gtcagggtta gggttttagg gttaggattt tagggttagg gtaagggtta
108481 agggttgggg ttggggttag ggttaggggt tagggttggg gttggggttg gggttggggt
108541 tggggttggg gttagggtta gctaaaccta accctaaccc ctaaccccaa ccccaacccc
108601 aaccctaccc ctacccctac ccctaacccc aacccccacc cttaaccctt aacccttacc
108661 ctaaccctaa cccaaaccct aaccctaccc taaccctaac ccaaccctaa ccctaaccct
108721 accctaaccc taacacccta aaaccgtgac cctgaccttg accctgaccc ttaaccctta
108781 accctaacca taaccctaaa ccctaaccct aaaccctaac cctaaaccct aaccctaaca
108841 ctaccctacc ctaaccccaa cccctaaccc ctaaccctaa ccctacccct aaccccaacc
108901 ccagccccaa cccttaccct aaccctaccc taacccttaa ccctaacccc taaccctaac
108961 ccctaaccct aaccctaccc caaccccaaa cccaacccta acccaaccct aacccctaac
109021 cctaacccct accctaaccc ctagccctag ccctagccct aaccctaacc ctcgccctaa
109081 ccctcaccct aaccctcacc ctcaccctaa cccaacgtct gtgctgagaa gaatgctgct
109141 ccgcctttaa ggtgcccccc aggtctgtgc tgaacagaac gcagctccgc cgtcgcagtg
109201 ccctcagccc gcccgcccgg gtctgacctg agaagaactc tgctccgcct tcgcaatagc
109261 cccgaagtct gtgcagagga gaacgcagct ccgccctcgc gatgctctcc ggctgtgtgc
109321 taaagagaac gcaactccgc cctcgcaaag gcggcgcgcc ggcggaggcg cggagaggcg
RISULTATI
108061 agcacagacc tgggggtcac cgtaaaggtg gagcagcatt cccctaagca cagaggttgg
108121 ggccactgcc tggctttgtg acaactcggg gcgcatcaac ggtgaataaa atctttcccg
108181 gttgcagccg tgaataatca aggttagaga ccagttagag cggttcagtg cggaaaacgg
108241 gaaagaaaaa gcccctctga atcctgggca gcgagattct cccaaagcaa ggcgaggggc
108301 tgcattgcag ggtgagggtg agggttaggg tttgggttgg gtttggggtt ggggttgggg HEAD
108361 taggggtggg gttggggttg gggttggggt taggggtagg ggtaggggta ggggtagggt 13
108421 cagggtcagg gtcagggtta gggttttagg gttaggattt tagggttagg gtaagggtta
108481 agggttgggg ttggggttag ggttaggggt tagggttggg gttggggttg gggttggggt
108541 tggggttggg gttagggtta gctaaaccta accctaaccc ctaaccccaa ccccaacccc
108601 aaccctaccc ctacccctac ccctaacccc aacccccacc cttaaccctt aacccttacc
108661 ctaaccctaa cccaaaccct aaccctaccc taaccctaac ccaaccctaa ccctaaccct
108721 accctaaccc taacacccta aaaccgtgac cctgaccttg accctgaccc ttaaccctta HEAD
108781 accctaacca taaccctaaa ccctaaccct aaaccctaac cctaaaccct aaccctaaca 12
108841 ctaccctacc ctaaccccaa cccctaaccc ctaaccctaa ccctacccct aaccccaacc
108901 ccagccccaa cccttaccct aaccctaccc taacccttaa ccctaacccc taaccctaac
108961 ccctaaccct aaccctaccc caaccccaaa cccaacccta acccaaccct aacccctaac
109021 cctaacccct accctaaccc ctagccctag ccctagccct aaccctaacc ctcgccctaa
109081 ccctcaccct aaccctcacc ctcaccctaa cccaacgtct gtgctgagaa gaatgctgct
109141 ccgcctttaa ggt
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.