ABOUT THE SPEAKER
Yaniv Erlich - Computational geneticist
Yaniv Erlich is fascinated by the connection between DNA and data.

Why you should listen

As a professor and researcher at Columbia University and as CSO of MyHeritage.com, Yaniv Erlich has performed foundational work in genetic privacy and large-scale studies of crowdsourced genomic data. Dubbed a "genome hacker" by the journal Nature, Erlich and his team discovered a privacy loophole enabling reidentification of allegedly anonymous male research participants using just internet searches and their Y chromosome. Later, he discovered that 60 percent of all US individuals with European descent can be identified by forensic genetics using open genetic genealogy databases, which Science magazine called one of the top 10 breakthroughs of 2018.

Erlich is also responsible for the construction of the world's largest family tree, comprising 13 million people, as well as the development of the website DNA.land, which has compiled the genotypes of more than 150,000 donors. He has also worked to discover the genetic bases for several conditions in Israeli families. His team has demonstrated stable DNA data storage, reaching a density of 215 petabyte per gram of DNA. He's been awarded numerous prizes, has published more than 45 papers and authored seven patents.

More profile about the speaker
Yaniv Erlich | Speaker | TED.com
TEDMED 2018

Yaniv Erlich: How we're building the world's largest family tree

Yaniv Erlich: Como estamos a criar a maior árvore genealógica do mundo

Filmed:
1,507,766 views

Yaniv Erlich, geneticista computacional ajudou a construir a maior árvore genealógica do mundo — englobando 13 milhões de pessoas e recuando a mais de 500 anos. Revela-nos fascinantes padrões que surgem desse trabalho — sobre as vidas amorosas, a saúde, e até casos de criminosos de há décadas — e mostra como as bases de dados genealógicas podem lançar luz não só no passado mas também no futuro.
- Computational geneticist
Yaniv Erlich is fascinated by the connection between DNA and data. Full bio

Double-click the English transcript below to play the video.

00:12
People use the internetInternet
for variousvários reasonsrazões.
0
817
3452
As pessoas usam a Internet
por diversas razões.
00:17
It turnsgira out that one of the mosta maioria
popularpopular categoriescategorias of websitelocal na rede Internet
1
5765
3804
Acontece que uma das categorias
mais populares da Internet
00:21
is something that people
typicallytipicamente consumeconsumir in privateprivado.
2
9593
2872
é uma coisa que as pessoas
habitualmente consomem em privado.
00:25
It involvesenvolve curiositycuriosidade,
3
13639
2510
Envolve a curiosidade,
00:28
non-insignificantnão insignificante levelsníveis
of self-indulgenceauto-indulgência
4
16173
3796
com níveis significativos
de autocomplacência
00:31
and is centeredcentrado around recordinggravação
the reproductivereprodutiva activitiesactividades
5
19993
3260
e centra-se em registar
as atividades reprodutivas
de outras pessoas.
00:35
of other people.
6
23277
1309
00:36
(LaughterRiso)
7
24610
1032
(Risos)
00:37
Of coursecurso, I'm talkingfalando about genealogyGenealogia --
8
25666
2250
Claro que estou a falar da genealogia,
00:39
(LaughterRiso)
9
27940
1214
(Risos)
00:41
the studyestude of familyfamília historyhistória.
10
29178
1702
o estudo da história familiar.
00:43
When it comesvem to detailingdetalhando familyfamília historyhistória,
11
31353
2037
Quando se trata de pormenorizar
a história familiar,
00:45
in everycada familyfamília, we have this personpessoa
that is obsessedobcecado with genealogyGenealogia.
12
33414
3943
em todas as famílias, temos uma pessoa
obcecada pela genealogia.
00:49
Let's call him UncleTio BernieBernie.
13
37381
1713
Vamos chamar-lhe o Tio Bernie.
00:51
UncleTio BernieBernie is exactlyexatamente the last personpessoa
you want to sitsentar nextPróximo to
14
39118
3782
O Tio Bernie é a última pessoa
que queremos ao nosso lado
00:54
in ThanksgivingAção de Graças dinnerjantar,
15
42924
1599
no jantar do Dia de Ação de Graças,
00:56
because he will boredo furo you to deathmorte
with peculiarpeculiar detailsdetalhes
16
44547
2814
porque ele chateia-nos até à morte
com pormenores curiosos
sobre parentes antigos.
00:59
about some ancientantigo relativesparentes.
17
47385
1966
01:02
But as you know,
18
50462
1262
Mas, como sabem,
01:03
there is a scientificcientífico sidelado for everything,
19
51748
2872
tudo tem um lado científico,
01:06
and we foundencontrado that UncleTio Bernie'sBernie storieshistórias
20
54644
2978
e encontrámos nas histórias do Tio Bernie
01:09
have immenseimenso potentialpotencial
for biomedicalbiomédica researchpesquisa.
21
57646
3168
um potencial enorme
para a investigação biomédica.
01:13
We let UncleTio BernieBernie
and his fellowcompanheiro genealogistsGenealogistas
22
61306
2714
Vamos pôr o Tio Bernie
e os seus camaradas genealogistas
01:16
documentdocumento theirdeles familyfamília treesárvores throughatravés
a genealogyGenealogia websitelocal na rede Internet calledchamado geniGeni.comcom.
23
64044
4668
a documentar as suas árvores genealógicas
num "website" chamado geni.com.
Quando os utilizadores colocam
as suas árvores neste "website",
01:21
When usersComercial uploadEnvio
theirdeles treesárvores to the websitelocal na rede Internet,
24
69198
2128
01:23
it scansvarredura theirdeles relativesparentes,
25
71350
1690
este percorre os parentes
01:25
and if it findsencontra matchescorresponde a to existingexistir treesárvores,
26
73064
2075
e, se encontra coincidências
com outras árvores existentes,
01:27
it mergesmescla the existingexistir
and the newNovo treeárvore togetherjuntos.
27
75163
3610
sobrepõe a nova árvore
às árvores já existentes.
01:31
The resultresultado is that largeampla
familyfamília treesárvores are createdcriada,
28
79768
2950
O resultado é que se vão criando
grandes árvores genealógicas,
01:34
beyondalém the individualIndividual levelnível
of eachcada genealogistGenealogista.
29
82742
3479
para além do nível individual
de cada genealogia.
01:38
Now, by repeatingRepetindo this processprocesso
with millionsmilhões of people
30
86808
4129
Repetindo este processo
com milhões de pessoas,
01:42
all over the worldmundo,
31
90961
1817
pelo mundo inteiro,
01:44
we can crowdsourcecrowdsourcing the constructionconstrução
of a familyfamília treeárvore of all humankindhumanidade.
32
92802
5532
podemos construir uma árvore
genealógica de toda a humanidade.
01:51
UsingUsando this websitelocal na rede Internet,
33
99292
1584
Usando este "website",
01:52
we were ablecapaz to connectconectar 125 millionmilhão people
34
100900
4813
pudemos interligar 125 milhões de pessoas
01:57
into a singlesolteiro familyfamília treeárvore.
35
105737
2521
numa única árvore genealógica.
02:00
I cannotnão podes drawdesenhar the treeárvore
on the screenstelas over here
36
108967
2788
Não posso desenhar aqui
esta árvore num ecrã
02:03
because they have lessMenos pixelspixéis
37
111779
2165
porque não há pixéis que cheguem
02:05
than the numbernúmero of people in this treeárvore.
38
113968
2513
para o número de pessoas desta árvore.
02:08
But here is an exampleexemplo of a subsetsubconjunto
of 6,000 individualsindivíduos.
39
116505
5010
Mas este é um exemplo
dum subconjunto de 6000 indivíduos.
02:14
EachCada greenverde nodenó de is a personpessoa.
40
122159
2362
Cada nódulo verde é uma pessoa.
02:17
The redvermelho nodesNós representrepresentar marriagescasamentos,
41
125060
2849
Os nódulos vermelhos
representam os casamentos
02:19
and the connectionsconexões representrepresentar parenthoodpaternidade.
42
127933
2258
e as ligações representam os progenitores.
02:22
In the middlemeio of this treeárvore,
you see the ancestorsantepassados.
43
130557
2372
No meio desta árvore,
vemos os antepassados.
02:24
And as we go to the peripheryperiferia,
you see the descendantsdescendentes.
44
132953
2604
À medida que avançamos para a periferia,
vemos os descendentes.
02:27
This treeárvore has sevenSete
generationsgerações, approximatelyaproximadamente.
45
135581
3102
Esta árvore tem sete gerações,
aproximadamente.
02:31
Now, this is what happensacontece
when we increaseaumentar the numbernúmero of individualsindivíduos
46
139692
3234
Isto é o que acontece
quando aumentamos
o número de indivíduos
para 70 000 pessoas,
02:34
to 70,000 people --
47
142950
1828
02:36
still a tinyminúsculo subsetsubconjunto
of all the datadados that we have.
48
144802
4330
ainda um pequeno subconjunto
de todos os dados que temos.
02:41
DespiteApesar de that, you can already see
the formationformação of giganticgigantesco familyfamília treesárvores
49
149629
4813
Apesar disso, já podemos ver
a formação de gigantescas árvores
02:46
with manymuitos very distantdistante relativesparentes.
50
154466
2655
com parentes muito distantes.
02:49
ThanksObrigado to the hardDifícil work
of our genealogistsGenealogistas,
51
157610
3134
Graças ao trabalho esforçado
dos nossos genealogistas,
02:52
we can go back in time
hundredscentenas of yearsanos agoatrás.
52
160768
3103
podemos recuar no tempo
centenas de anos.
02:56
For exampleexemplo, here is AlexanderAlexander HamiltonHamilton,
53
164418
3441
Por exemplo, este é Alexander Hamilton,
02:59
who was bornnascermos in 1755.
54
167883
2475
que nasceu em 1755.
03:02
AlexanderAlexander was the first
US SecretarySecretário of the TreasuryTesouraria,
55
170872
3764
Alexander foi o primeiro
Secretário do Tesouro dos EUA
03:06
but mostlyna maioria das vezes knownconhecido todayhoje
duevencimento to a popularpopular BroadwayBroadway musicalmusical.
56
174660
3831
mas é mais conhecido hoje
devido a um musical da Broadway.
03:11
We foundencontrado that AlexanderAlexander has deeperDeeper
connectionsconexões in the showbizShowbiz industryindústria.
57
179137
4922
Descobrimos que Alexander tem profundas
ligações com a indústria do espetáculo.
03:16
In factfacto, he's a bloodsangue relativerelativo of ...
58
184083
2111
Na verdade, é parente consanguíneo de...
03:18
KevinKevin BaconBacon!
59
186781
1220
Kevin Bacon!
03:20
(LaughterRiso)
60
188025
2032
(Risos)
03:22
BothOs dois of them are descendantsdescendentes
of a ladysenhora from ScotlandEscócia
61
190081
2606
Ambos são descendentes
de uma senhora escocesa
03:24
who livedvivia in the 13thº centuryséculo.
62
192711
2314
que viveu no século XIII.
03:27
So you can say that AlexanderAlexander HamiltonHamilton
63
195049
3102
Assim, podemos dizer
que Alexander Hamilton
03:30
is 35 degreesgraus of KevinKevin BaconBacon genealogyGenealogia.
64
198175
3188
tem 35 graus de genealogia
de Kevin Bacon.
03:33
(LaughterRiso)
65
201387
1441
(Risos)
03:34
And our treeárvore has millionsmilhões
of storieshistórias like that.
66
202852
3230
A nossa árvore tem milhões
de histórias destas.
03:40
We investedinvestido significantsignificativo effortsesforços
to validatevalidar the qualityqualidade of our datadados.
67
208113
4890
Investimos esforços significativos
para validar a qualidade dos dados.
03:45
UsingUsando DNADNA, we foundencontrado that .3 percentpor cento of
the mother-childmãe-criança connectionsconexões in our datadados
68
213027
5391
Usando o ADN, descobrimos que 0,3%
das ligações mãe-filho nos nossos dados
03:50
are wrongerrado,
69
218442
1250
estão incorretos,
03:51
whichqual could matchpartida the adoptionadoção ratetaxa
in the US pre-Secondpré-Segundo WorldMundo WarGuerra.
70
219716
3591
o que coincide com a taxa de adoções
nos EUA, antes da II Guerra Mundial.
03:56
For the father'spai sidelado,
71
224847
1785
Do lado do pai,
03:58
the newsnotícia is not as good:
72
226656
1961
as notícias não são tão boas.
04:02
1.9 percentpor cento of the father-childpai-filho
connectionsconexões in our datadados are wrongerrado.
73
230149
5600
Há 1,9% das ligações pai-filho
nos nossos dados que são incorretas.
04:07
And I see some people smirksorriso over here.
74
235773
2363
Vejo aqui algumas pessoas
com um sorriso amarelo.
04:10
It is what you think --
75
238160
1717
É o que estão a pensar,
04:11
there are manymuitos milkmenleiteiros out there.
76
239901
1789
há aqui muitos cucos.
04:13
(LaughterRiso)
77
241714
1064
(Risos)
04:14
HoweverNo entanto, this 1.9 percentpor cento errorerro ratetaxa
in patrilinealpatrilineal connectionsconexões
78
242802
3989
Mas este erro de 1,9%
nas ligações patrilineares
04:18
is not uniqueúnico to our datadados.
79
246815
1769
não existe apenas nos nossos dados.
04:20
PreviousAnterior studiesestudos foundencontrado
a similarsemelhante errorerro ratetaxa
80
248608
3069
Estudos anteriores encontraram
uma taxa semelhante de erro
04:23
usingusando clinical-gradeclínico-grau pedigreespedigrees.
81
251701
2021
usando genealogias do foro clínico.
04:26
So the qualityqualidade of our datadados is good,
82
254254
2525
Portanto, a qualidade
dos nossos dados é boa
04:28
and that should not be a surprisesurpresa.
83
256803
2133
e isso não deve constituir uma surpresa.
04:30
Our genealogistsGenealogistas have
a profoundprofundo, vestedinvestido interestinteresse
84
258960
3776
Os nossos genealogistas
têm um profundo interesse
04:34
in correctlycorretamente documentingdocumentando
theirdeles familyfamília historyhistória.
85
262760
3668
em documentar corretamente
a sua história de família.
04:40
We can leveragealavancagem this datadados to learnaprender
quantitativequantitativo informationem formação about humanityhumanidade,
86
268594
4591
Podemos usar estes dados para obter
informações quantitativas da humanidade,
04:45
for exampleexemplo, questionsquestões about demographydemografia.
87
273209
2596
como, por exemplo,
questões sobre demografia.
04:47
Here is a look at all our profilesperfis
on the mapmapa of the worldmundo.
88
275829
3857
Isto é uma visão de todos
os nossos perfis no mapa mundo.
04:52
EachCada pixelpixel is a personpessoa
that livedvivia at some pointponto.
89
280250
4481
Cada pixel é uma pessoa
que viveu em dada altura.
Como temos tantos dados,
04:56
And sinceDesde a we have so much datadados,
90
284755
1680
04:58
you can see the contourscontornos
of manymuitos countriespaíses,
91
286459
2781
podemos ver os contornos
de muitos países,
05:01
especiallyespecialmente in the WesternWestern worldmundo.
92
289264
2099
em especial no mundo ocidental.
05:03
In this clipgrampo, we stratifiedestratificada
the mapmapa that I've showedmostrou you
93
291387
3548
Neste "clip", estratificámos
o mapa que vos mostrei,
05:06
basedSediada on the yearano of birthsnascimentos of individualsindivíduos
from 1400 to 1900,
94
294959
5072
com base no ano de nascimentos
de pessoas entre 1400 e 1900.
05:12
and we comparedcomparado it
to knownconhecido migrationmigração eventseventos.
95
300055
2766
Comparámos esses dados
com movimentos migratórios conhecidos.
05:15
The clipgrampo is going to showexposição you
that the deepestmais profundo lineageslinhagens in our datadados
96
303482
3165
O "clip" mostra que as linhagens
mais profundas dos nossos dados
05:18
go all the way back to the UKREINO UNIDO,
97
306671
1627
vão todas parar ao Reino Unido,
05:20
where they had better recordregistro keepingguardando,
98
308322
1808
onde havia registos melhores
05:22
and then they spreadespalhar alongao longo
the routesrotas of WesternWestern colonialismcolonialismo.
99
310154
3282
e depois vão espalhar-se
pelas vias do colonialismo ocidental.
05:25
Let's watch this.
100
313460
1322
Vamos observar.
05:27
(MusicMúsica)
101
315143
1609
05:28
[YearAno of birthnascimento: ]
102
316776
2341
[Ano de nascimento:]
[1492 - Colombo navega no oceano azul]
05:31
[1492 - ColumbusColumbus sailsvelas the oceanoceano blueazul]
103
319705
1836
05:35
[1620 - MayflowerMayflower landsterras in MassachusettsMassachusetts]
104
323661
2000
[1620 - O Mayflower atraca
em Massachusetts]
[1652 - Os holandeses
instalam-se na África do Sul]
05:38
[1652 - DutchHolandês settleSettle in SouthSul AfricaÁfrica]
105
326726
1775
[1788 - Começa o transporte de presos
da Grã-Bretanha para a Austrália]
05:44
[1788 - Great BritainGrã-Bretanha penalpenal
transportationtransporte to AustraliaAustrália startscomeça]
106
332321
3186
05:47
[1836 - First migrantsmigrantes use OregonOregon TrailTrilha]
107
335531
1927
[1836 - Os primeiros migrantes
usam o Trilho do Oregon]
05:50
[all activityatividade]
108
338149
3183
[Todas as atividades]
05:55
I love this moviefilme.
109
343851
1543
Adoro este filme.
05:57
Now, sinceDesde a these migrationmigração eventseventos
are givingdando the contextcontexto of familiesfamílias,
110
345418
5093
Já que estes episódios de migração
põem as famílias em contexto,
06:02
we can askpergunte questionsquestões suchtal as:
111
350535
2183
podemos fazer perguntas como:
06:04
What is the typicaltípica distancedistância
betweenentre the birthnascimento locationsLocalizações
112
352742
3470
Qual é a distância habitual
entre os locais de nascimento
06:08
of husbandsmaridos and wivesesposas?
113
356236
2812
de maridos e mulheres?
06:11
This distancedistância playstocam
a pivotalPivotal roleFunção in demographydemografia,
114
359072
3677
Essa distância desempenha
um papel fundamental na demografia
06:14
because the patternspadrões in whichqual
people migratemigrar to formFormato familiesfamílias
115
362773
3681
porque os padrões em que
as pessoas migram para formar famílias
06:18
determinedeterminar how genesgenes spreadespalhar
in geographicalgeográfica areasáreas.
116
366478
3713
determinam como os genes
se espalham pelas áreas geográficas.
06:22
We analyzedanalisado this distancedistância usingusando our datadados,
117
370706
2328
Analisámos essa distância,
usando os nossos dados
06:25
and we foundencontrado that in the oldvelho daysdias,
118
373058
2290
e descobrimos que, antigamente,
isso era fácil para as pessoas.
06:27
people had it easyfácil.
119
375372
1230
06:28
They just marriedcasado someonealguém
in the villagealdeia nearbynas proximidades.
120
376626
2594
Casavam com alguém
da aldeia vizinha.
06:31
But the IndustrialIndustrial RevolutionRevolução
really complicatedcomplicado our love life.
121
379958
3705
Mas a Revolução Industrial
complicou a nossa vida amorosa.
06:35
And todayhoje, with affordableacessível flightsvôos
and onlineconectados socialsocial mediameios de comunicação,
122
383687
4560
E hoje, com os voos económicos
e as redes sociais
06:40
people typicallytipicamente migratemigrar more than
100 kilometersquilômetros from theirdeles placeLugar, colocar of birthnascimento
123
388271
4828
as pessoas migram a mais de 100 km
de distância do local do nascimento
06:45
to find theirdeles soulalma matecompanheiro de.
124
393123
1504
para encontrar uma alma gémea.
06:48
So now you mightpoderia askpergunte:
125
396524
1187
Agora, podem perguntar:
06:49
OK, but who does the hardDifícil work
of migratingmigrando from placeslocais to placeslocais
126
397735
4496
"Ok, mas quem se dá ao trabalho
de migrar de um local para outro
06:54
to formFormato familiesfamílias?
127
402255
1269
"para formar uma família?
06:55
Are these the malesmachos or the femalesfêmeas?
128
403548
3727
"É o homem ou é a mulher?"
06:59
We used our datadados to addressendereço this questionquestão,
129
407752
2155
Usámos os nossos dados
para responder a esta pergunta
07:01
and at leastpelo menos in the last 300 yearsanos,
130
409931
2594
e, pelo menos, nos últimos 300 anos,
07:04
we foundencontrado that the ladiessenhoras do the hardDifícil work
131
412549
3883
descobrimos que são as mulheres
que têm o trabalho difícil
07:08
of migratingmigrando from placeslocais
to placeslocais to formFormato familiesfamílias.
132
416456
2996
de migrar de um local para outro
para formar uma família.
07:11
Now, these resultsresultados
are statisticallyestatisticamente significantsignificativo,
133
419476
3101
Estes resultados são significativos,
do ponto de vista estatístico,
07:14
so you can take it as scientificcientífico factfacto
that malesmachos are lazypreguiçoso.
134
422601
3471
por isso, podem considerar
como facto científico,
que os homens são preguiçosos.
07:18
(LaughterRiso)
135
426096
3156
(Risos)
07:21
We can movemover from questionsquestões
about demographydemografia
136
429276
2536
Podemos passar das perguntas
sobre demografia
07:23
and askpergunte questionsquestões about humanhumano healthsaúde.
137
431836
2913
para fazer perguntas
sobre a saúde humana.
07:26
For exampleexemplo, we can askpergunte
138
434773
1487
Por exemplo, podemos perguntar
07:28
to what extentextensão geneticgenético variationsvariações
accountconta for differencesdiferenças in life spanperíodo
139
436284
4963
até que ponto as variações
genéticas existentes
contribuem para as diferenças
na longevidade entre indivíduos.
07:33
betweenentre individualsindivíduos.
140
441271
1194
07:34
PreviousAnterior studiesestudos analyzedanalisado the correlationcorrelação
of longevitylongevidade betweenentre twinsgêmeos
141
442988
4530
Estudos anteriores analisaram
a correlação de longevidade entre gémeos
07:39
to addressendereço this questionquestão.
142
447542
1442
para responder a esta pergunta.
07:41
They estimatedestimado that the geneticgenético
variationsvariações accountconta for
143
449411
2667
Calcularam que as variações genéticas
contribuem em cerca de um quarto
07:44
about a quartertrimestre of the differencesdiferenças
in life spanperíodo betweenentre individualsindivíduos.
144
452102
4040
da diferença na longevidade
dos indivíduos.
07:48
But twinsgêmeos can be correlatedcorrelacionado
duevencimento to so manymuitos reasonsrazões,
145
456688
2598
Mas os gémeos podem ser correlacionados
devido a muitas razões,
07:51
includingIncluindo variousvários environmentalde Meio Ambiente effectsefeitos
146
459310
2304
incluindo diversos efeitos ambientais
07:53
or a sharedcompartilhado householdfamília.
147
461638
1622
ou a um lar partilhado.
07:56
LargeGrande familyfamília treesárvores give us the opportunityoportunidade
to analyzeanalisar bothambos closefechar relativesparentes,
148
464411
3753
As grandes árvores genealógicas
dão-nos a oportunidade
de analisar parentes próximos,
como os gémeos,
08:00
suchtal as twinsgêmeos,
149
468188
1207
08:01
all the way to distantdistante relativesparentes,
even fourthquarto cousinsprimos.
150
469419
2917
ou parentes distantes,
até primos em quarto grau.
08:04
This way we can buildconstruir robustrobusto modelsmodelos
151
472749
2689
Desta forma, podemos construir
modelos robustos
08:07
that can teasetease apartseparados the contributioncontribuição
of geneticgenético variationsvariações
152
475462
3708
que podem separar a contribuição
de variações genéticas
08:11
from environmentalde Meio Ambiente factorsfatores.
153
479194
1717
e a contribuição dos fatores ambientais.
08:13
We conductedrealizado this analysisanálise usingusando our datadados,
154
481379
2899
Efetuámos esta análise
usando os nossos dados
08:16
and we foundencontrado that geneticgenético variationsvariações
explainexplicar only 15 percentpor cento
155
484302
5791
e descobrimos que as variações genéticas
explicam apenas 15% das diferenças
na longevidade entre indivíduos.
08:22
of the differencesdiferenças in life spanperíodo
betweenentre individualsindivíduos.
156
490117
2806
08:26
That is fivecinco yearsanos, on averagemédia.
157
494760
2756
Ou seja, cinco anos em média.
08:30
So genesgenes matterimportam lessMenos than
what we thought before to life spanperíodo.
158
498316
4708
Assim, os genes são menos importantes
que aquilo que pensávamos,
em termos de longevidade.
08:35
And I find it great newsnotícia,
159
503675
2136
E eu acho que é uma boa notícia
08:38
because it meanssignifica that
our actionsações can matterimportam more.
160
506438
3293
porque significa que as nossas ações
são mais importantes.
08:42
SmokingFumar, for exampleexemplo, determinesdetermina
10 yearsanos of our life expectancyexpectativa --
161
510533
4274
Fumar, por exemplo, determina 10 anos
da nossa esperança de vida
08:46
twiceduas vezes as much as what geneticsgenética determinesdetermina.
162
514831
2646
— o dobro do que é determinado
pela genética.
Podemos vir a encontrar
mais descobertas surpreendentes
08:50
We can even have more surprisingsurpreendente findingsconclusões
163
518236
2289
08:52
as we movemover from familyfamília treesárvores
164
520549
1492
se nos afastamos das árvores genealógicas
08:54
and we let our genealogistsGenealogistas
documentdocumento and crowdsourcecrowdsourcing DNADNA informationem formação.
165
522065
4732
e deixarmos os nossos genealogistas
documentarem informações de ADN.
08:58
And the resultsresultados can be amazingsurpreendente.
166
526821
2024
Os resultados podem revelar-se espantosos.
09:01
It mightpoderia be hardDifícil to imagineImagine,
but UncleTio BernieBernie and his friendsamigos
167
529255
3915
Pode ser difícil imaginar
mas o Tio Bernie e os seus amigos
09:05
can createcrio DNADNA forensicforense capabilitiescapacidades
168
533194
2646
podem criar competências
forenses de ADN
09:07
that even exceedexceder
what the FBIFBI currentlyatualmente has.
169
535864
3559
que ultrapassem o que o FBI
tem atualmente.
09:12
When you placeLugar, colocar the DNADNA
on a largeampla familyfamília treeárvore,
170
540862
2404
Quando colocamos o ADN
numa grande árvore genealógica,
09:15
you effectivelyefetivamente createcrio a beaconfarol
171
543290
2117
estamos a criar um farol
09:17
that illuminatesacende-se the hundredscentenas
of distantdistante relativesparentes
172
545431
2634
que ilumina as centenas
de parentes distantes
09:20
that are all connectedconectado to the personpessoa
that originatedoriginado the DNADNA.
173
548089
3490
que estão todos ligados à pessoa
que originou esse ADN.
09:24
By placingcolocação multiplemúltiplo beaconsbalizas
on a largeampla familyfamília treeárvore,
174
552505
2913
Colocando múltiplos faróis
numa grande árvore genealógica,
09:27
you can now triangulatetriangular the DNADNA
of an unknowndesconhecido personpessoa,
175
555442
3720
podemos triangular o ADN
duma pessoa desconhecida,
09:31
the samemesmo way that the GPSGPS systemsistema
usesusa multiplemúltiplo satellitessatélites
176
559186
3938
tal como o sistema GPS
usa múltiplos satélites
09:35
to find a locationlocalização.
177
563148
1324
para encontrar um local.
09:37
The primePrime exampleexemplo
of the powerpoder of this techniquetécnica
178
565226
3624
O exemplo principal
do poder desta técnica
09:40
is capturingcapturando the GoldenDourado StateEstado KillerAssassino,
179
568874
2675
é a captura do Assassino do Golden State,
09:44
one of the mosta maioria notoriousnotório criminalscriminosos
in the historyhistória of the US.
180
572612
4528
um dos criminosos mais famosos
da história dos EUA.
09:49
The FBIFBI had been searchingprocurando
for this personpessoa for over 40 yearsanos.
181
577164
5892
O FBI andava à procura
desta pessoa há mais de 40 anos.
09:55
They had his DNADNA,
182
583588
1835
Tinham o ADN dele,
09:57
but he never showedmostrou up
in any policepolícia databasebase de dados.
183
585447
3350
mas ele nunca apareceu
em nenhuma base de dados da polícia.
10:01
About a yearano agoatrás, the FBIFBI
consultedconsultado a geneticgenético genealogistGenealogista,
184
589447
4712
Há cerca de um ano, o FBI
consultou uma genealogista genética
10:06
and she suggestedsugerido that they submitenviar
his DNADNA to a genealogyGenealogia serviceserviço
185
594183
3950
e ela sugeriu que colocassem
o ADN num serviço de genealogias
10:10
that can locateLocalize distantdistante relativesparentes.
186
598157
2398
que pode localizar parentes distantes.
10:13
They did that,
187
601117
1156
Foi o que fizeram
10:14
and they foundencontrado a thirdterceiro cousinprimo
of the GoldenDourado StateEstado KillerAssassino.
188
602297
3692
e encontraram um primo terceiro
do Assassino do Golden State.
10:18
They builtconstruído a largeampla familyfamília treeárvore,
189
606013
2344
Criaram uma grande árvore genealógica,
10:20
scanneddigitalizado the differentdiferente
branchesRamos of that treeárvore,
190
608381
2102
percorreram os vários ramos dessa árvore,
10:22
untilaté they foundencontrado a profilePerfil
that exactlyexatamente matchedcoincide
191
610507
2565
até que encontraram um perfil
que correspondia exatamente
10:25
what they knewsabia about
the GoldenDourado StateEstado KillerAssassino.
192
613096
2581
ao que eles conheciam
do Assassino do Golden State.
10:27
They obtainedobtidos DNADNA from this personpessoa
and foundencontrado a perfectperfeito matchpartida
193
615701
3592
Obtiveram o ADN dessa pessoa
e encontraram uma correspondência perfeita
10:31
to the DNADNA they had in handmão.
194
619317
2025
ao ADN que tinham na mão.
10:33
They arrestedpreso him
and broughttrouxe him to justicejustiça
195
621366
2350
Prenderam-no e apresentaram-no à Justiça
10:35
after all these yearsanos.
196
623740
1424
ao fim desses anos todos.
10:38
SinceDesde then, geneticgenético genealogistsGenealogistas
have startedcomeçado workingtrabalhando with
197
626172
3241
A partir daí, os genealogistas genéticos
começaram a trabalhar
10:41
locallocal US lawlei enforcementexecução agenciesagências
198
629437
2668
com as agências policiais locais dos EUA
10:44
to use this techniquetécnica
in orderordem to capturecapturar criminalscriminosos.
199
632129
3362
para usarem esta técnica,
a fim de capturar criminosos.
10:47
And only in the pastpassado sixseis monthsmeses,
200
635521
2681
Só nos últimos seis meses,
10:50
they were ablecapaz to solveresolver
over 20 coldfrio casescasos with this techniquetécnica.
201
638226
4296
conseguiram resolver, com esta técnica,
mais de 20 casos arquivados.
10:56
LuckilyPor sorte, we have people like UncleTio
BernieBernie and his fellowcompanheiro genealogistsGenealogistas
202
644203
4636
Felizmente, temos pessoas
como o Tio Bernie e os genealogistas.
11:01
These are not amateursamadores
with a self-servingauto-serviço hobbypassatempo.
203
649045
2994
Não são amadores
com um passatempo egoísta.
11:04
These are citizencidadão scientistscientistas
with a deepprofundo passionpaixão to tell us who we are.
204
652602
6419
São cidadãos cientistas
com a profunda paixão
de nos dizerem quem somos.
11:11
And they know that the pastpassado
can holdaguarde a keychave to the futurefuturo.
205
659065
4458
Sabem que o passado
pode conter a chave do futuro.
11:16
Thank you very much.
206
664067
1183
Muito obrigado.
11:17
(ApplauseAplausos)
207
665314
3469
(Aplausos)
Translated by Margarida Ferreira
Reviewed by Joana Rodrigues

▲Back to top

ABOUT THE SPEAKER
Yaniv Erlich - Computational geneticist
Yaniv Erlich is fascinated by the connection between DNA and data.

Why you should listen

As a professor and researcher at Columbia University and as CSO of MyHeritage.com, Yaniv Erlich has performed foundational work in genetic privacy and large-scale studies of crowdsourced genomic data. Dubbed a "genome hacker" by the journal Nature, Erlich and his team discovered a privacy loophole enabling reidentification of allegedly anonymous male research participants using just internet searches and their Y chromosome. Later, he discovered that 60 percent of all US individuals with European descent can be identified by forensic genetics using open genetic genealogy databases, which Science magazine called one of the top 10 breakthroughs of 2018.

Erlich is also responsible for the construction of the world's largest family tree, comprising 13 million people, as well as the development of the website DNA.land, which has compiled the genotypes of more than 150,000 donors. He has also worked to discover the genetic bases for several conditions in Israeli families. His team has demonstrated stable DNA data storage, reaching a density of 215 petabyte per gram of DNA. He's been awarded numerous prizes, has published more than 45 papers and authored seven patents.

More profile about the speaker
Yaniv Erlich | Speaker | TED.com