ABOUT THE SPEAKER
Yaniv Erlich - Computational geneticist
Yaniv Erlich is fascinated by the connection between DNA and data.

Why you should listen

As a professor and researcher at Columbia University and as CSO of MyHeritage.com, Yaniv Erlich has performed foundational work in genetic privacy and large-scale studies of crowdsourced genomic data. Dubbed a "genome hacker" by the journal Nature, Erlich and his team discovered a privacy loophole enabling reidentification of allegedly anonymous male research participants using just internet searches and their Y chromosome. Later, he discovered that 60 percent of all US individuals with European descent can be identified by forensic genetics using open genetic genealogy databases, which Science magazine called one of the top 10 breakthroughs of 2018.

Erlich is also responsible for the construction of the world's largest family tree, comprising 13 million people, as well as the development of the website DNA.land, which has compiled the genotypes of more than 150,000 donors. He has also worked to discover the genetic bases for several conditions in Israeli families. His team has demonstrated stable DNA data storage, reaching a density of 215 petabyte per gram of DNA. He's been awarded numerous prizes, has published more than 45 papers and authored seven patents.

More profile about the speaker
Yaniv Erlich | Speaker | TED.com
TEDMED 2018

Yaniv Erlich: How we're building the world's largest family tree

雅尼夫‧埃利希: 我们如何建立世界上最大的家谱树

Filmed:
1,507,766 views

计算遗传学家亚尼夫·埃尔利希 (Yaniv Erlich) 帮助建立了世界上最大的家谱——包括1300 万人,可以追溯到 500 多年前。他分享了一些有趣的研究模式——关于我们的爱情生活、我们的健康,甚至几十年前的刑事案件——并展示了众包家谱数据库如何不仅能揭示过去,还能揭示未来。
- Computational geneticist
Yaniv Erlich is fascinated by the connection between DNA and data. Full bio

Double-click the English transcript below to play the video.

00:12
People use the internet互联网
for various各个 reasons原因.
0
817
3452
人们因各种原因使用着互联网。
00:17
It turns out that one of the most
popular流行 categories类别 of website网站
1
5765
3804
一种最受欢迎的网站
00:21
is something that people
typically一般 consume消耗 in private私人的.
2
9593
2872
是人们常常私下浏览的东西。
00:25
It involves涉及 curiosity好奇心,
3
13639
2510
它涉及到好奇心,
00:28
non-insignificant非显著性 levels水平
of self-indulgence自我放纵
4
16173
3796
无关自我放纵程度,
00:31
and is centered中心 around recording记录
the reproductive生殖 activities活动
5
19993
3260
并以记录他人的生殖记录
00:35
of other people.
6
23277
1309
为中心。
00:36
(Laughter笑声)
7
24610
1032
(笑声)
00:37
Of course课程, I'm talking about genealogy家谱 --
8
25666
2250
当然,我讨论的是家谱学——
00:39
(Laughter笑声)
9
27940
1214
(笑声)
00:41
the study研究 of family家庭 history历史.
10
29178
1702
也就是对家庭历史的研究。
00:43
When it comes to detailing详细 family家庭 history历史,
11
31353
2037
当说到详细的家族历史,
00:45
in every一切 family家庭, we have this person
that is obsessed痴迷 with genealogy家谱.
12
33414
3943
在每个家庭中,我们都有
一个痴迷于家谱的人。
00:49
Let's call him Uncle叔叔 Bernie伯尼.
13
37381
1713
我们姑且叫他伯尼叔叔吧。
00:51
Uncle叔叔 Bernie伯尼 is exactly究竟 the last person
you want to sit next下一个 to
14
39118
3782
伯尼叔叔正是你在感恩节晚餐上,
00:54
in Thanksgiving感恩 dinner晚餐,
15
42924
1599
最不想坐在一起的人,
00:56
because he will bore you to death死亡
with peculiar奇特 details细节
16
44547
2814
因为他会用一些远古亲戚的奇特细节
00:59
about some ancient relatives亲戚们.
17
47385
1966
把你烦死。
01:02
But as you know,
18
50462
1262
但正如你所知,
01:03
there is a scientific科学 side for everything,
19
51748
2872
任何事物都有科学的一面,
01:06
and we found发现 that Uncle叔叔 Bernie's伯尼的 stories故事
20
54644
2978
我们发现伯尼叔叔的故事
01:09
have immense巨大 potential潜在
for biomedical生物医药 research研究.
21
57646
3168
具有巨大的生物医学研究潜力。
01:13
We let Uncle叔叔 Bernie伯尼
and his fellow同伴 genealogists系谱
22
61306
2714
我们让伯尼叔叔和他的家谱同行,
01:16
document文件 their family家庭 trees树木 through通过
a genealogy家谱 website网站 called geniGENI.comCOM.
23
64044
4668
通过族谱网站 geni.com
记录他们的家谱。
01:21
When users用户 upload上载
their trees树木 to the website网站,
24
69198
2128
当用户上传他们的家谱树到网站时,
01:23
it scans扫描 their relatives亲戚们,
25
71350
1690
网站会扫描他们的亲戚,
01:25
and if it finds认定 matches火柴 to existing现有 trees树木,
26
73064
2075
如果它发现匹配上现存的家谱树,
01:27
it merges合并 the existing现有
and the new tree together一起.
27
75163
3610
它会合并现存的和新的家谱树。
01:31
The result结果 is that large
family家庭 trees树木 are created创建,
28
79768
2950
结果是超大的家族树创建起来了,
01:34
beyond the individual个人 level水平
of each genealogist系谱专家.
29
82742
3479
超越了每个家谱学家的个人水平。
01:38
Now, by repeating重复 this process处理
with millions百万 of people
30
86808
4129
现在,凭借着全球数百万人
01:42
all over the world世界,
31
90961
1817
不断重复这个过程,
01:44
we can crowdsource众包 the construction施工
of a family家庭 tree of all humankind人类.
32
92802
5532
我们可以众包全人类家谱树的建设。
01:51
Using运用 this website网站,
33
99292
1584
使用这个网站,
01:52
we were able能够 to connect 125 million百万 people
34
100900
4813
我们能够在一颗家族树上连接
01:57
into a single family家庭 tree.
35
105737
2521
1.25 亿人。
02:00
I cannot不能 draw the tree
on the screens屏幕 over here
36
108967
2788
我无法在这里的屏幕上画家谱树,
02:03
because they have less pixels像素
37
111779
2165
因为它们的像素比
02:05
than the number of people in this tree.
38
113968
2513
在这棵树上的人还少。
02:08
But here is an example of a subset子集
of 6,000 individuals个人.
39
116505
5010
但这里有一个 6000 人的子集例子。
02:14
Each green绿色 node节点 is a person.
40
122159
2362
每一个绿色的节点是一个人。
02:17
The red nodes节点 represent代表 marriages婚姻,
41
125060
2849
红色的节点代表婚姻,
02:19
and the connections连接 represent代表 parenthood父母.
42
127933
2258
连接代表亲子关系。
02:22
In the middle中间 of this tree,
you see the ancestors祖先.
43
130557
2372
在这个树的中央是祖先。
02:24
And as we go to the periphery周边,
you see the descendants后人.
44
132953
2604
外围是后代。
这棵树大约有 7 代。
02:27
This tree has seven
generations, approximately.
45
135581
3102
02:31
Now, this is what happens发生
when we increase增加 the number of individuals个人
46
139692
3234
而这是当我们增加人数到 7 万人时
02:34
to 70,000 people --
47
142950
1828
的样子——
02:36
still a tiny subset子集
of all the data数据 that we have.
48
144802
4330
仍然是我们拥有的所有
数据集的一小部分。
02:41
Despite尽管 that, you can already已经 see
the formation编队 of gigantic巨大 family家庭 trees树木
49
149629
4813
即便如此,你已经能够看到由许多远亲
02:46
with many许多 very distant遥远 relatives亲戚们.
50
154466
2655
组成的一棵巨大家谱树。
02:49
Thanks谢谢 to the hard work
of our genealogists系谱,
51
157610
3134
感谢家谱学家的努力工作,
02:52
we can go back in time
hundreds数以百计 of years年份 ago.
52
160768
3103
我们可以回到数百年前。
02:56
For example, here is Alexander亚历山大 Hamilton汉密尔顿,
53
164418
3441
比如,这是亚历山大·汉密尔顿,
02:59
who was born天生 in 1755.
54
167883
2475
他出生于 1755 年。
03:02
Alexander亚历山大 was the first
US Secretary秘书 of the Treasury金库,
55
170872
3764
亚历山大是首任美国财政部长,
03:06
but mostly大多 known已知 today今天
due应有 to a popular流行 Broadway百老汇 musical音乐.
56
174660
3831
但主要由于一部流行的百老汇
音乐剧而广为人知。
03:11
We found发现 that Alexander亚历山大 has deeper更深
connections连接 in the showbiz演艺圈 industry行业.
57
179137
4922
我们发现亚历山大在娱乐圈
有更深厚的人脉。
03:16
In fact事实, he's a blood血液 relative相对的 of ...
58
184083
2111
事实上,他是——
03:18
Kevin凯文 Bacon培根!
59
186781
1220
凯文·贝肯的血亲!
03:20
(Laughter笑声)
60
188025
2032
(笑声)
03:22
Both of them are descendants后人
of a lady淑女 from Scotland苏格兰
61
190081
2606
他们都是13世纪一位来自
03:24
who lived生活 in the 13th century世纪.
62
192711
2314
苏格兰的女士的后代。
03:27
So you can say that Alexander亚历山大 Hamilton汉密尔顿
63
195049
3102
所以你可以说亚历山大·汉密尔顿
03:30
is 35 degrees of Kevin凯文 Bacon培根 genealogy家谱.
64
198175
3188
是 35 度凯文·贝肯的宗谱。
03:33
(Laughter笑声)
65
201387
1441
(笑声)
03:34
And our tree has millions百万
of stories故事 like that.
66
202852
3230
我们的家谱树有数百万类似的故事。
03:40
We invested投资 significant重大 efforts努力
to validate验证 the quality质量 of our data数据.
67
208113
4890
我们投入了不小的工作
在验证数据的质量上。
03:45
Using运用 DNA脱氧核糖核酸, we found发现 that .3 percent百分 of
the mother-child母子 connections连接 in our data数据
68
213027
5391
使用DNA,我们发现我们
数据中有 0.3% 的母子关系
03:50
are wrong错误,
69
218442
1250
是错误的,
03:51
which哪一个 could match比赛 the adoption采用 rate
in the US pre-Second第二秒前 World世界 War战争.
70
219716
3591
这可能与二战前美国的收养率相当。
03:56
For the father's父亲的 side,
71
224847
1785
父亲方面,
03:58
the news新闻 is not as good:
72
226656
1961
消息也并不乐观:
04:02
1.9 percent百分 of the father-child父亲-儿童
connections连接 in our data数据 are wrong错误.
73
230149
5600
我们的数据中 1.9% 的
父子关系是错误的。
04:07
And I see some people smirk傻笑 over here.
74
235773
2363
我看到有人在这儿讪笑。
04:10
It is what you think --
75
238160
1717
这是你们在想的——
04:11
there are many许多 milkmen送奶员 out there.
76
239901
1789
外面有很多挤牛奶的人。
04:13
(Laughter笑声)
77
241714
1064
(笑声)
04:14
However然而, this 1.9 percent百分 error错误 rate
in patrilineal父系 connections连接
78
242802
3989
然而这 1.9% 的父子关系错误率
04:18
is not unique独特 to our data数据.
79
246815
1769
不是我们数据独有的。
04:20
Previous以前 studies学习 found发现
a similar类似 error错误 rate
80
248608
3069
早先使用临床级血统的研究
04:23
using运用 clinical-grade临床级 pedigrees家谱.
81
251701
2021
也发现了类似的错误率。
04:26
So the quality质量 of our data数据 is good,
82
254254
2525
所以我们的数据质量是良好的,
04:28
and that should not be a surprise.
83
256803
2133
并且这也不应该是个意外。
04:30
Our genealogists系谱 have
a profound深刻, vested既得利益 interest利益
84
258960
3776
我们的系谱学家对正确记录
04:34
in correctly正确地 documenting文档化
their family家庭 history历史.
85
262760
3668
他们的家族史有着浓厚的兴趣。
04:40
We can leverage杠杆作用 this data数据 to learn学习
quantitative information信息 about humanity人性,
86
268594
4591
我们可以利用这些数据来
了解人类的定量信息,
04:45
for example, questions问题 about demography人口统计学.
87
273209
2596
比如,有关人口统计学的问题。
04:47
Here is a look at all our profiles型材
on the map地图 of the world世界.
88
275829
3857
这是我们的资料在世界地图上的样子。
04:52
Each pixel像素 is a person
that lived生活 at some point.
89
280250
4481
每个像素代表一个生活在特定位置的人。
04:56
And since以来 we have so much data数据,
90
284755
1680
由于我们有很多数据,
04:58
you can see the contours轮廓
of many许多 countries国家,
91
286459
2781
你可以看到很多国家的轮廓,
05:01
especially特别 in the Western西 world世界.
92
289264
2099
尤其在西方世界。
05:03
In this clip, we stratified分层
the map地图 that I've showed显示 you
93
291387
3548
在这个视频片段中,
我们把给你展示的地图
05:06
based基于 on the year of births出生 of individuals个人
from 1400 to 1900,
94
294959
5072
根据 1400-1900 年出生
的人口进行分层,
05:12
and we compared相比 it
to known已知 migration移民 events事件.
95
300055
2766
并且跟已知的迁移事件比较。
05:15
The clip is going to show显示 you
that the deepest最深 lineages谱系 in our data数据
96
303482
3165
这个视频将向你展示
我们数据中最深的血统,
05:18
go all the way back to the UK联合王国,
97
306671
1627
可以追溯到英国,
05:20
where they had better record记录 keeping保持,
98
308322
1808
这里有更好的记录保存,
05:22
and then they spread传播 along沿
the routes路线 of Western西 colonialism殖民主义.
99
310154
3282
然后他们沿着西方殖民主义
的道路传播。
05:25
Let's watch this.
100
313460
1322
让我们来看看这个。
05:27
(Music音乐)
101
315143
1609
(音乐)
05:28
[Year of birth分娩: ]
102
316776
2341
【出生年份:】
05:31
[1492 - Columbus哥伦布 sails the ocean海洋 blue蓝色]
103
319705
1836
【1492 - 哥伦布蓝色海洋航行时期】
05:35
[1620 - Mayflower五月花 lands土地 in Massachusetts马萨诸塞]
104
323661
2000
【1620 - 五月花号在马萨诸塞州着陆】
05:38
[1652 - Dutch荷兰人 settle解决 in South Africa非洲]
105
326726
1775
【1652 - 荷兰人在南非定居】
05:44
[1788 - Great Britain英国 penal刑事
transportation运输 to Australia澳大利亚 starts启动]
106
332321
3186
【1788 - 英国开始向澳大利亚
进行刑事流放】】
05:47
[1836 - First migrants移民 use Oregon俄勒冈 Trail落后]
107
335531
1927
【1836 - 第一批移民来到俄勒冈小道】
05:50
[all activity活动]
108
338149
3183
【所有活动】
05:55
I love this movie电影.
109
343851
1543
我爱这个视频。
05:57
Now, since以来 these migration移民 events事件
are giving the context上下文 of families家庭,
110
345418
5093
因为这些移民时间
提供了家庭的背景,
06:02
we can ask questions问题 such这样 as:
111
350535
2183
我们可以问诸如此类的问题:
06:04
What is the typical典型 distance距离
between之间 the birth分娩 locations地点
112
352742
3470
丈夫和妻子出生地
06:08
of husbands丈夫 and wives妻子?
113
356236
2812
的特定距离是多少?
06:11
This distance距离 plays播放
a pivotal关键的 role角色 in demography人口统计学,
114
359072
3677
这一距离在人口统计学中
起着重要的作用,
06:14
because the patterns模式 in which哪一个
people migrate迁移 to form形成 families家庭
115
362773
3681
因为人们迁移形成家庭的模式
06:18
determine确定 how genes基因 spread传播
in geographical地理 areas.
116
366478
3713
决定了基因如何在地理位置上传播。
06:22
We analyzed分析 this distance距离 using运用 our data数据,
117
370706
2328
我们使用我们的数据分析了这个距离,
06:25
and we found发现 that in the old days,
118
373058
2290
我们发现在古时候,
06:27
people had it easy简单.
119
375372
1230
人们过得很轻松。
06:28
They just married已婚 someone有人
in the village nearby附近.
120
376626
2594
他们只是跟村子附近的某人结婚。
06:31
But the Industrial产业 Revolution革命
really complicated复杂 our love life.
121
379958
3705
但工业革命复杂化了
我们的爱情生活。
06:35
And today今天, with affordable实惠 flights航班
and online线上 social社会 media媒体,
122
383687
4560
今天,凭着可负担的航班
和网络社交媒体,
06:40
people typically一般 migrate迁移 more than
100 kilometers公里 from their place地点 of birth分娩
123
388271
4828
人们通常从出生地迁移 100 多公里
06:45
to find their soul灵魂 mate伴侣.
124
393123
1504
来寻找灵魂伴侣。
06:48
So now you might威力 ask:
125
396524
1187
所以现在你可能会问:
06:49
OK, but who does the hard work
of migrating迁移 from places地方 to places地方
126
397735
4496
好吧,但是谁会卖力从一个地方
迁移到另一个地方
06:54
to form形成 families家庭?
127
402255
1269
去构建家庭呢?
06:55
Are these the males男性 or the females女性?
128
403548
3727
是男人还是女人?
06:59
We used our data数据 to address地址 this question,
129
407752
2155
我们使用我们的数据解答了这个问题,
07:01
and at least最小 in the last 300 years年份,
130
409931
2594
至少在过去 300 年中,
07:04
we found发现 that the ladies女士们 do the hard work
131
412549
3883
我们发现女性从一个地方
迁移到另一个地方
07:08
of migrating迁移 from places地方
to places地方 to form形成 families家庭.
132
416456
2996
去构建家庭上是最辛苦的。
这些结果在统计上很显著,
07:11
Now, these results结果
are statistically统计学 significant重大,
133
419476
3101
07:14
so you can take it as scientific科学 fact事实
that males男性 are lazy.
134
422601
3471
所以你可以把男性懒惰当作科学事实。
07:18
(Laughter笑声)
135
426096
3156
(笑声)
07:21
We can move移动 from questions问题
about demography人口统计学
136
429276
2536
我们可以把问题从人口统计学开始
07:23
and ask questions问题 about human人的 health健康.
137
431836
2913
转向人类健康问题。
07:26
For example, we can ask
138
434773
1487
比如,我们可以问
07:28
to what extent程度 genetic遗传 variations变化
account帐户 for differences分歧 in life span跨度
139
436284
4963
遗传变异能在多大程度上影响个体的
07:33
between之间 individuals个人.
140
441271
1194
寿命差异。
07:34
Previous以前 studies学习 analyzed分析 the correlation相关
of longevity长寿 between之间 twins双胞胎
141
442988
4530
之前的研究通过分析
双胞胎寿命的相关性
07:39
to address地址 this question.
142
447542
1442
来解答这个问题。
07:41
They estimated预计 that the genetic遗传
variations变化 account帐户 for
143
449411
2667
他们估计出遗传变异
07:44
about a quarter25美分硬币 of the differences分歧
in life span跨度 between之间 individuals个人.
144
452102
4040
对个体寿命差异的影响大约占 1/4。
07:48
But twins双胞胎 can be correlated相关
due应有 to so many许多 reasons原因,
145
456688
2598
但双胞胎之间的关联有很多原因,
07:51
including包含 various各个 environmental环境的 effects效果
146
459310
2304
包括多样的环境影响
07:53
or a shared共享 household家庭.
147
461638
1622
或共同的家庭。
07:56
Large family家庭 trees树木 give us the opportunity机会
to analyze分析 both close relatives亲戚们,
148
464411
3753
庞大的家谱树给了我们分析这些近亲,
08:00
such这样 as twins双胞胎,
149
468188
1207
比如双胞胎,
08:01
all the way to distant遥远 relatives亲戚们,
even fourth第四 cousins表兄弟.
150
469419
2917
到远房亲戚,
甚至四代表亲这样的机会。
08:04
This way we can build建立 robust强大的 models楷模
151
472749
2689
这样我们可以构建稳健的模型,
08:07
that can tease apart距离 the contribution贡献
of genetic遗传 variations变化
152
475462
3708
从环境因素中分离出
08:11
from environmental环境的 factors因素.
153
479194
1717
遗传变异的贡献来。
08:13
We conducted进行 this analysis分析 using运用 our data数据,
154
481379
2899
我们使用数据执行了这个分析,
08:16
and we found发现 that genetic遗传 variations变化
explain说明 only 15 percent百分
155
484302
5791
发现遗传变异只解释了 15% 的
08:22
of the differences分歧 in life span跨度
between之间 individuals个人.
156
490117
2806
个体寿命差异。
08:26
That is five years年份, on average平均.
157
494760
2756
平均而言, 就是 5 年之差。
08:30
So genes基因 matter less than
what we thought before to life span跨度.
158
498316
4708
所以基因对寿命的重要性
比我们之前想象的少。
08:35
And I find it great news新闻,
159
503675
2136
我发现这是个好消息,
08:38
because it means手段 that
our actions行动 can matter more.
160
506438
3293
因为这意味着我们的行动更为重要。
08:42
Smoking抽烟, for example, determines确定
10 years年份 of our life expectancy期待 --
161
510533
4274
举个例子,吸烟会影响
大约10年的预期寿命——
08:46
twice两次 as much as what genetics遗传学 determines确定.
162
514831
2646
是基因所能影响的两倍。
08:50
We can even have more surprising奇怪 findings发现
163
518236
2289
随着我们从家谱树展开,
08:52
as we move移动 from family家庭 trees树木
164
520549
1492
让我们的家谱学专家建档,
08:54
and we let our genealogists系谱
document文件 and crowdsource众包 DNA脱氧核糖核酸 information信息.
165
522065
4732
并且众包DNA信息,
我们能有更多惊奇的发现。
08:58
And the results结果 can be amazing惊人.
166
526821
2024
结果将是惊人的。
09:01
It might威力 be hard to imagine想像,
but Uncle叔叔 Bernie伯尼 and his friends朋友
167
529255
3915
可能令人难以想象,
伯尼叔叔和他的朋友
09:05
can create创建 DNA脱氧核糖核酸 forensic法庭的 capabilities功能
168
533194
2646
能够创建 DNA 法医能力,
09:07
that even exceed超过
what the FBI联邦调查局 currently目前 has.
169
535864
3559
甚至超过了 FBI 目前拥有的水平。
09:12
When you place地点 the DNA脱氧核糖核酸
on a large family家庭 tree,
170
540862
2404
当你把 DNA 放在一棵大的家谱树中,
09:15
you effectively有效 create创建 a beacon烽火
171
543290
2117
你就有效地创造了一个照亮
09:17
that illuminates点亮 the hundreds数以百计
of distant遥远 relatives亲戚们
172
545431
2634
数百个远亲的灯塔,
09:20
that are all connected连接的 to the person
that originated起源 the DNA脱氧核糖核酸.
173
548089
3490
他们都与 DNA 的拥有者有联系。
09:24
By placing配售 multiple beacons信标
on a large family家庭 tree,
174
552505
2913
通过在一棵大的家谱树中
放置不同的灯塔,
09:27
you can now triangulate三角 the DNA脱氧核糖核酸
of an unknown未知 person,
175
555442
3720
你现在可以对一个陌生人
的 DNA 进行三角测量,
09:31
the same相同 way that the GPS全球定位系统 system系统
uses使用 multiple satellites卫星
176
559186
3938
就跟 GPS 系统利用不同的卫星
09:35
to find a location位置.
177
563148
1324
来定位一样。
09:37
The prime主要 example
of the power功率 of this technique技术
178
565226
3624
这种技术威力一个的主要例子
09:40
is capturing捕获 the Golden金色 State Killer凶手,
179
568874
2675
是追捕“金州杀手”,
09:44
one of the most notorious臭名昭著 criminals罪犯
in the history历史 of the US.
180
572612
4528
美国历史上最臭名昭著的罪犯之一。
09:49
The FBI联邦调查局 had been searching搜索
for this person for over 40 years年份.
181
577164
5892
FBI 已经寻找这人超过 40 年。
09:55
They had his DNA脱氧核糖核酸,
182
583588
1835
他们有他的 DNA,
09:57
but he never showed显示 up
in any police警察 database数据库.
183
585447
3350
但他从未出现在警方的数据库中。
10:01
About a year ago, the FBI联邦调查局
consulted咨询 a genetic遗传 genealogist系谱专家,
184
589447
4712
大约一年前,FBI 咨询了
一位基因谱系学家,
10:06
and she suggested建议 that they submit提交
his DNA脱氧核糖核酸 to a genealogy家谱 service服务
185
594183
3950
她建议他们提交他的 DNA
到可以定位远房亲戚
10:10
that can locate定位 distant遥远 relatives亲戚们.
186
598157
2398
的家谱服务平台上。
10:13
They did that,
187
601117
1156
FBI 这样做了,
10:14
and they found发现 a third第三 cousin表姐
of the Golden金色 State Killer凶手.
188
602297
3692
他们找到了金州杀手的第三代表亲。
10:18
They built内置 a large family家庭 tree,
189
606013
2344
他们构建了一棵巨大的家谱树,
10:20
scanned扫描 the different不同
branches分支机构 of that tree,
190
608381
2102
扫描树上的不同分支,
直到他们找到完美匹配
10:22
until直到 they found发现 a profile轮廓
that exactly究竟 matched匹配
191
610507
2565
10:25
what they knew知道 about
the Golden金色 State Killer凶手.
192
613096
2581
他们所了解的金州杀手信息的人。
10:27
They obtained获得 DNA脱氧核糖核酸 from this person
and found发现 a perfect完善 match比赛
193
615701
3592
他们从这人身上取得 DNA 并发现
10:31
to the DNA脱氧核糖核酸 they had in hand.
194
619317
2025
跟他们手上的 DNA 一致。
10:33
They arrested被捕 him
and brought him to justice正义
195
621366
2350
过了这么些年,他们终于逮捕了他,
10:35
after all these years年份.
196
623740
1424
并绳之与法。
10:38
Since以来 then, genetic遗传 genealogists系谱
have started开始 working加工 with
197
626172
3241
自那之后,基因谱系学家开始
10:41
local本地 US law enforcement强制 agencies机构
198
629437
2668
跟美国当地执法机构合作,
10:44
to use this technique技术
in order订购 to capture捕获 criminals罪犯.
199
632129
3362
使用这种技术来抓捕罪犯。
10:47
And only in the past过去 six months个月,
200
635521
2681
仅仅在过去的 6 个月,
10:50
they were able能够 to solve解决
over 20 cold cases with this technique技术.
201
638226
4296
他们使用这个技术就破获了
超过 20 个铁证悬案。
10:56
Luckily, we have people like Uncle叔叔
Bernie伯尼 and his fellow同伴 genealogists系谱
202
644203
4636
幸好,我们有这群人,
像伯尼叔叔和他的家谱学同行,
11:01
These are not amateurs业余
with a self-serving自顾自 hobby爱好.
203
649045
2994
他们不只是业余爱好者。
11:04
These are citizen公民 scientists科学家们
with a deep passion to tell us who we are.
204
652602
6419
他们是满怀热情的公民科学家,
想要揭开我们所有人身份的秘密。
11:11
And they know that the past过去
can hold保持 a key to the future未来.
205
659065
4458
他们知道,过去是通向未来的钥匙。
11:16
Thank you very much.
206
664067
1183
谢谢大家。
11:17
(Applause掌声)
207
665314
3469
(鼓掌)
Translated by psjmz mz
Reviewed by Yanyan Hong

▲Back to top

ABOUT THE SPEAKER
Yaniv Erlich - Computational geneticist
Yaniv Erlich is fascinated by the connection between DNA and data.

Why you should listen

As a professor and researcher at Columbia University and as CSO of MyHeritage.com, Yaniv Erlich has performed foundational work in genetic privacy and large-scale studies of crowdsourced genomic data. Dubbed a "genome hacker" by the journal Nature, Erlich and his team discovered a privacy loophole enabling reidentification of allegedly anonymous male research participants using just internet searches and their Y chromosome. Later, he discovered that 60 percent of all US individuals with European descent can be identified by forensic genetics using open genetic genealogy databases, which Science magazine called one of the top 10 breakthroughs of 2018.

Erlich is also responsible for the construction of the world's largest family tree, comprising 13 million people, as well as the development of the website DNA.land, which has compiled the genotypes of more than 150,000 donors. He has also worked to discover the genetic bases for several conditions in Israeli families. His team has demonstrated stable DNA data storage, reaching a density of 215 petabyte per gram of DNA. He's been awarded numerous prizes, has published more than 45 papers and authored seven patents.

More profile about the speaker
Yaniv Erlich | Speaker | TED.com