ABOUT THE SPEAKER
Yaniv Erlich - Computational geneticist
Yaniv Erlich is fascinated by the connection between DNA and data.

Why you should listen

As a professor and researcher at Columbia University and as CSO of MyHeritage.com, Yaniv Erlich has performed foundational work in genetic privacy and large-scale studies of crowdsourced genomic data. Dubbed a "genome hacker" by the journal Nature, Erlich and his team discovered a privacy loophole enabling reidentification of allegedly anonymous male research participants using just internet searches and their Y chromosome. Later, he discovered that 60 percent of all US individuals with European descent can be identified by forensic genetics using open genetic genealogy databases, which Science magazine called one of the top 10 breakthroughs of 2018.

Erlich is also responsible for the construction of the world's largest family tree, comprising 13 million people, as well as the development of the website DNA.land, which has compiled the genotypes of more than 150,000 donors. He has also worked to discover the genetic bases for several conditions in Israeli families. His team has demonstrated stable DNA data storage, reaching a density of 215 petabyte per gram of DNA. He's been awarded numerous prizes, has published more than 45 papers and authored seven patents.

More profile about the speaker
Yaniv Erlich | Speaker | TED.com
TEDMED 2018

Yaniv Erlich: How we're building the world's largest family tree

야니브 에를리치(Yaniv Erlich): 세계에서 가장 큰 가계도를 만드는 방법

Filmed:
1,507,766 views

전산 유전학자 야니브 에를리치는 세계에서 가장 큰 가계도를 만드는 것에 관여했습니다. 그 가계도는 1,300만 명으로 구성되어있고 500년 이상을 거슬러 올라갑니다. 그는 우리의 애정생활, 건강, 심지어 수십 년 된 범죄 사건들에 관한 결과물에서 나타난 대단히 흥미로운 패턴을 공유하며, 크라우드소싱된 족보 데이터베이스가 어떻게 과거뿐만 아니라 미래에도 빛을 발할 수 있는지를 보여줍니다.
- Computational geneticist
Yaniv Erlich is fascinated by the connection between DNA and data. Full bio

Double-click the English transcript below to play the video.

00:12
People use the internet인터넷
for various여러 reasons원인.
0
817
3452
사람들은 다양한 이유로
인터넷을 사용합니다.
00:17
It turns회전 out that one of the most가장
popular인기 있는 categories카테고리 of website웹 사이트
1
5765
3804
알고 보니 가장 인기 있는
웹사이트 중 하나는
00:21
is something that people
typically전형적으로 consume바싹 여위다 in private은밀한.
2
9593
2872
대개 사람들이 개인적으로 소비하는
어떤 것이었습니다.
00:25
It involves관련 curiosity호기심,
3
13639
2510
그것은 호기심과
00:28
non-insignificant중요하지 않은 levels수준
of self-indulgence자기 방종
4
16173
3796
무의미한 수준의 자기 방종을 포함하며
00:31
and is centered중심에 놓인 around recording녹음
the reproductive생식 activities활동들
5
19993
3260
다른 사람들의 생식 활동을
기록하는 데 중점을 둡니다.
00:35
of other people.
6
23277
1309
00:36
(Laughter웃음)
7
24610
1032
(웃음)
00:37
Of course코스, I'm talking말하는 about genealogy가계 --
8
25666
2250
당연히 제가 얘기하는 건 가계도인데요.
00:39
(Laughter웃음)
9
27940
1214
(웃음)
00:41
the study연구 of family가족 history역사.
10
29178
1702
가족사의 연구 말입니다.
00:43
When it comes온다 to detailing자세히 family가족 history역사,
11
31353
2037
가족사를 자세히 설명하자면,
00:45
in every...마다 family가족, we have this person사람
that is obsessed사로 잡힌 with genealogy가계.
12
33414
3943
모든 가족 중에는
족보에 집착하는 사람이 있죠.
00:49
Let's call him Uncle삼촌 Bernie버니.
13
37381
1713
그를 버니 삼촌이라고 합시다.
00:51
Uncle삼촌 Bernie버니 is exactly정확하게 the last person사람
you want to sit앉다 next다음 것 to
14
39118
3782
추수감사절 만찬에서 당신은 결코
버니 삼촌 옆에는 앉지 않을 겁니다.
00:54
in Thanksgiving추수 감사절 dinner공식 만찬,
15
42924
1599
00:56
because he will bore구경 you to death죽음
with peculiar독특한 details세부
16
44547
2814
그는 어떤 고대 친척들에 관한
이상한 정보로
00:59
about some ancient고대의 relatives친척.
17
47385
1966
당신을 지루하게 만들 거니까요.
01:02
But as you know,
18
50462
1262
하지만 당신도 알다시피
01:03
there is a scientific과학적 side측면 for everything,
19
51748
2872
모든 것에는 과학적인 면이 있으며
01:06
and we found녹이다 that Uncle삼촌 Bernie's버니스 stories이야기
20
54644
2978
우리는 버니 삼촌의 이야기가
생명 의학 연구에
01:09
have immense거대한 potential가능성
for biomedical생물 의학 research연구.
21
57646
3168
엄청난 잠재력을 가졌다는 것을
알게 되었습니다.
01:13
We let Uncle삼촌 Bernie버니
and his fellow사람 genealogists계보 학자
22
61306
2714
우리는 버니 삼촌과 동료 계보학자들에게
01:16
document문서 their그들의 family가족 trees나무 through...을 통하여
a genealogy가계 website웹 사이트 called전화 한 geni제니.comcom.
23
64044
4668
지니닷컴이라는 계보학 사이트를 통해
그들의 가계도를 기록하도록 했습니다.
01:21
When users사용자 upload업로드
their그들의 trees나무 to the website웹 사이트,
24
69198
2128
사용자들이 가계도를
웹사이트에 올리면,
01:23
it scans스캔 their그들의 relatives친척,
25
71350
1690
그 사이트는 친척을 찾아보고
01:25
and if it finds발견하다 matches성냥 to existing기존의 trees나무,
26
73064
2075
기존의 것과 일치하는 것을 발견하면
01:27
it merges합병하다 the existing기존의
and the new새로운 tree나무 together함께.
27
75163
3610
새로운 것을 기존 버전과 합칩니다.
01:31
The result결과 is that large
family가족 trees나무 are created만들어진,
28
79768
2950
그러면 각 계보학자의
개인적인 수준을 넘는
01:34
beyond...을 넘어서 the individual개인 level수평
of each마다 genealogist계보 학자.
29
82742
3479
더 큰 가계도가 만들어지게 됩니다.
01:38
Now, by repeating반복 this process방법
with millions수백만 of people
30
86808
4129
이제 이 과정을 반복해서 전 세계의
01:42
all over the world세계,
31
90961
1817
수백만 명의 사람들과 함께
01:44
we can crowdsourcecrowdsource the construction구성
of a family가족 tree나무 of all humankind인류.
32
92802
5532
모든 인류의 가계도 구조를
크라우드 소싱할 수 있습니다.
01:51
Using사용 this website웹 사이트,
33
99292
1584
이 웹사이트를 사용해서
01:52
we were able할 수 있는 to connect잇다 125 million백만 people
34
100900
4813
1억 2천 5백만 명의 사람들을
01:57
into a single단일 family가족 tree나무.
35
105737
2521
하나의 가계도로
연결할 수 있었습니다.
02:00
I cannot~ 할 수 없다. draw무승부 the tree나무
on the screens스크린 over here
36
108967
2788
여기 스크린에 그 가계도를
그릴 순 없습니다.
02:03
because they have less적게 pixels픽셀
37
111779
2165
이 가계도에 있는 사람들의 수보다
02:05
than the number번호 of people in this tree나무.
38
113968
2513
픽셀 수가 적기 때문이죠.
02:08
But here is an example of a subset부분 집합
of 6,000 individuals개인.
39
116505
5010
하지만 여기 6000명의
하위 집합의 예가 있습니다.
02:14
Each마다 green녹색 node마디 is a person사람.
40
122159
2362
각 녹색 점은 한 사람을 나타냅니다.
02:17
The red빨간 nodes노드들 represent말하다 marriages결혼,
41
125060
2849
빨간 점들은 결혼을 나타내고요.
02:19
and the connections사이 represent말하다 parenthood친자 관계.
42
127933
2258
그리고 연결선들은 부모를 나타냅니다.
02:22
In the middle중간 of this tree나무,
you see the ancestors선조.
43
130557
2372
이 가계도 중앙에는 조상들이 보이죠.
02:24
And as we go to the periphery주위,
you see the descendants자손.
44
132953
2604
그리고 주변부로 가면
그 자손들을 볼 수 있습니다.
02:27
This tree나무 has seven일곱
generations세대, approximately대략.
45
135581
3102
이 가계도에는 약 7세대가 있네요.
02:31
Now, this is what happens일이
when we increase증가하다 the number번호 of individuals개인
46
139692
3234
개인의 숫자를
7만 명까지 늘렸을 때는
02:34
to 70,000 people --
47
142950
1828
이렇게 되겠죠.
02:36
still a tiny작은 subset부분 집합
of all the data데이터 that we have.
48
144802
4330
우리가 가진 모든 데이터에 비하면
여전히 아주 작은 부분집합입니다.
02:41
Despite무례 that, you can already이미 see
the formation형성 of gigantic거인 같은 family가족 trees나무
49
149629
4813
그럼에도 불구하고,
이미 많은 먼 친척들로 구성된
02:46
with many많은 very distant relatives친척.
50
154466
2655
거대한 가계도가 형성되는 것을
볼 수 있습니다.
02:49
Thanks감사 to the hard단단한 work
of our genealogists계보 학자,
51
157610
3134
많은 계보학자들의 노고 덕분에
02:52
we can go back in time
hundreds수백 of years연령 ago...전에.
52
160768
3103
우리는 수백 년 전 과거로
돌아갈 수 있습니다.
02:56
For example, here is Alexander알렉산더 Hamilton해밀턴,
53
164418
3441
예를 들자면,
여기 알렉산더 해밀턴이 있습니다.
02:59
who was born타고난 in 1755.
54
167883
2475
그는 1755년에 태어났죠.
03:02
Alexander알렉산더 was the first
US Secretary비서 of the Treasury국고,
55
170872
3764
알렉산더는 미국의
초대 재무 장관이었지만
03:06
but mostly대개 known알려진 today오늘
due정당한 to a popular인기 있는 Broadway브로드 웨이 musical뮤지컬.
56
174660
3831
대부분 알려진 건 오늘날
브로드웨이 뮤지컬의 인기 덕택이죠.
03:11
We found녹이다 that Alexander알렉산더 has deeper더 깊은
connections사이 in the showbiz쇼 비지니스 industry산업.
57
179137
4922
알렉산더가 연예 산업에
깊은 연줄이 있다는 걸 알게 됐습니다.
03:16
In fact, he's a blood relative상대적인 of ...
58
184083
2111
사실, 그는 친척 관계입니다.
03:18
Kevin케빈 Bacon베이컨!
59
186781
1220
바로 케빈 베이컨이랑요!
03:20
(Laughter웃음)
60
188025
2032
(웃음)
03:22
Both양자 모두 of them are descendants자손
of a lady레이디 from Scotland스코틀랜드
61
190081
2606
그들 모두 스코틀랜드 출신인
한 여인의 후손입니다.
03:24
who lived살았던 in the 13th century세기.
62
192711
2314
그녀는 13세기 사람이죠.
03:27
So you can say that Alexander알렉산더 Hamilton해밀턴
63
195049
3102
따라서 알렉산더 해밀턴와 케빈 베이컨은
03:30
is 35 degrees of Kevin케빈 Bacon베이컨 genealogy가계.
64
198175
3188
35대가 차이 나는
친척이라고 할 수 있죠.
03:33
(Laughter웃음)
65
201387
1441
(웃음)
03:34
And our tree나무 has millions수백만
of stories이야기 like that.
66
202852
3230
이처럼 우리 가계도는
수백만 개의 이야기를 가지고 있습니다.
03:40
We invested투자 한 significant중요한 efforts노력
to validate유효성을 검사하다 the quality품질 of our data데이터.
67
208113
4890
저희는 데이터의 우수함을 입증하기 위해
상당한 노력을 기울였습니다.
03:45
Using사용 DNADNA, we found녹이다 that .3 percent퍼센트 of
the mother-child어머니-아이 connections사이 in our data데이터
68
213027
5391
DNA를 이용해서 데이터에 있는
어머니와 아이들의 관계 중 0.3%가
03:50
are wrong잘못된,
69
218442
1250
잘못됐다는 것을 발견했습니다.
03:51
which어느 could match시합 the adoption양자 rate
in the US pre-Second사전 초 World세계 War전쟁.
70
219716
3591
이것은 제2차 세계대전 이전
미국의 입양률과 일치할 겁니다.
03:56
For the father's아버지의 side측면,
71
224847
1785
아버지의 경우에는
03:58
the news뉴스 is not as good:
72
226656
1961
더 좋지 않네요.
04:02
1.9 percent퍼센트 of the father-child아버지 - 자식
connections사이 in our data데이터 are wrong잘못된.
73
230149
5600
데이터 중 아버지와 아이들의 관계는
1.9%의 비율로 잘못되었습니다.
04:07
And I see some people smirk능글 맞은 웃음 over here.
74
235773
2363
여기 몇몇 분들이
웃고 계신 게 보이네요.
04:10
It is what you think --
75
238160
1717
여러분들이 생각하는 것처럼
04:11
there are many많은 milkmen밀크맨 out there.
76
239901
1789
그곳엔 많은 우유배달원들이 있었죠.
04:13
(Laughter웃음)
77
241714
1064
(웃음)
04:14
However하나, this 1.9 percent퍼센트 error오류 rate
in patrilineal패트리날 connections사이
78
242802
3989
하지만 이러한 부계 관계의
1.9% 오차율이
04:18
is not unique독특한 to our data데이터.
79
246815
1769
우리 자료에 국한된 것은 아닙니다.
04:20
Previous너무 이른 studies연구 found녹이다
a similar비슷한 error오류 rate
80
248608
3069
임상 등급의 가계도를 사용했었던
이전 연구 자료도
04:23
using~을 사용하여 clinical-grade임상 등급 pedigrees혈통.
81
251701
2021
비슷한 오차율이 발견됐습니다.
04:26
So the quality품질 of our data데이터 is good,
82
254254
2525
따라서 데이터의 품질은 우수한 것이고,
04:28
and that should not be a surprise놀람.
83
256803
2133
그게 놀라운 일은 아닙니다.
04:30
Our genealogists계보 학자 have
a profound깊은, vested기득권이있는 interest관심
84
258960
3776
우리 계보학자들은
가족사를 정확하게 기록하는 데
04:34
in correctly바르게 documenting문서화
their그들의 family가족 history역사.
85
262760
3668
깊은 관심과 기득권을 가지고 있습니다.
04:40
We can leverage이점 this data데이터 to learn배우다
quantitative정량적 인 information정보 about humanity인류,
86
268594
4591
우리는 이 데이터를 활용해
인류의 양적 정보를 배울 수 있습니다.
04:45
for example, questions질문들 about demography인구 통계학.
87
273209
2596
예를 들면 인구통계학에 관한
문제 같은 거죠.
04:47
Here is a look at all our profiles프로필
on the map지도 of the world세계.
88
275829
3857
여기 세계지도에
우리 모두의 프로필이 있습니다.
04:52
Each마다 pixel화소 is a person사람
that lived살았던 at some point포인트.
89
280250
4481
각각의 픽셀은
특정 시점에 살았던 사람입니다.
04:56
And since이후 we have so much data데이터,
90
284755
1680
이 데이터는 아주 방대하기때문에,
04:58
you can see the contours등고선
of many많은 countries국가,
91
286459
2781
여러분은 많은 나라들,
특히 서구 세계의
05:01
especially특히 in the Western서부 사람 world세계.
92
289264
2099
경계를 볼 수 있을 겁니다.
05:03
In this clip클립, we stratified계층화 된
the map지도 that I've showed보여 주었다 you
93
291387
3548
이 동영상에서는 여러분들에게
보여드린 지도를 계층화했습니다.
05:06
based기반 on the year of births출생 of individuals개인
from 1400 to 1900,
94
294959
5072
1400년부터 1900년까지
개인의 출생연도를 기준으로요.
05:12
and we compared비교하다 it
to known알려진 migration이주 events사건.
95
300055
2766
그리고 잘 알려진 이주 사건들과
그걸 비교했어요.
05:15
The clip클립 is going to show보여 주다 you
that the deepest가장 깊은 lineages혈통 in our data데이터
96
303482
3165
이 동영상은 데이터의 가장 깊은 혈통이
거슬러 올라가보면
05:18
go all the way back to the UK영국,
97
306671
1627
영국까지 간다는 걸 보여줍니다.
05:20
where they had better record기록 keeping유지,
98
308322
1808
영국의 기록은 잘 유지되고 있었죠.
05:22
and then they spread전파 along...을 따라서
the routes노선 of Western서부 사람 colonialism식민주의.
99
310154
3282
그들은 서구 식민주의의 루트를 따라
퍼져나갔습니다.
05:25
Let's watch this.
100
313460
1322
이걸 한 번 보시죠.
05:27
(Music음악)
101
315143
1609
(음악)
05:28
[Year of birth출생: ]
102
316776
2341
[출생연도]
05:31
[1492 - Columbus콜럼버스 sails the ocean대양 blue푸른]
103
319705
1836
[1492 - 콜럼버스 대양 항해]
05:35
[1620 - Mayflower메이 플라워 lands in Massachusetts매사추세츠 주]
104
323661
2000
[1620 - 메이플라워호
매사추세츠 상륙]
05:38
[1652 - Dutch네덜란드 사람 settle가리다 in South남쪽 Africa아프리카]
105
326726
1775
[1652 - 네덜란드인
남아프리카 정착]
05:44
[1788 - Great Britain영국 penal형벌
transportation교통 to Australia호주 starts시작하다]
106
332321
3186
[1788 - 대영제국
호주로 유배 시작]
[1836 - 최초 이민자들
오리건 산길 이용]
05:47
[1836 - First migrants이주민 use Oregon오리건 주 Trail꼬리]
107
335531
1927
05:50
[all activity활동]
108
338149
3183
[모든 활동]
05:55
I love this movie영화.
109
343851
1543
저는 이 영화를 좋아합니다.
05:57
Now, since이후 these migration이주 events사건
are giving주는 the context문맥 of families가족들,
110
345418
5093
이 이주 사건들이
가족의 맥락을 말해주고 있기 때문에
06:02
we can ask청하다 questions질문들 such이러한 as:
111
350535
2183
우리는 이런 질문을 할 수 있습니다.
06:04
What is the typical전형적인 distance거리
between중에서 the birth출생 locations위치들
112
352742
3470
남편과 아내의 출생지 사이의
일반적인 거리는 얼마입니까?
06:08
of husbands남편 and wives아내?
113
356236
2812
06:11
This distance거리 plays연극
a pivotal추축 같은 role역할 in demography인구 통계학,
114
359072
3677
이 거리는 인구통계학에서
중요한 역할을 합니다.
06:14
because the patterns패턴들 in which어느
people migrate이주하다 to form형태 families가족들
115
362773
3681
왜냐하면 사람들이 가족을 이루기 위해
이주하는 패턴이
06:18
determine결정 how genes유전자 spread전파
in geographical지리적 인 areas지역.
116
366478
3713
유전자가 지리적으로 어떻게 확산되는지
결정하기 때문이죠.
06:22
We analyzed분석 된 this distance거리 using~을 사용하여 our data데이터,
117
370706
2328
우리는 데이터를 사용하여
이 거리를 분석했고
06:25
and we found녹이다 that in the old늙은 days,
118
373058
2290
옛날 사람들의 경우에는
분석하기 쉬웠다는 걸 알게 됐습니다.
06:27
people had it easy쉬운.
119
375372
1230
06:28
They just married기혼 someone어떤 사람
in the village마을 nearby인근의.
120
376626
2594
사람들은 근처 마을의 누군가와
결혼했습니다.
06:31
But the Industrial산업 Revolution혁명
really complicated복잡한 our love life.
121
379958
3705
하지만 산업혁명은 우리의 애정생활을
정말 복잡하게 만들었습니다.
06:35
And today오늘, with affordable저렴한 flights항공편
and online온라인 social사회적인 media미디어,
122
383687
4560
그리고 오늘날엔 저렴한 항공편과
온라인 소셜미디어와 함께
06:40
people typically전형적으로 migrate이주하다 more than
100 kilometers킬로미터 from their그들의 place장소 of birth출생
123
388271
4828
사람들은 출생지에서 100km 이상
떨어진 곳으로 이동하죠.
06:45
to find their그들의 soul영혼 mate항해사.
124
393123
1504
소울메이트를 찾기 위해서요.
06:48
So now you might ask청하다:
125
396524
1187
여기서 나오는 질문이,
06:49
OK, but who does the hard단단한 work
of migrating이주하는 from places장소들 to places장소들
126
397735
4496
좋아요. 그런데 가족을 이루기 위해
누가 이곳저곳 이동하는
06:54
to form형태 families가족들?
127
402255
1269
힘든 일을 하죠?
06:55
Are these the males수컷 or the females?
128
403548
3727
남성들인가요, 여성들인가요?
06:59
We used our data데이터 to address주소 this question문제,
129
407752
2155
답을 찾기 위해
우리 데이터를 사용했죠.
07:01
and at least가장 작은 in the last 300 years연령,
130
409931
2594
그리고 적어도 지난 300년 동안
07:04
we found녹이다 that the ladies숙녀 do the hard단단한 work
131
412549
3883
여성들이 이 힘든 일을
했다는 것을 발견했죠.
07:08
of migrating이주하는 from places장소들
to places장소들 to form형태 families가족들.
132
416456
2996
가족을 이루기 위해
이곳저곳 옮겨가는 일이요.
07:11
Now, these results결과들
are statistically통계적으로 significant중요한,
133
419476
3101
이 결과는 통계적으로 중요합니다.
07:14
so you can take it as scientific과학적 fact
that males수컷 are lazy게으른.
134
422601
3471
남자들이 게으르다는 것을
과학적 사실로 받아들일 수 있으니까요.
07:18
(Laughter웃음)
135
426096
3156
(웃음)
07:21
We can move움직임 from questions질문들
about demography인구 통계학
136
429276
2536
우리는 인구통계학에 관한
질문으로부터 벗어나
07:23
and ask청하다 questions질문들 about human인간의 health건강.
137
431836
2913
인간의 건강에 대해
질문할 수 있습니다.
07:26
For example, we can ask청하다
138
434773
1487
예를 들면, 우리는
07:28
to what extent범위 genetic유전적인 variations변형
account계정 for differences차이점들 in life span스팬
139
436284
4963
유전자 변이가 개인 간 수명 차이를
어느 정도까지 설명할 수 있는지
07:33
between중에서 individuals개인.
140
441271
1194
물어볼 수 있습니다.
07:34
Previous너무 이른 studies연구 analyzed분석 된 the correlation상호 관계
of longevity장수 between중에서 twins쌍둥이
141
442988
4530
이전 연구들은 이 문제를 풀기 위해
쌍둥이의 장수의 상관관계를 분석했습니다.
07:39
to address주소 this question문제.
142
447542
1442
07:41
They estimated추정 된 that the genetic유전적인
variations변형 account계정 for
143
449411
2667
그들은 유전자 변이가
개인 간 수명 차이의
07:44
about a quarter쿼터 of the differences차이점들
in life span스팬 between중에서 individuals개인.
144
452102
4040
약 4분의 1을 차지한다고
추정했습니다.
07:48
But twins쌍둥이 can be correlated상관 관계가있는
due정당한 to so many많은 reasons원인,
145
456688
2598
하지만 쌍둥이는 많은 이유로
상관관계가 있겠죠.
07:51
including포함 various여러 environmental환경 effects효과
146
459310
2304
다양한 환경적 요인이나
07:53
or a shared공유 된 household가정.
147
461638
1622
공동 가정을 포함해서요.
07:56
Large family가족 trees나무 give us the opportunity기회
to analyze분석하다 both양자 모두 close닫기 relatives친척,
148
464411
3753
큰 가계도는 가까운 친척 모두를
분석할 수 있는 기회가 됩니다.
08:00
such이러한 as twins쌍둥이,
149
468188
1207
쌍둥이와 뿐만 아니라,
08:01
all the way to distant relatives친척,
even fourth네번째 cousins사촌.
150
469419
2917
심지어 10촌 같은 먼 친척까지요.
08:04
This way we can build짓다 robust건장한 models모델
151
472749
2689
이런 식으로 우리는
강력한 모델을 구축할 수 있죠.
08:07
that can tease볶다 apart떨어져서 the contribution기부
of genetic유전적인 variations변형
152
475462
3708
그 모델은 환경적 요인으로부터
유전자 변이의 영향을 구별할 수 있습니다.
08:11
from environmental환경 factors요인들.
153
479194
1717
08:13
We conducted전도 된 this analysis분석 using~을 사용하여 our data데이터,
154
481379
2899
우리는 데이터를 사용하여
이 분석을 수행했고
08:16
and we found녹이다 that genetic유전적인 variations변형
explain설명 only 15 percent퍼센트
155
484302
5791
유전적 변이가 개인 간
수명 차이 중 약 15%만을
08:22
of the differences차이점들 in life span스팬
between중에서 individuals개인.
156
490117
2806
설명해 준다는 것을 발견했습니다.
08:26
That is five다섯 years연령, on average평균.
157
494760
2756
그건 평균적으로 5년입니다.
08:30
So genes유전자 matter문제 less적게 than
what we thought before to life span스팬.
158
498316
4708
따라서 유전자는 수명에 있어
우리가 생각했던 것보다 덜 중요합니다.
08:35
And I find it great news뉴스,
159
503675
2136
그리고 그건 좋은 소식입니다.
08:38
because it means방법 that
our actions행위 can matter문제 more.
160
506438
3293
우리의 행동이 더 중요할 수 있음을
의미하기 때문이죠.
08:42
Smoking흡연, for example, determines결정하다
10 years연령 of our life expectancy기대 --
161
510533
4274
예를 들어 흡연이
기대수명의 10년을 결정한다면
08:46
twice두번 as much as what genetics유전학 determines결정하다.
162
514831
2646
이건 유전자가 결정하는 것보다
두 배나 많습니다.
08:50
We can even have more surprising놀라운 findings결과
163
518236
2289
심지어 더 놀라운 결과가 있습니다.
08:52
as we move움직임 from family가족 trees나무
164
520549
1492
우리가 가계도를 떠나서
08:54
and we let our genealogists계보 학자
document문서 and crowdsourcecrowdsource DNADNA information정보.
165
522065
4732
계보학자들에게 DNA 정보를 문서화하고
크라우드 소싱하게 했을 때
08:58
And the results결과들 can be amazing놀랄 만한.
166
526821
2024
그 결과는 놀라웠습니다.
09:01
It might be hard단단한 to imagine상상하다,
but Uncle삼촌 Bernie버니 and his friends친구
167
529255
3915
상상하기 어렵겠지만
버니 삼촌과 그의 친구들은
09:05
can create몹시 떠들어 대다 DNADNA forensic법의학의 capabilities능력
168
533194
2646
DNA 법의학을 만들 수 있어요.
09:07
that even exceed넘다
what the FBIFBI currently현재 has.
169
535864
3559
그건 심지어 FBI의 것보다 낫죠.
09:12
When you place장소 the DNADNA
on a large family가족 tree나무,
170
540862
2404
큰 가계도에 DNA를 넣으면,
09:15
you effectively효과적으로 create몹시 떠들어 대다 a beacon봉홧불
171
543290
2117
효과적인 불빛을 만들어
09:17
that illuminates조명하다 the hundreds수백
of distant relatives친척
172
545431
2634
수백 명의 먼 친척들을
표시할 수 있게 되죠.
09:20
that are all connected연결된 to the person사람
that originated유래 된 the DNADNA.
173
548089
3490
그들은 모두 특정 DNA로를 타고난
한 사람과 연결되어 있습니다.
09:24
By placing자본 매출 multiple배수 beacons비컨
on a large family가족 tree나무,
174
552505
2913
대형 가계도에
여러 개의 비콘을 배치함으로써
09:27
you can now triangulate삼각 측량 the DNADNA
of an unknown알 수 없는 person사람,
175
555442
3720
여러분들은 알려지지 않은 사람의
DNA를 삼각측량할 수 있습니다.
09:31
the same같은 way that the GPSGPS system체계
uses용도 multiple배수 satellites인공위성
176
559186
3938
GPA 시스템이 위치를 찾기 위해
여러 개의 위성을 사용하는 방식과
09:35
to find a location위치.
177
563148
1324
같은 방식이죠.
09:37
The prime초기 example
of the power of this technique기술
178
565226
3624
이 기술의 가장 큰 예는
09:40
is capturing캡처 the Golden골든 State상태 Killer살인자,
179
568874
2675
골든스테이트 킬러를 잡은 일입니다.
09:44
one of the most가장 notorious유명한 criminals범죄자
in the history역사 of the US.
180
572612
4528
그는 미국 역사상
가장 악명 높은 범죄자 중 한 명이죠.
09:49
The FBIFBI had been searching수색
for this person사람 for over 40 years연령.
181
577164
5892
FBI는 40년 넘게 이 사람을
찾고 있었습니다.
09:55
They had his DNADNA,
182
583588
1835
FBI는 그의 DNA를 가지고 있었지만
09:57
but he never showed보여 주었다 up
in any police경찰 database데이터 베이스.
183
585447
3350
그는 어떤 경찰 데이터베이스에도
나타나지 않았죠.
10:01
About a year ago...전에, the FBIFBI
consulted상의 한 a genetic유전적인 genealogist계보 학자,
184
589447
4712
약 1년 전, FBI는
한 유전 계보학자와 상담했고
10:06
and she suggested제안 된 that they submit제출하다
his DNADNA to a genealogy가계 service서비스
185
594183
3950
그녀는 FBI에게 그의 DNA를
계보학회에 제출하라고 했습니다.
10:10
that can locate위치하고 있다 distant relatives친척.
186
598157
2398
그걸로 먼 친척을 찾을 수 있으니까요.
10:13
They did that,
187
601117
1156
그들은 그렇게 했고
10:14
and they found녹이다 a third제삼 cousin사촌
of the Golden골든 State상태 Killer살인자.
188
602297
3692
골든스테이트 킬러의 8촌을 찾았습니다.
10:18
They built세워짐 a large family가족 tree나무,
189
606013
2344
그들은 큰 가계도를 만들었고
10:20
scanned스캔 한 the different다른
branches가지 of that tree나무,
190
608381
2102
그 가계도의 다른 가지들을
훑어봤습니다.
10:22
until...까지 they found녹이다 a profile윤곽
that exactly정확하게 matched일치하는
191
610507
2565
골든스테이트 킬러에 대해
알고 있는 것과
10:25
what they knew알고 있었다 about
the Golden골든 State상태 Killer살인자.
192
613096
2581
정확히 일치하는
프로필을 찾을 때까지요.
10:27
They obtained획득 한 DNADNA from this person사람
and found녹이다 a perfect완전한 match시합
193
615701
3592
이 사람으로부터 얻은 DNA가
그들이 가지고 있는 DNA와
10:31
to the DNADNA they had in hand.
194
619317
2025
정확히 일치하는 것을 발견했습니다.
10:33
They arrested체포 된 him
and brought가져온 him to justice정의
195
621366
2350
그는 체포됐고 법의 심판을
받게 됐습니다.
10:35
after all these years연령.
196
623740
1424
이 모든 세월이 지난 후에요.
10:38
Since이후 then, genetic유전적인 genealogists계보 학자
have started시작한 working with
197
626172
3241
그 이후로 유전 계보학자들은
미국 지방 법 집행기관과
10:41
local노동 조합 지부 US law enforcement시행 agencies에이전시
198
629437
2668
함께 일하기 시작했습니다.
10:44
to use this technique기술
in order주문 to capture포착 criminals범죄자.
199
632129
3362
범인을 잡는데
이 기술을 사용하기 위해서죠.
10:47
And only in the past과거 six months개월,
200
635521
2681
그리고 지난 6개월 동안만 해도
10:50
they were able할 수 있는 to solve풀다
over 20 cold감기 cases사례 with this technique기술.
201
638226
4296
이 기술로 20개 넘는 미제 사건들을
해결할 수 있었습니다.
10:56
Luckily운 좋게, we have people like Uncle삼촌
Bernie버니 and his fellow사람 genealogists계보 학자
202
644203
4636
다행히도 우리에게는 버니 삼촌과
동료 계보학자와 같은 사람들이 있죠.
11:01
These are not amateurs아마추어
with a self-serving자급 자족하는 hobby취미.
203
649045
2994
그들은 이기적인 취미를 가진
아마추어가 아닙니다.
11:04
These are citizen시민 scientists과학자들
with a deep깊은 passion열정 to tell us who we are.
204
652602
6419
그들은 우리가 누구인지 알려주려는
깊은 열정을 가진 시민과학자이며
11:11
And they know that the past과거
can hold보류 a key to the future미래.
205
659065
4458
과거가 미래의 열쇠를
쥐고 있다는 것을 압니다.
대단히 감사합니다.
11:16
Thank you very much.
206
664067
1183
(박수)
11:17
(Applause박수 갈채)
207
665314
3469
Translated by Hajeong Kang
Reviewed by Eunice Yunjung Nam

▲Back to top

ABOUT THE SPEAKER
Yaniv Erlich - Computational geneticist
Yaniv Erlich is fascinated by the connection between DNA and data.

Why you should listen

As a professor and researcher at Columbia University and as CSO of MyHeritage.com, Yaniv Erlich has performed foundational work in genetic privacy and large-scale studies of crowdsourced genomic data. Dubbed a "genome hacker" by the journal Nature, Erlich and his team discovered a privacy loophole enabling reidentification of allegedly anonymous male research participants using just internet searches and their Y chromosome. Later, he discovered that 60 percent of all US individuals with European descent can be identified by forensic genetics using open genetic genealogy databases, which Science magazine called one of the top 10 breakthroughs of 2018.

Erlich is also responsible for the construction of the world's largest family tree, comprising 13 million people, as well as the development of the website DNA.land, which has compiled the genotypes of more than 150,000 donors. He has also worked to discover the genetic bases for several conditions in Israeli families. His team has demonstrated stable DNA data storage, reaching a density of 215 petabyte per gram of DNA. He's been awarded numerous prizes, has published more than 45 papers and authored seven patents.

More profile about the speaker
Yaniv Erlich | Speaker | TED.com