ABOUT THE SPEAKER
Dina Zielinski - Bench scientist, bioinformatician
Dina Zielinski brings biological data to life, from decoding mutations in cancer to encoding data in DNA.

Why you should listen

Dina Zielinski is a bench scientist and bioinformatician with broad experience in genetics and genomics. Her current projects are in developmental biology and neurology, but she is motivated to keep learning and using her skills to answer scientific questions that challenge our deepest knowledge.

More profile about the speaker
Dina Zielinski | Speaker | TED.com
TEDxVienna

Dina Zielinski: How we can store digital data in DNA

戴娜·杰林斯基: 我们如何在DNA中存储电子数据

Filmed:
1,777,866 views

从软盘到U盘,每个存储数据的方法最终都会过时。我们为什么不能找到一种永久存储全世界数据的方法呢?生物信息学家戴娜·杰林斯基分享了已经存在了数十亿年的解决方案:DNA,及其背后的科学原理。
- Bench scientist, bioinformatician
Dina Zielinski brings biological data to life, from decoding mutations in cancer to encoding data in DNA. Full bio

Double-click the English transcript below to play the video.

00:12
I could fit适合 all movies电影 ever made制作
inside of this tube.
0
652
5196
我可以把有史以来的所有电影
装进这个小管里。
00:17
If you can't see it,
that's kind of the point.
1
5872
2253
如果你看不见它,那就对了。
00:20
(Laughter笑声)
2
8149
1016
(大笑)
在我们理解这件事的可能性之前,
00:21
Before we understand理解 how this is possible可能,
3
9189
3243
00:24
it's important重要 to understand理解
the value of this feat功绩.
4
12456
3746
重要的是先理解这项技术的价值。
00:29
All of our thoughts思念
and actions行动 these days,
5
17075
2266
现在我们所有的想法和行动,
通过照片和视频——
00:31
through通过 photos相片 and videos视频 --
6
19365
1986
甚至是我们的健身运动——
00:33
even our fitness身体素质 activities活动 --
7
21375
1879
00:35
are stored存储 as digital数字 data数据.
8
23278
2133
都存储在电子数据里。
00:38
Aside在旁边 from running赛跑 out of space空间
9
26109
1517
要不是它们超出我们
00:39
on our phones手机,
10
27650
1151
手机的存储空间,
我们很少会去想我们到底
存储了多少电子数据。
00:40
we rarely很少 think about
our digital数字 footprint脚印.
11
28825
2314
00:43
But humanity人性 has collectively
generated产生 more data数据
12
31536
3528
但是人类已经携手创造了更多的数据,
在过去的几年中,
00:47
in the last few少数 years年份
13
35088
1873
00:48
than all of preceding human人的 history历史.
14
36985
2530
这些数据比先前
人类历史所产生的还要多。
大数据已经开始成为一个大问题。
00:51
Big data数据 has become成为 a big problem问题.
15
39902
2898
00:55
Digital数字 storage存储 is really expensive昂贵,
16
43229
2817
数字化存储很昂贵,
而且还没有一个设备
能真正经得起时间的考验。
00:58
and none没有 of these devices设备 that we have
really stand the test测试 of time.
17
46070
3723
01:03
There's this nonprofit非营利性 website网站
called the Internet互联网 Archive档案.
18
51256
3750
有一个非营利网站,
叫做“网络档案馆”。
除了免费的书籍和电影,
01:07
In addition加成 to free自由 books图书 and movies电影,
19
55030
2645
你还可以在上面找到
1996年以来的网页。
01:09
you can access访问 web卷筒纸 pages网页
as far back as 1996.
20
57699
4364
这可是非常诱人的,
01:14
Now, this is very tempting诱人的,
21
62087
1684
但我决定回过头来,
看看TED网站最初的样子。
01:15
but I decided决定 to go back and look at
the TEDTED website's网站的 very humble谦卑 beginnings开始.
22
63795
5989
可以看到,它在过去30年里改变了很多。
01:21
As you can see, it's changed
quite相当 a bit in the last 30 years年份.
23
69808
3912
01:26
So this led me to the first-ever史无前例的 TEDTED,
24
74720
2824
这使我回忆起第一次的TED,
01:29
back in 1984,
25
77568
2180
回到1984,
01:31
and it just so happened发生
to be a Sony索尼 executive行政人员
26
79772
2525
太巧了,正是索尼的主管
在解释一个简单的磁盘是如何工作的。
01:34
explaining说明 how a compact紧凑 disk磁盘 works作品.
27
82321
3058
(大笑)
01:37
(Laughter笑声)
28
85403
1079
这是让人难以置信的事,
我们可以回到过去,
01:38
Now, it's really incredible难以置信
to be able能够 to go back in time
29
86506
4264
01:42
and access访问 this moment时刻.
30
90794
2286
并且与那个时刻紧密相连。
01:45
It's also really fascinating迷人
that after 30 years年份, after that first TEDTED,
31
93548
5363
这也是非常让人着迷的事,
在第一次TED演讲过去的30年后,
我们还在谈论着数字化存储。
01:50
we're still talking about digital数字 storage存储.
32
98935
2779
01:54
Now, if we look back another另一个 30 years年份,
33
102827
2787
如果我们回头看看另外一个30年,
01:57
IBMIBM released发布 the first-ever史无前例的 hard drive驾驶
34
105638
3185
1956年,IBM破天荒地发布了
02:00
back in 1956.
35
108847
2127
它的第一个硬盘驱动器。
02:02
Here it is being存在 loaded for shipping运输
in front面前 of a small audience听众.
36
110998
4197
这是它正在被装载上车,
一小群人在围观。
02:07
It held保持 the equivalent当量 of one MPMP3 song歌曲
37
115569
3110
它承载着一首MP3歌曲的内容,
02:11
and weighed称重 over one ton.
38
119354
2004
却重达一吨多。
02:14
At 10,000 dollars美元 a megabyte兆字节,
39
122100
2651
一兆字节价值1万美元,
我想这里不会有人有兴趣要买它,
02:16
I don't think anyone任何人 in this room房间
would be interested有兴趣 in buying购买 this thing,
40
124775
3587
除非可能作为一个收藏品。
02:20
except maybe as a collector's珍藏 item项目.
41
128386
1760
02:22
But it's the best最好 we could do at the time.
42
130817
2988
但这是我们在当时最好的产品了。
02:26
We've我们已经 come such这样 a long way
in data数据 storage存储.
43
134832
3116
我们在数据存储的路上走了很久。
设备已经显著进化了。
02:29
Devices设备 have evolved进化 dramatically显着.
44
137972
2898
但所有载体最终都会磨损或被废弃。
02:32
But all media媒体 eventually终于 wear穿 out
or become成为 obsolete过时的.
45
140894
4024
02:37
If someone有人 handed you a floppy软盘 drive驾驶 today今天
to back up your presentation介绍,
46
145401
4417
今天,如果有人递给你一张
软盘驱动器来备份你的演示文稿,
你可能会奇怪地看着他们,
可能还会大笑,
02:41
you'd probably大概 look at them
kind of strange奇怪, maybe laugh,
47
149842
2940
但你肯定不会用这个落伍的东西。
02:44
but you'd have no way
to use the damn该死的 thing.
48
152806
2415
02:47
These devices设备 can no longer meet遇到
our storage存储 needs需求,
49
155854
3141
这些设备已经不能再
满足我们的存储需求了,
虽然它们有些可以被改作其他用途。
02:51
although虽然 some of them can be repurposed改变用途.
50
159019
2702
02:54
All technology技术 eventually终于 dies or is lost丢失,
51
162682
3109
所有的科技最终都会死亡或者消失,
02:57
along沿 with our data数据,
52
165815
1851
和我们的数据一起,
包含我们所有的记忆。
02:59
all of our memories回忆.
53
167690
1540
03:02
There's this illusion错觉 that
the storage存储 problem问题 has been solved解决了,
54
170210
4116
有一种错觉认为存储问题已经解决了,
03:06
but really, we all just externalize外化 it.
55
174350
2493
但实际上,我们只是把它外化了。
我们不担心邮件和照片的存储。
03:08
We don't worry担心 about storing存储
our emails电子邮件 and our photos相片.
56
176867
3477
它们都在云端上。
03:12
They're just in the cloud.
57
180368
1723
03:15
But behind背后 the scenes场景,
storage存储 is problematic问题.
58
183231
2937
但是在这些场景背后,
存储问题依然存在。
毕竟,云端只是许多硬盘组成的。
03:18
After all, the cloud is just
a lot of hard drives驱动器.
59
186192
3980
03:23
Now, most digital数字 data数据,
we could argue争论, is not really critical危急.
60
191156
4040
我们认为大部分电子数据都不重要。
当然,我们还可以
轻易地删除这些数据。
03:27
Surely一定, we could just delete删除 it.
61
195220
2123
03:29
But how can we really know
what's important重要 today今天?
62
197957
3535
但是今天的我们怎么
知道到底什么是重要的?
03:34
We've我们已经 learned学到了 so much about human人的 history历史
63
202132
2536
我们从人类历史中得到了很多信息,
从洞穴里的壁画和文字,
03:36
from drawings图纸 and writings文章 in caves洞穴,
64
204692
2826
还有石碑。
03:39
from stone tablets平板电脑.
65
207542
1614
我们破译了罗塞塔石碑上的语言。
03:41
We've我们已经 deciphered破译 languages语言
from the Rosetta罗塞塔 Stone.
66
209180
3397
03:45
You know, we'll never really have
the whole整个 story故事, though虽然.
67
213841
3609
尽管我们还远没有了解整个故事。
我们的数据就是我们的故事,
03:49
Our data数据 is our story故事,
68
217474
1894
这在今天更是这样。
03:51
even more so today今天.
69
219392
1735
03:53
We won't惯于 have our record记录
recorded记录 on stone tablets平板电脑.
70
221508
3261
我们不再将记录刻在石碑上。
03:57
But we don't have to choose选择
what is important重要 now.
71
225692
2698
我们现在也不需要去选择
什么是重要的。
04:00
There's a way to store商店 it all.
72
228847
1893
有一种方法可以存储所有信息。
04:03
It turns out that there's
a solution that's been around
73
231519
2598
我们发现,这种解决方案已经存在了
数十亿年。
04:06
for a few少数 billion十亿 years年份,
74
234141
2443
它实际上就在这个小管里。
04:08
and it's actually其实 in this tube.
75
236608
1840
04:12
DNA脱氧核糖核酸 is nature's大自然 oldest最老的 storage存储 device设备.
76
240044
3722
DNA是大自然最古老的存储设备。
04:15
After all, it contains包含
all the information信息 necessary必要
77
243790
3371
毕竟,它保存着构建和
维持一个人生命的
04:19
to build建立 and maintain保持 a human人的 being存在.
78
247185
2830
所有必要的信息。
04:22
But what makes品牌 DNA脱氧核糖核酸 so great?
79
250583
2204
然而,DNA为何如此强大?
04:25
Well, let's take our own拥有 genome基因组
80
253493
1756
让我们来看看
04:27
as an example.
81
255273
1560
人类的基因组,
04:28
If we were to print打印 out
all three billion十亿 A's, T'sT的, C'sC'S and G'sG公司
82
256857
4770
如果我们将所有30亿个A(腺嘌呤),
T(胸腺嘧啶),C(胞嘧啶)
和 G(鸟嘌呤),以标准字体,
标准格式打印出来,
04:33
on a standard标准 font字形, standard标准 format格式,
83
261651
3631
然后我们把所有纸张叠起来,
04:37
and then we were
to stack all of those papers文件,
84
265306
2740
大概会有130米高,
04:40
it would be about 130 meters high,
85
268070
2660
介于自由女神像和
华盛顿纪念碑的高度之间。
04:42
somewhere某处 between之间 the Statue雕像 of Liberty自由
and the Washington华盛顿 Monument纪念碑.
86
270754
3659
如果我们将所有这些A,T,C和G,
04:46
Now, if we converted转换
all those A's, T'sT的, C'sC'S and G'sG公司
87
274437
2447
转换为电子数据,0和1,
04:48
to digital数字 data数据, to zeroes and ones那些,
88
276898
2556
这不过是几场演奏会的事。
04:51
it would total a few少数 gigs演出.
89
279478
1769
04:53
And that's in each cell细胞 of our body身体.
90
281786
2339
这会发生在我们身体的每个细胞中。
04:56
We have more than 30 trillion cells细胞.
91
284516
2838
我们有超过30万亿的细胞。
04:59
You get the idea理念:
92
287757
1500
估计你们已经想明白了:
DNA可以在一个微小的
空间存储大量信息。
05:01
DNA脱氧核糖核酸 can store商店 a ton of information信息
in a minuscule微不足道 space空间.
93
289281
4675
05:07
DNA脱氧核糖核酸 is also very durable耐用,
94
295620
1825
DNA也是持久耐用的,
05:09
and it doesn't even require要求
electricity电力 to store商店 it.
95
297469
2834
它甚至不需要供电来储存信息。
05:12
We know this because scientists科学家们
have recovered恢复 DNA脱氧核糖核酸 from ancient humans人类
96
300327
4276
我们知道这些,是因为科学家
已经从生活在千万年前的
远古人类身上复原了DNA。
05:16
that lived生活 hundreds数以百计
of thousands数千 of years年份 ago.
97
304627
2752
其中一个是Ötzi冰人。
05:19
One of those is Ötzi the Iceman.
98
307739
2627
05:22
Turns out, he's Austrian.
99
310390
1683
他是奥地利人。
05:24
(Laughter笑声)
100
312097
1600
(大笑)
他被发现时正完整的保存在
05:25
He was found发现 high, well-preserved保存完好,
101
313721
1630
意大利和奥地利之间的山中,
05:27
in the mountains
between之间 Italy意大利 and Austria奥地利,
102
315375
2814
05:30
and it turns out that he has living活的
genetic遗传 relatives亲戚们 here in Austria奥地利 today今天.
103
318213
3984
证明他和现在的奥地利人有基因关系。
05:34
So one of you could be a cousin表姐 of Ötzi.
104
322221
2342
所以你们其中有人可能是Ötzi的表亲。
05:36
(Laughter笑声)
105
324587
1055
(大笑)
05:38
The point is that we have a better chance机会
of recovering恢复 information信息
106
326043
3853
其中的关键是,我们拥有
更好的从一个远古人类身上
修复信息的机会,
05:41
from an ancient human人的
107
329920
1225
比从一台老电话上获得的更多。
05:43
than we do from an old phone电话.
108
331169
2042
05:45
It's also much less likely容易
that we'll lose失去 the ability能力 to read DNA脱氧核糖核酸
109
333783
4645
同时,相较于任何一种
人造的设备,我们不太可能失去
解读DNA的能力。
05:50
than any single man-made人造 device设备.
110
338452
2434
05:53
Every一切 single new storage存储 format格式
requires要求 a new way to read it.
111
341567
4112
每一种新的存储格式都要求
一种新的解读方式。
而我们将一直保持解读DNA的能力。
05:57
We'll always be able能够 to read DNA脱氧核糖核酸.
112
345703
2133
05:59
If we can no longer sequence序列,
we have bigger problems问题
113
347860
3068
如果有一天我们
不能够进行基因排序,
那问题可比数据存储更令人担忧。
06:02
than worrying令人担忧 about data数据 storage存储.
114
350952
2281
在DNA中存储数据不是新鲜事。
06:05
Storing存储 data数据 on DNA脱氧核糖核酸 is not new.
115
353725
3071
大自然在数十亿年中一直这么做。
06:08
Nature's自然的 been doing it
for several一些 billion十亿 years年份.
116
356820
3099
事实上,每一个生物
都是一个DNA存储设备。
06:11
In fact事实, every一切 living活的 thing
is a DNA脱氧核糖核酸 storage存储 device设备.
117
359943
3892
06:16
But how do we store商店 data数据 on DNA脱氧核糖核酸?
118
364397
2786
但是我们怎么把数据存储进DNA呢?
06:19
This is Photo照片 51.
119
367725
1791
这是照片51。
这是第一张DNA的照片,
06:21
It's the first-ever史无前例的 photo照片 of DNA脱氧核糖核酸,
120
369540
2627
拍摄于大约60年前。
06:24
taken采取 about 60 years年份 ago.
121
372191
2252
也是大约这个时间,
IBM发布了硬盘驱动器。
06:26
This is around the time that
that same相同 hard drive驾驶 was released发布 by IBMIBM.
122
374467
4382
可以说,我们对数字化存储的理解
和我们对基因的理解是在同步进化的。
06:31
So really, our understanding理解 of digital数字
storage存储 and of DNA脱氧核糖核酸 have coevolved共同进化.
123
379246
5492
06:37
We first learned学到了 to sequence序列, or read DNA脱氧核糖核酸,
124
385600
3316
我们最开始是学习测序,
或者解读DNA,
之后很快也学会了如何编辑它,
06:40
and very soon不久 after, how to write it,
125
388940
2012
06:42
or synthesize合成 it.
126
390976
1559
或者合成它。
06:44
This is much like how we learn学习
a new language语言.
127
392559
3564
这很像如何学习一门新语言。
06:48
And now we have the ability能力
to read, write and copy复制 DNA脱氧核糖核酸.
128
396812
4613
而现在我们有能力阅读、
编辑和复制DNA。
我们一直在实验室里这么做。
06:53
We do it in the lab实验室 all the time.
129
401449
2080
06:56
So anything, really anything,
that can be stored存储 as zeroes and ones那些
130
404283
3882
所以,毫不夸张的说,
任何东西可以以 0 和 1的形式
存储在DNA中。
07:00
can be stored存储 in DNA脱氧核糖核酸.
131
408189
1719
07:02
To store商店 something digitally数字,
like this photo照片,
132
410579
3195
要以数字化的方式存储
某些内容,比如这张照片,
我们要先把它转换为比特,
或者二进制数字。
07:05
we convert兑换 it to bits, or binary二进制 digits数字.
133
413798
3306
黑白照片中的每个像素
就代表一个 0 或 1。
07:09
Each pixel像素 in a black-and-white黑与白 photo照片
is simply只是 a zero or a one.
134
417128
4211
我们可以像喷墨打印机
打字一样书写DNA。
07:13
And we can write DNA脱氧核糖核酸 much like an inkjet喷墨
printer打印机 can print打印 letters on a page.
135
421849
4824
我们只要将数据,所有这些 0 和1,
07:18
We just have to convert兑换 our data数据,
all of those zeroes and ones那些,
136
426697
3824
转换为 A,T,C,G,
07:22
to A's, T'sT的, C'sC'S and G'sG公司,
137
430545
2138
然后将它们发送到合成公司。
07:24
and then we send发送 this
to a synthesis合成 company公司.
138
432707
2258
这样一来,我们既可以
书写,也可以存储,
07:26
So we write it, we can store商店 it,
139
434989
1947
当我们想要恢复数据,
只需要测序就好。
07:28
and when we want to recover恢复 our data数据,
we just sequence序列 it.
140
436960
3234
有意思的部分是决定要包含哪些文件。
07:32
Now, the fun开玩笑 part部分 of all of this
is deciding决定 what files to include包括.
141
440218
4081
07:36
We're serious严重 scientists科学家们,
so we had to include包括 a manuscript手稿
142
444323
3377
我们是严肃的科学家,
所以我们必须留下一份手稿
给我们优秀的后代。
07:39
for good posterity后人.
143
447724
1743
07:41
We also included包括 a $50 Amazon亚马逊 gift礼品 card --
144
449491
2833
我们还放入了一份
价值50美元的亚马逊礼卡——
别激动,里面的余额已经被移除了——
07:44
don't get too excited兴奋, it's already已经
been spent花费, someone有人 decoded解码 it --
145
452348
3531
07:47
as well as an operating操作 system系统,
146
455903
2210
还有一个操作系统,
人类制作的第一部电影,
07:50
one of the first movies电影 ever made制作
147
458137
2371
和一个“先驱者号”金属板。
07:52
and a Pioneer先锋 plaque牌匾.
148
460532
1738
你们中可能有人见过它。
07:54
Some of you might威力 have seen看到 this.
149
462294
1669
它包含了代表性的信息,
——显然,包括男女性别,
07:55
It has a depiction描写 of a typical典型 --
apparently显然地 -- male and female,
150
463987
3456
还有我们在太阳系中的大致位置,
07:59
and our approximate近似 location位置
in the Solar太阳能 System系统,
151
467467
2562
以防万一“先驱者号”
太空飞船遇见了外星人。
08:02
in case案件 the Pioneer先锋 spacecraft宇宙飞船
ever encounters遭遇 extraterrestrials外星人.
152
470053
4002
08:06
So once一旦 we decided决定 what sort分类 of files
we want to encode编码,
153
474861
2929
一旦我们决定了
哪些类型的文件要编码,
就可以把这些数据打包,
08:09
we package up the data数据,
154
477814
1468
将这些 0 和 1 转换为 A,T,C,G,
08:11
convert兑换 those zeroes and ones那些
to A's, T'sT的, C'sC'S and G'sG公司,
155
479306
3654
然后将这个文件发送到合成公司。
08:14
and then we just send发送 this file文件 off
to a synthesis合成 company公司.
156
482984
3277
而这,就是我们拿回来的东西。
08:18
And this is what we got back.
157
486285
1770
我们的文件就在这个小管里。
08:20
Our files were in this tube.
158
488079
1919
我们只需要对它进行测序
就可以解读其中的信息。
08:22
All we had to do was sequence序列 it.
159
490022
2098
这听起来真的很简单,
08:24
This all sounds声音 pretty漂亮 straightforward直截了当,
160
492525
2531
08:27
but the difference区别 between之间
a really cool, fun开玩笑 idea理念
161
495080
2978
但一个很酷、很有趣的想法,
与我们实际运用之间的不同之处,
08:30
and something we can actually其实 use
162
498082
2155
在于战胜实际的挑战。
08:32
is overcoming克服 these practical实际的 challenges挑战.
163
500261
2496
08:35
Now, while DNA脱氧核糖核酸 is more robust强大的
than any man-made人造 device设备,
164
503453
3972
而DNA虽然比任何人造设备更稳定,
但它并不是完美的。
08:39
it's not perfect完善.
165
507449
1285
它也有一些弱点。
08:40
It does have some weaknesses弱点.
166
508758
1950
08:43
We recover恢复 our message信息
by sequencing测序 the DNA脱氧核糖核酸,
167
511364
3431
我们可以通过DNA测序来恢复信息,
08:46
and every一切 time data数据 is retrieved检索,
168
514819
2013
但每次数据找回,
这个DNA都会被破坏。
08:48
we lose失去 the DNA脱氧核糖核酸.
169
516856
1786
这只是测序过程的必要步骤。
08:50
That's just part部分
of the sequencing测序 process处理.
170
518666
2414
我们不想把数据耗尽,
08:53
We don't want to run out of data数据,
171
521104
1935
不过好在还有一种方法可以复制DNA,
08:55
but luckily, there's a way to copy复制 the DNA脱氧核糖核酸
172
523063
3096
甚至比合成更便宜,更容易。
08:58
that's even cheaper便宜 and easier更轻松
than synthesizing合成 it.
173
526183
4585
09:03
We actually其实 tested测试 a way to make
200 trillion copies副本 of our files,
174
531275
4858
我们测试了这种方法,
将我们的文件复制了200万亿份,
并精准的还原了所有数据。
09:08
and we recovered恢复
all the data数据 without error错误.
175
536157
2732
09:11
So sequencing测序 also introduces介绍
errors错误 into our DNA脱氧核糖核酸,
176
539556
3867
测序也会将误差引入DNA,
引入 A,T,C,G 中。
09:15
into the A's, T'sT的, C'sC'S and G'sG公司.
177
543447
2307
09:18
Nature性质 has a way
to deal合同 with this in our cells细胞.
178
546135
2978
大自然有办法在细胞中处理这个问题。
但我们的数据是存储在
小管里的合成DNA中,
09:21
But our data数据 is stored存储
in synthetic合成的 DNA脱氧核糖核酸 in a tube,
179
549137
5890
所以我们必须找到
自己的方法来解决这个问题。
09:27
so we had to find our own拥有 way
to overcome克服 this problem问题.
180
555051
3252
09:30
We decided决定 to use an algorithm算法
that was used to stream videos视频.
181
558724
4243
我们决定使用传输视频时用到的算法。
09:35
When you're streaming a video视频,
182
563452
1453
当你在传输视频时,
你实际上是在设法恢复
原始的视频,原始文件。
09:36
you're essentially实质上 trying to recover恢复
the original原版的 video视频, the original原版的 file文件.
183
564929
4461
当我们在设法恢复原始文件时,
09:41
When we're trying to recover恢复
our original原版的 files,
184
569414
2909
我们只是在测序。
09:44
we're simply只是 sequencing测序.
185
572347
1848
但实际上,这两个过程
都是在复原足够的 0 和1。
09:46
But really, both of these processes流程 are
about recovering恢复 enough足够 zeroes and ones那些
186
574219
4088
将数据重新整合在一起。
09:50
to put our data数据 back together一起.
187
578331
1793
09:52
And so, because of our coding编码 strategy战略,
188
580711
2041
所以,根据我们的编码策略,
我们能够以一种可以制造
09:54
we were able能够 to package up all of our data数据
189
582776
2551
上万亿份拷贝的方式,将所有数据打包,
09:57
in a way that allowed允许 us to make
millions百万 and trillions万亿 of copies副本
190
585351
3772
同时仍然保证所有的文件可以复原。
10:01
and still always recover恢复
all of our files back.
191
589147
2976
10:04
This is the movie电影 we encoded编码.
192
592708
1750
这是我们编码的电影,
10:06
It's one of the first movies电影 ever made制作,
193
594482
2580
是人类创作的首批电影之一,
也是第一个在DNA中被复制出
超过200万亿份拷贝的电影。
10:09
and now the first to be copied复制
more than 200 trillion times on DNA脱氧核糖核酸.
194
597086
4759
10:14
Soon不久 after our work was published发表,
195
602377
2130
很快我们的工作被公开发表,
我们在Reddit网站上
参与了“问我任何问题”的活动。
10:16
we participated参加 in an "Ask Me Anything"
on the website网站 reddit书签交易.
196
604531
3747
如果你是一个资深学究,
你应该对这个网站不会陌生。
10:20
If you're a fellow同伴 nerd书呆子,
you're very familiar with this website网站.
197
608302
3175
大部分问题都有很深的思考,
10:23
Most questions问题 were thoughtful周到.
198
611501
1945
也有一些问题很好笑。
10:25
Some were comical滑稽.
199
613470
1872
比如,一个用户想知道我们什么时候
会拥有一个字面意义的拇指储存器。
10:27
For example, one user用户 wanted to know
when we would have a literal文字 thumb拇指 drive驾驶.
200
615366
4128
10:32
Now, the thing is,
201
620091
2276
事实上,
我们的DNA已经存储了
所有塑造了我们的必要信息。
10:34
our DNA脱氧核糖核酸 already已经 stores商店 everything
needed需要 to make us who we are.
202
622391
4142
将数据存储在DNA中,
10:38
It's a lot safer更安全 to store商店 data数据 on DNA脱氧核糖核酸
203
626557
3818
比在小管中合成DNA要安全得多。
10:42
in synthetic合成的 DNA脱氧核糖核酸 in a tube.
204
630399
2821
10:46
Writing写作 and reading data数据 from DNA脱氧核糖核酸
is obviously明显 a lot more time-consuming耗时的
205
634704
5426
在DNA中写入和读取数据,
明显比在硬盘中存储文件
更花时间——
10:52
than just saving保存 all your files
on a hard drive驾驶 --
206
640154
3095
目前是这样。
10:55
for now.
207
643273
1291
10:57
So initially原来, we should focus焦点
on long-term长期 storage存储.
208
645159
3781
所以,我们首先应该
关注长期存储的问题。
11:02
Most data数据 are ephemeral短暂的.
209
650630
2310
大部分数据只能保存一段时间。
目前还很难提炼出哪些信息是重要的,
11:04
It's really hard to grasp把握
what's important重要 today今天,
210
652964
2588
或者哪些对后人是重要的。
11:07
or what will be important重要
for future未来 generations.
211
655576
3252
但重点是,我们不一定要马上做决定。
11:10
But the point is,
we don't have to decide决定 today今天.
212
658852
2563
11:14
There's this great program程序 by UNESCO联合国教科文组织
called the "Memory记忆 of the World世界" program程序.
213
662065
4988
联合国教科文组织有一个
叫做“世界的记忆”的项目,
建立这个项目的初衷是
保存历史的记忆,
11:19
It's been created创建 to preserve保留
historical历史的 materials物料
214
667077
3267
那些对全人类都有价值的记忆。
11:22
that are considered考虑 of value
to all of humanity人性.
215
670368
3127
11:26
Items项目 are nominated提名
to be added添加 to the collection采集,
216
674210
2977
被选中的信息会被加入集合中,
包括我们编译的那部电影。
11:29
including包含 that film电影 that we encoded编码.
217
677211
2255
11:32
While a wonderful精彩 way
to preserve保留 human人的 heritage遗产,
218
680188
3582
而保存人类传统更好的方式,
不是必须做一个选择。
11:35
it doesn't have to be a choice选择.
219
683794
1912
与其问我们这一代人,
11:38
Instead代替 of asking
the current当前 generation -- us --
220
686088
3454
在未来什么东西可能是重要的,
11:41
what might威力 be important重要 in the future未来,
221
689566
2222
我们可以在DNA中存储一切。
11:43
we could store商店 everything in DNA脱氧核糖核酸.
222
691812
2334
11:47
Storage存储 is not just about how many许多 bytes字节
223
695543
2440
存储不止是关乎有多少字节,
而是我们可以多好地保存和恢复数据。
11:50
but how well we can actually其实
store商店 the data数据 and recover恢复 it.
224
698007
3501
11:53
There's always been this tension张力
between之间 how much data数据 we can generate生成
225
701940
3431
一直以来,在我们会产生多少数据,
可以恢复多少数据,
以及可以存储多少数据之间,
11:57
and how much we can recover恢复
226
705395
1715
都存在着矛盾。
11:59
and how much we can store商店.
227
707134
1769
12:01
Every一切 advance提前 in writing写作 data数据
has required需要 a new way to read it.
228
709841
4039
数据写入的每次进步,
都要求一种新的读取方式。
我们已无法再读取
那些老旧的存储设备了。
12:05
We can no longer read old media媒体.
229
713904
2343
你们还有多少人的
笔记本电脑中有磁盘驱动器,
12:08
How many许多 of you even have
a disk磁盘 drive驾驶 in your laptop笔记本电脑,
230
716271
3741
或者软盘驱动器?
12:12
never mind心神 a floppy软盘 drive驾驶?
231
720036
1724
12:14
This will never be the case案件 with DNA脱氧核糖核酸.
232
722151
2552
有了DNA,这些情况再也不会出现。
只要我们在,DNA就存在,
12:16
As long as we're around, DNA脱氧核糖核酸 is around,
233
724727
3177
我们总会找到排序的方式。
12:19
and we'll find a way to sequence序列 it.
234
727928
2180
12:23
Archiving归档 the world世界 around us
is part部分 of human人的 nature性质.
235
731214
3459
将我们周围的世界存档
是人类天性的一部分。
12:27
This is the progress进展 we've我们已经 made制作
in digital数字 storage存储 in 60 years年份,
236
735172
4624
这是过去60年我们数字化存储的发展,
60年前我们也刚刚开始理解DNA。
12:31
at a time when we were only
beginning开始 to understand理解 DNA脱氧核糖核酸.
237
739820
3376
12:35
Yet然而, we've我们已经 made制作 similar类似 progress进展
in half that time with DNA脱氧核糖核酸 sequencers,
238
743725
4845
而有了DNA测序技术,我们用一半的
时间就达到了相似的发展进度,
而且只要我们还存在,DNA就永不过时。
12:40
and as long as we're around,
DNA脱氧核糖核酸 will never be obsolete过时的.
239
748594
4943
12:46
Thank you.
240
754107
1181
谢谢。
(鼓掌)
12:47
(Applause掌声)
241
755312
4981
Translated by Xuying Wu
Reviewed by SHUYING XU

▲Back to top

ABOUT THE SPEAKER
Dina Zielinski - Bench scientist, bioinformatician
Dina Zielinski brings biological data to life, from decoding mutations in cancer to encoding data in DNA.

Why you should listen

Dina Zielinski is a bench scientist and bioinformatician with broad experience in genetics and genomics. Her current projects are in developmental biology and neurology, but she is motivated to keep learning and using her skills to answer scientific questions that challenge our deepest knowledge.

More profile about the speaker
Dina Zielinski | Speaker | TED.com