ABOUT THE SPEAKER
Dina Zielinski - Bench scientist, bioinformatician
Dina Zielinski brings biological data to life, from decoding mutations in cancer to encoding data in DNA.

Why you should listen

Dina Zielinski is a bench scientist and bioinformatician with broad experience in genetics and genomics. Her current projects are in developmental biology and neurology, but she is motivated to keep learning and using her skills to answer scientific questions that challenge our deepest knowledge.

More profile about the speaker
Dina Zielinski | Speaker | TED.com
TEDxVienna

Dina Zielinski: How we can store digital data in DNA

迪娜·齊林斯基: 如何將數位資料儲存在 DNA 中

Filmed:
1,777,866 views

從軟碟到隨身碟,每一個儲存數據的方法終究會過時。如果我們找到一個能永久儲存全世界所有數據的辦法呢?生物資訊學家迪娜·齊林斯基,分享了已經存在數十億年的解決辦法 : DNA ,及其背後的科學原理。
- Bench scientist, bioinformatician
Dina Zielinski brings biological data to life, from decoding mutations in cancer to encoding data in DNA. Full bio

Double-click the English transcript below to play the video.

00:12
I could fit適合 all movies電影 ever made製作
inside of this tube.
0
652
5196
我可以把過去所有的電影
都放進這個試管中。
00:17
If you can't see it,
that's kind of the point.
1
5872
2253
如果你看不到,那就對了。
00:20
(Laughter笑聲)
2
8149
1016
(笑聲)
00:21
Before we understand理解 how this is possible可能,
3
9189
3243
我們在了解這怎麼可能辦到之前,
00:24
it's important重要 to understand理解
the value of this feat功績.
4
12456
3746
重要的是先了解這項技術的價值。
00:29
All of our thoughts思念
and actions行動 these days,
5
17075
2266
現今我們所有的想法和行為,
00:31
through通過 photos相片 and videos視頻 --
6
19365
1986
透過照片、影片——
00:33
even our fitness身體素質 activities活動 --
7
21375
1879
甚至我們的健身活動——
00:35
are stored存儲 as digital數字 data數據.
8
23278
2133
以數位資料的形式儲存起來。
要不是手機上的空間不夠用,
00:38
Aside在旁邊 from running賽跑 out of space空間
9
26109
1517
00:39
on our phones手機,
10
27650
1151
我們幾乎不會去思考
我們儲存了多少數位資料。
00:40
we rarely很少 think about
our digital數字 footprint腳印.
11
28825
2314
00:43
But humanity人性 has collectively
generated產生 more data數據
12
31536
3528
但人類在過去幾年間
產生出來的資料,
00:47
in the last few少數 years年份
13
35088
1873
比先前人類歷史上所產生的都還要多。
00:48
than all of preceding human人的 history歷史.
14
36985
2530
00:51
Big data數據 has become成為 a big problem問題.
15
39902
2898
大數據成為了大問題。
00:55
Digital數字 storage存儲 is really expensive昂貴,
16
43229
2817
數位儲存十分昂貴,
00:58
and none沒有 of these devices設備 that we have
really stand the test測試 of time.
17
46070
3723
我們現有的儲存裝置
都無法經過時間的考驗。
01:03
There's this nonprofit非營利性 website網站
called the Internet互聯網 Archive檔案.
18
51256
3750
有一個非營利的網站
叫做網路檔案庫。
01:07
In addition加成 to free自由 books圖書 and movies電影,
19
55030
2645
除了免費書籍和電影外,
01:09
you can access訪問 web捲筒紙 pages網頁
as far back as 1996.
20
57699
4364
你還能取得過去的網頁,
最早可追溯到 1996 年。
01:14
Now, this is very tempting誘人的,
21
62087
1684
這實在非常誘人,
01:15
but I decided決定 to go back and look at
the TEDTED website's網站的 very humble謙卑 beginnings開始.
22
63795
5989
但我決定回去看看
TED 網站最初低調的樣子。
01:21
As you can see, it's changed
quite相當 a bit in the last 30 years年份.
23
69808
3912
各位可以看到,在過去
三十年間它確實改變了不少。
01:26
So this led me to the first-ever史無前例​​的 TEDTED,
24
74720
2824
這讓我回憶起第一次與 TED 的接觸,
01:29
back in 1984,
25
77568
2180
時間回到 1984 年
01:31
and it just so happened發生
to be a Sony索尼 executive行政人員
26
79772
2525
主題正好就是 Sony 的經理
01:34
explaining說明 how a compact緊湊 disk磁盤 works作品.
27
82321
3058
解釋光碟如何運作的原理。
01:37
(Laughter笑聲)
28
85403
1079
(笑聲)
01:38
Now, it's really incredible難以置信
to be able能夠 to go back in time
29
86506
4264
能回到過去,存取當時的那一刻,
01:42
and access訪問 this moment時刻.
30
90794
2286
真的很不可思議。
01:45
It's also really fascinating迷人
that after 30 years年份, after that first TEDTED,
31
93548
5363
有趣的是,在第一次
TED 演講過後的三十年,
01:50
we're still talking about digital數字 storage存儲.
32
98935
2779
我們仍然在談數位儲存。
01:54
Now, if we look back another另一個 30 years年份,
33
102827
2787
如果我們回頭看看另一個三十年,
01:57
IBMIBM released發布 the first-ever史無前例​​的 hard drive駕駛
34
105638
3185
IBM 推出了史上第一個硬碟,
02:00
back in 1956.
35
108847
2127
那年是 1956 年。
02:02
Here it is being存在 loaded for shipping運輸
in front面前 of a small audience聽眾.
36
110998
4197
這張照片是硬碟在一小群
觀眾面前被裝載上連輸車。
02:07
It held保持 the equivalent當量 of one MPMP3 song歌曲
37
115569
3110
它的容量等同於
一首 MP3 格式的歌曲,
02:11
and weighed稱重 over one ton.
38
119354
2004
但重量卻有一公噸重。
02:14
At 10,000 dollars美元 a megabyte兆字節,
39
122100
2651
平均每 1MB 就要美金一萬元,
02:16
I don't think anyone任何人 in this room房間
would be interested有興趣 in buying購買 this thing,
40
124775
3587
我不認為在座有人
會想要買這個東西,
除非想拿來當作收藏品。
02:20
except maybe as a collector's珍藏 item項目.
41
128386
1760
02:22
But it's the best最好 we could do at the time.
42
130817
2988
但在當年,我們最多也只能做到這樣。
02:26
We've我們已經 come such這樣 a long way
in data數據 storage存儲.
43
134832
3116
我們在資料儲存方面
有很大的進步。
02:29
Devices設備 have evolved進化 dramatically顯著.
44
137972
2898
裝置設備也有很大的改良。
02:32
But all media媒體 eventually終於 wear穿 out
or become成為 obsolete過時的.
45
140894
4024
但,所有的儲存媒體終將
會損耗掉或被淘汰掉。
02:37
If someone有人 handed you a floppy軟盤 drive駕駛 today今天
to back up your presentation介紹,
46
145401
4417
如果現今有人給你
一張軟碟片來備份簡報,
02:41
you'd probably大概 look at them
kind of strange奇怪, maybe laugh,
47
149842
2940
你可能會用奇怪的表情
看著他們,也許會笑出來,
02:44
but you'd have no way
to use the damn該死的 thing.
48
152806
2415
但你完全沒辦法
使用那該死的古董。
02:47
These devices設備 can no longer meet遇到
our storage存儲 needs需求,
49
155854
3141
這些裝置已經無法滿足
我們在儲存上的需求,
02:51
although雖然 some of them can be repurposed改變用途.
50
159019
2702
只是其中某一些還能
轉做其它目的使用。
02:54
All technology技術 eventually終於 dies or is lost丟失,
51
162682
3109
所有的科技最終都會停用或過時,
把我們的資料、
02:57
along沿 with our data數據,
52
165815
1851
我們所有的記憶一同帶走。
02:59
all of our memories回憶.
53
167690
1540
03:02
There's this illusion錯覺 that
the storage存儲 problem問題 has been solved解決了,
54
170210
4116
「儲存問題已經解決」
只是一種幻覺,
03:06
but really, we all just externalize外化 it.
55
174350
2493
事實上,我們只是把它外化了。
03:08
We don't worry擔心 about storing存儲
our emails電子郵件 and our photos相片.
56
176867
3477
我們不擔心電子郵件
和相片的儲存。
03:12
They're just in the cloud.
57
180368
1723
反正它們全都在雲端。
03:15
But behind背後 the scenes場景,
storage存儲 is problematic問題.
58
183231
2937
但在這些場景背後的儲存卻問題多多。
03:18
After all, the cloud is just
a lot of hard drives驅動器.
59
186192
3980
畢竟,雲端是由很多硬碟組成的。
03:23
Now, most digital數字 data數據,
we could argue爭論, is not really critical危急.
60
191156
4040
我們可以爭辯說,大部分
數位資料都沒那麼重要。
03:27
Surely一定, we could just delete刪除 it.
61
195220
2123
當然,我們可以輕鬆地
就把它們刪除掉。
03:29
But how can we really know
what's important重要 today今天?
62
197957
3535
但現今,我們怎麼可能
知道什麼才是重要的?
03:34
We've我們已經 learned學到了 so much about human人的 history歷史
63
202132
2536
我們從人類歷史中得到很多知識,
03:36
from drawings圖紙 and writings文章 in caves洞穴,
64
204692
2826
有來自在洞穴裡的壁畫和文字,
03:39
from stone tablets平板電腦.
65
207542
1614
還有石碑。
03:41
We've我們已經 deciphered破譯 languages語言
from the Rosetta羅塞塔 Stone.
66
209180
3397
我們破解了羅塞塔石碑上的語言。
03:45
You know, we'll never really have
the whole整個 story故事, though雖然.
67
213841
3609
但,我們永遠不可能
知道完整的故事全貌。
03:49
Our data數據 is our story故事,
68
217474
1894
我們的資料就是我們的故事,
03:51
even more so today今天.
69
219392
1735
現今更是如此。
03:53
We won't慣於 have our record記錄
recorded記錄 on stone tablets平板電腦.
70
221508
3261
我們的記錄不再需要刻在石碑上。
03:57
But we don't have to choose選擇
what is important重要 now.
71
225692
2698
現在我們不需要去選擇什麼重要。
04:00
There's a way to store商店 it all.
72
228847
1893
有種方法可以把它們全部儲存起來。
04:03
It turns out that there's
a solution that's been around
73
231519
2598
原來,這個解決方案
其實一直都在我們身邊,
04:06
for a few少數 billion十億 years年份,
74
234141
2443
已經存在幾十億年了,
04:08
and it's actually其實 in this tube.
75
236608
1840
它其實就在這個試管中。
04:12
DNA脫氧核糖核酸 is nature's大自然 oldest最老的 storage存儲 device設備.
76
240044
3722
DNA 是大自然最古老的儲存裝置。
04:15
After all, it contains包含
all the information信息 necessary必要
77
243790
3371
畢竟,它保存著建構和維持
人類生命的所有必要訊息。
04:19
to build建立 and maintain保持 a human人的 being存在.
78
247185
2830
04:22
But what makes品牌 DNA脫氧核糖核酸 so great?
79
250583
2204
但,DNA 為什麼如此強大?
04:25
Well, let's take our own擁有 genome基因組
80
253493
1756
嗯,就拿我們的基因組來當例子。
04:27
as an example.
81
255273
1560
04:28
If we were to print打印 out
all three billion十億 A's, T'sT的, C'sC'S and G'sG公司
82
256857
4770
如果我們想要列印出所有三十億個
A、T、C、G(DNA 的鹼基),
04:33
on a standard標準 font字形, standard標準 format格式,
83
261651
3631
且採用標準字體,標準格式,
04:37
and then we were
to stack all of those papers文件,
84
265306
2740
接著我們把印出來的紙張
全都堆疊起來,
04:40
it would be about 130 meters high,
85
268070
2660
高度會達到約 130 公尺,
04:42
somewhere某處 between之間 the Statue雕像 of Liberty自由
and the Washington華盛頓 Monument紀念碑.
86
270754
3659
這高度大約是介在自由女神像
和華盛頓紀念碑之間。
如果我們把所有的
A、T、C、G 轉換成
04:46
Now, if we converted轉換
all those A's, T'sT的, C'sC'S and G'sG公司
87
274437
2447
數位資料,也就是 0 和 1,
04:48
to digital數字 data數據, to zeroes and ones那些,
88
276898
2556
04:51
it would total a few少數 gigs演出.
89
279478
1769
總共大約只有幾 GB。
04:53
And that's in each cell細胞 of our body身體.
90
281786
2339
這就是一個人體細胞的容量。
04:56
We have more than 30 trillion cells細胞.
91
284516
2838
而我們有超過三十兆個細胞。
04:59
You get the idea理念:
92
287757
1500
這樣你們就懂了:
05:01
DNA脫氧核糖核酸 can store商店 a ton of information信息
in a minuscule微不足道 space空間.
93
289281
4675
DNA 能夠在極小的空間中
儲存超大量的資訊。
05:07
DNA脫氧核糖核酸 is also very durable耐用,
94
295620
1825
DNA 也非常耐久,
05:09
and it doesn't even require要求
electricity電力 to store商店 it.
95
297469
2834
甚至不需電力就能儲存。
05:12
We know this because scientists科學家們
have recovered恢復 DNA脫氧核糖核酸 from ancient humans人類
96
300327
4276
我們會知道這些,
是因為科學家重獲了
數十萬年前的古人的 DNA。
05:16
that lived生活 hundreds數以百計
of thousands數千 of years年份 ago.
97
304627
2752
05:19
One of those is Ötzi the Iceman.
98
307739
2627
其中之一就是冰人奧茨(Ötzi)。
05:22
Turns out, he's Austrian.
99
310390
1683
結果發現,他是奧地利人。
05:24
(Laughter笑聲)
100
312097
1600
(笑聲)
05:25
He was found發現 high, well-preserved保存完好,
101
313721
1630
他被發現完好地保存在
義大利和奧地利間的高山上,
05:27
in the mountains
between之間 Italy意大利 and Austria奧地利,
102
315375
2814
05:30
and it turns out that he has living活的
genetic遺傳 relatives親戚們 here in Austria奧地利 today今天.
103
318213
3984
結果還發現,現今他還有
活著的親戚住在奧地利。
05:34
So one of you could be a cousin表姐 of Ötzi.
104
322221
2342
在座可能有人就是奧茨的表親。
05:36
(Laughter笑聲)
105
324587
1055
(笑聲)
05:38
The point is that we have a better chance機會
of recovering恢復 information信息
106
326043
3853
重點是,相對之下,
從古人身上復原資訊
05:41
from an ancient human人的
107
329920
1225
比從舊手機復原資料容易。
05:43
than we do from an old phone電話.
108
331169
2042
05:45
It's also much less likely容易
that we'll lose失去 the ability能力 to read DNA脫氧核糖核酸
109
333783
4645
與任何單一的人造設備相比,
我們不太可能失去解讀 DNA 的能力。
05:50
than any single man-made人造 device設備.
110
338452
2434
05:53
Every一切 single new storage存儲 format格式
requires要求 a new way to read it.
111
341567
4112
每一種新的儲存格式,
都需要對應一種新的讀取方式。
而我們將一直保有解讀 DNA 的能力。
05:57
We'll always be able能夠 to read DNA脫氧核糖核酸.
112
345703
2133
05:59
If we can no longer sequence序列,
we have bigger problems問題
113
347860
3068
若我們無法做 DNA 定序,
那我們要擔心的問題
06:02
than worrying令人擔憂 about data數據 storage存儲.
114
350952
2281
可就遠大於資料儲存問題了。
06:05
Storing存儲 data數據 on DNA脫氧核糖核酸 is not new.
115
353725
3071
用 DNA 儲存資料不是新觀念。
06:08
Nature's自然的 been doing it
for several一些 billion十億 years年份.
116
356820
3099
數十億年來大自然
都一直在這麼做。
06:11
In fact事實, every一切 living活的 thing
is a DNA脫氧核糖核酸 storage存儲 device設備.
117
359943
3892
事實上,每個生物都是
一個 DNA 儲存裝置。
06:16
But how do we store商店 data數據 on DNA脫氧核糖核酸?
118
364397
2786
但我們要如何把資料存在 DNA 上?
06:19
This is Photo照片 51.
119
367725
1791
這是「照片 51」。
06:21
It's the first-ever史無前例​​的 photo照片 of DNA脫氧核糖核酸,
120
369540
2627
它是史上第一張 DNA 的照片,
大約在六十年前拍攝的。
06:24
taken採取 about 60 years年份 ago.
121
372191
2252
06:26
This is around the time that
that same相同 hard drive駕駛 was released發布 by IBMIBM.
122
374467
4382
大約在那個時期,IBM 也推出了硬碟。
06:31
So really, our understanding理解 of digital數字
storage存儲 and of DNA脫氧核糖核酸 have coevolved共同進化.
123
379246
5492
所以,我們對於數位儲存
及 DNA 的了解是同步在演進的。
06:37
We first learned學到了 to sequence序列, or read DNA脫氧核糖核酸,
124
385600
3316
我們先學會 DNA 定序,
也就是解讀 DNA,
06:40
and very soon不久 after, how to write it,
125
388940
2012
沒多久後,又學會如何
寫 DNA,或說合成它。
06:42
or synthesize合成 it.
126
390976
1559
06:44
This is much like how we learn學習
a new language語言.
127
392559
3564
這非常類似我們
學習新語言的方式。
06:48
And now we have the ability能力
to read, write and copy複製 DNA脫氧核糖核酸.
128
396812
4613
現在我們有能力去讀、
寫,和複製 DNA。
06:53
We do it in the lab實驗室 all the time.
129
401449
2080
我們經常在實驗室做這些事。
06:56
So anything, really anything,
that can be stored存儲 as zeroes and ones那些
130
404283
3882
所以,不論是什麼,
只要可以轉成 0 和 1 來儲存,
07:00
can be stored存儲 in DNA脫氧核糖核酸.
131
408189
1719
就可以儲存在 DNA 上。
07:02
To store商店 something digitally數字,
like this photo照片,
132
410579
3195
若要用數位的方式
來儲存資料,比如這張照片,
07:05
we convert兌換 it to bits, or binary二進制 digits數字.
133
413798
3306
要把它轉成位元或二進制的數字,
07:09
Each pixel像素 in a black-and-white黑與白 photo照片
is simply只是 a zero or a one.
134
417128
4211
黑白照片中的每個像素
其實就是 0 或 1。
07:13
And we can write DNA脫氧核糖核酸 much like an inkjet噴墨
printer打印機 can print打印 letters on a page.
135
421849
4824
我們寫 DNA 的方式就類似噴墨
印表機在紙上列印字母的方式。
07:18
We just have to convert兌換 our data數據,
all of those zeroes and ones那些,
136
426697
3824
我們只需要把我們的資料,
所有那些 0 和 1,
07:22
to A's, T'sT的, C'sC'S and G'sG公司,
137
430545
2138
轉為 A、T、C、G,
07:24
and then we send發送 this
to a synthesis合成 company公司.
138
432707
2258
接著,把它交給合成公司。
07:26
So we write it, we can store商店 it,
139
434989
1947
我們可以寫它,可以儲存它,
07:28
and when we want to recover恢復 our data數據,
we just sequence序列 it.
140
436960
3234
當我們想取回我們的資料時,
只要對它做定序即可。
07:32
Now, the fun開玩笑 part部分 of all of this
is deciding決定 what files to include包括.
141
440218
4081
這當中最有趣的地方,
就是決定要放入什麼檔案,
07:36
We're serious嚴重 scientists科學家們,
so we had to include包括 a manuscript手稿
142
444323
3377
我們是嚴肅的科學家,
所以我們放入了一份手稿,
07:39
for good posterity後人.
143
447724
1743
留給後代子孫。
07:41
We also included包括 a $50 Amazon亞馬遜 gift禮品 card --
144
449491
2833
我們還放入了一張美金
五十元的亞馬遜禮卷——
07:44
don't get too excited興奮, it's already已經
been spent花費, someone有人 decoded解碼 it --
145
452348
3531
別太興奮,有人已經
把它解碼然後花掉了——
07:47
as well as an operating操作 system系統,
146
455903
2210
還有作業系統、
07:50
one of the first movies電影 ever made製作
147
458137
2371
最早的電影之一,
07:52
and a Pioneer先鋒 plaque牌匾.
148
460532
1738
還有先鋒號鍍金鋁板。
07:54
Some of you might威力 have seen看到 this.
149
462294
1669
在座有些人可能看過。
07:55
It has a depiction描寫 of a typical典型 --
apparently顯然地 -- male and female,
150
463987
3456
上面畫著很有代表性的一男一女,
07:59
and our approximate近似 location位置
in the Solar太陽能 System系統,
151
467467
2562
以及我們在太陽系中的概略位置,
08:02
in case案件 the Pioneer先鋒 spacecraft宇宙飛船
ever encounters遭遇 extraterrestrials外星人.
152
470053
4002
萬一先鋒號真的遇到了
外星人就派得上用場。
08:06
So once一旦 we decided決定 what sort分類 of files
we want to encode編碼,
153
474861
2929
一旦我們決定好了
要將哪些檔案編碼存入,
08:09
we package up the data數據,
154
477814
1468
我們把資料打包起來,
08:11
convert兌換 those zeroes and ones那些
to A's, T'sT的, C'sC'S and G'sG公司,
155
479306
3654
將 0 和 1 轉換成 A、T、C、G,
08:14
and then we just send發送 this file文件 off
to a synthesis合成 company公司.
156
482984
3277
再交給合成公司處理。
08:18
And this is what we got back.
157
486285
1770
這就是我們拿回來的東西。
08:20
Our files were in this tube.
158
488079
1919
我們的檔案都在這支試管裡。
08:22
All we had to do was sequence序列 it.
159
490022
2098
我們只需要將它定序即可。
08:24
This all sounds聲音 pretty漂亮 straightforward直截了當,
160
492525
2531
這一切聽起來似乎很簡單,
08:27
but the difference區別 between之間
a really cool, fun開玩笑 idea理念
161
495080
2978
但,要讓一個很酷很有趣的點子
08:30
and something we can actually其實 use
162
498082
2155
變成能夠真正實做的東西,
08:32
is overcoming克服 these practical實際的 challenges挑戰.
163
500261
2496
是必須要克服許多現實困難的。
08:35
Now, while DNA脫氧核糖核酸 is more robust強大的
than any man-made人造 device設備,
164
503453
3972
雖然 DNA 比任何
人造裝置都更耐用,
08:39
it's not perfect完善.
165
507449
1285
但也不是完美的。
08:40
It does have some weaknesses弱點.
166
508758
1950
它也有一些缺點。
08:43
We recover恢復 our message信息
by sequencing測序 the DNA脫氧核糖核酸,
167
511364
3431
我們可以透過 DNA 定序
來還原我們的訊息,
08:46
and every一切 time data數據 is retrieved檢索,
168
514819
2013
而每次還原資料時,
08:48
we lose失去 the DNA脫氧核糖核酸.
169
516856
1786
我們就會失去某些 DNA 片段。
08:50
That's just part部分
of the sequencing測序 process處理.
170
518666
2414
這是定序過程的一部分。
08:53
We don't want to run out of data數據,
171
521104
1935
我們不想把資料用完。
08:55
but luckily, there's a way to copy複製 the DNA脫氧核糖核酸
172
523063
3096
但,幸運的是,
有個方法可以複製 DNA,
08:58
that's even cheaper便宜 and easier更輕鬆
than synthesizing合成 it.
173
526183
4585
且這方法比合成 DNA
更便宜、更容易。
09:03
We actually其實 tested測試 a way to make
200 trillion copies副本 of our files,
174
531275
4858
我們真的測試過一種方法,
把我們的檔案複製二百兆份,
09:08
and we recovered恢復
all the data數據 without error錯誤.
175
536157
2732
且我們完全無誤地還原了所有資料,
09:11
So sequencing測序 also introduces介紹
errors錯誤 into our DNA脫氧核糖核酸,
176
539556
3867
定序也會將誤差引入 DNA ,
09:15
into the A's, T'sT的, C'sC'S and G'sG公司.
177
543447
2307
引入 A、T、C、G 中。
09:18
Nature性質 has a way
to deal合同 with this in our cells細胞.
178
546135
2978
大自然會在細胞中處理這些問題。
09:21
But our data數據 is stored存儲
in synthetic合成的 DNA脫氧核糖核酸 in a tube,
179
549137
5890
但我們的資料是儲存在
試管裡的合成 DNA 中,
09:27
so we had to find our own擁有 way
to overcome克服 this problem問題.
180
555051
3252
所以我們得自己想出
另外的辦法來克服這個問題。
09:30
We decided決定 to use an algorithm算法
that was used to stream videos視頻.
181
558724
4243
我們決定使用一個
影像串流用的演算法。
09:35
When you're streaming a video視頻,
182
563452
1453
當你在傳輸影像串流時,基本上,
09:36
you're essentially實質上 trying to recover恢復
the original原版的 video視頻, the original原版的 file文件.
183
564929
4461
你其實就是在試圖還原
原始的影片,原始的檔案。
09:41
When we're trying to recover恢復
our original原版的 files,
184
569414
2909
當我們試圖還原
我們的原始檔案時,
09:44
we're simply只是 sequencing測序.
185
572347
1848
我們做的就是定序。
09:46
But really, both of these processes流程 are
about recovering恢復 enough足夠 zeroes and ones那些
186
574219
4088
但,其實,這兩個流程
都是在還原足夠的 0 與 1,
09:50
to put our data數據 back together一起.
187
578331
1793
將數據重新組合起來。
09:52
And so, because of our coding編碼 strategy戰略,
188
580711
2041
所以,根據我們的編碼策略,
09:54
we were able能夠 to package up all of our data數據
189
582776
2551
我們打包所有資料時所用的方式
09:57
in a way that allowed允許 us to make
millions百萬 and trillions萬億 of copies副本
190
585351
3772
能夠以一種可以製造上萬億份
拷貝的方式將所有數據打包,
10:01
and still always recover恢復
all of our files back.
191
589147
2976
且隨時都可以把所有的檔案還原回來。
這是被我們拿來編碼的電影。
10:04
This is the movie電影 we encoded編碼.
192
592708
1750
10:06
It's one of the first movies電影 ever made製作,
193
594482
2580
它是史上最早的電影之一,
10:09
and now the first to be copied複製
more than 200 trillion times on DNA脫氧核糖核酸.
194
597086
4759
現在它也是最早在 DNA 上
被複製二百兆份的電影。
10:14
Soon不久 after our work was published發表,
195
602377
2130
在我們的研究公佈後不久,
10:16
we participated參加 in an "Ask Me Anything"
on the website網站 reddit書籤交易.
196
604531
3747
我們參加了 Reddit
網站上的「來問我任何事」。
10:20
If you're a fellow同伴 nerd書呆子,
you're very familiar with this website網站.
197
608302
3175
如果你是個宅研究員的話,
應該很熟悉這個網站。
10:23
Most questions問題 were thoughtful周到.
198
611501
1945
大部分問題都有經過仔細考量。
10:25
Some were comical滑稽.
199
613470
1872
有些問題還挺詼諧。
10:27
For example, one user用戶 wanted to know
when we would have a literal文字 thumb拇指 drive駕駛.
200
615366
4128
比如,有位使用者想知道
我們何時會推出真的「拇指」碟。
10:32
Now, the thing is,
201
620091
2276
重點是,
10:34
our DNA脫氧核糖核酸 already已經 stores商店 everything
needed需要 to make us who we are.
202
622391
4142
我們的 DNA 已經儲存了
塑造我們所需要的所有資訊。
10:38
It's a lot safer更安全 to store商店 data數據 on DNA脫氧核糖核酸
203
626557
3818
將資料儲存在試管中的
合成 DNA 要安全得多。
10:42
in synthetic合成的 DNA脫氧核糖核酸 in a tube.
204
630399
2821
10:46
Writing寫作 and reading data數據 from DNA脫氧核糖核酸
is obviously明顯 a lot more time-consuming耗時的
205
634704
5426
很顯然,讀寫 DNA 上的
資料相當花時間,
10:52
than just saving保存 all your files
on a hard drive駕駛 --
206
640154
3095
遠比將所有的檔案
存在硬碟上更耗時——
10:55
for now.
207
643273
1291
目前是如此。
10:57
So initially原來, we should focus焦點
on long-term長期 storage存儲.
208
645159
3781
所以,一開始,我們應該
把焦點放在長期儲存。
11:02
Most data數據 are ephemeral短暫的.
209
650630
2310
大部分的資料都是短期用途的。
11:04
It's really hard to grasp把握
what's important重要 today今天,
210
652964
2588
很難去掌握現在
有哪些資訊比較重要,
11:07
or what will be important重要
for future未來 generations.
211
655576
3252
或哪些資訊對未來世代會很重要。
11:10
But the point is,
we don't have to decide決定 today今天.
212
658852
2563
但,重點是,我們
不需要馬上決定這些。
11:14
There's this great program程序 by UNESCO聯合國教科文組織
called the "Memory記憶 of the World世界" program程序.
213
662065
4988
聯合國教科文組織的
「世界的記憶」計畫相當不錯。
11:19
It's been created創建 to preserve保留
historical歷史的 materials物料
214
667077
3267
計畫的目的是要保存
有歷史意義的素材,
11:22
that are considered考慮 of value
to all of humanity人性.
215
670368
3127
對全人類都很有價值的素材。
11:26
Items專案 are nominated提名
to be added添加 to the collection採集,
216
674210
2977
被選中的訊息會被加入收藏起來,
11:29
including包含 that film電影 that we encoded編碼.
217
677211
2255
包括被我們編碼的那部電影。
11:32
While a wonderful精彩 way
to preserve保留 human人的 heritage遺產,
218
680188
3582
這是保存人類遺跡的好方法,
11:35
it doesn't have to be a choice選擇.
219
683794
1912
但不見得現在就要選擇
哪些才是重要的資訊。
11:38
Instead代替 of asking
the current當前 generation -- us --
220
686088
3454
與其詢問目前的世代——我們——
11:41
what might威力 be important重要 in the future未來,
221
689566
2222
哪些資訊在未來可能會很重要,
11:43
we could store商店 everything in DNA脫氧核糖核酸.
222
691812
2334
不如直接把所有資訊都存入 DNA 即可。
11:47
Storage存儲 is not just about how many許多 bytes字節
223
695543
2440
儲存的重點不只是有多少位元,
11:50
but how well we can actually其實
store商店 the data數據 and recover恢復 it.
224
698007
3501
還有我們能把資料的
儲存和還原做到多好。
11:53
There's always been this tension張力
between之間 how much data數據 we can generate生成
225
701940
3431
一直以來,我們都很難去平衡
「我們能產生多少資料」、
「我們能還原多少資料」,
及「我們能儲存多少資料」。
11:57
and how much we can recover恢復
226
705395
1715
11:59
and how much we can store商店.
227
707134
1769
12:01
Every一切 advance提前 in writing寫作 data數據
has required需要 a new way to read it.
228
709841
4039
每當寫資料的技術有新進展,
就表示也需要有新方法來讀資料。
12:05
We can no longer read old media媒體.
229
713904
2343
我們無法再讀取舊的儲存媒介。
12:08
How many許多 of you even have
a disk磁盤 drive駕駛 in your laptop筆記本電腦,
230
716271
3741
在座有誰的筆記型電腦
還有裝磁碟機?
12:12
never mind心神 a floppy軟盤 drive駕駛?
231
720036
1724
軟碟機就更不用說了。
12:14
This will never be the case案件 with DNA脫氧核糖核酸.
232
722151
2552
用 DNA 就絕對不會有這種狀況。
12:16
As long as we're around, DNA脫氧核糖核酸 is around,
233
724727
3177
只要我們還在,DNA 就會在,
12:19
and we'll find a way to sequence序列 it.
234
727928
2180
且我們會找到方法來做定序。
12:23
Archiving歸檔 the world世界 around us
is part部分 of human人的 nature性質.
235
731214
3459
將身邊的世界收集歸檔
是人類天性的一部分。
12:27
This is the progress進展 we've我們已經 made製作
in digital數字 storage存儲 in 60 years年份,
236
735172
4624
這是過去六十年我們
數位存儲的發展,
12:31
at a time when we were only
beginning開始 to understand理解 DNA脫氧核糖核酸.
237
739820
3376
六十年前我們也才剛剛開始理解 DNA 。
12:35
Yet然而, we've我們已經 made製作 similar類似 progress進展
in half that time with DNA脫氧核糖核酸 sequencers,
238
743725
4845
但我們只花了一半的時間
DNA 定序儀就有相當的進展,
12:40
and as long as we're around,
DNA脫氧核糖核酸 will never be obsolete過時的.
239
748594
4943
而且只要人類還在,
DNA 就永遠不會被淘汰。
12:46
Thank you.
240
754107
1181
謝謝大家。
12:47
(Applause掌聲)
241
755312
4981
(掌聲)
Translated by Lilian Chiu
Reviewed by Yi-Fan Yu

▲Back to top

ABOUT THE SPEAKER
Dina Zielinski - Bench scientist, bioinformatician
Dina Zielinski brings biological data to life, from decoding mutations in cancer to encoding data in DNA.

Why you should listen

Dina Zielinski is a bench scientist and bioinformatician with broad experience in genetics and genomics. Her current projects are in developmental biology and neurology, but she is motivated to keep learning and using her skills to answer scientific questions that challenge our deepest knowledge.

More profile about the speaker
Dina Zielinski | Speaker | TED.com