ABOUT THE SPEAKER
Dina Zielinski - Bench scientist, bioinformatician
Dina Zielinski brings biological data to life, from decoding mutations in cancer to encoding data in DNA.

Why you should listen

Dina Zielinski is a bench scientist and bioinformatician with broad experience in genetics and genomics. Her current projects are in developmental biology and neurology, but she is motivated to keep learning and using her skills to answer scientific questions that challenge our deepest knowledge.

More profile about the speaker
Dina Zielinski | Speaker | TED.com
TEDxVienna

Dina Zielinski: How we can store digital data in DNA

Dina Zielinski: Làm cách nào để lưu trữ dữ liệu số trong DNA

Filmed:
1,777,866 views

Từ ổ đĩa mềm đến USB, mọi phương pháp lưu trữ dữ liệu cuối cùng sẽ lạc hậu. Liệu chúng ta có thể tìm ra phương pháp để lưu trữ dữ liệu toàn cầu vĩnh cửu không? Nhà tin sinh học Dina Zielinski sẽ chia sẻ cơ chế khoa học của một giải pháp đã ở bên cạnh chúng ta hàng tỉ năm: DNA.
- Bench scientist, bioinformatician
Dina Zielinski brings biological data to life, from decoding mutations in cancer to encoding data in DNA. Full bio

Double-click the English transcript below to play the video.

00:12
I could fitPhù hợp all moviesphim ever madethực hiện
insidephía trong of this tubeống.
0
652
5196
Tôi có thể lưu trữ toàn bộ những bộ phim
từng được sản xuất vào cái ống này.
Nếu bạn không thể thấy nó,
đó chính là điều tôi muốn nói.
00:17
If you can't see it,
that's kindloại of the pointđiểm.
1
5872
2253
00:20
(LaughterTiếng cười)
2
8149
1016
(Cười)
00:21
Before we understandhiểu không how this is possiblekhả thi,
3
9189
3243
Trước khi chúng ta hiểu làm thế nào
mà điều đó xảy ra,
00:24
it's importantquan trọng to understandhiểu không
the valuegiá trị of this featfeat.
4
12456
3746
chúng ta cần phải
hiểu được lợi ích của điều này.
Mọi suy nghĩ và hành động
của chúng ta hiện nay,
00:29
All of our thoughtssuy nghĩ
and actionshành động these daysngày,
5
17075
2266
00:31
throughxuyên qua photosảnh and videosvideo --
6
19365
1986
thông qua ảnh và video --
00:33
even our fitnessthể dục activitieshoạt động --
7
21375
1879
cả những hoạt động thể chất --
00:35
are storedlưu trữ as digitalkỹ thuật số datadữ liệu.
8
23278
2133
đều được lưu dưới dạng
dữ liệu kĩ thuật số.
00:38
AsideSang một bên from runningđang chạy out of spacekhông gian
9
26109
1517
Ngoài việc hết dung lượng
00:39
on our phonesđiện thoại,
10
27650
1151
của điện thoại,
00:40
we rarelyhiếm khi think about
our digitalkỹ thuật số footprintdấu chân.
11
28825
2314
chúng ta hiếm khi quan tâm đến
dấu chân điện tử của mình.
00:43
But humanitynhân loại has collectivelychung
generatedtạo ra more datadữ liệu
12
31536
3528
Nhưng loài người đã chung tay
tạo ra dữ liệu
00:47
in the last fewvài yearsnăm
13
35088
1873
vào một vài năm trở lại đây
00:48
than all of precedingngay trước humanNhân loại historylịch sử.
14
36985
2530
nhiều hơn quãng thời gian trước đó
của lịch sử loài người.
00:51
BigLớn datadữ liệu has becometrở nên a biglớn problemvấn đề.
15
39902
2898
Dữ liệu lớn đã trở thành một vấn đề lớn.
00:55
DigitalKỹ thuật số storagelưu trữ is really expensiveđắt,
16
43229
2817
Lưu trữ kĩ thuật số thực sự rất đắt đỏ,
00:58
and nonekhông ai of these devicesthiết bị that we have
really standđứng the testthử nghiệm of time.
17
46070
3723
và không có thiết bị nào của chúng ta
tồn tại vĩnh viễn.
01:03
There's this nonprofitphi lợi nhuận websitetrang mạng
calledgọi là the InternetInternet ArchiveLưu trữ.
18
51256
3750
Có một trang web phi lợi nhuận
tên là Internet Archive.
01:07
In additionthêm vào to freemiễn phí bookssách and moviesphim,
19
55030
2645
Bên cạnh sách và phim miễn phí,
01:09
you can accesstruy cập webweb pagestrang
as farxa back as 1996.
20
57699
4364
Bạn có thể truy cập trang
web từ năm 1996.
01:14
Now, this is very temptinghấp dẫn,
21
62087
1684
Giờ đây, điều này rất hấp dẫn
01:15
but I decidedquyết định to go back and look at
the TEDTED website'sTrang web của very humblekhiêm tốn beginningsbắt đầu.
22
63795
5989
nhưng tôi quyết định quay lại và quan sát
sự khởi đầu khiêm tốn của TED.
01:21
As you can see, it's changedđã thay đổi
quitekhá a bitbit in the last 30 yearsnăm.
23
69808
3912
Như các bạn thấy, nó thay đổi một chút
trong vòng 30 năm qua.
01:26
So this led me to the first-everlần đầu tiên TEDTED,
24
74720
2824
Vì vậy, nó khiến tôi tò mò về TED đầu tiên,
01:29
back in 1984,
25
77568
2180
năm 1984,
01:31
and it just so happenedđã xảy ra
to be a SonySony executiveđiều hành
26
79772
2525
và nó chỉ là một hội nghị của Sony
01:34
explaininggiải thích how a compactgọn nhẹ diskđĩa workscông trinh.
27
82321
3058
giải thích cơ chế hoạt động của đĩa CD.
01:37
(LaughterTiếng cười)
28
85403
1079
(Cười)
01:38
Now, it's really incredibleđáng kinh ngạc
to be ablecó thể to go back in time
29
86506
4264
Giờ đây, quay ngược thời gian và xem lại
khoảnh khắc này
là một điều đáng kinh ngạc.
01:42
and accesstruy cập this momentchốc lát.
30
90794
2286
01:45
It's alsocũng thế really fascinatinghấp dẫn
that after 30 yearsnăm, after that first TEDTED,
31
93548
5363
Một điều đáng kinh ngạc khác nữa là
sau 30 năm kể từ TED đầu tiên,
01:50
we're still talkingđang nói about digitalkỹ thuật số storagelưu trữ.
32
98935
2779
ta vẫn còn nói về lưu trữ dữ liệu số.
01:54
Now, if we look back anotherkhác 30 yearsnăm,
33
102827
2787
Bây giờ, nếu chúng ta nhìn lại 30 năm nữa,
01:57
IBMIBM releasedphát hành the first-everlần đầu tiên hardcứng drivelái xe
34
105638
3185
IBM ra mắt phần cứng đầu tiên,
02:00
back in 1956.
35
108847
2127
vào năm 1956.
02:02
Here it is beingđang loadednạp vào for shippingĐang chuyển hàng
in fronttrước mặt of a smallnhỏ bé audiencethính giả.
36
110998
4197
Nó đang được vận chuyển lên tàu
trước mắt vài người theo dõi.
02:07
It heldđược tổ chức the equivalenttương đương of one MPMP3 songbài hát
37
115569
3110
Dung lượng của nó bằng
với một bài nhạc MP3
02:11
and weighedcân nặng over one tontấn.
38
119354
2004
và nặng hơn một tấn.
02:14
At 10,000 dollarsUSD a megabytemegabyte,
39
122100
2651
Trị giá 10,000 đô la mỗi MB,
02:16
I don't think anyonebất kỳ ai in this roomphòng
would be interestedquan tâm in buyingmua this thing,
40
124775
3587
Tôi không nghĩ bất kì ai ở đây
hứng thú với việc mua nó,
Ngoại trừ một vài người sưu tầm
02:20
exceptngoại trừ maybe as a collector'sCollector's itemmục.
41
128386
1760
02:22
But it's the besttốt we could do at the time.
42
130817
2988
Nhưng nó là thứ tốt nhất
ta có thể làm tại thời điểm đó.
Chúng ta đã đi một chặng đường dài
trong quá trình lưu trữ dữ liệu số.
02:26
We'veChúng tôi đã come suchnhư là a long way
in datadữ liệu storagelưu trữ.
43
134832
3116
02:29
DevicesThiết bị have evolvedphát triển dramaticallyđột ngột.
44
137972
2898
Các thiết bị cải tiến
một cách đáng kinh ngạc.
02:32
But all mediaphương tiện truyền thông eventuallycuối cùng wearmặc out
or becometrở nên obsoletelỗi thời.
45
140894
4024
Nhưng mọi phương tiện truyền thông
rồi cũng sẽ trở nên lỗi thời.
02:37
If someonengười nào handedbàn giao you a floppyđĩa mềm drivelái xe todayhôm nay
to back up your presentationtrình bày,
46
145401
4417
Nếu ai đó đưa bạn 1 đĩa mềm
để lưu bài thuyết trình của bạn hôm nay,
02:41
you'dbạn muốn probablycó lẽ look at them
kindloại of strangekỳ lạ, maybe laughcười,
47
149842
2940
bạn có lẽ sẽ nhìn họ với ánh mắt kì lạ
và có thể cười,
02:44
but you'dbạn muốn have no way
to use the damnchỉ trích thing.
48
152806
2415
bạn không thể sử dụng cái thứ quái quỷ đó.
02:47
These devicesthiết bị can no longerlâu hơn meetgặp
our storagelưu trữ needsnhu cầu,
49
155854
3141
Những thiết bị đó không thể
đáp ứng nhu cầu lưu trữ của chúng ta,
02:51
althoughmặc dù some of them can be repurposedthêm thắt.
50
159019
2702
mặc dù một vài trong số đó
có thể tái sử dụng.
02:54
All technologyCông nghệ eventuallycuối cùng dieschết or is lostmất đi,
51
162682
3109
Mọi công nghệ sẽ hỏng hoặc mất tích,
02:57
alongdọc theo with our datadữ liệu,
52
165815
1851
cùng với dữ liệu của chúng ta,
02:59
all of our memorieskỷ niệm.
53
167690
1540
và mọi kí ức của chúng ta.
03:02
There's this illusionảo giác that
the storagelưu trữ problemvấn đề has been solvedđã được giải quyết,
54
170210
4116
Có người ảo tưởng rằng
vấn đề lưu trữ đã được giải quyết,
03:06
but really, we all just externalizeExternalize it.
55
174350
2493
nhưng thật ra chúng ta
chỉ ngoại hóa chúng.
03:08
We don't worrylo about storinglưu giữ
our emailsemail and our photosảnh.
56
176867
3477
Chúng ta không lo lắng về việc
lưu trữ email và ảnh.
03:12
They're just in the cloudđám mây.
57
180368
1723
Chúng chỉ ở trên đám mây.
03:15
But behindphía sau the scenescảnh,
storagelưu trữ is problematiccó vấn đề.
58
183231
2937
Nhưng ẩn sau đó,
việc lưu trữ tồn tại nhiều vấn đề
03:18
After all, the cloudđám mây is just
a lot of hardcứng drivesổ đĩa.
59
186192
3980
Dù sao thì đám mây
cũng chỉ là rất nhiều phần cứng.
03:23
Now, mostphần lớn digitalkỹ thuật số datadữ liệu,
we could arguetranh luận, is not really criticalchỉ trích.
60
191156
4040
Hiện nay, hầu hết dữ liệu số,
không thực sự quan trọng.
03:27
SurelyChắc chắn, we could just deletexóa bỏ it.
61
195220
2123
Chúng ta chỉ cần xóa nó.
03:29
But how can we really know
what's importantquan trọng todayhôm nay?
62
197957
3535
Nhưng làm sao ta có thể biết
thứ gì là thực sự quan trọng?
03:34
We'veChúng tôi đã learnedđã học so much about humanNhân loại historylịch sử
63
202132
2536
Chúng ta đã học nhiều điều
về lịch sử loài người
03:36
from drawingsbản vẽ and writingstác phẩm in caveshang động,
64
204692
2826
từ vẽ và viết lên thành hang động,
03:39
from stoneCục đá tabletsmáy tính bảng.
65
207542
1614
từ những văn bản viết trên đá.
03:41
We'veChúng tôi đã decipheredgiải mã languagesngôn ngữ
from the RosettaRosetta StoneĐá.
66
209180
3397
Chúng ta đã và đang giải mã ngôn ngữ từ
hòn đá Rosetta.
03:45
You know, we'lltốt never really have
the wholetoàn thể storycâu chuyện, thoughTuy nhiên.
67
213841
3609
Nhưng chúng ta sẽ chả bao giờ biết được
toàn bộ câu chuyện.
03:49
Our datadữ liệu is our storycâu chuyện,
68
217474
1894
Dữ liệu là câu chuyện của chúng ta,
03:51
even more so todayhôm nay.
69
219392
1735
thậm chí còn hơn nữa.
03:53
We won'tsẽ không have our recordghi lại
recordedghi lại on stoneCục đá tabletsmáy tính bảng.
70
221508
3261
Chúng ta sẽ chẳng bao giờ lưu trữ
văn bản của chúng ta trên đá
03:57
But we don't have to choosechọn
what is importantquan trọng now.
71
225692
2698
Nhưng chúng ta không phải lựa chọn
thứ gì là quan trọng nữa.
04:00
There's a way to storecửa hàng it all.
72
228847
1893
Có một cách để lưu trữ toàn bộ chúng.
04:03
It turnslượt out that there's
a solutiondung dịch that's been around
73
231519
2598
Hóa ra là có một giải pháp ở quanh ta
04:06
for a fewvài billiontỷ yearsnăm,
74
234141
2443
hàng tỉ năm,
04:08
and it's actuallythực ra in this tubeống.
75
236608
1840
và nó thật ra ở trong cái ống này.
04:12
DNADNA is nature'sthiên nhiên oldestcũ nhất storagelưu trữ devicethiết bị.
76
240044
3722
DNA là công cụ lưu trữ lâu đời nhất
của tự nhiên
04:15
After all, it containschứa đựng
all the informationthông tin necessarycần thiết
77
243790
3371
Nó bao gồm mọi thông tin cần thiết
04:19
to buildxây dựng and maintainduy trì a humanNhân loại beingđang.
78
247185
2830
để cấu thành và duy trì loài người.
04:22
But what makeslàm cho DNADNA so great?
79
250583
2204
Nhưng điều gì làm DNA tuyệt vời đến vậy?
04:25
Well, let's take our ownsở hữu genomebộ gen
80
253493
1756
Hãy lấy gen của chúng ta
04:27
as an examplethí dụ.
81
255273
1560
là một ví dụ.
04:28
If we were to printin out
all threesố ba billiontỷ A'sA's, T'sT, C'sC and G'sG's
82
256857
4770
Nếu chúng ra in ra toàn bộ 3 tỉ
A, T, C và G nucleotit
04:33
on a standardTiêu chuẩn fontphông chữ, standardTiêu chuẩn formatđịnh dạng,
83
261651
3631
trên một phông tiêu chuẩn,
một định dạng tiêu chuẩn
04:37
and then we were
to stackcây rơm all of those papersgiấy tờ,
84
265306
2740
và xếp chồng chúng lên nhau,
04:40
it would be about 130 metersmét highcao,
85
268070
2660
nó sẽ cao 130 m, khoảng giữa chiều cao
04:42
somewheremột vài nơi betweengiữa the StatueBức tượng of LibertyLiberty
and the WashingtonWashington MonumentĐài tưởng niệm.
86
270754
3659
của Tượng Nữ thần Tự do
và Đài tưởng niệm Washington,
04:46
Now, if we convertedchuyển đổi
all those A'sA's, T'sT, C'sC and G'sG's
87
274437
2447
Bây giờ, nếu chúng ta chuyển các nucleotit
04:48
to digitalkỹ thuật số datadữ liệu, to zeroeszeroes and onesnhững người,
88
276898
2556
về dạng dữ liệu số, 0 và 1,
04:51
it would totaltoàn bộ a fewvài gigsbiểu diễn.
89
279478
1769
nó sẽ là một vài gigabyte.
04:53
And that's in eachmỗi celltế bào of our bodythân hình.
90
281786
2339
Và đó là trong mỗi tế bào của cơ thể chúng ta.
04:56
We have more than 30 trillionnghìn tỉ cellstế bào.
91
284516
2838
Chúng ta có hơn 30 nghìn tỉ tế bào.
04:59
You get the ideaý kiến:
92
287757
1500
Bạn hiểu rồi đấy:
05:01
DNADNA can storecửa hàng a tontấn of informationthông tin
in a minusculeminuscule spacekhông gian.
93
289281
4675
DNA có thể lưu trữ cả tấn dữ liệu trong
một không gian nhỏ.
05:07
DNADNA is alsocũng thế very durablebền Bỉ,
94
295620
1825
DNA cũng rất bền,
05:09
and it doesn't even requireyêu cầu
electricityđiện to storecửa hàng it.
95
297469
2834
và không cần điện để vận hành.
05:12
We know this because scientistscác nhà khoa học
have recoveredphục hồi DNADNA from ancientxưa humanscon người
96
300327
4276
Chúng ta biết điều này vì các nhà khoa học
đã khôi phục DNA từ người cổ đại
05:16
that livedđã sống hundredshàng trăm
of thousandshàng nghìn of yearsnăm agotrước.
97
304627
2752
từ hàng trăm nghìn năm trước.
05:19
One of those is Ötzitzi the IcemanIceman.
98
307739
2627
Một trong số đó là
Người băng Ötzi
05:22
TurnsBiến out, he's AustrianÁo.
99
310390
1683
Hóa ra, anh ta là người Áo.
05:24
(LaughterTiếng cười)
100
312097
1600
(Cười)
05:25
He was foundtìm highcao, well-preservedbảo quản tốt,
101
313721
1630
Anh ta được tìm thấy trên cao,
được bảo quản tốt,
05:27
in the mountainsnúi
betweengiữa ItalyÝ and AustriaÁo,
102
315375
2814
trên núi giữa Ý và Áo.
05:30
and it turnslượt out that he has livingsống
geneticdi truyền relativesngười thân here in AustriaÁo todayhôm nay.
103
318213
3984
và hóa ra anh ta có
họ hàng tại Áo hiện nay.
05:34
So one of you could be a cousinanh chị em họ of Ötzitzi.
104
322221
2342
Vì vậy một trong số các bạn có thể là
bà con của Ötzi
05:36
(LaughterTiếng cười)
105
324587
1055
(Cười)
05:38
The pointđiểm is that we have a better chancecơ hội
of recoveringphục hồi informationthông tin
106
326043
3853
Vấn đề ở đây là chúng ta có một cơ hội
tốt hơn để khôi phục thông tin
05:41
from an ancientxưa humanNhân loại
107
329920
1225
từ một người cổ đại
05:43
than we do from an old phoneđiện thoại.
108
331169
2042
hơn là từ cái điện thoại cũ
của chúng ta.
05:45
It's alsocũng thế much lessít hơn likelycó khả năng
that we'lltốt losethua the abilitycó khả năng to readđọc DNADNA
109
333783
4645
Cũng rất hiếm khi chúng ta
mất khả năng đọc DNA
05:50
than any singleĐộc thân man-madenhân tạo devicethiết bị.
110
338452
2434
hơn là bất kì thiết bị nhân tạo nào.
05:53
EveryMỗi singleĐộc thân newMới storagelưu trữ formatđịnh dạng
requiresđòi hỏi a newMới way to readđọc it.
111
341567
4112
Mọi định dạng lưu trữ mới cần một
cách mới để đọc nó.
05:57
We'llChúng tôi sẽ always be ablecó thể to readđọc DNADNA.
112
345703
2133
Chúng ta luôn có thể đọc DNA
05:59
If we can no longerlâu hơn sequencetrình tự,
we have biggerlớn hơn problemscác vấn đề
113
347860
3068
Nếu chúng ta không thể,
chúng ta có vấn đề lớn hơn
06:02
than worryinglo lắng about datadữ liệu storagelưu trữ.
114
350952
2281
việc lưu trữ dữ liệu.
06:05
StoringLưu trữ datadữ liệu on DNADNA is not newMới.
115
353725
3071
Lưu trữ dữ liệu trên DNA không hề mới.
06:08
Nature'sCủa thiên nhiên been doing it
for severalmột số billiontỷ yearsnăm.
116
356820
3099
Tự nhiên đã làm điều đó hàng tỉ năm.
06:11
In factthực tế, everymỗi livingsống thing
is a DNADNA storagelưu trữ devicethiết bị.
117
359943
3892
Thật ra, mọi thực thể sống
là một thiết bị lưu trữ DNA.
06:16
But how do we storecửa hàng datadữ liệu on DNADNA?
118
364397
2786
Nhưng làm cách nào để chúng ta
lưu trữ dữ liệu trên DNA?
06:19
This is PhotoHình ảnh 51.
119
367725
1791
Đây là Bức ảnh 51.
06:21
It's the first-everlần đầu tiên photohình chụp of DNADNA,
120
369540
2627
Là bức ảnh đầu tiên của DNA,
06:24
takenLấy about 60 yearsnăm agotrước.
121
372191
2252
được chụp 60 năm trước.
06:26
This is around the time that
that sametương tự hardcứng drivelái xe was releasedphát hành by IBMIBM.
122
374467
4382
Nó gần với thời điểm phần cứng đầu tiên
được ra mắt bởi IBM.
06:31
So really, our understandinghiểu biết of digitalkỹ thuật số
storagelưu trữ and of DNADNA have coevolvedcoevolved.
123
379246
5492
Sự hiểu biết của chúng ta về lưu trữ
và DNA đang tiến hóa cùng nhau.
06:37
We first learnedđã học to sequencetrình tự, or readđọc DNADNA,
124
385600
3316
Chúng ta đầu tiên tìm hiểu trình tự,
hoặc đọc DNA,
06:40
and very soonSớm after, how to writeviết it,
125
388940
2012
và rất nhanh ngay sau đó, học viết nó,
06:42
or synthesizetổng hợp it.
126
390976
1559
hoặc tổng hợp nó.
06:44
This is much like how we learnhọc hỏi
a newMới languagengôn ngữ.
127
392559
3564
Đó rất giống với việc chúng ta
học một ngôn ngữ mới.
06:48
And now we have the abilitycó khả năng
to readđọc, writeviết and copysao chép DNADNA.
128
396812
4613
Và giờ đây chúng ta có thể đọc,
viết và sao chép DNA
06:53
We do it in the labphòng thí nghiệm all the time.
129
401449
2080
Chúng ta làm điều đó cả ngày trong
phòng thí nghiệm.
06:56
So anything, really anything,
that can be storedlưu trữ as zeroeszeroes and onesnhững người
130
404283
3882
Vậy tất cả mọi thứ mà có thể
lưu trữ dưới dạng 0 và 1
07:00
can be storedlưu trữ in DNADNA.
131
408189
1719
có thể lưu trữ trong DNA.
07:02
To storecửa hàng something digitallykỹ thuật số,
like this photohình chụp,
132
410579
3195
Để lưu trữ một thứ gì đó dưới dạng
kĩ thuật số như bức ảnh này,
07:05
we convertđổi it to bitsbit, or binarynhị phân digitschữ số.
133
413798
3306
chúng ta chuyển nó thành bits, hoặc
chữ số nhị phân.
07:09
EachMỗi pixelpixel in a black-and-whiteđen và trắng photohình chụp
is simplyđơn giản a zerokhông or a one.
134
417128
4211
Mỗi pixel trong một ảnh trắng đen
đơn giản chỉ là 0 và 1.
07:13
And we can writeviết DNADNA much like an inkjetmáy in phun
printermáy in can printin lettersbức thư on a pagetrang.
135
421849
4824
Và chúng ta có thể viết DNA như cách
một máy in in chữ lên giấy.
07:18
We just have to convertđổi our datadữ liệu,
all of those zeroeszeroes and onesnhững người,
136
426697
3824
Và chúng ta chỉ cần chuyển đổi dữ liệu,
những thứ bao gồm 0 và 1,
07:22
to A'sA's, T'sT, C'sC and G'sG's,
137
430545
2138
về dạng A, T, C, và G,
07:24
and then we sendgửi this
to a synthesistổng hợp companyCông ty.
138
432707
2258
và đưa nó tới một
công ti tổng hợp.
07:26
So we writeviết it, we can storecửa hàng it,
139
434989
1947
Vậy chúng ta viết nó,
lưu trữ nó,
07:28
and when we want to recoverbình phục our datadữ liệu,
we just sequencetrình tự it.
140
436960
3234
và khi muốn phục hồi,
chúng ta chỉ cần sắp xếp nó.
07:32
Now, the funvui vẻ partphần of all of this
is decidingquyết định what filestập tin to includebao gồm.
141
440218
4081
Bây giờ, điều thú vị là
quyết định lưu tệp nào.
07:36
We're seriousnghiêm trọng scientistscác nhà khoa học,
so we had to includebao gồm a manuscriptbản thảo
142
444323
3377
Chúng ta là những nhà khoa học,
vì vậy chúng ta sẽ có những bản viết tay
07:39
for good posterityhậu thế.
143
447724
1743
cho hậu thế.
07:41
We alsocũng thế includedbao gồm a $50 AmazonAmazon giftquà tặng cardThẻ --
144
449491
2833
Chúng ta sẽ lưu trữ
thẻ quà tặng Amazon 50 đô --
07:44
don't get too excitedbị kích thích, it's alreadyđã
been spentđã bỏ ra, someonengười nào decodedgiải mã it --
145
452348
3531
đừng quá hưng phấn, nó đã được dành cho
người mà giải mã được nó --
07:47
as well as an operatingđiều hành systemhệ thống,
146
455903
2210
cũng như là hệ điều hành,
07:50
one of the first moviesphim ever madethực hiện
147
458137
2371
một trong số những bộ phim đầu tiên
được sản xuất
07:52
and a PioneerTiên phong plaquemảng bám.
148
460532
1738
và một mảng Pioneer.
07:54
Some of you mightcó thể have seenđã xem this.
149
462294
1669
Một trong số các bạn đã thấy nó trước đây.
07:55
It has a depictionMô tả of a typicalđiển hình --
apparentlydường như -- maleNam giới and femalegiống cái,
150
463987
3456
Nó bao gồm hình ảnh mô tả
một cặp nam nữ phổ thông,
07:59
and our approximategần đúng locationvị trí
in the SolarNăng lượng mặt trời SystemHệ thống,
151
467467
2562
và vị trí của chúng ta trong hệ Mặt Trời,
08:02
in casetrường hợp the PioneerTiên phong spacecraftphi thuyền
ever encounterscuộc gặp gỡ extraterrestrialsngoài trái đất.
152
470053
4002
trong trường hợp tàu Pioneer
bắt gặp người ngoài hành tinh.
08:06
So onceMột lần we decidedquyết định what sortsắp xếp of filestập tin
we want to encodemã hóa,
153
474861
2929
Vậy một khi chúng ta quyết định loại
tài liệu ta muốn mã hóa,
08:09
we packagegói up the datadữ liệu,
154
477814
1468
chúng ta đóng gói dữ liệu,
08:11
convertđổi those zeroeszeroes and onesnhững người
to A'sA's, T'sT, C'sC and G'sG's,
155
479306
3654
chuyển từ 0 và 1 sang A, T, C và G,
08:14
and then we just sendgửi this filetập tin off
to a synthesistổng hợp companyCông ty.
156
482984
3277
và sau đó chỉ cần gửi tài liệu đến
một công ty tổng hợp.
08:18
And this is what we got back.
157
486285
1770
Và đây là thứ mà ta nhận được.
08:20
Our filestập tin were in this tubeống.
158
488079
1919
Tài liệu của chúng ta
ở trong cái ống này.
08:22
All we had to do was sequencetrình tự it.
159
490022
2098
Mọi thứ ta cần làm là đọc nó.
08:24
This all soundsâm thanh prettyđẹp straightforwardđơn giản,
160
492525
2531
Điều này nghe có vẻ đơn giản,
08:27
but the differenceSự khác biệt betweengiữa
a really coolmát mẻ, funvui vẻ ideaý kiến
161
495080
2978
nhưng sự khác biệt
giữa một ý tưởng tuyệt vời
08:30
and something we can actuallythực ra use
162
498082
2155
và thứ mà chúng ta thực tế
có thể sử dụng
08:32
is overcomingkhắc phục these practicalthiết thực challengesthách thức.
163
500261
2496
là vượt qua những thách thức
về mặt thực nghiệm.
08:35
Now, while DNADNA is more robustmạnh mẽ
than any man-madenhân tạo devicethiết bị,
164
503453
3972
Bây giờ, khi DNA mạnh mẽ hơn bất kì thiết
bị nhân tạo nào,
08:39
it's not perfecthoàn hảo.
165
507449
1285
nó không hoàn hảo.
08:40
It does have some weaknessesđiểm yếu.
166
508758
1950
Nó có một vài điểm yếu.
08:43
We recoverbình phục our messagethông điệp
by sequencingtrình tự the DNADNA,
167
511364
3431
Chúng ta có thể khôi phục dữ liệu
bằng cách sắp xếp DNA,
08:46
and everymỗi time datadữ liệu is retrievedLấy,
168
514819
2013
và mỗi khi dữ liệu được lấy lại,
08:48
we losethua the DNADNA.
169
516856
1786
chúng ta mất DNA.
08:50
That's just partphần
of the sequencingtrình tự processquá trình.
170
518666
2414
Đó chỉ là một phần của quá trình sắp xếp.
08:53
We don't want to runchạy out of datadữ liệu,
171
521104
1935
Chúng ta không muốn mất hết
dữ liệu,
08:55
but luckilymay mắn thay, there's a way to copysao chép the DNADNA
172
523063
3096
nhưng may thay, có một cách
sao chép DNA
08:58
that's even cheapergiá rẻ hơn and easierdễ dàng hơn
than synthesizingtổng hợp it.
173
526183
4585
đó còn rẻ và dễ hơn tổng hợp nó.
09:03
We actuallythực ra testedthử nghiệm a way to make
200 trillionnghìn tỉ copiesbản sao of our filestập tin,
174
531275
4858
Chúng ta đã thử nghiệm sao chép
tập tin giống loài 200 nghìn tỉ lần,
và khôi phục dữ liệu không một sai sót.
09:08
and we recoveredphục hồi
all the datadữ liệu withoutkhông có errorlỗi.
175
536157
2732
09:11
So sequencingtrình tự alsocũng thế introducesgiới thiệu
errorslỗi into our DNADNA,
176
539556
3867
Vì vậy sắp xếp có thể gây lỗi ở DNA,
09:15
into the A'sA's, T'sT, C'sC and G'sG's.
177
543447
2307
ở A, T, C và G.
09:18
NatureThiên nhiên has a way
to dealthỏa thuận with this in our cellstế bào.
178
546135
2978
Tự nhiên có một cách để giải quyết
vấn đề này.
09:21
But our datadữ liệu is storedlưu trữ
in syntheticsợi tổng hợp DNADNA in a tubeống,
179
549137
5890
Nhưng dữ liệu của chúng ta
lưu trữ trong sợi tổng hợp DNA trong ống,
09:27
so we had to find our ownsở hữu way
to overcomevượt qua this problemvấn đề.
180
555051
3252
vì vậy chúng ta phải tìm cách
giải quyết vấn đề này.
09:30
We decidedquyết định to use an algorithmthuật toán
that was used to streamsuối videosvideo.
181
558724
4243
Chúng tôi quyết định sử dụng thuật toán
dùng trong phát trực tiếp video.
09:35
When you're streamingphát trực tuyến a videovideo,
182
563452
1453
Khi bạn phát một video,
09:36
you're essentiallybản chất tryingcố gắng to recoverbình phục
the originalnguyên videovideo, the originalnguyên filetập tin.
183
564929
4461
bạn đang cố khôi phục
video gốc, tập tin gốc.
09:41
When we're tryingcố gắng to recoverbình phục
our originalnguyên filestập tin,
184
569414
2909
Khi chúng ta khôi phục tập tin gốc,
09:44
we're simplyđơn giản sequencingtrình tự.
185
572347
1848
chúng ta đơn giản là đang sắp xếp.
09:46
But really, bothcả hai of these processesquy trình are
about recoveringphục hồi enoughđủ zeroeszeroes and onesnhững người
186
574219
4088
Nhưng thật ra, cả hai quá trình đều là
khôi phục đủ 0 và 1
09:50
to put our datadữ liệu back togethercùng với nhau.
187
578331
1793
để ghép dữ liệu lại với nhau.
09:52
And so, because of our codingmã hóa strategychiến lược,
188
580711
2041
Và vì thế, nhờ chiến thuật mã hóa,
09:54
we were ablecó thể to packagegói up all of our datadữ liệu
189
582776
2551
chúng ta có thể ghép lại
toàn bộ dữ liệu
09:57
in a way that allowedđược cho phép us to make
millionshàng triệu and trillionshàng nghìn tỷ of copiesbản sao
190
585351
3772
theo một cách mà cho phép chúng ta
làm hàng triệu và nghìn tỉ bản sao
10:01
and still always recoverbình phục
all of our filestập tin back.
191
589147
2976
và vẫn luôn luôn hồi phục
được toàn bộ tập tin.
10:04
This is the moviebộ phim we encodedmã hóa.
192
592708
1750
Đây là bộ phim chúng ta giải mã.
10:06
It's one of the first moviesphim ever madethực hiện,
193
594482
2580
Đây là một trong số những bộ phim
đầu tiên được sản xuất,
10:09
and now the first to be copiedsao chép
more than 200 trillionnghìn tỉ timeslần on DNADNA.
194
597086
4759
và giờ đây là bộ phim đầu tiên sao chép
hơn 200 nghìn tỉ lần trên DNA.
10:14
SoonSớm after our work was publishedđược phát hành,
195
602377
2130
Ngay sau khi dự án
của chúng tôi công khai,
10:16
we participatedtham gia in an "AskYêu cầu Me Anything"
on the websitetrang mạng redditReddit.
196
604531
3747
chúng tôi tham gia
"Hỏi tôi bất kì điều gì" trên Reddit
10:20
If you're a fellowđồng bào nerdmọt sách,
you're very familiarquen with this websitetrang mạng.
197
608302
3175
Nếu bạn là một mọt sách,
bạn sẽ rất quen thuộc với trang web này.
10:23
MostHầu hết questionscâu hỏi were thoughtfulchu đáo.
198
611501
1945
Hầu hết câu hỏi đều rất sâu sắc.
10:25
Some were comicalComical.
199
613470
1872
Một số thì lố bịch.
10:27
For examplethí dụ, one userngười dùng wanted to know
when we would have a literaltheo nghĩa đen thumbngón tay cái drivelái xe.
200
615366
4128
Ví dụ, một người muốn biết khi nào
sẽ có một thiết bị 'ngón tay di động' thực thụ.
10:32
Now, the thing is,
201
620091
2276
Bây giờ, vấn đề là,
10:34
our DNADNA alreadyđã storescửa hàng everything
neededcần to make us who we are.
202
622391
4142
DNA của chúng ta vốn đã lưu trữ mọi
thứ cần thiết để làm nên chúng ta.
10:38
It's a lot saferan toàn hơn to storecửa hàng datadữ liệu on DNADNA
203
626557
3818
Lưu trữ dữ liệu trên DNA an toàn hơn
rất nhiều
10:42
in syntheticsợi tổng hợp DNADNA in a tubeống.
204
630399
2821
trong sợi DNA trong 1 cái ống
10:46
WritingBằng văn bản and readingđọc hiểu datadữ liệu from DNADNA
is obviouslychắc chắn a lot more time-consumingtốn thời gian
205
634704
5426
Viết và đọc dữ liệu từ DNA rõ ràng
tốn thời gian hơn rất nhiều
10:52
than just savingtiết kiệm all your filestập tin
on a hardcứng drivelái xe --
206
640154
3095
hơn là chỉ lưu trữ toàn bộ tệp
vào trong ổ cứng --
10:55
for now.
207
643273
1291
hiện nay.
10:57
So initiallyban đầu, we should focustiêu điểm
on long-termdài hạn storagelưu trữ.
208
645159
3781
Vì vậy, ban đầu, chúng ta nên tập trung
lưu trữ thời gian dài.
11:02
MostHầu hết datadữ liệu are ephemeralkhông lâu.
209
650630
2310
Hầu hết các dữ liệu tồn tại
không lâu.
11:04
It's really hardcứng to graspsự hiểu biết
what's importantquan trọng todayhôm nay,
210
652964
2588
Rất khó để biết điều gì là
quan trọng
11:07
or what will be importantquan trọng
for futureTương lai generationscác thế hệ.
211
655576
3252
hoặc điều sẽ cần thiết cho thế hệ
tương lai
11:10
But the pointđiểm is,
we don't have to decidequyết định todayhôm nay.
212
658852
2563
Nhưng chúng ta không phải
quyết định điều đó ngay hôm nay.
11:14
There's this great programchương trình by UNESCOUNESCO
calledgọi là the "MemoryBộ nhớ of the WorldTrên thế giới" programchương trình.
213
662065
4988
Có một dự án lớn của UNESCO gọi là
"Kí ức của thế giới"
11:19
It's been createdtạo to preservegiữ gìn
historicallịch sử materialsnguyên vật liệu
214
667077
3267
Nó đã được tạo ra để bảo tồn
các di sản
11:22
that are consideredxem xét of valuegiá trị
to all of humanitynhân loại.
215
670368
3127
có ý nghĩa với toàn bộ loài người.
11:26
ItemsMục are nominatedđược đề cử
to be addedthêm to the collectionbộ sưu tập,
216
674210
2977
Những thứ mà được đề cử
đưa vào bộ sưu tập,
11:29
includingkể cả that filmphim ảnh that we encodedmã hóa.
217
677211
2255
bao gồm bộ phim chúng tôi giải mã.
11:32
While a wonderfulTuyệt vời way
to preservegiữ gìn humanNhân loại heritagedi sản,
218
680188
3582
Một cách tuyệt vời để
bảo tồn di sản loài người,
11:35
it doesn't have to be a choicelựa chọn.
219
683794
1912
nó không bắt buộc là một lựa chọn.
11:38
InsteadThay vào đó of askinghỏi
the currenthiện hành generationthế hệ -- us --
220
686088
3454
Thay vì hỏi thế hệ hiện tại
-- chúng ta --
11:41
what mightcó thể be importantquan trọng in the futureTương lai,
221
689566
2222
điều gì sẽ quan trọng trong tương lai,
11:43
we could storecửa hàng everything in DNADNA.
222
691812
2334
chúng ta có thể lưu mọi thứ trong DNA.
11:47
StorageLưu trữ is not just about how manynhiều bytesbyte
223
695543
2440
Lưu trữ không chỉ là bao nhiêu byte
11:50
but how well we can actuallythực ra
storecửa hàng the datadữ liệu and recoverbình phục it.
224
698007
3501
mà là làm cách nào ta có thể
thực sự lưu trữ và phục hồi dữ liệu.
11:53
There's always been this tensioncăng thẳng
betweengiữa how much datadữ liệu we can generatetạo ra
225
701940
3431
Luôn có sự ràng buộc giữa
bao nhiêu dữ liệu ta có thể tạo ra
11:57
and how much we can recoverbình phục
226
705395
1715
và bao nhiêu ta có thể khôi phục
11:59
and how much we can storecửa hàng.
227
707134
1769
và bao nhiêu ta có thể lưu trữ.
12:01
EveryMỗi advancenâng cao in writingviết datadữ liệu
has requiredcần thiết a newMới way to readđọc it.
228
709841
4039
Mọi cải tiến trong viết dữ liệu
yêu cầu một cách mới để đọc nó.
12:05
We can no longerlâu hơn readđọc old mediaphương tiện truyền thông.
229
713904
2343
Chúng ta không còn có thể
đọc phương tiện truyền thông cũ.
12:08
How manynhiều of you even have
a diskđĩa drivelái xe in your laptopmáy tính xách tay,
230
716271
3741
Có bao nhiêu người trong số các bạn
có ổ đĩa trên laptop,
12:12
never mindlí trí a floppyđĩa mềm drivelái xe?
231
720036
1724
không một ổ đĩa mềm?
12:14
This will never be the casetrường hợp with DNADNA.
232
722151
2552
Nó không bao giờ là vấn đề với DNA.
12:16
As long as we're around, DNADNA is around,
233
724727
3177
Khi chúng ta còn tồn tại,
DNA còn tồn tại,
12:19
and we'lltốt find a way to sequencetrình tự it.
234
727928
2180
và chúng ta sẽ có cách xác định
trật tự của nó.
12:23
ArchivingLưu trữ the worldthế giới around us
is partphần of humanNhân loại naturethiên nhiên.
235
731214
3459
Lưu trữ thế giới xung quanh là
một bản tính của con người.
12:27
This is the progresstiến độ we'vechúng tôi đã madethực hiện
in digitalkỹ thuật số storagelưu trữ in 60 yearsnăm,
236
735172
4624
Đây là sự tiến bộ chúng ta đạt được
trong lưu trữ dữ liệu số trong 60 năm,
12:31
at a time when we were only
beginningbắt đầu to understandhiểu không DNADNA.
237
739820
3376
vào thời điểm chúng ta chỉ vừa
bắt đầu hiểu về DNA.
12:35
YetNào được nêu ra, we'vechúng tôi đã madethực hiện similargiống progresstiến độ
in halfmột nửa that time with DNADNA sequencerssequencers,
238
743725
4845
Nhưng, chúng ta đạt được tiến bộ tương tự
với nửa thời gian khi xác định trật tự DNA,
12:40
and as long as we're around,
DNADNA will never be obsoletelỗi thời.
239
748594
4943
và khi chúng ta tồn tại,
DNA sẽ không bao giờ lỗi thời.
12:46
Thank you.
240
754107
1181
Cảm ơn các bạn.
12:47
(ApplauseVỗ tay)
241
755312
4981
(Vỗ tay)
Translated by Tieu Phuong Nguyen
Reviewed by Trang Phạm

▲Back to top

ABOUT THE SPEAKER
Dina Zielinski - Bench scientist, bioinformatician
Dina Zielinski brings biological data to life, from decoding mutations in cancer to encoding data in DNA.

Why you should listen

Dina Zielinski is a bench scientist and bioinformatician with broad experience in genetics and genomics. Her current projects are in developmental biology and neurology, but she is motivated to keep learning and using her skills to answer scientific questions that challenge our deepest knowledge.

More profile about the speaker
Dina Zielinski | Speaker | TED.com