ABOUT THE SPEAKER
Dina Zielinski - Bench scientist, bioinformatician
Dina Zielinski brings biological data to life, from decoding mutations in cancer to encoding data in DNA.

Why you should listen

Dina Zielinski is a bench scientist and bioinformatician with broad experience in genetics and genomics. Her current projects are in developmental biology and neurology, but she is motivated to keep learning and using her skills to answer scientific questions that challenge our deepest knowledge.

More profile about the speaker
Dina Zielinski | Speaker | TED.com
TEDxVienna

Dina Zielinski: How we can store digital data in DNA

Дина Зилински: Как ДНК может хранить цифровые данные

Filmed:
1,777,866 views

Любой метод хранения данных: от гибких дисков до флеш-накопителей — в конечном итоге устаревает. Что, если бы мы могли найти способ хранить все данные мира вечно? Биоинформатик Дина Зилински рассказывает о носителе информации, который существует уже несколько миллиардов лет, — ДНК.
- Bench scientist, bioinformatician
Dina Zielinski brings biological data to life, from decoding mutations in cancer to encoding data in DNA. Full bio

Double-click the English transcript below to play the video.

00:12
I could fitпоместиться all moviesкино ever madeсделал
insideвнутри of this tubeтрубка.
0
652
5196
Я могла бы поместить все существующие
кинофильмы внутрь этой пробирки.
00:17
If you can't see it,
that's kindсвоего рода of the pointточка.
1
5872
2253
Даже если вы ничего там не видите,
в этом и есть фокус.
00:20
(LaughterСмех)
2
8149
1016
(Смех)
00:21
Before we understandПонимаю how this is possibleвозможное,
3
9189
3243
До того как мы поймём,
каким образом это осуществимо,
00:24
it's importantважный to understandПонимаю
the valueстоимость of this featподвиг.
4
12456
3746
важно осознать ценность
данного достижения.
00:29
All of our thoughtsмысли
and actionsдействия these daysдней,
5
17075
2266
В настоящее время
все наши мысли, действия,
00:31
throughчерез photosфото and videosвидео --
6
19365
1986
даже спортивная активность,
00:33
even our fitnessфитнес activitiesвиды деятельности --
7
21375
1879
хранятся в цифровом формате
00:35
are storedхранится as digitalцифровой dataданные.
8
23278
2133
в виде фото- и видеофайлов.
00:38
AsideВ стороне from runningБег out of spaceпространство
9
26109
1517
Помимо ситуаций, когда нам не хватает
00:39
on our phonesтелефоны,
10
27650
1151
памяти в смартфонах,
00:40
we rarelyредко think about
our digitalцифровой footprintслед.
11
28825
2314
мы редко задумываемся
о нашем цифровом следе.
00:43
But humanityчеловечество has collectivelyколлективно
generatedгенерироваться more dataданные
12
31536
3528
Но за последние несколько лет
00:47
in the last fewмало yearsлет
13
35088
1873
человечество создало больше информации,
00:48
than all of precedingпредшествующий humanчеловек historyистория.
14
36985
2530
чем за всю предыдущую историю.
00:51
Bigбольшой dataданные has becomeстали a bigбольшой problemпроблема.
15
39902
2898
Большие данные создали большие проблемы.
Хранение в цифровом формате
на самом деле дорогое удовольствие,
00:55
Digitalцифровой storageместо хранения is really expensiveдорогая,
16
43229
2817
00:58
and noneникто of these devicesприборы that we have
really standстоять the testконтрольная работа of time.
17
46070
3723
и вряд ли какое-то из нынешних
устройств выдержит испытание временем.
01:03
There's this nonprofitнекоммерческий websiteВеб-сайт
calledназывается the Internetинтернет ArchiveАрхив.
18
51256
3750
Есть такой некоммерческий сайт —
Internet Archive.
01:07
In additionприбавление to freeсвободно booksкниги and moviesкино,
19
55030
2645
Он даёт доступ не только
к бесплатным книгам и фильмам,
01:09
you can accessдоступ webWeb pagesстраницы
as farдалеко back as 1996.
20
57699
4364
но и к веб-страницам,
созданным в далёком 1996 году.
01:14
Now, this is very temptingзаманчивый,
21
62087
1684
Было трудно удержаться,
01:15
but I decidedприняли решение to go back and look at
the TEDТЕД website'sвеб-сайта very humbleсмиренный beginningsистоки.
22
63795
5989
и я решила посмотреть
на самые истоки сайта TED.
01:21
As you can see, it's changedизменено
quiteдовольно a bitнемного in the last 30 yearsлет.
23
69808
3912
Очевидно, что за последние 30 лет
он претерпел существенные изменения.
01:26
So this led me to the first-everПервый когда-либо TEDТЕД,
24
74720
2824
Это привело меня к самому первому TED,
01:29
back in 1984,
25
77568
2180
аж в 1984 год.
01:31
and it just so happenedполучилось
to be a SonySony executiveдолжностное лицо
26
79772
2525
Это оказлось выступление
исполнительного директора Sony,
01:34
explainingобъясняя how a compactкомпактный diskдиск worksработает.
27
82321
3058
объяснявшего, как устроен компакт-диск.
01:37
(LaughterСмех)
28
85403
1079
(Смех)
01:38
Now, it's really incredibleнеимоверный
to be ableв состоянии to go back in time
29
86506
4264
Совершенно невероятно иметь
возможность вернуться назад в прошлое
01:42
and accessдоступ this momentмомент.
30
90794
2286
в тот самый момент.
01:45
It's alsoтакже really fascinatingочаровательный
that after 30 yearsлет, after that first TEDТЕД,
31
93548
5363
Также удивительно и то, что спустя 30 лет
после первой конференции TED
01:50
we're still talkingговорящий about digitalцифровой storageместо хранения.
32
98935
2779
мы всё ещё обсуждаем
хранение цифровых данных.
01:54
Now, if we look back anotherдругой 30 yearsлет,
33
102827
2787
А за 30 лет до этого,
01:57
IBMIBM releasedвыпущенный the first-everПервый когда-либо hardжесткий driveводить машину
34
105638
3185
ещё в 1956 году,
02:00
back in 1956.
35
108847
2127
IBM выпустила свой первый жёсткий диск.
02:02
Here it is beingявляющийся loadedнагруженный for shippingПеревозка
in frontфронт of a smallмаленький audienceаудитория.
36
110998
4197
Вот здесь его отгружают с целью
показать небольшой аудитории.
02:07
It heldРучной the equivalentэквивалент of one MPчлен парламент3 songпесня
37
115569
3110
Он содержал объём информации,
эквивалентный одной песне в формате MP3,
02:11
and weighedвзвешенный over one tonтонна.
38
119354
2004
и весил более тонны.
02:14
At 10,000 dollarsдолларов a megabyteмегабайт,
39
122100
2651
При цене 10 тысяч долларов за мегабайт
02:16
I don't think anyoneкто угодно in this roomкомната
would be interestedзаинтересованный in buyingпокупка this thing,
40
124775
3587
вряд ли кто-то из присутствующих
захотел бы его приобрести,
02:20
exceptКроме maybe as a collector'sколлекционер itemпункт.
41
128386
1760
если только вы не коллекционер.
02:22
But it's the bestЛучший we could do at the time.
42
130817
2988
Но это лучшее,
что было создано в то время.
02:26
We'veУ нас come suchтакие a long way
in dataданные storageместо хранения.
43
134832
3116
Мы прошли долгий путь
в развитии способов хранения данных.
02:29
Devicesприборы have evolvedэволюционировали dramaticallyдраматично.
44
137972
2898
Произошёл грандиозный скачок
в развитии электронных устройств.
02:32
But all mediaСМИ eventuallyв итоге wearносить out
or becomeстали obsoleteустарелый.
45
140894
4024
Однако в конце концов
все носители информации устаревают.
02:37
If someoneкто то handedруками you a floppyдискета driveводить машину todayCегодня
to back up your presentationпрезентация,
46
145401
4417
Если кто-то вручит вам дискету
для хранения вашей презентации,
02:41
you'dвы бы probablyвероятно look at them
kindсвоего рода of strangeстранный, maybe laughсмех,
47
149842
2940
вы посмотрите на него как на чудака,
в крайнем случае, посмеётесь,
02:44
but you'dвы бы have no way
to use the damnчерт thing.
48
152806
2415
но никоим образом не сможете
воспользоваться этой штуковиной.
02:47
These devicesприборы can no longerдольше meetвстретить
our storageместо хранения needsпотребности,
49
155854
3141
Эти устройства стали абсолютно непригодны
для хранения информации,
02:51
althoughнесмотря на то что some of them can be repurposedпереориентированы.
50
159019
2702
хотя некоторые из них
можно использовать для других целей.
02:54
All technologyтехнологии eventuallyв итоге diesумирает or is lostпотерял,
51
162682
3109
Все технологии умирают или утрачиваются
02:57
alongвдоль with our dataданные,
52
165815
1851
вместе с нашими данными,
02:59
all of our memoriesвоспоминания.
53
167690
1540
нашими воспоминаниями.
03:02
There's this illusionиллюзия that
the storageместо хранения problemпроблема has been solvedрешена,
54
170210
4116
Заблуждение — считать, что проблема
хранения информации уже решена.
03:06
but really, we all just externalizeвоплощать it.
55
174350
2493
На самом деле мы лишь
признали её существование.
03:08
We don't worryбеспокоиться about storingхранения
our emailsэлектронная почта and our photosфото.
56
176867
3477
Мы не беспокоимся о хранении
наших электронных писем или фото.
03:12
They're just in the cloudоблако.
57
180368
1723
Мы просто отправляем их в облако.
03:15
But behindза the scenesсцены,
storageместо хранения is problematicпроблематичный.
58
183231
2937
Но проблема никуда не уходит.
03:18
After all, the cloudоблако is just
a lot of hardжесткий drivesдиски.
59
186192
3980
Не стоит забывать, что облако —
всего лишь множество жёстких дисков.
03:23
Now, mostбольшинство digitalцифровой dataданные,
we could argueспорить, is not really criticalкритический.
60
191156
4040
Можно утверждать, что большая часть
цифровой информации не настолько важна.
03:27
Surelyконечно, we could just deleteУдалить it.
61
195220
2123
Конечно, мы можем просто её удалить.
03:29
But how can we really know
what's importantважный todayCегодня?
62
197957
3535
Но как мы узнаем, что сегодня
представляет наибольшую важность?
03:34
We'veУ нас learnedнаучился so much about humanчеловек historyистория
63
202132
2536
Мы столько узнали об истории человечества
03:36
from drawingsрисунки and writingsписанина in cavesпещеры,
64
204692
2826
благодаря наскальным рисункам в пещерах
03:39
from stoneкамень tabletsтаблетки.
65
207542
1614
и каменным скрижалям.
03:41
We'veУ нас decipheredрасшифровано languagesязыки
from the RosettaRosetta StoneКамень.
66
209180
3397
Мы расшифровали языки Розеттского камня.
03:45
You know, we'llЧто ж never really have
the wholeвсе storyистория, thoughхоть.
67
213841
3609
И мы всё равно никогда
не узнаем всю историю.
03:49
Our dataданные is our storyистория,
68
217474
1894
Наши данные — это наша история,
03:51
even more so todayCегодня.
69
219392
1735
а в настоящее время особенно.
03:53
We won'tне будет have our recordзапись
recordedзаписанный on stoneкамень tabletsтаблетки.
70
221508
3261
Мы не будем сохранять записи на камнях,
03:57
But we don't have to chooseвыберите
what is importantважный now.
71
225692
2698
и нам не нужно выбирать,
что сейчас важно.
04:00
There's a way to storeмагазин it all.
72
228847
1893
Есть способ сохранить всё.
04:03
It turnsвитки out that there's
a solutionрешение that's been around
73
231519
2598
Оказывается, решение проблемы
04:06
for a fewмало billionмиллиард yearsлет,
74
234141
2443
миллиарды лет было рядом с нами.
04:08
and it's actuallyна самом деле in this tubeтрубка.
75
236608
1840
И оно в этой пробирке.
04:12
DNAДНК is nature'sприроды oldestсамый старший storageместо хранения deviceустройство.
76
240044
3722
ДНК — самое старое устройство
для хранения, созданное самой природой.
04:15
After all, it containsсодержит
all the informationИнформация necessaryнеобходимо
77
243790
3371
Ведь она содержит всю информацию,
04:19
to buildстроить and maintainподдерживать a humanчеловек beingявляющийся.
78
247185
2830
необходимую для создания
и существования человека.
04:22
But what makesмарки DNAДНК so great?
79
250583
2204
Так что же придаёт ей
такие невероятные свойства?
04:25
Well, let's take our ownсвоя genomeгеном
80
253493
1756
Для примера возьмём
04:27
as an exampleпример.
81
255273
1560
наш собственный геном.
04:28
If we were to printРаспечатать out
all threeтри billionмиллиард A'sВ виде, T'sT-х, C'sC о and G'sДжи
82
256857
4770
Если бы нам было нужно напечатать
три миллиарда букв A, T, C и G
04:33
on a standardстандарт fontшрифт, standardстандарт formatформат,
83
261651
3631
стандартным шрифтом
на листе стандартного формата
04:37
and then we were
to stackстек all of those papersдокументы,
84
265306
2740
и сложить листы бумаги вместе,
высота пачки составила бы 130 метров,
04:40
it would be about 130 metersметры highвысокая,
85
268070
2660
что-то среднее между
04:42
somewhereгде-то betweenмежду the StatueСтатуя of Libertyсвобода
and the WashingtonВашингтон MonumentПамятник.
86
270754
3659
статуей Свободы и монументом Вашингтону.
04:46
Now, if we convertedпереоборудованный
all those A'sВ виде, T'sT-х, C'sC о and G'sДжи
87
274437
2447
Если перевести все эти A, T, С и G
в цифровой вид, в единицы и нули,
04:48
to digitalцифровой dataданные, to zeroesобнуляет and onesте,,
88
276898
2556
04:51
it would totalВсего a fewмало gigsкабриолеты.
89
279478
1769
получилось бы несколько гигабайт.
04:53
And that's in eachкаждый cellклетка of our bodyтело.
90
281786
2339
И так в каждой клеточке нашего организма.
04:56
We have more than 30 trillionтриллион cellsячейки.
91
284516
2838
А всего в нас более 30 триллионов клеток.
04:59
You get the ideaидея:
92
287757
1500
Только представьте:
05:01
DNAДНК can storeмагазин a tonтонна of informationИнформация
in a minusculeминускул spaceпространство.
93
289281
4675
ДНК, занимающая крошечное пространство,
вмещает в себя тонну информации.
05:07
DNAДНК is alsoтакже very durableпрочный,
94
295620
1825
Кроме того, ДНК долговечна,
05:09
and it doesn't even requireтребовать
electricityэлектричество to storeмагазин it.
95
297469
2834
для её хранения не нужно электричество.
05:12
We know this because scientistsученые
have recoveredвыздоровел DNAДНК from ancientдревний humansлюди
96
300327
4276
Нам это известно благодаря учёным,
восстановившим ДНК первобытных людей,
05:16
that livedжил hundredsсотни
of thousandsтысячи of yearsлет agoтому назад.
97
304627
2752
живших сотни тысяч лет назад.
05:19
One of those is ÖtziТзи the IcemanАйсмен.
98
307739
2627
Один из них Этци, Ледяной человек.
05:22
TurnsПовороты out, he's Austrianавстриец.
99
310390
1683
Как оказалось, он австриец.
05:24
(LaughterСмех)
100
312097
1600
(Смех)
05:25
He was foundнайденный highвысокая, well-preservedхорошо сохранились,
101
313721
1630
Он хорошо сохранился,
05:27
in the mountainsгоры
betweenмежду ItalyИталия and AustriaАвстрия,
102
315375
2814
его нашли высоко в горах
на границе Италии и Австрии.
05:30
and it turnsвитки out that he has livingживой
geneticгенетический relativesродные here in AustriaАвстрия todayCегодня.
103
318213
3984
Его генетические потомки
проживают в настоящее время в Австрии.
05:34
So one of you could be a cousinдвоюродная сестра of ÖtziТзи.
104
322221
2342
Так что кто-то из вас
может быть кузеном Этци.
05:36
(LaughterСмех)
105
324587
1055
(Смех)
05:38
The pointточка is that we have a better chanceшанс
of recoveringвосстановление informationИнформация
106
326043
3853
Суть в том, что у нас больше шансов
извлечь информацию
05:41
from an ancientдревний humanчеловек
107
329920
1225
из древнего человека,
05:43
than we do from an oldстарый phoneТелефон.
108
331169
2042
чем из старого телефона.
05:45
It's alsoтакже much lessМеньше likelyвероятно
that we'llЧто ж loseпотерять the abilityспособность to readчитать DNAДНК
109
333783
4645
Кроме того, менее вероятно,
что мы утратим способность читать ДНК,
05:50
than any singleОдин man-madeискусственный deviceустройство.
110
338452
2434
в отличие от устройств,
созданных человеком.
05:53
Everyкаждый singleОдин newновый storageместо хранения formatформат
requiresтребует a newновый way to readчитать it.
111
341567
4112
Каждый новый формат хранения данных
требует нового способа чтения.
05:57
We'llЧто ж always be ableв состоянии to readчитать DNAДНК.
112
345703
2133
Мы всегда сможем прочитать ДНК.
Если мы больше не сможем секвенировать
данные, значит, нам уже будет
05:59
If we can no longerдольше sequenceпоследовательность,
we have biggerбольше problemsпроблемы
113
347860
3068
06:02
than worryingбеспокойство about dataданные storageместо хранения.
114
350952
2281
не до беспокойства по поводу
хранения этой самой информации.
06:05
StoringХранения dataданные on DNAДНК is not newновый.
115
353725
3071
Хранение данных в ДНК не ново.
06:08
Nature'sприроды been doing it
for severalнесколько billionмиллиард yearsлет.
116
356820
3099
Природа умеет это делать
уже несколько миллиардов лет.
06:11
In factфакт, everyкаждый livingживой thing
is a DNAДНК storageместо хранения deviceустройство.
117
359943
3892
По сути, каждое живое существо является
ДНК-устройством для хранения данных.
06:16
But how do we storeмагазин dataданные on DNAДНК?
118
364397
2786
Так как же информация хранится в ДНК?
06:19
This is PhotoФото 51.
119
367725
1791
Это фото номер 51.
06:21
It's the first-everПервый когда-либо photoФото of DNAДНК,
120
369540
2627
Самое первое фото ДНК,
06:24
takenвзятый about 60 yearsлет agoтому назад.
121
372191
2252
сделанное почти 60 лет назад.
06:26
This is around the time that
that sameодна и та же hardжесткий driveводить машину was releasedвыпущенный by IBMIBM.
122
374467
4382
Приблизительно в то же самое время
IBM создала свой первый жёсткий диск.
06:31
So really, our understandingпонимание of digitalцифровой
storageместо хранения and of DNAДНК have coevolvedcoevolved.
123
379246
5492
Наше понимание цифрового хранения
и ДНК развивались одновременно.
06:37
We first learnedнаучился to sequenceпоследовательность, or readчитать DNAДНК,
124
385600
3316
Сначала мы научились
секвенировать, или читать ДНК,
06:40
and very soonскоро after, how to writeзаписывать it,
125
388940
2012
а вскоре после этого — записывать
06:42
or synthesizeсинтезировать it.
126
390976
1559
и синтезировать.
06:44
This is much like how we learnучить
a newновый languageязык.
127
392559
3564
Это очень похоже на изучение нового языка.
06:48
And now we have the abilityспособность
to readчитать, writeзаписывать and copyкопия DNAДНК.
128
396812
4613
И сейчас мы можем читать,
записывать и копировать ДНК.
06:53
We do it in the labлаборатория all the time.
129
401449
2080
Мы всё время делаем это в лабораториях.
06:56
So anything, really anything,
that can be storedхранится as zeroesобнуляет and onesте,
130
404283
3882
Поэтому всё, абсолютно всё, что можно
хранить в виде нулей и единиц,
07:00
can be storedхранится in DNAДНК.
131
408189
1719
можно хранить в ДНК.
07:02
To storeмагазин something digitallyв цифровом виде,
like this photoФото,
132
410579
3195
Чтобы сохранить что-то в цифровом
формате, например это фото,
07:05
we convertконвертировать it to bitsбиты, or binaryдвоичный digitsцифры.
133
413798
3306
мы преобразуем его
в биты или двоичные единицы.
07:09
Eachкаждый pixelпиксель in a black-and-whiteчерное и белое photoФото
is simplyпросто a zeroнуль or a one.
134
417128
4211
Каждый пиксель на чёрно-белой фотографии
представляет собой ноль или единицу.
07:13
And we can writeзаписывать DNAДНК much like an inkjetдля струйной печати
printerпринтер can printРаспечатать lettersбуквы on a pageстраница.
135
421849
4824
И мы можем записать ДНК так же, как
принтер может печатать буквы на бумаге.
07:18
We just have to convertконвертировать our dataданные,
all of those zeroesобнуляет and onesте,,
136
426697
3824
Нам остаётся всего лишь конвертировать
наши данные, эти нули и единицы,
07:22
to A'sВ виде, T'sT-х, C'sC о and G'sДжи,
137
430545
2138
в буквы А, Т, С и G.
07:24
and then we sendОтправить this
to a synthesisсинтез companyКомпания.
138
432707
2258
А затем синтезировать их.
07:26
So we writeзаписывать it, we can storeмагазин it,
139
434989
1947
Итак, мы записываем
информацию, можем её хранить,
07:28
and when we want to recoverоправляться our dataданные,
we just sequenceпоследовательность it.
140
436960
3234
и когда мы захотим ею воспользоваться,
просто считываем её.
07:32
Now, the funвесело partчасть of all of this
is decidingпринятия решения what filesфайлы to includeвключают.
141
440218
4081
И самое интересное —
это решить, какие файлы хранить.
07:36
We're seriousсерьезный scientistsученые,
so we had to includeвключают a manuscriptрукопись
142
444323
3377
Мы серьёзные учёные,
и мы должны сохранить манускрипт
07:39
for good posterityпотомство.
143
447724
1743
для потомков.
07:41
We alsoтакже includedвключены a $50 AmazonАмазонка giftподарок cardкарта --
144
449491
2833
Мы также включили 50-долларовую
подарочную карту Amazon —
07:44
don't get too excitedв восторге, it's alreadyуже
been spentпотраченный, someoneкто то decodedдекодированный it --
145
452348
3531
сильно не радуйтесь,
они уже потрачены, кто-то её активировал.
07:47
as well as an operatingоперационная systemсистема,
146
455903
2210
А также операционную систему,
07:50
one of the first moviesкино ever madeсделал
147
458137
2371
один из первых фильмов
07:52
and a Pioneerпервопроходец plaqueбляшка.
148
460532
1738
и пластинки «Пионера».
07:54
Some of you mightмог бы have seenвидели this.
149
462294
1669
Возможно, кто-то из вас уже их видел.
07:55
It has a depictionописание of a typicalтипичный --
apparentlyпо всей видимости -- maleмужской and femaleженский пол,
150
463987
3456
На них изображены мужчина и женщина
07:59
and our approximateприближенный locationместо нахождения
in the Solarсолнечная Systemсистема,
151
467467
2562
и наше приблизительное
местоположение в Солнечной системе,
08:02
in caseдело the Pioneerпервопроходец spacecraftкосмический корабль
ever encountersвстречи extraterrestrialsинопланетяне.
152
470053
4002
на случай если корабль «Пионер»
когда-нибудь встретит инопланетян.
08:06
So onceодин раз we decidedприняли решение what sortСортировать of filesфайлы
we want to encodeшифровать,
153
474861
2929
Мы придумали, какую именно
информацию хотим закодировать,
08:09
we packageпакет up the dataданные,
154
477814
1468
запаковали её,
08:11
convertконвертировать those zeroesобнуляет and onesте,
to A'sВ виде, T'sT-х, C'sC о and G'sДжи,
155
479306
3654
конвертировали нули
и единицы в буквы А, Т, С и G,
08:14
and then we just sendОтправить this fileфайл off
to a synthesisсинтез companyКомпания.
156
482984
3277
а затем просто синтезировали эти файлы.
08:18
And this is what we got back.
157
486285
1770
И вот что мы получили в итоге.
08:20
Our filesфайлы were in this tubeтрубка.
158
488079
1919
Наши файлы были помещены в эту пробирку.
08:22
All we had to do was sequenceпоследовательность it.
159
490022
2098
Осталось только их секвенировать.
08:24
This all soundsзвуки prettyСимпатичная straightforwardпростой,
160
492525
2531
Кажется, всё достаточно просто,
08:27
but the differenceразница betweenмежду
a really coolкруто, funвесело ideaидея
161
495080
2978
но отличие действительно
замечательной идеи от того,
08:30
and something we can actuallyна самом деле use
162
498082
2155
что мы можем использовать, в том,
08:32
is overcomingпреодоление these practicalпрактическое challengesпроблемы.
163
500261
2496
чтобы преодолеть проблемы
с реализацией на практике.
08:35
Now, while DNAДНК is more robustкрепкий
than any man-madeискусственный deviceустройство,
164
503453
3972
Хотя ДНК и надёжнее,
чем любое рукотворное устройство,
08:39
it's not perfectидеально.
165
507449
1285
она несовершенна.
08:40
It does have some weaknessesнедостатки.
166
508758
1950
Есть некоторые слабые стороны.
08:43
We recoverоправляться our messageсообщение
by sequencingпоследовательность действий the DNAДНК,
167
511364
3431
Мы восстанавливаем наше сообщение
путем секвенирования ДНК,
08:46
and everyкаждый time dataданные is retrievedизвлекаться,
168
514819
2013
но каждый раз, когда данные извлекаются,
08:48
we loseпотерять the DNAДНК.
169
516856
1786
мы теряем ДНК.
08:50
That's just partчасть
of the sequencingпоследовательность действий processобработать.
170
518666
2414
Это одна из особенностей
процесса секвенирования.
08:53
We don't want to runбег out of dataданные,
171
521104
1935
Мы не хотим терять данные,
08:55
but luckilyк счастью, there's a way to copyкопия the DNAДНК
172
523063
3096
но к счастью, есть способ копирования ДНК,
08:58
that's even cheaperболее дешевый and easierПолегче
than synthesizingсинтезирующий it.
173
526183
4585
который дешевле и легче её синтезирования.
09:03
We actuallyна самом деле testedпроверенный a way to make
200 trillionтриллион copiesкопии of our filesфайлы,
174
531275
4858
Мы уже протестировали способ создания
200 триллионов копий наших файлов,
09:08
and we recoveredвыздоровел
all the dataданные withoutбез errorошибка.
175
536157
2732
и нам удалось извлечь
информацию без её повреждения.
09:11
So sequencingпоследовательность действий alsoтакже introducesвводит
errorsошибки into our DNAДНК,
176
539556
3867
Секвенирование также приводит
к ошибкам в нашей ДНК,
09:15
into the A'sВ виде, T'sT-х, C'sC о and G'sДжи.
177
543447
2307
в А, Т, С и G.
09:18
NatureПрирода has a way
to dealпо рукам with this in our cellsячейки.
178
546135
2978
Природа научилась справляться
с этим в наших клетках.
09:21
But our dataданные is storedхранится
in syntheticсинтетический DNAДНК in a tubeтрубка,
179
549137
5890
Но наши данные хранятся
в искусственной ДНК в пробирке.
09:27
so we had to find our ownсвоя way
to overcomeпреодолеть this problemпроблема.
180
555051
3252
Мы должны были придумать собственный
способ справиться с этой проблемой.
09:30
We decidedприняли решение to use an algorithmалгоритм
that was used to streamпоток videosвидео.
181
558724
4243
Мы решили использовать тот же алгоритм,
который применяется в потоковом видео.
09:35
When you're streamingпотоковый a videoвидео,
182
563452
1453
Когда вы транслируете видео,
09:36
you're essentiallyпо существу tryingпытаясь to recoverоправляться
the originalоригинал videoвидео, the originalоригинал fileфайл.
183
564929
4461
вы фактически пытаетесь восстановить
оригинальное видео, первоначальный файл.
09:41
When we're tryingпытаясь to recoverоправляться
our originalоригинал filesфайлы,
184
569414
2909
Когда мы это делаем,
09:44
we're simplyпросто sequencingпоследовательность действий.
185
572347
1848
мы просто секвенируем.
09:46
But really, bothи то и другое of these processesпроцессы are
about recoveringвосстановление enoughдостаточно zeroesобнуляет and onesте,
186
574219
4088
Оба этих процесса подразумевают
восстановление нулей и единиц
09:50
to put our dataданные back togetherвместе.
187
578331
1793
с целью собрать всю нашу информацию.
09:52
And so, because of our codingкодирование strategyстратегия,
188
580711
2041
И благодаря такому способу кодирования
09:54
we were ableв состоянии to packageпакет up all of our dataданные
189
582776
2551
мы смогли запаковать все данные так,
09:57
in a way that allowedпозволил us to make
millionsмиллионы and trillionsтриллионы of copiesкопии
190
585351
3772
чтобы можно было создать
миллионы и триллионы копий,
10:01
and still always recoverоправляться
all of our filesфайлы back.
191
589147
2976
которые в любой момент можно извлечь.
10:04
This is the movieкино we encodedзакодированный.
192
592708
1750
Вот фильм, который мы закодировали.
10:06
It's one of the first moviesкино ever madeсделал,
193
594482
2580
Один из первых, который был снят,
а теперь он первый,
10:09
and now the first to be copiedскопированный
more than 200 trillionтриллион timesраз on DNAДНК.
194
597086
4759
который был скопирован на ДНК
более 200 триллионов раз.
Вскоре после того
как наша работа была опубликована,
10:14
SoonСкоро after our work was publishedопубликованный,
195
602377
2130
10:16
we participatedпринимала участие in an "AskПросить Me Anything"
on the websiteВеб-сайт redditReddit.
196
604531
3747
мы приняли участие в «Спроси меня
о чём угодно» на сайте Reddit.
10:20
If you're a fellowчеловек nerdботан,
you're very familiarзнакомые with this websiteВеб-сайт.
197
608302
3175
Если вы тот ещё ботаник,
то хорошо знаете, что это за сайт.
10:23
MostНаиболее questionsвопросов were thoughtfulВдумчивый.
198
611501
1945
Некоторые вопросы были содержательные,
10:25
Some were comicalкомичный.
199
613470
1872
но были и смешные.
10:27
For exampleпример, one userпользователь wanted to know
when we would have a literalбуквальный thumbбольшой палец driveводить машину.
200
615366
4128
Например, один пользователь хотел узнать,
когда у нас появится настоящая флешка.
10:32
Now, the thing is,
201
620091
2276
Дело в том, что наша ДНК
10:34
our DNAДНК alreadyуже storesмагазины everything
neededнеобходимый to make us who we are.
202
622391
4142
уже содержит всю необходимую
информацию о нас.
10:38
It's a lot saferбезопаснее to storeмагазин dataданные on DNAДНК
203
626557
3818
Хранить данные на ДНК гораздо безопаснее
10:42
in syntheticсинтетический DNAДНК in a tubeтрубка.
204
630399
2821
в синтетической ДНК в пробирке.
10:46
WritingПисьмо and readingчтение dataданные from DNAДНК
is obviouslyочевидно a lot more time-consumingкропотливый
205
634704
5426
Очевидно, что запись и чтение данных
из ДНК занимает намного больше времени,
10:52
than just savingэкономия all your filesфайлы
on a hardжесткий driveводить машину --
206
640154
3095
чем просто сохранение
всех ваших файлов на жёстком диске.
10:55
for now.
207
643273
1291
Пока что.
10:57
So initiallyпервоначально, we should focusфокус
on long-termдолгосрочный storageместо хранения.
208
645159
3781
Перво-наперво мы должны сосредоточиться
на возможности длительного хранения.
11:02
MostНаиболее dataданные are ephemeralэфемерный.
209
650630
2310
Большинство данных эфемерны.
11:04
It's really hardжесткий to graspсхватывание
what's importantважный todayCегодня,
210
652964
2588
Действительно трудно понять,
что важно сегодня,
11:07
or what will be importantважный
for futureбудущее generationsпоколения.
211
655576
3252
а что будет важно для будущих поколений.
11:10
But the pointточка is,
we don't have to decideпринимать решение todayCегодня.
212
658852
2563
Но дело в том, что решать необязательно.
11:14
There's this great programпрограмма by UNESCOЮНЕСКО
calledназывается the "MemoryПамять of the WorldМир" programпрограмма.
213
662065
4988
Есть замечательная программа ЮНЕСКО
под названием «Память мира».
11:19
It's been createdсозданный to preserveсохранять
historicalисторический materialsматериалы
214
667077
3267
Она была создана с целью
сохранить исторические материалы,
11:22
that are consideredсчитается of valueстоимость
to all of humanityчеловечество.
215
670368
3127
которые представляют ценность
для всего человечества.
11:26
ItemsЭлементы are nominatedноминирована
to be addedдобавленной to the collectionколлекция,
216
674210
2977
Был составлен список того,
что необходимо включить,
11:29
includingв том числе that filmфильм that we encodedзакодированный.
217
677211
2255
в том числе фильм,
который мы закодировали.
11:32
While a wonderfulзамечательно way
to preserveсохранять humanчеловек heritageнаследие,
218
680188
3582
Хотя это и замечательный способ
сохранить человеческое наследие,
11:35
it doesn't have to be a choiceвыбор.
219
683794
1912
но мы не должны стоять перед выбором.
11:38
InsteadВместо of askingпросить
the currentтекущий generationпоколение -- us --
220
686088
3454
Вместо того чтобы спрашивать нас,
современное поколение,
11:41
what mightмог бы be importantважный in the futureбудущее,
221
689566
2222
что может быть важно в будущем,
11:43
we could storeмагазин everything in DNAДНК.
222
691812
2334
мы могли бы сохранить всё в ДНК.
11:47
StorageМесто хранения is not just about how manyмногие bytesбайтов
223
695543
2440
Смысл не только в количестве
сохранённых байтов,
11:50
but how well we can actuallyна самом деле
storeмагазин the dataданные and recoverоправляться it.
224
698007
3501
а в том, насколько хорошо мы можем
их сохранять и извлекать.
11:53
There's always been this tensionнапряженность
betweenмежду how much dataданные we can generateгенерировать
225
701940
3431
Существует проблема того, сколько
информации мы сможем сгенерировать,
11:57
and how much we can recoverоправляться
226
705395
1715
сколько восстановить
11:59
and how much we can storeмагазин.
227
707134
1769
и сколько сохранить.
12:01
Everyкаждый advanceпродвижение in writingписьмо dataданные
has requiredобязательный a newновый way to readчитать it.
228
709841
4039
Каждый новый способ создания данных
потребовал новый способ их чтения.
12:05
We can no longerдольше readчитать oldстарый mediaСМИ.
229
713904
2343
Мы больше не можем читать старые носители.
12:08
How manyмногие of you even have
a diskдиск driveводить машину in your laptopпортативный компьютер,
230
716271
3741
У кого из присутствующих
в ноутбуке есть дисковод,
12:12
never mindразум a floppyдискета driveводить машину?
231
720036
1724
не говоря уже о флоппи-дисководе?
12:14
This will never be the caseдело with DNAДНК.
232
722151
2552
В случае с ДНК
такой проблемы не возникнет.
12:16
As long as we're around, DNAДНК is around,
233
724727
3177
Пока существуем мы, существует и ДНК,
12:19
and we'llЧто ж find a way to sequenceпоследовательность it.
234
727928
2180
и мы найдём способ её секвенировать.
12:23
ArchivingАрхивации the worldМир around us
is partчасть of humanчеловек natureприрода.
235
731214
3459
Архивирование мира вокруг нас —
часть человеческой природы.
12:27
This is the progressпрогресс we'veмы в madeсделал
in digitalцифровой storageместо хранения in 60 yearsлет,
236
735172
4624
Это прогресс, которого мы достигли
в цифровом хранении за 60 лет,
12:31
at a time when we were only
beginningначало to understandПонимаю DNAДНК.
237
739820
3376
с момента, когда мы только начали
понимать ДНК.
12:35
YetВсе же, we'veмы в madeсделал similarаналогичный progressпрогресс
in halfполовина that time with DNAДНК sequencersсеквенсоры,
238
743725
4845
Однако мы добились подобного прогресса
с ДНК-секвенаторами в два раза быстрее,
12:40
and as long as we're around,
DNAДНК will never be obsoleteустарелый.
239
748594
4943
и пока человечество существует,
ДНК никогда не устареет.
12:46
Thank you.
240
754107
1181
Спасибо.
12:47
(ApplauseАплодисменты)
241
755312
4981
(Аплодисменты)
Translated by Alena Chernykh
Reviewed by Alena Moricheva

▲Back to top

ABOUT THE SPEAKER
Dina Zielinski - Bench scientist, bioinformatician
Dina Zielinski brings biological data to life, from decoding mutations in cancer to encoding data in DNA.

Why you should listen

Dina Zielinski is a bench scientist and bioinformatician with broad experience in genetics and genomics. Her current projects are in developmental biology and neurology, but she is motivated to keep learning and using her skills to answer scientific questions that challenge our deepest knowledge.

More profile about the speaker
Dina Zielinski | Speaker | TED.com