ABOUT THE SPEAKER
Kenneth Cukier - Data Editor of The Economist
Kenneth Cukier is the Data Editor of The Economist. From 2007 to 2012 he was the Tokyo correspondent, and before that, the paper’s technology correspondent in London, where his work focused on innovation, intellectual property and Internet governance. Kenneth is also the co-author of Big Data: A Revolution That Will Transform How We Live, Work, and Think with Viktor Mayer-Schönberger in 2013, which was a New York Times Bestseller and translated into 16 languages.

Why you should listen

As Data Editor of The Economist and co-author of Big Data: A Revolution That Will Transform How We Live, Work, and Think, Kenneth Cukier has spent years immersed in big data, machine learning -- and the impact of both. What's the future of big data-driven technology and design? To find out, watch this talk.

More profile about the speaker
Kenneth Cukier | Speaker | TED.com
TEDSalon Berlin 2014

Kenneth Cukier: Big data is better data

Кеннет Кук'єр: Більші дані - кращі дані

Filmed:
1,663,038 views

Самокеровані автомобілі були лише початком. Яке майбутнє технологій і дизайну за участю великих об'ємів даних? У своїй захопливій науковій промові Кеннет Кук'єр аналізує, що ж чекає на машинне навчання і знання людства загалом.
- Data Editor of The Economist
Kenneth Cukier is the Data Editor of The Economist. From 2007 to 2012 he was the Tokyo correspondent, and before that, the paper’s technology correspondent in London, where his work focused on innovation, intellectual property and Internet governance. Kenneth is also the co-author of Big Data: A Revolution That Will Transform How We Live, Work, and Think with Viktor Mayer-Schönberger in 2013, which was a New York Times Bestseller and translated into 16 languages. Full bio

Double-click the English transcript below to play the video.

00:12
America'sВ Америці favoriteулюблений pieпиріг is?
0
787
3845
Улюблений пиріг американців?
00:16
AudienceАудиторія: AppleApple.
KennethКеннет CukierCukier: AppleApple. Of courseзвичайно it is.
1
4632
3506
Аудиторія: Яблучний.
Кеннет Кук'єр: Яблучний. Звісно ж.
00:20
How do we know it?
2
8138
1231
Звідки нам про це відомо?
00:21
Because of dataдані.
3
9369
2753
Завдяки даним.
00:24
You look at supermarketсупермаркет salesпродажі.
4
12122
2066
Дивимось на розпродаж в супермаркеті.
00:26
You look at supermarketсупермаркет
salesпродажі of 30-centimeter-сантиметр piesпироги
5
14188
2866
На торгівлю 30-сантиметровими замороженими
00:29
that are frozenзаморожений, and appleяблуко winsперемагає, no contestконкурс.
6
17054
4075
пирогами, і яблучний, без сумніву, виграє.
00:33
The majorityбільшість of the salesпродажі are appleяблуко.
7
21129
5180
Більшість продаж - пироги з яблуками.
00:38
But then supermarketsСупермаркети, універсальні магазини startedпочався sellingпродаж
8
26309
2964
Проте згодом супермаркети почали продавати
00:41
smallerменший, 11-centimeter-сантиметр piesпироги,
9
29273
2583
менші, 11-сантиметрові пироги,
00:43
and suddenlyраптом, appleяблуко fellвпав to fourthчетвертий or fifthп'ятий placeмісце.
10
31856
4174
і раптово рейтинг яблучних знизився до
четвертого чи п'ятого місця.
00:48
Why? What happenedсталося?
11
36030
2875
Чому? Що трапилось?
00:50
Okay, think about it.
12
38905
2818
Гаразд, поміркуйте про це.
00:53
When you buyкупити a 30-centimeter-сантиметр pieпиріг,
13
41723
3848
Коли ви купуєте 30-сантиметровий пиріг,
00:57
the wholeцілий familyсім'я has to agreeзгоден,
14
45571
2261
уся сім'я змушена погодитись,
00:59
and appleяблуко is everyone'sкожен secondдругий favoriteулюблений.
15
47832
3791
і пиріг з яблуками виявляється улюбленим
кожного другого.
01:03
(LaughterСміх)
16
51623
1935
(Сміх)
01:05
But when you buyкупити an individualіндивідуальний 11-centimeter-сантиметр pieпиріг,
17
53558
3615
Проте якщо ви купуєте 11-сантиметровий
пиріг,
01:09
you can buyкупити the one that you want.
18
57173
3745
ви можете придбати той, який бажаєте.
01:12
You can get your first choiceвибір.
19
60918
4015
Ви можете повернутись до першого вибору.
01:16
You have more dataдані.
20
64933
1641
У вас більше інформації.
01:18
You can see something
21
66574
1554
Ви можете помітити щось,
01:20
that you couldn'tне міг see
22
68128
1132
що не помічали тоді,
01:21
when you only had smallerменший amountsсуми of it.
23
69260
3953
коли у вас були лише окремі факти.
01:25
Now, the pointточка here is that more dataдані
24
73213
2475
І ось, ключовим моментом є те, що
додаткові дані
01:27
doesn't just let us see more,
25
75688
2283
не тільки дають можливість бачити
01:29
more of the sameтой же thing we were looking at.
26
77971
1854
інші аспекти аналізованого об'єкта.
01:31
More dataдані allowsдозволяє us to see newновий.
27
79825
3613
Більше даних дозволяють бачити нове.
01:35
It allowsдозволяє us to see better.
28
83438
3094
Бачити краще.
01:38
It allowsдозволяє us to see differentінший.
29
86532
3656
Бачити інакше.
01:42
In this caseсправа, it allowsдозволяє us to see
30
90188
3173
У цьому випадку, дані дозволяють побачити
01:45
what America'sВ Америці favoriteулюблений pieпиріг is:
31
93361
2913
який же з пирогів є улюбленим серед
американців:
01:48
not appleяблуко.
32
96274
2542
не з яблуками.
01:50
Now, you probablyймовірно all have heardпочув the termтермін bigвеликий dataдані.
33
98816
3614
Так от, ви всі, напевне, чули визначення
"великі дані".
01:54
In factфакт, you're probablyймовірно sickхворий of hearingслухання the termтермін
34
102430
2057
Власне, ви, мабуть, втомилися чути про
01:56
bigвеликий dataдані.
35
104487
1630
великий об'єм даних.
01:58
It is trueправда that there is a lot of hypeHype around the termтермін,
36
106117
3330
Термін є дійсно дуже розрекламованим,
02:01
and that is very unfortunateнещасний,
37
109447
2332
і це дуже сумно,
02:03
because bigвеликий dataдані is an extremelyнадзвичайно importantважливо toolінструмент
38
111779
3046
тому що велика кількість даних є важливим
інструментом,
02:06
by whichкотрий societyсуспільство is going to advanceзаздалегідь.
39
114825
3734
за допомогою якого суспільство
розвиватиметься.
02:10
In the pastминуле, we used to look at smallмаленький dataдані
40
118559
3561
В минулому ми брали до уваги невеликі
об'єми інформації
02:14
and think about what it would mean
41
122120
1704
і думали, що б вони могли означати
02:15
to try to understandзрозуміти the worldсвіт,
42
123824
1496
для спроби розуміння світу,
02:17
and now we have a lot more of it,
43
125320
1991
а тепер у нас набагато більше даних -
02:19
more than we ever could before.
44
127311
2722
більше, ніж могло б коли-небудь бути.
02:22
What we find is that when we have
45
130033
1877
Отож, коли ми маємо
02:23
a largeвеликий bodyтіло of dataдані, we can fundamentallyпринципово do things
46
131910
2724
велику масу даних, ми маємо можливість
робити те,
02:26
that we couldn'tне міг do when we
only had smallerменший amountsсуми.
47
134634
3276
чого не могли, коли даних було значно
менше.
02:29
BigВеликий dataдані is importantважливо, and bigвеликий dataдані is newновий,
48
137910
2641
Великі дані важливі, великі дані
інноваційні,
02:32
and when you think about it,
49
140551
1777
і якщо задуматись,
02:34
the only way this planetпланета is going to dealугода
50
142328
2216
для нашої планети єдиним шляхом подолати
02:36
with its globalглобальний challengesвиклики
51
144544
1789
виклики світового значення є
02:38
to feedгодувати people, supplyпостачання them with medicalмедичний careтурбота,
52
146333
3537
нагодувати людей, забезпечити їх медичною
допомогою,
02:41
supplyпостачання them with energyенергія, electricityелектрика,
53
149870
2810
енергією, електрикою,
02:44
and to make sure they're not burntспалений to a crispКрисп
54
152680
1789
впевнитись, що вони не згоріли дотла
02:46
because of globalглобальний warmingпотепління
55
154469
1238
через глобальне
потепління
02:47
is because of the effectiveефективний use of dataдані.
56
155707
4195
за допомогою ефективного використання
інформації.
02:51
So what is newновий about bigвеликий
dataдані? What is the bigвеликий dealугода?
57
159902
3870
Що ж нового у великих даних?
В чому ж суть?
02:55
Well, to answerвідповісти that questionпитання, let's think about
58
163772
2517
Щоб дати відповідь на запитання,
подумаймо
02:58
what informationінформація lookedподивився like,
59
166289
1896
про те, який вигляд мала інформація,
03:00
physicallyфізично lookedподивився like in the pastминуле.
60
168185
3034
як вона фізично виглядала в минулому.
03:03
In 1908, on the islandострів of CreteКрит,
61
171219
3611
У 1908 на острові Крит
03:06
archaeologistsАрхеологи discoveredвідкритий a clayглина discдиск.
62
174830
4735
археологи знайшли глиняний диск.
03:11
They datedдатовано it from 2000 B.C., so it's 4,000 yearsроків oldстарий.
63
179565
4059
Він датувався 2000 роком до н.е., отже
йому приблизно 4000 років.
03:15
Now, there's inscriptionsнаписи on this discдиск,
64
183624
2004
На диску є надписи,
03:17
but we actuallyнасправді don't know what it meansзасоби.
65
185628
1327
але їхнє значення невідоме.
03:18
It's a completeзавершити mysteryтаємниця, but the pointточка is that
66
186955
2098
Повна таємниця, але суть в тому, що
03:21
this is what informationінформація used to look like
67
189053
1928
таким чином інформація виглядала
03:22
4,000 yearsроків agoтому назад.
68
190981
2089
4000 років тому.
03:25
This is how societyсуспільство storedзберігається
69
193070
2548
Отак суспільство накопичувало
03:27
and transmittedпередається informationінформація.
70
195618
3524
і передавало дані.
03:31
Now, societyсуспільство hasn'tне має advancedпросунутий all that much.
71
199142
4160
Відтоді суспільство не дуже розвинулось.
03:35
We still storeмагазин informationінформація on discsдиски,
72
203302
3474
Ми все ще накопичуємо
інформацію на дисках,
03:38
but now we can storeмагазин a lot more informationінформація,
73
206776
3184
проте сьогодні можна зберігати набагато
більше даних
03:41
more than ever before.
74
209960
1260
ніж коли-небудь раніше.
03:43
SearchingПошук it is easierлегше. CopyingКопіювання it easierлегше.
75
211220
3093
Пошук даних спростився. Спростилося й
копіювання.
03:46
SharingОбмін it is easierлегше. ProcessingОбробка it is easierлегше.
76
214313
3500
А також обмін та обробка.
03:49
And what we can do is we can reuseповторне використання this informationінформація
77
217813
2766
І ми можемо повторно використовувати
інформацію
03:52
for usesвикористовує that we never even imaginedуявити собі
78
220579
1834
для цілей, яких не могли навіть уявити
03:54
when we first collectedзібрані the dataдані.
79
222413
3195
під час первинного збору даних.
03:57
In this respectповажати, the dataдані has goneпішов
80
225608
2252
В цьому плані дані пройшли шлях
03:59
from a stockзапас to a flowтечія,
81
227860
3532
від запасів до потоку,
04:03
from something that is stationaryстаціонарні and staticстатичні
82
231392
3938
від стаціонарного і статичного
04:07
to something that is fluidрідина and dynamicдинамічний.
83
235330
3609
до чогось швидкоплинного і
динамічного.
04:10
There is, if you will, a liquidityліквідність to informationінформація.
84
238939
4023
Плинність інформації, якщо
бажаєте.
04:14
The discдиск that was discoveredвідкритий off of CreteКрит
85
242962
3474
Диск, знайдений на Криті
04:18
that's 4,000 yearsроків oldстарий, is heavyважкий,
86
246436
3764
і якому 4000 років, досить важкий,
04:22
it doesn't storeмагазин a lot of informationінформація,
87
250200
1962
не зберігає багато інформації,
04:24
and that informationінформація is unchangeableнезмінний.
88
252162
3116
і ця інформація незмінна.
04:27
By contrastконтраст, all of the filesфайли
89
255278
4011
Для порівняння, усі файли,
04:31
that EdwardЕдвард SnowdenСноуден tookвзяв
90
259289
1861
взяті Едвардом Сноуденом
04:33
from the NationalНаціональний SecurityБезпека
AgencyАгентство in the UnitedЮнайтед StatesШтати
91
261150
2621
з Агентства національної безпеки США,
04:35
fitsпідходить on a memoryпам'ять stickпалиця
92
263771
2419
вміщуються на карті пам'яті,
04:38
the sizeрозмір of a fingernailніготь,
93
266190
3010
завбільшки з ніготь,
04:41
and it can be sharedподілився at the speedшвидкість of lightсвітло.
94
269200
4745
і її можна поширити зі швидкістю світла.
04:45
More dataдані. More.
95
273945
5255
Більше даних. Більше.
04:51
Now, one reasonпричина why we have
so much dataдані in the worldсвіт todayсьогодні
96
279200
1974
Однією з причин, чому нині
ми маємо стільки
04:53
is we are collectingзбирати things
97
281174
1432
даних є те, що ми збираємо пристрої,
04:54
that we'veми маємо always collectedзібрані informationінформація on,
98
282606
3280
на яких досі збирали інформацію,
04:57
but anotherінший reasonпричина why is we're takingвзяти things
99
285886
2656
а ще те, що ми
зберігаємо матеріали,
05:00
that have always been informationalінформаційні
100
288542
2812
які завжди були інформаційними,
05:03
but have never been renderedнадані into a dataдані formatформат
101
291354
2486
але ніколи не трансформувалися у формат
даних,
05:05
and we are puttingпокласти it into dataдані.
102
293840
2419
а зараз ми це їх переводимо
в цифровий формат.
05:08
Think, for exampleприклад, the questionпитання of locationМісцезнаходження.
103
296259
3308
Тепер подумаймо, наприклад, про
місцезнаходження.
05:11
Take, for exampleприклад, MartinМартін LutherЛютер.
104
299567
2249
Візьмемо для прикладу Мартіна Лютера.
05:13
If we wanted to know in the 1500s
105
301816
1597
Якщо б у 1500-ті ми захотіли
05:15
where MartinМартін LutherЛютер was,
106
303413
2667
дізнатись, де був Мартін Лютер,
05:18
we would have to followслідуйте him at all timesразів,
107
306080
2092
ми б мусили слідкувати за ним весь час,
05:20
maybe with a featheryперната quillQuill and an inkwellКаламар,
108
308172
2137
можливо, навіть з пером і чорнильницею,
05:22
and recordзапис it,
109
310309
1676
і занотовувати,
05:23
but now think about what it looksвиглядає like todayсьогодні.
110
311985
2183
проте подумаймо, як все це виглядає тепер.
05:26
You know that somewhereдесь,
111
314168
2122
Вам відомо, що десь,
05:28
probablyймовірно in a telecommunicationsтелекомунікації carrier'sперевізника databaseбаза даних,
112
316290
2446
мабуть, в базі даних постачальника
телекомунікацій
05:30
there is a spreadsheetелектронна таблиця or at leastнайменше a databaseбаза даних entryвходження
113
318736
3036
є таблиця чи, принаймні, запис
05:33
that recordsзаписи your informationінформація
114
321772
2088
з інформацією про те,
05:35
of where you've been at all timesразів.
115
323860
2063
де ви весь час бували.
05:37
If you have a cellклітина phoneтелефон,
116
325923
1360
Якщо у вас є мобільний
телефон,
05:39
and that cellклітина phoneтелефон has GPSGPS,
but even if it doesn't have GPSGPS,
117
327283
2847
і в ньому є GPS, і навіть якщо GPS немає,
05:42
it can recordзапис your informationінформація.
118
330130
2385
він все одно може записувати інформацію
про вас.
05:44
In this respectповажати, locationМісцезнаходження has been datafieddatafied.
119
332515
4084
В цьому відношенні місцезнаходження
задокументовано.
05:48
Now think, for exampleприклад, of the issueпроблема of postureпостава,
120
336599
4601
Тепер візьмемо до уваги, наприклад,
позу,
05:53
the way that you are all sittingсидячи right now,
121
341200
1285
те, як ми зараз сидимо,
05:54
the way that you sitсидіти,
122
342485
2030
те, як ви сидите,
05:56
the way that you sitсидіти, the way that you sitсидіти.
123
344515
2771
те, як сидите ви, чи ви.
05:59
It's all differentінший, and it's a functionфункція of your legноги lengthдовжина
124
347286
2077
Всі сидять по-різному залежно від
06:01
and your back and the contoursконтури of your back,
125
349363
2093
довжини ніг, спини і форми спини,
06:03
and if I were to put sensorsдатчики,
maybe 100 sensorsдатчики
126
351456
2531
а якщо б я зараз встановив сенсори, десь
100 сенсорів
06:05
into all of your chairsстільці right now,
127
353987
1766
у ваші сидіння,
06:07
I could createстворити an indexіндекс that's fairlyсправедливо uniqueунікальний to you,
128
355753
3600
я б зміг вивести індивідуальний індекс для
кожного з вас,
06:11
sortсортувати of like a fingerprintвідбитків пальців, but it's not your fingerпалець.
129
359353
4409
щось на кшталт відбитка пальця, але це не
пальці.
06:15
So what could we do with this?
130
363762
2969
Що ж можна з усім цим зробити?
06:18
ResearchersДослідники in TokyoТокіо are usingвикористовуючи it
131
366731
2397
Дослідники з Токіо використовують це
06:21
as a potentialпотенціал anti-theftпротиугінні deviceпристрій in carsавтомобілі.
132
369128
4388
як потенційний протиугінний пристрій
в автомобілях.
06:25
The ideaідея is that the carjackercarjacker sitsсидить behindпозаду the wheelколесо,
133
373516
2924
Суть в тому, що водій сідає за кермо,
06:28
triesнамагається to streamпотік off, but the carмашина recognizesвизнає
134
376440
2104
намагається втекти, але машина розпізнає
06:30
that a non-approvedне затверджено driverводій is behindпозаду the wheelколесо,
135
378544
2362
водія без належного доступу за кермом,
06:32
and maybe the engineдвигун just stopsзупиняється, unlessякщо не you
136
380906
2164
і мабуть, двигун затихне, аж поки не
06:35
typeтип in a passwordпароль into the dashboardПриладна дошка
137
383070
3177
ввести пароль на приборній панелі,
06:38
to say, "Hey, I have authorizationАвторизація to driveїхати." Great.
138
386247
4658
щоб прозвучало, "Агов, у мене є доступ до
водіння". Чудово.
06:42
What if everyкожен singleсингл carмашина in EuropeЄвропа
139
390905
2553
Що якщо б кожне авто Європи було
06:45
had this technologyтехнологія in it?
140
393458
1457
обладнане цією технологією?
06:46
What could we do then?
141
394915
3165
Що б ми змогли зробити?
06:50
Maybe, if we aggregatedагреговані the dataдані,
142
398080
2240
Мабуть, якщо б зібрати усі дані,
06:52
maybe we could identifyідентифікувати telltaleTelltale signsзнаки
143
400320
3814
ми б могли розпізнати індикатори
приборної панелі,
06:56
that bestнайкраще predictпередбачати that a carмашина accidentаварія
144
404134
2709
які найкраще сповіщають про можливе
зіткнення
06:58
is going to take placeмісце in the nextдалі fiveп'ять secondsсекунд.
145
406843
5893
у наступні п'ять секунд.
07:04
And then what we will have datafieddatafied
146
412736
2557
І тоді б була задокументована
07:07
is driverводій fatigueвтома,
147
415293
1783
втома водія,
07:09
and the serviceсервіс would be when the carмашина sensesпочуття
148
417076
2334
а машина б розпізнавала,
07:11
that the personлюдина slumpsзазнало спадів into that positionпозиція,
149
419410
3437
що водій безпосередньо провалюється в ту
позу,
07:14
automaticallyавтоматично knowsзнає, hey, setвстановити an internalвнутрішній alarmтривога
150
422847
3994
автоматично визначала й посилала
внутрішній сигнал:
07:18
that would vibrateВібрація the steeringрульове управління wheelколесо, honkХрю insideвсередині
151
426841
2025
вібрація керма, салонний гудок,
07:20
to say, "Hey, wakeпрокинься up,
152
428866
1721
і сповіщала: "Агов, прокидайся,
07:22
payплатити more attentionувага to the roadдорога."
153
430587
1904
сконцентруйся на дорозі".
07:24
These are the sortsсортів of things we can do
154
432491
1853
Ось такого типу речі ми можемо робити,
07:26
when we datafydatafy more aspectsаспекти of our livesживе.
155
434344
2821
документуючи й інші аспекти
нашого життя.
07:29
So what is the valueвартість of bigвеликий dataдані?
156
437165
3675
В чому цінність великих даних?
07:32
Well, think about it.
157
440840
2190
Що ж, подумайте про це.
07:35
You have more informationінформація.
158
443030
2412
У вас більше інформації.
07:37
You can do things that you couldn'tне міг do before.
159
445442
3341
Ви можете робити речі, які перед тим
робити не доводилось.
07:40
One of the mostнайбільше impressiveвражаюче areasрайони
160
448783
1676
Однією з вражаючих сфер
їхнього використання
07:42
where this conceptконцепція is takingвзяти placeмісце
161
450459
1729
є машинне навчання.
07:44
is in the areaплоща of machineмашина learningнавчання.
162
452188
3307
Машинне навчання є частиною штучного
інтелекту,
07:47
MachineМашина learningнавчання is a branchфілія of artificialштучний intelligenceрозвідка,
163
455495
3077
який, своєю чергою, належить до
інформатики.
07:50
whichкотрий itselfсама по собі is a branchфілія of computerкомп'ютер scienceнаука.
164
458572
3378
Ідея в тому, що замість
07:53
The generalзагальний ideaідея is that insteadзамість цього of
165
461950
1543
того, щоб задати певний алгоритм дій,
07:55
instructingінструктаж a computerкомп'ютер what do do,
166
463493
2117
ми просто спрямуємо дані на проблему
07:57
we are going to simplyпросто throwкинути dataдані at the problemпроблема
167
465610
2620
і дамо можливість комп'ютеру розібратись
самому.
08:00
and tell the computerкомп'ютер to figureфігура it out for itselfсама по собі.
168
468230
3206
Зрозуміти це допоможе
08:03
And it will help you understandзрозуміти it
169
471436
1777
розгляд походження.
08:05
by seeingбачачи its originsвитоки.
170
473213
3552
У 1950-х вчений-інформатик
08:08
In the 1950s, a computerкомп'ютер scientistвчений
171
476765
2388
компанії IBM Артур Семюел полюбляв грати
в шашки,
08:11
at IBMIBM namedназваний ArthurАртур SamuelСамуїл likedсподобалося to playграти checkersшашки,
172
479153
3592
отож він створив програму,
08:14
so he wroteписав a computerкомп'ютер programпрограма
173
482745
1402
щоб грати проти комп'ютера.
08:16
so he could playграти againstпроти the computerкомп'ютер.
174
484147
2813
Він грав. Він перемагав.
08:18
He playedзіграв. He wonвиграв.
175
486960
2711
Грав. Перемагав.
08:21
He playedзіграв. He wonвиграв.
176
489671
2103
Грав. Перемагав,
08:23
He playedзіграв. He wonвиграв,
177
491774
3015
тому що комп'ютеру було відомо тільки
08:26
because the computerкомп'ютер only knewзнав
178
494789
1778
правильні ходи.
08:28
what a legalзаконний moveрухатися was.
179
496567
2227
Артур Семюел знав дещо інше.
08:30
ArthurАртур SamuelСамуїл knewзнав something elseінакше.
180
498794
2087
Артур Семюел знав стратегію.
08:32
ArthurАртур SamuelСамуїл knewзнав strategyстратегія.
181
500881
4629
Тому він написав невелику під-програму,
08:37
So he wroteписав a smallмаленький sub-programпрограму alongsideпоряд з it
182
505510
2396
яка працювала у фоновому режимі
08:39
operatingдіючий in the backgroundфон, and all it did
183
507906
1974
і вираховувала ймовірність
08:41
was scoreоцінка the probabilityймовірність
184
509880
1817
того, що задана конфігурація призведе
08:43
that a givenдано boardдошка configurationконфігурації would likelyшвидше за все leadвести
185
511697
2563
до перемоги, а не зазнає поразки
08:46
to a winningвиграш boardдошка versusпроти a losingпрограє boardдошка
186
514260
2910
після кожного ходу.
08:49
after everyкожен moveрухатися.
187
517170
2508
Він грає проти комп'ютера. Він перемагає.
08:51
He playsграє the computerкомп'ютер. He winsперемагає.
188
519678
3150
Грає проти комп'ютера. Перемагає.
08:54
He playsграє the computerкомп'ютер. He winsперемагає.
189
522828
2508
Грає проти комп'ютера. Перемагає.
08:57
He playsграє the computerкомп'ютер. He winsперемагає.
190
525336
3731
А потім Артур Семюел залишає комп'ютер
09:01
And then ArthurАртур SamuelСамуїл leavesлистя the computerкомп'ютер
191
529067
2277
грати із самим собою.
09:03
to playграти itselfсама по собі.
192
531344
2227
Він грає сам з собою. Збирає більше даних.
09:05
It playsграє itselfсама по собі. It collectsзбирає more dataдані.
193
533571
3509
Зберігає більше даних. Підвищує точність
передбачення.
09:09
It collectsзбирає more dataдані. It increasesзбільшується
the accuracyточність of its predictionпередбачення.
194
537080
4309
І ось Артур Семюел повертається до
комп' ютера,
09:13
And then ArthurАртур SamuelСамуїл goesйде back to the computerкомп'ютер
195
541389
2104
і грає, і програє,
09:15
and he playsграє it, and he losesвтрачає,
196
543493
2318
грає, і програє,
09:17
and he playsграє it, and he losesвтрачає,
197
545811
2069
грає, і програє,
09:19
and he playsграє it, and he losesвтрачає,
198
547880
2047
і от Артур Семюел створює пристрій,
09:21
and ArthurАртур SamuelСамуїл has createdстворений a machineмашина
199
549927
2599
що випереджує його здатність виконувати
певні завдання.
09:24
that surpassesперевершує his abilityздібності in a taskзавдання that he taughtнавчав it.
200
552526
6288
Ця ідея машинного навчання
09:30
And this ideaідея of machineмашина learningнавчання
201
558814
2498
поширюється усюди.
09:33
is going everywhereскрізь.
202
561312
3927
Як, на вашу думку, з'явились самокеровані
авто?
09:37
How do you think we have self-drivingіндивідуальної їзді carsавтомобілі?
203
565239
3149
Стали б ми розвиненішим суспільством,
довіряючи
09:40
Are we any better off as a societyсуспільство
204
568388
2137
правила дорожнього руху
комп'ютерам?
09:42
enshriningЗакріпивши all the rulesправил of the roadдорога into softwareпрограмне забезпечення?
205
570525
3285
Ні. Пам'ять дешевша? Ні.
09:45
No. MemoryПам'яті is cheaperдешевше. No.
206
573810
2598
Алгоритми швидші? Ні. Процесори кращі? Ні.
09:48
AlgorithmsАлгоритми are fasterшвидше. No. ProcessorsПроцесори are better. No.
207
576408
3994
Усі ці речі мають значення, але суть не в
тому.
09:52
All of those things matterматерія, but that's not why.
208
580402
2772
Все тому, що ми змінили саму проблему.
09:55
It's because we changedзмінився the natureприрода of the problemпроблема.
209
583174
3141
Ми змінили проблему з однієї,
09:58
We changedзмінився the natureприрода of the problemпроблема from one
210
586315
1530
у якій намагалися чітко і ясно
09:59
in whichкотрий we triedспробував to overtlyвідверто and explicitlyявно
211
587845
2245
пояснити комп'ютеру як керувати,
10:02
explainпояснити to the computerкомп'ютер how to driveїхати
212
590090
2581
до такої, де кажемо:
10:04
to one in whichкотрий we say,
213
592671
1316
"Ось багато даних про авто.
10:05
"Here'sОсь a lot of dataдані around the vehicleтранспортний засіб.
214
593987
1876
З'ясовуй.
10:07
You figureфігура it out.
215
595863
1533
Зрозумій, що таке світлофор,
10:09
You figureфігура it out that that is a trafficтрафік lightсвітло,
216
597396
1867
що він червоний, а не зелений,
10:11
that that trafficтрафік lightсвітло is redчервоний and not greenзелений,
217
599263
2081
що він означає зупинитись,
10:13
that that meansзасоби that you need to stop
218
601344
2014
а не рухатись далі".
10:15
and not go forwardвперед."
219
603358
3083
Машинне навчання є основою
10:18
MachineМашина learningнавчання is at the basisоснови
220
606441
1518
багатьох речей онлайн:
10:19
of manyбагато хто of the things that we do onlineонлайн:
221
607959
1991
пошукових систем,
10:21
searchпошук enginesдвигуни,
222
609950
1857
алгоритму персоналізації Amazon,
10:23
Amazon'sAmazon personalizationПерсоналізація algorithmалгоритм,
223
611807
3801
комп'ютерного перекладу,
10:27
computerкомп'ютер translationпереклад,
224
615608
2212
систем голосового розпізнавання.
10:29
voiceголос recognitionвизнання systemsсистеми.
225
617820
4290
Дослідники недавно зосередились на
10:34
ResearchersДослідники recentlyнещодавно have lookedподивився at
226
622110
2835
проблемі біопсії,
10:36
the questionпитання of biopsiesбіопсія,
227
624945
3195
біопсії ракових клітин,
10:40
cancerousракової biopsiesбіопсія,
228
628140
2767
вони дали завдання комп'ютеру
ідентифікувати
10:42
and they'veвони вже askedзапитав the computerкомп'ютер to identifyідентифікувати
229
630907
2315
за допомогою даних і процентів виживання,
10:45
by looking at the dataдані and survivalвиживання ratesставки
230
633222
2471
чи клітини дійсно
10:47
to determineвизначити whetherчи то cellsклітини are actuallyнасправді
231
635693
4667
уражені раком чи ні,
10:52
cancerousракової or not,
232
640360
2544
і справді, коли ви спрямовуєте на це дані,
10:54
and sure enoughдостатньо, when you throwкинути the dataдані at it,
233
642904
1778
через алгоритм машинного навчання,
10:56
throughчерез a machine-learningМашинне навчання algorithmалгоритм,
234
644682
2047
пристрій може ідентифікувати
10:58
the machineмашина was ableздатний to identifyідентифікувати
235
646729
1877
12 ознак, які найкраще визначають,
11:00
the 12 telltaleTelltale signsзнаки that bestнайкраще predictпередбачати
236
648606
2262
що біоптат ракових клітин
11:02
that this biopsyбіопсія of the breastгруди cancerрак cellsклітини
237
650868
3299
дійсно раковий.
11:06
are indeedдійсно cancerousракової.
238
654167
3218
Проблема: медичній літературі
11:09
The problemпроблема: The medicalмедичний literatureлітература
239
657385
2498
відомо тільки 9 з них.
11:11
only knewзнав nineдев'ять of them.
240
659883
2789
Три з ознак раніше
11:14
ThreeТри of the traitsриси were onesті, хто
241
662672
1800
не були взагалі відомі,
11:16
that people didn't need to look for,
242
664472
2975
проте машина їх знайшла.
11:19
but that the machineмашина spottedплямистий.
243
667447
5531
Так от, у великих даних є й вади.
11:24
Now, there are darkтемний sidesсторони to bigвеликий dataдані as well.
244
672978
5925
Вони покращують наше життя, але існують
й проблеми,
11:30
It will improveполіпшити our livesживе, but there are problemsпроблеми
245
678903
2074
про які ми мусимо знати,
11:32
that we need to be consciousсвідомий of,
246
680977
2640
і найпершою є ідея того,
11:35
and the first one is the ideaідея
247
683617
2623
що нас можуть покарати за передбачення,
11:38
that we mayможе be punishedпокарані for predictionsпрогнози,
248
686240
2686
що поліція використовуватиме дані на
власний розсуд,
11:40
that the policeполіція mayможе use bigвеликий dataдані for theirїх purposesцілей,
249
688926
3870
щось на кшталт "Особливої думки."
11:44
a little bitбіт like "MinorityМеншини ReportЗвіт."
250
692796
2351
Термін має назву прогностичної
11:47
Now, it's a termтермін calledназивається predictiveІнтелектуальне policingполіцейські,
251
695147
2441
політики або алгоритмічної кримінології,
11:49
or algorithmicАлгоритмічні criminologyкримінологія,
252
697588
2363
і якщо ми візьмемо до уваги багато
відомостей,
11:51
and the ideaідея is that if we take a lot of dataдані,
253
699951
2036
наприклад, колишні місця злочинів,
11:53
for exampleприклад where pastминуле crimesзлочини have been,
254
701987
2159
ми б знали, куди посилати патрулі.
11:56
we know where to sendвідправити the patrolsпатрулювання.
255
704146
2543
Логічно, але, звісно ж, проблема
11:58
That makesробить senseсенс, but the problemпроблема, of courseзвичайно,
256
706689
2115
в тому, що все не зупиниться на даних
про локацію,
12:00
is that it's not simplyпросто going to stop on locationМісцезнаходження dataдані,
257
708804
4544
а пошириться й на приватний рівень.
12:05
it's going to go down to the levelрівень of the individualіндивідуальний.
258
713348
2959
Чому б не використати інформацію
12:08
Why don't we use dataдані about the person'sлюдина
259
716307
2250
про чийсь атестат?
12:10
highвисокий schoolшкола transcriptТранскрипт?
260
718557
2228
Можливо, нам згодяться факти про
12:12
Maybe we should use the factфакт that
261
720785
1561
роботу, кредитний рейтинг,
12:14
they're unemployedбезробітний or not, theirїх creditкредит scoreоцінка,
262
722346
2028
поведінку в глобальній мережі,
12:16
theirїх web-surfingвеб серфінг behaviorповедінка,
263
724374
1552
чи хтось не спить допізна.
12:17
whetherчи то they're up lateпізно at night.
264
725926
1878
Прилади, які вимірюють біологічні дані,
12:19
TheirЇх FitbitFitbit, when it's ableздатний
to identifyідентифікувати biochemistriesbiochemistries,
265
727804
3161
покажуть наявність агресивних думок.
12:22
will showпоказати that they have aggressiveагресивний thoughtsдумки.
266
730965
4236
Ми можемо виробити алгоритми, які зможуть
12:27
We mayможе have algorithmsалгоритми that are likelyшвидше за все to predictпередбачати
267
735201
2221
передбачити наші дії, але є ймовірність
12:29
what we are about to do,
268
737422
1633
притягнення до відповідальності
12:31
and we mayможе be heldвідбувся accountableпідзвітний
269
739055
1244
ще перед самою спробою.
12:32
before we'veми маємо actuallyнасправді actedдіяла.
270
740299
2590
Конфіденційність була основним викликом
12:34
PrivacyКонфіденційність was the centralцентральний challengeвиклик
271
742889
1732
епохи невеликих даних.
12:36
in a smallмаленький dataдані eraепоха.
272
744621
2880
У періоді великого об'єму даних
12:39
In the bigвеликий dataдані ageвік,
273
747501
2149
проблемою є безпека свободи волі,
12:41
the challengeвиклик will be safeguardingзбереження freeбезкоштовно will,
274
749650
4523
морального вибору, бажань,
12:46
moralморальний choiceвибір, humanлюдина volitionбажанням,
275
754173
3779
свободи дій.
12:49
humanлюдина agencyагентство.
276
757952
3068
Існує й інша проблема:
12:54
There is anotherінший problemпроблема:
277
762540
2225
великі дані скоротять робочі місця.
12:56
BigВеликий dataдані is going to stealвкрасти our jobsробочі місця.
278
764765
3556
Вони разом з алгоритмами поставлять
під сумнів роботу
13:00
BigВеликий dataдані and algorithmsалгоритми are going to challengeвиклик
279
768321
3512
"білих комірців", професійні знання
13:03
whiteбілий collarкомір, professionalпрофесійний knowledgeзнання work
280
771833
3061
21-го століття
13:06
in the 21stвул centuryстоліття
281
774894
1653
таким же чином, як автоматизація
13:08
in the sameтой же way that factoryфабрика automationАвтоматизація
282
776547
2434
і конвеєризація кинули виклик
13:10
and the assemblyзбірка lineлінія
283
778981
2189
"синім комірцям" у 20-му столітті.
13:13
challengedвиклик blueсиній collarкомір laborпраця in the 20thго centuryстоліття.
284
781170
3026
Подумайте про лаборанта,
13:16
Think about a labлабораторія technicianтехнік
285
784196
2092
що розглядає у мікроскоп
13:18
who is looking throughчерез a microscopeмікроскоп
286
786288
1409
раковий біоптат
13:19
at a cancerрак biopsyбіопсія
287
787697
1624
і визначає, чи він дійсно раковий.
13:21
and determiningвизначаючи whetherчи то it's cancerousракової or not.
288
789321
2637
Ця людина закінчила університет.
13:23
The personлюдина wentпішов to universityуніверситет.
289
791958
1972
Ця людина купує речі.
13:25
The personлюдина buysкупує propertyвласність.
290
793930
1430
Він або вона голосує.
13:27
He or she votesголосів.
291
795360
1741
Він або вона змінює суспільство.
13:29
He or she is a stakeholderзацікавлених сторін in societyсуспільство.
292
797101
3666
І робота цієї людини,
13:32
And that person'sлюдина jobробота,
293
800767
1394
як і цілої флотилії таких же
13:34
as well as an entireцілий fleetфлот
294
802161
1609
професіоналів,
13:35
of professionalsпрофесіонали like that personлюдина,
295
803770
1969
радикально зміниться
13:37
is going to find that theirїх jobsробочі місця are radicallyрадикально changedзмінився
296
805739
3150
або й взагалі зникне.
13:40
or actuallyнасправді completelyповністю eliminatedусувається.
297
808889
2357
Так от, ми звикли думати, що технології
створюють
13:43
Now, we like to think
298
811246
1284
місця на довгий час
13:44
that technologyтехнологія createsстворює jobsробочі місця over a periodперіод of time
299
812530
3187
після короткого, тимчасового періоду
дезорганізації,
13:47
after a shortкороткий, temporaryтимчасовий periodперіод of dislocationвивих,
300
815717
3465
і дійсно, таке відбувається в умовах,
13:51
and that is trueправда for the frameрамка of referenceдовідка
301
819182
1941
в яких ми живемо, Індустріальній
13:53
with whichкотрий we all liveжити, the IndustrialПромислові RevolutionРеволюція,
302
821123
2142
Революції, тому що саме так трапилось.
13:55
because that's preciselyточно what happenedсталося.
303
823265
2328
Проче чогось бракує в цьому аналізі:
13:57
But we forgetзабувай something in that analysisаналіз:
304
825593
2333
є деякі категорії праці, що просто
13:59
There are some categoriesкатегорій of jobsробочі місця
305
827926
1830
нівелюються і з часом зникають.
14:01
that simplyпросто get eliminatedусувається and never come back.
306
829756
3420
Індустріальна Революція мала б негативне
значення,
14:05
The IndustrialПромислові RevolutionРеволюція wasn'tне було very good
307
833176
2004
якщо ви були б конем.
14:07
if you were a horseкінь.
308
835180
4002
Отже, нам варто бути обережними
14:11
So we're going to need to be carefulобережно
309
839182
2055
і регулювати дані лише для певних
потреб,
14:13
and take bigвеликий dataдані and adjustналаштувати it for our needsпотреби,
310
841237
3514
головних людських потреб.
14:16
our very humanлюдина needsпотреби.
311
844751
3185
Ми мусимо стати господарями
цієї технології,
14:19
We have to be the masterмагістр of this technologyтехнологія,
312
847936
1954
а не її рабами.
14:21
not its servantслуга.
313
849890
1656
Ми на початку епохи великих даних,
14:23
We are just at the outsetПерш за все of the bigвеликий dataдані eraепоха,
314
851546
2958
і чесно кажучи, нам не вдається оперувати
14:26
and honestlyчесно, we are not very good
315
854504
3150
усіма даними, які можемо зібрати.
14:29
at handlingобробка all the dataдані that we can now collectзбирати.
316
857654
4207
Це проблема не тільки АНБ.
14:33
It's not just a problemпроблема for
the NationalНаціональний SecurityБезпека AgencyАгентство.
317
861861
3330
Підприємства володіють багатьма даними,
проте зложивають ними,
14:37
BusinessesПідприємства collectзбирати lots of
dataдані, and they misuseзловживання it too,
318
865191
3038
тому ми повинні покращити становище, хоч
це й забере час.
14:40
and we need to get better at
this, and this will take time.
319
868229
3667
Трохи схоже на виклик
14:43
It's a little bitбіт like the challengeвиклик that was facedзіткнувся
320
871896
1822
перших людей і вогню.
14:45
by primitiveпримітивний man and fireвогонь.
321
873718
2407
Це не тільки інструмент, але й те, що,
14:48
This is a toolінструмент, but this is a toolінструмент that,
322
876125
1885
доки ми не обережні, знищить нас.
14:50
unlessякщо не we're carefulобережно, will burnгоріти us.
323
878010
3559
Великі дані змінять наше життя,
14:56
BigВеликий dataдані is going to transformперетворити how we liveжити,
324
884008
3120
працю і мислення.
14:59
how we work and how we think.
325
887128
2801
Вони допоможуть управляти працею
15:01
It is going to help us manageуправляти our careersкар'єра
326
889929
1889
і бути задоволеним, повним сподівань,
15:03
and leadвести livesживе of satisfactionзадоволення and hopeнадія
327
891818
3634
щасливим і здоровим,
15:07
and happinessщастя and healthздоров'я,
328
895452
2992
але в минулому ми дивились на
інформаційні технології
15:10
but in the pastминуле, we'veми маємо oftenчасто
lookedподивився at informationінформація technologyтехнологія
329
898444
3306
і бачили лише Т,
15:13
and our eyesочі have only seenбачив the T,
330
901750
2208
технології, пристрої,
15:15
the technologyтехнологія, the hardwareапаратне забезпечення,
331
903958
1686
тому що все це було матеріальним.
15:17
because that's what was physicalфізичний.
332
905644
2262
Тепер ж потрібно зосередитись на І,
15:19
We now need to recastпереробити our gazeпогляду at the I,
333
907906
2924
інформації,
15:22
the informationінформація,
334
910830
1380
яка, певно, є менш очевидною,
15:24
whichкотрий is lessменше apparentочевидним,
335
912210
1373
проте набагато важливішою.
15:25
but in some waysшляхи a lot more importantважливо.
336
913583
4109
Людство нарешті мати вигоду
15:29
HumanityЛюдство can finallyнарешті learnвчитися from the informationінформація
337
917692
3465
із зібраних відомостей,
15:33
that it can collectзбирати,
338
921157
2418
як частини наших вічних пошуків
15:35
as partчастина of our timelessTimeless questквест
339
923575
2115
розуміння світу і місця в ньому,
15:37
to understandзрозуміти the worldсвіт and our placeмісце in it,
340
925690
3159
і ось тому великі дані мають велике
значення.
15:40
and that's why bigвеликий dataдані is a bigвеликий dealугода.
341
928849
5631
15:46
(ApplauseОплески)
342
934480
3568
Translated by Elena Pedosyuk
Reviewed by Hanna Leliv

▲Back to top

ABOUT THE SPEAKER
Kenneth Cukier - Data Editor of The Economist
Kenneth Cukier is the Data Editor of The Economist. From 2007 to 2012 he was the Tokyo correspondent, and before that, the paper’s technology correspondent in London, where his work focused on innovation, intellectual property and Internet governance. Kenneth is also the co-author of Big Data: A Revolution That Will Transform How We Live, Work, and Think with Viktor Mayer-Schönberger in 2013, which was a New York Times Bestseller and translated into 16 languages.

Why you should listen

As Data Editor of The Economist and co-author of Big Data: A Revolution That Will Transform How We Live, Work, and Think, Kenneth Cukier has spent years immersed in big data, machine learning -- and the impact of both. What's the future of big data-driven technology and design? To find out, watch this talk.

More profile about the speaker
Kenneth Cukier | Speaker | TED.com