ABOUT THE SPEAKER
Sebastian Wernicke - Data scientist
After making a splash in the field of bioinformatics, Sebastian Wernicke moved on to the corporate sphere, where he motivates and manages multidimensional projects.

Why you should listen

Dr. Sebastian Wernicke is the Chief Data Scientist of ONE LOGIC, a data science boutique that supports organizations across industries to make sense of their vast data collections to improve operations and gain strategic advantages. Wernicke originally studied bioinformatics and previously led the strategy and growth of Seven Bridges Genomics, a Cambridge-based startup that builds platforms for genetic analysis.

Before his career in statistics began, Wernicke worked stints as both a paramedic and successful short animated filmmaker. He's also the author of the TEDPad app, an irreverent tool for creating an infinite number of "amazing and really bad" and mostly completely meaningless talks. He's the author of the statistically authoritative and yet completely ridiculous "How to Give the Perfect TEDTalk."

More profile about the speaker
Sebastian Wernicke | Speaker | TED.com
TEDxCambridge

Sebastian Wernicke: How to use data to make a hit TV show

Sebastian Wernicke: Jak użyć danych do stworzenia świetnego programu TV

Filmed:
1,628,704 views

Czy zbieranie danych usprawnia podejmowanie decyzji? Ambitne i obeznane z danymi firmy jak Amazon, Google i Netflix odkryły, że sama analiza danych nie zawsze prowadzi do najlepszych rezultatów. W tej prelekcji badacz danych Sebastian Wernicke analizuje pomyłki wynikające z opierania się wyłącznie na danych, i sugeruje sprytniejsze ich wykorzystanie.
- Data scientist
After making a splash in the field of bioinformatics, Sebastian Wernicke moved on to the corporate sphere, where he motivates and manages multidimensional projects. Full bio

Double-click the English transcript below to play the video.

Większość z was pewnie
nigdy nie słyszała o Royu Price,
00:12
RoyRoy PriceCena is a man that mostwiększość of you
have probablyprawdopodobnie never heardsłyszał about,
0
820
4276
choć być może zabrał wam 22 minut życia
00:17
even thoughchociaż he maymoże have been responsibleodpowiedzialny
1
5120
2496
00:19
for 22 somewhatnieco mediocremierny
minutesminuty of your life on AprilKwietnia 19, 2013.
2
7640
6896
19 kwietnia 2013 roku.
Niewykluczone, że przez te 22 minuty
część z was dobrze się bawiła,
00:26
He maymoże have alsorównież been responsibleodpowiedzialny
for 22 very entertainingzabawny minutesminuty,
3
14560
3176
00:29
but not very manywiele of you.
4
17760
2256
ale raczej niewielu.
Wszystko to sprowadza się do decyzji,
którą Roy musiał podjąć trzy lata temu.
00:32
And all of that goesidzie back to a decisiondecyzja
5
20040
1896
00:33
that RoyRoy had to make
about threetrzy yearslat agotemu.
6
21960
2000
Roy Price jest prezesem Amazon Studios,
00:35
So you see, RoyRoy PriceCena
is a seniorsenior executivewykonawczy with AmazonAmazon StudiosStudios.
7
23984
4832
00:40
That's the TVTELEWIZOR productionprodukcja
companyfirma of AmazonAmazon.
8
28840
3016
spółki zajmującej się
produkcją telewizyjną.
00:43
He's 47 yearslat oldstary, slimszczupły, spikykolczaste hairwłosy,
9
31880
3256
Ma 47 lat, jest szczupły
i ma włosy na sztorc,
00:47
describesopisuje himselfsamego siebie on TwitterTwitter
as "movieskino, TVTELEWIZOR, technologytechnologia, tacosTacos."
10
35160
4816
jego opis na Twitterze brzmi:
"filmy, telewizja, technologia, tacos".
00:52
And RoyRoy PriceCena has a very responsibleodpowiedzialny jobpraca,
because it's his responsibilityodpowiedzialność
11
40000
5176
Roy Price ma bardzo odpowiedzialną pracę.
To on odpowiada za wybór seriali,
jakie stworzy Amazon.
00:57
to pickwybierać the showsprzedstawia, the originaloryginalny contentzadowolony
that AmazonAmazon is going to make.
12
45200
4056
01:01
And of coursekurs that's
a highlywysoko competitivekonkurencyjny spaceprzestrzeń.
13
49280
2336
To bardzo konkurencyjny rynek.
01:03
I mean, there are so manywiele
TVTELEWIZOR showsprzedstawia alreadyjuż out there,
14
51640
2736
Teraz jest tyle seriali,
że nie można wybrać byle czego.
01:06
that RoyRoy can't just choosewybierać any showpokazać.
15
54400
2176
01:08
He has to find showsprzedstawia
that are really, really great.
16
56600
4096
Trzeba wybrać naprawdę dobre seriale.
01:12
So in other wordssłowa, he has to find showsprzedstawia
17
60720
2816
Innymi słowy takie, które będą
na prawym końcu tego wykresu.
01:15
that are on the very right endkoniec
of this curvekrzywa here.
18
63560
2376
01:17
So this curvekrzywa here
is the ratingOcena distributiondystrybucja
19
65960
2656
Ten wykres to rozkład ocen ratingowych
2 500 seriali w serwisie IMDB.
01:20
of about 2,500 TVTELEWIZOR showsprzedstawia
on the websitestronie internetowej IMDBIMDB,
20
68640
4376
Oceny są w skali od 1 do 10.
01:25
and the ratingOcena goesidzie from one to 10,
21
73040
2896
Ta linia pokazuje ile programów
dostało taką ocenę.
01:27
and the heightwysokość here showsprzedstawia you
how manywiele showsprzedstawia get that ratingOcena.
22
75960
2976
01:30
So if your showpokazać getsdostaje a ratingOcena
of ninedziewięć pointszwrotnica or higherwyższy, that's a winnerzwycięzca.
23
78960
4696
Program oceniony na minimum 9
jest bardzo dobry.
01:35
Then you have a topTop two percentprocent showpokazać.
24
83680
1816
Mieści się w górnych 2%.
01:37
That's showsprzedstawia like "BreakingŁamanie BadZły,"
"GameGra of ThronesTrony," "The WireDrutu,"
25
85520
3896
Tu mamy seriale jak "Breaking Bad",
"Gra o tron", "Prawo ulicy",
01:41
so all of these showsprzedstawia that are addictivewciągający,
26
89440
2296
czyli wszelkie uzależniające seriale,
01:43
whereafterma you've watchedoglądaliśmy a seasonpora roku,
your brainmózg is basicallygruntownie like,
27
91760
3056
po obejrzeniu których mózg pyta:
01:46
"Where can I get more of these episodesodcinki?"
28
94840
2176
"Skąd wziąć dalsze odcinki".
01:49
That kinduprzejmy of showpokazać.
29
97040
1200
O takich serialach mówię.
Żeby było jasne, tutaj po lewej
01:50
On the left sidebok, just for clarityprzejrzystość,
here on that endkoniec,
30
98920
2496
01:53
you have a showpokazać callednazywa
"ToddlersMałe dzieci and TiarasTiary" --
31
101440
3176
znajdziecie program "Mała piękność".
01:56
(LaughterŚmiech)
32
104640
2656
(Śmiech)
01:59
-- whichktóry should tell you enoughdość
33
107320
1536
co pozwala zrozumieć,
02:00
about what's going on
on that endkoniec of the curvekrzywa.
34
108880
2191
co się dzieje z tego końca.
02:03
Now, RoyRoy PriceCena is not worriedzmartwiony about
gettinguzyskiwanie on the left endkoniec of the curvekrzywa,
35
111095
4161
Roy Price nie martwi, że tam trafi.
02:07
because I think you would have to have
some seriouspoważny brainpowerpotencjału umysłowego
36
115280
2936
bo trzeba by się nieźle postarać,
żeby zrobić program gorszy od tego.
02:10
to undercutpodcięcie "ToddlersMałe dzieci and TiarasTiary."
37
118240
1696
02:11
So what he's worriedzmartwiony about
is this middleśrodkowy bulgewybrzuszenie here,
38
119960
3936
Bardziej martwi go środkowe wybrzuszenie.
02:15
the bulgewybrzuszenie of averageśredni TVTELEWIZOR,
39
123920
1816
Tutaj są wszelkie średniaki.
02:17
you know, those showsprzedstawia
that aren'tnie są really good or really badzły,
40
125760
2856
Wszelkie seriale, które nie są dobre,
ale nie są też złe.
02:20
they don't really get you excitedpodekscytowany.
41
128639
1656
Takie, które nie wzbudzają emocji.
02:22
So he needswymagania to make sure
that he's really on the right endkoniec of this.
42
130320
4856
Musi się koniecznie znaleźć
po prawej stronie.
02:27
So the pressurenacisk is on,
43
135200
1576
Jest więc presja, a na dodatek
Amazon robi coś takiego po raz pierwszy.
02:28
and of coursekurs it's alsorównież the first time
44
136800
2176
02:31
that AmazonAmazon is even
doing something like this,
45
139000
2176
02:33
so RoyRoy PriceCena does not want
to take any chancesszanse.
46
141200
3336
Dlatego Roy Price nie chce
liczyć na łut szczęścia.
02:36
He wants to engineerinżynier successpowodzenie.
47
144560
2456
Woli zaplanować swój sukces.
02:39
He needswymagania a guaranteedgwarantowana successpowodzenie,
48
147040
1776
Musi go sobie zapewnić.
02:40
and so what he does is,
he holdstrzyma a competitionzawody.
49
148840
2576
W tym celu organizuje konkursy.
02:43
So he takes a bunchwiązka of ideaspomysły for TVTELEWIZOR showsprzedstawia,
50
151440
3136
Zbiera wiele pomysłów
02:46
and from those ideaspomysły,
throughprzez an evaluationoceny,
51
154600
2296
i na podstawie ich oceny
wybiera osiem seriali.
02:48
they selectWybierz eightosiem candidatesKandydaci for TVTELEWIZOR showsprzedstawia,
52
156920
4096
02:53
and then he just makesczyni the first episodeodcinek
of eachkażdy one of these showsprzedstawia
53
161040
3216
Dla każdego z nich tworzy pilota
02:56
and putsstawia them onlineonline for freewolny
for everyonekażdy to watch.
54
164280
3136
i udostępnia za darmo w Internecie.
02:59
And so when AmazonAmazon
is givingdający out freewolny stuffrzeczy,
55
167440
2256
A skoro Amazon daje coś za darmo,
to kto by nie skorzystał?
03:01
you're going to take it, right?
56
169720
1536
03:03
So millionsmiliony of viewerswidzów
are watchingoglądanie those episodesodcinki.
57
171280
5136
Miliony widzów oglądają te seriale,
03:08
What they don't realizerealizować is that,
while they're watchingoglądanie theirich showsprzedstawia,
58
176440
3216
ale nie zdają sobie sprawy,
że są wtedy obserwowani.
03:11
actuallytak właściwie, they are beingistota watchedoglądaliśmy.
59
179680
2296
03:14
They are beingistota watchedoglądaliśmy
by RoyRoy PriceCena and his teamzespół,
60
182000
2336
Roy Price i jego ludzie
nagrywają wszystko.
03:16
who recordrekord everything.
61
184360
1376
03:17
They recordrekord when somebodyktoś pressesprasy playgrać,
when somebodyktoś pressesprasy pausepauza,
62
185760
3376
Kiedy naciskamy start czy pauzę,
co opuszczamy, a co oglądamy ponownie.
03:21
what partsCzęści they skippominąć,
what partsCzęści they watch again.
63
189160
2536
03:23
So they collectzebrać millionsmiliony of datadane pointszwrotnica,
64
191720
2256
W ten sposób zbierają mnóstwo danych
potrzebnych przy wyborze serialu.
03:26
because they want
to have those datadane pointszwrotnica
65
194000
2096
03:28
to then decidedecydować się
whichktóry showpokazać they should make.
66
196120
2696
03:30
And sure enoughdość,
so they collectzebrać all the datadane,
67
198840
2176
Zbierają więc dane, analizują je
i dostają odpowiedź.
03:33
they do all the datadane crunchingskrzypienie,
and an answerodpowiedź emergeswyłania się,
68
201040
2576
03:35
and the answerodpowiedź is,
69
203640
1216
"Stwórzcie sitcom o czterech senatorach
z amerykańskiej Partii Republikańskiej".
03:36
"AmazonAmazon should do a sitcomsitcom
about fourcztery RepublicanRepublikański US SenatorsSenatorowie."
70
204880
5536
03:42
They did that showpokazać.
71
210440
1216
Tak też zrobili.
03:43
So does anyonektokolwiek know the nameNazwa of the showpokazać?
72
211680
2160
Ktoś wie, co to za serial?
Publiczność: "Alpha House".
03:46
(AudiencePubliczność: "AlphaAlpha HouseDom.")
73
214720
1296
Tak, "Alpha House".
03:48
Yes, "AlphaAlpha HouseDom,"
74
216040
1456
03:49
but it seemswydaje się like not too manywiele of you here
rememberZapamiętaj that showpokazać, actuallytak właściwie,
75
217520
4096
Odnoszę jednak wrażenie,
że niewielu z was zna ten serial.
03:53
because it didn't turnskręcać out that great.
76
221640
1856
A to dlatego, że nie był wybitny.
03:55
It's actuallytak właściwie just an averageśredni showpokazać,
77
223520
1856
Średni serial, nic specjalnego.
03:57
actuallytak właściwie -- literallydosłownie, in factfakt, because
the averageśredni of this curvekrzywa here is at 7.4,
78
225400
4576
Całkiem dosłownie "średni",
bo średnia na tym wykresie to 7,4,
04:02
and "AlphaAlpha HouseDom" landsziemie at 7.5,
79
230000
2416
a "Alpha House" ma 7,5.
04:04
so a slightlynieco abovepowyżej averageśredni showpokazać,
80
232440
2016
Tak więc trochę powyżej średniej.
04:06
but certainlyna pewno not what RoyRoy PriceCena
and his teamzespół were aimingcelem for.
81
234480
2920
Ale nie taki był cel
Roya Price'a i jego zespołu.
W tym samym czasie
prezesowi innej firmy się udało.
04:10
MeanwhileTymczasem, howeverjednak,
at about the samepodobnie time,
82
238320
2856
04:13
at anotherinne companyfirma,
83
241200
1576
04:14
anotherinne executivewykonawczy did managezarządzanie
to landwylądować a topTop showpokazać usingza pomocą datadane analysisanaliza,
84
242800
4216
Stworzył świetny serial
właśnie dzięki analizie danych
04:19
and his nameNazwa is TedTed,
85
247040
1576
Mowa o Tedzie Sarandosie,
dyrektorze programowym Netflixa.
04:20
TedTed SarandosSarandos, who is
the ChiefSzef ContentZawartość OfficerOficer of NetflixNetflix,
86
248640
3416
On również nieustannie szuka pomysłów
na jak najlepsze seriale.
04:24
and just like RoyRoy,
he's on a constantstały missionmisja
87
252080
2136
04:26
to find that great TVTELEWIZOR showpokazać,
88
254240
1496
04:27
and he usesużywa datadane as well to do that,
89
255760
2016
Również używa do tego analizy danych.
04:29
exceptz wyjątkiem he does it
a little bitkawałek differentlyróżnie.
90
257800
2015
Robi to jednak trochę inaczej.
04:31
So insteadzamiast of holdingtrzymać a competitionzawody,
what he did -- and his teamzespół of coursekurs --
91
259839
3737
Nie zrobił żadnego konkursu.
Zamiast tego przeanalizował z zespołem
dane na temat widzów Netflixa.
04:35
was they lookedspojrzał at all the datadane
they alreadyjuż had about NetflixNetflix viewerswidzów,
92
263600
3536
04:39
you know, the ratingsoceny
they give theirich showsprzedstawia,
93
267160
2096
Jak oceniają seriale, co oglądają.
04:41
the viewingoglądanie historieshistorie,
what showsprzedstawia people like, and so on.
94
269280
2696
04:44
And then they use that datadane to discoverodkryć
95
272000
1896
Na tej podstawie stworzyli profil widza:
04:45
all of these little bitsbity and piecessztuk
about the audiencepubliczność:
96
273920
2616
04:48
what kindsrodzaje of showsprzedstawia they like,
97
276560
1456
jakie seriale lubi,
jakich producentów, jakich aktorów.
04:50
what kinduprzejmy of producersproducentów,
what kinduprzejmy of actorsaktorzy.
98
278040
2096
04:52
And oncepewnego razu they had
all of these piecessztuk togetherRazem,
99
280160
2576
Zebrali to razem i zaryzykowali.
04:54
they tookwziął a leapskok of faithwiara,
100
282760
1656
Nie wypuścili sitcomu
o czterech senatorach,
04:56
and they decidedzdecydowany to licenselicencja
101
284440
2096
04:58
not a sitcomsitcom about fourcztery SenatorsSenatorowie
102
286560
2456
05:01
but a dramadramat seriesseria about a singlepojedynczy SenatorSenator.
103
289040
2880
tylko serial o jednym senatorze.
05:04
You guys know the showpokazać?
104
292760
1656
Znacie ten serial?
05:06
(LaughterŚmiech)
105
294440
1296
(Śmiech)
05:07
Yes, "HouseDom of CardsKarty," and NetflixNetflix
of coursekurs, nailedprzybity it with that showpokazać,
106
295760
3736
Tak, "House of Cards".
Netflix trafił tutaj w dziesiątkę.
05:11
at leastnajmniej for the first two seasonspory roku.
107
299520
2136
Przynajmniej z dwoma pierwszymi sezonami.
05:13
(LaughterŚmiech) (ApplauseAplauz)
108
301680
3976
(Śmiech) (Brawa)
05:17
"HouseDom of CardsKarty" getsdostaje
a 9.1 ratingOcena on this curvekrzywa,
109
305680
3176
Ocena "House of Cards" to 9,1,
05:20
so it's exactlydokładnie
where they wanted it to be.
110
308880
3176
więc dokładnie tak, jak miało być.
05:24
Now, the questionpytanie of coursekurs is,
what happenedstało się here?
111
312080
2416
Pytanie więc, skąd ta różnica.
05:26
So you have two very competitivekonkurencyjny,
data-savvydanych zrozumiały companiesfirmy.
112
314520
2656
Mamy dwie konkurencyjne firmy
zarządzające danymi.
05:29
They connectpołączyć all of these
millionsmiliony of datadane pointszwrotnica,
113
317200
2856
Łączą zebrane dane i dla jednej
wszystko działa jak należy,
05:32
and then it worksPrace
beautifullyestetycznie for one of them,
114
320080
2376
a dla drugiej nie bardzo.
05:34
and it doesn't work for the other one.
115
322480
1856
05:36
So why?
116
324360
1216
Dlaczego tak się dzieje?
05:37
Because logiclogika kinduprzejmy of tellsmówi you
that this should be workingpracujący all the time.
117
325600
3456
Wydaje się, że taka analiza
zawsze powinna działać.
05:41
I mean, if you're collectingzbieranie
millionsmiliony of datadane pointszwrotnica
118
329080
2456
W końcu mamy mnóstwo danych,
na podstawie których podejmujemy decyzję,
05:43
on a decisiondecyzja you're going to make,
119
331560
1736
więc raczej powinna to być dobra decyzja.
05:45
then you should be ablezdolny
to make a prettyładny good decisiondecyzja.
120
333320
2616
05:47
You have 200 yearslat
of statisticsStatystyka to relypolegać on.
121
335960
2216
Opieramy się na 200 latach statystyk.
05:50
You're amplifyingwzmacniający it
with very powerfulpotężny computerskomputery.
122
338200
3016
Do ich analizy wykorzystujemy
nowoczesne komputery.
05:53
The leastnajmniej you could expectoczekiwać
is good TVTELEWIZOR, right?
123
341240
3280
Mamy więc prawo oczekiwać,
że serial będzie dobry.
05:57
And if datadane analysisanaliza
does not work that way,
124
345880
2720
Jeśli analiza danych
nie działa w ten sposób,
06:01
then it actuallytak właściwie getsdostaje a little scarystraszny,
125
349520
2056
to zaczyna się robić strasznie,
06:03
because we liverelacja na żywo in a time
where we're turningobrócenie to datadane more and more
126
351600
3816
bo dziś na podstawie danych
podejmuje się bardzo ważne decyzje.
06:07
to make very seriouspoważny decisionsdecyzje
that go fardaleko beyondpoza TVTELEWIZOR.
127
355440
4480
Znacznie ważniejsze niż wybór serialu.
06:12
Does anyonektokolwiek here know the companyfirma
Multi-HealthZdrowia wielu SystemsSystemy?
128
360760
3240
Znacie Multi-Health Systems?
06:17
No one. OK, that's good actuallytak właściwie.
129
365080
1656
Nie? To dobrze.
06:18
OK, so Multi-HealthZdrowia wielu SystemsSystemy
is a softwareoprogramowanie companyfirma,
130
366760
3216
To firma zajmująca się oprogramowaniem.
06:22
and I hopenadzieja that nobodynikt here in this roompokój
131
370000
2816
Mam nadzieję, że nigdy
się z nim nie zetkniecie,
06:24
ever comespochodzi into contactkontakt
with that softwareoprogramowanie,
132
372840
3176
06:28
because if you do,
it meansznaczy you're in prisonwięzienie.
133
376040
2096
bo to by oznaczało,
że jesteście w więzieniu.
06:30
(LaughterŚmiech)
134
378160
1176
(Śmiech)
06:31
If someonektoś here in the US is in prisonwięzienie,
and they applyzastosować for paroleParole,
135
379360
3536
Jeśli więzień w Stanach
wnioskuje o zwolnienie warunkowe,
06:34
then it's very likelyprawdopodobne that
datadane analysisanaliza softwareoprogramowanie from that companyfirma
136
382920
4296
oprogramowanie tej firmy pozwala ocenić,
06:39
will be used in determiningokreślanie
whetherczy to grantdotacja that paroleParole.
137
387240
3616
czy je przyznać czy nie.
06:42
So it's the samepodobnie principlezasada
as AmazonAmazon and NetflixNetflix,
138
390880
2576
Zasada jest taka sama
jak dla Amazona czy Netflixa,
06:45
but now insteadzamiast of decidingdecydowanie whetherczy
a TVTELEWIZOR showpokazać is going to be good or badzły,
139
393480
4616
tylko tym razem nie chodzi o ocenę serialu
06:50
you're decidingdecydowanie whetherczy a personosoba
is going to be good or badzły.
140
398120
2896
tylko o ocenę więźnia.
06:53
And mediocremierny TVTELEWIZOR, 22 minutesminuty,
that can be prettyładny badzły,
141
401040
5496
Owszem, to żadna przyjemność
stracić 22 minuty na średni serial,
06:58
but more yearslat in prisonwięzienie,
I guessodgadnąć, even worsegorzej.
142
406560
2640
ale dodatkowe kilka lat w więzieniu
jest chyba jeszcze gorsze.
07:02
And unfortunatelyNiestety, there is actuallytak właściwie
some evidencedowód that this datadane analysisanaliza,
143
410360
4136
Niestety mamy dowody na to,
że analiza danych nie zawsze się sprawdza.
07:06
despitepomimo havingmający lots of datadane,
does not always produceprodukować optimumoptymalny resultswyniki.
144
414520
4216
Nawet jeśli mamy mnóstwo danych.
07:10
And that's not because a companyfirma
like Multi-HealthZdrowia wielu SystemsSystemy
145
418760
2722
Nie chodzi o to, że firmy
nie wiedzą, co zrobić z danymi.
07:13
doesn't know what to do with datadane.
146
421506
1627
07:15
Even the mostwiększość data-savvydanych zrozumiały
companiesfirmy get it wrongźle.
147
423158
2298
Nawet najlepsze firmy popełniają błędy.
07:17
Yes, even GoogleGoogle getsdostaje it wrongźle sometimesczasami.
148
425480
2400
Nawet Google nie jest nieomylny.
07:20
In 2009, GoogleGoogle announcedogłosił
that they were ablezdolny, with datadane analysisanaliza,
149
428680
4496
W 2009 roku Google ogłosił,
że może przewidzieć epidemie grypy.
07:25
to predictprzepowiadać, wywróżyć outbreaksepidemie of influenzagrypa,
the nastypaskudny kinduprzejmy of flugrypa,
150
433200
4136
Wystarczy przeanalizować
dane wyszukiwania.
07:29
by doing datadane analysisanaliza
on theirich GoogleGoogle searcheswyszukiwań.
151
437360
3776
07:33
And it workedpracował beautifullyestetycznie,
and it madezrobiony a bigduży splashpluśnięcie in the newsAktualności,
152
441160
3856
Wszystko szło świetnie,
rozpisywały się o tym gazety.
07:37
includingwłącznie z the pinnacleszczyt
of scientificnaukowy successpowodzenie:
153
445040
2136
Był również sukces naukowy
w postaci artykułu w tygodniku "Nature".
07:39
a publicationopublikowanie in the journaldziennik "NatureNatura."
154
447200
2456
07:41
It workedpracował beautifullyestetycznie
for yearrok after yearrok after yearrok,
155
449680
3616
Wszystko szło świetnie
przez rok, drugi, trzeci,
07:45
untilaż do one yearrok it failednie udało się.
156
453320
1656
aż jednego roku czar prysł.
07:47
And nobodynikt could even tell exactlydokładnie why.
157
455000
2256
I nikt właściwie nie wiedział dlaczego.
07:49
It just didn't work that yearrok,
158
457280
1696
Tego roku coś po prostu nie wyszło.
07:51
and of coursekurs that again madezrobiony bigduży newsAktualności,
159
459000
1936
O tym też rozpisywały się gazety.
07:52
includingwłącznie z now a retractionwycofanie
160
460960
1616
Pojawiło się też sprostowanie
artykułu w tygodniku "Nature".
07:54
of a publicationopublikowanie
from the journaldziennik "NatureNatura."
161
462600
2840
07:58
So even the mostwiększość data-savvydanych zrozumiały companiesfirmy,
AmazonAmazon and GoogleGoogle,
162
466480
3336
Czyli nawet Amazon
i Google popełniają błędy,
08:01
they sometimesczasami get it wrongźle.
163
469840
2136
a mimo porażek dane coraz częściej
wpływają na nasze decyzje,
08:04
And despitepomimo all those failuresawarie,
164
472000
2936
08:06
datadane is movingw ruchu rapidlyszybko
into real-lifeprawdziwe decision-makingpodejmowanie decyzji --
165
474960
3856
w pracy, w prawie czy w medycynie.
08:10
into the workplaceMiejsce pracy,
166
478840
1816
08:12
lawprawo enforcementegzekwowanie,
167
480680
1816
08:14
medicinelekarstwo.
168
482520
1200
08:16
So we should better make sure
that datadane is helpingporcja jedzenia.
169
484400
3336
Trzeba się upewnić,
że dane rzeczywiście pomagają.
08:19
Now, personallyosobiście I've seenwidziany
a lot of this struggleborykać się with datadane myselfsiebie,
170
487760
3136
Sam mam takie problemy z danymi.
08:22
because I work in computationalobliczeniowy geneticsgenetyka,
171
490920
1976
Zajmuję się genetyką komputerową,
08:24
whichktóry is alsorównież a fieldpole
where lots of very smartmądry people
172
492920
2496
gdzie mnóstwo mądrych ludzi
używa niesamowicie wiele danych
08:27
are usingza pomocą unimaginableniewyobrażalny amountskwoty of datadane
to make prettyładny seriouspoważny decisionsdecyzje
173
495440
3656
w podejmowaniu ważnych decyzji,
08:31
like decidingdecydowanie on a cancernowotwór therapyterapia
or developingrozwijanie a drugnarkotyk.
174
499120
3560
jak dobór chemioterapii
czy opracowanie leku.
08:35
And over the yearslat,
I've noticedzauważyłem a sortsortować of patternwzór
175
503520
2376
Przez lata zaobserwowałem pewien schemat.
08:37
or kinduprzejmy of rulereguła, if you will,
about the differenceróżnica
176
505920
2456
Pewną zależność między właściwym
i niewłaściwym podejmowaniem decyzji.
08:40
betweenpomiędzy successfuludany
decision-makingpodejmowanie decyzji with datadane
177
508400
2696
08:43
and unsuccessfulNieudane decision-makingpodejmowanie decyzji,
178
511120
1616
08:44
and I find this a patternwzór worthwartość sharingdzielenie się,
and it goesidzie something like this.
179
512760
3880
Chciałbym podzielić się z wami
moimi przemyśleniami.
08:50
So wheneverkiedy tylko you're
solvingrozwiązywanie a complexzłożony problemproblem,
180
518520
2135
Jeśli chcemy rozwiązać jakiś
złożony problem, robimy dwie rzeczy.
08:52
you're doing essentiallygłównie two things.
181
520679
1737
08:54
The first one is, you take that problemproblem
apartniezależnie into its bitsbity and piecessztuk
182
522440
3296
Najpierw rozkładamy go na części pierwsze,
żeby go dogłębnie przeanalizować.
08:57
so that you can deeplygłęboko analyzeanalizować
those bitsbity and piecessztuk,
183
525760
2496
09:00
and then of coursekurs
you do the seconddruga partczęść.
184
528280
2016
W drugiej części łączymy te części
z powrotem i wyciągamy wnioski.
09:02
You put all of these bitsbity and piecessztuk
back togetherRazem again
185
530320
2656
09:05
to come to your conclusionwniosek.
186
533000
1336
09:06
And sometimesczasami you
have to do it over again,
187
534360
2336
Czasami trzeba cały proces powtórzyć,
09:08
but it's always those two things:
188
536720
1656
ale zawsze chodzi o rozkładanie
i składanie części.
09:10
takingnabierający apartniezależnie and puttingwprowadzenie
back togetherRazem again.
189
538400
2320
09:14
And now the crucialistotny thing is
190
542280
1616
Co istotne - analiza danych
sprawdza się tylko na pierwszym etapie.
09:15
that datadane and datadane analysisanaliza
191
543920
2896
09:18
is only good for the first partczęść.
192
546840
2496
09:21
DataDanych and datadane analysisanaliza,
no mattermateria how powerfulpotężny,
193
549360
2216
Analiza danych pozwala jedynie zrozumieć
części składowe problemu.
09:23
can only help you takingnabierający a problemproblem apartniezależnie
and understandingzrozumienie its piecessztuk.
194
551600
4456
09:28
It's not suitedodpowiedni to put those piecessztuk
back togetherRazem again
195
556080
3496
Nie nadaje się do ich ponownego łączenia
ani do wyciągania wniosków.
09:31
and then to come to a conclusionwniosek.
196
559600
1896
09:33
There's anotherinne toolnarzędzie that can do that,
and we all have it,
197
561520
2736
Do tego służy inne narzędzie,
które ma każdy z nas.
09:36
and that toolnarzędzie is the brainmózg.
198
564280
1296
Tym narzędziem jest mózg.
09:37
If there's one thing a brainmózg is good at,
199
565600
1936
Mózg idealnie nadaje się do łączenia
części informacji, nawet niekompletnych,
09:39
it's takingnabierający bitsbity and piecessztuk
back togetherRazem again,
200
567560
2256
09:41
even when you have incompleteniekompletny informationInformacja,
201
569840
2016
i potem do wyciągania wniosków.
09:43
and comingprzyjście to a good conclusionwniosek,
202
571880
1576
09:45
especiallyszczególnie if it's the brainmózg of an expertekspert.
203
573480
2936
Zwłaszcza mózg eksperta.
09:48
And that's why I believe
that NetflixNetflix was so successfuludany,
204
576440
2656
To dlatego, moim zdaniem,
Netflixowi się udało.
09:51
because they used datadane and brainsmózg
where they belongnależeć in the processproces.
205
579120
3576
Wykorzystali dane
i mózg tak, jak należało.
09:54
They use datadane to first understandzrozumieć
lots of piecessztuk about theirich audiencepubliczność
206
582720
3536
Wykorzystali dane,
żeby zrozumieć preferencje widzów,
09:58
that they otherwisew przeciwnym razie wouldn'tnie have
been ablezdolny to understandzrozumieć at that depthgłębokość,
207
586280
3416
czego inaczej nie dałoby się
zrobić tak dogłębnie.
10:01
but then the decisiondecyzja
to take all these bitsbity and piecessztuk
208
589720
2616
Ale to nie dane zdecydowały
o stworzeniu "House of Cards".
10:04
and put them back togetherRazem again
and make a showpokazać like "HouseDom of CardsKarty,"
209
592360
3336
10:07
that was nowherenigdzie in the datadane.
210
595720
1416
Decyzję podjął Ted Sarandos z zespołem.
10:09
TedTed SarandosSarandos and his teamzespół
madezrobiony that decisiondecyzja to licenselicencja that showpokazać,
211
597160
3976
10:13
whichktóry alsorównież meantOznaczało, by the way,
that they were takingnabierający
212
601160
2381
Oczywiście to była ryzykowna decyzja.
10:15
a prettyładny bigduży personalosobisty riskryzyko
with that decisiondecyzja.
213
603565
2851
10:18
And AmazonAmazon, on the other handdłoń,
they did it the wrongźle way around.
214
606440
3016
Amazon natomiast postąpił inaczej.
Cały proces decyzyjny oparł na danych.
10:21
They used datadane all the way
to drivenapęd theirich decision-makingpodejmowanie decyzji,
215
609480
2736
Zarówno przy organizacji konkursu,
jak i wyborze "Alpha House".
10:24
first when they heldtrzymany
theirich competitionzawody of TVTELEWIZOR ideaspomysły,
216
612240
2416
10:26
then when they selectedwybrany "AlphaAlpha HouseDom"
to make as a showpokazać.
217
614680
3696
10:30
WhichCo of coursekurs was
a very safebezpieczny decisiondecyzja for them,
218
618400
2496
Oczywiście to było bezpieczne zagranie,
bo zawsze można było zrzucić winę na dane.
10:32
because they could always
pointpunkt at the datadane, sayingpowiedzenie,
219
620920
2456
10:35
"This is what the datadane tellsmówi us."
220
623400
1696
"Przecież tak wynikało z danych".
10:37
But it didn't leadprowadzić to the exceptionalwyjątkowy
resultswyniki that they were hopingmieć nadzieję for.
221
625120
4240
Nie dało to jednak świetnych wyników,
jakich się spodziewano.
10:42
So datadane is of coursekurs a massivelymasowo
usefulprzydatny toolnarzędzie to make better decisionsdecyzje,
222
630120
4976
Tak, dane są bardzo przydatnym narzędziem
przy podejmowaniu decyzji.
10:47
but I believe that things go wrongźle
223
635120
2376
Jeśli jednak decyzje opierają się
jedynie na danych, zaczynają się problemy.
10:49
when datadane is startingstartowy
to drivenapęd those decisionsdecyzje.
224
637520
2576
10:52
No mattermateria how powerfulpotężny,
datadane is just a toolnarzędzie,
225
640120
3776
Dane są tylko narzędziem,
nieważne jak potężnym.
10:55
and to keep that in mindumysł,
I find this deviceurządzenie here quitecałkiem usefulprzydatny.
226
643920
3336
Osobiście uważam,
że to urządzenie jest bardzo przydatne.
10:59
ManyWiele of you will ...
227
647280
1216
Wielu z was...
11:00
(LaughterŚmiech)
228
648520
1216
(Śmiech)
11:01
Before there was datadane,
229
649760
1216
Zanim pojawiły się dane.
11:03
this was the decision-makingpodejmowanie decyzji
deviceurządzenie to use.
230
651000
2856
tym urządzeniem podejmowano decyzje,
11:05
(LaughterŚmiech)
231
653880
1256
(Śmiech)
11:07
ManyWiele of you will know this.
232
655160
1336
Wielu z was wie, co to jest.
11:08
This toyzabawka here is callednazywa the MagicMagia 8 BallPiłka,
233
656520
1953
Ta zabawka to Magic 8 Ball.
11:10
and it's really amazingniesamowity,
234
658497
1199
Jest niesamowita.
11:11
because if you have a decisiondecyzja to make,
a yes or no questionpytanie,
235
659720
2896
Jeśli mamy zdecydować na tak lub na nie,
11:14
all you have to do is you shakepotrząsnąć the ballpiłka,
and then you get an answerodpowiedź --
236
662640
3736
wystarczy nią potrząsnąć
i od razu dostajemy odpowiedź.
11:18
"MostWiększość LikelyPrawdopodobnie" -- right here
in this windowokno in realreal time.
237
666400
2816
W tym wypadku "Bardzo prawdopodobne".
11:21
I'll have it out laterpóźniej for techtech demosdema.
238
669240
2096
Dam wam ją później przetestować.
11:23
(LaughterŚmiech)
239
671360
1216
(Śmiech)
11:24
Now, the thing is, of coursekurs --
so I've madezrobiony some decisionsdecyzje in my life
240
672600
3576
Podjąłem w życiu kilka decyzji,
11:28
where, in hindsightperspektywy czasu,
I should have just listenedsłuchałem to the ballpiłka.
241
676200
2896
które, z perspektywy czasu,
mogłem zostawić kuli.
11:31
But, you know, of coursekurs,
if you have the datadane availabledostępny,
242
679120
3336
Ale jest tak, że jak już mamy dane,
to chcemy użyć czegoś bardziej złożonego,
11:34
you want to replacezastąpić this with something
much more sophisticatedwyrafinowany,
243
682480
3056
11:37
like datadane analysisanaliza
to come to a better decisiondecyzja.
244
685560
3616
żeby podjąć lepszą decyzję.
11:41
But that does not changezmiana the basicpodstawowy setupinstalacji.
245
689200
2616
Z tym że schemat pozostaje ten sam.
11:43
So the ballpiłka maymoże get smartermądrzejszy
and smartermądrzejszy and smartermądrzejszy,
246
691840
3176
Kula może stawać się coraz lepsza,
ale to my powinniśmy podjąć decyzję.
11:47
but I believe it's still on us
to make the decisionsdecyzje
247
695040
2816
11:49
if we want to achieveosiągać
something extraordinaryniezwykły,
248
697880
3016
Tylko wtedy powstanie coś wyjątkowego,
co znajdzie się po prawej stronie.
11:52
on the right endkoniec of the curvekrzywa.
249
700920
1936
11:54
And I find that a very encouragingzachęcający
messagewiadomość, in factfakt,
250
702880
4496
To bardzo pocieszające,
11:59
that even in the facetwarz
of hugeolbrzymi amountskwoty of datadane,
251
707400
3976
że mimo takiego natłoku danych,
12:03
it still payspłaci off to make decisionsdecyzje,
252
711400
4096
nadal warto podejmować decyzje,
być ekspertem i podejmować ryzyko.
12:07
to be an expertekspert in what you're doing
253
715520
2656
12:10
and take risksryzyko.
254
718200
2096
12:12
Because in the endkoniec, it's not datadane,
255
720320
2776
Koniec końców to ryzyko pozwala nam
znaleźć się po prawej stronie, a nie dane.
12:15
it's risksryzyko that will landwylądować you
on the right endkoniec of the curvekrzywa.
256
723120
3960
12:19
Thank you.
257
727840
1216
Dziękuję.
12:21
(ApplauseAplauz)
258
729080
3680
(Brawa)
Translated by Krzysztof Łuczak
Reviewed by Rysia Wand

▲Back to top

ABOUT THE SPEAKER
Sebastian Wernicke - Data scientist
After making a splash in the field of bioinformatics, Sebastian Wernicke moved on to the corporate sphere, where he motivates and manages multidimensional projects.

Why you should listen

Dr. Sebastian Wernicke is the Chief Data Scientist of ONE LOGIC, a data science boutique that supports organizations across industries to make sense of their vast data collections to improve operations and gain strategic advantages. Wernicke originally studied bioinformatics and previously led the strategy and growth of Seven Bridges Genomics, a Cambridge-based startup that builds platforms for genetic analysis.

Before his career in statistics began, Wernicke worked stints as both a paramedic and successful short animated filmmaker. He's also the author of the TEDPad app, an irreverent tool for creating an infinite number of "amazing and really bad" and mostly completely meaningless talks. He's the author of the statistically authoritative and yet completely ridiculous "How to Give the Perfect TEDTalk."

More profile about the speaker
Sebastian Wernicke | Speaker | TED.com