ABOUT THE SPEAKER
Sebastian Wernicke - Data scientist
After making a splash in the field of bioinformatics, Sebastian Wernicke moved on to the corporate sphere, where he motivates and manages multidimensional projects.

Why you should listen

Dr. Sebastian Wernicke is the Chief Data Scientist of ONE LOGIC, a data science boutique that supports organizations across industries to make sense of their vast data collections to improve operations and gain strategic advantages. Wernicke originally studied bioinformatics and previously led the strategy and growth of Seven Bridges Genomics, a Cambridge-based startup that builds platforms for genetic analysis.

Before his career in statistics began, Wernicke worked stints as both a paramedic and successful short animated filmmaker. He's also the author of the TEDPad app, an irreverent tool for creating an infinite number of "amazing and really bad" and mostly completely meaningless talks. He's the author of the statistically authoritative and yet completely ridiculous "How to Give the Perfect TEDTalk."

More profile about the speaker
Sebastian Wernicke | Speaker | TED.com
TED2010

Sebastian Wernicke: Lies, damned lies and statistics (about TEDTalks)

Leugens, verdomde leugens en statistiek (over TEDTalks)

Filmed:
2,510,120 views

In een briljante en ironische analyse past Sebastian Wernicke de instrumenten van de statistische analyse toe op TEDTalks. Hij laat zien hoe, op basis van beoordelingen van kijkers, 'de optimale TEDTalk' gemaakt kan worden. Hoe beoordeelt u het? 'Verbazingwekkend'? 'Overtuigend'? Of gewoon 'Grappig'?
- Data scientist
After making a splash in the field of bioinformatics, Sebastian Wernicke moved on to the corporate sphere, where he motivates and manages multidimensional projects. Full bio

Double-click the English transcript below to play the video.

00:16
If you go on the TEDTED websitewebsite,
0
1000
3000
Als je de TED-website bezoekt,
00:19
you can currentlymomenteel find there
1
4000
2000
kun je daar op dit moment
00:21
over a fullvol weekweek of TEDTalkTEDTalk videosvideos,
2
6000
3000
meer dan een week aan TEDTalk video's vinden,
00:24
over 1.3 millionmiljoen
3
9000
2000
meer dan 1,3 miljoen
00:26
wordstekst of transcriptsTranscripten
4
11000
2000
woorden in transcripties
00:28
and millionsmiljoenen of usergebruiker ratingsratings.
5
13000
2000
en miljoenen waarderingen door gebruikers.
00:30
And that's a hugereusachtig amountbedrag of datagegevens.
6
15000
3000
Dat is een enorme hoeveelheid data.
00:33
And it got me wonderingafvragen:
7
18000
2000
Ik moest daardoor denken aan het volgende:
00:35
If you tooknam all this datagegevens
8
20000
2000
als je al deze data verzamelt
00:37
and put it throughdoor statisticalstatistisch analysisanalyse,
9
22000
2000
en er statistische analyse op loslaat,
00:39
could you reverseomgekeerde engineeringenieur a TEDTalkTEDTalk?
10
24000
2000
zou je daar dan een TEDTalk uit kunnen maken?
00:41
Could you createcreëren
11
26000
2000
Zou je de
00:43
the ultimateultiem TEDTalkTEDTalk?
12
28000
2000
ultieme TEDTalk kunnen creëren?
00:45
(LaughterGelach) (ApplauseApplaus)
13
30000
2000
(Applaus)
00:47
And alsoook, could you createcreëren
14
32000
2000
Zou je ook de
00:49
the worstslechtst possiblemogelijk TEDTalkTEDTalk
15
34000
2000
slechts mogelijke TEDtalk kunnen creëren
00:51
that they would still let you get away with?
16
36000
2000
waarmee ze je nog zouden laten wegkomen?
00:53
To find this out, I lookedkeek at threedrie things:
17
38000
2000
Om dit uit te zoeken, heb ik gekeken naar drie dingen.
00:55
I lookedkeek at the topiconderwerp that you should chooseKiezen,
18
40000
2000
Ik heb gekeken naar het onderwerp dat je zou moeten kiezen.
00:57
I lookedkeek at how you should deliverleveren it
19
42000
3000
Ik heb gekeken naar hoe je het moet brengen
01:00
and the visualsvisuals onstageop het podium.
20
45000
2000
en naar de zichtbare dingen op het podium.
01:02
Now, with the topiconderwerp: There's a wholegeheel rangereeks of topicstopics you can chooseKiezen,
21
47000
3000
Welnu, met dit onderwerp -- er is een hele reeks van onderwerpen waar je uit kan kiezen,
01:05
but you should chooseKiezen wiselyverstandig,
22
50000
2000
maar de keuze moet je met overleg maken
01:07
because your topiconderwerp stronglysterk correlatescorrelaties
23
52000
2000
omdat je onderwerp sterk correleert
01:09
with how usersgebruikers will reactReageer to your talk.
24
54000
3000
met de reacties van de gebruikers op je verhaal.
01:12
Now, to make this more concretebeton,
25
57000
2000
Laten we, om dit meer concreet te maken,
01:14
let's look at the listlijst of toptop 10 wordstekst
26
59000
3000
eens kijken naar de lijst met de top tien van woorden
01:17
that statisticallystatistisch stickstok out
27
62000
2000
die statistisch opvallen
01:19
in the mostmeest favoritefavoriete TEDTalksTEDTalks
28
64000
2000
in de meest favoriete TEDTalks
01:21
and in the leastminst favoritefavoriete TEDTalksTEDTalks.
29
66000
3000
en in de minst favoriete TEDTalks.
01:24
So if you camekwam here
30
69000
2000
Als je hier gekomen bent
01:26
to talk about how FrenchFrans coffeekoffie
31
71000
2000
om te praten over hoe Franse koffie
01:28
will spreadverspreiding happinessgeluk in our brainshersenen,
32
73000
3000
geluk zal verspreiden in je hersenen,
01:31
that's a go.
33
76000
2000
dan zit je goed.
01:33
(LaughterGelach) (ApplauseApplaus)
34
78000
2000
(Gelach) (Applaus)
01:35
WhereasOverwegende dat, if you wanted to talk about
35
80000
2000
Als je echter wilde praten over
01:37
your projectproject involvingerbij betrekken
36
82000
2000
je project met
01:39
oxygenzuurstof, girlsmeisjes, aircraftvliegtuig --
37
84000
2000
zuurstof, meisjes, vliegtuigen --
01:41
actuallywerkelijk, I would like to hearhoren that talk, (LaughterGelach)
38
86000
2000
eigenlijk zou ik dat praatje graag willen horen,
01:43
but statisticsstatistieken say it's not so good.
39
88000
2000
maar de statistiek zegt dat het niet zo goed is.
01:45
Oh, well.
40
90000
2000
Ach, nou ja.
01:47
If you generalizegeneraliseren this,
41
92000
2000
Als je dit generaliseert,
01:49
the mostmeest favoritefavoriete TEDTalksTEDTalks are those
42
94000
2000
dan zijn de meest favoriete TEDTalks deze
01:51
that featurekenmerk topicstopics we can connectaansluiten with,
43
96000
3000
die onderwerpen behandelen waar we ons mee kunnen verbinden,
01:54
bothbeide easilygemakkelijk and deeplydiep,
44
99000
2000
zowel gemakkelijk als diep
01:56
suchzodanig as happinessgeluk, our owneigen bodylichaam,
45
101000
2000
zoals geluk, ons eigen lichaam,
01:58
foodeten, emotionsemoties.
46
103000
2000
voedsel, emoties.
02:00
And the more technicaltechnisch topicstopics,
47
105000
2000
De meer technische onderwerpen,
02:02
suchzodanig as architecturearchitectuur, materialsmaterialen and, strangelyvreemd enoughgenoeg, menmannen,
48
107000
3000
zoals architectuur, materialen en, raar genoeg, mannen,
02:05
those are not good topicstopics to talk about.
49
110000
3000
dat zijn geen goede onderwerpen om over te praten.
02:08
How should you deliverleveren your talk?
50
113000
2000
Hoe moet je je praatje brengen?
02:10
TEDTED is famousberoemd for keepingbewaring
51
115000
2000
TED is beroemd om het
02:12
a very sharpscherp eyeoog on the clockklok,
52
117000
2000
strikt omgaan met de tijd.
02:14
so they're going to hatehaat me
53
119000
2000
Dus gaan ze me haten
02:16
for revealingonthullende this, because, actuallywerkelijk,
54
121000
2000
dat ik dit onthul, omdat je eigenlijk
02:18
you should talk as long as they will let you. (LaughterGelach)
55
123000
2000
zo lang moet praten als ze je toelaten,
02:20
Because the mostmeest favoritefavoriete TEDTalksTEDTalks
56
125000
3000
omdat de meest favoriete TEDTalks
02:23
are, on averagegemiddelde, over 50 percentprocent longerlanger
57
128000
2000
gemiddeld meer dan 50 procent langer zijn
02:25
than the leastminst favoritefavoriete onesdegenen.
58
130000
2000
dan de minst favoriete.
02:28
And this holdshoudt truewaar for all rankingranking listslijsten on TEDTED.comcom
59
133000
2000
Dit geldt voor alle lijsten met waarderingen op TED.com
02:30
exceptbehalve if you want to have a talk
60
135000
2000
behalve als je een praatje wil houden
02:32
that's beautifulmooi, inspiringinspirerende or funnygrappig.
61
137000
2000
dat mooi, inspirerend of grappig is.
02:34
Then, you should be briefkort. (LaughterGelach) But other than that,
62
139000
2000
Dan moet je het kort houden. Maar voor de rest,
02:36
talk untiltot they dragslepen you off the stagestadium.
63
141000
3000
spreek tot ze je van het podium slepen.
02:39
(LaughterGelach)
64
144000
2000
(Gelach)
02:41
Now, while ...
65
146000
2000
Welnu, als --
02:43
(ApplauseApplaus)
66
148000
6000
(Applaus)
02:49
While you're pushingduwen the clockklok, there's a fewweinig rulesreglement to obeygehoorzamen.
67
154000
3000
Als je op de tijd moet letten zijn er een paar belangrijke regels.
02:52
I foundgevonden these rulesreglement out by comparingvergelijken the statisticsstatistieken
68
157000
2000
Ik heb deze regels gevonden door vergelijking van de statistiek
02:54
of four-wordvier woorden phraseszinnen
69
159000
2000
van zinnen van vier woorden
02:56
that appearverschijnen more oftenvaak in the mostmeest favoritefavoriete TEDTalksTEDTalks
70
161000
3000
die vaker voorkomen in de meest favoriete TEDTalks,
02:59
as opposedgekant tegen to the leastminst favoritefavoriete TEDTalksTEDTalks.
71
164000
2000
in tegenstelling tot de minst favoriete TEDTalks.
03:01
I'll give you threedrie examplesvoorbeelden.
72
166000
2000
Ik zal je drie voorbeelden geven.
03:03
First of all, I mustmoet, as a speakerspreker,
73
168000
2000
Ten eerste moet ik als spreker
03:05
providevoorzien a serviceservice to the audiencepubliek and talk about what I will give you,
74
170000
3000
een dienst aan het publiek leveren en praten over dat wat ik jullie wil geven,
03:08
insteadin plaats daarvan of sayinggezegde what I can't have.
75
173000
2000
in plaats van zeggen wat ik niet kan krijgen.
03:10
SecondlyTen tweede, it's imperativegebiedende wijs
76
175000
2000
Ten tweede is het van vitaal belang
03:12
that you do not citeciteren The NewNieuw YorkYork TimesTijden.
77
177000
2000
dat je de New York Times niet citeert.
03:14
(LaughterGelach)
78
179000
2000
(Gelach)
03:16
And finallyTenslotte, it's okay for the speakerspreker -- that's the good newsnieuws --
79
181000
3000
Als laatste is het toegestaan voor de spreker -- dat is het goede nieuws --
03:19
to fakenep intellectualintellectueel capacitycapaciteit.
80
184000
2000
om intellectuele capaciteit te veinzen.
03:21
If I don't understandbegrijpen something, I can just say, "etcenz., etcenz."
81
186000
3000
Als ik iets niet begrijp kan ik gewoon "et cetera, et cetera" zeggen.
03:24
You'llU zult all stayverblijf with me.
82
189000
2000
Je zal mij allemaal blijven volgen.
03:26
It's perfectlyvolmaakt fine.
83
191000
2000
Er is niets aan de hand.
03:28
(ApplauseApplaus)
84
193000
4000
(Applaus)
03:32
Now, let's go to the visualsvisuals.
85
197000
2000
Laten we nu kijken naar het visuele aspect.
03:34
The mostmeest obviousduidelijk visualzichtbaar thing on stagestadium is the speakerspreker.
86
199000
3000
Het meest duidelijke visuele ding op het podium is de spreker.
03:37
And analysisanalyse showsshows if you want to be
87
202000
2000
De analyse laat zien dat, als je bij
03:39
amongtussen the mostmeest favoritefavoriete TEDTED speakersspeakers,
88
204000
2000
de meest favoriete TED-sprekers wil horen,
03:41
you should let your hairhaar- growgroeien a little bitbeetje longerlanger than averagegemiddelde,
89
206000
3000
je je haar iets langer dan gemiddeld moet laten groeien,
03:44
make sure you wearslijtage your glassesbril and be slightlylicht more dressed-upgekleed-up
90
209000
3000
moet zorgen dat je een bril draagt en dat je iets beter gekleed bent
03:47
than the averagegemiddelde TEDTED speakerspreker.
91
212000
2000
dan de gemiddelde TED-spreker.
03:49
SlidesDia 's are okay, thoughhoewel you mightmacht consideroverwegen going for propsrekwisieten.
92
214000
3000
Dia's zijn oké, hoewel je zou kunnen overwegen voor rekwisieten te gaan.
03:52
And now the mostmeest importantbelangrijk thing,
93
217000
2000
En nu het belangrijkste:
03:54
that is the moodhumeur onstageop het podium.
94
219000
2000
de sfeer op het podium.
03:56
ColorKleur playstoneelstukken a very importantbelangrijk rolerol.
95
221000
2000
Kleur speelt een heel belangrijke rol.
03:58
ColorKleur closelyvan nabij correlatescorrelaties
96
223000
2000
Kleur correleert sterk
04:00
with the ratingsratings that talksgesprekken get on the websitewebsite.
97
225000
3000
met de waardering die praatjes krijgen op de website.
04:03
(ApplauseApplaus)
98
228000
2000
(Applaus)
04:05
For examplevoorbeeld, fascinatingfascinerend talksgesprekken
99
230000
2000
Bijvoorbeeld: fascinerende praatjes
04:07
containbevatten a statisticallystatistisch highhoog amountbedrag
100
232000
2000
bevatten een statistisch hoge hoeveelheid
04:09
of exactlyprecies this blueblauw colorkleur, (LaughterGelach)
101
234000
2000
van precies deze blauwe kleur,
04:11
much more than the averagegemiddelde TEDTalkTEDTalk.
102
236000
2000
veel meer dan de gemiddelde TEDTalk.
04:13
IngeniousIngenieuze TEDTalksTEDTalks, much more this greengroen colorkleur,
103
238000
2000
Ingenieuze praatjes, veel meer deze groene kleur,
04:15
etcenz., etet.
104
240000
2000
et cetera, et cetera.
04:17
(LaughterGelach) (ApplauseApplaus)
105
242000
7000
(Applaus)
04:24
Now, personallypersoonlijk, I think
106
249000
2000
Welnu, persoonlijk denk ik
04:26
I'm not the first one who has donegedaan this analysisanalyse,
107
251000
2000
dat ik niet de eerste ben die deze analyse gedaan heeft,
04:28
but I'll leavehet verlof this
108
253000
2000
maar dat laat ik
04:30
to your good judgmentoordeel.
109
255000
3000
over aan jullie gezond verstand.
04:33
So, now it's time to put it all togethersamen
110
258000
2000
Dus nu is het tijd om alles samen te voegen
04:35
and designontwerp the ultimateultiem TEDTalkTEDTalk.
111
260000
2000
en de ultieme TEDTalk te maken.
04:37
Now, sincesinds this is TEDActiveTEDActive,
112
262000
2000
Omdat dit TED Active is
04:39
and I learnedgeleerd from my analysisanalyse
113
264000
2000
en ik geleerd heb van mijn analyse
04:41
that I should actuallywerkelijk give you something,
114
266000
2000
dat ik jullie echt iets moet geven,
04:43
I will not imposeleggen the ultimateultiem
115
268000
2000
ik zal jullie niet de ultieme
04:45
or worstslechtst TEDTalkTEDTalk on you,
116
270000
2000
of slechtste TEDTalk opleggen,
04:47
but ratherliever give you a toolgereedschap to createcreëren your owneigen.
117
272000
2000
maar ik geef jullie het gereedschap om er zelf een te maken.
04:49
And I call this toolgereedschap the TEDPadTEDPad.
118
274000
3000
Ik noem dit gereedschap de TEDPad.
04:52
(LaughterGelach)
119
277000
3000
(Gelach)
04:55
And the TEDPadTEDPad is a matrixmatrix
120
280000
2000
En de TEDPad is een matrix
04:57
of 100 specificallyspecifiek selectedgekozen,
121
282000
2000
van 100 specifiek geselecteerde,
04:59
highlyzeer curatedcurator sentenceszinnen
122
284000
3000
zeer dubieuze zinnen
05:02
that you can easilygemakkelijk piecestuk togethersamen to get your owneigen TEDTalkTEDTalk.
123
287000
3000
die je makkelijk samen kan voegen om je eigen TEDTalk te maken.
05:07
You only have to make one decisionbesluit,
124
292000
2000
Je hoeft maar één beslissing te nemen
05:09
and that is: Are you going to use the whitewit versionversie
125
294000
2000
en dat is: ga je de witte versie gebruiken
05:11
for very good TEDTalksTEDTalks,
126
296000
2000
voor zeer goede TEDTalks,
05:13
about creativitycreativiteit, humanmenselijk geniusgenie?
127
298000
2000
over creativiteit, het menselijke genie?
05:15
Or are you going to go with a blackzwart versionversie,
128
300000
2000
Of kies je de zwarte versie,
05:17
whichwelke will allowtoestaan you to createcreëren really badslecht TEDTalksTEDTalks,
129
302000
2000
waarmee je een heel slechte TEDTalk kunt maken,
05:19
mostlymeestal about blogsblogs,
130
304000
2000
voornamelijk over blogs
05:21
politicspolitiek and stuffspul?
131
306000
2000
en politiek en zo?
05:23
So, downloaddownloaden it and have funpret with it.
132
308000
2000
Download het en vermaak je er mee.
05:25
Now I hopehoop you enjoygenieten the sessionsessie.
133
310000
3000
Ik hoop dat je genoten hebt van deze sessie.
05:28
I hopehoop you enjoygenieten designingontwerpen your owneigen
134
313000
2000
Ik hoop dat je plezier hebt in het maken van je eigen
05:30
ultimateultiem and worstslechtst possiblemogelijk TEDTalksTEDTalks.
135
315000
2000
ultieme en slechtst mogelijke TEDTalk.
05:32
And I hopehoop some of you will be inspiredgeinspireerd for nextvolgende yearjaar
136
317000
3000
Ik hoop dat sommigen van jullie zich zullen laten inspireren voor het komende jaar
05:35
to createcreëren this, whichwelke I really want to see.
137
320000
3000
om deze te maken. Dat wil ik echt zien.
05:38
Thank you very much.
138
323000
2000
Dank je wel.
05:40
(ApplauseApplaus) ThanksBedankt.
139
325000
10000
(Applaus)
Translated by Aryan de Jong
Reviewed by Sebastiaan Willemsen

▲Back to top

ABOUT THE SPEAKER
Sebastian Wernicke - Data scientist
After making a splash in the field of bioinformatics, Sebastian Wernicke moved on to the corporate sphere, where he motivates and manages multidimensional projects.

Why you should listen

Dr. Sebastian Wernicke is the Chief Data Scientist of ONE LOGIC, a data science boutique that supports organizations across industries to make sense of their vast data collections to improve operations and gain strategic advantages. Wernicke originally studied bioinformatics and previously led the strategy and growth of Seven Bridges Genomics, a Cambridge-based startup that builds platforms for genetic analysis.

Before his career in statistics began, Wernicke worked stints as both a paramedic and successful short animated filmmaker. He's also the author of the TEDPad app, an irreverent tool for creating an infinite number of "amazing and really bad" and mostly completely meaningless talks. He's the author of the statistically authoritative and yet completely ridiculous "How to Give the Perfect TEDTalk."

More profile about the speaker
Sebastian Wernicke | Speaker | TED.com