ABOUT THE SPEAKER
Sebastian Wernicke - Data scientist
After making a splash in the field of bioinformatics, Sebastian Wernicke moved on to the corporate sphere, where he motivates and manages multidimensional projects.

Why you should listen

Dr. Sebastian Wernicke is the Chief Data Scientist of ONE LOGIC, a data science boutique that supports organizations across industries to make sense of their vast data collections to improve operations and gain strategic advantages. Wernicke originally studied bioinformatics and previously led the strategy and growth of Seven Bridges Genomics, a Cambridge-based startup that builds platforms for genetic analysis.

Before his career in statistics began, Wernicke worked stints as both a paramedic and successful short animated filmmaker. He's also the author of the TEDPad app, an irreverent tool for creating an infinite number of "amazing and really bad" and mostly completely meaningless talks. He's the author of the statistically authoritative and yet completely ridiculous "How to Give the Perfect TEDTalk."

More profile about the speaker
Sebastian Wernicke | Speaker | TED.com
TED2010

Sebastian Wernicke: Lies, damned lies and statistics (about TEDTalks)

TEDTalksにまつわる真っ赤な嘘と統計の話

Filmed:
2,510,120 views

素晴しく皮肉の効いた分析により、セバスチャン・ワーニックがTEDTalkを統計分析というツールにかけ、ユーザ評価に基づいた「最適なTEDTalk」を作るための基準を編み出しています。この講演をどのように評価されますか? 「びっくり」? 「説得力なし」? それとも、ただただ「可笑しい」?
- Data scientist
After making a splash in the field of bioinformatics, Sebastian Wernicke moved on to the corporate sphere, where he motivates and manages multidimensional projects. Full bio

Double-click the English transcript below to play the video.

00:16
If you go on the TEDTED websiteウェブサイト,
0
1000
3000
もし今TEDのホームページに行くと
00:19
you can currently現在 find there
1
4000
2000
延べ1週間を越えるビデオがあり
00:21
over a full満員 week週間 of TEDTalkTEDTalk videosビデオ,
2
6000
3000
130万語に上る
00:24
over 1.3 million百万
3
9000
2000
文字起こしデータと
00:26
words言葉 of transcripts転写物
4
11000
2000
何百万という
00:28
and millions何百万 of userユーザー ratings評価.
5
13000
2000
ユーザー評価を見られます
00:30
And that's a huge巨大 amount of dataデータ.
6
15000
3000
実に莫大な量のデータです
00:33
And it got me wondering不思議:
7
18000
2000
それを見てこう思いました
00:35
If you took取った all this dataデータ
8
20000
2000
「もしこのデータ全てを
00:37
and put it throughを通して statistical統計的 analysis分析,
9
22000
2000
統計分析にかければ TEDTalkを
00:39
could you reverse engineerエンジニア a TEDTalkTEDTalk?
10
24000
2000
リバースエンジニアリングして
00:41
Could you create作成する
11
26000
2000
究極のTEDTalkを
00:43
the ultimate究極 TEDTalkTEDTalk?
12
28000
2000
作れるかも」
00:45
(Laughter笑い) (Applause拍手)
13
30000
2000
(拍手)
00:47
And alsoまた、, could you create作成する
14
32000
2000
「それにまた
00:49
the worst最悪 possible可能 TEDTalkTEDTalk
15
34000
2000
大目に見てもらえる
00:51
that they would still let you get away with?
16
36000
2000
最低のTEDTalkも」
00:53
To find this out, I looked見た at three things:
17
38000
2000
これを確かめるべく 3つの点に着目しました
00:55
I looked見た at the topicトピック that you should choose選択する,
18
40000
2000
選ぶべき題材
00:57
I looked見た at how you should deliver配信する it
19
42000
3000
講演のやり方
01:00
and the visualsビジュアル onstageステージ上.
20
45000
2000
舞台上での見た目です
01:02
Now, with the topicトピック: There's a whole全体 range範囲 of topicsトピック you can choose選択する,
21
47000
3000
さて 選べる題材は多岐にわたりますが
01:05
but you should choose選択する wisely賢く,
22
50000
2000
賢く選択しなくてはいけません
01:07
because your topicトピック strongly強く correlates相関する
23
52000
2000
題材はユーザーの反応と
01:09
with how usersユーザー will react反応する to your talk.
24
54000
3000
密接な関係があるからです
01:12
Now, to make this more concreteコンクリート,
25
57000
2000
話をより具体的にするため
01:14
let's look at the listリスト of top 10 words言葉
26
59000
3000
統計的にみて
01:17
that statistically統計的に stickスティック out
27
62000
2000
最も好まれるTalkと
01:19
in the most最も favoriteお気に入り TEDTalksTEDTalks
28
64000
2000
最も好まれないTalkに
01:21
and in the least少なくとも favoriteお気に入り TEDTalksTEDTalks.
29
66000
3000
よく見られる10個の言葉を拾い上げてみました
01:24
So if you came来た here
30
69000
2000
TEDでは
01:26
to talk about how Frenchフランス語 coffeeコーヒー
31
71000
2000
「フレンチ」「コーヒー」が
01:28
will spread普及 happiness幸福 in our brains頭脳,
32
73000
3000
「あなたの」「脳」にもたらす「幸福感」について
01:31
that's a go.
33
76000
2000
話をすれば 成功間違いなしです
01:33
(Laughter笑い) (Applause拍手)
34
78000
2000
(拍手)
01:35
Whereasそれに対して, if you wanted to talk about
35
80000
2000
一方で 「酸素」「女の子」
01:37
your projectプロジェクト involving関与する
36
82000
2000
「飛行機」が関わる
01:39
oxygen酸素, girls女の子, aircraft航空機 --
37
84000
2000
プロジェクトの話をするつもりなら
01:41
actually実際に, I would like to hear聞く that talk, (Laughter笑い)
38
86000
2000
個人的には聞いてみたいですが
01:43
but statistics統計 say it's not so good.
39
88000
2000
統計的にはうまくいきません
01:45
Oh, well.
40
90000
2000
そして
01:47
If you generalize一般化する this,
41
92000
2000
これをもっと一般化すると
01:49
the most最も favoriteお気に入り TEDTalksTEDTalks are those
42
94000
2000
最も好まれるTEDTalkは
01:51
that feature特徴 topicsトピック we can connect接続する with,
43
96000
3000
私たちが容易に自分と深く
01:54
bothどちらも easily簡単に and deeply深く,
44
99000
2000
関係づけられるもの
01:56
suchそのような as happiness幸福, our own自分の body,
45
101000
2000
「幸福」「体のこと」「食べ物」
01:58
foodフード, emotions感情.
46
103000
2000
「感情」などの話題です
02:00
And the more technicalテクニカル topicsトピック,
47
105000
2000
もっと専門性の高い話題
02:02
suchそのような as architecture建築, materials材料 and, strangely妙に enough十分な, men男性,
48
107000
3000
「建築」「素材」 それと面白いことに「男」なんかは
02:05
those are not good topicsトピック to talk about.
49
110000
3000
TEDではウケません
02:08
How should you deliver配信する your talk?
50
113000
2000
次にどのように講演を行うかですが
02:10
TEDTED is famous有名な for keeping維持
51
115000
2000
TEDが時間にうるさいことは
02:12
a very sharpシャープ eye on the clockクロック,
52
117000
2000
よく知られています
02:14
so they're going to hate嫌い me
53
119000
2000
だからこのことをお教えすると
02:16
for revealing明らかにする this, because, actually実際に,
54
121000
2000
嫌な顔をされると思いますが
02:18
you should talk as long as they will let you. (Laughter笑い)
55
123000
2000
可能な限り長く話してください
02:20
Because the most最も favoriteお気に入り TEDTalksTEDTalks
56
125000
3000
最も好まれているTalkは
02:23
are, on average平均, over 50 percentパーセント longerより長いです
57
128000
2000
好まれてないTalkより
02:25
than the least少なくとも favoriteお気に入り onesもの.
58
130000
2000
平均で50%以上長いのです
02:28
And this holds保持 true真実 for all rankingランキング listsリスト on TEDTED.comcom
59
133000
2000
これは個々のランキングリストにも
02:30
exceptを除いて if you want to have a talk
60
135000
2000
当てはまりますが 例外もあって
02:32
that's beautiful綺麗な, inspiring感動的な or funny面白い.
61
137000
2000
「美しい」「刺激的」「可笑しい」
02:34
Then, you should be brief簡潔な. (Laughter笑い) But other than that,
62
139000
2000
というのを狙うなら簡潔に
02:36
talk until〜まで they dragドラッグ you off the stageステージ.
63
141000
3000
そうでなければ 引きずり下ろされるまで話し続けましょう
02:39
(Laughter笑い)
64
144000
2000
(笑い)
02:41
Now, while ...
65
146000
2000
それから…
02:43
(Applause拍手)
66
148000
6000
(拍手)
02:49
While you're pushing押して the clockクロック, there's a few少数 rulesルール to obey従う.
67
154000
3000
講演する上で守るべきルールがあります
02:52
I found見つけた these rulesルール out by comparing比較する the statistics統計
68
157000
2000
私はこのルールを 好かれているTalkと
02:54
of four-word4語 phrasesフレーズ
69
159000
2000
好かれていないTalkの
02:56
that appear現れる more oftenしばしば in the most最も favoriteお気に入り TEDTalksTEDTalks
70
161000
3000
それぞれに現れる4語のフレーズの
02:59
as opposed反対 to the least少なくとも favoriteお気に入り TEDTalksTEDTalks.
71
164000
2000
統計を取ることで見つけました
03:01
I'll give you three examples.
72
166000
2000
3つ例を挙げます
03:03
First of all, I must必須, as a speakerスピーカー,
73
168000
2000
まずなにより 講演者として
03:05
provide提供する a serviceサービス to the audience聴衆 and talk about what I will give you,
74
170000
3000
聴衆に対して「自分に提供できる」ことを話し
03:08
instead代わりに of saying言って what I can't have.
75
173000
2000
「自分にはできない」と言うべきではありません
03:10
Secondly第二に, it's imperative命令的
76
175000
2000
第2に「ニューヨークタイムズ」の
03:12
that you do not cite引用する The New新しい Yorkヨーク Timesタイムズ.
77
177000
2000
引用は絶対避けてください
03:14
(Laughter笑い)
78
179000
2000
(笑い)
03:16
And finally最後に, it's okay for the speakerスピーカー -- that's the good newsニュース --
79
181000
3000
最後に…これは良い報せですが…講演者が
03:19
to fake intellectual知的 capacity容量.
80
184000
2000
知ったかぶりをするのは構いません
03:21
If I don't understandわかる something, I can just say, "etc., etc."
81
186000
3000
「分らない」ときにはただ「エトセトラ エトセトラ」と言えばいいのです
03:24
You'llあなたは all stay滞在 with me.
82
189000
2000
みんな付いてきてくれますから
03:26
It's perfectly完全に fine.
83
191000
2000
全く問題ありません
03:28
(Applause拍手)
84
193000
4000
(拍手)
03:32
Now, let's go to the visualsビジュアル.
85
197000
2000
次は 見た目の話です
03:34
The most最も obvious明らか visualビジュアル thing on stageステージ is the speakerスピーカー.
86
199000
3000
ステージの上で一番目に付くものは 講演者本人です
03:37
And analysis分析 showsショー if you want to be
87
202000
2000
分析の結果 最も好かれる
03:39
among the most最も favoriteお気に入り TEDTED speakersスピーカー,
88
204000
2000
講演者の仲間入りをするには
03:41
you should let your hairヘア grow成長する a little bitビット longerより長いです than average平均,
89
206000
3000
髪の毛を平均より少し長めにのばし
03:44
make sure you wear着る your glasses眼鏡 and be slightly少し more dressed-upドレスアップして
90
209000
3000
眼鏡を忘れずにかけ 平均的な講演者よりも
03:47
than the average平均 TEDTED speakerスピーカー.
91
212000
2000
きちっとした身なりをしてください
03:49
Slidesスライド are okay, thoughしかし you mightかもしれない consider検討する going for props小道具.
92
214000
3000
スライドだけでなく 小道具も使ってみましょう
03:52
And now the most最も important重要 thing,
93
217000
2000
そして とても重要なのは
03:54
that is the mood気分 onstageステージ上.
94
219000
2000
ステージの雰囲気です
03:56
Color plays演劇 a very important重要 role役割.
95
221000
2000
色がとても重要な役割を果たします
03:58
Color closely密接に correlates相関する
96
223000
2000
Webサイトでの講演の評価は
04:00
with the ratings評価 that talks交渉 get on the websiteウェブサイト.
97
225000
3000
色と密接な関連があります
04:03
(Applause拍手)
98
228000
2000
(拍手)
04:05
For example, fascinating魅力的な talks交渉
99
230000
2000
たとえば「魅力的」な講演は
04:07
contain含む a statistically統計的に high高い amount
100
232000
2000
統計的に
04:09
of exactly正確に this blue color, (Laughter笑い)
101
234000
2000
平均的な講演と比べて
04:11
much more than the average平均 TEDTalkTEDTalk.
102
236000
2000
紫色を多く含んでいます
04:13
Ingenious独創的な TEDTalksTEDTalks, much more this green color,
103
238000
2000
「独創的」な講演は緑色が多く…
04:15
etc., etet.
104
240000
2000
エトセトラ エトセトラ
04:17
(Laughter笑い) (Applause拍手)
105
242000
7000
(拍手)
04:24
Now, personally個人的に, I think
106
249000
2000
このような分析をしたのは
04:26
I'm not the first one who has done完了 this analysis分析,
107
251000
2000
私が初めてではないと思われます
04:28
but I'll leave離れる this
108
253000
2000
しかしこれは皆さんの
04:30
to your good judgment判定.
109
255000
3000
ご判断にお任せしましょう
04:33
So, now it's time to put it all together一緒に
110
258000
2000
それでは これらすべてをまとめて
04:35
and design設計 the ultimate究極 TEDTalkTEDTalk.
111
260000
2000
究極のTEDTalkを作ってみましょう
04:37
Now, since以来 this is TEDActiveTEDActive,
112
262000
2000
ここはTED Activeですから
04:39
and I learned学んだ from my analysis分析
113
264000
2000
分析でわかったことを
04:41
that I should actually実際に give you something,
114
266000
2000
何か形にすべきでしょう
04:43
I will not impose課す the ultimate究極
115
268000
2000
究極のTalkや最悪のTalkを
04:45
or worst最悪 TEDTalkTEDTalk on you,
116
270000
2000
押しつけようとは思いません
04:47
but ratherむしろ give you a toolツール to create作成する your own自分の.
117
272000
2000
皆さんがご自分のを作れる
04:49
And I call this toolツール the TEDPadTEDPad.
118
274000
3000
ツールを用意しました TED Padです
04:52
(Laughter笑い)
119
277000
3000
(笑い)
04:55
And the TEDPadTEDPad is a matrixマトリックス
120
280000
2000
このTED Padを使うと
04:57
of 100 specifically具体的に selected選択された,
121
282000
2000
特別に選んだ100個の
04:59
highly高く curatedキュレーション sentences文章
122
284000
3000
精選された文章を組み合わせ
05:02
that you can easily簡単に pieceピース together一緒に to get your own自分の TEDTalkTEDTalk.
123
287000
3000
ご自分のTEDTalkを作っていただくことができます
05:07
You only have to make one decision決定,
124
292000
2000
決断すべきことは1つだけ
05:09
and that is: Are you going to use the white versionバージョン
125
294000
2000
良いTalkのためのホワイトバージョンを使って
05:11
for very good TEDTalksTEDTalks,
126
296000
2000
「創造性」や
05:13
about creativity創造性, human人間 genius天才?
127
298000
2000
「人類の英知」についての話をするか
05:15
Or are you going to go with a black versionバージョン,
128
300000
2000
それともブラックバージョンにして
05:17
whichどの will allow許す you to create作成する really bad悪い TEDTalksTEDTalks,
129
302000
2000
すごくまずいTEDTalkを作り
05:19
mostly主に about blogsブログ,
130
304000
2000
「ブログ」や「政治」なんかの
05:21
politics政治 and stuffもの?
131
306000
2000
話をするかです
05:23
So, downloadダウンロード it and have fun楽しい with it.
132
308000
2000
ぜひダウンロードしてお試しください
05:25
Now I hope希望 you enjoy楽しんで the sessionセッション.
133
310000
3000
このセッションを楽しんでいただけたなら幸いです
05:28
I hope希望 you enjoy楽しんで designing設計 your own自分の
134
313000
2000
ご自分の究極のTEDTalkや
05:30
ultimate究極 and worst最悪 possible可能 TEDTalksTEDTalks.
135
315000
2000
最悪のTEDTalkをお作りください
05:32
And I hope希望 some of you will be inspiredインスピレーションを受けた for next year
136
317000
3000
そして皆さんの中の誰かが触発されて
05:35
to create作成する this, whichどの I really want to see.
137
320000
3000
来年のTEDで このような講演を聞かせていただけるのを楽しみにしています
05:38
Thank you very much.
138
323000
2000
ご清聴ありがとうございました
05:40
(Applause拍手) Thanksありがとう.
139
325000
10000
(拍手)
Translated by Takahiro Shimpo
Reviewed by Yasushi Aoki

▲Back to top

ABOUT THE SPEAKER
Sebastian Wernicke - Data scientist
After making a splash in the field of bioinformatics, Sebastian Wernicke moved on to the corporate sphere, where he motivates and manages multidimensional projects.

Why you should listen

Dr. Sebastian Wernicke is the Chief Data Scientist of ONE LOGIC, a data science boutique that supports organizations across industries to make sense of their vast data collections to improve operations and gain strategic advantages. Wernicke originally studied bioinformatics and previously led the strategy and growth of Seven Bridges Genomics, a Cambridge-based startup that builds platforms for genetic analysis.

Before his career in statistics began, Wernicke worked stints as both a paramedic and successful short animated filmmaker. He's also the author of the TEDPad app, an irreverent tool for creating an infinite number of "amazing and really bad" and mostly completely meaningless talks. He's the author of the statistically authoritative and yet completely ridiculous "How to Give the Perfect TEDTalk."

More profile about the speaker
Sebastian Wernicke | Speaker | TED.com