ABOUT THE SPEAKERS
Jean-Baptiste Michel - Data researcher
Jean-Baptiste Michel looks at how we can use large volumes of data to better understand our world.

Why you should listen

Jean-Baptiste Michel holds joint academic appointments at Harvard (FQEB Fellow) and Google (Visiting Faculty). His research focusses on using large volumes of data as tools that help better understand the world around us -- from the way diseases progress in patients over years, to the way cultures change in human societies over centuries. With his colleague Erez Lieberman Aiden, Jean-Baptiste is a Founding Director of Harvard's Cultural Observatory, where their research team pioneers the use of quantitative methods for the study of human culture, language and history. His research was featured on the covers of Science and Nature, on the front pages of the New York Times and the Boston Globe, in The Economist, Wired and many other venues. The online tool he helped create -- ngrams.googlelabs.com -- was used millions of times to browse cultural trends. Jean-Baptiste is an Engineer from Ecole Polytechnique (Paris), and holds an MS in Applied Mathematics and a PhD in Systems Biology from Harvard.

More profile about the speaker
Jean-Baptiste Michel | Speaker | TED.com
Erez Lieberman Aiden - Researcher
Erez Lieberman Aiden pursues a broad range of research interests, spanning genomics, linguistics, mathematics ...

Why you should listen

Erez Lieberman Aiden is a fellow at the Harvard Society of Fellows and Visiting Faculty at Google. His research spans many disciplines and has won numerous awards, including recognition for one of the top 20 "Biotech Breakthroughs that will Change Medicine", by Popular Mechanics; the Lemelson-MIT prize for the best student inventor at MIT; the American Physical Society's Award for the Best Doctoral Dissertation in Biological Physics; and membership in Technology Review's 2009 TR35, recognizing the top 35 innovators under 35. His last three papers -- two with JB Michel -- have all appeared on the cover of Nature and Science.

More profile about the speaker
Erez Lieberman Aiden | Speaker | TED.com
TEDxBoston 2011

Jean-Baptiste Michel + Erez Lieberman Aiden: What we learned from 5 million books

Čemu jsme se naučili z 5 milionů knih

Filmed:
2,049,453 views

Zkoušeli jste někdy Google Labs´ Ngram Viewer? Je to návykový nástroj, který Vás nechá vyhledávat slova a nápady v databázi 5 miliónů knih napříč stoletími. Erez Lieberman Aiden a Jean-Baptiste Michel nám ukazuje, jak funguje, a pár pěkných vychytávek, které můžeme z 500 biliónů slov vyčíst.
- Data researcher
Jean-Baptiste Michel looks at how we can use large volumes of data to better understand our world. Full bio - Researcher
Erez Lieberman Aiden pursues a broad range of research interests, spanning genomics, linguistics, mathematics ... Full bio

Double-click the English transcript below to play the video.

00:15
ErezErez LiebermanLieberman AidenAiden: EveryoneKaždý knows
0
0
2000
Erez Lieberman Aiden: Každý ví,
00:17
that a pictureobrázek is worthhodnota a thousandtisíc wordsslova.
1
2000
3000
že jeden obraz vydá za tisíc slov.
00:22
But we at HarvardHarvard
2
7000
2000
My na Harvardu
00:24
were wonderingpřemýšlel if this was really trueskutečný.
3
9000
3000
jsme si to chtěli ověřit.
00:27
(LaughterSmích)
4
12000
2000
(smích)
00:29
So we assembledsestaven a teamtým of expertsOdborníci,
5
14000
4000
A tak jsme dali dohromady tým expertů
00:33
spanningspanning HarvardHarvard, MITMIT,
6
18000
2000
z Harvardu, MIT,
00:35
The AmericanAmerická HeritageDědictví DictionarySlovník, The EncyclopediaEncyklopedie BritannicaBritannica
7
20000
3000
The American Heritage Dictionary, The Encyclopedia Britannica
00:38
and even our proudhrdý sponsorssponzorů,
8
23000
2000
a dokonce i našeho hrdého sponzora,
00:40
the GoogleGoogle.
9
25000
3000
Google.
00:43
And we cogitatedpřikývnul about this
10
28000
2000
A bádali jsme
00:45
for about fourčtyři yearsroky.
11
30000
2000
4 roky.
00:47
And we camepřišel to a startlingpřekvapující conclusionzávěr.
12
32000
5000
A přišli jsme na překvapující závěr.
00:52
LadiesLadies and gentlemenPánové, a pictureobrázek is not worthhodnota a thousandtisíc wordsslova.
13
37000
3000
Dámy a pánové, jeden obraz nevydá za tisíc slov.
00:55
In factskutečnost, we foundnalezeno some picturesobrázky
14
40000
2000
Nášli jsme obrazy, které
00:57
that are worthhodnota 500 billionmiliarda wordsslova.
15
42000
5000
vydají i za 500 miliard slov.
01:02
Jean-BaptisteJean-Baptiste MichelMichel: So how did we get to this conclusionzávěr?
16
47000
2000
Jean-Baptiste Michel: Jak jsme na to přišli?
01:04
So ErezErez and I were thinkingmyslící about wayszpůsoby
17
49000
2000
Erez a já jsme přemýšleli nad tím,
01:06
to get a bigvelký pictureobrázek of humančlověk culturekultura
18
51000
2000
jak získat celkový obrázek lidské
01:08
and humančlověk historydějiny: changezměna over time.
19
53000
3000
kultury, historie a jejich vývoje v čase.
01:11
So manymnoho booksknihy actuallyvlastně have been writtenpsaný over the yearsroky.
20
56000
2000
V historii vzniklo mnoho a mnoho knih.
01:13
So we were thinkingmyslící, well the bestnejlepší way to learnUčit se from them
21
58000
2000
Takže jsme si řekli, že nejlepší způsob, jak se z nich
01:15
is to readčíst all of these millionsmiliony of booksknihy.
22
60000
2000
poučit, je přečíst všechny ty miliony knih.
01:17
Now of coursechod, if there's a scaleměřítko for how awesomeskvělý that is,
23
62000
3000
Takže, na škále úžasnosti je takový postup
01:20
that has to rankpořadí extremelyvelmi, extremelyvelmi highvysoký.
24
65000
3000
opravdu, velmi vysoká..
01:23
Now the problemproblém is there's an X-axisOsa x for that,
25
68000
2000
Nicméně je zde i osa X,
01:25
whichkterý is the practicalpraktický axisosa.
26
70000
2000
a to osa praktičnosti.
01:27
This is very, very lownízký.
27
72000
2000
A ta je velmi, velmi nízká.
01:29
(ApplausePotlesk)
28
74000
3000
(potlesk)
01:32
Now people tendtendenci to use an alternativealternativní approachpřístup,
29
77000
3000
Takže lidé zkouší různé alternativní přístupy,
01:35
whichkterý is to take a fewpár sourcesZdroje and readčíst them very carefullyopatrně.
30
80000
2000
například vzít si pár zdrojů a pečlivě je pročíst.
01:37
This is extremelyvelmi practicalpraktický, but not so awesomeskvělý.
31
82000
2000
Velmi praktické, ale ani trochu cool.
01:39
What you really want to do
32
84000
3000
Nejraději bychom
01:42
is to get to the awesomeskvělý yetdosud practicalpraktický partčást of this spaceprostor.
33
87000
3000
získali úžasné a praktické řešení zároveň.
01:45
So it turnsotočí out there was a companyspolečnost acrosspřes the riverřeka calledvolal GoogleGoogle
34
90000
3000
No a kousek od nás byla společnost Google, která před pár lety
01:48
who had startedzačal a digitizationdigitalizace projectprojekt a fewpár yearsroky back
35
93000
2000
začala projekt digitalizace
01:50
that mightmohl just enableumožnit this approachpřístup.
36
95000
2000
který toto umožnil.
01:52
They have digitizeddigitalizovat millionsmiliony of booksknihy.
37
97000
2000
Zdigitalizovali milióny knih.
01:54
So what that meansprostředek is, one could use computationalvýpočetní methodsmetody
38
99000
3000
To znamená, že za použití počítačů můžete
01:57
to readčíst all of the booksknihy in a clickklikněte na tlačítko of a buttontlačítko.
39
102000
2000
přečíst všechny ty knihy na jedno kliknutí.
01:59
That's very practicalpraktický and extremelyvelmi awesomeskvělý.
40
104000
3000
To je velmi praktické a naprosto úžasné.
02:03
ELAELA: Let me tell you a little bitbit about where booksknihy come from.
41
108000
2000
ELA: Dovolte mi říci něco o původu těchto knih.
02:05
SinceOd time immemorialprastarý, there have been authorsautorů.
42
110000
3000
Od pradávných časů jsme měli spisovatele.
02:08
These authorsautorů have been strivingúsilí to writenapsat booksknihy.
43
113000
3000
Tito autoři toužili psát knihy.
02:11
And this becamestal se considerablyznačně easiersnadnější
44
116000
2000
Což se stalo výrazně snazším
02:13
with the developmentrozvoj of the printingtisk pressstisk some centuriesstoletí agopřed.
45
118000
2000
s vynálezem knihtisku před pár stoletími.
02:15
SinceOd then, the authorsautorů have wonvyhrál
46
120000
3000
Od té doby se autorům podařilo
02:18
on 129 millionmilión distinctodlišný occasionspříležitostech,
47
123000
2000
ve 129 milionech různých případů,
02:20
publishingpublikování booksknihy.
48
125000
2000
své knihy vydat.
02:22
Now if those booksknihy are not lostztracený to historydějiny,
49
127000
2000
Pokud tyto knihy nezapadly v čase,
02:24
then they are somewhereněkde in a libraryknihovna,
50
129000
2000
staly se součástí nějaké knihovny,
02:26
and manymnoho of those booksknihy have been gettingdostat retrievedCitováno from the librariesknihovny
51
131000
3000
a mnoho z nich se z těchto knihoven i dostalo, a byly
02:29
and digitizeddigitalizovat by GoogleGoogle,
52
134000
2000
zdigitalizovány Googlem,
02:31
whichkterý has scannednaskenované 15 millionmilión booksknihy to datedatum.
53
136000
2000
který má dnes naskenováno asi 15 miliónů knih.
02:33
Now when GoogleGoogle digitizesdigitalizuje a bookrezervovat, they put it into a really nicepěkný formatformát.
54
138000
3000
Když Google naskenuje knihu, převede jí do velmi pěkného formátu.
02:36
Now we'vejsme got the datadata, plusPlus we have metadatametadata.
55
141000
2000
Takže teď máme data a k tomu metadata.
02:38
We have informationinformace about things like where was it publishedpublikováno,
56
143000
3000
Máme informaci například o tom, kde byla kniha vydaná,
02:41
who was the authorautor, when was it publishedpublikováno.
57
146000
2000
kdo byl její autor, nebo kdy byla vydaná.
02:43
And what we do is go throughpřes all of those recordsevidence
58
148000
3000
A to, co jsme my udělali bylo, že jsme prošli
02:46
and excludevyloučit everything that's not the highestnejvyšší qualitykvalitní datadata.
59
151000
4000
všechny tyto záznamy a vypustili vše co nebylo nejvyšší kvality.
02:50
What we're left with
60
155000
2000
A nakonec nám
02:52
is a collectionsbírka of fivePět millionmilión booksknihy,
61
157000
3000
zbyla sbírka 5 miliónů knih,
02:55
500 billionmiliarda wordsslova,
62
160000
3000
500 miliard slov,
02:58
a stringřetězec of characterspostavy a thousandtisíc timesčasy longerdelší
63
163000
2000
řada písmen tisíckrát delší
03:00
than the humančlověk genomegenomu --
64
165000
3000
než lidský genom -
03:03
a texttext whichkterý, when writtenpsaný out,
65
168000
2000
text, který, když by byl přepsán,
03:05
would stretchprotáhnout se from here to the MoonMěsíc and back
66
170000
2000
by dosáhl odsud na Měsíc a zpátky
03:07
10 timesčasy over --
67
172000
2000
desetkrát
03:09
a veritableopravdový shardstřípek of our culturalkulturní genomegenomu.
68
174000
4000
- opravdový střípek našeho kulturního genomu.
03:13
Of coursechod what we did
69
178000
2000
Samozřejmě,
03:15
when facedtváří v tvář with suchtakový outrageouspobuřující hyperbolenadsázka ...
70
180000
3000
když jsme čelili tak nehorázné hyperbole..
03:18
(LaughterSmích)
71
183000
2000
(smích)
03:20
was what any self-respectingsebeúcty researchersvýzkumných pracovníků
72
185000
3000
udělali jsme to, co by každý výzkumník
03:23
would have doneHotovo.
73
188000
3000
s trochou sebeúcty udělal.
03:26
We tookvzal a pagestrana out of XKCDXKCD,
74
191000
2000
Vzali jsme stránku z XKCD,
03:28
and we said, "StandStojan back.
75
193000
2000
a řekli: "Ustupte,
03:30
We're going to try scienceVěda."
76
195000
2000
zkusíme vědu!"
03:32
(LaughterSmích)
77
197000
2000
(Smích)
03:34
JMJM: Now of coursechod, we were thinkingmyslící,
78
199000
2000
JM: No a pochopitelně jsme si
03:36
well let's just first put the datadata out there
79
201000
2000
říkali, že nejprve ty data zveřejníme,
03:38
for people to do scienceVěda to it.
80
203000
2000
aby na nich lidi mohli tu vědu dělat.
03:40
Now we're thinkingmyslící, what datadata can we releaseuvolnění?
81
205000
2000
Takže jsme přemýšleli, jaká data můžeme zveřejnit?
03:42
Well of coursechod, you want to take the booksknihy
82
207000
2000
Pochopitelně chtěli jsme vzít obsah všech
03:44
and releaseuvolnění the fullplný texttext of these fivePět millionmilión booksknihy.
83
209000
2000
těch pěti miliónů knih a všechen zveřejnit.
03:46
Now GoogleGoogle, and JonJon OrwantOrwant in particularkonkrétní,
84
211000
2000
Na to Google, a zejména Jon Orwant,
03:48
told us a little equationrovnice that we should learnUčit se.
85
213000
2000
nás seznámili s jednou pěknou rovnicí.
03:50
So you have fivePět millionmilión, that is, fivePět millionmilión authorsautorů
86
215000
3000
Máte pět miliónů knih. To je pět miliónů autorů
03:53
and fivePět millionmilión plaintiffsžalobci is a massivemasivní lawsuitsoudní řízení.
87
218000
3000
a pět miliónů žalob je už pořádný proces.
03:56
So, althoughAčkoli that would be really, really awesomeskvělý,
88
221000
2000
Takže, i když by to bylo opravdu úžasné,
03:58
again, that's extremelyvelmi, extremelyvelmi impracticalnepraktický.
89
223000
3000
opět to bylo i opravdu nepraktické.
04:01
(LaughterSmích)
90
226000
2000
(Smích)
04:03
Now again, we kinddruh of cavedustoupila in,
91
228000
2000
Takže jsme ustoupili
04:05
and we did the very practicalpraktický approachpřístup, whichkterý was a bitbit lessméně awesomeskvělý.
92
230000
3000
a pojali velmi praktický přístup, který byl však trochu méně úžasný.
04:08
We said, well insteadmísto toho of releasinguvolnění the fullplný texttext,
93
233000
2000
Řekli jsme si, že namísto plného znění,
04:10
we're going to releaseuvolnění statisticsstatistika about the booksknihy.
94
235000
2000
vydáme o těchto knihách statistiky.
04:12
So take for instanceinstance "A gleamzáblesk of happinessštěstí."
95
237000
2000
Takže například: "Záblesk štěstí"
04:14
It's fourčtyři wordsslova; we call that a four-gramčtyři gram.
96
239000
2000
To jsou dvě slova; říkáme tomu dvou-gram.
04:16
We're going to tell you how manymnoho timesčasy a particularkonkrétní four-gramčtyři gram
97
241000
2000
Takže Vám můžeme říci, kolikrát se daný dvou-gram
04:18
appearedobjevil se in booksknihy in 1801, 1802, 1803,
98
243000
2000
objevil v knihách v roce 1801, 2, 3
04:20
all the way up to 2008.
99
245000
2000
až do roku 2008.
04:22
That givesdává us a time seriessérie
100
247000
2000
To nám dá časovou řadu
04:24
of how frequentlyčasto this particularkonkrétní sentencevěta was used over time.
101
249000
2000
stopující jak často se tato věta v danné době použila.
04:26
We do that for all the wordsslova and phrasesfráze that appearobjevit in those booksknihy,
102
251000
3000
Děláme to se všemi slovy a frázemi, které se v těchto knihách
04:29
and that givesdává us a bigvelký tablestůl of two billionmiliarda linesline
103
254000
3000
objevují a to nám dá jednu velkou mapu
04:32
that tell us about the way culturekultura has been changingměnící se.
104
257000
2000
dvou mliard řádků zrcadlící proměny kultury.
04:34
ELAELA: So those two billionmiliarda linesline,
105
259000
2000
ELA: Takže tyto řádky
04:36
we call them two billionmiliarda n-gramsn g.
106
261000
2000
nazýváme dvě milardy n-gramů.
04:38
What do they tell us?
107
263000
2000
Co nám umí říct?
04:40
Well the individualindividuální n-gramsn g measureopatření culturalkulturní trendstrendy.
108
265000
2000
Jednotlivé n-gramy měří kulturní trendy.
04:42
Let me give you an examplepříklad.
109
267000
2000
Dám Vám příklad.
04:44
Let's supposepředpokládat that I am thrivingprosperující,
110
269000
2000
Řekněme, že se mám fajn a
04:46
then tomorrowzítra I want to tell you about how well I did.
111
271000
2000
druhý den vám o tom chci říci. Mohl bych
04:48
And so I mightmohl say, "YesterdayVčera, I throvevzkvétali."
112
273000
3000
říci: "Včera mi bylo fajn."
04:51
AlternativelyMůžete také, I could say, "YesterdayVčera, I thrivedkvetl."
113
276000
3000
Nebo bych mohl říct: "Včera mi bylo dobře."
04:54
Well whichkterý one should I use?
114
279000
3000
Co bych měl říct správně?
04:57
How to know?
115
282000
2000
Jak se rozhodnout?
04:59
As of about sixšest monthsměsíců agopřed,
116
284000
2000
Přibližně před šesti měsíci
05:01
the stateStát of the artumění in this fieldpole
117
286000
2000
by situace v této oblasti
05:03
is that you would, for instanceinstance,
118
288000
2000
vypada asi takto - šli byste
05:05
go up to the followingNásledující psychologistpsycholog with fabulousbáječný hairvlasy,
119
290000
2000
za tímto psychologem s úžasným účesem
05:07
and you'dže ano say,
120
292000
2000
a řekli:
05:09
"SteveSteve, you're an expertexpert on the irregularnepravidelný verbsslovesa.
121
294000
3000
"Steve, ty jsi expert na nepravidelná slovesa.
05:12
What should I do?"
122
297000
2000
Co bych měl říct?"
05:14
And he'don to byl tell you, "Well mostvětšina people say thrivedkvetl,
123
299000
2000
A on by Vám řekl: "No, většina lidí by řekla "fajn"
05:16
but some people say throvevzkvétali."
124
301000
3000
ale někteří by řekli "dobře".
05:19
And you alsotaké knewvěděl, more or lessméně,
125
304000
2000
Ale, když byste se vrátili, zhruba,
05:21
that if you were to go back in time 200 yearsroky
126
306000
3000
200 let nazpátek, a oslovili byste dalšího
05:24
and askdotázat se the followingNásledující statesmanstátník with equallystejně fabulousbáječný hairvlasy,
127
309000
3000
odborníka s neméně úžasným účesem:
05:27
(LaughterSmích)
128
312000
3000
(Smích)
05:30
"TomTom, what should I say?"
129
315000
2000
"Tome, co bych měl říci?"
05:32
He'dOn by say, "Well, in my day, mostvětšina people throvevzkvétali,
130
317000
2000
Řekl by: "Inu, v mé době většina lidí řekne
05:34
but some thrivedkvetl."
131
319000
3000
"dobře", ale někteří i "fajn".
05:37
So now what I'm just going to showshow you is rawdrsný datadata.
132
322000
2000
Takže nyní Vám ukáži původní data.
05:39
Two rowsřádky from this tablestůl of two billionmiliarda entrieszáznamy.
133
324000
4000
Tyto dvě linky vznikly také z oněch dvou
05:43
What you're seeingvidění is yearrok by yearrok frequencyfrekvence
134
328000
2000
miliard údajů. To, co vidíte je frekvence užití
05:45
of "thrivedkvetl" and "throvevzkvétali" over time.
135
330000
3000
dvou podobných slov rok po roce.
05:49
Now this is just two
136
334000
2000
A toto jsou pouze
05:51
out of two billionmiliarda rowsřádky.
137
336000
3000
dvě z dvou miliard linek.
05:54
So the entirecelý datadata setsoubor
138
339000
2000
Takže všechna ta data
05:56
is a billionmiliarda timesčasy more awesomeskvělý than this slideskluzavka.
139
341000
3000
jsou ještě mnohem úžasnější než tento slide.
05:59
(LaughterSmích)
140
344000
2000
(Smích)
06:01
(ApplausePotlesk)
141
346000
4000
(potlesk)
06:05
JMJM: Now there are manymnoho other picturesobrázky that are worthhodnota 500 billionmiliarda wordsslova.
142
350000
2000
JM: Existuje mnoho dalších obrázků, které vydají za 500 miliard slov.
06:07
For instanceinstance, this one.
143
352000
2000
Například toto.
06:09
If you just take influenzachřipka,
144
354000
2000
Když bychom vzali třeba
06:11
you will see peaksvrcholy at the time where you knewvěděl
145
356000
2000
"chřipku", uvidíte maxima v dobách, kdy víte,
06:13
bigvelký fluchřipka epidemicsepidemie were killingzabíjení people around the globezeměkoule.
146
358000
3000
že velké chřipkové epidemie zabíjely po celém světě.
06:16
ELAELA: If you were not yetdosud convincedpřesvědčený,
147
361000
3000
ELA: pokud ještě nejste přesvědčeni,
06:19
seamoře levelsúrovně are risingstoupající,
148
364000
2000
hladiny moře stoupají,
06:21
so is atmosphericatmosférický COCO2 and globalglobální temperatureteplota.
149
366000
3000
stejně jako obsah CO2 v atmosféře či globální teplota.
06:24
JMJM: You mightmohl alsotaké want to have a look at this particularkonkrétní n-gramn gramové,
150
369000
3000
JM: Možná byste také stáli o to vidět tento n-gram,
06:27
and that's to tell NietzscheNietzsche that God is not deadmrtví,
151
372000
3000
který říká Nietzschemu, že Bůh není mrtvý,
06:30
althoughAčkoli you mightmohl agreesouhlasit that he mightmohl need a better publicistpublicista.
152
375000
3000
i když byste mohli usoudit, že by mohl užít lepšího PR agenta..
06:33
(LaughterSmích)
153
378000
2000
(Smích)
06:35
ELAELA: You can get at some prettydosti abstractabstraktní conceptskoncepty with this sorttřídění of thing.
154
380000
3000
ELA: S tímto se můžete dostat k pár dosti abstraktním pojmům.
06:38
For instanceinstance, let me tell you the historydějiny
155
383000
2000
Tak například, dovolte mi Vás seznámit
06:40
of the yearrok 1950.
156
385000
2000
s historií roku 1950.
06:42
PrettyPěkné much for the vastobrovský majorityvětšina of historydějiny,
157
387000
2000
Po drtivou většinu celé historie
06:44
no one gavedal a damnsakra about 1950.
158
389000
2000
o samotný rok 1950 nikdo ani nezavadil.
06:46
In 1700, in 1800, in 1900,
159
391000
2000
V roce 1700, 188, ani 1900.
06:48
no one caredpéče.
160
393000
3000
Ani trochu.
06:52
ThroughProstřednictvím the 30s and 40s,
161
397000
2000
Ani v 30. nebo 40. letech
06:54
no one caredpéče.
162
399000
2000
nikoho nezajímal.
06:56
SuddenlyNáhle, in the mid-střední-40s,
163
401000
2000
Najednou, uprostřed 40. let
06:58
there startedzačal to be a buzzBuzz.
164
403000
2000
to začalo vřít.
07:00
People realizeduvědomil that 1950 was going to happenpřihodit se,
165
405000
2000
Lidé si uvědomili, že přijde rok 1950 a že to
07:02
and it could be bigvelký.
166
407000
2000
může být velké.
07:04
(LaughterSmích)
167
409000
3000
(Smích)
07:07
But nothing got people interestedzájem in 1950
168
412000
3000
Ale nic lidi nezajímalo na roku 1950
07:10
like the yearrok 1950.
169
415000
3000
více, než rok 1950.
07:13
(LaughterSmích)
170
418000
3000
(Smích)
07:16
People were walkingchůze around obsessedposedlý.
171
421000
2000
Lidé byli celí bez sebe.
07:18
They couldn'tnemohl stop talkingmluvící
172
423000
2000
Nemohli přestat mluvit
07:20
about all the things they did in 1950,
173
425000
3000
o všem, co v tom roce dělali,
07:23
all the things they were planningplánování to do in 1950,
174
428000
3000
co plánovali do té doby dosáhnout a jaké sny
07:26
all the dreamssny of what they wanted to accomplishdosáhnout in 1950.
175
431000
5000
si chtěli splnit v roce 1950.
07:31
In factskutečnost, 1950 was so fascinatingfascinující
176
436000
2000
Ve skutečnosti byl rok 1950
07:33
that for yearsroky thereafterpoté,
177
438000
2000
tak fascinující,
07:35
people just keptudržováno talkingmluvící about all the amazingúžasný things that happenedStalo,
178
440000
3000
že i v dalších letech lidé vydrželi mluvit o tom, jak úžasné věci se staly
07:38
in '51, '52, '53.
179
443000
2000
i v roce 51, 2, 3..
07:40
FinallyNakonec in 1954,
180
445000
2000
Až konečně
07:42
someoneněkdo wokeprobudil jsem se up and realizeduvědomil
181
447000
2000
v roce 1954 se lidé z ničeho nic
07:44
that 1950 had gottendostal somewhatponěkud passsložité.
182
449000
4000
probrali a zjistili, že rok 1950 je poněkud pasé.
07:48
(LaughterSmích)
183
453000
2000
(Smích)
07:50
And just like that, the bubblebublina burstburst.
184
455000
2000
A stejně tak splaskla i ta bublina.
07:52
(LaughterSmích)
185
457000
2000
(Smích)
07:54
And the storypříběh of 1950
186
459000
2000
A příběh roku 1950
07:56
is the storypříběh of everykaždý yearrok that we have on recordzáznam,
187
461000
2000
je příběh každého roku, který jsme zaznamenali
07:58
with a little twistTwist, because now we'vejsme got these nicepěkný chartsgrafy.
188
463000
3000
trochu jinak, díky těmto krásným tabulkám, co máme.
08:01
And because we have these nicepěkný chartsgrafy, we can measureopatření things.
189
466000
3000
A protože tyto úžasné tabulky máme, můžeme věci měřit.
08:04
We can say, "Well how fastrychle does the bubblebublina burstburst?"
190
469000
2000
Můžeme říct: "Takže, jak rychle ta bublina splaskla?"
08:06
And it turnsotočí out that we can measureopatření that very preciselypřesně.
191
471000
3000
Ukázalo se, že to dokážeme změřit velmi přesně.
08:09
EquationsRovnice were derivedodvozený, graphsgrafy were producedvyrobeno,
192
474000
3000
Rovnice byly odvozeny, grafy vytvořeny
08:12
and the netsíť resultvýsledek
193
477000
2000
a čistý výsledek
08:14
is that we find that the bubblebublina burstsshluky fasterrychleji and fasterrychleji
194
479000
3000
říká, že zjistíme, jak ta bublina splaskává rychleji
08:17
with eachkaždý passingprocházet yearrok.
195
482000
2000
a rychleji každ rok.
08:19
We are losingztrácí interestzájem in the pastminulost more rapidlyrychle.
196
484000
5000
O minulost ztrácíme zájem čím dál rychleji.
08:24
JMJM: Now a little piecekus of careerkariéra adviceRada.
197
489000
2000
JM: A nyní malý kariérní tip.
08:26
So for those of you who seekhledat to be famousslavný,
198
491000
2000
Pro ty z Vás, kdo se chcete stát slavnými,
08:28
we can learnUčit se from the 25 mostvětšina famousslavný politicalpolitický figuresčísel,
199
493000
2000
můžeme vzít inspiraci od 25 nejslavnějších politických
08:30
authorsautorů, actorsherci and so on.
200
495000
2000
osobností, autorů a herců atd.
08:32
So if you want to becomestát famousslavný earlybrzy on, you should be an actorherec,
201
497000
3000
Pokud se chcete stát slavnými spíše hned, měli byste být herci,
08:35
because then famesláva startszačíná risingstoupající by the endkonec of your 20s --
202
500000
2000
neboť tehdy zazáříte pravděpodobně před 30. rokem.
08:37
you're still youngmladý, it's really great.
203
502000
2000
Jste stále mladí, takže je to skvělé.
08:39
Now if you can wait a little bitbit, you should be an authorautor,
204
504000
2000
Pokud jste ochotni si trochu počkat, měli byste být
08:41
because then you risevzestup to very great heightsvýšky,
205
506000
2000
spisovatel, protože pak Vás nejvyšší pocty
08:43
like MarkMark TwainRozhraní TWAIN, for instanceinstance: extremelyvelmi famousslavný.
206
508000
2000
čekají později, jako třeba úspěch Marka Twaina.
08:45
But if you want to reachdosáhnout the very tophorní,
207
510000
2000
Ale pokud se chcete dostat opravdu
08:47
you should delayzpoždění gratificationuspokojení
208
512000
2000
na vrchol, měli byste odložit
08:49
and, of coursechod, becomestát a politicianpolitička.
209
514000
2000
uspokojení ještě více a pochopitelně
08:51
So here you will becomestát famousslavný by the endkonec of your 50s,
210
516000
2000
se stát politikem. Slavným se stanete před 60tým rokem
08:53
and becomestát very, very famousslavný afterwardpoté.
211
518000
2000
a velmi slavným poté.
08:55
So scientistsvědců alsotaké tendtendenci to get famousslavný when they're much olderstarší.
212
520000
3000
Také vědci tíhnout k slávě ve výrazně starším věku.
08:58
Like for instanceinstance, biologistsbiologové and physicsfyzika
213
523000
2000
Jako například biologové a fyzici
09:00
tendtendenci to be almosttéměř as famousslavný as actorsherci.
214
525000
2000
tíhnou k slávě srovnatelné s herci.
09:02
One mistakechyba you should not do is becomestát a mathematicianmatematik.
215
527000
3000
Jediná chyba by byla, když byste se dali na dráhu matematika.
09:05
(LaughterSmích)
216
530000
2000
(Smích)
09:07
If you do that,
217
532000
2000
Pokud byste to udělali,
09:09
you mightmohl think, "Oh great. I'm going to do my bestnejlepší work when I'm in my 20s."
218
534000
3000
mohli byste si říct: "Oh, skvěle. To nejlepší udělám mezi 20-30 lety.
09:12
But guesstipni si what, nobodynikdo will really carepéče.
219
537000
2000
Jenže, ouha. Nikoho to nezaujme.
09:14
(LaughterSmích)
220
539000
3000
(Smích)
09:17
ELAELA: There are more soberingvyčerpání notespoznámky
221
542000
2000
ELA: Mezi n-gramy najdeme ještě
09:19
amongmezi the n-gramsn g.
222
544000
2000
více varování.
09:21
For instanceinstance, here'stady je the trajectorytrajektorie of MarcMarc ChagallChagall,
223
546000
2000
Například tady vidíme trajektorii Marc Chagalla,
09:23
an artistumělec bornnarozený in 1887.
224
548000
2000
malíře narozeného 1887.
09:25
And this looksvzhled like the normalnormální trajectorytrajektorie of a famousslavný personosoba.
225
550000
3000
Která vypadá jako běžná trajektorie slavné osobnosti.
09:28
He getsdostane more and more and more famousslavný,
226
553000
4000
Stává se slavnějším a slavnějším všude,
09:32
exceptaž na if you look in GermanNěmčina.
227
557000
2000
kromě Německa.
09:34
If you look in GermanNěmčina, you see something completelyzcela bizarrebizarní,
228
559000
2000
Pokud se podíváte na Německo, zjistíte něco velmi
09:36
something you prettydosti much never see,
229
561000
2000
bizardního, co se jen tak nevidí.
09:38
whichkterý is he becomesstává se extremelyvelmi famousslavný
230
563000
2000
A to je to, že se stává extrémně slavným
09:40
and then all of a suddennáhlý plummetsklesne,
231
565000
2000
a pak zničeho nic sláva opadne,
09:42
going throughpřes a nadirNadir betweenmezi 1933 and 1945,
232
567000
3000
s nejnižším bodem v letech 1933 až 1945,
09:45
before reboundingoživením afterwardpoté.
233
570000
3000
kdy se odrazil ode dna.
09:48
And of coursechod, what we're seeingvidění
234
573000
2000
A pochopitelně to, co zjistíme je,
09:50
is the factskutečnost MarcMarc ChagallChagall was a JewishŽidovský artistumělec
235
575000
3000
že Marc Chagall je židovský umělec
09:53
in NaziNacista GermanyNěmecko.
236
578000
2000
v nacistickém Německu.
09:55
Now these signalssignály
237
580000
2000
Tyto signály jsou
09:57
are actuallyvlastně so strongsilný
238
582000
2000
ve skutečnosti tak silné,
09:59
that we don't need to know that someoneněkdo was censoredcenzurováno.
239
584000
3000
že nepotřebujeme ani vědět, že tu byl někdo cenzorován.
10:02
We can actuallyvlastně figurepostava it out
240
587000
2000
Můžeme to zjistit
10:04
usingpoužitím really basiczákladní signalsignál processingzpracovává se.
241
589000
2000
užitím základních metod zpracování dat.
10:06
Here'sTady je a simplejednoduchý way to do it.
242
591000
2000
Toto je jedna jednoduchá metoda.
10:08
Well, a reasonablerozumné expectationočekávání
243
593000
2000
A sice: rozumné očekávání
10:10
is that somebody'sněkdo je famesláva in a givendané perioddoba of time
244
595000
2000
je, že míra slávy jednoho člověka v daném čase
10:12
should be roughlyzhruba the averageprůměrný of theirjejich famesláva before
245
597000
2000
by se měla rovnat cca průměru jeho slávy
10:14
and theirjejich famesláva after.
246
599000
2000
před tím a potom.
10:16
So that's sorttřídění of what we expectočekávat.
247
601000
2000
Něco takového očekáváme.
10:18
And we compareporovnat that to the famesláva that we observeDodržujte.
248
603000
3000
A srovnáváme to se slávou, kterou pozorujeme.
10:21
And we just dividerozdělit one by the other
249
606000
2000
A jen dělíme jedno druhým,
10:23
to producevyrobit something we call a suppressionpotlačení indexindex.
250
608000
2000
abychom se dostali k tzv. indexu potlačení.
10:25
If the suppressionpotlačení indexindex is very, very, very smallmalý,
251
610000
3000
Pokud je index potlačení velmi, ale velmi nízký,
10:28
then you very well mightmohl be beingbytost suppressedpotlačeno.
252
613000
2000
pak asi se jedná o nějaký útisk, cenzuru.
10:30
If it's very largevelký, maybe you're benefitingprospěch from propagandapropaganda.
253
615000
3000
Pokud je velmi vysoký, můze to být výsledek propagandy.
10:34
JMJM: Now you can actuallyvlastně look at
254
619000
2000
JM: Nyní se můžeme podívat na
10:36
the distributionrozdělení of suppressionpotlačení indexesindexy over wholeCelý populationspopulací.
255
621000
3000
několik příkladů rozdělení indexů potlačení napříč populací.
10:39
So for instanceinstance, here --
256
624000
2000
Zde je například je
10:41
this suppressionpotlačení indexindex is for 5,000 people
257
626000
2000
index potlačení pro asi 5 000 lidí
10:43
pickedvybral in EnglishAngličtina booksknihy where there's no knownznámý suppressionpotlačení --
258
628000
2000
vybraných z anglické literatury, kde nebylo žádné známé potlačení,
10:45
it would be like this, basicallyv podstatě tightlytěsně centeredna střed on one.
259
630000
2000
vypadá takto, v podstatě těsně vycentrované na jedné.
10:47
What you expectočekávat is basicallyv podstatě what you observeDodržujte.
260
632000
2000
To, co očekáváte je to, co vidíte.
10:49
This is distributionrozdělení as seenviděno in GermanyNěmecko --
261
634000
2000
Toto je rozložení je viděno v Německu -
10:51
very differentodlišný, it's shiftedposunuté to the left.
262
636000
2000
velmi odlišné - posunuté doleva.
10:53
People talkedmluvil about it twicedvakrát lessméně as it should have been.
263
638000
3000
Lidé o tom mluvili dvakrát méně, než by měli.
10:56
But much more importantlydůležité, the distributionrozdělení is much widerširší.
264
641000
2000
Ale co je ještě důležitější, rozdělení je mnohem širší.
10:58
There are manymnoho people who endkonec up on the fardaleko left on this distributionrozdělení
265
643000
3000
Mnoho lidí se umístilo daleko vlevo na této škále a o nich
11:01
who are talkedmluvil about 10 timesčasy fewerméně than they should have been.
266
646000
3000
se mluvilo 10 krát méně, než by se mělo.
11:04
But then alsotaké manymnoho people on the fardaleko right
267
649000
2000
Mnoho lidí se ale také umístilo daleko
11:06
who seemzdát se to benefitvýhoda from propagandapropaganda.
268
651000
2000
v pravo, které podporovala propaganda.
11:08
This pictureobrázek is the hallmarkCharakteristickým znakem of censorshipcenzura in the bookrezervovat recordzáznam.
269
653000
3000
Tento obrázek je znak cenzury v knihách.
11:11
ELAELA: So culturomicsculturomics
270
656000
2000
ELA: Tuto metodu
11:13
is what we call this methodmetoda.
271
658000
2000
nazýváme kulturomikou.
11:15
It's kinddruh of like genomicsgenomika.
272
660000
2000
Je to trochu jako genomika.
11:17
ExceptS výjimkou genomicsgenomika is a lensobjektiv on biologybiologie
273
662000
2000
S tím rozdílem, že genomika je biologie, nahlížena
11:19
throughpřes the windowokno of the sequencesekvence of baseszáklady in the humančlověk genomegenomu.
274
664000
3000
skrze pohled na posloupnosti bází lidského genomu.
11:22
CulturomicsCulturomics is similarpodobný.
275
667000
2000
Kulturomika je podobná.
11:24
It's the applicationaplikace of massive-scaleobrovský rozsah datadata collectionsbírka analysisanalýza
276
669000
3000
Aplikuje analyzu masivní sbírky dat
11:27
to the studystudie of humančlověk culturekultura.
277
672000
2000
ke studiu lidské kultury.
11:29
Here, insteadmísto toho of throughpřes the lensobjektiv of a genomegenomu,
278
674000
2000
Zde však namísto pohledu skrze lidský genom
11:31
throughpřes the lensobjektiv of digitizeddigitalizovat pieceskousky of the historicalhistorický recordzáznam.
279
676000
3000
nahlížíme člověka skrze digitální kusy historických záznamů.
11:34
The great thing about culturomicsculturomics
280
679000
2000
Na kulturomice je skvělé to,
11:36
is that everyonekaždý can do it.
281
681000
2000
že se jí může věnovat každý.
11:38
Why can everyonekaždý do it?
282
683000
2000
Jak to?
11:40
EveryoneKaždý can do it because threetři guys,
283
685000
2000
Je to možné díky třem chlapíkům,
11:42
JonJon OrwantOrwant, MattMatt GrayŠedá and Will BrockmanBrockman over at GoogleGoogle,
284
687000
3000
Jonovi Orwantovi, Mattotvi Graymu a Willovi Brockmanovi z Googlu,
11:45
saw the prototypeprototyp of the NgramNgramů ViewerProhlížeč,
285
690000
2000
kteří, když viděli prototyp Ngrame Vieweru,
11:47
and they said, "This is so funzábava.
286
692000
2000
řekli, "Tohle je fakt supr,
11:49
We have to make this availabledostupný for people."
287
694000
3000
tuhle věc musíme dostat k lidem."
11:52
So in two weekstýdny flatploché -- the two weekstýdny before our paperpapír camepřišel out --
288
697000
2000
Takže dva týdny před tím, než jsme vydali svou studii
11:54
they codedkódované up a versionverze of the NgramNgramů ViewerProhlížeč for the generalVšeobecné publicveřejnost.
289
699000
3000
vytvořili kódy pro verzi Ngram Vieweru, která by byla dostupná
11:57
And so you too can typetyp in any wordslovo or phrasefráze that you're interestedzájem in
290
702000
3000
všem. Takže i vy si můžete napsat jakoukoliv frázi či slovo, které vás
12:00
and see its n-gramn gramové immediatelyihned --
291
705000
2000
zajímá a vidět je okamžitě v n-gramu
12:02
alsotaké browseProcházet examplespříklady of all the variousrozličný booksknihy
292
707000
2000
a také si zabrouzdat ukázkou všech možných
12:04
in whichkterý your n-gramn gramové appearsobjeví se.
293
709000
2000
knih, ve kterých se Váš n-gram vyskytuje.
12:06
JMJM: Now this was used over a millionmilión timesčasy on the first day,
294
711000
2000
JM: Během prvního dne byly užity více než
12:08
and this is really the bestnejlepší of all the queriesdotazy.
295
713000
2000
miliónkrát a to je nejlepší ze všech statistik.
12:10
So people want to be theirjejich bestnejlepší, put theirjejich bestnejlepší footnoha forwardvpřed.
296
715000
3000
Takže lidé chtějí být co nejlepší a dělat to nejlepší.
12:13
But it turnsotočí out in the 18thth centurystoletí, people didn't really carepéče about that at all.
297
718000
3000
Ale ukazuje se, že v 18. století se o to lidé o toto nezajímali.
12:16
They didn't want to be theirjejich bestnejlepší, they wanted to be theirjejich beftbeft.
298
721000
3000
Nechtěli být co nejlepší. Chtěli být co "nejlepčí".
12:19
So what happenedStalo is, of coursechod, this is just a mistakechyba.
299
724000
3000
To, co jste viděli byla samozřejmě chyba.
12:22
It's not that stroveusiloval for mediocrityprostřednost,
300
727000
2000
Není to pokus o jakousi prostřednost.
12:24
it's just that the S used to be writtenpsaný differentlyjinak, kinddruh of like an F.
301
729000
3000
Spousta slov se historicky psala s jinými písmeny. Například S jako Beta,
12:27
Now of coursechod, GoogleGoogle didn't pickvýběr this up at the time,
302
732000
3000
v angličtině jako F apod. Google si to samozřejmě
12:30
so we reportedhlášení this in the scienceVěda articlečlánek that we wrotenapsal.
303
735000
3000
sám od sebe nepřeložil a tak jsme to popsali ve vědedckém
12:33
But it turnsotočí out this is just a reminderpřipomenutí
304
738000
2000
článku, který jsme vydali. Ale ukázalo se,
12:35
that, althoughAčkoli this is a lot of funzábava,
305
740000
2000
že je to připomínka, toho, že i když
12:37
when you interpretinterpretovat these graphsgrafy, you have to be very carefulopatrně,
306
742000
2000
je to celé velká zábava, když interpretujete tyto grafy,
12:39
and you have to adoptpřijmout the basebáze standardsstandardy in the sciencesvědy.
307
744000
3000
musíte být velmi opatrní a použít to nejlepší co věda nabízí.
12:42
ELAELA: People have been usingpoužitím this for all kindsdruhy of funzábava purposesúčely.
308
747000
3000
ELA: Lidé to využívali pro mnoho rozličných zábavných účelů.
12:45
(LaughterSmích)
309
750000
7000
(Smích)
12:52
ActuallyVe skutečnosti, we're not going to have to talk,
310
757000
2000
Ve skutečnosti nebudeme muset ani
12:54
we're just going to showshow you all the slidesdiapozitivy and remainzůstat silenttichý.
311
759000
3000
moc mluvit, jen Vám ukážeme zbylé slidy a můžeme mlčet.
12:57
This personosoba was interestedzájem in the historydějiny of frustrationfrustrace.
312
762000
3000
Tato osoba se zajímala o historii frustrace.
13:00
There's variousrozličný typestypy of frustrationfrustrace.
313
765000
3000
Jsou různé typy frustrací.
13:03
If you stubse zakázaným inzerováním your toeToe, that's a one A "arghArgh."
314
768000
3000
Pokud se praštíte do palce, zakřičíte "argh".
13:06
If the planetplaneta EarthZemě is annihilatedzničena by the VogonsVogoni
315
771000
2000
Pokud planetu Zemi zničí Vogoni, aby
13:08
to make roompokoj, místnost for an interstellarmezihvězdný bypassobejít,
316
773000
2000
si udělali prostor pro mezihvězdný bypass,
13:10
that's an eightosm A "aaaaaaaarghaaaaaaaargh."
317
775000
2000
bude to osmimístné "aaaaaaaargh."
13:12
This personosoba studiesstudie all the "arghsarghs,"
318
777000
2000
Tato osoba studovala všechny "arghy."
13:14
from one throughpřes eightosm A'sÁčka.
319
779000
2000
od jednoho po osmimístné.
13:16
And it turnsotočí out
320
781000
2000
A ukázalo se, že
13:18
that the less-frequentméně často "arghsarghs"
321
783000
2000
méně frekventovaná "argh"
13:20
are, of coursechod, the onesty that correspondodpovídají to things that are more frustratingfrustrující --
322
785000
3000
se pochopitelně váží k více frustrujícím situacím, s jednou zvláštní výjimkou
13:23
exceptaž na, oddlypodivně, in the earlybrzy 80s.
323
788000
3000
v 80. letech.
13:26
We think that mightmohl have something to do with ReaganReagan.
324
791000
2000
Domníváme se, že to bude mít něco společného s Reaganem.
13:28
(LaughterSmích)
325
793000
2000
(Smích)
13:30
JMJM: There are manymnoho usagespoužití of this datadata,
326
795000
3000
JM: Tato data mají mnohotvárné využití,
13:33
but the bottomdno linečára is that the historicalhistorický recordzáznam is beingbytost digitizeddigitalizovat.
327
798000
3000
ale základ je vždy digitalizace historických záznamů.
13:36
GoogleGoogle has startedzačal to digitizedigitalizovat 15 millionmilión booksknihy.
328
801000
2000
Google začal a zdigitalizoval 15 miliónů knih.
13:38
That's 12 percentprocent of all the booksknihy that have ever been publishedpublikováno.
329
803000
2000
To je 12 procent všech knih, které kdy byly vydané.
13:40
It's a sizablerozměrné chunkkus of humančlověk culturekultura.
330
805000
3000
To je slušný kousek z lidské kultury.
13:43
There's much more in culturekultura: there's manuscriptsrukopisy, there newspapersnoviny,
331
808000
3000
Ale kultura má mnohem víc: manuskripty, noviny,
13:46
there's things that are not texttext, like artumění and paintingsobrazy.
332
811000
2000
věci, které nejsou v textech - jako umění a obrazy.
13:48
These all happenpřihodit se to be on our computerspočítačů,
333
813000
2000
Ale všechny se nalézají v nějaké podobě
13:50
on computerspočítačů acrosspřes the worldsvět.
334
815000
2000
v našich počítačech kolem světa.
13:52
And when that happensse děje, that will transformpřeměnit the way we have
335
817000
3000
A až budou všechny zdigitalizované, nastane změna
13:55
to understandrozumět our pastminulost, our presentsoučasnost, dárek and humančlověk culturekultura.
336
820000
2000
v chápání naší minulosti, současnosti a kultury lidstva.
13:57
Thank you very much.
337
822000
2000
Velice Vám děkuji.
13:59
(ApplausePotlesk)
338
824000
3000
(potlesk)
Translated by Irena Svobodová
Reviewed by Petr Frish

▲Back to top

ABOUT THE SPEAKERS
Jean-Baptiste Michel - Data researcher
Jean-Baptiste Michel looks at how we can use large volumes of data to better understand our world.

Why you should listen

Jean-Baptiste Michel holds joint academic appointments at Harvard (FQEB Fellow) and Google (Visiting Faculty). His research focusses on using large volumes of data as tools that help better understand the world around us -- from the way diseases progress in patients over years, to the way cultures change in human societies over centuries. With his colleague Erez Lieberman Aiden, Jean-Baptiste is a Founding Director of Harvard's Cultural Observatory, where their research team pioneers the use of quantitative methods for the study of human culture, language and history. His research was featured on the covers of Science and Nature, on the front pages of the New York Times and the Boston Globe, in The Economist, Wired and many other venues. The online tool he helped create -- ngrams.googlelabs.com -- was used millions of times to browse cultural trends. Jean-Baptiste is an Engineer from Ecole Polytechnique (Paris), and holds an MS in Applied Mathematics and a PhD in Systems Biology from Harvard.

More profile about the speaker
Jean-Baptiste Michel | Speaker | TED.com
Erez Lieberman Aiden - Researcher
Erez Lieberman Aiden pursues a broad range of research interests, spanning genomics, linguistics, mathematics ...

Why you should listen

Erez Lieberman Aiden is a fellow at the Harvard Society of Fellows and Visiting Faculty at Google. His research spans many disciplines and has won numerous awards, including recognition for one of the top 20 "Biotech Breakthroughs that will Change Medicine", by Popular Mechanics; the Lemelson-MIT prize for the best student inventor at MIT; the American Physical Society's Award for the Best Doctoral Dissertation in Biological Physics; and membership in Technology Review's 2009 TR35, recognizing the top 35 innovators under 35. His last three papers -- two with JB Michel -- have all appeared on the cover of Nature and Science.

More profile about the speaker
Erez Lieberman Aiden | Speaker | TED.com