ABOUT THE SPEAKERS
Jean-Baptiste Michel - Data researcher
Jean-Baptiste Michel looks at how we can use large volumes of data to better understand our world.

Why you should listen

Jean-Baptiste Michel holds joint academic appointments at Harvard (FQEB Fellow) and Google (Visiting Faculty). His research focusses on using large volumes of data as tools that help better understand the world around us -- from the way diseases progress in patients over years, to the way cultures change in human societies over centuries. With his colleague Erez Lieberman Aiden, Jean-Baptiste is a Founding Director of Harvard's Cultural Observatory, where their research team pioneers the use of quantitative methods for the study of human culture, language and history. His research was featured on the covers of Science and Nature, on the front pages of the New York Times and the Boston Globe, in The Economist, Wired and many other venues. The online tool he helped create -- ngrams.googlelabs.com -- was used millions of times to browse cultural trends. Jean-Baptiste is an Engineer from Ecole Polytechnique (Paris), and holds an MS in Applied Mathematics and a PhD in Systems Biology from Harvard.

More profile about the speaker
Jean-Baptiste Michel | Speaker | TED.com
Erez Lieberman Aiden - Researcher
Erez Lieberman Aiden pursues a broad range of research interests, spanning genomics, linguistics, mathematics ...

Why you should listen

Erez Lieberman Aiden is a fellow at the Harvard Society of Fellows and Visiting Faculty at Google. His research spans many disciplines and has won numerous awards, including recognition for one of the top 20 "Biotech Breakthroughs that will Change Medicine", by Popular Mechanics; the Lemelson-MIT prize for the best student inventor at MIT; the American Physical Society's Award for the Best Doctoral Dissertation in Biological Physics; and membership in Technology Review's 2009 TR35, recognizing the top 35 innovators under 35. His last three papers -- two with JB Michel -- have all appeared on the cover of Nature and Science.

More profile about the speaker
Erez Lieberman Aiden | Speaker | TED.com
TEDxBoston 2011

Jean-Baptiste Michel + Erez Lieberman Aiden: What we learned from 5 million books

Czego nauczyliśmy się z 5 milionów książek

Filmed:
2,049,453 views

Bawiliście się Ngram Viewerem od Google? To wciągające narzędzie, które pozwala na wyszukiwanie słów i pomysłów w bazie danych obejmującej 5 milionów książek z różnych wieków. Erez Lieberman Aiden i Jean-Baptiste Michel pokazują nam jak to działa i kilka zaskakujących rzeczy, których możemy się dowiedzieć z 500 miliardów słów.
- Data researcher
Jean-Baptiste Michel looks at how we can use large volumes of data to better understand our world. Full bio - Researcher
Erez Lieberman Aiden pursues a broad range of research interests, spanning genomics, linguistics, mathematics ... Full bio

Double-click the English transcript below to play the video.

00:15
ErezErez LiebermanLieberman AidenAiden: EveryoneKażdy knowswie
0
0
2000
Erez Lieberman Aiden: Każdy wie,
00:17
that a pictureobrazek is worthwartość a thousandtysiąc wordssłowa.
1
2000
3000
że jeden obraz jest wart tysiąca słów.
00:22
But we at HarvardHarvard
2
7000
2000
Ale my na Harvardzie
00:24
were wonderingpełen zdumienia if this was really trueprawdziwe.
3
9000
3000
zastanawialiśmy się, czy to rzeczywiście prawda.
00:27
(LaughterŚmiech)
4
12000
2000
(Śmiech)
00:29
So we assembledzmontowany a teamzespół of expertseksperci,
5
14000
4000
Więc zebraliśmy zespół ekspertów,
00:33
spanningrozpiętość HarvardHarvard, MITMIT,
6
18000
2000
obejmujący Harvard, MIT,
00:35
The AmericanAmerykański HeritageDziedzictwo DictionarySłownik, The EncyclopediaEncyklopedia BritannicaBritannica
7
20000
3000
słownik American Heritage Dictionary, encyklopedię Britannica,
00:38
and even our prouddumny sponsorssponsorów,
8
23000
2000
a nawet naszych dumnych sponsorów -
00:40
the GoogleGoogle.
9
25000
3000
Google.
00:43
And we cogitatedcogitated about this
10
28000
2000
I rozmyślaliśmy nad tym
00:45
for about fourcztery yearslat.
11
30000
2000
przez około czterech lat.
00:47
And we cameoprawa ołowiana witrażu to a startlingzaskakujące conclusionwniosek.
12
32000
5000
I doszliśmy do zaskakującego wniosku.
00:52
LadiesPanie and gentlemenpanowie, a pictureobrazek is not worthwartość a thousandtysiąc wordssłowa.
13
37000
3000
Panie i panowie, obraz nie jest wart tysiąca słów.
00:55
In factfakt, we founduznany some pictureskino
14
40000
2000
W rzeczywistości dowiedzieliśmy się, że niektóre obrazy
00:57
that are worthwartość 500 billionmiliard wordssłowa.
15
42000
5000
są warte 500 miliardów słów.
01:02
Jean-BaptisteJean-Baptiste MichelMichel: So how did we get to this conclusionwniosek?
16
47000
2000
Jean-Baptiste Michel: Więc jak doszliśmy do tego wniosku?
01:04
So ErezErez and I were thinkingmyślący about wayssposoby
17
49000
2000
Erez i ja myśleliśmy o sposobach
01:06
to get a bigduży pictureobrazek of humanczłowiek culturekultura
18
51000
2000
uzyskania pełnego obrazu ludzkiej kultury
01:08
and humanczłowiek historyhistoria: changezmiana over time.
19
53000
3000
i historii: zmiany na przestrzeni lat.
01:11
So manywiele booksksiążki actuallytak właściwie have been writtenpisemny over the yearslat.
20
56000
2000
Tak wiele książek zostało napisanych przez lata.
01:13
So we were thinkingmyślący, well the bestNajlepiej way to learnuczyć się from them
21
58000
2000
Więc myśleliśmy, najlepszą drogą do nauczenia się z nich
01:15
is to readczytać all of these millionsmiliony of booksksiążki.
22
60000
2000
jest przeczytanie tych wszystkich milionów książek.
01:17
Now of coursekurs, if there's a scaleskala for how awesomeniesamowite that is,
23
62000
3000
Oczywiście jeśli jest skala tego, jak bardzo jest to wspaniałe,
01:20
that has to rankrangi extremelyniezwykle, extremelyniezwykle highwysoki.
24
65000
3000
musi się to plasować bardzo, bardzo wysoko.
01:23
Now the problemproblem is there's an X-axisOś x for that,
25
68000
2000
Problem polega na tym, że jest także oś X,
01:25
whichktóry is the practicalpraktyczny axis.
26
70000
2000
która jest osią praktyczności.
01:27
This is very, very lowNiska.
27
72000
2000
Ta jest bardzo, bardzo niska.
01:29
(ApplauseAplauz)
28
74000
3000
(Oklaski)
01:32
Now people tendzmierzać to use an alternativealternatywny approachpodejście,
29
77000
3000
Ludzie używają innego podejścia,
01:35
whichktóry is to take a fewkilka sourcesźródła and readczytać them very carefullyostrożnie.
30
80000
2000
które polega na wzięci kilku źródeł i przeczytania ich bardzo uważnie.
01:37
This is extremelyniezwykle practicalpraktyczny, but not so awesomeniesamowite.
31
82000
2000
To jest bardzo praktyczne, ale nie tak wspaniałe.
01:39
What you really want to do
32
84000
3000
Tak naprawdę chcielibyśmy
01:42
is to get to the awesomeniesamowite yetjeszcze practicalpraktyczny partczęść of this spaceprzestrzeń.
33
87000
3000
mieścić się w jednocześnie wspaniałej i praktycznej części tej przestrzeni.
01:45
So it turnsskręca out there was a companyfirma acrossprzez the riverrzeka callednazywa GoogleGoogle
34
90000
3000
Więc okazuje się, że była za morzem firma o nazwie Google,
01:48
who had startedRozpoczęty a digitizationdigitalizacja projectprojekt a fewkilka yearslat back
35
93000
2000
która zaczęła kilka lat temu projekt cyfryzacji,
01:50
that mightmoc just enablewłączyć this approachpodejście.
36
95000
2000
który może pozwolić na takie podejście.
01:52
They have digitizedzdigitalizowane millionsmiliony of booksksiążki.
37
97000
2000
Zcyfryzowali miliony książek.
01:54
So what that meansznaczy is, one could use computationalobliczeniowy methodsmetody
38
99000
3000
Oznacza to, że można by użyć metod obliczeniowych,
01:57
to readczytać all of the booksksiążki in a clickKliknij of a buttonprzycisk.
39
102000
2000
by przeczytać wszystkie te książki za jednym kliknięciem.
01:59
That's very practicalpraktyczny and extremelyniezwykle awesomeniesamowite.
40
104000
3000
To bardzo praktyczne i niezwykle wspaniałe.
02:03
ELAELA: Let me tell you a little bitkawałek about where booksksiążki come from.
41
108000
2000
ELA: Opowiem wam trochę o tym, skąd wzięły się książki.
02:05
SinceOd time immemorialodwieczny, there have been authorsautorski.
42
110000
3000
Od niepamiętnych czasów byli autorzy.
02:08
These authorsautorski have been strivingusiłujący to writepisać booksksiążki.
43
113000
3000
Ci autorzy pisali książki.
02:11
And this becamestał się considerablywydatnie easierłatwiejsze
44
116000
2000
A to stało się znacznie łatwiejsze
02:13
with the developmentrozwój of the printingdruk pressnaciśnij some centurieswieki agotemu.
45
118000
2000
z rozwojem prasy drukarskiej kilka wieków temu.
02:15
SinceOd then, the authorsautorski have wonwygrał
46
120000
3000
Od tego czasu, autorom udało sie
02:18
on 129 millionmilion distinctodrębny occasionsokazje,
47
123000
2000
129 milionów razy
02:20
publishingwydawniczy booksksiążki.
48
125000
2000
wydać książkę.
02:22
Now if those booksksiążki are not lostStracony to historyhistoria,
49
127000
2000
Jeśli te książki nie są stracone dla historii,
02:24
then they are somewheregdzieś in a librarybiblioteka,
50
129000
2000
wówczas są gdzieś w bibliotece,
02:26
and manywiele of those booksksiążki have been gettinguzyskiwanie retrievedŹródło from the librariesbiblioteki
51
131000
3000
a wiele z tych książek zostało wyciągniętych z bibliotek
02:29
and digitizedzdigitalizowane by GoogleGoogle,
52
134000
2000
i zcyfryzowanych przez Google,
02:31
whichktóry has scannedzeskanowany 15 millionmilion booksksiążki to datedata.
53
136000
2000
które do dzisiejszego dnia zeskanowało 15 milionów książek.
02:33
Now when GoogleGoogle digitizesprzekształca a bookksiążka, they put it into a really nicemiły formatformat.
54
138000
3000
Kiedy Google zmienia postać książki na cyfrową, umieszcza ją w bardzo ładnym formacie.
02:36
Now we'vemamy got the datadane, plusplus we have metadatametadane.
55
141000
2000
Mamy teraz dane, plus mamy metadane.
02:38
We have informationInformacja about things like where was it publishedopublikowany,
56
143000
3000
Mamy informacje o rzeczach takich jak gdzie została ona wydana,
02:41
who was the authorautor, when was it publishedopublikowany.
57
146000
2000
kim był autor, kiedy była ona wydana.
02:43
And what we do is go throughprzez all of those recordsdokumentacja
58
148000
3000
I przechodzimy przez te wszystkie zapisy
02:46
and excludeWyklucz everything that's not the highestnajwyższy qualityjakość datadane.
59
151000
4000
i wykluczamy wszystko, co nie jest danymi najwyższej jakości.
02:50
What we're left with
60
155000
2000
Zostajemy ze
02:52
is a collectionkolekcja of fivepięć millionmilion booksksiążki,
61
157000
3000
zbiorem pięciu milionów książek,
02:55
500 billionmiliard wordssłowa,
62
160000
3000
500 miliardów słów,
02:58
a stringstrunowy of characterspostacie a thousandtysiąc timesczasy longerdłużej
63
163000
2000
ciąg znaków tysiąc razy dłuższy
03:00
than the humanczłowiek genomegenom --
64
165000
3000
niż ludzki genom -
03:03
a texttekst whichktóry, when writtenpisemny out,
65
168000
2000
tekst który, po jego zapisaniu,
03:05
would stretchrozciągać from here to the MoonKsiężyc and back
66
170000
2000
rozciągałby się stąd do księżyca i z powrotem
03:07
10 timesczasy over --
67
172000
2000
10 razy -
03:09
a veritableistne shardOdłamek of our culturalkulturalny genomegenom.
68
174000
4000
prawdziwy kryształ naszego genomu kulturowego.
03:13
Of coursekurs what we did
69
178000
2000
Oczywiście to, co zrobiliśmy
03:15
when facedw obliczu with suchtaki outrageousskandaliczny hyperbolehiperbola ...
70
180000
3000
w obliczu takiej wygórowanej hiperboli...
03:18
(LaughterŚmiech)
71
183000
2000
(Śmiech)
03:20
was what any self-respectingszanujący researchersnaukowcy
72
185000
3000
było tym, co każdy szanujący się naukowiec
03:23
would have doneGotowe.
73
188000
3000
by zrobił.
03:26
We tookwziął a pagestrona out of XKCDXKCD,
74
191000
2000
Wzięliśmy pasek komiksu o nauce XKDC
03:28
and we said, "StandStojak back.
75
193000
2000
i powiedzieliśmy, "Cofnijcie się.
03:30
We're going to try sciencenauka."
76
195000
2000
Spróbujemy nauki."
03:32
(LaughterŚmiech)
77
197000
2000
(Śmiech)
03:34
JMJM: Now of coursekurs, we were thinkingmyślący,
78
199000
2000
JM: Oczywiście myśleliśmy
03:36
well let's just first put the datadane out there
79
201000
2000
o tym, by wydobyć dane
03:38
for people to do sciencenauka to it.
80
203000
2000
dla ludzi, by zrobili z nimi naukę.
03:40
Now we're thinkingmyślący, what datadane can we releasewydanie?
81
205000
2000
Teraz pomyśleliśmy jakie dane możemy uwolnić?
03:42
Well of coursekurs, you want to take the booksksiążki
82
207000
2000
Oczywiście chcemy wziąć książki
03:44
and releasewydanie the fullpełny texttekst of these fivepięć millionmilion booksksiążki.
83
209000
2000
i uwolnić pełny tekst tych pięciu milionów książek.
03:46
Now GoogleGoogle, and JonJon OrwantOrwant in particularszczególny,
84
211000
2000
Google i Jon Orwant w szczególności
03:48
told us a little equationrównanie that we should learnuczyć się.
85
213000
2000
powiedział nam o małym równaniu, które powinniśmy zapamiętać.
03:50
So you have fivepięć millionmilion, that is, fivepięć millionmilion authorsautorski
86
215000
3000
Więc mamy pięć milionów, to znaczy, pięć milionów autorów
03:53
and fivepięć millionmilion plaintiffsPowodowie is a massivemasywny lawsuitpozew sądowy.
87
218000
3000
a pięć milionów powodów to wielki pozew.
03:56
So, althoughmimo że that would be really, really awesomeniesamowite,
88
221000
2000
Więc choć byłoby to naprawdę, naprawdę wspaniałe
03:58
again, that's extremelyniezwykle, extremelyniezwykle impracticalniepraktyczny.
89
223000
3000
znów, jest to bardzo, bardzo niepraktyczne.
04:01
(LaughterŚmiech)
90
226000
2000
(Śmiech)
04:03
Now again, we kinduprzejmy of cavedzawalił in,
91
228000
2000
Jakoś się poddaliśmy
04:05
and we did the very practicalpraktyczny approachpodejście, whichktóry was a bitkawałek lessmniej awesomeniesamowite.
92
230000
3000
i zastosowaliśmy to bardzo praktyczne podejście, które było troszkę mniej wspaniałe.
04:08
We said, well insteadzamiast of releasingzwolnienie the fullpełny texttekst,
93
233000
2000
Powiedzieliśmy, cóż zamiast uwalniania pełnego tekstu,
04:10
we're going to releasewydanie statisticsStatystyka about the booksksiążki.
94
235000
2000
uwolnimy statystyki dotyczące książek.
04:12
So take for instanceinstancja "A gleamblask of happinessszczęście."
95
237000
2000
Weźmy na przykład "błysk szczęścia"
04:14
It's fourcztery wordssłowa; we call that a four-gramcztery gram.
96
239000
2000
To dwa słowa. Nazywamy to dwugramem.
04:16
We're going to tell you how manywiele timesczasy a particularszczególny four-gramcztery gram
97
241000
2000
Powiemy wam jak wiele razy poszczególny czterogram
04:18
appearedpojawił się in booksksiążki in 1801, 1802, 1803,
98
243000
2000
pojawił się w książkach w 1801, 1802, 1803,
04:20
all the way up to 2008.
99
245000
2000
aż do 2008.
04:22
That givesdaje us a time seriesseria
100
247000
2000
Daje nam to szereg czasowy
04:24
of how frequentlyczęsto this particularszczególny sentencezdanie was used over time.
101
249000
2000
częstotliwości pojawiania się tego konkretnego zdania w ciągu tych lat.
04:26
We do that for all the wordssłowa and phrasesZwroty that appearzjawić się in those booksksiążki,
102
251000
3000
Robimy to dla wszystkich słów i zwrotów, które występują w tych książkach,
04:29
and that givesdaje us a bigduży tablestół of two billionmiliard lineskwestia
103
254000
3000
a to daje nam wielką tabelę z dwóch miliardów linijek,
04:32
that tell us about the way culturekultura has been changingwymiana pieniędzy.
104
257000
2000
która mówi nam o sposobie, w jaki zmieniała się kultura.
04:34
ELAELA: So those two billionmiliard lineskwestia,
105
259000
2000
ELA: Więc te dwa miliardy wierszy,
04:36
we call them two billionmiliard n-gramsn gramów.
106
261000
2000
nazywamy jest dwoma miliardami n-gramów.
04:38
What do they tell us?
107
263000
2000
Co nam mówią?
04:40
Well the individualindywidualny n-gramsn gramów measurezmierzyć culturalkulturalny trendstrendy.
108
265000
2000
Poszczególne n-gramy mierzą trendy kulturowe.
04:42
Let me give you an exampleprzykład.
109
267000
2000
Pozwólcie, że podam wam przykład.
04:44
Let's supposeprzypuszczać that I am thrivingkwitnie,
110
269000
2000
Załóżmy, że kwitnę,
04:46
then tomorrowjutro I want to tell you about how well I did.
111
271000
2000
a jutro będę chciał wam powiedzieć jak dobrze mi poszło.
04:48
And so I mightmoc say, "YesterdayWczoraj, I throvethrove."
112
273000
3000
Więc mogę powiedzieć "Wczoraj kwitłem."
04:51
AlternativelyAlternatywnie, I could say, "YesterdayWczoraj, I thrivedkwitła."
113
276000
3000
Względnie, mogę powiedzieć "Wczoraj kwitnąłem."
04:54
Well whichktóry one should I use?
114
279000
3000
Którego z tych zwrotów powinienem użyć?
04:57
How to know?
115
282000
2000
Skąd to wiedzieć?
04:59
As of about sixsześć monthsmiesiące agotemu,
116
284000
2000
Około sześć miesięcy temu,
05:01
the statestan of the artsztuka in this fieldpole
117
286000
2000
praktyką w tej dziedzinie
05:03
is that you would, for instanceinstancja,
118
288000
2000
było, na przykład,
05:05
go up to the followingnastępujący psychologistpsycholog with fabulousfantastyczny hairwłosy,
119
290000
2000
pójście do tego psychologa z fantstycznymi włosami
05:07
and you'dty byś say,
120
292000
2000
i powiedzenie:
05:09
"SteveSteve, you're an expertekspert on the irregularnieregularny verbsCzasowniki.
121
294000
3000
"Steve, jesteś ekspertem od czasowników nieregularnych.
05:12
What should I do?"
122
297000
2000
Co powinienem zrobić?"
05:14
And he'don by tell you, "Well mostwiększość people say thrivedkwitła,
123
299000
2000
A on by powiedział "Cóż, większość ludzi mówi "kwitnąć",
05:16
but some people say throvethrove."
124
301000
3000
ale niektórzy mówią "kwiść".
05:19
And you alsorównież knewwiedziałem, more or lessmniej,
125
304000
2000
I wiadomo także było,
05:21
that if you were to go back in time 200 yearslat
126
306000
3000
że jeśli cofnąłbyś się w czasie o 200 lat
05:24
and askzapytać the followingnastępujący statesmanmąż stanu with equallyna równi fabulousfantastyczny hairwłosy,
127
309000
3000
i spytał tego męża stanu z równie fantastycznymi włosami,
05:27
(LaughterŚmiech)
128
312000
3000
(Śmiech)
05:30
"TomTom, what should I say?"
129
315000
2000
"Tom, co powinienem zrobić?"
05:32
He'dTo on say, "Well, in my day, mostwiększość people throvethrove,
130
317000
2000
Powiedziałby, "Cóż, w moich czasach, większość ludzi kwitła,
05:34
but some thrivedkwitła."
131
319000
3000
ale niektórzy kwitnęli."
05:37
So now what I'm just going to showpokazać you is rawsurowy datadane.
132
322000
2000
Teraz pokażę wam surowe dane.
05:39
Two rowswiersze from this tablestół of two billionmiliard entrieswpisy.
133
324000
4000
Dwa wiersze z tej tabeli dwóch miliardów danych.
05:43
What you're seeingwidzenie is yearrok by yearrok frequencyczęstotliwość
134
328000
2000
Widzicie częstotliwość z roku na rok
05:45
of "thrivedkwitła" and "throvethrove" over time.
135
330000
3000
"kwitnęłem" i "kwitnąłem" na przestrzeni czasu.
05:49
Now this is just two
136
334000
2000
To tylko dwa
05:51
out of two billionmiliard rowswiersze.
137
336000
3000
z dwóch miliardów wierszy.
05:54
So the entireCały datadane setzestaw
138
339000
2000
Więc cały zestaw danych
05:56
is a billionmiliard timesczasy more awesomeniesamowite than this slideślizgać się.
139
341000
3000
jest miliard razy wspanialszy niż tej slajd.
05:59
(LaughterŚmiech)
140
344000
2000
(Śmiech)
06:01
(ApplauseAplauz)
141
346000
4000
(Oklaski)
06:05
JMJM: Now there are manywiele other pictureskino that are worthwartość 500 billionmiliard wordssłowa.
142
350000
2000
JM:Jest wiele innych obrazków, które są warte 500 miliardów słów.
06:07
For instanceinstancja, this one.
143
352000
2000
Na przykład ten.
06:09
If you just take influenzagrypa,
144
354000
2000
Jeśli weźmiecie grypę,
06:11
you will see peaksszczyty at the time where you knewwiedziałem
145
356000
2000
zobaczycie wzrosty w czasie, kiedy wiadomo,
06:13
bigduży flugrypa epidemicsepidemie were killingzabicie people around the globeglob.
146
358000
3000
że wielkie epidemie grypy zabijały ludzi na świecie.
06:16
ELAELA: If you were not yetjeszcze convincedprzekonany,
147
361000
3000
ELA: Jeśli jeszcze nie jesteście przekonani,
06:19
seamorze levelspoziomy are risingpodniesienie,
148
364000
2000
poziomy morza się podnoszą,
06:21
so is atmosphericatmosferyczny COCO2 and globalświatowy temperaturetemperatura.
149
366000
3000
tak samo jak poziom CO2 w atmosferze i temperatura na Ziemi.
06:24
JMJM: You mightmoc alsorównież want to have a look at this particularszczególny n-gramn gramów,
150
369000
3000
JM: Moglibyście także chcieć się przyjrzeć temu n-gramowi,
06:27
and that's to tell NietzscheNietzsche that God is not deadnie żyje,
151
372000
3000
żeby powiedzieć Nietzschemu, że Bóg nie umarł,
06:30
althoughmimo że you mightmoc agreeZgodzić się that he mightmoc need a better publicistpublicysta.
152
375000
3000
choć moglibyście się zgodzić, że potrzebuje lepszego publicysty.
06:33
(LaughterŚmiech)
153
378000
2000
(Śmiech)
06:35
ELAELA: You can get at some prettyładny abstractabstrakcyjny conceptskoncepcje with this sortsortować of thing.
154
380000
3000
ELA: Można dojść do całkiem abstrakcyjnych koncepcji z takimi rzeczami.
06:38
For instanceinstancja, let me tell you the historyhistoria
155
383000
2000
Na przykład, opowiem wam historię
06:40
of the yearrok 1950.
156
385000
2000
roku 1950.
06:42
PrettyŁadny much for the vastogromny majoritywiększość of historyhistoria,
157
387000
2000
Przez większość historii,
06:44
no one gavedał a damncholerny about 1950.
158
389000
2000
nikogo nie obchodził 1950.
06:46
In 1700, in 1800, in 1900,
159
391000
2000
W 1700, 1800, w 1900,
06:48
no one caredpod opieką.
160
393000
3000
nikt się nie przejmował.
06:52
ThroughPoprzez the 30s and 40s,
161
397000
2000
W latach 30-tych i 40-tych,
06:54
no one caredpod opieką.
162
399000
2000
nikt się nie przejmował.
06:56
SuddenlyNagle, in the mid-Środek-40s,
163
401000
2000
Nagle, w połowie lat 40-tych
06:58
there startedRozpoczęty to be a buzzBuzz.
164
403000
2000
zrobił się wokół tego szum.
07:00
People realizedrealizowany that 1950 was going to happenzdarzyć,
165
405000
2000
Ludzie zdali sobie sprawę, że 1950 nadejdzie
07:02
and it could be bigduży.
166
407000
2000
i może być czymś wielkim.
07:04
(LaughterŚmiech)
167
409000
3000
(Śmiech)
07:07
But nothing got people interestedzainteresowany in 1950
168
412000
3000
Ale nic nie interesowało ludzi w 1950 tak,
07:10
like the yearrok 1950.
169
415000
3000
jak rok 1950.
07:13
(LaughterŚmiech)
170
418000
3000
(Śmiech)
07:16
People were walkingpieszy around obsessedobsesję.
171
421000
2000
Ludzie chodzili jak opętami.
07:18
They couldn'tnie mógł stop talkingmówić
172
423000
2000
Nie mogli przestać opowiadać
07:20
about all the things they did in 1950,
173
425000
3000
o wszystkich rzeczach, które robili w 1950,
07:23
all the things they were planningplanowanie to do in 1950,
174
428000
3000
wszystkich rzeczach, które planowali zrobić w 1950,
07:26
all the dreamsmarzenia of what they wanted to accomplishukończyć in 1950.
175
431000
5000
wszystkich marzeniach o tym, co chcieli osiągnąć w 1950.
07:31
In factfakt, 1950 was so fascinatingfascynujący
176
436000
2000
W rzeczywistości 1950 był tak fascynujący,
07:33
that for yearslat thereafternastępnie,
177
438000
2000
że przez dwa lata po nim,
07:35
people just kepttrzymane talkingmówić about all the amazingniesamowity things that happenedstało się,
178
440000
3000
ludzie po prostu wciąż opowiadali o niezwykłych rzeczach, które się wydarzyły,
07:38
in '51, '52, '53.
179
443000
2000
w '51, '52, '53.
07:40
FinallyWreszcie in 1954,
180
445000
2000
Wreszcie w 1954
07:42
someonektoś wokeobudził up and realizedrealizowany
181
447000
2000
ktoś się ocknął i zdał sobie sprawę,
07:44
that 1950 had gottenzdobyć somewhatnieco passprzechodzićé.
182
449000
4000
że 1950 jest cokolwiek passe.
07:48
(LaughterŚmiech)
183
453000
2000
(Śmiech)
07:50
And just like that, the bubblebańka burstrozerwanie.
184
455000
2000
I tak pękła bańka.
07:52
(LaughterŚmiech)
185
457000
2000
(Śmiech)
07:54
And the storyfabuła of 1950
186
459000
2000
I historia 1950
07:56
is the storyfabuła of everykażdy yearrok that we have on recordrekord,
187
461000
2000
jest historią każdego roku, który mamy w zapisach,
07:58
with a little twistTwist, because now we'vemamy got these nicemiły chartswykresy.
188
463000
3000
z pewnym urozmaiceniem, ponieważ mamy te ładne wykresy.
08:01
And because we have these nicemiły chartswykresy, we can measurezmierzyć things.
189
466000
3000
A ponieważ mamy te ładne wykresy, możemy mierzyć różne rzeczy.
08:04
We can say, "Well how fastszybki does the bubblebańka burstrozerwanie?"
190
469000
2000
Możemy powiedzieć "Jak szybko pęka bańka?"
08:06
And it turnsskręca out that we can measurezmierzyć that very preciselydokładnie.
191
471000
3000
I okazuje się, że możemy to zmierzyć bardzo dokładnie.
08:09
EquationsRównania were derivedpochodny, graphswykresy were producedwytworzony,
192
474000
3000
Stworzony równania, narysowano wykresy
08:12
and the netnetto resultwynik
193
477000
2000
i wynik sieciowy jest taki,
08:14
is that we find that the bubblebańka burstswybuchy fasterszybciej and fasterszybciej
194
479000
3000
że bańka pęka szybko i szybciej
08:17
with eachkażdy passingprzechodzący yearrok.
195
482000
2000
z każdym mijającym rokiem.
08:19
We are losingprzegrywający interestzainteresowanie in the pastprzeszłość more rapidlyszybko.
196
484000
5000
Tracimy zainteresowanie przeszłością coraz szybciej.
08:24
JMJM: Now a little piecekawałek of careerkariera adviceRada.
197
489000
2000
JM: Teraz drobna rada dotycząca kariery.
08:26
So for those of you who seekszukać to be famoussławny,
198
491000
2000
Dla tych z was, którzy chcą zostać sławni,
08:28
we can learnuczyć się from the 25 mostwiększość famoussławny politicalpolityczny figuresfigury,
199
493000
2000
możemy się uczyć od 25 najsławniejszych polityków,
08:30
authorsautorski, actorsaktorzy and so on.
200
495000
2000
autorów, aktorów itd.
08:32
So if you want to becomestają się famoussławny earlywcześnie on, you should be an actoraktor,
201
497000
3000
Więc jeśli chcesz zostać sławny wcześnie, powinieneś być aktorem,
08:35
because then famesława startszaczyna się risingpodniesienie by the endkoniec of your 20s --
202
500000
2000
ponieważ wówczas sława zaczyna rosnąć do końca trzeciej dekady życia -
08:37
you're still youngmłody, it's really great.
203
502000
2000
wciąż jesteś młody, to naprawdę wspaniałe.
08:39
Now if you can wait a little bitkawałek, you should be an authorautor,
204
504000
2000
Teraz jeśli możesz trochę poczekać, powinieneś być autorem,
08:41
because then you risewzrost to very great heightswysokości,
205
506000
2000
ponieważ wówczas wzrasta się do prawdziwej wielkości,
08:43
like MarkMark TwainTWAIN, for instanceinstancja: extremelyniezwykle famoussławny.
206
508000
2000
jak na przykład Mark Twain: bardzo sławny.
08:45
But if you want to reachdosięgnąć the very topTop,
207
510000
2000
Ale jeśli chcesz osiągnąć sam szczyt,
08:47
you should delayopóźnienie gratificationgratyfikacja
208
512000
2000
powinieneś opóźnić gratyfikację
08:49
and, of coursekurs, becomestają się a politicianpolityk.
209
514000
2000
i, oczywiście, zostać politykiem.
08:51
So here you will becomestają się famoussławny by the endkoniec of your 50s,
210
516000
2000
Tak zostaniecie sławni do końca szóstej dekady życia,
08:53
and becomestają się very, very famoussławny afterwardpóźniej.
211
518000
2000
i zostaniecie bardzo, bardzo sławni potem.
08:55
So scientistsnaukowcy alsorównież tendzmierzać to get famoussławny when they're much olderstarsze.
212
520000
3000
Naukowcy także stają się sławni, jeśli są znacznie starsi.
08:58
Like for instanceinstancja, biologistsbiolodzy and physicsfizyka
213
523000
2000
Jak na przykład, biolodzy i fizycy
09:00
tendzmierzać to be almostprawie as famoussławny as actorsaktorzy.
214
525000
2000
są tak sławni jak aktorzy.
09:02
One mistakebłąd you should not do is becomestają się a mathematicianmatematyk.
215
527000
3000
Jedynym błędem, którego nie należy robić jest zostanie matematykiem.
09:05
(LaughterŚmiech)
216
530000
2000
(Śmiech
09:07
If you do that,
217
532000
2000
Jeśli to zrobisz,
09:09
you mightmoc think, "Oh great. I'm going to do my bestNajlepiej work when I'm in my 20s."
218
534000
3000
możesz myśleć: "Wspaniale, wykonam swoje najwspanialsze dzieła w wieku lat dwudziestu kilku".
09:12
But guessodgadnąć what, nobodynikt will really careopieka.
219
537000
2000
Ale wiecie co, nikogo to nie będzie obchodzić.
09:14
(LaughterŚmiech)
220
539000
3000
(Śmiech)
09:17
ELAELA: There are more soberingotrzeźwiający notesnotatki
221
542000
2000
ELA: Są bardziej otrzeźwiające informacje
09:19
amongpośród the n-gramsn gramów.
222
544000
2000
w n-gramach.
09:21
For instanceinstancja, here'soto jest the trajectorytrajektoria of MarcMarc ChagallChagall,
223
546000
2000
Na przykład, to trajektoria Marca Chagalla,
09:23
an artistartysta bornurodzony in 1887.
224
548000
2000
artysty urodzonego w 1887.
09:25
And this lookswygląda like the normalnormalna trajectorytrajektoria of a famoussławny personosoba.
225
550000
3000
Wygląda to jak normalna trajektoria dla sławnej osoby.
09:28
He getsdostaje more and more and more famoussławny,
226
553000
4000
Staje się bardziej i bardziej i bardziej sławny,
09:32
exceptz wyjątkiem if you look in GermanNiemiecki.
227
557000
2000
z
09:34
If you look in GermanNiemiecki, you see something completelycałkowicie bizarredziwaczne,
228
559000
2000
Jeśli sprawdzicie w Niemczech, zobaczycie coś dziwacznego,
09:36
something you prettyładny much never see,
229
561000
2000
coś, czego nigdy się nie obserwuje,
09:38
whichktóry is he becomesstaje się extremelyniezwykle famoussławny
230
563000
2000
staje się ona bardzo sławny,
09:40
and then all of a suddennagły plummetsspada,
231
565000
2000
a potem to zainteresowanie nagle spada,
09:42
going throughprzez a nadirNadir betweenpomiędzy 1933 and 1945,
232
567000
3000
przeżywając kryzys między 1933 i 1945,
09:45
before reboundingzbiórkach afterwardpóźniej.
233
570000
3000
by się potem znów odbić.
09:48
And of coursekurs, what we're seeingwidzenie
234
573000
2000
I oczywiście, to, co widzimy,
09:50
is the factfakt MarcMarc ChagallChagall was a JewishŻydowskie artistartysta
235
575000
3000
to fakt, że Marc Chagall był Żydowskim artystą
09:53
in NaziNazistowskich GermanyNiemcy.
236
578000
2000
w nazistowskich Niemczech.
09:55
Now these signalssygnały
237
580000
2000
Te sygnały
09:57
are actuallytak właściwie so strongsilny
238
582000
2000
są tak silne,
09:59
that we don't need to know that someonektoś was censoredocenzurowane.
239
584000
3000
że nie musimy wiedzieć, że ktoś był ocenzurowany.
10:02
We can actuallytak właściwie figurepostać it out
240
587000
2000
Możemy to wywnioskować
10:04
usingza pomocą really basicpodstawowy signalsygnał processingprzetwarzanie.
241
589000
2000
używając naprawdę podstawowego przetwarzania sygnałów.
10:06
Here'sTutaj jest a simpleprosty way to do it.
242
591000
2000
To prosty sposób.
10:08
Well, a reasonablerozsądny expectationoczekiwanie
243
593000
2000
Racjonalnym oczekiwaniem
10:10
is that somebody'sczyjś famesława in a givendany periodokres of time
244
595000
2000
jest to, że czyjaś sława w określonym okresie czasu
10:12
should be roughlyw przybliżeniu the averageśredni of theirich famesława before
245
597000
2000
powinna być średnią jego sławy przed
10:14
and theirich famesława after.
246
599000
2000
i po.
10:16
So that's sortsortować of what we expectoczekiwać.
247
601000
2000
Tego oczekujemy.
10:18
And we compareporównać that to the famesława that we observenależy przestrzegać.
248
603000
3000
I porównujemy to z obserwowaną sławą.
10:21
And we just dividepodzielić one by the other
249
606000
2000
Po prostu dzielimy jedno przez drugie
10:23
to produceprodukować something we call a suppressionTłumienie indexindeks.
250
608000
2000
by uzyskać coś, co nazywamy wskaźnikiem tłumienia.
10:25
If the suppressionTłumienie indexindeks is very, very, very smallmały,
251
610000
3000
Jeśli wskaźnik tłumienia jest bardzo, bardzo, bardzo mału,
10:28
then you very well mightmoc be beingistota suppressedstłumione.
252
613000
2000
wówczas możesz być rzeczywiście tłumiony.
10:30
If it's very largeduży, maybe you're benefitingkorzystających from propagandaPropaganda.
253
615000
3000
Jeśli jest bardzo wielki, może korzystasz na propagandzie.
10:34
JMJM: Now you can actuallytak właściwie look at
254
619000
2000
JM: Można spojrzeć
10:36
the distributiondystrybucja of suppressionTłumienie indexesindeksy over wholecały populationspopulacje.
255
621000
3000
na rozkład wskaźników tłumienia całej populacji.
10:39
So for instanceinstancja, here --
256
624000
2000
Więc na przykład tutaj -
10:41
this suppressionTłumienie indexindeks is for 5,000 people
257
626000
2000
wskaźnik tłumienia dla 5 000 osób
10:43
pickeddoborowy in EnglishAngielski booksksiążki where there's no knownznany suppressionTłumienie --
258
628000
2000
wybranych z angielskich książek, gdzie nie ma tłumienia, o którym byśmy wiedzieli -
10:45
it would be like this, basicallygruntownie tightlyciasno centeredwyśrodkowany on one.
259
630000
2000
będzie to wyglądało tak, ściśle upakowane koło jedynki.
10:47
What you expectoczekiwać is basicallygruntownie what you observenależy przestrzegać.
260
632000
2000
Obserwujemy to, czego byśmy oczekiwali.
10:49
This is distributiondystrybucja as seenwidziany in GermanyNiemcy --
261
634000
2000
To rozkład w Niemczech -
10:51
very differentróżne, it's shiftedprzesunięty to the left.
262
636000
2000
bardzo odmienny, przesunięty w lewo.
10:53
People talkedrozmawialiśmy about it twicedwa razy lessmniej as it should have been.
263
638000
3000
Ludzie mówili o tym dwa razy mniej niż powinni.
10:56
But much more importantlyco ważne, the distributiondystrybucja is much widerszerszy.
264
641000
2000
Ale co znacznie ważniejsze, rozkład jest znacznie szerszy.
10:58
There are manywiele people who endkoniec up on the fardaleko left on this distributiondystrybucja
265
643000
3000
Jest wielu ludzi, którzy są skrajnie z lewej w tym rozkładzie,
11:01
who are talkedrozmawialiśmy about 10 timesczasy fewermniej than they should have been.
266
646000
3000
mówi się o nich około 10 razy rzadziej niż się powinno.
11:04
But then alsorównież manywiele people on the fardaleko right
267
649000
2000
Ale także jest wielu ludzi po prawej,
11:06
who seemwydać się to benefitzasiłek from propagandaPropaganda.
268
651000
2000
którzy korzystają na propagandzie.
11:08
This pictureobrazek is the hallmarkznakiem rozpoznawczym of censorshipcenzura in the bookksiążka recordrekord.
269
653000
3000
Ten obrazek jest oznaką cenzury w książkach.
11:11
ELAELA: So culturomicsculturomics
270
656000
2000
ELA: Nazywamy tą metodę
11:13
is what we call this methodmetoda.
271
658000
2000
kulturomiką.
11:15
It's kinduprzejmy of like genomicsgenomika.
272
660000
2000
To coś jak genomika.
11:17
ExceptZ wyjątkiem genomicsgenomika is a lensobiektyw on biologybiologia
273
662000
2000
Poza tym, że genomika patrzy na biologię
11:19
throughprzez the windowokno of the sequencesekwencja of basespodstawy in the humanczłowiek genomegenom.
274
664000
3000
przez okno sekwencji zasad w ludzkim genomie.
11:22
CulturomicsCulturomics is similarpodobny.
275
667000
2000
Kulturomika jest podobna.
11:24
It's the applicationpodanie of massive-scalemasową skalę datadane collectionkolekcja analysisanaliza
276
669000
3000
To zastosowanie analizy zbieranych danych na wielką skalę
11:27
to the studybadanie of humanczłowiek culturekultura.
277
672000
2000
do badania ludzkiej kultury.
11:29
Here, insteadzamiast of throughprzez the lensobiektyw of a genomegenom,
278
674000
2000
Tutaj, zamiast przez genom,
11:31
throughprzez the lensobiektyw of digitizedzdigitalizowane piecessztuk of the historicalhistoryczny recordrekord.
279
676000
3000
dokonuje się to przez zcyfryzowane dane historyczne.
11:34
The great thing about culturomicsculturomics
280
679000
2000
Wielką rzeczą w kulturomice
11:36
is that everyonekażdy can do it.
281
681000
2000
jest to, że każdy może to robić.
11:38
Why can everyonekażdy do it?
282
683000
2000
Dlaczego każdy może to robić?
11:40
EveryoneKażdy can do it because threetrzy guys,
283
685000
2000
Każdy może ponieważ trzech gości,
11:42
JonJon OrwantOrwant, MattMatt GraySzary and Will BrockmanBrockman over at GoogleGoogle,
284
687000
3000
Jon Orwant, Matt Gray i Will Brockman z Google
11:45
saw the prototypeprototyp of the NgramNgram ViewerPodgląd,
285
690000
2000
zobaczyli prototyp Ngram Viewera
11:47
and they said, "This is so funzabawa.
286
692000
2000
i powiedziało: "To jest taka frajda.
11:49
We have to make this availabledostępny for people."
287
694000
3000
Musimy to udostępnić ludziom."
11:52
So in two weekstygodnie flatmieszkanie -- the two weekstygodnie before our paperpapier cameoprawa ołowiana witrażu out --
288
697000
2000
Więc przez dwa tygodnie - dwa tygodnie przed publikacją naszego artykułu -
11:54
they codedkodowane up a versionwersja of the NgramNgram ViewerPodgląd for the generalgenerał publicpubliczny.
289
699000
3000
napisali kod wersji Ngram Viewera dla szerokiej publiczności.
11:57
And so you too can typerodzaj in any wordsłowo or phrasewyrażenie that you're interestedzainteresowany in
290
702000
3000
Więc wy także możecie wpisać każde słowo lub zwrot, który was interesuje
12:00
and see its n-gramn gramów immediatelynatychmiast --
291
705000
2000
i zobaczyć od razu jego n-gram -
12:02
alsorównież browsePrzeglądaj examplesprzykłady of all the variousróżnorodny booksksiążki
292
707000
2000
a także wyszukać przykłady różnych książek,
12:04
in whichktóry your n-gramn gramów appearspojawia się.
293
709000
2000
w których pojawia się wasz n-gram.
12:06
JMJM: Now this was used over a millionmilion timesczasy on the first day,
294
711000
2000
JM: Użyto tego przeszło milion razy w pierwszym dniu,
12:08
and this is really the bestNajlepiej of all the querieszapytania.
295
713000
2000
a to jest najlepsze ze wszystkich wyszukiwań.
12:10
So people want to be theirich bestNajlepiej, put theirich bestNajlepiej footstopa forwardNaprzód.
296
715000
3000
Więc ludzie chcą się pokazać z najlepszej strony.
12:13
But it turnsskręca out in the 18thth centurystulecie, people didn't really careopieka about that at all.
297
718000
3000
Ale okazuje się, że w XVIII wieku ludzi to naprawdę nie obchodziło.
12:16
They didn't want to be theirich bestNajlepiej, they wanted to be theirich beftbeft.
298
721000
3000
Nie chcieli być najlepsi (best), a "beft".
12:19
So what happenedstało się is, of coursekurs, this is just a mistakebłąd.
299
724000
3000
Oczywiście jest to pomyłka.
12:22
It's not that strovestarał for mediocrityprzeciętność,
300
727000
2000
To nie walka o przecietność,
12:24
it's just that the S used to be writtenpisemny differentlyróżnie, kinduprzejmy of like an F.
301
729000
3000
a fakt, że "s" pisano inaczej, raczej jak "f".
12:27
Now of coursekurs, GoogleGoogle didn't pickwybierać this up at the time,
302
732000
3000
Oczywiście Google nie wychwycił tego wówczas,
12:30
so we reportedzgłaszane this in the sciencenauka articleartykuł that we wrotenapisał.
303
735000
3000
więc zgłosiliśmy to w artykule naukowym, który napisaliśmy.
12:33
But it turnsskręca out this is just a reminderprzypomnienie
304
738000
2000
Ale okazuje się to tylko przypomnieniem,
12:35
that, althoughmimo że this is a lot of funzabawa,
305
740000
2000
że choć to wiele zabawy,
12:37
when you interpretzinterpretować these graphswykresy, you have to be very carefulostrożny,
306
742000
2000
kiedy interpretuje się te wykresy, trzeba być bardzo ostrożnym
12:39
and you have to adoptprzyjąć the basebaza standardsstandardy in the sciencesnauki.
307
744000
3000
i przyjąć te podstawowe standardy naukowe.
12:42
ELAELA: People have been usingza pomocą this for all kindsrodzaje of funzabawa purposescele.
308
747000
3000
ELA: Ludzie używali tego do zabawy na różne sposoby.
12:45
(LaughterŚmiech)
309
750000
7000
(Śmiech)
12:52
ActuallyFaktycznie, we're not going to have to talk,
310
757000
2000
Nie będziemy mówili,
12:54
we're just going to showpokazać you all the slidesslajdy and remainpozostawać silentcichy.
311
759000
3000
po prostu pokażemy wam te slajdy i będziemy cicho.
12:57
This personosoba was interestedzainteresowany in the historyhistoria of frustrationudaremnienie.
312
762000
3000
Ta osoba była zainteresowana historią frustracji.
13:00
There's variousróżnorodny typestypy of frustrationudaremnienie.
313
765000
3000
To różne rodzaje frustracji.
13:03
If you stubstub your toeToe, that's a one A "arghArgh."
314
768000
3000
Jeśli uderzysz się w palec, to jedno "a" w "argh"
13:06
If the planetplaneta EarthZiemia is annihilatedanihilacji by the VogonsVogons
315
771000
2000
Jeśli Ziemia jest anihilowana przez Vogonów,
13:08
to make roompokój for an interstellarmiędzygwiezdny bypassObwodnica,
316
773000
2000
by zrobić miejsce na międzygwiezdny tunel,
13:10
that's an eightosiem A "aaaaaaaarghaaaaaaaargh."
317
775000
2000
jest to "aaaaaaaargh" przez 8 "a".
13:12
This personosoba studiesstudia all the "arghsarghs,"
318
777000
2000
Ta osoba zbadała wszystkie "argh"
13:14
from one throughprzez eightosiem A'sA.
319
779000
2000
przez od 1 do 8 "a".
13:16
And it turnsskręca out
320
781000
2000
I okazuje się,
13:18
that the less-frequentrzadziej "arghsarghs"
321
783000
2000
że rzadsze "argh"
13:20
are, of coursekurs, the oneste that correspondodpowiadać to things that are more frustratingfrustrujące --
322
785000
3000
są, oczywiście, tymi, które odpowiadają bardziej frustrującym rzeczom -
13:23
exceptz wyjątkiem, oddlydziwnie, in the earlywcześnie 80s.
323
788000
3000
poza, co dziwne, we wczesnych latach 80-tych.
13:26
We think that mightmoc have something to do with ReaganReagan.
324
791000
2000
Myślimy, że to może mieć coś wspólnego z Reaganem.
13:28
(LaughterŚmiech)
325
793000
2000
(Śmiech)
13:30
JMJM: There are manywiele usageszwyczaje of this datadane,
326
795000
3000
JM: Jest wiele zastosowań dla tych danych,
13:33
but the bottomDolny linelinia is that the historicalhistoryczny recordrekord is beingistota digitizedzdigitalizowane.
327
798000
3000
ale puenta jest taka, że dane historyczne są cyfryzowane.
13:36
GoogleGoogle has startedRozpoczęty to digitizedigitalizacji 15 millionmilion booksksiążki.
328
801000
2000
Google zaczęła cyfryzować 15 milionów książek.
13:38
That's 12 percentprocent of all the booksksiążki that have ever been publishedopublikowany.
329
803000
2000
To 12% wszystkich książek, które kiedykolwiek zostały wydane.
13:40
It's a sizablesporych rozmiarów chunkkawałek of humanczłowiek culturekultura.
330
805000
3000
To pokaźny kawał ludzkiej kultury.
13:43
There's much more in culturekultura: there's manuscriptsmanuskrypty, there newspapersgazety,
331
808000
3000
Jest znacznie więcej aspektów: manuskrypty, gazety,
13:46
there's things that are not texttekst, like artsztuka and paintingsobrazy.
332
811000
2000
rzeczy, które nie są tekstem, jak sztuka i malarstwo.
13:48
These all happenzdarzyć to be on our computerskomputery,
333
813000
2000
Wszystkie są w naszych komputerach,
13:50
on computerskomputery acrossprzez the worldświat.
334
815000
2000
na całym świecie.
13:52
And when that happensdzieje się, that will transformprzekształcać the way we have
335
817000
3000
A kiedy to się stanie, odmieni to sposób, w jaki
13:55
to understandzrozumieć our pastprzeszłość, our presentteraźniejszość and humanczłowiek culturekultura.
336
820000
2000
będziemy rozumieli naszą przeszłość, teraźniejszość, ludzką kulturę.
13:57
Thank you very much.
337
822000
2000
Dziękujemy bardzo.
13:59
(ApplauseAplauz)
338
824000
3000
(Oklaski)
Translated by Agata Lesnicka
Reviewed by Filip Jaromczyk

▲Back to top

ABOUT THE SPEAKERS
Jean-Baptiste Michel - Data researcher
Jean-Baptiste Michel looks at how we can use large volumes of data to better understand our world.

Why you should listen

Jean-Baptiste Michel holds joint academic appointments at Harvard (FQEB Fellow) and Google (Visiting Faculty). His research focusses on using large volumes of data as tools that help better understand the world around us -- from the way diseases progress in patients over years, to the way cultures change in human societies over centuries. With his colleague Erez Lieberman Aiden, Jean-Baptiste is a Founding Director of Harvard's Cultural Observatory, where their research team pioneers the use of quantitative methods for the study of human culture, language and history. His research was featured on the covers of Science and Nature, on the front pages of the New York Times and the Boston Globe, in The Economist, Wired and many other venues. The online tool he helped create -- ngrams.googlelabs.com -- was used millions of times to browse cultural trends. Jean-Baptiste is an Engineer from Ecole Polytechnique (Paris), and holds an MS in Applied Mathematics and a PhD in Systems Biology from Harvard.

More profile about the speaker
Jean-Baptiste Michel | Speaker | TED.com
Erez Lieberman Aiden - Researcher
Erez Lieberman Aiden pursues a broad range of research interests, spanning genomics, linguistics, mathematics ...

Why you should listen

Erez Lieberman Aiden is a fellow at the Harvard Society of Fellows and Visiting Faculty at Google. His research spans many disciplines and has won numerous awards, including recognition for one of the top 20 "Biotech Breakthroughs that will Change Medicine", by Popular Mechanics; the Lemelson-MIT prize for the best student inventor at MIT; the American Physical Society's Award for the Best Doctoral Dissertation in Biological Physics; and membership in Technology Review's 2009 TR35, recognizing the top 35 innovators under 35. His last three papers -- two with JB Michel -- have all appeared on the cover of Nature and Science.

More profile about the speaker
Erez Lieberman Aiden | Speaker | TED.com