ABOUT THE SPEAKER
Kenneth Cukier - Data Editor of The Economist
Kenneth Cukier is the Data Editor of The Economist. From 2007 to 2012 he was the Tokyo correspondent, and before that, the paper’s technology correspondent in London, where his work focused on innovation, intellectual property and Internet governance. Kenneth is also the co-author of Big Data: A Revolution That Will Transform How We Live, Work, and Think with Viktor Mayer-Schönberger in 2013, which was a New York Times Bestseller and translated into 16 languages.

Why you should listen

As Data Editor of The Economist and co-author of Big Data: A Revolution That Will Transform How We Live, Work, and Think, Kenneth Cukier has spent years immersed in big data, machine learning -- and the impact of both. What's the future of big data-driven technology and design? To find out, watch this talk.

More profile about the speaker
Kenneth Cukier | Speaker | TED.com
TEDSalon Berlin 2014

Kenneth Cukier: Big data is better data

Kenneth Cukier: "Metadados" são dados melhores

Filmed:
1,663,038 views

Os carros autoguiados foram apenas o começo. Qual é o futuro da tecnologia e do "design" impulsionados pelos metadados? Numa palestra de ciência emocionante, Kenneth Cukier olha para o futuro da aprendizagem das máquinas — e do conhecimento humano.
- Data Editor of The Economist
Kenneth Cukier is the Data Editor of The Economist. From 2007 to 2012 he was the Tokyo correspondent, and before that, the paper’s technology correspondent in London, where his work focused on innovation, intellectual property and Internet governance. Kenneth is also the co-author of Big Data: A Revolution That Will Transform How We Live, Work, and Think with Viktor Mayer-Schönberger in 2013, which was a New York Times Bestseller and translated into 16 languages. Full bio

Double-click the English transcript below to play the video.

00:12
America'sDo América favoritefavorito pietorta is?
0
787
3845
A tarte preferida da América é...?
00:16
AudienceAudiência: AppleApple.
KennethKenneth CukierCukier: AppleApple. Of coursecurso it is.
1
4632
3506
Audiência: Maçã!
Kenneth Cukier: Maçã. Claro que é.
00:20
How do we know it?
2
8138
1231
Como é que sabemos?
00:21
Because of datadados.
3
9369
2753
Por causa dos dados!
00:24
You look at supermarketsupermercado salesvendas.
4
12122
2066
Vemos nas vendas dos supermercados.
00:26
You look at supermarketsupermercado
salesvendas of 30-centimeter-centímetro piestortas
5
14188
2866
Vemos nos supermercados
as vendas das tartes de 30 cm
00:29
that are frozencongeladas, and applemaçã winsganha, no contestconcurso.
6
17054
4075
que estão congeladas,
e a maçã ganha, sem discussão.
00:33
The majoritymaioria of the salesvendas are applemaçã.
7
21129
5180
A maioria das vendas são as de maçã.
00:38
But then supermarketssupermercados startedcomeçado sellingvendendo
8
26309
2964
Mas depois os supermercados
começaram a vender
00:41
smallermenor, 11-centimeter-centímetro piestortas,
9
29273
2583
tartes mais pequenas, de 11 cm.
00:43
and suddenlyDe repente, applemaçã fellcaiu to fourthquarto or fifthquinto placeLugar, colocar.
10
31856
4174
De repente, a maçã caiu
para quarto ou quinto lugar.
00:48
Why? What happenedaconteceu?
11
36030
2875
Porquê? O que é que aconteceu?
00:50
Okay, think about it.
12
38905
2818
Pensem bem.
00:53
When you buyComprar a 30-centimeter-centímetro pietorta,
13
41723
3848
Quando vocês compram uma tarte de 30 cm,
00:57
the wholetodo familyfamília has to agreeaceita,
14
45571
2261
toda a família tem que aceitar,
00:59
and applemaçã is everyone'stodos secondsegundo favoritefavorito.
15
47832
3791
mas a maçã é a segunda escolha de todos.
01:03
(LaughterRiso)
16
51623
1935
(Risos)
01:05
But when you buyComprar an individualIndividual 11-centimeter-centímetro pietorta,
17
53558
3615
Mas quando compram
uma tarte individual de 11 cm,
01:09
you can buyComprar the one that you want.
18
57173
3745
podem comprar aquela que quiserem.
01:12
You can get your first choiceescolha.
19
60918
4015
Podem obter a vossa primeira escolha.
01:16
You have more datadados.
20
64933
1641
Vocês têm mais dados.
01:18
You can see something
21
66574
1554
Podem ver uma coisa que não viam,
01:20
that you couldn'tnão podia see
22
68128
1132
01:21
when you only had smallermenor amountsvalores of it.
23
69260
3953
quando só tinham
uma quantidade mais pequena.
01:25
Now, the pointponto here is that more datadados
24
73213
2475
A questão aqui é que mais dados
não só nos permitem ver mais,
01:27
doesn't just let us see more,
25
75688
2283
mais da mesma coisa
para que estamos a olhar,
01:29
more of the samemesmo thing we were looking at.
26
77971
1854
01:31
More datadados allowspermite us to see newNovo.
27
79825
3613
mas mais dados também
nos permitem ver coisas novas.
01:35
It allowspermite us to see better.
28
83438
3094
Permitem-nos ver melhor.
01:38
It allowspermite us to see differentdiferente.
29
86532
3656
Permitem-nos ver de modo diferente.
01:42
In this casecaso, it allowspermite us to see
30
90188
3173
Neste caso, permitem-nos ver
01:45
what America'sDo América favoritefavorito pietorta is:
31
93361
2913
qual é a tarte preferida da América:
01:48
not applemaçã.
32
96274
2542
não é a de maçã.
01:50
Now, you probablyprovavelmente all have heardouviu the termprazo biggrande datadados.
33
98816
3614
Provavelmente, já todos ouviram falar
do termo "metadados".
01:54
In factfacto, you're probablyprovavelmente sickdoente of hearingaudição the termprazo
34
102430
2057
Provavelmente já estão enjoados
de ouvir o termo
01:56
biggrande datadados.
35
104487
1630
Metadados.
01:58
It is trueverdade that there is a lot of hypecampanha publicitária around the termprazo,
36
106117
3330
É verdade que há muita publicidade
em torno deste termo
02:01
and that is very unfortunateinfeliz,
37
109447
2332
e isso é lamentável,
02:03
because biggrande datadados is an extremelyextremamente importantimportante toolferramenta
38
111779
3046
porque os metadados são uma ferramenta
extremamente importante
02:06
by whichqual societysociedade is going to advanceavançar.
39
114825
3734
com a qual a sociedade vai avançar.
02:10
In the pastpassado, we used to look at smallpequeno datadados
40
118559
3561
No passado, olhávamos
para conjuntos reduzidos de dados
02:14
and think about what it would mean
41
122120
1704
e pensávamos o que significariam
para tentar entender o mundo.
02:15
to try to understandCompreendo the worldmundo,
42
123824
1496
02:17
and now we have a lot more of it,
43
125320
1991
Agora temos muito mais,
02:19
more than we ever could before.
44
127311
2722
mais do que alguma vez tivemos.
02:22
What we find is that when we have
45
130033
1877
Descobrimos que, quando temos
um grande conjunto de dados,
02:23
a largeampla bodycorpo of datadados, we can fundamentallyfundamentalmente do things
46
131910
2724
podemos fazer coisas
que não eram possíveis,
02:26
that we couldn'tnão podia do when we
only had smallermenor amountsvalores.
47
134634
3276
quando só tínhamos
quantidades mais pequenas.
02:29
BigGrande datadados is importantimportante, and biggrande datadados is newNovo,
48
137910
2641
Os metadados são importantes
e são uma novidade.
02:32
and when you think about it,
49
140551
1777
Pensem nisto.
02:34
the only way this planetplaneta is going to dealacordo
50
142328
2216
A única forma como este planeta
vai poder lidar com os desafios globais
02:36
with its globalglobal challengesdesafios
51
144544
1789
02:38
to feedalimentação people, supplyfornecem them with medicalmédico careCuidado,
52
146333
3537
— alimentar as pessoas,
dispensar-lhes cuidados médicos,
02:41
supplyfornecem them with energyenergia, electricityeletricidade,
53
149870
2810
fornecer-lhes energia, eletricidade,
02:44
and to make sure they're not burntqueimado to a crispbatata frita
54
152680
1789
e garantir que elas
não vão ficar em torresmos
02:46
because of globalglobal warmingaquecimento
55
154469
1238
por causa do aquecimento global —
02:47
is because of the effectiveeficaz use of datadados.
56
155707
4195
é através do uso eficaz de dados.
02:51
So what is newNovo about biggrande
datadados? What is the biggrande dealacordo?
57
159902
3870
Então o que há de novo
quanto aos metadados?
O que têm de tão importante?
02:55
Well, to answerresponda that questionquestão, let's think about
58
163772
2517
Para responder a esta pergunta,
pensemos em como era a informação,
02:58
what informationem formação lookedolhou like,
59
166289
1896
03:00
physicallyfisicamente lookedolhou like in the pastpassado.
60
168185
3034
qual era o seu aspeto físico, no passado.
03:03
In 1908, on the islandilha of CreteCreta,
61
171219
3611
Em 1908, na Ilha de Creta,
03:06
archaeologistsarqueólogos discovereddescobriu a clayargila discdisco.
62
174830
4735
os arqueólogos descobriram
um disco de barro.
03:11
They dateddatado it from 2000 B.C., so it's 4,000 yearsanos oldvelho.
63
179565
4059
Dataram-no de 2000 a.C.,
portanto com 4000 anos.
03:15
Now, there's inscriptionsinscrições on this discdisco,
64
183624
2004
Há inscrições nesse disco,
mas não sabemos o que é que significam.
03:17
but we actuallyna realidade don't know what it meanssignifica.
65
185628
1327
03:18
It's a completecompleto mysterymistério, but the pointponto is that
66
186955
2098
É um mistério total, mas a questão
03:21
this is what informationem formação used to look like
67
189053
1928
é que era aquele o aspeto das informações
03:22
4,000 yearsanos agoatrás.
68
190981
2089
há 4000 anos.
03:25
This is how societysociedade storedarmazenados
69
193070
2548
Era assim que a sociedade armazenava
03:27
and transmittedtransmitidos informationem formação.
70
195618
3524
e transmitia as informações.
03:31
Now, societysociedade hasn'tnão tem advancedavançado all that much.
71
199142
4160
A sociedade não avançou assim muito.
03:35
We still storeloja informationem formação on discsdiscos,
72
203302
3474
Continuamos a armazenar
informação em discos,
03:38
but now we can storeloja a lot more informationem formação,
73
206776
3184
mas agora podemos guardar
muito mais informações,
03:41
more than ever before.
74
209960
1260
muito mais do que até aqui.
03:43
SearchingÀ procura it is easierMais fácil. CopyingA cópia it easierMais fácil.
75
211220
3093
É mais fácil pesquisar.
É mais fácil copiar.
É mais fácil partilhar.
É mais fácil processar.
03:46
SharingCompartilhamento de it is easierMais fácil. ProcessingProcessamento de it is easierMais fácil.
76
214313
3500
03:49
And what we can do is we can reusereuso this informationem formação
77
217813
2766
Podemos reutilizar essas informações
03:52
for usesusa that we never even imaginedimaginou
78
220579
1834
para usos que nunca sequer imaginávamos
03:54
when we first collectedcoletado the datadados.
79
222413
3195
quando a princípio reunimos os dados.
03:57
In this respectrespeito, the datadados has gonefoi
80
225608
2252
Neste aspeto, os dados
passaram de "stock" a fluxo,
03:59
from a stockestoque to a flowfluxo,
81
227860
3532
04:03
from something that is stationaryestacionária and staticestático
82
231392
3938
passaram duma coisa que é fixa e estática
04:07
to something that is fluidfluido and dynamicdinâmico.
83
235330
3609
para uma coisa que é fluida e dinâmica.
04:10
There is, if you will, a liquidityliquidez to informationem formação.
84
238939
4023
Há, se quiserem,
uma liquidez na informação.
04:14
The discdisco that was discovereddescobriu off of CreteCreta
85
242962
3474
O disco que foi descoberto em Creta
04:18
that's 4,000 yearsanos oldvelho, is heavypesado,
86
246436
3764
que tem 4000 anos, é pesado,
04:22
it doesn't storeloja a lot of informationem formação,
87
250200
1962
não guarda muitas informações
04:24
and that informationem formação is unchangeableinalterável.
88
252162
3116
e essas informações são imutáveis.
04:27
By contrastcontraste, all of the filesarquivos
89
255278
4011
Em contrapartida, todos os arquivos
04:31
that EdwardEdward SnowdenSnowden tooktomou
90
259289
1861
que Edward Snowden levou
04:33
from the NationalNacional SecuritySegurança
AgencyAgência in the UnitedUnidos StatesEstados-Membros
91
261150
2621
da National Security Agency
nos Estados Unidos da América
04:35
fitsencaixa on a memorymemória stickbastão
92
263771
2419
cabem num cartão de memória
04:38
the sizeTamanho of a fingernailunha,
93
266190
3010
do tamanho duma unha
04:41
and it can be sharedcompartilhado at the speedRapidez of lightluz.
94
269200
4745
e podem ser partilhados
à velocidade da luz.
04:45
More datadados. More.
95
273945
5255
Mais dados. Mais.
Uma das razões por que temos hoje
tantos dados no mundo
04:51
Now, one reasonrazão why we have
so much datadados in the worldmundo todayhoje
96
279200
1974
04:53
is we are collectingcoletando things
97
281174
1432
é porque estamos a reunir coisas
04:54
that we'venós temos always collectedcoletado informationem formação on,
98
282606
3280
sobre as quais sempre reunimos informação.
04:57
but anotheroutro reasonrazão why is we're takinglevando things
99
285886
2656
Mas outra razão é porque
estamos a agarrar em coisas
05:00
that have always been informationalinformativo
100
288542
2812
que sempre foram informativas
05:03
but have never been renderedprocessado into a datadados formatformato
101
291354
2486
mas nunca foram transformadas
num formato de dados
05:05
and we are puttingcolocando it into datadados.
102
293840
2419
e estamos a transformá-las em dados.
05:08
Think, for exampleexemplo, the questionquestão of locationlocalização.
103
296259
3308
Por exemplo, pensem
na questão da localização.
05:11
Take, for exampleexemplo, MartinMartin LutherLuther.
104
299567
2249
Por exemplo, Martinho Lutero.
05:13
If we wanted to know in the 1500s
105
301816
1597
Se quiséssemos saber nos anos de 1500
05:15
where MartinMartin LutherLuther was,
106
303413
2667
onde estava Martinho Lutero,
05:18
we would have to followSegue him at all timesvezes,
107
306080
2092
tínhamos que andar sempre atrás dele,
05:20
maybe with a featherypenas quillpena and an inkwelltinteiro,
108
308172
2137
— talvez com uma pluma de pato
e um tinteiro —
05:22
and recordregistro it,
109
310309
1676
e registar isso.
05:23
but now think about what it looksparece like todayhoje.
110
311985
2183
Agora pensem no que se passa hoje.
05:26
You know that somewherealgum lugar,
111
314168
2122
Sabemos que algures,
provavelmente na base de dados
duma empresa de telecomunicações,
05:28
probablyprovavelmente in a telecommunicationstelecomunicações carrier'sdo transportador databasebase de dados,
112
316290
2446
05:30
there is a spreadsheetplanilha or at leastpelo menos a databasebase de dados entryentrada
113
318736
3036
há uma folha de cálculo ou, pelo menos,
uma entrada numa base de dados
05:33
that recordsregistros your informationem formação
114
321772
2088
que regista as informações
05:35
of where you've been at all timesvezes.
115
323860
2063
sobre onde estivemos em todas as ocasiões,
05:37
If you have a cellcélula phonetelefone,
116
325923
1360
se tivermos um telemóvel
e esse telemóvel tiver GPS.
05:39
and that cellcélula phonetelefone has GPSGPS,
but even if it doesn't have GPSGPS,
117
327283
2847
Mas, mesmo que não tenha GPS,
05:42
it can recordregistro your informationem formação.
118
330130
2385
pode registar as nossas informações.
05:44
In this respectrespeito, locationlocalização has been datafieddatafied.
119
332515
4084
Nesse aspeto, a localização
foi transformada em dados.
05:48
Now think, for exampleexemplo, of the issuequestão of posturepostura,
120
336599
4601
Pensem, por exemplo,
na questão da postura,
na forma como estão sentados
neste momento,
05:53
the way that you are all sittingsentado right now,
121
341200
1285
05:54
the way that you sitsentar,
122
342485
2030
na forma como se sentam,
05:56
the way that you sitsentar, the way that you sitsentar.
123
344515
2771
na forma como você se senta,
na forma como você se senta.
05:59
It's all differentdiferente, and it's a functionfunção of your legperna lengthcomprimento
124
347286
2077
São diferentes, em função
do tamanho das vossas pernas,
06:01
and your back and the contourscontornos of your back,
125
349363
2093
dos contornos das vossas costas.
06:03
and if I were to put sensorssensores,
maybe 100 sensorssensores
126
351456
2531
Se puséssemos censores,
— talvez uns 100 censores —
06:05
into all of your chairscadeiras right now,
127
353987
1766
em todas as cadeiras, neste momento,
06:07
I could createcrio an indexíndice that's fairlybastante uniqueúnico to you,
128
355753
3600
eu podia criar um índice único
para cada um de vocês,
06:11
sortordenar of like a fingerprintimpressão digital, but it's not your fingerdedo.
129
359353
4409
uma espécie de impressão digital,
mas não dos vossos dedos.
06:15
So what could we do with this?
130
363762
2969
Mas o que é que podíamos fazer com isso?
06:18
ResearchersPesquisadores in TokyoTóquio are usingusando it
131
366731
2397
Há investigadores em Tóquio
que estão a usar isso
06:21
as a potentialpotencial anti-theftantiroubo devicedispositivo in carscarros.
132
369128
4388
como um possível aparelho antirroubo
em automóveis.
06:25
The ideaidéia is that the carjackerladrão de carros sitssenta behindatrás the wheelroda,
133
373516
2924
A ideia é que o ladrão
senta-se ao volante, tenta arrancar,
06:28
triestentativas to streamcorrente off, but the carcarro recognizesreconhece
134
376440
2104
mas o carro reconhece que, ao volante,
está um condutor não autorizado
06:30
that a non-approvednão aprovada drivermotorista is behindatrás the wheelroda,
135
378544
2362
06:32
and maybe the enginemotor just stopspára, unlessa menos que you
136
380906
2164
e o motor não arranca,
a não ser que se digite uma senha
06:35
typetipo in a passwordsenha into the dashboardpainel de controle
137
383070
3177
no painel de comandos, que diz:
06:38
to say, "Hey, I have authorizationautorização to drivedirigir." Great.
138
386247
4658
"Olha lá,
eu tenho autorização para guiar".
Fantástico.
06:42
What if everycada singlesolteiro carcarro in EuropeEuropa
139
390905
2553
E, se todos os carros na Europa
06:45
had this technologytecnologia in it?
140
393458
1457
tivessem essa tecnologia?
06:46
What could we do then?
141
394915
3165
O que é que podíamos fazer?
06:50
Maybe, if we aggregatedagregados the datadados,
142
398080
2240
Se agregássemos os dados,
06:52
maybe we could identifyidentificar telltaleTelltale signssinais
143
400320
3814
talvez pudéssemos identificar
sinais reveladores
06:56
that bestmelhor predictprever that a carcarro accidentacidente
144
404134
2709
que previssem melhor
que vai ocorrer um acidente de viação
06:58
is going to take placeLugar, colocar in the nextPróximo fivecinco secondssegundos.
145
406843
5893
nos cinco segundos seguintes.
07:04
And then what we will have datafieddatafied
146
412736
2557
E mais, o que teremos registado em dados
07:07
is drivermotorista fatiguefadiga,
147
415293
1783
é a fadiga do condutor.
07:09
and the serviceserviço would be when the carcarro sensessentidos
148
417076
2334
O objetivo seria que,
quando o carro pressente
que a pessoa entra nessa situação,
07:11
that the personpessoa slumpsquedas into that positionposição,
149
419410
3437
07:14
automaticallyautomaticamente knowssabe, hey, setconjunto an internalinterno alarmalarme
150
422847
3994
sabe automaticamente
que deve ligar um alarme interno
07:18
that would vibratevibrar the steeringdireção wheelroda, honkbuzina insidedentro
151
426841
2025
que fará vibrar a buzina do volante,
no interior, a dizer:
07:20
to say, "Hey, wakedespertar up,
152
428866
1721
"Ei, acorda!
Presta mais atenção à estrada!"
07:22
paypagamento more attentionatenção to the roadestrada."
153
430587
1904
07:24
These are the sortstipos of things we can do
154
432491
1853
São estas as coisas que podemos fazer
07:26
when we datafydatafy more aspectsaspectos of our livesvidas.
155
434344
2821
quando transformamos em dados
mais aspetos da nossa vida.
07:29
So what is the valuevalor of biggrande datadados?
156
437165
3675
Então, qual é o valor dos metadados?
07:32
Well, think about it.
157
440840
2190
Pensem só.
07:35
You have more informationem formação.
158
443030
2412
Temos mais informações.
07:37
You can do things that you couldn'tnão podia do before.
159
445442
3341
Podemos fazer coisas
que não podíamos fazer antes.
07:40
One of the mosta maioria impressiveimpressionante areasáreas
160
448783
1676
Uma das áreas mais impressionantes
07:42
where this conceptconceito is takinglevando placeLugar, colocar
161
450459
1729
em que está a ocorrer este conceito
07:44
is in the areaárea of machinemáquina learningAprendendo.
162
452188
3307
é na área da aprendizagem das máquinas.
07:47
MachineMáquina learningAprendendo is a branchramo of artificialartificial intelligenceinteligência,
163
455495
3077
A aprendizagem das máquinas
é um ramo da inteligência artificial,
07:50
whichqual itselfem si is a branchramo of computercomputador scienceCiência.
164
458572
3378
que, por sua vez, é um ramo
das tecnologias da informação.
07:53
The generalgeral ideaidéia is that insteadem vez de of
165
461950
1543
A ideia geral é que,
em vez de dar instruções
a um computador sobre o que fazer,
07:55
instructinginstruindo-o a computercomputador what do do,
166
463493
2117
07:57
we are going to simplysimplesmente throwlançar datadados at the problemproblema
167
465610
2620
vamos simplesmente
lançar dados para o problema
08:00
and tell the computercomputador to figurefigura it out for itselfem si.
168
468230
3206
e dizer ao computador para arranjar
a solução por si mesmo.
08:03
And it will help you understandCompreendo it
169
471436
1777
Vão compreender melhor
08:05
by seeingvendo its originsorigens.
170
473213
3552
conhecendo as suas origens.
08:08
In the 1950s, a computercomputador scientistcientista
171
476765
2388
Nos anos 50,
um engenheiro informático da IBM,
08:11
at IBMIBM namednomeado ArthurArthur SamuelSamuel likedgostei to playToque checkersjogo de damas,
172
479153
3592
chamado Arthur Samuel,
gostava de jogar xadrez.
08:14
so he wroteescrevi a computercomputador programprograma
173
482745
1402
Por isso escreveu
um programa para computador
08:16
so he could playToque againstcontra the computercomputador.
174
484147
2813
para poder jogar com o computador.
08:18
He playedreproduziu. He wonGanhou.
175
486960
2711
Jogou. Ganhou.
08:21
He playedreproduziu. He wonGanhou.
176
489671
2103
Jogou. Ganhou.
08:23
He playedreproduziu. He wonGanhou,
177
491774
3015
Jogou. Ganhou.
08:26
because the computercomputador only knewsabia
178
494789
1778
Porque o computador só sabia
08:28
what a legallegal movemover was.
179
496567
2227
o que era um movimento legal.
08:30
ArthurArthur SamuelSamuel knewsabia something elseoutro.
180
498794
2087
Arthur Samuel sabia mais qualquer coisa.
08:32
ArthurArthur SamuelSamuel knewsabia strategyestratégia.
181
500881
4629
Arthur Samuel sabia estratégia.
08:37
So he wroteescrevi a smallpequeno sub-programsubprograma alongsideao lado de it
182
505510
2396
Assim, escreveu um pequeno subprograma
08:39
operatingoperativo in the backgroundfundo, and all it did
183
507906
1974
que corria por detrás,
que apenas calculava as probabilidades
08:41
was scorePonto the probabilityprobabilidade
184
509880
1817
08:43
that a givendado boardborda configurationconfiguração would likelyprovável leadconduzir
185
511697
2563
de uma dada configuração do tabuleiro
levar a um tabuleiro vencedor
ou a um tabuleiro perdedor,
08:46
to a winningganhando boardborda versusversus a losingperdendo boardborda
186
514260
2910
08:49
after everycada movemover.
187
517170
2508
depois de cada movimento.
08:51
He playstocam the computercomputador. He winsganha.
188
519678
3150
Joga com o computador. Ganha.
08:54
He playstocam the computercomputador. He winsganha.
189
522828
2508
Joga com o computador. Ganha.
08:57
He playstocam the computercomputador. He winsganha.
190
525336
3731
Joga com o computador. Ganha.
09:01
And then ArthurArthur SamuelSamuel leavessai the computercomputador
191
529067
2277
Então, Arthur Samuel deixa
o computador jogar sozinho.
09:03
to playToque itselfem si.
192
531344
2227
09:05
It playstocam itselfem si. It collectscoleta more datadados.
193
533571
3509
Ele joga sozinho. Reúne mais dados.
09:09
It collectscoleta more datadados. It increasesaumenta
the accuracyprecisão of its predictionpredição.
194
537080
4309
Reúne mais dados.
Aumenta o rigor das suas previsões.
09:13
And then ArthurArthur SamuelSamuel goesvai back to the computercomputador
195
541389
2104
Arthur Samuel volta ao computador.
09:15
and he playstocam it, and he losesperde,
196
543493
2318
Joga e perde,
09:17
and he playstocam it, and he losesperde,
197
545811
2069
joga e perde,
09:19
and he playstocam it, and he losesperde,
198
547880
2047
joga e perde.
09:21
and ArthurArthur SamuelSamuel has createdcriada a machinemáquina
199
549927
2599
Arthur Samuel criara uma máquina
09:24
that surpassessupera his abilityhabilidade in a tasktarefa that he taughtensinado it.
200
552526
6288
que ultrapassara a sua capacidade
numa tarefa que ele lhe ensinara.
09:30
And this ideaidéia of machinemáquina learningAprendendo
201
558814
2498
Esta ideia de aprendizagem da máquina
09:33
is going everywhereem toda parte.
202
561312
3927
está a espalhar-se por todo o lado.
09:37
How do you think we have self-drivingauto-condução carscarros?
203
565239
3149
Como é que julgam
que temos carros autoguiados?
09:40
Are we any better off as a societysociedade
204
568388
2137
A nossa sociedade está melhor
09:42
enshriningconsagração all the rulesregras of the roadestrada into softwareProgramas?
205
570525
3285
por meter todas as regras de trânsito
em "software"? Não.
09:45
No. MemoryMemória is cheapermais barato. No.
206
573810
2598
A memória é mais barata? Não.
09:48
AlgorithmsAlgoritmos are fasterMais rápido. No. ProcessorsProcessadores are better. No.
207
576408
3994
Os algoritmos são mais rápidos? Não.
Os processadores são melhores? Não.
09:52
All of those things matterimportam, but that's not why.
208
580402
2772
Todas essas coisas são importantes,
mas a razão não é essa.
09:55
It's because we changedmudou the naturenatureza of the problemproblema.
209
583174
3141
É porque alterámos a natureza do problema.
09:58
We changedmudou the naturenatureza of the problemproblema from one
210
586315
1530
Alterámos a natureza do problema.
09:59
in whichqual we triedtentou to overtlyabertamente and explicitlyexplicitamente
211
587845
2245
Em vez de tentarmos
aberta e explicitamente
10:02
explainexplicar to the computercomputador how to drivedirigir
212
590090
2581
explicar ao computador como guiar,
dizemos:
10:04
to one in whichqual we say,
213
592671
1316
10:05
"Here'sAqui é a lot of datadados around the vehicleveículo.
214
593987
1876
"Estão aqui os dados sobre o veículo.
10:07
You figurefigura it out.
215
595863
1533
"Descobre lá como é.
10:09
You figurefigura it out that that is a traffictráfego lightluz,
216
597396
1867
"Descobre que isto é um semáforo,
10:11
that that traffictráfego lightluz is redvermelho and not greenverde,
217
599263
2081
"que a luz do semáforo
está vermelha e não verde,
10:13
that that meanssignifica that you need to stop
218
601344
2014
"que isso significa que tens que parar
10:15
and not go forwardprogressivo."
219
603358
3083
"em vez de avançar".
A aprendizagem da máquina está na base
10:18
MachineMáquina learningAprendendo is at the basisbase
220
606441
1518
10:19
of manymuitos of the things that we do onlineconectados:
221
607959
1991
de muitas das coisas que fazemos "online".
10:21
searchpesquisa enginesmotores,
222
609950
1857
Por exemplo, motores de busca,
10:23
Amazon'sDo Amazonas personalizationpersonalização de algorithmalgoritmo de,
223
611807
3801
algoritmo de personalização do Amazon,
10:27
computercomputador translationtradução,
224
615608
2212
tradução por computador,
10:29
voicevoz recognitionreconhecimento systemssistemas.
225
617820
4290
sistemas de reconhecimento de voz.
10:34
ResearchersPesquisadores recentlyrecentemente have lookedolhou at
226
622110
2835
Recentemente, houve investigadores
que analisaram a questão das biópsias,
10:36
the questionquestão of biopsiesbiópsias,
227
624945
3195
10:40
cancerouscanceroso biopsiesbiópsias,
228
628140
2767
das biópsias relacionadas com cancros.
10:42
and they'veeles têm askedperguntei the computercomputador to identifyidentificar
229
630907
2315
Pediram ao computador para identificar,
10:45
by looking at the datadados and survivalsobrevivência ratestaxas
230
633222
2471
olhando para os dados
e as taxas de sobrevivência,
10:47
to determinedeterminar whetherse cellscélulas are actuallyna realidade
231
635693
4667
para determinar
se as células eram cancerosas ou não.
10:52
cancerouscanceroso or not,
232
640360
2544
Claro que, quando lá meteram os dados,
10:54
and sure enoughsuficiente, when you throwlançar the datadados at it,
233
642904
1778
10:56
throughatravés a machine-learningaprendizado de máquina algorithmalgoritmo de,
234
644682
2047
através dum algoritmo
de aprendizagem das máquinas,
10:58
the machinemáquina was ablecapaz to identifyidentificar
235
646729
1877
a máquina foi capaz de identificar
11:00
the 12 telltaleTelltale signssinais that bestmelhor predictprever
236
648606
2262
os 12 sinais reveladores
que melhor preveem
11:02
that this biopsybiópsia of the breastpeito cancerCâncer cellscélulas
237
650868
3299
que naquela biopsia do cancro da mama
11:06
are indeedde fato cancerouscanceroso.
238
654167
3218
as células são de facto cancerosas.
11:09
The problemproblema: The medicalmédico literatureliteratura
239
657385
2498
Um problema: a literatura médica
11:11
only knewsabia ninenove of them.
240
659883
2789
só conhecia nove desses sinais.
11:14
ThreeTrês of the traitstraços were onesuns
241
662672
1800
Três dos sinais eram sinais
11:16
that people didn't need to look for,
242
664472
2975
que as pessoas não precisavam de procurar,
11:19
but that the machinemáquina spottedmanchado.
243
667447
5531
mas a máquina detetou-os.
11:24
Now, there are darkSombrio sideslados to biggrande datadados as well.
244
672978
5925
Mas também há
o lado sombrio dos metadados.
11:30
It will improvemelhorar our livesvidas, but there are problemsproblemas
245
678903
2074
Vai melhorar a nossa vida,
mas há problemas
11:32
that we need to be consciousconsciente of,
246
680977
2640
de que temos que ter consciência.
11:35
and the first one is the ideaidéia
247
683617
2623
O primeiro é a ideia
11:38
that we maypode be punishedpunido for predictionsPrevisões,
248
686240
2686
de que podemos ser punidos
por causa das previsões,
11:40
that the policepolícia maypode use biggrande datadados for theirdeles purposesfins,
249
688926
3870
de que a polícia possa usar os metadados
para os seus objetivos,
11:44
a little bitpouco like "MinorityMinoria ReportRelatório."
250
692796
2351
um pouco como no "Minority Report".
11:47
Now, it's a termprazo calledchamado predictivepreditiva policingpoliciamento,
251
695147
2441
É um termo chamado
policiamento previsível,
11:49
or algorithmicalgorítmica criminologycriminologia,
252
697588
2363
ou criminologia algorítmica.
11:51
and the ideaidéia is that if we take a lot of datadados,
253
699951
2036
A ideia é que, se tivermos muitos dados,
11:53
for exampleexemplo where pastpassado crimescrimes have been,
254
701987
2159
por exemplo, sítios onde
ocorreram crimes no passado,
11:56
we know where to sendenviar the patrolspatrulhas.
255
704146
2543
sabemos para onde enviar as patrulhas.
11:58
That makesfaz com que sensesentido, but the problemproblema, of coursecurso,
256
706689
2115
Isso faz sentido, mas claro que o problema
12:00
is that it's not simplysimplesmente going to stop on locationlocalização datadados,
257
708804
4544
é que isso não vai parar
nos dados de localização,
12:05
it's going to go down to the levelnível of the individualIndividual.
258
713348
2959
vai descer ao nível do indivíduo.
12:08
Why don't we use datadados about the person'spessoas
259
716307
2250
Porque é que não usamos dados
sobre o historial universitário
das pessoas?
12:10
highAlto schoolescola transcripttranscrição?
260
718557
2228
Podíamos usar o facto
de eles estarem empregados ou não,
12:12
Maybe we should use the factfacto that
261
720785
1561
12:14
they're unemployeddesempregado or not, theirdeles creditcrédito scorePonto,
262
722346
2028
o grau de confiança,
12:16
theirdeles web-surfingnavegação na Web behaviorcomportamento,
263
724374
1552
o comportamento
de navegação na Internet,
12:17
whetherse they're up lateatrasado at night.
264
725926
1878
se se deitam muito tarde.
12:19
TheirSeus FitbitFitbit, when it's ablecapaz
to identifyidentificar biochemistriesbiochemistries,
265
727804
3161
O seu Fitbit, quando conseguir
identificar bioquímicos,
12:22
will showexposição that they have aggressiveagressivo thoughtspensamentos.
266
730965
4236
mostrará que eles têm
pensamentos agressivos.
12:27
We maypode have algorithmsalgoritmos that are likelyprovável to predictprever
267
735201
2221
Podemos ter algoritmos
que poderão prever
12:29
what we are about to do,
268
737422
1633
o que estamos a pensar fazer,
12:31
and we maypode be heldmantido accountableresponsável
269
739055
1244
e podemos ser responsabilizados
12:32
before we'venós temos actuallyna realidade actedatuou.
270
740299
2590
ainda antes de termos agido.
12:34
PrivacyPrivacidade was the centralcentral challengedesafio
271
742889
1732
A privacidade era o desafio central
12:36
in a smallpequeno datadados eraera.
272
744621
2880
numa era de pequenos dados.
12:39
In the biggrande datadados ageera,
273
747501
2149
Na era dos metadados,
12:41
the challengedesafio will be safeguardingsalvaguarda freelivre will,
274
749650
4523
o desafio será
a salvaguarda da nossa vontade,
12:46
moralmoral choiceescolha, humanhumano volitionvolição,
275
754173
3779
da escolha moral, da volição humana,
12:49
humanhumano agencyagência.
276
757952
3068
da atividade humana.
12:54
There is anotheroutro problemproblema:
277
762540
2225
Há um outro problema:
12:56
BigGrande datadados is going to stealroubar our jobsempregos.
278
764765
3556
Os metadados vão roubar-nos trabalho.
13:00
BigGrande datadados and algorithmsalgoritmos are going to challengedesafio
279
768321
3512
Os metadados e os algoritmos
vão pôr em causa o trabalho intelectual
13:03
whitebranco collarcolar, professionalprofissional knowledgeconhecimento work
280
771833
3061
de colarinho branco, dos profissionais
13:06
in the 21stst centuryséculo
281
774894
1653
no século XXI,
13:08
in the samemesmo way that factoryfábrica automationautomação
282
776547
2434
tal como a automação das fábricas
13:10
and the assemblymontagem linelinha
283
778981
2189
e as linhas de montagem
13:13
challengeddesafiado blueazul collarcolar labortrabalho in the 20thº centuryséculo.
284
781170
3026
puseram em causa o trabalho
dos operários no século XX.
13:16
Think about a lablaboratório techniciantécnico
285
784196
2092
Pensem num técnico de laboratório
13:18
who is looking throughatravés a microscopemicroscópio
286
786288
1409
que observa ao microscópio
a biópsia dum cancro
13:19
at a cancerCâncer biopsybiópsia
287
787697
1624
13:21
and determiningdeterminando whetherse it's cancerouscanceroso or not.
288
789321
2637
e determina se é cancerosa ou não.
13:23
The personpessoa wentfoi to universityuniversidade.
289
791958
1972
Essa pessoa frequentou a universidade.
13:25
The personpessoa buyscompra propertypropriedade.
290
793930
1430
Essa pessoa compra bens.
13:27
He or she votesvotos.
291
795360
1741
Vota.
13:29
He or she is a stakeholderdas partes interessadas in societysociedade.
292
797101
3666
É parte interessada da sociedade.
13:32
And that person'spessoas jobtrabalho,
293
800767
1394
Essa pessoa,
13:34
as well as an entireinteira fleetfrota
294
802161
1609
assim como todo um grupo
de profissionais iguais a ela,
13:35
of professionalsprofissionais like that personpessoa,
295
803770
1969
13:37
is going to find that theirdeles jobsempregos are radicallyradicalmente changedmudou
296
805739
3150
vai deparar-se com o seu trabalho
radicalmente alterado
13:40
or actuallyna realidade completelycompletamente eliminatedeliminado.
297
808889
2357
ou totalmente eliminado.
13:43
Now, we like to think
298
811246
1284
Gostamos de pensar
13:44
that technologytecnologia createscria jobsempregos over a periodperíodo of time
299
812530
3187
que a tecnologia cria empregos
depois de um curto período
temporário de transição.
13:47
after a shortcurto, temporarytemporário periodperíodo of dislocationluxação,
300
815717
3465
Isso é verdade,
dentro do quadro de referência
13:51
and that is trueverdade for the framequadro, armação of referencereferência
301
819182
1941
13:53
with whichqual we all liveviver, the IndustrialIndustrial RevolutionRevolução,
302
821123
2142
em que todos vivemos
na Revolução Industrial
13:55
because that's preciselyprecisamente what happenedaconteceu.
303
823265
2328
porque foi exatamente o que aconteceu.
13:57
But we forgetesqueço something in that analysisanálise:
304
825593
2333
Mas esquecemos uma coisa nessa análise.
13:59
There are some categoriescategorias of jobsempregos
305
827926
1830
Há algumas categorias de trabalhos
14:01
that simplysimplesmente get eliminatedeliminado and never come back.
306
829756
3420
que são eliminados e nunca mais voltam.
14:05
The IndustrialIndustrial RevolutionRevolução wasn'tnão foi very good
307
833176
2004
A Revolução Industrial não foi
muito boa para os cavalos.
14:07
if you were a horsecavalo.
308
835180
4002
14:11
So we're going to need to be carefulCuidado
309
839182
2055
Portanto, vamos ter que ser cuidadosos,
14:13
and take biggrande datadados and adjustajustar it for our needsprecisa,
310
841237
3514
agarrar nos metadados
e ajustá-los às nossas necessidades,
14:16
our very humanhumano needsprecisa.
311
844751
3185
às nossas necessidades humanas.
14:19
We have to be the mastermestre of this technologytecnologia,
312
847936
1954
Temos que ser os donos desta tecnologia
14:21
not its servantservo.
313
849890
1656
e não os seus escravos.
14:23
We are just at the outsetinício of the biggrande datadados eraera,
314
851546
2958
Estamos apenas no início
da era dos metadados.
14:26
and honestlyhonestamente, we are not very good
315
854504
3150
Honestamente, não somos muito bons
14:29
at handlingmanipulação all the datadados that we can now collectrecolher.
316
857654
4207
em manejar todos os dados
que conseguimos reunir atualmente.
14:33
It's not just a problemproblema for
the NationalNacional SecuritySegurança AgencyAgência.
317
861861
3330
Não é só um problema com a NSA.
14:37
BusinessesEmpresas collectrecolher lots of
datadados, and they misuseuso indevido it too,
318
865191
3038
A indústria reúne muitos dados
e também os utiliza mal.
14:40
and we need to get better at
this, and this will take time.
319
868229
3667
Precisamos de melhorar nisso,
mas isso vai levar tempo.
14:43
It's a little bitpouco like the challengedesafio that was facedenfrentou
320
871896
1822
É um pouco como o desafio
14:45
by primitiveprimitivo man and firefogo.
321
873718
2407
que os homens primitivos
enfrentaram com o fogo.
14:48
This is a toolferramenta, but this is a toolferramenta that,
322
876125
1885
É uma ferramenta, mas é uma ferramenta
14:50
unlessa menos que we're carefulCuidado, will burnqueimar us.
323
878010
3559
que, se não tivermos cuidado,
pode-nos queimar.
14:56
BigGrande datadados is going to transformtransformar how we liveviver,
324
884008
3120
Os metadados vão transformar
o modo como vivemos,
14:59
how we work and how we think.
325
887128
2801
como trabalhamos e como pensamos.
15:01
It is going to help us managegerir our careerscarreiras
326
889929
1889
Vão ajudar-nos a gerir as nossas carreiras
15:03
and leadconduzir livesvidas of satisfactionsatisfação and hopeesperança
327
891818
3634
e a viver com satisfação e esperança,
15:07
and happinessfelicidade and healthsaúde,
328
895452
2992
com felicidade e saúde.
15:10
but in the pastpassado, we'venós temos oftenfrequentemente
lookedolhou at informationem formação technologytecnologia
329
898444
3306
No passado, olhámos muitas vezes
para a tecnologia da informação
15:13
and our eyesolhos have only seenvisto the T,
330
901750
2208
e os nossos olhos só viram o "T,"
15:15
the technologytecnologia, the hardwarehardware,
331
903958
1686
a Tecnologia, o equipamento,
15:17
because that's what was physicalfisica.
332
905644
2262
porque era o que era físico.
15:19
We now need to recastreformulação our gazeolhar at the I,
333
907906
2924
Agora precisamos de focar
o nosso olhar no "I",
15:22
the informationem formação,
334
910830
1380
a Informação
15:24
whichqual is lessMenos apparentaparente,
335
912210
1373
que é menos aparente,
15:25
but in some waysmaneiras a lot more importantimportante.
336
913583
4109
mas em certos aspetos,
muito mais importante.
15:29
HumanityHumanidade can finallyfinalmente learnaprender from the informationem formação
337
917692
3465
A humanidade pode finalmente
aprender com as informações
15:33
that it can collectrecolher,
338
921157
2418
que consegue reunir,
15:35
as partparte of our timelessatemporal questbusca
339
923575
2115
faz parte
da nossa busca incansável
15:37
to understandCompreendo the worldmundo and our placeLugar, colocar in it,
340
925690
3159
para entender o mundo
e o nosso lugar nele.
15:40
and that's why biggrande datadados is a biggrande dealacordo.
341
928849
5631
Por isso é que os metadados
são uma coisa importante.
15:46
(ApplauseAplausos)
342
934480
3568
(Aplausos)
Translated by Margarida Ferreira
Reviewed by Hamilton Abreu

▲Back to top

ABOUT THE SPEAKER
Kenneth Cukier - Data Editor of The Economist
Kenneth Cukier is the Data Editor of The Economist. From 2007 to 2012 he was the Tokyo correspondent, and before that, the paper’s technology correspondent in London, where his work focused on innovation, intellectual property and Internet governance. Kenneth is also the co-author of Big Data: A Revolution That Will Transform How We Live, Work, and Think with Viktor Mayer-Schönberger in 2013, which was a New York Times Bestseller and translated into 16 languages.

Why you should listen

As Data Editor of The Economist and co-author of Big Data: A Revolution That Will Transform How We Live, Work, and Think, Kenneth Cukier has spent years immersed in big data, machine learning -- and the impact of both. What's the future of big data-driven technology and design? To find out, watch this talk.

More profile about the speaker
Kenneth Cukier | Speaker | TED.com