ABOUT THE SPEAKER
Abe Davis - Computer scientist
Computer vision expert Abe Davis pioneers methods to extract audio from silent digital videos, even footage shot on ordinary consumer cameras.

Why you should listen

MIT PhD student, computer vision wizard and rap artist Abe Davis has co-created the world’s most improbable audio instrument.  In 2014, Davis and his collaborators debuted the “visual microphone,” an algorithm that samples the sympathetic vibrations of ordinary objects (such as a potato chip bag) from ordinary high-speed video footage and transduces them into intelligible audio tracks.

Davis is also the author of Caperture, a 3D-imaging app designed to create and share 3D images on any compatible smartphone.

More profile about the speaker
Abe Davis | Speaker | TED.com
TED2015

Abe Davis: New video technology that reveals an object's hidden properties

Abe Davis: Nova tecnologia de vídeo que revela as propriedades ocultas de um objeto

Filmed:
1,482,525 views

Movimentos sutis acontecem à nossa volta o tempo todo, incluindo pequenas vibrações causadas pelo som. Uma nova tenologia mostra que podemos pegar essas vibrações e recriar sons e conversas através de vídeos de objetos aparentemente imóveis. Mas agora Abe Davis dá um passo adiante: veja-o demonstrar o software que deixa qualquer pessoa interagir com essas propriedades, a partir de um simples vídeo.
- Computer scientist
Computer vision expert Abe Davis pioneers methods to extract audio from silent digital videos, even footage shot on ordinary consumer cameras. Full bio

Double-click the English transcript below to play the video.

Nós pensamos em movimento
como algo visual.
00:13
Most of us think of motion
as a very visual thing.
0
1373
3349
00:17
If I walk across this stage
or gesture with my hands while I speak,
1
5889
5088
Se eu andar pelo palco
ou gesticular enquanto falo,
esse movimento é algo que vocês podem ver.
00:22
that motion is something that you can see.
2
10977
2261
00:26
But there's a world of important motion
that's too subtle for the human eye,
3
14255
5482
Mas há um mundo de movimentos importantes
que é muito sutil para o olho humano,
00:31
and over the past few years,
4
19737
2041
e nos últimos anos,
começamos a descobrir que câmeras
00:33
we've started to find that cameras
5
21778
1997
podem ver esse movimento,
mesmo quando humanos não podem.
00:35
can often see this motion
even when humans can't.
6
23775
3410
Deixe-me mostrar o que quero dizer.
00:40
So let me show you what I mean.
7
28305
1551
Na esquerda, vocês veem o vídeo
do pulso de uma pessoa
00:42
On the left here, you see video
of a person's wrist,
8
30717
3622
00:46
and on the right, you see video
of a sleeping infant,
9
34339
3147
e na direita, vocês veem o vídeo
de um bebê dormindo,
00:49
but if I didn't tell you
that these were videos,
10
37486
3146
mas se eu não tivesse dito
que são vídeos,
00:52
you might assume that you were looking
at two regular images,
11
40632
3761
vocês poderiam achar que estavam vendo
duas imagens comuns,
porque em ambos os casos,
00:56
because in both cases,
12
44393
1672
os vídeos parecem estar
completamente imóveis.
00:58
these videos appear to be
almost completely still.
13
46065
3047
01:02
But there's actually a lot
of subtle motion going on here,
14
50175
3885
Mas, na verdade, há muitos
movimentos sutis acontecendo aqui,
e se vocês tocassem o pulso da esquerda,
01:06
and if you were to touch
the wrist on the left,
15
54060
2392
01:08
you would feel a pulse,
16
56452
1996
sentiriam a pulsação,
01:10
and if you were to hold
the infant on the right,
17
58448
2485
e se vocês segurassem o bebê da direita,
01:12
you would feel the rise
and fall of her chest
18
60933
2391
sentiriam seu tórax subir e descer
01:15
as she took each breath.
19
63324
1390
a cada vez que respira.
01:17
And these motions carry
a lot of significance,
20
65762
3576
E esses movimentos carregam
muito significado,
01:21
but they're usually
too subtle for us to see,
21
69338
3343
mas geralmente são
muito sutis para serem vistos,
01:24
so instead, we have to observe them
22
72681
2276
então, em vez disso, temos que observá-los
01:26
through direct contact, through touch.
23
74957
2900
através do contato direto,
através do toque.
01:30
But a few years ago,
24
78997
1265
Mas alguns anos atrás,
01:32
my colleagues at MIT developed
what they call a motion microscope,
25
80262
4405
meus colegas no MIT desenvolveram o que
eles chamam de microscópio do movimento,
01:36
which is software that finds
these subtle motions in video
26
84667
4384
que é um software que encontra
esses movimentos sutis em vídeos
01:41
and amplifies them so that they
become large enough for us to see.
27
89051
3562
e os amplifica para que se tornem
grandes o suficiente para podermos ver.
01:45
And so, if we use their software
on the left video,
28
93416
3483
Então, se usarmos o software
no vídeo da esquerda,
01:48
it lets us see the pulse in this wrist,
29
96899
3250
podemos ver a pulsação,
01:52
and if we were to count that pulse,
30
100149
1695
e se contássemos esta pulsação,
01:53
we could even figure out
this person's heart rate.
31
101844
2355
nós poderíamos descobrir
os batimentos cardíacos dessa pessoa.
01:57
And if we used the same software
on the right video,
32
105095
3065
E se usássemos o mesmo software
no vídeo da direita,
02:00
it lets us see each breath
that this infant takes,
33
108160
3227
ele nos deixa ver cada
vez que este bebê respira,
02:03
and we can use this as a contact-free way
to monitor her breathing.
34
111387
4137
e podemos usá-lo como uma maneira
de monitorar sua respiração sem tocar.
02:08
And so this technology is really powerful
because it takes these phenomena
35
116884
5348
E essa tecnologia é realmente poderosa,
pois pega esses fenômenos
que normalmente temos
que experimentar pelo toque
02:14
that we normally have
to experience through touch
36
122232
2367
e nos deixa capturá-los visualmente
e não invasivamente.
02:16
and it lets us capture them visually
and non-invasively.
37
124599
2957
Alguns anos atrás, eu comecei a trabalhar
com as pessoas que criaram esse software,
02:21
So a couple years ago, I started working
with the folks that created that software,
38
129104
4411
e decidimos ir atrás de uma ideia louca.
02:25
and we decided to pursue a crazy idea.
39
133515
3367
Pensamos, é legal
podermos usar esse software
02:28
We thought, it's cool
that we can use software
40
136882
2693
02:31
to visualize tiny motions like this,
41
139575
3135
para visualizar movimentos pequenos assim,
e poder pensar nisso como uma maneira
de estender nosso senso de toque.
02:34
and you can almost think of it
as a way to extend our sense of touch.
42
142710
4458
02:39
But what if we could do the same thing
with our ability to hear?
43
147168
4059
Mas e se pudéssemos fazer a mesma coisa
com a nossa capacidade de ouvir?
E se pudéssemos usar o vídeo
para capturar as vibrações de som,
02:44
What if we could use video
to capture the vibrations of sound,
44
152508
4665
02:49
which are just another kind of motion,
45
157173
2827
que são apenas outro tipo de movimento,
02:52
and turn everything that we see
into a microphone?
46
160000
3346
e transformássemos tudo
o que vemos em um microfone?
Bom, essa é uma ideia um pouco estranha,
02:56
Now, this is a bit of a strange idea,
47
164236
1971
02:58
so let me try to put it
in perspective for you.
48
166207
2586
então me deixe colocá-la
em perspectiva para vocês.
03:01
Traditional microphones
work by converting the motion
49
169523
3488
Microfones tradicionais funcionam
convertendo o movimento
03:05
of an internal diaphragm
into an electrical signal,
50
173011
3599
de um diafragma interno em sinal elétrico,
03:08
and that diaphragm is designed
to move readily with sound
51
176610
4318
e o diafragma é feito
para mover prontamente com som
03:12
so that its motion can be recorded
and interpreted as audio.
52
180928
4807
para que seus movimentos possam
ser gravados e interpretados como áudio.
Mas o som faz todos os objetos vibrarem.
03:17
But sound causes all objects to vibrate.
53
185735
3668
03:21
Those vibrations are just usually
too subtle and too fast for us to see.
54
189403
5480
Essas vibrações são normalmente
sutis e rápidas demais para nós vermos.
03:26
So what if we record them
with a high-speed camera
55
194883
3738
E se as gravarmos
com uma câmera de alta velocidade
03:30
and then use software
to extract tiny motions
56
198621
3576
e depois usarmos o software
para extrair pequenos movimentos
03:34
from our high-speed video,
57
202197
2090
do nosso vídeo de alta velocidade,
03:36
and analyze those motions to figure out
what sounds created them?
58
204287
4274
e analisarmos esses movimentos
para descobrir quais sons os criaram?
Isto nos permitiria transformar objetos
visíveis em microfones à distância.
03:41
This would let us turn visible objects
into visual microphones from a distance.
59
209859
5449
03:49
And so we tried this out,
60
217080
2183
E então nós tentamos,
e aqui está uma de nossas experiências,
03:51
and here's one of our experiments,
61
219263
1927
em que nós pegamos esta planta
que vocês veem na direita
03:53
where we took this potted plant
that you see on the right
62
221190
2949
03:56
and we filmed it with a high-speed camera
63
224139
2438
e a filmamos com uma câmera
de alta velocidade
enquanto um alto-falante
tocava esta música.
03:58
while a nearby loudspeaker
played this sound.
64
226577
3529
(Música: "Mary Had a Little Lamb")
04:02
(Music: "Mary Had a Little Lamb")
65
230275
8190
04:11
And so here's the video that we recorded,
66
239820
2824
E aqui está o vídeo que gravamos,
04:14
and we recorded it at thousands
of frames per second,
67
242644
3924
e o gravamos a milhares
de quadros por segundo,
mas mesmo se vocês olharem de perto,
04:18
but even if you look very closely,
68
246568
2322
só verão algumas folhas
04:20
all you'll see are some leaves
69
248890
1951
04:22
that are pretty much
just sitting there doing nothing,
70
250841
3065
que estão basicamente
paradas ali, sem fazer nada,
04:25
because our sound only moved those leaves
by about a micrometer.
71
253906
4806
porque nosso som só moveu aquelas folhas
por volta de um micrômetro.
04:31
That's one ten-thousandth of a centimeter,
72
259103
4276
Isso é um décimo de milésimo
de centímetro,
04:35
which spans somewhere between
a hundredth and a thousandth
73
263379
4156
que fica entre um centésimo e um milésimo
de um pixel nesta imagem.
04:39
of a pixel in this image.
74
267535
2299
04:41
So you can squint all you want,
75
269881
2887
Vocês podem olhar o quanto quiserem,
mas o movimento pequeno assim é
basicamente imperceptível.
04:44
but motion that small is pretty much
perceptually invisible.
76
272768
3335
Mas verifica-se que algo
pode ser imperceptível
04:49
But it turns out that something
can be perceptually invisible
77
277667
4157
e ainda ser numericamente significante,
04:53
and still be numerically significant,
78
281824
2809
pois com os algoritmos certos,
04:56
because with the right algorithms,
79
284633
2002
podemos pegar este vídeo silencioso
e aparentemente parado
04:58
we can take this silent,
seemingly still video
80
286635
3687
e podemos recuperar este som.
05:02
and we can recover this sound.
81
290322
1527
(Música: "Mary Had a Little Lamb")
05:04
(Music: "Mary Had a Little Lamb")
82
292690
7384
(Aplausos)
05:12
(Applause)
83
300074
5828
Como isso é possível?
05:22
So how is this possible?
84
310058
1939
Como podemos obter tanta informação
de tão pouco movimento?
05:23
How can we get so much information
out of so little motion?
85
311997
4344
Bom, vamos supor que aquelas folhas
se movem a apenas um micrômetro,
05:28
Well, let's say that those leaves
move by just a single micrometer,
86
316341
5361
05:33
and let's say that that shifts our image
by just a thousandth of a pixel.
87
321702
4308
e vamos dizer que isso muda a nossa imagem
a apenas um milésimo de um pixel.
05:39
That may not seem like much,
88
327269
2572
Pode não parecer muito,
mas um simples quadro de vídeo
05:41
but a single frame of video
89
329841
1996
pode ter centenas de milhares de pixels,
05:43
may have hundreds of thousands
of pixels in it,
90
331837
3257
e se combinarmos todos
os pequenos movimentos que vemos
05:47
and so if we combine all
of the tiny motions that we see
91
335094
3454
05:50
from across that entire image,
92
338548
2298
em toda essa imagem,
05:52
then suddenly a thousandth of a pixel
93
340846
2623
então um milésimo de pixel
05:55
can start to add up
to something pretty significant.
94
343469
2775
pode começar a virar
algo bem significante.
05:58
On a personal note, we were pretty psyched
when we figured this out.
95
346870
3635
Pessoalmente, ficamos muito empolgados
quando descobrimos isso.
(Risadas)
06:02
(Laughter)
96
350505
2320
Mas mesmo com o algoritmo certo,
06:04
But even with the right algorithm,
97
352825
3253
nós ainda estávamos perdendo alguns
pedaços importantes do quebra-cabeças.
06:08
we were still missing
a pretty important piece of the puzzle.
98
356078
3617
06:11
You see, there are a lot of factors
that affect when and how well
99
359695
3604
Vejam, há muitos fatores
que afetam quando e quão bem
06:15
this technique will work.
100
363299
1997
essa técnica vai funcionar.
Tem o objeto e o quão distante ele está,
06:17
There's the object and how far away it is;
101
365296
3204
tem a câmera e as lentes usadas,
06:20
there's the camera
and the lens that you use;
102
368500
2394
quanta luz está iluminando o objeto
e o quão alto o som está.
06:22
how much light is shining on the object
and how loud your sound is.
103
370894
4091
E mesmo com o algoritmo certo,
06:27
And even with the right algorithm,
104
375945
3375
tivemos que ser cuidadosos
com nossas primeiras experiências,
06:31
we had to be very careful
with our early experiments,
105
379320
3390
porque se errássemos
qualquer um desses fatores,
06:34
because if we got
any of these factors wrong,
106
382710
2392
não haveria como saber
qual era o problema.
06:37
there was no way to tell
what the problem was.
107
385102
2368
Nós receberíamos apenas barulho de volta.
06:39
We would just get noise back.
108
387470
2647
Muitas das nossas primeiras
experiências pareciam com isso.
06:42
And so a lot of our early
experiments looked like this.
109
390117
3320
E aqui estou eu,
06:45
And so here I am,
110
393437
2206
e abaixo, na esquerda, vocês podem
ver a nossa câmera de alta velocidade,
06:47
and on the bottom left, you can kind of
see our high-speed camera,
111
395643
4040
que está apontada para um pacote de batata
06:51
which is pointed at a bag of chips,
112
399683
2183
e está tudo iluminado
por essas lâmpadas.
06:53
and the whole thing is lit
by these bright lamps.
113
401866
2949
E, como eu disse, nós tivemos que
ser cuidadosos nas primeiras experiências,
06:56
And like I said, we had to be
very careful in these early experiments,
114
404815
4365
então foi assim que aconteceu.
07:01
so this is how it went down.
115
409180
2508
(Vídeo) Abe Davis: três, dois, um, vai.
07:03
(Video) Abe Davis: Three, two, one, go.
116
411688
3761
Mary had a little lamb!
Little lamb! Little lamb!
07:07
Mary had a little lamb!
Little lamb! Little lamb!
117
415449
5387
(Risadas)
07:12
(Laughter)
118
420836
4500
AD: Então essa experiência
parece completamente ridícula.
07:17
AD: So this experiment
looks completely ridiculous.
119
425336
2814
(Risadas)
07:20
(Laughter)
120
428150
1788
Bom, eu estou gritando
com um pacote de batata
07:21
I mean, I'm screaming at a bag of chips --
121
429938
2345
(Risadas)
07:24
(Laughter) --
122
432283
1551
07:25
and we're blasting it with so much light,
123
433834
2117
e estamos a irradiando com tanta luz,
que nós literalmente derretemos o primeiro
pacote que nós testamos. (Risadas)
07:27
we literally melted the first bag
we tried this on. (Laughter)
124
435951
4479
Mas por mais ridícula
que essa experiência pareça,
07:32
But ridiculous as this experiment looks,
125
440525
3274
foi, na verdade, muito importante,
07:35
it was actually really important,
126
443799
1788
porque pudemos recuperar este som.
07:37
because we were able
to recover this sound.
127
445587
2926
(Áudio) Mary had a little lamb!
Little lamb! Little lamb!
07:40
(Audio) Mary had a little lamb!
Little lamb! Little lamb!
128
448513
4712
(Aplausos)
07:45
(Applause)
129
453225
4088
AD: Isso foi realmente significativo,
07:49
AD: And this was really significant,
130
457313
1881
porque foi a primeira vez que nós
recuperamos discurso humano intelegível
07:51
because it was the first time
we recovered intelligible human speech
131
459194
4119
07:55
from silent video of an object.
132
463424
2341
do vídeo silencioso de um objeto.
07:57
And so it gave us this point of reference,
133
465765
2391
Isso nos deu este ponto de referência,
08:00
and gradually we could start
to modify the experiment,
134
468156
3871
e pudemos começar a gradualmente
mudar a experiência,
usando objetos diferentes
ou afastando mais o objeto
08:04
using different objects
or moving the object further away,
135
472106
3805
usando menos luz ou sons mais baixos.
08:07
using less light or quieter sounds.
136
475911
2770
Nós analisamos todos essas experiências
08:11
And we analyzed all of these experiments
137
479887
2874
08:14
until we really understood
the limits of our technique,
138
482761
3622
até realmente entendermos
os limites da nossa técnica,
08:18
because once we understood those limits,
139
486383
1950
pois uma vez entendidos,
08:20
we could figure out how to push them.
140
488333
2346
poderíamos descobrir como ultrapassá-los.
08:22
And that led to experiments like this one,
141
490679
3181
E isso nos levou a experiências como esta,
08:25
where again, I'm going to speak
to a bag of chips,
142
493860
2739
em que vou, novamente, falar
com um pacote de batatas,
08:28
but this time we've moved our camera
about 15 feet away,
143
496599
4830
mas dessa vez afastamos
a câmera a uns 4,5 metros,
do lado de fora, atrás
de uma janela à prova de som,
08:33
outside, behind a soundproof window,
144
501429
2833
08:36
and the whole thing is lit
by only natural sunlight.
145
504262
2803
e tudo está iluminado
apenas por luz natural.
E aqui está o vídeo que filmamos.
08:40
And so here's the video that we captured.
146
508529
2155
08:44
And this is what things sounded like
from inside, next to the bag of chips.
147
512450
4559
E foi assim que as coisas soaram
de dentro, próximo ao pacote de batatas.
08:49
(Audio) Mary had a little lamb
whose fleece was white as snow,
148
517009
5038
(Áudio) "Mary had a little lamb
whose fleece was white as snow,
and everywhere that Mary went,
that lamb was sure to go."
08:54
and everywhere that Mary went,
that lamb was sure to go.
149
522047
5619
AD: E aqui está o que conseguimos
recuperar do nosso vídeo silencioso
08:59
AD: And here's what we were able
to recover from our silent video
150
527666
4017
capturado do lado de fora,
atrás da janela.
09:03
captured outside behind that window.
151
531683
2345
(Áudio) "Mary had a little lamb
whose fleece was white as snow,
09:06
(Audio) Mary had a little lamb
whose fleece was white as snow,
152
534028
4435
and everywhere that Mary went,
that lamb was sure to go."
09:10
and everywhere that Mary went,
that lamb was sure to go.
153
538463
5457
(Aplausos)
09:15
(Applause)
154
543920
6501
AD: E há outras maneiras
de ultrapassar esses limites também.
09:22
AD: And there are other ways
that we can push these limits as well.
155
550421
3542
09:25
So here's a quieter experiment
156
553963
1798
Em uma experiência mais silenciosa,
09:27
where we filmed some earphones
plugged into a laptop computer,
157
555761
4110
nós filmamos alguns fones de ouvido
plugados em um laptop,
09:31
and in this case, our goal was to recover
the music that was playing on that laptop
158
559871
4110
e nesse caso, nosso objetivo era recuperar
a música que estava tocando no laptop
09:35
from just silent video
159
563981
2299
do vídeo silencioso
09:38
of these two little plastic earphones,
160
566280
2507
desses dois fones de ouvido de plástico,
e conseguimos fazer isso tão bem
09:40
and we were able to do this so well
161
568787
2183
09:42
that I could even Shazam our results.
162
570970
2461
que eu pude até pôr
os resultados no Shazam.
09:45
(Laughter)
163
573431
2411
(Risadas)
(Música: Under Pressure - Queen)
09:49
(Music: "Under Pressure" by Queen)
164
577191
10034
(Aplausos)
10:01
(Applause)
165
589615
4969
10:06
And we can also push things
by changing the hardware that we use.
166
594584
4551
E também podemos dar um empurrãozinho
mudando o hardware que usamos.
10:11
Because the experiments
I've shown you so far
167
599135
2461
Porque as experiências
que mostrei até agora
foram feitas com uma câmera,
de alta velocidade,
10:13
were done with a camera,
a high-speed camera,
168
601596
2322
10:15
that can record video
about a 100 times faster
169
603918
2879
que pode gravar vídeos
até 100 vezes mais rápido
10:18
than most cell phones,
170
606797
1927
que a maioria dos celulares,
10:20
but we've also found a way
to use this technique
171
608724
2809
mas também encontramos um modo
de usar essa técnica
10:23
with more regular cameras,
172
611533
2230
com câmeras mais comuns,
10:25
and we do that by taking advantage
of what's called a rolling shutter.
173
613763
4069
e nós fazemos isso tirando vantagem
do que é chamado de persiana.
10:29
You see, most cameras
record images one row at a time,
174
617832
4798
Vejam, a maioria das câmeras
gravam imagens um rolo por vez,
10:34
and so if an object moves
during the recording of a single image,
175
622630
5702
e se um objeto se mover
durante a gravação de apenas uma imagem,
há um pequeno atraso entre cada rolo,
10:40
there's a slight time delay
between each row,
176
628344
2717
10:43
and this causes slight artifacts
177
631061
3157
e isso causa pequenos artefatos
10:46
that get coded into each frame of a video.
178
634218
3483
que são codificados
entre cada quadro de um vídeo.
10:49
And so what we found
is that by analyzing these artifacts,
179
637701
3806
Então descobrimos
que, analisando esses artefatos,
10:53
we can actually recover sound
using a modified version of our algorithm.
180
641507
4615
podemos recuperar o som usando
uma versão modificada do nosso algoritmo.
10:58
So here's an experiment we did
181
646122
1912
Aqui está uma experiência que fizemos
11:00
where we filmed a bag of candy
182
648034
1695
em que filmamos um pacote de doces
11:01
while a nearby loudspeaker played
183
649729
1741
enquanto um alto-falante tocava
11:03
the same "Mary Had a Little Lamb"
music from before,
184
651470
2972
a mesma música de antes,
"Mary Had a Little Lamb",
11:06
but this time, we used just a regular
store-bought camera,
185
654442
4203
mas dessa vez, usamos apenas
uma câmera comum de loja,
11:10
and so in a second, I'll play for you
the sound that we recovered,
186
658645
3174
e em um segundo, vou tocar pra vocês
o som que recuperamos,
e vai parecer distorcido dessa vez,
11:13
and it's going to sound
distorted this time,
187
661819
2050
mas escutem e vejam se vocês ainda
reconhecem a música.
11:15
but listen and see if you can still
recognize the music.
188
663869
2836
(Áudio: "Mary Had a Little Lamb")
11:19
(Audio: "Mary Had a Little Lamb")
189
667723
6223
11:37
And so, again, that sounds distorted,
190
685527
3465
E, de novo, parece distorcido,
11:40
but what's really amazing here
is that we were able to do this
191
688992
4386
mas o que é realmente incrível aqui
é que conseguimos fazer isso
11:45
with something
that you could literally run out
192
693378
2626
com algo que você pode literalmente sair
11:48
and pick up at a Best Buy.
193
696004
1444
e comprar no Best Buy.
11:51
So at this point,
194
699122
1363
Nesse momento,
muitas pessoas veem esse trabalho,
11:52
a lot of people see this work,
195
700485
1974
e imediatamente pensam em vigilância.
11:54
and they immediately think
about surveillance.
196
702459
3413
E, pra ser justo,
11:57
And to be fair,
197
705872
2415
não é difícil imaginar que pode-se usar
essa tecnologia para espiar alguém.
12:00
it's not hard to imagine how you might use
this technology to spy on someone.
198
708287
4133
Mas tenha em mente que já
existem muitas tecnologias maduras
12:04
But keep in mind that there's already
a lot of very mature technology
199
712420
3947
12:08
out there for surveillance.
200
716367
1579
para vigilância.
12:09
In fact, people have been using lasers
201
717946
2090
De fato, as pessoas têm usado lêiseres
12:12
to eavesdrop on objects
from a distance for decades.
202
720036
2799
para bisbilhotar objetos
à distância por décadas.
Mas o que é realmente novo aqui,
12:15
But what's really new here,
203
723978
2025
o que é realmente diferente,
12:18
what's really different,
204
726003
1440
12:19
is that now we have a way
to picture the vibrations of an object,
205
727443
4295
é que agora temos uma maneira
de imaginar as vibrações de um objeto,
12:23
which gives us a new lens
through which to look at the world,
206
731738
3413
o que nos dá uma nova lente
através da qual podemos ver o mundo,
e podemos usar essa lente
12:27
and we can use that lens
207
735151
1510
12:28
to learn not just about forces like sound
that cause an object to vibrate,
208
736661
4899
para aprender não apenas sobre forças
como o som, que faz um objeto a vibrar,
12:33
but also about the object itself.
209
741560
2288
mas também sobre o próprio objeto.
Eu quero dar um passo atrás
12:36
And so I want to take a step back
210
744975
1693
12:38
and think about how that might change
the ways that we use video,
211
746668
4249
e pensar em como isso pode mudar
as maneiras como usamos vídeo,
12:42
because we usually use video
to look at things,
212
750917
3553
porque costumamos usar vídeo
para ver as coisas,
12:46
and I've just shown you how we can use it
213
754470
2322
e eu só mostrei como podemos usá-lo
12:48
to listen to things.
214
756792
1857
para ouvir as coisas.
Mas tem outra maneira importante
de aprendermos sobre o mundo:
12:50
But there's another important way
that we learn about the world:
215
758649
3971
interagindo com ele.
12:54
that's by interacting with it.
216
762620
2275
Nós empurramos, puxamos,
cutucamos e estimulamos coisas.
12:56
We push and pull and poke and prod things.
217
764895
3111
Nós mexemos nas coisas
pra ver o que acontece.
13:00
We shake things and see what happens.
218
768006
3181
13:03
And that's something that video
still won't let us do,
219
771187
4273
E isso é algo que o vídeo ainda
não nos deixa fazer,
pelo menos não tradicionalmente.
13:07
at least not traditionally.
220
775460
2136
13:09
So I want to show you some new work,
221
777596
1950
Quero mostrar alguns novos trabalhos,
13:11
and this is based on an idea I had
just a few months ago,
222
779546
2667
e isso é baseado em um ideia
que tive alguns meses atrás.
Esta é a primeira em que mostro isso
para um público, na verdade.
13:14
so this is actually the first time
I've shown it to a public audience.
223
782213
3301
E a ideia básica é a de que vamos
usar as vibrações em um vídeo
13:17
And the basic idea is that we're going
to use the vibrations in a video
224
785514
5363
13:22
to capture objects in a way
that will let us interact with them
225
790877
4481
para capturar objetos de modo
a nos deixar interagir com eles
13:27
and see how they react to us.
226
795358
1974
e ver como eles reagem a nós.
13:31
So here's an object,
227
799120
1764
Aqui está um objeto,
13:32
and in this case, it's a wire figure
in the shape of a human,
228
800884
3832
e nesse caso, é uma figura em fios
no formato de um humano,
13:36
and we're going to film that object
with just a regular camera.
229
804716
3088
e vamos filmar esse objeto
com uma câmera comum.
13:39
So there's nothing special
about this camera.
230
807804
2124
Não tem nada de especial nessa câmera.
13:41
In fact, I've actually done this
with my cell phone before.
231
809928
2961
Na verdade, eu fiz isso
com o meu celular antes.
13:44
But we do want to see the object vibrate,
232
812889
2252
Mas queremos ver o objeto vibrar
e, para isso acontecer,
13:47
so to make that happen,
233
815141
1133
13:48
we're just going to bang a little bit
on the surface where it's resting
234
816274
3346
nós vamos bater um pouco
na superfície onde ele está parado
13:51
while we record this video.
235
819620
2138
enquanto gravamos este vídeo.
Então é isso: apenas cinco segundos
de vídeo comum,
13:59
So that's it: just five seconds
of regular video,
236
827398
3671
enquanto batemos nessa superfície.
14:03
while we bang on this surface,
237
831069
2136
14:05
and we're going to use
the vibrations in that video
238
833205
3513
Vamos usar as vibrações nesse vídeo
14:08
to learn about the structural
and material properties of our object,
239
836718
4544
para aprender sobre as propriedades
estruturais e materiais do nosso objeto,
e vamos usar essa informação
para criar algo novo e interativo.
14:13
and we're going to use that information
to create something new and interactive.
240
841262
4834
14:24
And so here's what we've created.
241
852866
2653
Aqui está o que nós criamos.
14:27
And it looks like a regular image,
242
855519
2229
E parece uma imagem comum,
14:29
but this isn't an image,
and it's not a video,
243
857748
3111
mas isso não é uma imagem,
nem é um video,
14:32
because now I can take my mouse
244
860859
2368
porque agora eu posso pegar o mouse
14:35
and I can start interacting
with the object.
245
863227
2859
e eu posso começar a interagir
com o objeto.
14:44
And so what you see here
246
872936
2357
E o que você vê aqui
é a simulação de como esse objeto
14:47
is a simulation of how this object
247
875389
2226
14:49
would respond to new forces
that we've never seen before,
248
877615
4458
responderia a novas forças
que nunca vimos antes,
14:54
and we created it from just
five seconds of regular video.
249
882073
3633
e nós criamos isso a partir de cinco
segundos de um vídeo comum.
(Aplausos)
14:59
(Applause)
250
887249
4715
Essa é uma maneira muito
poderosa de ver o mundo,
15:09
And so this is a really powerful
way to look at the world,
251
897421
3227
porque ela nos deixa prever
como os objetos vão responder
15:12
because it lets us predict
how objects will respond
252
900648
2972
15:15
to new situations,
253
903620
1823
a novas situações,
15:17
and you could imagine, for instance,
looking at an old bridge
254
905443
3473
e você pode imaginar, por exemplo,
olhar para uma ponte velha
15:20
and wondering what would happen,
how would that bridge hold up
255
908916
3527
e se perguntar o que aconteceria,
como a ponte aguentaria
15:24
if I were to drive my car across it.
256
912443
2833
se eu dirigisse meu carro nela.
15:27
And that's a question
that you probably want to answer
257
915276
2774
E essa é uma questão que você
provavelmente quer responder
15:30
before you start driving
across that bridge.
258
918050
2560
antes de começar a dirigir naquela ponte.
15:33
And of course, there are going to be
limitations to this technique,
259
921988
3272
E haverá limitações a essa técnica,
assim como houve com o microfone visual,
15:37
just like there were
with the visual microphone,
260
925260
2462
mas descobrimos que ela funciona
em muitas situações
15:39
but we found that it works
in a lot of situations
261
927722
3181
que você pode não imaginar,
15:42
that you might not expect,
262
930903
1875
15:44
especially if you give it longer videos.
263
932778
2768
principalmente com vídeos maiores.
Por exemplo, aqui tem um vídeo que filmei
15:47
So for example,
here's a video that I captured
264
935546
2508
de um arbusto fora do me apartamento,
15:50
of a bush outside of my apartment,
265
938054
2299
15:52
and I didn't do anything to this bush,
266
940353
3088
e não fiz nada a esse arbusto,
mas filmando um vídeo de um minuto,
15:55
but by capturing a minute-long video,
267
943441
2705
uma brisa causou vibrações suficientes
15:58
a gentle breeze caused enough vibrations
268
946146
3378
16:01
that we could learn enough about this bush
to create this simulation.
269
949524
3587
e, assim, pudemos aprender o suficiente
sobre o arbusto para criar essa simulação.
16:07
(Applause)
270
955270
6142
(Aplausos)
16:13
And so you could imagine giving this
to a film director,
271
961412
2972
E você pode imaginar dar isso
a um diretor de cinema,
e deixá-lo controlar
16:16
and letting him control, say,
272
964384
1719
16:18
the strength and direction of wind
in a shot after it's been recorded.
273
966103
4922
a força e a direção do vento
numa filmagem depois que ela foi gravada.
Ou, nesse caso, nós apontamos nossa câmera
para uma cortina pendurada
16:24
Or, in this case, we pointed our camera
at a hanging curtain,
274
972810
4535
16:29
and you can't even see
any motion in this video,
275
977345
4129
e você não pode ver nenhum
movimento nesse vídeo,
mas gravando um vídeo de dois minutos,
16:33
but by recording a two-minute-long video,
276
981474
2925
as correntes de ar natural nesse quarto
16:36
natural air currents in this room
277
984399
2438
16:38
created enough subtle,
imperceptible motions and vibrations
278
986837
4412
criaram movimentos e vibrações
sutis e imperceptíveis
16:43
that we could learn enough
to create this simulation.
279
991249
2565
e, assim, pudemos aprender o suficiente
para criar essa simulação.
16:48
And ironically,
280
996243
2366
Ironicamente,
16:50
we're kind of used to having
this kind of interactivity
281
998609
3088
nós estamos acostumados a ter
esse tipo de interatividade
16:53
when it comes to virtual objects,
282
1001697
2647
quando se trata de objetos virtuais,
16:56
when it comes to video games
and 3D models,
283
1004344
3297
videogames e modelos 3D,
16:59
but to be able to capture this information
from real objects in the real world
284
1007641
4404
mas ser capaz de capturar essa informação
de objetos reais, no mundo real,
17:04
using just simple, regular video,
285
1012045
2817
usando apenas um vídeo simples, comum,
17:06
is something new that has
a lot of potential.
286
1014862
2183
é algo novo que tem muito potencial.
17:10
So here are the amazing people
who worked with me on these projects.
287
1018410
4904
Aqui estão as pessoas incríveis
que trabalharam comigo nesses projetos.
17:16
(Applause)
288
1024057
5596
(Aplausos)
E o que mostrei hoje
é apenas o início.
17:24
And what I've shown you today
is only the beginning.
289
1032819
3057
Nós só começamos a sondar a superfície
17:27
We've just started to scratch the surface
290
1035876
2113
do que pode ser feito
com esse tipo de imagem,
17:29
of what you can do
with this kind of imaging,
291
1037989
2972
porque ela nos dá um novo modo
17:32
because it gives us a new way
292
1040961
2286
de notar o que está a nossa volta
com uma tecnologia comum e acessível.
17:35
to capture our surroundings
with common, accessible technology.
293
1043342
4724
E olhando para o futuro,
17:40
And so looking to the future,
294
1048066
1929
17:41
it's going to be
really exciting to explore
295
1049995
2037
vai ser realmente animador explorar
17:44
what this can tell us about the world.
296
1052032
1856
o que isso pode nos dizer sobre o mundo.
Obrigado.
17:46
Thank you.
297
1054381
1204
17:47
(Applause)
298
1055610
6107
(Aplausos)
Translated by Guilherme Dias
Reviewed by Leonardo Silva

▲Back to top

ABOUT THE SPEAKER
Abe Davis - Computer scientist
Computer vision expert Abe Davis pioneers methods to extract audio from silent digital videos, even footage shot on ordinary consumer cameras.

Why you should listen

MIT PhD student, computer vision wizard and rap artist Abe Davis has co-created the world’s most improbable audio instrument.  In 2014, Davis and his collaborators debuted the “visual microphone,” an algorithm that samples the sympathetic vibrations of ordinary objects (such as a potato chip bag) from ordinary high-speed video footage and transduces them into intelligible audio tracks.

Davis is also the author of Caperture, a 3D-imaging app designed to create and share 3D images on any compatible smartphone.

More profile about the speaker
Abe Davis | Speaker | TED.com