English-Video.net comment policy

The comment field is common to all languages

Let's write in your language and use "Google Translate" together

Please refer to informative community guidelines on TED.com

TED2015

Fei-Fei Li: How we're teaching computers to understand pictures

Fei-Fei Li: Como estamos ensinando os computadores a compreender fotos

Filmed:
2,378,245 views

Quando uma criancinha olha para uma foto, ela consegue identificar elementos simples: "gato", "livro", "cadeira". Bem, os computadores estão ficando inteligentes o suficiente para fazer isso também. O que vem a seguir? Em uma palestra animada, a especialista em visão computacional Fei-Fei Li fala sobre tecnologia de ponta - incluindo um banco de dados de 15 milhões de fotos que a sua equipe reuniu para "ensinar" um computador a compreender fotos - e sobre ideias importantes que estão por vir.

- Computer scientist
As Director of Stanford’s Artificial Intelligence Lab and Vision Lab, Fei-Fei Li is working to solve AI’s trickiest problems -- including image recognition, learning and language processing. Full bio

00:14
Let me show you something.
Deixem-me lhes mostrar algo.
(Vídeo) Garota: Certo, isso é um gato
sentado sobre a cama.
00:18
(Video) Girl: Okay, that's a cat
sitting in a bed.
O garoto está acariciando o elefante.
00:22
The boy is petting the elephant.
Aquelas são pessoas
que estão entrando num avião.
00:26
Those are people
that are going on an airplane.
É um avião grande!
00:30
That's a big airplane.
Fei-Fei Li: Esta é uma criança
de três anos de idade
00:33
Fei-Fei Li: This is
a three-year-old child
descrevendo o que vê numa série de fotos.
00:35
describing what she sees
in a series of photos.
Ela ainda tem muito
o que aprender sobre este mundo,
00:39
She might still have a lot
to learn about this world,
mas já é uma especialista
numa importante tarefa:
00:42
but she's already an expert
at one very important task:
dar sentido ao que vê.
00:46
to make sense of what she sees.
Nossa sociedade está mais
tecnologicamente avançada do que nunca.
00:50
Our society is more
technologically advanced than ever.
Mandamos pessoas para a Lua,
fazemos telefones que falam conosco
00:54
We send people to the moon,
we make phones that talk to us
ou personalizamos estações de rádio
para tocar só as músicas de que gostamos.
00:58
or customize radio stations
that can play only music we like.
No entanto, nossas máquinas
mais avançadas e computadores
01:03
Yet, our most advanced
machines and computers
ainda lutam para realizar esta tarefa.
01:07
still struggle at this task.
Então, estou aqui hoje
para dar um relatório do progresso
01:09
So I'm here today
to give you a progress report
sobre os últimos avanços
em nossa pesquisa em visão computacional,
01:13
on the latest advances
in our research in computer vision,
uma das tecnologias mais inovadoras
e potencialmente revolucionárias
01:17
one of the most frontier
and potentially revolutionary
01:21
technologies in computer science.
na ciência da computação.
Sim, temos protótipos de carros
que podem dirigir sozinhos,
01:24
Yes, we have prototyped cars
that can drive by themselves,
mas sem uma visão inteligente,
não conseguem notar a diferença
01:29
but without smart vision,
they cannot really tell the difference
entre um saco de papel amassado
na estrada, que pode ser atropelado,
01:33
between a crumpled paper bag
on the road, which can be run over,
e uma pedra daquele tamanho,
que deve ser evitada.
01:37
and a rock that size,
which should be avoided.
Fizemos câmeras incríveis de megapixel,
01:41
We have made fabulous megapixel cameras,
mas não demos visão aos cegos.
01:44
but we have not delivered
sight to the blind.
Os "drones" podem voar
sobre a terra firme,
01:48
Drones can fly over massive land,
mas não têm a tecnologia
de visão suficiente
01:51
but don't have enough vision technology
para nos ajudar a rastrear
as mudanças das florestas tropicais.
01:53
to help us to track
the changes of the rainforests.
As câmeras de segurança
estão em toda parte,
01:57
Security cameras are everywhere,
mas não nos alertam quando uma criança
está se afogando numa piscina.
02:00
but they do not alert us when a child
is drowning in a swimming pool.
Fotos e vídeos estão se tornando
partes integrais da vida global.
02:06
Photos and videos are becoming
an integral part of global life.
Estão sendo gerados a um ritmo
muito além do que qualquer humano,
02:11
They're being generated at a pace
that's far beyond what any human,
-- ou grupos de seres humanos --
poderia esperar ver.
02:15
or teams of humans, could hope to view,
E vocês e eu estamos contribuindo
para isto nesta palestra TED.
02:18
and you and I are contributing
to that at this TED.
No entanto, nosso software mais avançado
ainda tem dificuldade para compreender
02:22
Yet our most advanced software
is still struggling at understanding
02:27
and managing this enormous content.
e administrar este conteúdo enorme.
Então, em outras palavras,
coletivamente como sociedade,
02:31
So in other words,
collectively as a society,
somos muito cegos,
02:36
we're very much blind,
porque nossas máquinas
mais inteligentes ainda são cegas.
02:38
because our smartest
machines are still blind.
"Por que isto é tão difícil?",
vocês podem perguntar.
02:43
"Why is this so hard?" you may ask.
As câmeras podem tirar fotos como esta,
02:46
Cameras can take pictures like this one
convertendo luzes numa matriz
bidimensional de números
02:49
by converting lights into
a two-dimensional array of numbers
conhecida como pixels,
02:53
known as pixels,
mas estes são apenas números sem vida,
02:54
but these are just lifeless numbers.
não carregam significado em si mesmos.
02:57
They do not carry meaning in themselves.
Assim como ouvir
não é o mesmo que escutar,
03:00
Just like to hear is not
the same as to listen,
tirar fotos não é o mesmo que ver,
03:04
to take pictures is not
the same as to see,
e por ver, queremos dizer, compreender.
03:08
and by seeing,
we really mean understanding.
Na verdade, a mãe natureza levou
540 milhões de anos de trabalho pesado
03:13
In fact, it took Mother Nature
540 million years of hard work
para realizar esta tarefa,
03:19
to do this task,
e muito deste esforço
03:21
and much of that effort
foi para desenvolver o aparelho
de processamento visual do nosso cérebro,
03:23
went into developing the visual
processing apparatus of our brains,
não os olhos em si.
03:28
not the eyes themselves.
Então, a visão começa com os olhos,
03:31
So vision begins with the eyes,
mas acontece de fato no cérebro.
03:33
but it truly takes place in the brain.
Então, por 15 anos, começando
com o meu doutorado na Caltech
03:38
So for 15 years now, starting
from my Ph.D. at Caltech
e depois liderando
o Stanford's Vision Lab,
03:43
and then leading Stanford's Vision Lab,
venho trabalhando com os meus mentores,
colaboradores e alunos
03:46
I've been working with my mentors,
collaborators and students
para ensinar os computadores a ver.
03:50
to teach computers to see.
Nosso campo de pesquisa chama-se visão
computacional e aprendizado de máquina.
03:54
Our research field is called
computer vision and machine learning.
03:57
It's part of the general field
of artificial intelligence.
É parte do campo geral
da inteligência artificial.
Basicamente, queremos ensinar
as máquinas a ver como nós:
04:03
So ultimately, we want to teach
the machines to see just like we do:
nomear objetos, identificar pessoas,
perceber a geometria 3D das coisas,
04:08
naming objects, identifying people,
inferring 3D geometry of things,
compreender relações, emoções,
ações e intenções.
04:13
understanding relations, emotions,
actions and intentions.
Nós tecemos juntos histórias completas
das pessoas, lugares e coisas
04:19
You and I weave together entire stories
of people, places and things
no momento em que os vemos.
04:25
the moment we lay our gaze on them.
O primeiro passo rumo a este objetivo,
é ensinar um computador a ver objetos,
04:28
The first step towards this goal
is to teach a computer to see objects,
o bloco de construção do mundo visual.
04:34
the building block of the visual world.
De modo bem simples,
imaginem este processo de ensino
04:37
In its simplest terms,
imagine this teaching process
como mostrar aos computadores
algumas imagens de treinamento
04:42
as showing the computers
some training images
de um objeto em particular, digamos gatos,
04:45
of a particular object, let's say cats,
e projetar um modelo que aprenda
a partir destas imagens de treinamento.
04:48
and designing a model that learns
from these training images.
Qual é a dificuldade disto?
04:53
How hard can this be?
Afinal de contas, um gato é apenas
uma coleção de forma e cores,
04:55
After all, a cat is just
a collection of shapes and colors,
e foi o que fizemos nos primeiro dias
de modelagem de objetos.
04:59
and this is what we did
in the early days of object modeling.
Falamos ao algoritmo computacional,
numa linguagem matemática,
05:03
We'd tell the computer algorithm
in a mathematical language
que um gato tem o rosto
arredondado, corpo gordinho,
05:07
that a cat has a round face,
a chubby body,
duas orelhas pontudas e uma cauda longa,
05:10
two pointy ears, and a long tail,
e parecia tudo bem.
05:12
and that looked all fine.
Mas, e este gato?
05:14
But what about this cat?
(Risos)
05:16
(Laughter)
Ele está todo torto.
05:18
It's all curled up.
Agora é preciso adicionar outra forma
e outro ponto de vista ao objeto modelo.
05:19
Now you have to add another shape
and viewpoint to the object model.
Mas, e se os gatos estiverem escondidos?
05:24
But what if cats are hidden?
E estes gatos bobos?
05:27
What about these silly cats?
Agora vocês sabem do que estou falando.
05:31
Now you get my point.
Mesmo algo simples,
como um animal doméstico,
05:33
Even something as simple
as a household pet
pode apresentar um número infinito
de variações ao objeto modelo,
05:36
can present an infinite number
of variations to the object model,
e isto é só um objeto.
05:41
and that's just one object.
Então, há oito anos,
05:44
So about eight years ago,
uma observação bem simples
e profunda mudou o meu pensamento.
05:47
a very simple and profound observation
changed my thinking.
Ninguém diz a uma criança como ver,
05:53
No one tells a child how to see,
especialmente nos primeiros anos.
05:56
especially in the early years.
Elas aprendem através das experiências
e exemplos do mundo real.
05:58
They learn this through
real-world experiences and examples.
Se considerarmos os olhos de uma criança
06:03
If you consider a child's eyes
como um par de câmeras biológicas,
06:06
as a pair of biological cameras,
eles tiram uma foto
a cada 200 milissegundos,
06:08
they take one picture
about every 200 milliseconds,
o tempo médio em que o movimento
do olho é feito.
06:12
the average time an eye movement is made.
Então, aos três anos, uma criança
terá visto centenas de milhões de fotos
06:15
So by age three, a child would have seen
hundreds of millions of pictures
do mundo real.
06:21
of the real world.
São muitos exemplos de treinamento.
06:23
That's a lot of training examples.
Então, em vez de focar
somente algoritmos melhores,
06:26
So instead of focusing solely
on better and better algorithms,
minha ideia foi dar-lhes
os tipos de dados de treinamento
06:32
my insight was to give the algorithms
the kind of training data
que uma criança obtém
através das experiências,
06:37
that a child was given through experiences
tanto em quantidade quanto em qualidade.
06:40
in both quantity and quality.
Uma vez compreendendo isso,
06:44
Once we know this,
sabíamos que precisávamos
coletar um conjunto de dados
06:46
we knew we needed to collect a data set
que tivesse mais imagens
do que tínhamos antes,
06:49
that has far more images
than we have ever had before,
talvez milhares de vezes mais,
06:54
perhaps thousands of times more,
e juntamente com o professor Kai Li,
da Universidade de Princeton,
06:56
and together with Professor
Kai Li at Princeton University,
lançamos o projeto ImageNet em 2007.
07:00
we launched the ImageNet project in 2007.
Felizmente, não tínhamos que colocar
uma câmera em nossas cabeças
07:05
Luckily, we didn't have to mount
a camera on our head
e esperar por vários anos.
07:09
and wait for many years.
Fomos à internet,
07:11
We went to the Internet,
o maior tesouro de imagens
que os humanos já criaram.
07:12
the biggest treasure trove of pictures
that humans have ever created.
Baixamos aproximadamente
um bilhão de imagens
07:17
We downloaded nearly a billion images
e usamos tecnologia de "crowdsourcing",
como a plataforma Amazon Mechanical Turk,
07:20
and used crowdsourcing technology
like the Amazon Mechanical Turk platform
para nos ajudar
a classificar essas imagens.
07:25
to help us to label these images.
No seu auge, o ImageNet foi
um dos maiores empregadores
07:28
At its peak, ImageNet was one of
the biggest employers
de trabalhadores
da Amazon Mechanical Turk.
07:33
of the Amazon Mechanical Turk workers:
Juntos, quase 50 mil trabalhadores
07:36
together, almost 50,000 workers
de 167 países do mundo,
07:40
from 167 countries around the world
nos ajudaram a limpar,
separar e classificar
07:44
helped us to clean, sort and label
aproximadamente um bilhão
de candidatas a imagens.
07:48
nearly a billion candidate images.
Esse foi o tamanho do empenho
07:52
That was how much effort it took
para capturar até mesmo
uma fração das imagens
07:55
to capture even a fraction
of the imagery
que a mente de uma criança capta
nos primeiros anos de desenvolvimento.
07:59
a child's mind takes in
in the early developmental years.
Em retrospecto,
esta ideia de usar dados extensos
08:04
In hindsight, this idea of using big data
para treinar os algoritmos
computacionais pode parecer óbvia agora,
08:08
to train computer algorithms
may seem obvious now,
mas em 2007, não era tão óbvia assim.
08:12
but back in 2007, it was not so obvious.
Estivemos praticamente sós
nessa jornada por um bom tempo.
08:16
We were fairly alone on this journey
for quite a while.
Alguns colegas próximos me aconselharam
a fazer algo mais útil pelo meu mandato,
08:20
Some very friendly colleagues advised me
to do something more useful for my tenure,
e lutávamos constantemente para conseguir
financiamento para a pesquisa.
08:25
and we were constantly struggling
for research funding.
Uma vez, eu brinquei
com os meus alunos de graduação
08:29
Once, I even joked to my graduate students
que iria reabrir minha loja de lavagem
a seco para financiar o ImageNet.
08:32
that I would just reopen
my dry cleaner's shop to fund ImageNet.
Afinal de contas, foi assim
que financiei minha faculdade.
08:36
After all, that's how I funded
my college years.
Então seguimos em frente.
08:41
So we carried on.
Em 2009, o projeto ImageNet entregou
08:43
In 2009, the ImageNet project delivered
um banco de dados
de 15 milhões de imagens,
08:46
a database of 15 million images
entre 22 mil classes de objetos e coisas,
08:50
across 22,000 classes
of objects and things
organizadas pelas palavras
cotidianas em inglês.
08:55
organized by everyday English words.
Tanto em quantidade quanto em qualidade,
08:58
In both quantity and quality,
isso foi uma escala sem precedentes.
09:01
this was an unprecedented scale.
09:04
As an example, in the case of cats,
Como exemplo, no caso dos gatos,
temos mais de 62 mil gatos
09:08
we have more than 62,000 cats
de todos os aspectos e poses;
09:11
of all kinds of looks and poses
e todas as espécies
de gatos domésticos e selvagens.
09:15
and across all species
of domestic and wild cats.
Ficamos muito felizes em criar o ImageNet
09:20
We were thrilled
to have put together ImageNet,
e queríamos que todo o mundo das pesquisas
se beneficiasse com ele.
09:23
and we wanted the whole research world
to benefit from it,
Assim, à moda TED, abrimos
todo o conjunto de dados
09:27
so in the TED fashion,
we opened up the entire data set
para a comunidade mundial
de pesquisa gratuitamente.
09:31
to the worldwide
research community for free.
(Aplausos)
09:36
(Applause)
Agora que temos os dados para alimentar
o cérebro do nosso computador,
09:41
Now that we have the data
to nourish our computer brain,
estamos prontos para retornar
aos algoritmos em si.
09:45
we're ready to come back
to the algorithms themselves.
Como se viu, a riqueza de informações
fornecidas pelo ImageNet
09:49
As it turned out, the wealth
of information provided by ImageNet
foi um ajuste perfeito para uma classe
de algoritmos de aprendizado de máquina
09:54
was a perfect match to a particular class
of machine learning algorithms
chamada "rede neural convolucional",
09:59
called convolutional neural network,
iniciada por Kunihiko Fukushima,
Geoff Hinton e Yann LeCun
10:02
pioneered by Kunihiko Fukushima,
Geoff Hinton, and Yann LeCun
nos anos 1970 e 1980.
10:07
back in the 1970s and '80s.
10:10
Just like the brain consists
of billions of highly connected neurons,
Assim como o cérebro é composto de bilhões
de neurônios altamente conectados,
uma unidade operacional básica
numa rede neural
10:16
a basic operating unit in a neural network
é como um nó neuronal.
10:20
is a neuron-like node.
Ela obtém informações de outros nós
10:22
It takes input from other nodes
e envia dados para outros.
10:25
and sends output to others.
Além disso, essas centenas de milhares,
ou mesmo milhões de nós,
10:28
Moreover, these hundreds of thousands
or even millions of nodes
são organizadas em camadas hierárquicas,
10:32
are organized in hierarchical layers,
parecidas com o cérebro.
10:36
also similar to the brain.
Numa rede neural que usamos para treinar
nosso modelo de reconhecimento de objetos
10:38
In a typical neural network we use
to train our object recognition model,
há 24 milhões de nós,
10:43
it has 24 million nodes,
140 milhões de parâmetros
10:46
140 million parameters,
e 15 bilhões de conexões.
10:49
and 15 billion connections.
É um modelo enorme.
10:52
That's an enormous model.
Alimentada pelos dados
consideráveis do ImageNet
10:55
Powered by the massive data from ImageNet
e os modernos CPUs e GPUs
para treinar um modelo colossal,
10:58
and the modern CPUs and GPUs
to train such a humongous model,
a rede neural convolucional
11:04
the convolutional neural network
floresceu de um modo que ninguém esperava.
11:06
blossomed in a way that no one expected.
Tornou-se a arquitetura vencedora
11:10
It became the winning architecture
para gerar novos resultados animadores
em reconhecimento de objetos.
11:12
to generate exciting new results
in object recognition.
Isto é um computador nos dizendo
11:18
This is a computer telling us
que esta foto contém um gato
11:20
this picture contains a cat
e onde ele está.
11:23
and where the cat is.
É claro que há mais coisas além de gatos.
11:25
Of course there are more things than cats,
Aqui está um algoritmo
computacional nos dizendo
11:27
so here's a computer algorithm telling us
que a foto contém um garoto
e um urso de pelúcia;
11:29
the picture contains
a boy and a teddy bear;
um cão, uma pessoa
e uma pequena pipa ao fundo;
11:32
a dog, a person, and a small kite
in the background;
ou uma foto com muitas informações
11:37
or a picture of very busy things
como um homem, um skate, corrimãos,
um poste de luz, e assim por diante.
11:40
like a man, a skateboard,
railings, a lampost, and so on.
Às vezes,
11:45
Sometimes, when the computer
is not so confident about what it sees,
quando o computador
não tem certeza do que vê,
(Risos)
nós o ensinamos
a ser inteligente o bastante
11:51
we have taught it to be smart enough
para nos dar uma resposta segura
em vez de ficar deduzindo muito,
11:53
to give us a safe answer
instead of committing too much,
como nós faríamos.
11:57
just like we would do,
Mas outras vezes, nosso algoritmo
computacional é notável aos nos dizer
12:00
but other times our computer algorithm
is remarkable at telling us
exatamente o que são os objetos,
12:05
what exactly the objects are,
como a marca, o modelo e o ano dos carros.
12:07
like the make, model, year of the cars.
Nós cruzamos esse algoritmo com milhões
de imagens do Google Street View
12:10
We applied this algorithm to millions
of Google Street View images
em centenas de cidades americanas
12:16
across hundreds of American cities,
e descobrimos algo muito interessante:
12:19
and we have learned something
really interesting:
primeiro, confirmou-se
a nossa sabedoria popular
12:22
first, it confirmed our common wisdom
de que preços de carros estão relacionados
12:25
that car prices correlate very well
ao rendimento das famílias.
12:28
with household incomes.
Mas surpreendentemente,
o preço dos carros também se relaciona
12:31
But surprisingly, car prices
also correlate well
com as taxas de crimes nas cidades,
12:35
with crime rates in cities,
ou padrões de votos pelo CEPs.
12:39
or voting patterns by zip codes.
Espere um pouco. É isso mesmo?
12:44
So wait a minute. Is that it?
Os computadores já igualaram ou mesmo
superaram as capacidades humanas?
12:46
Has the computer already matched
or even surpassed human capabilities?
Não tão rápido.
12:51
Not so fast.
Até agora, apenas ensinamos
os computadores a ver objetos.
12:53
So far, we have just taught
the computer to see objects.
É como uma criancinha aprendendo
a pronunciar algumas palavras.
12:58
This is like a small child
learning to utter a few nouns.
É um feito incrível,
13:03
It's an incredible accomplishment,
mas é apenas o primeiro passo.
13:05
but it's only the first step.
Em breve, outro marco
de desenvolvimento será atingido,
13:08
Soon, another developmental
milestone will be hit,
e as crianças começam
a se comunicar por meio de frases.
13:12
and children begin
to communicate in sentences.
13:15
So instead of saying
this is a cat in the picture,
Então, em vez de dizer
que isto é um gato na foto,
vocês ouviram a garotinha nos dizendo
que isto é um gato deitado na cama.
13:19
you already heard the little girl
telling us this is a cat lying on a bed.
Então, para ensinar um computador
a ver uma foto e criar frases,
13:24
So to teach a computer
to see a picture and generate sentences,
o casamento entre os dados
e o algoritmo de aprendizado de máquina
13:30
the marriage between big data
and machine learning algorithm
deve dar outro passo.
13:34
has to take another step.
Agora, o computador tem que aprender
tanto com as fotos
13:36
Now, the computer has to learn
from both pictures
quanto com as frases em linguagem natural
13:40
as well as natural language sentences
13:43
generated by humans.
geradas por humanos.
Assim como o cérebro integra
visão e linguagem,
13:47
Just like the brain integrates
vision and language,
nós desenvolvemos um modelo
que conecta partes de coisas visuais,
13:50
we developed a model
that connects parts of visual things
como fragmentos visuais,
13:56
like visual snippets
com palavras e ideias em frases.
13:58
with words and phrases in sentences.
14:02
About four months ago,
Há uns quatro meses,
finalmente juntamos tudo isso,
14:04
we finally tied all this together
e produzimos um dos primeiros
modelos de visão computacional
14:07
and produced one of the first
computer vision models
capaz de gerar frases do jeito humano
14:11
that is capable of generating
a human-like sentence
quando vê uma foto pela primeira vez.
14:15
when it sees a picture for the first time.
Agora, vou mostrar o que o computador diz
14:18
Now, I'm ready to show you
what the computer says
quando vê a foto
14:23
when it sees the picture
que a garotinha viu,
no início desta palestra.
14:25
that the little girl saw
at the beginning of this talk.
(Vídeo) Computador: Um homem está
em pé, próximo a um elefante.
14:31
(Video) Computer: A man is standing
next to an elephant.
Um grande avião sentado em cima
de uma pista de aeroporto.
14:36
A large airplane sitting on top
of an airport runway.
FFL: Claro, estamos trabalhando com afinco
para melhorar nossos algoritmos,
14:41
FFL: Of course, we're still working hard
to improve our algorithms,
e ele ainda tem muito o que aprender.
14:45
and it still has a lot to learn.
(Aplausos)
14:47
(Applause)
E o computador ainda comete erros.
14:51
And the computer still makes mistakes.
(Vídeo) Computador: Um gato deitado
numa cama com um cobertor. (Risos)
14:54
(Video) Computer: A cat lying
on a bed in a blanket.
FFL: É claro, quando ele vê muitos gatos,
14:58
FFL: So of course, when it sees
too many cats,
ele acha que tudo se parece com um gato.
15:00
it thinks everything
might look like a cat.
(Vídeo) Computador: Um garoto
está segurando um taco de beisebol.
15:05
(Video) Computer: A young boy
is holding a baseball bat.
(Risos)
15:08
(Laughter)
FFL: Se nunca viu uma escova de dentes,
ele a confunde com um taco de beisebol.
15:09
FFL: Or, if it hasn't seen a toothbrush,
it confuses it with a baseball bat.
(Vídeo) Computador: Um homem monta
um cavalo na rua, próximo a um edifício.
15:15
(Video) Computer: A man riding a horse
down a street next to a building.
(Risos)
15:18
(Laughter)
FFL: Não ensinamos Arte 101
aos computadores.
15:20
FFL: We haven't taught Art 101
to the computers.
(Vídeo) Computador: Uma zebra
num campo gramado.
15:25
(Video) Computer: A zebra standing
in a field of grass.
FFL: E ele não aprendeu a apreciar
a deslumbrante beleza da natureza
15:28
FFL: And it hasn't learned to appreciate
the stunning beauty of nature
como nós apreciamos.
15:32
like you and I do.
Tem sido uma longa jornada.
15:34
So it has been a long journey.
Ir da idade zero a três foi difícil.
15:37
To get from age zero to three was hard.
O verdadeiro desafio é ir
dos 3 aos 13 e além disso.
15:41
The real challenge is to go
from three to 13 and far beyond.
Vejam esta foto do garoto
com o bolo novamente.
15:47
Let me remind you with this picture
of the boy and the cake again.
Até então, ensinamos
o computador a ver objetos
15:51
So far, we have taught
the computer to see objects
ou mesmo contar-nos uma simples
história quando vê uma foto.
15:55
or even tell us a simple story
when seeing a picture.
(Vídeo) Computador: Uma pessoa
sentada à mesa com um bolo.
15:59
(Video) Computer: A person sitting
at a table with a cake.
FFL: Mas há muito mais nesta foto
16:03
FFL: But there's so much more
to this picture
do que apenas uma pessoa e um bolo.
16:06
than just a person and a cake.
O que o computador não vê
é que esta é uma colomba
16:08
What the computer doesn't see
is that this is a special Italian cake
que é servida apenas durante a Páscoa.
16:12
that's only served during Easter time.
O garoto está vestindo
a sua camiseta preferida,
16:16
The boy is wearing his favorite t-shirt
que lhe foi dada de presente
pelo pai após uma viagem a Sydney.
16:19
given to him as a gift by his father
after a trip to Sydney,
E nós podemos ver a felicidade dele,
16:23
and you and I can all tell how happy he is
e o que está se passando em sua mente
exatamente naquele momento.
16:27
and what's exactly on his mind
at that moment.
Este é o meu filho Leo.
16:31
This is my son Leo.
Em minha busca pela inteligência visual,
16:34
On my quest for visual intelligence,
penso nele constantemente
16:36
I think of Leo constantly
e no mundo futuro em que ele viverá.
16:39
and the future world he will live in.
Quando as máquinas puderem ver,
16:42
When machines can see,
médicos e enfermeiros terão
pares extras de olhos incansáveis
16:44
doctors and nurses will have
extra pairs of tireless eyes
para ajudá-los a diagnosticar
e cuidar de pacientes.
16:48
to help them to diagnose
and take care of patients.
Os carros funcionarão de forma
mais inteligente e segura nas estradas.
16:53
Cars will run smarter
and safer on the road.
Robôs, não apenas seres humanos,
16:57
Robots, not just humans,
nos ajudarão a realizar buscas
em áreas de desastres
17:00
will help us to brave the disaster zones
to save the trapped and wounded.
e a salvar pessoas soterradas e feridas.
Descobriremos novas espécies,
materiais melhores
17:05
We will discover new species,
better materials,
e exploraremos lugares que não podemos ver
com a ajuda das máquinas.
17:09
and explore unseen frontiers
with the help of the machines.
Pouco a pouco, estamos dando
visão às máquinas.
17:15
Little by little, we're giving sight
to the machines.
Primeiro, as ensinamos a ver,
17:19
First, we teach them to see.
então elas nos ajudam a ver melhor.
17:22
Then, they help us to see better.
Pela primeira vez,
17:24
For the first time, human eyes
won't be the only ones
os olhos humanos não serão os únicos
ponderando e explorando nosso mundo.
17:29
pondering and exploring our world.
Não usaremos as máquinas
apenas pela sua inteligência;
17:31
We will not only use the machines
for their intelligence,
colaboraremos também com elas
de uma maneira que nem sequer imaginamos.
17:35
we will also collaborate with them
in ways that we cannot even imagine.
Esta é a minha busca:
17:41
This is my quest:
dar aos computadores inteligência visual
17:43
to give computers visual intelligence
e criar um futuro melhor
para o Leo e para o mundo.
17:46
and to create a better future
for Leo and for the world.
Obrigada.
17:51
Thank you.
(Aplausos)
17:53
(Applause)
Translated by Fernando Gonçalves
Reviewed by Maricene Crus

▲Back to top

About the speaker:

Fei-Fei Li - Computer scientist
As Director of Stanford’s Artificial Intelligence Lab and Vision Lab, Fei-Fei Li is working to solve AI’s trickiest problems -- including image recognition, learning and language processing.

Why you should listen

Using algorithms built on machine learning methods such as neural network models, the Stanford Artificial Intelligence Lab led by Fei-Fei Li has created software capable of recognizing scenes in still photographs -- and accurately describe them using natural language.

Li’s work with neural networks and computer vision (with Stanford’s Vision Lab) marks a significant step forward for AI research, and could lead to applications ranging from more intuitive image searches to robots able to make autonomous decisions in unfamiliar situations.

Fei-Fei was honored as one of Foreign Policy's 2015 Global Thinkers

More profile about the speaker
Fei-Fei Li | Speaker | TED.com