ABOUT THE SPEAKER
Fei-Fei Li - Computer scientist
As Director of Stanford’s Artificial Intelligence Lab and Vision Lab, Fei-Fei Li is working to solve AI’s trickiest problems -- including image recognition, learning and language processing.

Why you should listen

Using algorithms built on machine learning methods such as neural network models, the Stanford Artificial Intelligence Lab led by Fei-Fei Li has created software capable of recognizing scenes in still photographs -- and accurately describe them using natural language.

Li’s work with neural networks and computer vision (with Stanford’s Vision Lab) marks a significant step forward for AI research, and could lead to applications ranging from more intuitive image searches to robots able to make autonomous decisions in unfamiliar situations.

Fei-Fei was honored as one of Foreign Policy's 2015 Global Thinkers

More profile about the speaker
Fei-Fei Li | Speaker | TED.com
TED2015

Fei-Fei Li: How we're teaching computers to understand pictures

Fei-Fei Li: Cómo estamos enseñando a las computadoras a entender imágenes

Filmed:
2,702,344 views

Cuando un niño muy pequeño mira una foto, puede identificar dibujos simples: "gato", "libro", "silla". Ahora las computadoras tienen la inteligencia suficiente para hacer eso también. ¿Qué sigue? En esta charla emocionante, Fei-Fei Li, experta en visión artificial, describe lo más reciente —incluyendo la base de datos de 15 millones de fotos que su equipo construyó para "enseñar" a una computadora a entender dibujos— y lo que aún está por venir.
- Computer scientist
As Director of Stanford’s Artificial Intelligence Lab and Vision Lab, Fei-Fei Li is working to solve AI’s trickiest problems -- including image recognition, learning and language processing. Full bio

Double-click the English transcript below to play the video.

00:14
Let me showespectáculo you something.
0
2366
3738
Les mostraré algo.
00:18
(VideoVídeo) GirlNiña: Okay, that's a catgato
sittingsentado in a bedcama.
1
6104
4156
(Video) Niña: Eso es un gato
sentado en una cama.
00:22
The boychico is pettingcaricias the elephantelefante.
2
10260
4040
El niño está acariciando al elefante.
00:26
Those are people
that are going on an airplaneavión.
3
14300
4354
Esas son personas que van en un avión.
00:30
That's a biggrande airplaneavión.
4
18654
2810
Ese es un avión grande.
00:33
Fei-FeiFei-Fei LiLi: This is
a three-year-oldtres años childniño
5
21464
2206
Fei-Fei Li: Así describe una niña
00:35
describingdescribiendo what she seesve
in a seriesserie of photosfotos.
6
23670
3679
de 3 años lo que ve
en una serie de fotos.
00:39
She mightpodría still have a lot
to learnaprender about this worldmundo,
7
27349
2845
Tal vez le falta mucho
por aprender sobre este mundo,
00:42
but she's alreadyya an expertexperto
at one very importantimportante tasktarea:
8
30194
4549
pero ya es experta
en algo importante:
00:46
to make sensesentido of what she seesve.
9
34743
2846
entender lo que ve.
00:50
Our societysociedad is more
technologicallytecnológicamente advancedavanzado than ever.
10
38229
4226
Tecnológicamente, nuestra sociedad
está más avanzada que nunca.
00:54
We sendenviar people to the moonLuna,
we make phonesteléfonos that talk to us
11
42455
3629
Enviamos personas a la luna,
nuestros teléfonos nos hablan
00:58
or customizepersonalizar radioradio stationsestaciones
that can playjugar only musicmúsica we like.
12
46084
4946
o personalizan radios para reproducir
solo la música que nos gusta.
01:03
YetTodavía, our mostmás advancedavanzado
machinesmáquinas and computersordenadores
13
51030
4055
Sin embargo, nuestras máquinas
y computadoras más avanzadas
01:07
still strugglelucha at this tasktarea.
14
55085
2903
aún tienen problemas en ese aspecto.
01:09
So I'm here todayhoy
to give you a progressProgreso reportinforme
15
57988
3459
Hoy estoy aquí
para darles un reporte
01:13
on the latestúltimo advancesavances
in our researchinvestigación in computercomputadora visionvisión,
16
61447
4047
de nuestros últimos avances
en visión artificial,
01:17
one of the mostmás frontierfrontera
and potentiallypotencialmente revolutionaryrevolucionario
17
65494
4161
una de las tecnologías potencialmente
más revolucionarias
01:21
technologiestecnologías in computercomputadora scienceciencia.
18
69655
3206
en la ciencia de la computación.
01:24
Yes, we have prototypedprototipado carscarros
that can drivemanejar by themselvessí mismos,
19
72861
4551
Es cierto, hemos inventado autos
que conducen solos,
01:29
but withoutsin smartinteligente visionvisión,
they cannotno poder really tell the differencediferencia
20
77412
3853
pero sin una visión inteligente,
realmente no pueden distinguir
01:33
betweenEntre a crumpledestropeado paperpapel bagbolso
on the roadla carretera, whichcual can be runcorrer over,
21
81265
3970
entre una bolsa arrugada de papel
en el camino, que puede uno pisar,
01:37
and a rockrock that sizetamaño,
whichcual should be avoidedevitado.
22
85235
3340
y una roca del mismo tamaño,
que debemos evitar.
01:41
We have madehecho fabulousfabuloso megapixelmegapíxel camerascámaras,
23
89415
3390
Hemos creado fabulosas cámaras
de muchos megapíxeles,
01:44
but we have not deliveredentregado
sightvisión to the blindciego.
24
92805
3135
pero aún no podemos devolverle
la vista a un ciego.
01:48
DronesDrones can flymosca over massivemasivo landtierra,
25
96420
3305
Los drones pueden volar sobre
grandes superficies de tierra,
pero no tienen tecnología
01:51
but don't have enoughsuficiente visionvisión technologytecnología
26
99725
2134
de visión suficiente
01:53
to help us to trackpista
the changescambios of the rainforestsbosques lluviosos.
27
101859
3461
para ayudarnos a monitorear los
cambios en los bosques tropicales.
01:57
SecuritySeguridad camerascámaras are everywhereen todos lados,
28
105320
2950
Hay cámaras de seguridad en todas partes,
02:00
but they do not alertalerta us when a childniño
is drowningahogo in a swimmingnadando poolpiscina.
29
108270
5067
pero no nos alertan cuando un niño
se está ahogando en una piscina.
02:06
PhotosFotos and videosvideos are becomingdevenir
an integralintegral partparte of globalglobal life.
30
114167
5595
Las fotos y los videos se están volviendo
parte integral de la vida global.
02:11
They're beingsiendo generatedgenerado at a pacepaso
that's farlejos beyondmás allá what any humanhumano,
31
119762
4087
Se generan a un ritmo mucho mayor
de lo que cualquier humano,
02:15
or teamsequipos of humanshumanos, could hopeesperanza to viewver,
32
123849
2783
o equipo de humanos, podría ver,
02:18
and you and I are contributingcontribuyendo
to that at this TEDTED.
33
126632
3921
y Uds. y yo contribuimos
a eso en este TED.
02:22
YetTodavía our mostmás advancedavanzado softwaresoftware
is still strugglingluchando at understandingcomprensión
34
130553
5232
Aun así, nuestro software más avanzado
tiene problemas para entender
02:27
and managinggerente this enormousenorme contentcontenido.
35
135785
3876
y gestionar este enorme contenido.
02:31
So in other wordspalabras,
collectivelycolectivamente as a societysociedad,
36
139661
5272
En otras palabras, colectivamente
como una sociedad,
02:36
we're very much blindciego,
37
144933
1746
somos muy ciegos,
02:38
because our smartestmás inteligente
machinesmáquinas are still blindciego.
38
146679
3387
porque nuestras máquinas
más inteligentes aún son ciegas.
02:43
"Why is this so harddifícil?" you maymayo askpedir.
39
151526
2926
Se preguntarán:
"¿Por qué es tan difícil?"
02:46
CamerasCámaras can take picturesimágenes like this one
40
154452
2693
Las cámaras pueden tomar fotos como esta
02:49
by convertingmudado lightsluces into
a two-dimensionalbidimensional arrayformación of numbersnúmeros
41
157145
3994
convirtiendo luz en matrices
numéricas bidimensionales
02:53
knownconocido as pixelspíxeles,
42
161139
1650
conocidas como pixeles,
02:54
but these are just lifelesssin vida numbersnúmeros.
43
162789
2251
pero estos son solo números vacíos.
02:57
They do not carryllevar meaningsentido in themselvessí mismos.
44
165040
3111
En sí mismos no tienen significado.
03:00
Just like to hearoír is not
the samemismo as to listen,
45
168151
4343
Al igual que oír no es
lo mismo que escuchar,
03:04
to take picturesimágenes is not
the samemismo as to see,
46
172494
4040
tomar fotografías
no es lo mismo que ver;
03:08
and by seeingviendo,
we really mean understandingcomprensión.
47
176534
3829
y solo viendo podemos realmente entender.
03:13
In facthecho, it tooktomó MotherMadre NatureNaturaleza
540 millionmillón yearsaños of harddifícil work
48
181293
6177
De hecho, le tomó a la Madre Naturaleza
540 millones de años de arduo trabajo
03:19
to do this tasktarea,
49
187470
1973
lograr esta tarea,
03:21
and much of that effortesfuerzo
50
189443
1881
y mucho de ese esfuerzo
03:23
wentfuimos into developingdesarrollando the visualvisual
processingtratamiento apparatusaparato of our brainssesos,
51
191324
5271
consistió en desarrollar el sistema
de procesamiento visual en el cerebro,
03:28
not the eyesojos themselvessí mismos.
52
196595
2647
no los ojos en sí.
03:31
So visionvisión beginscomienza with the eyesojos,
53
199242
2747
La visión empieza en los ojos,
03:33
but it trulyverdaderamente takes placelugar in the braincerebro.
54
201989
3518
pero, en realidad,
ocurre en nuestro cerebro.
03:38
So for 15 yearsaños now, startingcomenzando
from my PhPh.D. at CaltechCaltech
55
206287
5060
Durante 15 años, empezando
desde mi doctorado en Caltech
03:43
and then leadinglíder Stanford'sStanford VisionVisión LabLaboratorio,
56
211347
2926
y luego al frente del laboratorio
Stanford Vision Lab,
03:46
I've been workingtrabajando with my mentorsmentores,
collaboratorscolaboradores and studentsestudiantes
57
214273
4396
he trabajado con mis mentores,
colaboradores y estudiantes
03:50
to teachenseñar computersordenadores to see.
58
218669
2889
para enseñar a las computadoras a ver.
Nuestro campo de investigación se llama
03:54
Our researchinvestigación fieldcampo is calledllamado
computercomputadora visionvisión and machinemáquina learningaprendizaje.
59
222658
3294
"visión artificial
y aprendizaje automático".
03:57
It's partparte of the generalgeneral fieldcampo
of artificialartificial intelligenceinteligencia.
60
225952
3878
Es parte del campo de
la inteligencia artificial.
04:03
So ultimatelypor último, we want to teachenseñar
the machinesmáquinas to see just like we do:
61
231000
5493
Queremos enseñar a las máquinas
a ver tal como nosotros lo hacemos:
04:08
namingnombrando objectsobjetos, identifyingidentificando people,
inferringinferir 3D geometrygeometría of things,
62
236493
5387
nombrar objetos, identificar personas,
inferir la geometría 3D de las cosas,
04:13
understandingcomprensión relationsrelaciones, emotionsemociones,
actionscomportamiento and intentionsintenciones.
63
241880
5688
entender relaciones, emociones,
acciones e intenciones.
04:19
You and I weavetejido togetherjuntos entiretodo storiescuentos
of people, placeslugares and things
64
247568
6153
Nosotros tejemos historias completas
de la gente, los lugares y las cosas
04:25
the momentmomento we laylaico our gazemirada on them.
65
253721
2164
simplemente con mirarlas.
El primer paso hacia esta meta es
enseñar a una computadora a ver objetos,
04:28
The first steppaso towardshacia this goalGol
is to teachenseñar a computercomputadora to see objectsobjetos,
66
256955
5583
04:34
the buildingedificio blockbloquear of the visualvisual worldmundo.
67
262538
3368
la unidad básica del mundo visual.
04:37
In its simplestmás simple termscondiciones,
imagineimagina this teachingenseñando processproceso
68
265906
4434
En términos más simples,
imaginen este proceso
04:42
as showingdemostración the computersordenadores
some trainingformación imagesimágenes
69
270340
2995
mostrando a las computadoras
algunas imágenes de entrenamiento
04:45
of a particularespecial objectobjeto, let's say catsgatos,
70
273335
3321
de un objeto en particular,
digamos gatos,
04:48
and designingdiseño a modelmodelo that learnsaprende
from these trainingformación imagesimágenes.
71
276656
4737
y diseñar un modelo que
aprenda de estas imágenes.
04:53
How harddifícil can this be?
72
281393
2044
¿Qué tan difícil puede ser esto?
04:55
After all, a catgato is just
a collectioncolección of shapesformas and colorscolores,
73
283437
4052
A fin de cuentas, un gato es solo
un conjunto de formas y colores,
04:59
and this is what we did
in the earlytemprano daysdías of objectobjeto modelingmodelado.
74
287489
4086
y eso fue lo que hacíamos en los inicios
de la modelización de objetos.
05:03
We'dMie tell the computercomputadora algorithmalgoritmo
in a mathematicalmatemático languageidioma
75
291575
3622
Decíamos al algoritmo
de la computadora
en un lenguaje matemático
05:07
that a catgato has a roundredondo facecara,
a chubbyregordete bodycuerpo,
76
295197
3343
que un gato tiene cara redonda,
cuerpo regordete,
05:10
two pointypuntiagudo earsorejas, and a long tailcola,
77
298540
2299
dos orejas puntiagudas
y cola larga,
05:12
and that lookedmirado all fine.
78
300839
1410
y así quedaba bien.
05:14
But what about this catgato?
79
302859
2113
Pero ¿qué me dicen de este gato?
05:16
(LaughterRisa)
80
304972
1091
(Risas)
05:18
It's all curledrizado up.
81
306063
1626
Está todo retorcido.
05:19
Now you have to addañadir anotherotro shapeforma
and viewpointpunto de vista to the objectobjeto modelmodelo.
82
307689
4719
Se debe agregar otra figura y otra
perspectiva al modelo del objeto.
05:24
But what if catsgatos are hiddenoculto?
83
312408
1715
¿Y si los gatos están escondidos?
05:27
What about these sillytonto catsgatos?
84
315143
2219
¿Qué tal estos gatos tontos?
05:31
Now you get my pointpunto.
85
319112
2417
Ahora entienden mi idea.
05:33
Even something as simplesencillo
as a householdcasa petmascota
86
321529
3367
Incluso algo tan simple
como una mascota
05:36
can presentpresente an infiniteinfinito numbernúmero
of variationsvariaciones to the objectobjeto modelmodelo,
87
324896
4504
puede tener un número infinito de
variaciones en el modelo del objeto,
05:41
and that's just one objectobjeto.
88
329400
2233
y eso es solo un objeto.
05:44
So about eightocho yearsaños agohace,
89
332573
2492
Así que hace unos 8 años,
05:47
a very simplesencillo and profoundprofundo observationobservación
changedcambiado my thinkingpensando.
90
335065
5030
una observación simple y profunda
cambió mi perspectiva.
05:53
No one tellsdice a childniño how to see,
91
341425
2685
Nadie le dice al niño cómo ver,
05:56
especiallyespecialmente in the earlytemprano yearsaños.
92
344110
2261
menos aún en los primeros años.
05:58
They learnaprender this throughmediante
real-worldmundo real experiencesexperiencias and examplesejemplos.
93
346371
5000
Ellos aprenden a través de ejemplos
y experiencias del mundo real.
06:03
If you considerconsiderar a child'sniño eyesojos
94
351371
2740
Si consideramos los ojos de un niño
06:06
as a pairpar of biologicalbiológico camerascámaras,
95
354111
2554
como un par de cámaras biológicas,
06:08
they take one pictureimagen
about everycada 200 millisecondsmilisegundos,
96
356665
4180
toman una foto cada 200 milisegundos,
06:12
the averagepromedio time an eyeojo movementmovimiento is madehecho.
97
360845
3134
el tiempo promedio en que el ojo
hace un movimiento.
06:15
So by ageaños threeTres, a childniño would have seenvisto
hundredscientos of millionsmillones of picturesimágenes
98
363979
5550
Entonces, a los 3 años un niño ha visto
cientos de millones de fotografías
06:21
of the realreal worldmundo.
99
369529
1834
del mundo real.
06:23
That's a lot of trainingformación examplesejemplos.
100
371363
2280
Esos son muchos ejemplares
de entrenamiento.
06:26
So insteaden lugar of focusingenfoque solelysolamente
on better and better algorithmsAlgoritmos,
101
374383
5989
Así que en lugar de enfocarnos
solo en mejorar los algoritmos,
06:32
my insightvisión was to give the algorithmsAlgoritmos
the kindtipo of trainingformación datadatos
102
380372
5272
mi intención fue dotar a los algoritmos
con los datos de entrenamiento
06:37
that a childniño was givendado throughmediante experiencesexperiencias
103
385644
3319
que un niño adquiere con la experiencia
06:40
in bothambos quantitycantidad and qualitycalidad.
104
388963
3878
tanto en cantidad como en calidad.
06:44
OnceUna vez we know this,
105
392841
1858
Al conocer esto
06:46
we knewsabía we needednecesario to collectrecoger a datadatos setconjunto
106
394699
2971
supimos que necesitábamos recolectar
06:49
that has farlejos more imagesimágenes
than we have ever had before,
107
397670
4459
muchas más imágenes que nunca,
06:54
perhapsquizás thousandsmiles of timesveces more,
108
402129
2577
tal vez miles de veces más;
06:56
and togetherjuntos with ProfessorProfesor
KaiKai LiLi at PrincetonPrinceton UniversityUniversidad,
109
404706
4111
y junto con el profesor Kai Li
en la Universidad de Princeton,
07:00
we launchedlanzado the ImageNetImageNet projectproyecto in 2007.
110
408817
4752
lanzamos el proyecto ImageNet en 2007.
07:05
LuckilyPor suerte, we didn't have to mountmontar
a cameracámara on our headcabeza
111
413569
3838
Por suerte, no tuvimos que ponernos
una cámara en la cabeza
07:09
and wait for manymuchos yearsaños.
112
417407
1764
y esperar muchos años.
07:11
We wentfuimos to the InternetInternet,
113
419171
1463
Entramos a Internet,
07:12
the biggestmás grande treasuretesoro trovetrove of picturesimágenes
that humanshumanos have ever createdcreado.
114
420634
4436
el banco de imágenes más grande
creado por la humanidad.
07:17
We downloadeddescargado nearlycasi a billionmil millones imagesimágenes
115
425070
3041
Descargamos casi
1000 millones de imágenes
07:20
and used crowdsourcingcrowdsourcing technologytecnología
like the AmazonAmazonas MechanicalMecánico Turkturco platformplataforma
116
428111
5880
y usamos tecnología de crowdsourcing
como la plataforma Amazon Mechanical Turk
07:25
to help us to labeletiqueta these imagesimágenes.
117
433991
2339
para etiquetar estas imágenes.
07:28
At its peakpico, ImageNetImageNet was one of
the biggestmás grande employersempleadores
118
436330
4900
En su mejor momento, ImageNet fue
uno de los empleadores más importantes
07:33
of the AmazonAmazonas MechanicalMecánico Turkturco workerstrabajadores:
119
441230
2996
de trabajadores en
Amazon Mechanical Turk:
07:36
togetherjuntos, almostcasi 50,000 workerstrabajadores
120
444226
3854
Casi 50 000 trabajadores
07:40
from 167 countriespaíses around the worldmundo
121
448080
4040
de 167 países del mundo
07:44
helpedayudado us to cleanlimpiar, sortordenar and labeletiqueta
122
452120
3947
nos ayudaron a limpiar,
separar y etiquetar
07:48
nearlycasi a billionmil millones candidatecandidato imagesimágenes.
123
456067
3575
casi 1000 millones
de imágenes candidatas.
07:52
That was how much effortesfuerzo it tooktomó
124
460612
2653
Se necesitó todo ese esfuerzo
07:55
to capturecapturar even a fractionfracción
of the imageryimágenes
125
463265
3900
para capturar apenas una fracción
de todas las imágenes
07:59
a child'sniño mindmente takes in
in the earlytemprano developmentalde desarrollo yearsaños.
126
467165
4171
que un niño asimila en sus
primeros años de desarrollo.
08:04
In hindsightcomprensión retrospectiva, this ideaidea of usingutilizando biggrande datadatos
127
472148
3902
Viendo en retrospectiva,
esta idea de usar muchos datos
08:08
to traintren computercomputadora algorithmsAlgoritmos
maymayo seemparecer obviousobvio now,
128
476050
4550
para entrenar algoritmos
puede parecer obvia ahora.
08:12
but back in 2007, it was not so obviousobvio.
129
480600
4110
Sin embargo, en 2007
no era tan evidente.
08:16
We were fairlybastante alonesolo on this journeyviaje
for quitebastante a while.
130
484710
3878
Estuvimos solos en este viaje
por un buen rato.
08:20
Some very friendlyamistoso colleaguescolegas advisedaconsejado me
to do something more usefulútil for my tenuretenencia,
131
488588
5003
Algunos colegas me sugerían
hacer algo más útil para mi cátedra,
08:25
and we were constantlyconstantemente strugglingluchando
for researchinvestigación fundingfondos.
132
493591
4342
y con frecuencia teníamos problemas
para conseguir financiamiento.
08:29
OnceUna vez, I even jokedbromeó to my graduategraduado studentsestudiantes
133
497933
2485
Incluso llegué a decir
a mis alumnos, como broma,
08:32
that I would just reopenreabrir
my dryseco cleaner'slimpiadores shoptienda to fundfondo ImageNetImageNet.
134
500418
4063
que tendría que reabrir mi tintorería
para financiar ImageNet.
08:36
After all, that's how I fundedfundado
my collegeUniversidad yearsaños.
135
504481
4761
Después de todo, así fue como
financié mis años de universidad.
08:41
So we carriedllevado on.
136
509242
1856
Seguimos adelante.
08:43
In 2009, the ImageNetImageNet projectproyecto deliveredentregado
137
511098
3715
En 2009, el proyecto ImageNet juntó
08:46
a databasebase de datos of 15 millionmillón imagesimágenes
138
514813
4042
una base de datos con
15 millones de imágenes
08:50
acrossa través de 22,000 classesclases
of objectsobjetos and things
139
518855
4805
de 22 000 tipos de objetos
organizados por palabra
en inglés de uso cotidiano.
08:55
organizedorganizado by everydaycada día EnglishInglés wordspalabras.
140
523660
3320
08:58
In bothambos quantitycantidad and qualitycalidad,
141
526980
2926
En cantidad y calidad,
09:01
this was an unprecedentedsin precedentes scaleescala.
142
529906
2972
tuvieron una escala sin precedentes.
09:04
As an exampleejemplo, in the casecaso of catsgatos,
143
532878
3461
Por ejemplo, en el caso de los gatos,
09:08
we have more than 62,000 catsgatos
144
536339
2809
tenemos más de 62 000 gatos
09:11
of all kindsclases of looksmiradas and posesposes
145
539148
4110
con todo tipo de apariencias y poses
09:15
and acrossa través de all speciesespecies
of domesticnacional and wildsalvaje catsgatos.
146
543258
5223
y todo tipo de gatos
domésticos y salvajes.
09:20
We were thrilledemocionado
to have put togetherjuntos ImageNetImageNet,
147
548481
3344
Estábamos entusiasmados
por haber creado ImageNet
09:23
and we wanted the wholetodo researchinvestigación worldmundo
to benefitbeneficio from it,
148
551825
3738
y queríamos que todo el mundo de
la investigación se beneficiara,
09:27
so in the TEDTED fashionModa,
we openedabrió up the entiretodo datadatos setconjunto
149
555563
4041
así que, al estilo TED,
abrimos toda la base de datos
09:31
to the worldwideen todo el mundo
researchinvestigación communitycomunidad for freegratis.
150
559604
3592
a la comunidad mundial de
investigadores de forma gratuita.
09:36
(ApplauseAplausos)
151
564636
4000
(Aplausos)
09:41
Now that we have the datadatos
to nourishnutrir our computercomputadora braincerebro,
152
569416
4538
Ahora que tenemos los datos para nutrir
el cerebro de nuestra computadora,
09:45
we're readyListo to come back
to the algorithmsAlgoritmos themselvessí mismos.
153
573954
3737
estamos listos para volver
a los algoritmos.
09:49
As it turnedconvertido out, the wealthriqueza
of informationinformación providedprevisto by ImageNetImageNet
154
577691
5178
La abundancia de información
aportada por ImageNet
09:54
was a perfectPerfecto matchpartido to a particularespecial classclase
of machinemáquina learningaprendizaje algorithmsAlgoritmos
155
582869
4806
fue el complemento perfecto para
un tipo particular de algoritmos
09:59
calledllamado convolutionalconvolucional neuralneural networkred,
156
587675
2415
de aprendizaje automático llamado
red neuronal convolucional,
10:02
pioneeredpionero by KunihikoKunihiko FukushimaFukushima,
GeoffGeoff HintonHinton, and YannYann LeCunLeCun
157
590090
5248
ideado por Kunihiko Fukushima,
Geoff Hinton y Yann LeCun
10:07
back in the 1970s and '80s.
158
595338
3645
en los años 70 y 80.
10:10
Just like the braincerebro consistsconsiste
of billionsmiles de millones of highlyaltamente connectedconectado neuronsneuronas,
159
598983
5619
Como el cerebro que tiene miles de
millones de neuronas muy bien conectadas,
10:16
a basicBASIC operatingoperando unitunidad in a neuralneural networkred
160
604602
3854
la unidad operativa fundamental
en una red neuronal
10:20
is a neuron-likeparecido a una neurona nodenodo.
161
608456
2415
es un nodo con forma de neurona.
10:22
It takes inputentrada from other nodesnodos
162
610871
2554
Toma datos de otros nodos
10:25
and sendsenvía outputsalida to othersotros.
163
613425
2718
los procesa y los manda
a otros nodos.
10:28
MoreoverAdemás, these hundredscientos of thousandsmiles
or even millionsmillones of nodesnodos
164
616143
4713
Además, estos cientos de miles
o incluso millones de nodos
10:32
are organizedorganizado in hierarchicaljerárquico layerscapas,
165
620856
3227
se organizan en capas jerárquicas,
10:36
alsoademás similarsimilar to the braincerebro.
166
624083
2554
algo parecido al cerebro.
10:38
In a typicaltípico neuralneural networkred we use
to traintren our objectobjeto recognitionreconocimiento modelmodelo,
167
626637
4783
En una red neuronal típica
que usamos para entrenar
nuestro modelo de
reconocimiento de objetos
10:43
it has 24 millionmillón nodesnodos,
168
631420
3181
hay 24 millones de nodos,
10:46
140 millionmillón parametersparámetros,
169
634601
3297
140 millones de parámetros
10:49
and 15 billionmil millones connectionsconexiones.
170
637898
2763
y 15 000 millones de conexiones.
10:52
That's an enormousenorme modelmodelo.
171
640661
2415
Es un modelo enorme.
10:55
PoweredMotorizado by the massivemasivo datadatos from ImageNetImageNet
172
643076
3901
Alimentado por la información
masiva de ImageNet
10:58
and the modernmoderno CPUsCPU and GPUsGPU
to traintren suchtal a humongoushumongous modelmodelo,
173
646977
5433
y las CPUs y GPUs modernas que
entrenan este inmenso modelo,
11:04
the convolutionalconvolucional neuralneural networkred
174
652410
2369
la red neuronal convolucional
11:06
blossomedflorecido in a way that no one expectedesperado.
175
654779
3436
tuvo un éxito inesperado.
11:10
It becameconvirtió the winningvictorioso architecturearquitectura
176
658215
2508
Se volvió la ingeniería ganadora
11:12
to generategenerar excitingemocionante newnuevo resultsresultados
in objectobjeto recognitionreconocimiento.
177
660723
5340
para generar nuevos y emocionantes
resultados en reconocimiento de objetos.
11:18
This is a computercomputadora tellingnarración us
178
666063
2810
Esta es una computadora que nos dice
11:20
this pictureimagen containscontiene a catgato
179
668873
2300
que la foto tiene un gato
11:23
and where the catgato is.
180
671173
1903
y dónde está el gato.
11:25
Of coursecurso there are more things than catsgatos,
181
673076
2112
Desde luego hay más cosas
aparte de los gatos
11:27
so here'saquí está a computercomputadora algorithmalgoritmo tellingnarración us
182
675188
2438
así que hay un algoritmo
informático que nos dice
11:29
the pictureimagen containscontiene
a boychico and a teddyosito de peluche bearoso;
183
677626
3274
que hay un niño y un oso
de peluche en la foto;
11:32
a dogperro, a personpersona, and a smallpequeña kitecometa
in the backgroundfondo;
184
680900
4366
un perro, una persona
y un papalote al fondo;
11:37
or a pictureimagen of very busyocupado things
185
685266
3135
o una foto de cosas muy ocupadas
11:40
like a man, a skateboardpatineta,
railingsbarandillas, a lampostLampost, and so on.
186
688401
4644
como un hombre, una patineta,
un barandal, una lámpara etc.
11:45
SometimesA veces, when the computercomputadora
is not so confidentconfidente about what it seesve,
187
693045
5293
A veces, cuando la computadora
no está segura de lo que ve,
11:51
we have taughtenseñó it to be smartinteligente enoughsuficiente
188
699498
2276
le hemos enseñado
11:53
to give us a safeseguro answerresponder
insteaden lugar of committingcometer too much,
189
701774
3878
a darnos una respuesta segura
en lugar de comprometer su respuesta,
11:57
just like we would do,
190
705652
2811
tal como lo haríamos nosotros.
12:00
but other timesveces our computercomputadora algorithmalgoritmo
is remarkablenotable at tellingnarración us
191
708463
4666
Pero otras veces nuestro algoritmo
informático es muy acertado al decirnos
12:05
what exactlyexactamente the objectsobjetos are,
192
713129
2253
qué son los objetos exactamente,
12:07
like the make, modelmodelo, yearaño of the carscarros.
193
715382
3436
como la marca, modelo
y año de los coches.
12:10
We appliedaplicado this algorithmalgoritmo to millionsmillones
of GoogleGoogle StreetCalle ViewVer imagesimágenes
194
718818
5386
Aplicamos este algoritmo a millones
de imágenes de Google Street View
12:16
acrossa través de hundredscientos of Americanamericano citiesciudades,
195
724204
3135
de cientos de ciudades
de Estados Unidos
12:19
and we have learnedaprendido something
really interestinginteresante:
196
727339
2926
y hemos aprendido algo muy interesante:
12:22
first, it confirmedconfirmado our commoncomún wisdomsabiduría
197
730265
3320
primero, confirmó nuestra idea
12:25
that carcoche pricesprecios correlatecorrelación very well
198
733585
3290
de que los precios de los autos
se relacionan bien
12:28
with householdcasa incomesingresos.
199
736875
2345
con los ingresos del hogar.
12:31
But surprisinglyasombrosamente, carcoche pricesprecios
alsoademás correlatecorrelación well
200
739220
4527
Pero sorprendentemente, los precios
de los autos se relacionan también
12:35
with crimecrimen ratestasas in citiesciudades,
201
743747
2300
con las tasas de criminalidad
en la ciudades
12:39
or votingvotación patternspatrones by zipcremallera codescódigos.
202
747007
3963
o los patrones de votación
por código postal.
12:44
So wait a minuteminuto. Is that it?
203
752060
2206
Un minuto. ¿Eso es todo?
12:46
Has the computercomputadora alreadyya matchedemparejado
or even surpassedsuperado humanhumano capabilitiescapacidades?
204
754266
5153
¿Acaso la computadora ya sobrepasó
las capacidades humanas?
12:51
Not so fastrápido.
205
759419
2138
No tan rápido.
12:53
So farlejos, we have just taughtenseñó
the computercomputadora to see objectsobjetos.
206
761557
4923
Hasta ahora solo hemos enseñado
a la computadora a ver objetos.
12:58
This is like a smallpequeña childniño
learningaprendizaje to utterpronunciar a fewpocos nounssustantivos.
207
766480
4644
Es como un niño pequeño
que aprende a decir palabras.
13:03
It's an incredibleincreíble accomplishmentlogro,
208
771124
2670
Es un logro increíble,
13:05
but it's only the first steppaso.
209
773794
2460
pero es apenas el primer paso.
13:08
Soonpronto, anotherotro developmentalde desarrollo
milestonehito will be hitgolpear,
210
776254
3762
Pronto daremos otro paso
13:12
and childrenniños beginempezar
to communicatecomunicar in sentencesfrases.
211
780016
3461
y los niños empiezan
a comunicarse con frases.
13:15
So insteaden lugar of sayingdiciendo
this is a catgato in the pictureimagen,
212
783477
4224
Así que en lugar de decir
que hay un gato en la foto,
13:19
you alreadyya heardoído the little girlniña
tellingnarración us this is a catgato lyingacostado on a bedcama.
213
787701
5202
la niña ya dice que el gato
está sobre la cama.
13:24
So to teachenseñar a computercomputadora
to see a pictureimagen and generategenerar sentencesfrases,
214
792903
5595
Así que para enseñar a una computadora
a ver una foto y generar frases
13:30
the marriagematrimonio betweenEntre biggrande datadatos
and machinemáquina learningaprendizaje algorithmalgoritmo
215
798498
3948
la conjunción de mucha información
y el algoritmo de aprendizaje automático
13:34
has to take anotherotro steppaso.
216
802446
2275
debe dar otro paso.
13:36
Now, the computercomputadora has to learnaprender
from bothambos picturesimágenes
217
804721
4156
Ahora, la computadora tiene
que aprender de fotografías
13:40
as well as naturalnatural languageidioma sentencesfrases
218
808877
2856
así como de frases en lenguaje natural
13:43
generatedgenerado by humanshumanos.
219
811733
3322
generado por humanos.
13:47
Just like the braincerebro integratesintegra
visionvisión and languageidioma,
220
815055
3853
De la forma en que el cerebro
integra visión y lenguaje,
13:50
we developeddesarrollado a modelmodelo
that connectsconecta partspartes of visualvisual things
221
818908
5201
desarrollamos un modelo que
conecta partes de cosas visuales
13:56
like visualvisual snippetsfragmentos
222
824109
1904
como fragmentos visuales
13:58
with wordspalabras and phrasesfrases in sentencesfrases.
223
826013
4203
con palabras y frases en oraciones.
14:02
About fourlas cuatro monthsmeses agohace,
224
830216
2763
Hace unos 4 meses
14:04
we finallyfinalmente tiedatado all this togetherjuntos
225
832979
2647
finalmente juntamos todo esto
14:07
and producedproducido one of the first
computercomputadora visionvisión modelsmodelos
226
835626
3784
y produjimos uno de los primeros
modelos de visión artificial
14:11
that is capablecapaz of generatinggenerando
a human-likehumano sentencefrase
227
839410
3994
que puede generar frases
como las de un humano
14:15
when it seesve a pictureimagen for the first time.
228
843404
3506
cuando ve una foto por primera vez.
14:18
Now, I'm readyListo to showespectáculo you
what the computercomputadora saysdice
229
846910
4644
Ahora estoy lista para mostrarles
lo que dice la computadora
14:23
when it seesve the pictureimagen
230
851554
1975
cuando ve la fotografía
14:25
that the little girlniña saw
at the beginningcomenzando of this talk.
231
853529
3830
que la niña vio al inicio de esta charla.
14:31
(VideoVídeo) ComputerComputadora: A man is standingen pie
nextsiguiente to an elephantelefante.
232
859519
3344
(Video) Computadora:
Un hombre está junto a un elefante.
14:36
A largegrande airplaneavión sittingsentado on topparte superior
of an airportaeropuerto runwaypista.
233
864393
3634
Un avión grande está encima
de una pista de aeropuerto.
14:41
FFLFFL: Of coursecurso, we're still workingtrabajando harddifícil
to improvemejorar our algorithmsAlgoritmos,
234
869057
4212
FFL: Desde luego, seguimos
trabajando para mejorar los algoritmos
14:45
and it still has a lot to learnaprender.
235
873269
2596
y aún tiene mucho que aprender.
14:47
(ApplauseAplausos)
236
875865
2291
(Aplausos)
14:51
And the computercomputadora still makeshace mistakeserrores.
237
879556
3321
Y la computadora aún comete errores.
14:54
(VideoVídeo) ComputerComputadora: A catgato lyingacostado
on a bedcama in a blanketcobija.
238
882877
3391
(Video) Computadora: Un gato
recostado en la cama en una sábana.
14:58
FFLFFL: So of coursecurso, when it seesve
too manymuchos catsgatos,
239
886268
2553
FFL: Y cuando ha visto
demasiados gatos,
15:00
it thinkspiensa everything
mightpodría look like a catgato.
240
888821
2926
cree que todo lo que ve
parece un gato.
15:05
(VideoVídeo) ComputerComputadora: A youngjoven boychico
is holdingparticipación a baseballbéisbol batmurciélago.
241
893317
2864
(Video) Computadora: Un niño
tiene un bate de béisbol.
15:08
(LaughterRisa)
242
896181
1765
(Risas)
15:09
FFLFFL: Or, if it hasn'tno tiene seenvisto a toothbrushcepillo de dientes,
it confusesconfunde it with a baseballbéisbol batmurciélago.
243
897946
4583
FFL: O si nunca ha visto
un cepillo de dientes,
lo confunde con un bate de béisbol.
15:15
(VideoVídeo) ComputerComputadora: A man ridingequitación a horsecaballo
down a streetcalle nextsiguiente to a buildingedificio.
244
903309
3434
(Video) Computadora: Un hombre
montando un caballo junto a un edificio.
15:18
(LaughterRisa)
245
906743
2023
(Risas)
15:20
FFLFFL: We haven'tno tiene taughtenseñó ArtArt 101
to the computersordenadores.
246
908766
3552
FFL: No le hemos enseñado
arte elemental a las computadoras.
15:25
(VideoVídeo) ComputerComputadora: A zebracebra standingen pie
in a fieldcampo of grasscésped.
247
913768
2884
(Video) Computadora: Una cebra
en un campo de hierba.
15:28
FFLFFL: And it hasn'tno tiene learnedaprendido to appreciateapreciar
the stunningmaravilloso beautybelleza of naturenaturaleza
248
916652
3367
FFL: Y no ha aprendido a apreciar
la belleza deslumbrante
15:32
like you and I do.
249
920019
2438
de la naturaleza,
como lo hacemos nosotros.
15:34
So it has been a long journeyviaje.
250
922457
2832
Así que ha sido un largo camino.
15:37
To get from ageaños zerocero to threeTres was harddifícil.
251
925289
4226
Pasar de los 0 a los 3 años fue difícil.
15:41
The realreal challengereto is to go
from threeTres to 13 and farlejos beyondmás allá.
252
929515
5596
El verdadero reto es llegar
a los 13 y mucho más todavía.
15:47
Let me remindrecordar you with this pictureimagen
of the boychico and the cakepastel again.
253
935111
4365
Recordemos nuevamente esta foto
del niño y el pastel.
15:51
So farlejos, we have taughtenseñó
the computercomputadora to see objectsobjetos
254
939476
4064
Hasta ahora, le hemos enseñado
a la computadora a ver objetos
15:55
or even tell us a simplesencillo storyhistoria
when seeingviendo a pictureimagen.
255
943540
4458
o incluso darnos una pequeña
historia cuando ve la foto.
15:59
(VideoVídeo) ComputerComputadora: A personpersona sittingsentado
at a tablemesa with a cakepastel.
256
947998
3576
(Video) Computadora: Una persona sentada
a la mesa con un pastel.
16:03
FFLFFL: But there's so much more
to this pictureimagen
257
951574
2630
FFL: Pero hay mucho más
en esta fotografía
16:06
than just a personpersona and a cakepastel.
258
954204
2270
que simplemente una persona y un pastel.
16:08
What the computercomputadora doesn't see
is that this is a specialespecial Italianitaliano cakepastel
259
956474
4467
Lo que la computadora no ve es que
este es un pastel especial italiano
16:12
that's only servedservido duringdurante EasterPascua de Resurrección time.
260
960941
3217
exclusivo de Pascua.
16:16
The boychico is wearingvistiendo his favoritefavorito t-shirtcamiseta
261
964158
3205
El niño viste su camiseta favorita,
16:19
givendado to him as a giftregalo by his fatherpadre
after a tripviaje to SydneySydney,
262
967363
3970
que le regaló su papá
tras un viaje a Sídney,
16:23
and you and I can all tell how happycontento he is
263
971333
3808
y nosotros podemos decir
qué tan feliz está
16:27
and what's exactlyexactamente on his mindmente
at that momentmomento.
264
975141
3203
y qué pasa por su mente
en ese momento.
16:31
This is my sonhijo LeoLeón.
265
979214
3125
Ese es mi hijo Leo.
16:34
On my questbúsqueda for visualvisual intelligenceinteligencia,
266
982339
2624
En mi búsqueda de inteligencia visual,
16:36
I think of LeoLeón constantlyconstantemente
267
984963
2391
pienso constantemente en él
16:39
and the futurefuturo worldmundo he will livevivir in.
268
987354
2903
y en el futuro en que va a vivir.
16:42
When machinesmáquinas can see,
269
990257
2021
Cuando las máquinas puedan ver,
16:44
doctorsdoctores and nursesenfermeras will have
extraextra pairspares of tirelessincansable eyesojos
270
992278
4712
los médicos y enfermeras tendrán
un par extra de ojos incansables
16:48
to help them to diagnosediagnosticar
and take carecuidado of patientspacientes.
271
996990
4092
para ayudarlos a diagnosticar
y cuidar de los pacientes.
16:53
CarsCarros will runcorrer smartermás inteligente
and safermás seguro on the roadla carretera.
272
1001082
4383
Los autos andarán de forma
inteligente y segura en los caminos.
16:57
RobotsRobots, not just humanshumanos,
273
1005465
2694
Robots, y no solo humanos,
17:00
will help us to bravevaliente the disasterdesastre zoneszonas
to savesalvar the trappedatrapado and woundedherido.
274
1008159
4849
nos ayudarán a desafiar zonas de desastre
para salvar heridos y atrapados.
17:05
We will discoverdescubrir newnuevo speciesespecies,
better materialsmateriales,
275
1013798
3796
Descubriremos nuevas especies,
mejores materiales,
17:09
and exploreexplorar unseeninvisible frontiersfronteras
with the help of the machinesmáquinas.
276
1017594
4509
y exploraremos fronteras nunca vistas
con ayuda de las máquinas.
17:15
Little by little, we're givingdando sightvisión
to the machinesmáquinas.
277
1023113
4167
Poco a poco, damos a las máquinas
el don de la vista.
17:19
First, we teachenseñar them to see.
278
1027280
2798
Primero les enseñamos a ver.
17:22
Then, they help us to see better.
279
1030078
2763
Luego ellas nos ayudarán a ver mejor.
Por primera vez, los ojos humanos
no serán los únicos
17:24
For the first time, humanhumano eyesojos
won'tcostumbre be the only onesunos
280
1032841
4165
17:29
ponderingreflexionando and exploringexplorador our worldmundo.
281
1037006
2934
que exploren nuestro mundo.
17:31
We will not only use the machinesmáquinas
for theirsu intelligenceinteligencia,
282
1039940
3460
No solo usaremos máquinas
por su inteligencia,
17:35
we will alsoademás collaboratecolaborar with them
in waysformas that we cannotno poder even imagineimagina.
283
1043400
6179
también colaboraremos con ellas de
formas que ni siquiera imaginamos.
17:41
This is my questbúsqueda:
284
1049579
2161
Esta es mi misión:
17:43
to give computersordenadores visualvisual intelligenceinteligencia
285
1051740
2712
dar a las computadoras
inteligencia visual
17:46
and to createcrear a better futurefuturo
for LeoLeón and for the worldmundo.
286
1054452
5131
y crear un mejor futuro
para Leo y para el mundo.
17:51
Thank you.
287
1059583
1811
Gracias.
17:53
(ApplauseAplausos)
288
1061394
3785
(Aplausos)
Translated by Cuicani Ríos
Reviewed by Sebastian Betti

▲Back to top

ABOUT THE SPEAKER
Fei-Fei Li - Computer scientist
As Director of Stanford’s Artificial Intelligence Lab and Vision Lab, Fei-Fei Li is working to solve AI’s trickiest problems -- including image recognition, learning and language processing.

Why you should listen

Using algorithms built on machine learning methods such as neural network models, the Stanford Artificial Intelligence Lab led by Fei-Fei Li has created software capable of recognizing scenes in still photographs -- and accurately describe them using natural language.

Li’s work with neural networks and computer vision (with Stanford’s Vision Lab) marks a significant step forward for AI research, and could lead to applications ranging from more intuitive image searches to robots able to make autonomous decisions in unfamiliar situations.

Fei-Fei was honored as one of Foreign Policy's 2015 Global Thinkers

More profile about the speaker
Fei-Fei Li | Speaker | TED.com