ABOUT THE SPEAKER
Supasorn Suwajanakorn - Computer scientist
Supasorn Suwajanakorn works on ways to reconstruct, preserve and reanimate anyone -- just from their existing photos and videos.

Why you should listen

Can we create a digital avatar that looks, acts and talks just like our sweet grandma? This question has inspired Supasorn Suwajanakorn, a recent PhD graduate from the University of Washington, to spend years developing new tools to make it a reality. He has developed a set of algorithms that can build a moving 3D face model of anyone from just photos, which was awarded the Innovation of the Year in 2016. He then introduced the first system that can replicate a person's speech and produce a realistic CG-animation by only analyzing their existing video footage -- all without ever bringing in the person to a Hollywood capture studio.

Suwajanakorn is working in the field of machine learning and computer vision. His goal is to bring vision algorithms out of the lab and make them work in the wild.

More profile about the speaker
Supasorn Suwajanakorn | Speaker | TED.com
TED2018

Supasorn Suwajanakorn: Fake videos of real people -- and how to spot them

Supasorn Suwajanakorn: Vídeos falsos de personas verdaderas, y cómo detectarlos

Filmed:
1,453,308 views

¿Crees que eres bueno para detectar vídeos falsos, donde personas famosas dicen cosas que nunca dijeron en la vida real? Veamos cómo se hacen esos vídeos en esta sorprendente charla con demo. El experto en informática Supasorn Suwajanakorn nos muestra cómo, siendo estudiante de posgrado, aplicó la inteligencia artificial y el modelado en 3D para crear vídeos falsos que aparentan ser reales, donde la persona está sincronizada con audio. También nos habla de las implicancias éticas y las posibilidades creativas de esta tecnología, así como de las medidas que se están tomando para combatir su uso indebido.
- Computer scientist
Supasorn Suwajanakorn works on ways to reconstruct, preserve and reanimate anyone -- just from their existing photos and videos. Full bio

Double-click the English transcript below to play the video.

00:12
Look at these imagesimágenes.
0
876
1151
Observen estas imágenes y díganme
cuál de estos es el Obama verdadero.
00:14
Now, tell me whichcual ObamaObama here is realreal.
1
2051
2635
(Vídeo) Barack Obama: Ayudar
a las familias a refinanciar sus casas,
00:16
(VideoVídeo) BarackBarack ObamaObama: To help familiesfamilias
refinancerefinanciar theirsu homeshogares,
2
4710
2861
00:19
to investinvertir in things
like high-techalta tecnología manufacturingfabricación,
3
7595
2647
invertir en producción de alta tecnología,
en energía no contaminante
00:22
cleanlimpiar energyenergía
4
10266
1159
00:23
and the infrastructureinfraestructura
that createscrea good newnuevo jobstrabajos.
5
11449
2779
y en infraestructura
que genera puestos de trabajo.
Supasorn Suwajanakorn: ¿Alguien lo sabe?
00:26
SupasornSupasorn SuwajanakornSuwajanakorn: AnyoneNadie?
6
14647
1484
00:28
The answerresponder is noneninguna of them.
7
16155
1874
La respuesta es ninguno.
00:30
(LaughterRisa)
8
18053
1114
(Risas)
00:31
NoneNinguna of these is actuallyactualmente realreal.
9
19191
1786
Ninguno es el verdadero.
00:33
So let me tell you how we got here.
10
21001
1840
Les diré cómo llegamos a este punto.
00:35
My inspirationinspiración for this work
11
23940
1578
Para este trabajo,
me inspiré en un proyecto
00:37
was a projectproyecto meantsignificado to preservepreservar our last
chanceoportunidad for learningaprendizaje about the HolocaustHolocausto
12
25542
5411
destinado a preservar nuestra última
oportunidad de saber del Holocausto
00:42
from the survivorssobrevivientes.
13
30977
1768
a través de sus sobrevivientes.
00:44
It's calledllamado NewNuevo DimensionsDimensiones in TestimonyTestimonio,
14
32769
2627
Se llama "Nuevas
dimensiones en testimonio",
00:47
and it allowspermite you to have
interactiveinteractivo conversationsconversaciones
15
35420
3126
y permite mantener
una conversación interactiva
00:50
with a hologramholograma
of a realreal HolocaustHolocausto survivorsobreviviente.
16
38570
2556
con el holograma de un verdadero
sobreviviente del Holocausto.
(Vídeo) Hombre: ¿Cómo
sobrevivió al Holocausto?
00:53
(VideoVídeo) Man: How did you
survivesobrevivir the HolocaustHolocausto?
17
41793
1966
00:55
(VideoVídeo) HologramHolograma: How did I survivesobrevivir?
18
43783
1668
(Vídeo) Holograma: ¿Cómo sobreviví?
00:57
I survivedsobrevivió,
19
45912
1807
Sobreviví
01:00
I believe,
20
48419
1527
posiblemente porque
la Providencia velaba por mí.
01:01
because providenceprovidencia watchedmirado over me.
21
49970
3023
01:05
SSSS: TurnsVueltas out these answersrespuestas
were prerecordedpregrabado in a studioestudio.
22
53573
3454
SS: Estas respuestas fueron
previamente grabadas en un estudio.
01:09
YetTodavía the effectefecto is astoundingasombroso.
23
57051
2452
Sin embargo, el efecto es impresionante.
01:11
You feel so connectedconectado to his storyhistoria
and to him as a personpersona.
24
59527
3619
Sentimos una conexión estrecha
con su historia y con él como persona.
01:16
I think there's something specialespecial
about humanhumano interactionInteracción
25
64011
3301
Pienso que la interacción
humana tiene algo especial.
01:19
that makeshace it much more profoundprofundo
26
67336
2757
Es mucho más profunda y personal
01:22
and personalpersonal
27
70117
2198
01:24
than what bookslibros or lecturesconferencias
or moviespelículas could ever teachenseñar us.
28
72339
3485
que lo transmitido a través
de libros, clases o películas.
01:28
So I saw this and beganempezó to wonderpreguntarse,
29
76267
2425
Cuando vi esto empecé a preguntarme:
¿es posible crear un modelo
como este con cualquier persona,
01:30
can we createcrear a modelmodelo
like this for anyonenadie?
30
78716
2810
01:33
A modelmodelo that looksmiradas, talksnegociaciones
and actshechos just like them?
31
81550
2975
un modelo que se vea, hable
y actúe como la persona real?
01:37
So I setconjunto out to see if this could be donehecho
32
85573
2007
Así que decidí intentarlo,
01:39
and eventuallyfinalmente camevino up with a newnuevo solutionsolución
33
87604
2310
y finalmente se me ocurrió una solución
01:41
that can buildconstruir a modelmodelo of a personpersona
usingutilizando nothing but these:
34
89938
3220
para construir el modelo de una persona
utilizando solo esto que vemos aquí:
01:45
existingexistente photosfotos and videosvideos of a personpersona.
35
93747
2214
fotos y vídeos de esa persona.
01:48
If you can leverageapalancamiento
this kindtipo of passivepasivo informationinformación,
36
96701
2617
El hecho de poder usar
información que ya existe,
como fotos y vídeos
que encontramos por allí,
01:51
just photosfotos and videovídeo that are out there,
37
99342
2007
01:53
that's the keyllave to scalingescalada to anyonenadie.
38
101373
2056
es la clave para poder
modelar cualquier persona.
01:56
By the way, here'saquí está RichardRicardo FeynmanFeynman,
39
104119
1777
Por cierto, este es Richard Feynman,
01:57
who in additionadición to beingsiendo
a NobelNobel PrizePremio winnerganador in physicsfísica
40
105920
3413
quien, además de haber ganado
el Premio Nobel de física,
02:01
was alsoademás knownconocido as a legendarylegendario teacherprofesor.
41
109357
2453
también fue un legendario profesor.
02:05
Wouldn'tNo lo haría it be great
if we could bringtraer him back
42
113080
2198
¿No sería maravilloso poder rescatarlo
02:07
to give his lecturesconferencias
and inspireinspirar millionsmillones of kidsniños,
43
115302
3265
para que diera sus clases
e inspirara a millones de jóvenes,
02:10
perhapsquizás not just in EnglishInglés
but in any languageidioma?
44
118591
2992
no solo en inglés, sino en otros idiomas?
02:14
Or if you could askpedir our grandparentsabuelos
for adviceConsejo and hearoír those comfortingconsolador wordspalabras
45
122441
4602
O poder pedir consejos a nuestros abuelos
y oír esas palabras reconfortantes
02:19
even if they're no longermás with us?
46
127067
1770
aunque ya no estén con nosotros.
02:21
Or maybe usingutilizando this toolherramienta,
booklibro authorsautores, aliveviva or not,
47
129683
3396
O quizá con esta herramienta
los escritores, vivos o no,
02:25
could readleer alouden voz alta all of theirsu bookslibros
for anyonenadie interestedinteresado.
48
133103
2937
podrían leer sus libros en voz alta
a quienes estén interesados.
Las posibilidades creativas son infinitas
02:29
The creativecreativo possibilitiesposibilidades
here are endlessinterminable,
49
137199
2437
02:31
and to me, that's very excitingemocionante.
50
139660
1713
y, en mi opinión, esto es
sumamente interesante.
02:34
And here'saquí está how it's workingtrabajando so farlejos.
51
142595
2002
Les mostraré cómo funciona por ahora.
02:36
First, we introduceintroducir a newnuevo techniquetécnica
52
144621
1667
Primero, usamos una nueva técnica
para reconstruir un rostro en 3D
02:38
that can reconstructreconstruir a high-detailedalta detallada
3D facecara modelmodelo from any imageimagen
53
146312
4572
con un alto nivel de detalle
a partir de cualquier imagen,
02:42
withoutsin ever 3D-scanningD-exploración the personpersona.
54
150908
2119
sin haber hecho nunca
un escaneo en 3D de la persona.
02:45
And here'saquí está the samemismo outputsalida modelmodelo
from differentdiferente viewspuntos de vista.
55
153890
2642
Este es el mismo modelo obtenido,
visto desde distintos ángulos.
Se puede hacer lo mismo con vídeos,
02:49
This alsoademás workstrabajos on videosvideos,
56
157969
1502
02:51
by runningcorriendo the samemismo algorithmalgoritmo
on eachcada videovídeo framemarco
57
159495
2852
ejecutando el mismo algoritmo
en cada cuadro del vídeo
02:54
and generatinggenerando a movingemocionante 3D modelmodelo.
58
162371
2222
y generando un modelo móvil en 3D.
02:57
And here'saquí está the samemismo
outputsalida modelmodelo from differentdiferente anglesanglos.
59
165538
2772
Aquí vemos el mismo modelo
obtenido, desde distintos ángulos.
03:01
It turnsvueltas out this problemproblema
is very challengingdesafiante,
60
169933
2534
Esta técnica presenta
numerosos desafíos,
03:04
but the keyllave tricktruco
is that we are going to analyzeanalizar
61
172491
2525
pero el truco consiste
en analizar de antemano
03:07
a largegrande photofoto collectioncolección
of the personpersona beforehandantemano.
62
175040
2966
una gran colección de fotos de la persona.
03:10
For GeorgeJorge W. BushArbusto,
we can just searchbuscar on GoogleGoogle,
63
178650
2539
Si la persona es George W. Bush,
basta con buscar en Google.
De allí se puede construir
un modelo de base,
03:14
and from that, we are ablepoder
to buildconstruir an averagepromedio modelmodelo,
64
182309
2499
03:16
an iterativeiterativo, refinedrefinado modelmodelo
to recoverrecuperar the expressionexpresión
65
184832
3111
perfeccionado iterativamente
para recuperar la expresión
en sus detalles finos,
03:19
in fine detailsdetalles,
like creasespliegues and wrinklesarrugas.
66
187967
2336
como las arrugas y líneas de expresión.
03:23
What's fascinatingfascinante about this
67
191326
1403
Lo fascinante es que la colección de fotos
03:24
is that the photofoto collectioncolección
can come from your typicaltípico photosfotos.
68
192753
3423
puede hacerse a partir de fotos
comunes de la persona,
03:28
It doesn't really matterimportar
what expressionexpresión you're makingfabricación
69
196200
2603
cualquiera sea la expresión de su rostro
o el lugar donde se tomó la foto.
03:30
or where you tooktomó those photosfotos.
70
198827
1885
03:32
What mattersasuntos is
that there are a lot of them.
71
200736
2400
Lo que importa es que haya gran cantidad.
03:35
And we are still missingdesaparecido colorcolor here,
72
203160
1736
Pero todavía nos falta el color,
03:36
so nextsiguiente, we developdesarrollar
a newnuevo blendingmezcla techniquetécnica
73
204920
2348
así que a desarrollamos
una nueva técnica de mezcla
03:39
that improvesmejora uponsobre
a singlesoltero averagingpromediando methodmétodo
74
207292
2836
que funciona mejor que un simple promedio
y produce texturas
y colores faciales definidos.
03:42
and producesproduce sharpagudo
facialfacial texturestexturas and colorscolores.
75
210152
2818
03:45
And this can be donehecho for any expressionexpresión.
76
213779
2771
Y esto se puede aplicar
a cualquier expresión.
03:49
Now we have a controlcontrolar
of a modelmodelo of a personpersona,
77
217485
2499
Ahora podemos controlar
el modelo de una persona,
03:52
and the way it's controlledrevisado now
is by a sequencesecuencia of staticestático photosfotos.
78
220008
3795
a través de una secuencia
de fotos estáticas.
03:55
Noticedarse cuenta how the wrinklesarrugas come and go,
dependingdependiente on the expressionexpresión.
79
223827
3126
Observen cómo aparecen y desaparecen
las líneas del rostro según la expresión.
04:00
We can alsoademás use a videovídeo
to drivemanejar the modelmodelo.
80
228109
2746
También se puede usar un vídeo
para manejar el modelo.
04:02
(VideoVídeo) DanielDaniel CraigCraig: Right, but somehowde algun modo,
81
230879
2593
(Vídeo) Daniel Craig: Sí,
pero de alguna manera,
04:05
we'venosotros tenemos managedmanejado to attractatraer
some more amazingasombroso people.
82
233496
3771
logramos atraer más gente increíble.
SS: Y aquí tenemos otra demo entretenida.
04:10
SSSS: And here'saquí está anotherotro fundivertido demomanifestación.
83
238021
1642
04:11
So what you see here
are controllablecontrolable modelsmodelos
84
239687
2246
Estos son modelos controlables de personas
04:13
of people I builtconstruido
from theirsu internetInternet photosfotos.
85
241957
2444
que construí a partir de fotos
disponibles en la web.
04:16
Now, if you transfertransferir
the motionmovimiento from the inputentrada videovídeo,
86
244425
2904
Trasladando el movimiento
del vídeo original,
04:19
we can actuallyactualmente drivemanejar the entiretodo partyfiesta.
87
247353
2152
podemos manejar todos los modelos juntos.
04:21
GeorgeJorge W. BushArbusto:
It's a difficultdifícil billcuenta to passpasar,
88
249529
2172
George W. Bush: No es
una ley fácil de aprobar
04:23
because there's a lot of movingemocionante partspartes,
89
251725
2303
porque es un tema muy complejo
04:26
and the legislativelegislativo processesprocesos can be uglyfeo.
90
254052
5231
y los procesos legislativos
a veces son difíciles.
04:31
(ApplauseAplausos)
91
259307
1630
(Aplausos)
04:32
SSSS: So comingviniendo back a little bitpoco,
92
260961
1837
SS: Retomando lo anterior,
04:34
our ultimateúltimo goalGol, rathermás bien,
is to capturecapturar theirsu mannerismsmanierismos
93
262822
3191
nuestro objetivo principal
es captar los gestos típicos
04:38
or the uniqueúnico way eachcada
of these people talksnegociaciones and smilessonrisas.
94
266037
3045
o el modo particular de hablar
y sonreír de cada persona.
04:41
So to do that, can we
actuallyactualmente teachenseñar the computercomputadora
95
269106
2313
Para lograrlo, ¿es posible
enseñarle a la computadora
04:43
to imitateimitar the way someonealguien talksnegociaciones
96
271443
2222
a imitar cómo habla una persona
04:45
by only showingdemostración it
videovídeo footagedistancia en pies of the personpersona?
97
273689
2420
con solo mostrarle vídeos de ella?
Lo que yo hice exactamente
fue mostrarle a la computadora
04:48
And what I did exactlyexactamente was,
I let a computercomputadora watch
98
276898
2577
04:51
14 hourshoras of purepuro BarackBarack ObamaObama
givingdando addressesdirecciones.
99
279499
3277
14 horas de vídeos
con discursos de Barack Obama.
04:55
And here'saquí está what we can produceProduce
givendado only his audioaudio.
100
283443
3516
Y esto es lo se puede obtener
tan solo con el audio.
04:58
(VideoVídeo) BOBO: The resultsresultados are clearclaro.
101
286983
1777
(Vídeo) BO: Los resultados son claros.
05:00
America'sAmérica businessesnegocios have createdcreado
14.5 millionmillón newnuevo jobstrabajos
102
288784
4349
Las empresas en EE. UU. han creado
14,5 millones de puestos de trabajo
05:05
over 75 straightDerecho monthsmeses.
103
293157
2774
en un período de 75 meses.
05:07
SSSS: So what's beingsiendo synthesizedsintetizado here
is only the mouthboca regionregión,
104
295955
2905
SS: En este caso sintetizamos
solo la parte de la boca.
Les mostraré cómo lo hacemos.
05:10
and here'saquí está how we do it.
105
298884
1540
Nuestro sistema de datos
usa una red neuronal
05:12
Our pipelinetubería usesusos a neuralneural networkred
106
300764
1826
05:14
to convertconvertir and inputentrada audioaudio
into these mouthboca pointspuntos.
107
302614
2936
para convertir audio e ingresarlo
en estos puntos de la boca.
05:18
(VideoVídeo) BOBO: We get it throughmediante our jobtrabajo
or throughmediante MedicareSeguro médico del estado or MedicaidSeguro de enfermedad.
108
306547
4225
(Vídeo) BO: Lo conseguimos mediante
nuestro trabajo, Medicare o Medicaid.
05:22
SSSS: Then we synthesizesintetizar the texturetextura,
enhancemejorar detailsdetalles and teethdientes,
109
310796
3420
SS: Luego sintetizamos la textura,
mejoramos los detalles y los dientes,
05:26
and blendmezcla it into the headcabeza
and backgroundfondo from a sourcefuente videovídeo.
110
314240
3074
y lo incorporamos a la cabeza
y al fondo del vídeo original.
05:29
(VideoVídeo) BOBO: WomenMujer can get freegratis checkupschequeos,
111
317338
1905
(Vídeo) BO: La mujer tiene
derecho al chequeo gratuito.
05:31
and you can't get chargedcargado more
just for beingsiendo a womanmujer.
112
319267
2968
No se le puede cobrar más
solo por ser mujer.
05:34
YoungJoven people can staypermanecer
on a parent'spadres planplan untilhasta they turngiro 26.
113
322973
3306
Los jóvenes tienen la cobertura
del plan de sus padres hasta los 26.
05:39
SSSS: I think these resultsresultados
seemparecer very realisticrealista and intriguingintrigante,
114
327267
2952
SS: Creo que estos resultados
son muy realistas y fascinantes,
05:42
but at the samemismo time
frighteningaterrador, even to me.
115
330243
3173
pero al mismo tiempo son
aterradores, incluso para mí.
05:45
Our goalGol was to buildconstruir an accuratepreciso modelmodelo
of a personpersona, not to misrepresentfalsificar them.
116
333440
4015
Nuestra idea fue crear el modelo exacto
de una persona, no tergiversarla.
05:49
But one thing that concernspreocupaciones me
is its potentialpotencial for misusemal uso.
117
337956
3111
Pero hay algo que me preocupa, y es
su potencial de ser usado indebidamente.
05:53
People have been thinkingpensando
about this problemproblema for a long time,
118
341958
2971
Este problema es motivo
de preocupación hace tiempo,
desde que Photoshop entró
al mercado por primera vez.
05:56
sinceya que the daysdías when PhotoshopPhotoshop
first hitgolpear the marketmercado.
119
344953
2381
05:59
As a researcherinvestigador, I'm alsoademás workingtrabajando
on countermeasurecontramedida technologytecnología,
120
347862
3801
Como investigador, también trabajo
en tecnología de prevención,
06:03
and I'm partparte of an ongoingen marcha
effortesfuerzo at AIAI FoundationFundación,
121
351687
2942
y formo parte de "AI Foundation",
06:06
whichcual usesusos a combinationcombinación
of machinemáquina learningaprendizaje and humanhumano moderatorsmoderadores
122
354653
3397
donde combinamos el aprendizaje
automático con el control humano
06:10
to detectdetectar fakefalso imagesimágenes and videosvideos,
123
358074
2144
para detectar imágenes y vídeos falsos,
combatiendo mi propio trabajo.
06:12
fightinglucha againsten contra my ownpropio work.
124
360242
1514
Una de las herramientas que queremos
lanzar se llama "Reality Defender",
06:14
And one of the toolsherramientas we planplan to releaselanzamiento
is calledllamado RealityRealidad DefenderDefensor,
125
362675
3190
06:17
whichcual is a web-browsernavegador web plug-inenchufar
that can flagbandera potentiallypotencialmente fakefalso contentcontenido
126
365889
4039
un complemento para el navegador
que detecta contenido potencialmente falso
automáticamente en el buscador.
06:21
automaticallyautomáticamente, right in the browsernavegador.
127
369952
2533
06:24
(ApplauseAplausos)
128
372509
4228
(Aplausos)
06:28
DespiteA pesar de all this, thoughaunque,
129
376761
1453
Pero, aun así,
los vídeos falsos pueden
causar un gran daño,
06:30
fakefalso videosvideos could do a lot of damagedañar,
130
378238
1840
06:32
even before anyonenadie has a chanceoportunidad to verifyverificar,
131
380102
3294
incluso antes de ser chequeados.
06:35
so it's very importantimportante
that we make everyonetodo el mundo awareconsciente
132
383420
2722
Por eso es fundamental que la gente
esté al tanto de este tipo de cosas
06:38
of what's currentlyactualmente possibleposible
133
386166
2007
06:40
so we can have the right assumptionsuposición
and be criticalcrítico about what we see.
134
388197
3369
y pueda sacar las conclusiones
correctas y juzgar lo que ve.
06:44
There's still a long way to go before
we can fullycompletamente modelmodelo individualindividual people
135
392423
5007
Todavía falta mucho para llegar a modelar
completamente una persona en particular
06:49
and before we can ensureasegurar
the safetyla seguridad of this technologytecnología.
136
397454
2786
y garantizar la seguridad
de esta tecnología.
Pero estoy entusiasmado
y lleno de esperanza,
06:53
But I'm excitedemocionado and hopefulesperanzado,
137
401097
1587
06:54
because if we use it right and carefullycuidadosamente,
138
402708
3539
porque si esta herramienta
se usa con buen juicio
06:58
this toolherramienta can allowpermitir any individual'sindividuo
positivepositivo impactimpacto on the worldmundo
139
406271
4309
puede permitir amplificar enormemente
el impacto positivo de cualquier
persona en el mundo
07:02
to be massivelymacizamente scaledescamoso
140
410604
2190
y ayudarnos a forjar
el futuro que queremos.
07:04
and really help shapeforma our futurefuturo
the way we want it to be.
141
412818
2742
07:07
Thank you.
142
415584
1151
Gracias.
07:08
(ApplauseAplausos)
143
416759
5090
(Aplausos)
Translated by Paula Motter
Reviewed by Analia Padin

▲Back to top

ABOUT THE SPEAKER
Supasorn Suwajanakorn - Computer scientist
Supasorn Suwajanakorn works on ways to reconstruct, preserve and reanimate anyone -- just from their existing photos and videos.

Why you should listen

Can we create a digital avatar that looks, acts and talks just like our sweet grandma? This question has inspired Supasorn Suwajanakorn, a recent PhD graduate from the University of Washington, to spend years developing new tools to make it a reality. He has developed a set of algorithms that can build a moving 3D face model of anyone from just photos, which was awarded the Innovation of the Year in 2016. He then introduced the first system that can replicate a person's speech and produce a realistic CG-animation by only analyzing their existing video footage -- all without ever bringing in the person to a Hollywood capture studio.

Suwajanakorn is working in the field of machine learning and computer vision. His goal is to bring vision algorithms out of the lab and make them work in the wild.

More profile about the speaker
Supasorn Suwajanakorn | Speaker | TED.com