ABOUT THE SPEAKER
Supasorn Suwajanakorn - Computer scientist
Supasorn Suwajanakorn works on ways to reconstruct, preserve and reanimate anyone -- just from their existing photos and videos.

Why you should listen

Can we create a digital avatar that looks, acts and talks just like our sweet grandma? This question has inspired Supasorn Suwajanakorn, a recent PhD graduate from the University of Washington, to spend years developing new tools to make it a reality. He has developed a set of algorithms that can build a moving 3D face model of anyone from just photos, which was awarded the Innovation of the Year in 2016. He then introduced the first system that can replicate a person's speech and produce a realistic CG-animation by only analyzing their existing video footage -- all without ever bringing in the person to a Hollywood capture studio.

Suwajanakorn is working in the field of machine learning and computer vision. His goal is to bring vision algorithms out of the lab and make them work in the wild.

More profile about the speaker
Supasorn Suwajanakorn | Speaker | TED.com
TED2018

Supasorn Suwajanakorn: Fake videos of real people -- and how to spot them

Supasorn Suwajanakorn: Videot false të personave realë -- dhe si t'i dallojmë ato

Filmed:
1,453,308 views

Mendoni se jeni të aftë të dalloni videot false, ku personat e famshëm thonë gjëra që nuk i kanë thënë kurrë në jetën reale? Shikoni se si ato krijohen në këtë prezantim dhe demostrim teknologjik mbreslënës. Eksperti kompjuterik Supasorn Suwajanakorn tregon se si, ai si një student i diplomuar, përdori modelet Al dhe 3D për të krijuar video false me foto reale të njerëzve të sinkronizuara me audio. Mësoni më shumë rreth treguesve etikë dhe mundësive kreative të kësaj teknologjie -- dhe hapave që duhen ndjekur për të luftuar kundër keqpërdorimit të saj.
- Computer scientist
Supasorn Suwajanakorn works on ways to reconstruct, preserve and reanimate anyone -- just from their existing photos and videos. Full bio

Double-click the English transcript below to play the video.

00:12
Look at these images.
0
876
1151
Shikojini këto foto.
Tani, më tregoni cili Obama këtu
është i vërtetë.
00:14
Now, tell me which Obama here is real.
1
2051
2635
(Video) B. Obama: Të ndihmojmë
familjet të rifinancojnë shtëpitë e tyre,
00:16
(Video) Barack Obama: To help families
refinance their homes,
2
4710
2861
00:19
to invest in things
like high-tech manufacturing,
3
7595
2647
të investojmë në prodhimet
e teknologjisë së lartë,
00:22
clean energy
4
10266
1159
energjinë e pastër dhe në infrastrukturë
00:23
and the infrastructure
that creates good new jobs.
5
11449
2779
që krijon vende të reja dhe të mira pune.
00:26
Supasorn Suwajanakorn: Anyone?
6
14647
1484
Supasorn Suwajanakorn: Ndonjë?
00:28
The answer is none of them.
7
16155
1874
Përgjigjja është asgjë nga ato.
00:30
(Laughter)
8
18053
1114
(Të qeshura)
00:31
None of these is actually real.
9
19191
1786
Asnjë nga këto nuk është
faktikisht e vërtetë.
00:33
So let me tell you how we got here.
10
21001
1840
Më lini t'iu tregoj si arritëm këtu.
00:35
My inspiration for this work
11
23940
1578
Frymëzimi im për këtë punë
00:37
was a project meant to preserve our last
chance for learning about the Holocaust
12
25542
5411
ishte nga një projekt për të mbrojtur
mundësinë tonë të fundit
për të mësuar për Asgjesimin
nga të mbijetuarit.
00:42
from the survivors.
13
30977
1768
00:44
It's called New Dimensions in Testimony,
14
32769
2627
Quhet Dimensionet e Reja në Testament,
00:47
and it allows you to have
interactive conversations
15
35420
3126
dhe ai të lejon të bësh një bisedë
interaktive
00:50
with a hologram
of a real Holocaust survivor.
16
38570
2556
me një hologram të një të mbijetuari
real të Asgjesimit.
00:53
(Video) Man: How did you
survive the Holocaust?
17
41793
1966
(Video) Burri: Si i mbjetuat Asgjesimit?
00:55
(Video) Hologram: How did I survive?
18
43783
1668
(Video) Hologram: Si mbijetova?
00:57
I survived,
19
45912
1807
Unë mbijetova,
01:00
I believe,
20
48419
1527
Unë besoj,
01:01
because providence watched over me.
21
49970
3023
sepse fati u kujdes për mua.
01:05
SS: Turns out these answers
were prerecorded in a studio.
22
53573
3454
SS: E kuptuat që këto përgjigje
janë para regjistruar në një studio.
01:09
Yet the effect is astounding.
23
57051
2452
Ende efekti është i mahnitshëm.
01:11
You feel so connected to his story
and to him as a person.
24
59527
3619
Ju ndiheni të lidhur me historinë e tij
dhe me të si individ.
01:16
I think there's something special
about human interaction
25
64011
3301
Unë mendoj se ka diçka speciale
në bashkëveprimin midis njerëzve
01:19
that makes it much more profound
26
67336
2757
që e bën atë akoma më të ndjeshëm
01:22
and personal
27
70117
2198
dhe personal
01:24
than what books or lectures
or movies could ever teach us.
28
72339
3485
se sa librat ose leksionet ose
filmat mund të na mësojnë ne.
01:28
So I saw this and began to wonder,
29
76267
2425
Pra unë pashë këtë dhe nisa të pyes veten,
01:30
can we create a model
like this for anyone?
30
78716
2810
a mundemi ne të krijojmë një model
të tillë për këdo?
01:33
A model that looks, talks
and acts just like them?
31
81550
2975
Një model që duket, flet dhe
vepron si ata?
Kështu nisa të shikoja nëse kjo
mund të ndodhte
01:37
So I set out to see if this could be done
32
85573
2007
01:39
and eventually came up with a new solution
33
87604
2310
dhe përfundimisht erdha me
një zgjidhje të re
01:41
that can build a model of a person
using nothing but these:
34
89938
3220
për të ndërtuar një model të një personi
duke përdorur vetëm këto:
01:45
existing photos and videos of a person.
35
93747
2214
fotot dhe videot ekzistuese
të një personi.
01:48
If you can leverage
this kind of passive information,
36
96701
2617
Nëse ju mund të menaxhoni
këtë lloj informacioni pasiv,
01:51
just photos and video that are out there,
37
99342
2007
vetëm fotot dhe videot që janë atje,
01:53
that's the key to scaling to anyone.
38
101373
2056
ky është çelësi i riprodhimit të kujdo.
01:56
By the way, here's Richard Feynman,
39
104119
1777
Ja pra, këtu kemi Richard Feynam,
01:57
who in addition to being
a Nobel Prize winner in physics
40
105920
3413
i cili përveç të qënit fitues
i çmimit Nobel në fizikë
02:01
was also known as a legendary teacher.
41
109357
2453
ishte gjithashtu i njohur si një
mësues legjendar.
02:05
Wouldn't it be great
if we could bring him back
42
113080
2198
A nuk do të ishte fantastike
ta sillnim sërish
02:07
to give his lectures
and inspire millions of kids,
43
115302
3265
atë të na jepte leksionet e tij
dhe të frymëzonte miliona fëmijë,
02:10
perhaps not just in English
but in any language?
44
118591
2992
ndoshta jo vetëm në Anglisht
por në çdo gjuhë tjetër?
02:14
Or if you could ask our grandparents
for advice and hear those comforting words
45
122441
4602
Ose të mund të pyesnit gjyshërit për
ndonjë këshillë dhe të dëgjonit
ato fjalë të ngrohta edhe pse
ata nuk janë më mes nesh?
02:19
even if they're no longer with us?
46
127067
1770
02:21
Or maybe using this tool,
book authors, alive or not,
47
129683
3396
Ose ndoshta duke përdorur këtë
metodë, shkrimtarë, gjallë ose jo,
02:25
could read aloud all of their books
for anyone interested.
48
133103
2937
mund të lexojnë me zë librat
e tyre për këdo të interesuar.
02:29
The creative possibilities
here are endless,
49
137199
2437
Mundësitë kreative këtu janë të pafundme,
02:31
and to me, that's very exciting.
50
139660
1713
dhe për mua kjo është shumë emocionuese.
02:34
And here's how it's working so far.
51
142595
2002
Dhe kështu po funksionon kjo deri tani.
02:36
First, we introduce a new technique
52
144621
1667
Fillimisht, ne prezantojmë
një teknikë të re
02:38
that can reconstruct a high-detailed
3D face model from any image
53
146312
4572
që mund të ndërtojë një model fytyre
të detajuar 3D nga çdo imazh
02:42
without ever 3D-scanning the person.
54
150908
2119
pa skanim 3D të personit.
02:45
And here's the same output model
from different views.
55
153890
2642
Këtu është i njëjti model paraqitje
nga anë të ndryshme.
02:49
This also works on videos,
56
157969
1502
Kjo funksionon dhe në video,
02:51
by running the same algorithm
on each video frame
57
159495
2852
duke përdorur të njëjtin algoritëm
në çdo kuadër të filmit
02:54
and generating a moving 3D model.
58
162371
2222
dhe duke krijuar një model 3D lëvizje.
02:57
And here's the same
output model from different angles.
59
165538
2772
Dhe këtu është i njëjti model
nga kënde të ndryshme.
03:01
It turns out this problem
is very challenging,
60
169933
2534
Zbulimi i këtij problemi
është shumë sfidues,
por çelësi i zgjidhjes është
që ne të analizojmë
03:04
but the key trick
is that we are going to analyze
61
172491
2525
03:07
a large photo collection
of the person beforehand.
62
175040
2966
fillimisht një koleksion të gjerë fotosh
të personit.
03:10
For George W. Bush,
we can just search on Google,
63
178650
2539
Për George W. Bush,
ne thjesht mund të kërkojmë në Google,
dhe nga ajo, ne mund të krijojmë një
model të përafërt
03:14
and from that, we are able
to build an average model,
64
182309
2499
një model të përsëritur, të përpunuar
për të shprehur
03:16
an iterative, refined model
to recover the expression
65
184832
3111
03:19
in fine details,
like creases and wrinkles.
66
187967
2336
detaje të hollësishme,
si shprehitë e fytyrës dhe rrudhat.
Ajo që është mahnitëse rreth kësaj
është se
03:23
What's fascinating about this
67
191326
1403
03:24
is that the photo collection
can come from your typical photos.
68
192753
3423
koleksioni i fotove krijohet
prej fotove tipike tuajat.
Nuk ka rëndësi çfarë shprehie
fytyre ju jeni duke bërë
03:28
It doesn't really matter
what expression you're making
69
196200
2603
ose ku i keni realizuar ato foto.
03:30
or where you took those photos.
70
198827
1885
Ajo që vlen është që ka shumë prej tyre.
03:32
What matters is
that there are a lot of them.
71
200736
2400
Dhe kemi akoma mungesë ngjyrash këtu,
03:35
And we are still missing color here,
72
203160
1736
kështu te tjetra, zhvilluam një
teknikë të re përzierje
03:36
so next, we develop
a new blending technique
73
204920
2348
03:39
that improves upon
a single averaging method
74
207292
2836
që e përmirëson në një metodë
të vetme të përafërt
03:42
and produces sharp
facial textures and colors.
75
210152
2818
dhe krijon paraqitje dhe
ngjyra të mprehta të fytyrës.
03:45
And this can be done for any expression.
76
213779
2771
Dhe kjo mund të bëhet për
çdo shprehi fytyre.
03:49
Now we have a control
of a model of a person,
77
217485
2499
Tani ne kemi një kontroll të një
modeli të një personi dhe
03:52
and the way it's controlled now
is by a sequence of static photos.
78
220008
3795
mënyra si ai kontrollohet
është pasojë e fotove statike.
Vini re si rrudhat vijnë dhe ikin,
në varësi të shprehisë.
03:55
Notice how the wrinkles come and go,
depending on the expression.
79
223827
3126
04:00
We can also use a video
to drive the model.
80
228109
2746
Ne mund të përdorim edhe
një video për bërë modelin.
04:02
(Video) Daniel Craig: Right, but somehow,
81
230879
2593
(Video) Daniel Craig: Drejt, por disi,
ne jemi përpjekur për të tërhequr
më shumë njerëz interesantë.
04:05
we've managed to attract
some more amazing people.
82
233496
3771
SS: Dhe këtu është një tjetër
demostrim argëtues.
04:10
SS: And here's another fun demo.
83
238021
1642
Ato që shikoni këtu janë
modele të kontrollueshme
04:11
So what you see here
are controllable models
84
239687
2246
04:13
of people I built
from their internet photos.
85
241957
2444
të njerëzve që unë ndërtova nga
fotot e tyre në internet.
04:16
Now, if you transfer
the motion from the input video,
86
244425
2904
Tani, nëse transferoni lëvizjen
nga video origjinale,
mund të realizoni lëvizjen e
të gjitha pjesëve.
04:19
we can actually drive the entire party.
87
247353
2152
04:21
George W. Bush:
It's a difficult bill to pass,
88
249529
2172
G. Bush: Ky projektligj është
i vështirë për t'u kaluar,
sepse ka shumë pjesë të ndryshueshme,
04:23
because there's a lot of moving parts,
89
251725
2303
dhe proçesi legjislativ mund
të jetë i shëmtuar.
04:26
and the legislative processes can be ugly.
90
254052
5231
(Duartrokitje)
04:31
(Applause)
91
259307
1630
SS: Pra le të kthehemi pak pas,
04:32
SS: So coming back a little bit,
92
260961
1837
04:34
our ultimate goal, rather,
is to capture their mannerisms
93
262822
3191
qëllimi ynë final është të kapim
veset e tyre ose mënyrat tipike se si
04:38
or the unique way each
of these people talks and smiles.
94
266037
3045
këta persona flasin dhe qeshin.
04:41
So to do that, can we
actually teach the computer
95
269106
2313
Pra për ta bërë atë, a mundemi
të mësojmë kompjuterin
04:43
to imitate the way someone talks
96
271443
2222
të imitojë mënyrën se si
një person flet duke
04:45
by only showing it
video footage of the person?
97
273689
2420
i treguar atij një video imazh
të personit?
Dhe unë saktësisht lash në
një kompjuter për 14 orë
04:48
And what I did exactly was,
I let a computer watch
98
276898
2577
04:51
14 hours of pure Barack Obama
giving addresses.
99
279499
3277
video të Barak Obamës duke mbajtur fjalim.
04:55
And here's what we can produce
given only his audio.
100
283443
3516
Dhe ja çfarë mund të krijojmë
duke përdorur vetëm audio-n e tij.
(Video) BO: Rezultatet janë të qarta.
04:58
(Video) BO: The results are clear.
101
286983
1777
05:00
America's businesses have created
14.5 million new jobs
102
288784
4349
Bizneset në Amerikë kanë krijuar
14.5 milion vende të reja pune
gjatë 75 muajve pasuese.
05:05
over 75 straight months.
103
293157
2774
SS: Pra ajo që kemi modifikuar këtu
është vetëm zona e gojës,
05:07
SS: So what's being synthesized here
is only the mouth region,
104
295955
2905
dhe ja si e kemi bërë.
05:10
and here's how we do it.
105
298884
1540
Për përpunimin përdoret një
rrjet nervor që konverton
05:12
Our pipeline uses a neural network
106
300764
1826
05:14
to convert and input audio
into these mouth points.
107
302614
2936
dhe fut audio në pikat e gojës.
05:18
(Video) BO: We get it through our job
or through Medicare or Medicaid.
108
306547
4225
(Video) BO: Ne e arritëm atë nga puna jonë
ose nga Medicare ose Medicaid.
05:22
SS: Then we synthesize the texture,
enhance details and teeth,
109
310796
3420
SS: Pastaj ne krijuam tiparet,
përmirësuam detajet dhe dhëmbët,
dhe i vendosëm ato te koka
dhe sfondin nga video origjinale.
05:26
and blend it into the head
and background from a source video.
110
314240
3074
(Video) BO: Gratë mund të bëjnë
kontrolle falas,
05:29
(Video) BO: Women can get free checkups,
111
317338
1905
05:31
and you can't get charged more
just for being a woman.
112
319267
2968
dhe ju nuk do të ndjeni më pengesë
që jeni një grua.
Të rinjtë mund të jenë nën kujdesin
e prindit derisa bëhen 26.
05:34
Young people can stay
on a parent's plan until they turn 26.
113
322973
3306
SS: Unë mendoj se këto
rezulatate duken shumë realiste
05:39
SS: I think these results
seem very realistic and intriguing,
114
327267
2952
dhe interesante por njëkohësisht
frikësuese, edhe për mua.
05:42
but at the same time
frightening, even to me.
115
330243
3173
Qëllimi ynë ishte të ndërtonim një model
05:45
Our goal was to build an accurate model
of a person, not to misrepresent them.
116
333440
4015
të saktë të personit,
jo keqprezantimin e tyre.
Por një gjë që më shqetëson
është risku për keqpërdorim të tij.
05:49
But one thing that concerns me
is its potential for misuse.
117
337956
3111
Njerëzit kanë menduar për këtë
problem për një kohë të gjatë,
05:53
People have been thinking
about this problem for a long time,
118
341958
2971
që në ditët kur Photoshop hyri në treg.
05:56
since the days when Photoshop
first hit the market.
119
344953
2381
05:59
As a researcher, I'm also working
on countermeasure technology,
120
347862
3801
Si një studiues, unë po punoj edhe
në teknologjinë mbrojtëse
dhe jam pjesë e një projekti
në vazhdim të Al Foundation,
06:03
and I'm part of an ongoing
effort at AI Foundation,
121
351687
2942
06:06
which uses a combination
of machine learning and human moderators
122
354653
3397
që përdor një kombinim të të mësuarit
automatik dhe njeriut
06:10
to detect fake images and videos,
123
358074
2144
për të dalluar imazhet dhe videot false,
06:12
fighting against my own work.
124
360242
1514
duke luftuar kundër punës time.
Dhe një nga mjetet që ne duam të nxjerrim
quhet Mbrojtësi Realitetit,
06:14
And one of the tools we plan to release
is called Reality Defender,
125
362675
3190
që është një ndihmës web-browser që dallon
06:17
which is a web-browser plug-in
that can flag potentially fake content
126
365889
4039
të dhënat false automatikisht,
06:21
automatically, right in the browser.
127
369952
2533
direkt në browser.
(Duartrokitje)
06:24
(Applause)
128
372509
4228
Përveç kësaj, meqënëse
06:28
Despite all this, though,
129
376761
1453
videot false shkaktojnë shumë pasoja,
edhe para se një person
06:30
fake videos could do a lot of damage,
130
378238
1840
06:32
even before anyone has a chance to verify,
131
380102
3294
të ketë mundësinë t'i verifikojë.
Pra është shumë e rëndësishme të dini
06:35
so it's very important
that we make everyone aware
132
383420
2722
se çfarë bëhet konkretisht,
që të bëni supozimet e duhura
06:38
of what's currently possible
133
386166
2007
06:40
so we can have the right assumption
and be critical about what we see.
134
388197
3369
dhe të jeni kritik në atë që shikoni.
Duhet një rrugë e gjatë para se të
modelojmë
06:44
There's still a long way to go before
we can fully model individual people
135
392423
5007
plotësisht një individ dhe
06:49
and before we can ensure
the safety of this technology.
136
397454
2786
para se të garantojmë
sigurinë e kësaj teknologjie.
Por unë jam i kënaqur dhe me shpresë,
sepse nëse e përdorim
06:53
But I'm excited and hopeful,
137
401097
1587
06:54
because if we use it right and carefully,
138
402708
3539
atë drejt dhe me kujdes,
ky mjet lejon çdo impakt pozitiv
të njeriut në botë
06:58
this tool can allow any individual's
positive impact on the world
139
406271
4309
07:02
to be massively scaled
140
410604
2190
të vlerësohet masivisht dhe na ndihmon
07:04
and really help shape our future
the way we want it to be.
141
412818
2742
të krijojmë të ardhmen tonë
ashtu si duam ne.
07:07
Thank you.
142
415584
1151
Ju falemnderit.
(Duartrokitje)
07:08
(Applause)
143
416759
5090
Translated by Artjola Puja
Reviewed by Helena Bedalli

▲Back to top

ABOUT THE SPEAKER
Supasorn Suwajanakorn - Computer scientist
Supasorn Suwajanakorn works on ways to reconstruct, preserve and reanimate anyone -- just from their existing photos and videos.

Why you should listen

Can we create a digital avatar that looks, acts and talks just like our sweet grandma? This question has inspired Supasorn Suwajanakorn, a recent PhD graduate from the University of Washington, to spend years developing new tools to make it a reality. He has developed a set of algorithms that can build a moving 3D face model of anyone from just photos, which was awarded the Innovation of the Year in 2016. He then introduced the first system that can replicate a person's speech and produce a realistic CG-animation by only analyzing their existing video footage -- all without ever bringing in the person to a Hollywood capture studio.

Suwajanakorn is working in the field of machine learning and computer vision. His goal is to bring vision algorithms out of the lab and make them work in the wild.

More profile about the speaker
Supasorn Suwajanakorn | Speaker | TED.com