ABOUT THE SPEAKER
Supasorn Suwajanakorn - Computer scientist
Supasorn Suwajanakorn works on ways to reconstruct, preserve and reanimate anyone -- just from their existing photos and videos.

Why you should listen

Can we create a digital avatar that looks, acts and talks just like our sweet grandma? This question has inspired Supasorn Suwajanakorn, a recent PhD graduate from the University of Washington, to spend years developing new tools to make it a reality. He has developed a set of algorithms that can build a moving 3D face model of anyone from just photos, which was awarded the Innovation of the Year in 2016. He then introduced the first system that can replicate a person's speech and produce a realistic CG-animation by only analyzing their existing video footage -- all without ever bringing in the person to a Hollywood capture studio.

Suwajanakorn is working in the field of machine learning and computer vision. His goal is to bring vision algorithms out of the lab and make them work in the wild.

More profile about the speaker
Supasorn Suwajanakorn | Speaker | TED.com
TED2018

Supasorn Suwajanakorn: Fake videos of real people -- and how to spot them

Супасорн Суваджанакорн: Поддельные видео реальных людей — как их распознать

Filmed:
1,453,308 views

Умеете ли вы распознавать поддельные видео, на которых известные люди говорят то, что в реальной жизни никогда не говорили? Посмотрите, как они создаются, в выступлении и демонстрационном видео Супасорна Суваджанакорна. Учёный в области компьютерных наук показывает, как, будучи студентом старших курсов, он использовал ИИ и 3D-моделирование для создания фотореалистичных поддельных видеороликов людей, синхронизируя их с аудио. Узнайте, какие этические последствия и творческие возможности есть у этой технологии, а также о попытках борьбы с её неправильным использованием.
- Computer scientist
Supasorn Suwajanakorn works on ways to reconstruct, preserve and reanimate anyone -- just from their existing photos and videos. Full bio

Double-click the English transcript below to play the video.

00:12
Look at these imagesизображений.
0
876
1151
Взгляните на изображения.
00:14
Now, tell me whichкоторый ObamaОбама here is realреальный.
1
2051
2635
А теперь скажите,
на котором из них настоящий Обама.
00:16
(Videoвидео) BarackБарак ObamaОбама: To help familiesсемьи
refinanceрефинансировать theirих homesдома,
2
4710
2861
(Видео) Барак Обама: Помочь семьям
рефинансировать жильё,
00:19
to investвкладывать деньги in things
like high-techвысокие технологии manufacturingпроизводство,
3
7595
2647
инвестировать
в высокотехнологичное производство,
00:22
cleanчистый energyэнергия
4
10266
1159
экологичную энергию
00:23
and the infrastructureинфраструктура
that createsсоздает good newновый jobsработы.
5
11449
2779
и инфраструктуру, которая
создаёт новые рабочие места.
Супасорн Суваджанакорн: Кто-нибудь знает?
00:26
SupasornSupasorn SuwajanakornSuwajanakorn: AnyoneКто угодно?
6
14647
1484
00:28
The answerответ is noneникто of them.
7
16155
1874
Правильный ответ: ни на каком.
00:30
(LaughterСмех)
8
18053
1114
(Смех)
00:31
NoneНикто of these is actuallyна самом деле realреальный.
9
19191
1786
На самом деле все они поддельные.
00:33
So let me tell you how we got here.
10
21001
1840
Я расскажу вам, как мы это сделали.
00:35
My inspirationвдохновение for this work
11
23940
1578
На это меня вдохновил проект,
00:37
was a projectпроект meantимел ввиду to preserveсохранять our last
chanceшанс for learningобучение about the Holocaustистребление
12
25542
5411
предоставляющий нам последний шанс
узнать правду о Холокосте
00:42
from the survivorsвыжившие.
13
30977
1768
от оставшихся в живых.
00:44
It's calledназывается Newновый DimensionsГабаритные размеры in TestimonyПоказания,
14
32769
2627
Он называется «Новые измерения
в свидетельских показаниях»
00:47
and it allowsпозволяет you to have
interactiveинтерактивный conversationsразговоры
15
35420
3126
и позволяет участвовать
в интерактивном диалоге
00:50
with a hologramголограмма
of a realреальный Holocaustистребление survivorуцелевший.
16
38570
2556
с голограммами выживших жертв Холокоста.
00:53
(Videoвидео) Man: How did you
surviveуцелеть the Holocaustистребление?
17
41793
1966
(Видео) Мужчина: Как вы
выжили во время Холокоста?
00:55
(Videoвидео) Hologramголограмма: How did I surviveуцелеть?
18
43783
1668
(Видео) Голограмма: Как я выжил?
00:57
I survivedпереживший,
19
45912
1807
Я думаю,
01:00
I believe,
20
48419
1527
что я выжил,
01:01
because providenceпровидение watchedсмотрели over me.
21
49970
3023
потому что так было угодно Богу.
01:05
SSSS: TurnsПовороты out these answersответы
were prerecordedзаписанная in a studioстудия.
22
53573
3454
СС: Оказывается, эти ответы
были записаны в студии.
01:09
YetВсе же the effectэффект is astoundingпоразительный.
23
57051
2452
И всё же эффект поразительный.
01:11
You feel so connectedсвязанный to his storyистория
and to him as a personчеловек.
24
59527
3619
Чувствуется связь с историей его жизни
и лично с самим человеком.
01:16
I think there's something specialособый
about humanчеловек interactionвзаимодействие
25
64011
3301
Есть нечто особенное в общении людей,
01:19
that makesмарки it much more profoundглубокий
26
67336
2757
что делает его более проникновенным
01:22
and personalличный
27
70117
2198
и личным,
01:24
than what booksкниги or lecturesлекции
or moviesкино could ever teachучат us.
28
72339
3485
чем любая информация из книг или фильмов.
01:28
So I saw this and beganначал to wonderзадаваться вопросом,
29
76267
2425
Увидев это, я задался вопросом:
01:30
can we createСоздайте a modelмодель
like this for anyoneкто угодно?
30
78716
2810
возможно ли создать подобную
модель любого человека?
01:33
A modelмодель that looksвыглядит, talksпереговоры
and actsакты just like them?
31
81550
2975
Модель, которая выглядит, говорит,
ведёт себя как реальный человек?
01:37
So I setзадавать out to see if this could be doneсделанный
32
85573
2007
Я решил выяснить, возможно ли это,
01:39
and eventuallyв итоге cameпришел up with a newновый solutionрешение
33
87604
2310
и в итоге придумал новую методику,
01:41
that can buildстроить a modelмодель of a personчеловек
usingс помощью nothing but these:
34
89938
3220
которая позволяет создать модель человека,
01:45
existingсуществующий photosфото and videosвидео of a personчеловек.
35
93747
2214
используя лишь
его существующие фото и видео.
01:48
If you can leverageлевередж
this kindсвоего рода of passiveпассивный informationИнформация,
36
96701
2617
Если можно воспользоваться
данной пассивной информацией,
01:51
just photosфото and videoвидео that are out there,
37
99342
2007
только лишь имеющимися фото и видео,
01:53
that's the keyключ to scalingпересчет to anyoneкто угодно.
38
101373
2056
то это ляжет в основу
моделирования любого человека.
01:56
By the way, here'sвот RichardРичард FeynmanФейнман,
39
104119
1777
Кстати, это Ричард Фейнман:
01:57
who in additionприбавление to beingявляющийся
a NobelНобель Prizeприз winnerпобедитель in physicsфизика
40
105920
3413
будучи лауреатом
Нобелевской премии по физике,
02:01
was alsoтакже knownизвестен as a legendaryлегендарный teacherучитель.
41
109357
2453
он также известен как выдающийся педагог.
Было бы здорово,
если бы мы смогли воскресить его,
02:05
Wouldn'tне было бы it be great
if we could bringприносить him back
42
113080
2198
02:07
to give his lecturesлекции
and inspireвнушать millionsмиллионы of kidsДети,
43
115302
3265
чтобы он прочёл свои лекции
и вдохновил бы миллионы детей.
02:10
perhapsвозможно not just in Englishанглийский
but in any languageязык?
44
118591
2992
Возможно, не только на английском языке,
но и на любом другом?
02:14
Or if you could askпросить our grandparentsдедушка и бабушка
for adviceсовет and hearзаслушивать those comfortingутешительный wordsслова
45
122441
4602
Или если можно было бы посоветоваться
с покойными бабушками и дедушками
02:19
even if they're no longerдольше with us?
46
127067
1770
и услышать их утешительные слова?
02:21
Or maybe usingс помощью this toolинструмент,
bookкнига authorsавторы, aliveв живых or not,
47
129683
3396
А может быть, при помощи этого устройства
авторы книг, живые или нет,
02:25
could readчитать aloudвслух all of theirих booksкниги
for anyoneкто угодно interestedзаинтересованный.
48
133103
2937
смогли бы прочесть вслух
свои произведения любому желающему?
02:29
The creativeтворческий possibilitiesвозможности
here are endlessбесконечный,
49
137199
2437
Возможности творчества здесь безграничны,
02:31
and to me, that's very excitingзахватывающе.
50
139660
1713
и это меня завораживает.
02:34
And here'sвот how it's workingза работой so farдалеко.
51
142595
2002
Вот как это работает сейчас.
02:36
First, we introduceвводить a newновый techniqueтехника
52
144621
1667
Во-первых, мы используем новую технику,
02:38
that can reconstructреконструировать a high-detailedвысокий подробно
3D faceлицо modelмодель from any imageобраз
53
146312
4572
которая позволяет воссоздать сверхточную
3D-модель лица с любого изображения
02:42
withoutбез ever 3D-scanningD-сканирование the personчеловек.
54
150908
2119
без помощи 3D-сканирования человека.
02:45
And here'sвот the sameодна и та же outputвывод modelмодель
from differentдругой viewsПросмотры.
55
153890
2642
Вот та же самая готовая модель
с разных точек обзора.
02:49
This alsoтакже worksработает on videosвидео,
56
157969
1502
Это работает и с видео:
02:51
by runningБег the sameодна и та же algorithmалгоритм
on eachкаждый videoвидео frameРамка
57
159495
2852
мы запускаем этот же алгоритм
на каждом видеокадре
02:54
and generatingпорождающий a movingперемещение 3D modelмодель.
58
162371
2222
и создаём движущуюся 3D-модель.
02:57
And here'sвот the sameодна и та же
outputвывод modelмодель from differentдругой anglesуглы.
59
165538
2772
А вот готовая модель с разных ракурсов.
03:01
It turnsвитки out this problemпроблема
is very challengingиспытывающий,
60
169933
2534
На самом деле это довольно сложно,
03:04
but the keyключ trickтрюк
is that we are going to analyzeанализировать
61
172491
2525
но главная хитрость в том,
что мы заранее анализируем
03:07
a largeбольшой photoФото collectionколлекция
of the personчеловек beforehandзаранее.
62
175040
2966
большу́ю коллекцию фотографий
конкретного человека.
03:10
For GeorgeДжордж W. Bushбуш,
we can just searchпоиск on GoogleGoogle,
63
178650
2539
Фотографии Джорджа Буша-младшего
можно просто погуглить
03:14
and from that, we are ableв состоянии
to buildстроить an averageв среднем modelмодель,
64
182309
2499
и на их основе создать усреднённую модель,
03:16
an iterativeитеративный, refinedутонченный modelмодель
to recoverоправляться the expressionвыражение
65
184832
3111
итеративную, высокоточную модель,
чтобы воссоздать выражение лица
03:19
in fine detailsДетали,
like creasesсгибы and wrinklesморщины.
66
187967
2336
по таким мелким деталям,
как складки и морщины.
03:23
What's fascinatingочаровательный about this
67
191326
1403
Самое увлекательное в том,
03:24
is that the photoФото collectionколлекция
can come from your typicalтипичный photosфото.
68
192753
3423
что коллекция фотографий составляется
из ваших обычных фото.
03:28
It doesn't really matterдело
what expressionвыражение you're makingизготовление
69
196200
2603
Не имеет особого значения,
какое выражение лица у вас было
03:30
or where you tookвзял those photosфото.
70
198827
1885
и где были сделаны эти фотографии.
03:32
What mattersвопросы is
that there are a lot of them.
71
200736
2400
Важно то, что их много.
03:35
And we are still missingотсутствует colorцвет here,
72
203160
1736
Пока мы не можем сделать их цветными,
03:36
so nextследующий, we developразвивать
a newновый blendingсмешивание techniqueтехника
73
204920
2348
поэтому следующий шаг —
разработать новую технику смешивания,
03:39
that improvesулучшает uponна
a singleОдин averagingусреднение methodметод
74
207292
2836
которая усовершенствует основной алгоритм
03:42
and producesпроизводит sharpострый
facialлицевой texturesтекстуры and colorsцвета.
75
210152
2818
для создания чёткой текстуры лица и цвета.
03:45
And this can be doneсделанный for any expressionвыражение.
76
213779
2771
Это станет возможным для любой мимики.
03:49
Now we have a controlконтроль
of a modelмодель of a personчеловек,
77
217485
2499
Итак, мы добились контроля
над моделью человека,
03:52
and the way it's controlledконтролируемый now
is by a sequenceпоследовательность of staticстатический photosфото.
78
220008
3795
который достигается последовательностью
статических фотографий.
03:55
Noticeуведомление how the wrinklesморщины come and go,
dependingв зависимости on the expressionвыражение.
79
223827
3126
Заметьте, как появляются и исчезают
морщинки в зависимости от выражения лица.
Чтобы управлять моделью,
мы также можем использовать видео.
04:00
We can alsoтакже use a videoвидео
to driveводить машину the modelмодель.
80
228109
2746
04:02
(Videoвидео) DanielДаниил CraigCraig: Right, but somehowкак-то,
81
230879
2593
(Видео) Дэниел Крейг:
Верно, но каким-то образом
04:05
we'veмы в managedудалось to attractпривлекать
some more amazingудивительно people.
82
233496
3771
нам удалось привлечь
ещё несколько удивительных людей.
СС: А вот ещё одно забавное демо-видео.
04:10
SSSS: And here'sвот anotherдругой funвесело demoдемонстрация.
83
238021
1642
04:11
So what you see here
are controllableуправляемый modelsмодели
84
239687
2246
То, что вы здесь видите, —
управляемые модели людей,
04:13
of people I builtпостроен
from theirих internetинтернет photosфото.
85
241957
2444
которые я создал на основе
их фото из интернета.
04:16
Now, if you transferперевод
the motionдвижение from the inputвход videoвидео,
86
244425
2904
Если перенести движение
от первоначального видео,
04:19
we can actuallyна самом деле driveводить машину the entireвсе partyвечеринка.
87
247353
2152
фактически мы можем
управлять всем процессом.
04:21
GeorgeДжордж W. Bushбуш:
It's a difficultсложно billзаконопроект to passпроходить,
88
249529
2172
Джордж Буш-младший:
Это сложный законопроект,
04:23
because there's a lot of movingперемещение partsчасти,
89
251725
2303
потому что в нём много поправок,
04:26
and the legislativeзаконодательные processesпроцессы can be uglyуродливый.
90
254052
5231
а законодательные процедуры
могут быть неприглядными.
04:31
(ApplauseАплодисменты)
91
259307
1630
(Аплодисменты)
04:32
SSSS: So comingприход back a little bitнемного,
92
260961
1837
СС: Возвращаясь немного назад, скажу,
04:34
our ultimateокончательный goalЦель, ratherскорее,
is to captureзахватить theirих mannerismsманерность
93
262822
3191
что наша конечная цель —
скопировать манеры людей,
04:38
or the uniqueуникальный way eachкаждый
of these people talksпереговоры and smilesулыбки.
94
266037
3045
то есть уникальность их мимики
во время разговора и улыбки.
04:41
So to do that, can we
actuallyна самом деле teachучат the computerкомпьютер
95
269106
2313
Чтобы это сделать, можем ли мы
фактически научить компьютер
04:43
to imitateподражать the way someoneкто то talksпереговоры
96
271443
2222
имитировать манеру речи,
04:45
by only showingпоказ it
videoвидео footageметраж of the personчеловек?
97
273689
2420
только показав ему видеозапись человека?
04:48
And what I did exactlyв точку was,
I let a computerкомпьютер watch
98
276898
2577
И я сделал вот что — я дал компьютеру
04:51
14 hoursчасов of pureчистый BarackБарак ObamaОбама
givingдающий addressesадреса.
99
279499
3277
посмотреть 14 часов записей
речей Барака Обамы.
04:55
And here'sвот what we can produceпроизводить
givenданный only his audioаудио.
100
283443
3516
И вот что у нас получилось,
когда мы использовали только аудио.
04:58
(Videoвидео) BOBO: The resultsРезультаты are clearЧисто.
101
286983
1777
(Видео) БО: Результаты очевидны.
05:00
America'sАмерика businessesбизнес have createdсозданный
14.5 millionмиллиона newновый jobsработы
102
288784
4349
Предприятия Америки создали
14,5 миллиона новых рабочих мест
05:05
over 75 straightПрямо monthsмесяцы.
103
293157
2774
за последние шесть с небольшим лет.
05:07
SSSS: So what's beingявляющийся synthesizedсинтезированный here
is only the mouthрот regionобласть,
104
295955
2905
СС: Здесь синтезируется
только область рта,
и вот как мы это делаем.
05:10
and here'sвот how we do it.
105
298884
1540
05:12
Our pipelineтрубопровод usesиспользования a neuralнервный networkсеть
106
300764
1826
Наше устройство использует нейронную сеть
05:14
to convertконвертировать and inputвход audioаудио
into these mouthрот pointsточки.
107
302614
2936
для преобразования и ввода
звука в эти точки рта.
05:18
(Videoвидео) BOBO: We get it throughчерез our jobработа
or throughчерез Medicareстрахование здоровья по старости or Medicaidфедеральная система медицинской помощи неимущим.
108
306547
4225
(Видео) БО: Мы получаем его на работе,
через Medicare или через Medicaid.
05:22
SSSS: Then we synthesizeсинтезировать the textureтекстура,
enhanceусилить detailsДетали and teethзубы,
109
310796
3420
СС: Затем мы синтезируем текстуру,
добавляем чёткости деталям, зубам
05:26
and blendсмесь it into the headглава
and backgroundзадний план from a sourceисточник videoвидео.
110
314240
3074
и накладываем их на изображение
головы и фона из исходного видео.
05:29
(Videoвидео) BOBO: Womenженщины can get freeсвободно checkupsмедосмотры,
111
317338
1905
(Видео) БО: Женщины могут пройти
бесплатное обследование,
05:31
and you can't get chargedзаряженный more
just for beingявляющийся a womanженщина.
112
319267
2968
и вы не обязаны переплачивать
лишь за то, что вы женщина.
Молодые люди могут воспользоваться планом
родителей, пока им не исполнится 26 лет.
05:34
Youngмолодой people can stayоставаться
on a parent'sродители planплан untilдо they turnочередь 26.
113
322973
3306
05:39
SSSS: I think these resultsРезультаты
seemказаться very realisticреалистический and intriguingинтригующий,
114
327267
2952
СС: Эти результаты кажутся очень
реалистичными и интригующими,
05:42
but at the sameодна и та же time
frighteningпугающий, even to me.
115
330243
3173
но в то же время пугающими даже меня.
05:45
Our goalЦель was to buildстроить an accurateточный modelмодель
of a personчеловек, not to misrepresentискажать them.
116
333440
4015
Нашей целью было создать
точную модель человека, а не исказить его.
Но больше всего меня беспокоит возможность
злоупотребления этой технологией.
05:49
But one thing that concernsпроблемы me
is its potentialпотенциал for misuseзлоупотребление.
117
337956
3111
05:53
People have been thinkingмышление
about this problemпроблема for a long time,
118
341958
2971
Люди уже давно пытаются
решить эту проблему,
05:56
sinceпоскольку the daysдней when PhotoshopPhotoshop
first hitудар the marketрынок.
119
344953
2381
ещё со времён, когда на рынке
впервые появился Photoshop.
05:59
As a researcherИсследователь, I'm alsoтакже workingза работой
on countermeasureконтрмера technologyтехнологии,
120
347862
3801
Как исследователь, я также работаю
над технологией противодействия
06:03
and I'm partчасть of an ongoingпостоянный
effortусилие at AIискусственный интеллект FoundationФонд,
121
351687
2942
и вхожу в команду «Фонд ИИ»,
06:06
whichкоторый usesиспользования a combinationсочетание
of machineмашина learningобучение and humanчеловек moderatorsМодераторы
122
354653
3397
который использует комбинацию
машинного обучения и человека
06:10
to detectобнаружить fakeне настоящие imagesизображений and videosвидео,
123
358074
2144
для обнаружения поддельных фото и видео,
06:12
fightingборьба againstпротив my ownсвоя work.
124
360242
1514
то есть борюсь со своей же работой.
Один из инструментов, который мы планируем
выпустить, — «Защитник реальности».
06:14
And one of the toolsинструменты we planплан to releaseвыпуск
is calledназывается Realityреальность DefenderЗащитник,
125
362675
3190
06:17
whichкоторый is a web-browserвеб браузер plug-inвставной
that can flagфлаг potentiallyпотенциально fakeне настоящие contentсодержание
126
365889
4039
Это плагин для браузера,
способный автоматически распознавать
06:21
automaticallyавтоматически, right in the browserбраузер.
127
369952
2533
потенциально поддельный контент
прямо в самом браузере.
06:24
(ApplauseАплодисменты)
128
372509
4228
(Аплодисменты)
06:28
DespiteНесмотря all this, thoughхоть,
129
376761
1453
Несмотря на всё это,
06:30
fakeне настоящие videosвидео could do a lot of damageнаносить ущерб,
130
378238
1840
поддельное видео может причинить вред
06:32
even before anyoneкто угодно has a chanceшанс to verifyпроверить,
131
380102
3294
ещё до того, как у кого-то
появится шанс его проверить,
06:35
so it's very importantважный
that we make everyoneвсе awareзнать
132
383420
2722
поэтому очень важно предупредить каждого
06:38
of what's currentlyВ данный момент possibleвозможное
133
386166
2007
о современных возможностях,
06:40
so we can have the right assumptionпредположение
and be criticalкритический about what we see.
134
388197
3369
чтобы составить правильное представление
и критично относиться к тому, что видим.
06:44
There's still a long way to go before
we can fullyв полной мере modelмодель individualиндивидуальный people
135
392423
5007
Нам ещё далеко до полного
моделирования конкретных людей
06:49
and before we can ensureобеспечивать
the safetyбезопасность of this technologyтехнологии.
136
397454
2786
и до обеспечения
безопасности этой технологии.
06:53
But I'm excitedв восторге and hopefulмногообещающий,
137
401097
1587
Но я воодушевлён и полон надежды,
06:54
because if we use it right and carefullyвнимательно,
138
402708
3539
ведь, если мы будем пользоваться
этим инструментом правильно и осторожно,
06:58
this toolинструмент can allowпозволять any individual'sиндивидуал
positiveположительный impactвлияние on the worldМир
139
406271
4309
он позволит любому человеку
положительно повлиять на наш мир
07:02
to be massivelyмассивно scaledмасштабируется
140
410604
2190
в огромных масштабах
07:04
and really help shapeформа our futureбудущее
the way we want it to be.
141
412818
2742
и помочь сделать наше будущее
таким, каким мы хотим.
07:07
Thank you.
142
415584
1151
Спасибо.
07:08
(ApplauseАплодисменты)
143
416759
5090
(Аплодисменты)
Translated by Alena Chernykh
Reviewed by Polina Nikitina

▲Back to top

ABOUT THE SPEAKER
Supasorn Suwajanakorn - Computer scientist
Supasorn Suwajanakorn works on ways to reconstruct, preserve and reanimate anyone -- just from their existing photos and videos.

Why you should listen

Can we create a digital avatar that looks, acts and talks just like our sweet grandma? This question has inspired Supasorn Suwajanakorn, a recent PhD graduate from the University of Washington, to spend years developing new tools to make it a reality. He has developed a set of algorithms that can build a moving 3D face model of anyone from just photos, which was awarded the Innovation of the Year in 2016. He then introduced the first system that can replicate a person's speech and produce a realistic CG-animation by only analyzing their existing video footage -- all without ever bringing in the person to a Hollywood capture studio.

Suwajanakorn is working in the field of machine learning and computer vision. His goal is to bring vision algorithms out of the lab and make them work in the wild.

More profile about the speaker
Supasorn Suwajanakorn | Speaker | TED.com