ABOUT THE SPEAKER

Supasorn Suwajanakorn - Computer scientist
Supasorn Suwajanakorn works on ways to reconstruct, preserve and reanimate anyone -- just from their existing photos and videos.

Why you should listen

Can we create a digital avatar that looks, acts and talks just like our sweet grandma? This question has inspired Supasorn Suwajanakorn, a recent PhD graduate from the University of Washington, to spend years developing new tools to make it a reality. He has developed a set of algorithms that can build a moving 3D face model of anyone from just photos, which was awarded the Innovation of the Year in 2016. He then introduced the first system that can replicate a person's speech and produce a realistic CG-animation by only analyzing their existing video footage -- all without ever bringing in the person to a Hollywood capture studio.

Suwajanakorn is working in the field of machine learning and computer vision. His goal is to bring vision algorithms out of the lab and make them work in the wild.

More profile about the speaker
Supasorn Suwajanakorn | Speaker | TED.com

TED2018

Supasorn Suwajanakorn: Fake videos of real people -- and how to spot them

Супасорн Суваджанакорн: Поддельные видео реальных людей — как их распознать

Filmed: 2018-04-10

Readability: 4.6

1,453,308 views

Умеете ли вы распознавать поддельные видео, на которых известные люди говорят то, что в реальной жизни никогда не говорили? Посмотрите, как они создаются, в выступлении и демонстрационном видео Супасорна Суваджанакорна. Учёный в области компьютерных наук показывает, как, будучи студентом старших курсов, он использовал ИИ и 3D-моделирование для создания фотореалистичных поддельных видеороликов людей, синхронизируя их с аудио. Узнайте, какие этические последствия и творческие возможности есть у этой технологии, а также о попытках борьбы с её неправильным использованием.

Supasorn Suwajanakorn - Computer scientist
Supasorn Suwajanakorn works on ways to reconstruct, preserve and reanimate anyone -- just from their existing photos and videos. Full bio

Double-click the English transcript below to play the video.

00:12

Look at these imagesизображений.

0

876

1151

Взгляните на изображения.

00:14

Now, tell me whichкоторый ObamaОбама here is realреальный.

1

2051

2635

А теперь скажите,
на котором из них настоящий Обама.

00:16

(Videoвидео) BarackБарак ObamaОбама: To help familiesсемьи
refinanceрефинансировать theirих homesдома,

2

4710

2861

(Видео) Барак Обама: Помочь семьям
рефинансировать жильё,

00:19

to investвкладывать деньги in things
like high-techвысокие технологии manufacturingпроизводство,

3

7595

2647

инвестировать
в высокотехнологичное производство,

00:22

cleanчистый energyэнергия

4

10266

1159

экологичную энергию

00:23

and the infrastructureинфраструктура
that createsсоздает good newновый jobsработы.

5

11449

2779

и инфраструктуру, которая
создаёт новые рабочие места.

Супасорн Суваджанакорн: Кто-нибудь знает?

00:26

SupasornSupasorn SuwajanakornSuwajanakorn: AnyoneКто угодно?

6

14647

1484

00:28

The answerответ is noneникто of them.

7

16155

1874

Правильный ответ: ни на каком.

00:30

(LaughterСмех)

8

18053

1114

(Смех)

00:31

NoneНикто of these is actuallyна самом деле realреальный.

9

19191

1786

На самом деле все они поддельные.

00:33

So let me tell you how we got here.

10

21001

1840

Я расскажу вам, как мы это сделали.

00:35

My inspirationвдохновение for this work

11

23940

1578

На это меня вдохновил проект,

00:37

was a projectпроект meantимел ввиду to preserveсохранять our last
chanceшанс for learningобучение about the Holocaustистребление

12

25542

5411

предоставляющий нам последний шанс
узнать правду о Холокосте

00:42

from the survivorsвыжившие.

13

30977

1768

от оставшихся в живых.

00:44

It's calledназывается Newновый DimensionsГабаритные размеры in TestimonyПоказания,

14

32769

2627

Он называется «Новые измерения
в свидетельских показаниях»

00:47

and it allowsпозволяет you to have
interactiveинтерактивный conversationsразговоры

15

35420

3126

и позволяет участвовать
в интерактивном диалоге

00:50

with a hologramголограмма
of a realреальный Holocaustистребление survivorуцелевший.

16

38570

2556

с голограммами выживших жертв Холокоста.

00:53

(Videoвидео) Man: How did you
surviveуцелеть the Holocaustистребление?

17

41793

1966

(Видео) Мужчина: Как вы
выжили во время Холокоста?

00:55

(Videoвидео) Hologramголограмма: How did I surviveуцелеть?

18

43783

1668

(Видео) Голограмма: Как я выжил?

00:57

I survivedпереживший,

19

45912

1807

Я думаю,

01:00

I believe,

20

48419

1527

что я выжил,

01:01

because providenceпровидение watchedсмотрели over me.

21

49970

3023

потому что так было угодно Богу.

01:05

SSSS: TurnsПовороты out these answersответы
were prerecordedзаписанная in a studioстудия.

22

53573

3454

СС: Оказывается, эти ответы
были записаны в студии.

01:09

YetВсе же the effectэффект is astoundingпоразительный.

23

57051

2452

И всё же эффект поразительный.

01:11

You feel so connectedсвязанный to his storyистория
and to him as a personчеловек.

24

59527

3619

Чувствуется связь с историей его жизни
и лично с самим человеком.

01:16

I think there's something specialособый
about humanчеловек interactionвзаимодействие

25

64011

3301

Есть нечто особенное в общении людей,

01:19

that makesмарки it much more profoundглубокий

26

67336

2757

что делает его более проникновенным

01:22

and personalличный

27

70117

2198

и личным,

01:24

than what booksкниги or lecturesлекции
or moviesкино could ever teachучат us.

28

72339

3485

чем любая информация из книг или фильмов.

01:28

So I saw this and beganначал to wonderзадаваться вопросом,

29

76267

2425

Увидев это, я задался вопросом:

01:30

can we createСоздайте a modelмодель
like this for anyoneкто угодно?

30

78716

2810

возможно ли создать подобную
модель любого человека?

01:33

A modelмодель that looksвыглядит, talksпереговоры
and actsакты just like them?

31

81550

2975

Модель, которая выглядит, говорит,
ведёт себя как реальный человек?

01:37

So I setзадавать out to see if this could be doneсделанный

32

85573

2007

Я решил выяснить, возможно ли это,

01:39

and eventuallyв итоге cameпришел up with a newновый solutionрешение

33

87604

2310

и в итоге придумал новую методику,

01:41

that can buildстроить a modelмодель of a personчеловек
usingс помощью nothing but these:

34

89938

3220

которая позволяет создать модель человека,

01:45

existingсуществующий photosфото and videosвидео of a personчеловек.

35

93747

2214

используя лишь
его существующие фото и видео.

01:48

If you can leverageлевередж
this kindсвоего рода of passiveпассивный informationИнформация,

36

96701

2617

Если можно воспользоваться
данной пассивной информацией,

01:51

just photosфото and videoвидео that are out there,

37

99342

2007

только лишь имеющимися фото и видео,

01:53

that's the keyключ to scalingпересчет to anyoneкто угодно.

38

101373

2056

то это ляжет в основу
моделирования любого человека.

01:56

By the way, here'sвот RichardРичард FeynmanФейнман,

39

104119

1777

Кстати, это Ричард Фейнман:

01:57

who in additionприбавление to beingявляющийся
a NobelНобель Prizeприз winnerпобедитель in physicsфизика

40

105920

3413

будучи лауреатом
Нобелевской премии по физике,

02:01

was alsoтакже knownизвестен as a legendaryлегендарный teacherучитель.

41

109357

2453

он также известен как выдающийся педагог.

Было бы здорово,
если бы мы смогли воскресить его,

02:05

Wouldn'tне было бы it be great
if we could bringприносить him back

42

113080

2198

02:07

to give his lecturesлекции
and inspireвнушать millionsмиллионы of kidsДети,

43

115302

3265

чтобы он прочёл свои лекции
и вдохновил бы миллионы детей.

02:10

perhapsвозможно not just in Englishанглийский
but in any languageязык?

44

118591

2992

Возможно, не только на английском языке,
но и на любом другом?

02:14

Or if you could askпросить our grandparentsдедушка и бабушка
for adviceсовет and hearзаслушивать those comfortingутешительный wordsслова

45

122441

4602

Или если можно было бы посоветоваться
с покойными бабушками и дедушками

02:19

even if they're no longerдольше with us?

46

127067

1770

и услышать их утешительные слова?

02:21

Or maybe usingс помощью this toolинструмент,
bookкнига authorsавторы, aliveв живых or not,

47

129683

3396

А может быть, при помощи этого устройства
авторы книг, живые или нет,

02:25

could readчитать aloudвслух all of theirих booksкниги
for anyoneкто угодно interestedзаинтересованный.

48

133103

2937

смогли бы прочесть вслух
свои произведения любому желающему?

02:29

The creativeтворческий possibilitiesвозможности
here are endlessбесконечный,

49

137199

2437

Возможности творчества здесь безграничны,

02:31

and to me, that's very excitingзахватывающе.

50

139660

1713

и это меня завораживает.

02:34

And here'sвот how it's workingза работой so farдалеко.

51

142595

2002

Вот как это работает сейчас.

02:36

First, we introduceвводить a newновый techniqueтехника

52

144621

1667

Во-первых, мы используем новую технику,

02:38

that can reconstructреконструировать a high-detailedвысокий подробно
3D faceлицо modelмодель from any imageобраз

53

146312

4572

которая позволяет воссоздать сверхточную
3D-модель лица с любого изображения

02:42

withoutбез ever 3D-scanningD-сканирование the personчеловек.

54

150908

2119

без помощи 3D-сканирования человека.

02:45

And here'sвот the sameодна и та же outputвывод modelмодель
from differentдругой viewsПросмотры.

55

153890

2642

Вот та же самая готовая модель
с разных точек обзора.

02:49

This alsoтакже worksработает on videosвидео,

56

157969

1502

Это работает и с видео:

02:51

by runningБег the sameодна и та же algorithmалгоритм
on eachкаждый videoвидео frameРамка

57

159495

2852

мы запускаем этот же алгоритм
на каждом видеокадре

02:54

and generatingпорождающий a movingперемещение 3D modelмодель.

58

162371

2222

и создаём движущуюся 3D-модель.

02:57

And here'sвот the sameодна и та же
outputвывод modelмодель from differentдругой anglesуглы.

59

165538

2772

А вот готовая модель с разных ракурсов.

03:01

It turnsвитки out this problemпроблема
is very challengingиспытывающий,

60

169933

2534

На самом деле это довольно сложно,

03:04

but the keyключ trickтрюк
is that we are going to analyzeанализировать

61

172491

2525

но главная хитрость в том,
что мы заранее анализируем

03:07

a largeбольшой photoФото collectionколлекция
of the personчеловек beforehandзаранее.

62

175040

2966

большу́ю коллекцию фотографий
конкретного человека.

03:10

For GeorgeДжордж W. Bushбуш,
we can just searchпоиск on GoogleGoogle,

63

178650

2539

Фотографии Джорджа Буша-младшего
можно просто погуглить

03:14

and from that, we are ableв состоянии
to buildстроить an averageв среднем modelмодель,

64

182309

2499

и на их основе создать усреднённую модель,

03:16

an iterativeитеративный, refinedутонченный modelмодель
to recoverоправляться the expressionвыражение

65

184832

3111

итеративную, высокоточную модель,
чтобы воссоздать выражение лица

03:19

in fine detailsДетали,
like creasesсгибы and wrinklesморщины.

66

187967

2336

по таким мелким деталям,
как складки и морщины.

03:23

What's fascinatingочаровательный about this

67

191326

1403

Самое увлекательное в том,

03:24

is that the photoФото collectionколлекция
can come from your typicalтипичный photosфото.

68

192753

3423

что коллекция фотографий составляется
из ваших обычных фото.

03:28

It doesn't really matterдело
what expressionвыражение you're makingизготовление

69

196200

2603

Не имеет особого значения,
какое выражение лица у вас было

03:30

or where you tookвзял those photosфото.

70

198827

1885

и где были сделаны эти фотографии.

03:32

What mattersвопросы is
that there are a lot of them.

71

200736

2400

Важно то, что их много.

03:35

And we are still missingотсутствует colorцвет here,

72

203160

1736

Пока мы не можем сделать их цветными,

03:36

so nextследующий, we developразвивать
a newновый blendingсмешивание techniqueтехника

73

204920

2348

поэтому следующий шаг —
разработать новую технику смешивания,

03:39

that improvesулучшает uponна
a singleОдин averagingусреднение methodметод

74

207292

2836

которая усовершенствует основной алгоритм

03:42

and producesпроизводит sharpострый
facialлицевой texturesтекстуры and colorsцвета.

75

210152

2818

для создания чёткой текстуры лица и цвета.

03:45

And this can be doneсделанный for any expressionвыражение.

76

213779

2771

Это станет возможным для любой мимики.

03:49

Now we have a controlконтроль
of a modelмодель of a personчеловек,

77

217485

2499

Итак, мы добились контроля
над моделью человека,

03:52

and the way it's controlledконтролируемый now
is by a sequenceпоследовательность of staticстатический photosфото.

78

220008

3795

который достигается последовательностью
статических фотографий.

03:55

Noticeуведомление how the wrinklesморщины come and go,
dependingв зависимости on the expressionвыражение.

79

223827

3126

Заметьте, как появляются и исчезают
морщинки в зависимости от выражения лица.

Чтобы управлять моделью,
мы также можем использовать видео.

04:00

We can alsoтакже use a videoвидео
to driveводить машину the modelмодель.

80

228109

2746

04:02

(Videoвидео) DanielДаниил CraigCraig: Right, but somehowкак-то,

81

230879

2593

(Видео) Дэниел Крейг:
Верно, но каким-то образом

04:05

we'veмы в managedудалось to attractпривлекать
some more amazingудивительно people.

82

233496

3771

нам удалось привлечь
ещё несколько удивительных людей.

СС: А вот ещё одно забавное демо-видео.

04:10

SSSS: And here'sвот anotherдругой funвесело demoдемонстрация.

83

238021

1642

04:11

So what you see here
are controllableуправляемый modelsмодели

84

239687

2246

То, что вы здесь видите, —
управляемые модели людей,

04:13

of people I builtпостроен
from theirих internetинтернет photosфото.

85

241957

2444

которые я создал на основе
их фото из интернета.

04:16

Now, if you transferперевод
the motionдвижение from the inputвход videoвидео,

86

244425

2904

Если перенести движение
от первоначального видео,

04:19

we can actuallyна самом деле driveводить машину the entireвсе partyвечеринка.

87

247353

2152

фактически мы можем
управлять всем процессом.

04:21

GeorgeДжордж W. Bushбуш:
It's a difficultсложно billзаконопроект to passпроходить,

88

249529

2172

Джордж Буш-младший:
Это сложный законопроект,

04:23

because there's a lot of movingперемещение partsчасти,

89

251725

2303

потому что в нём много поправок,

04:26

and the legislativeзаконодательные processesпроцессы can be uglyуродливый.

90

254052

5231

а законодательные процедуры
могут быть неприглядными.

04:31

(ApplauseАплодисменты)

91

259307

1630

(Аплодисменты)

04:32

SSSS: So comingприход back a little bitнемного,

92

260961

1837

СС: Возвращаясь немного назад, скажу,

04:34

our ultimateокончательный goalЦель, ratherскорее,
is to captureзахватить theirих mannerismsманерность

93

262822

3191

что наша конечная цель —
скопировать манеры людей,

04:38

or the uniqueуникальный way eachкаждый
of these people talksпереговоры and smilesулыбки.

94

266037

3045

то есть уникальность их мимики
во время разговора и улыбки.

04:41

So to do that, can we
actuallyна самом деле teachучат the computerкомпьютер

95

269106

2313

Чтобы это сделать, можем ли мы
фактически научить компьютер

04:43

to imitateподражать the way someoneкто то talksпереговоры

96

271443

2222

имитировать манеру речи,

04:45

by only showingпоказ it
videoвидео footageметраж of the personчеловек?

97

273689

2420

только показав ему видеозапись человека?

04:48

And what I did exactlyв точку was,
I let a computerкомпьютер watch

98

276898

2577

И я сделал вот что — я дал компьютеру

04:51

14 hoursчасов of pureчистый BarackБарак ObamaОбама
givingдающий addressesадреса.

99

279499

3277

посмотреть 14 часов записей
речей Барака Обамы.

04:55

And here'sвот what we can produceпроизводить
givenданный only his audioаудио.

100

283443

3516

И вот что у нас получилось,
когда мы использовали только аудио.

04:58

(Videoвидео) BOBO: The resultsРезультаты are clearЧисто.

101

286983

1777

(Видео) БО: Результаты очевидны.

05:00

America'sАмерика businessesбизнес have createdсозданный
14.5 millionмиллиона newновый jobsработы

102

288784

4349

Предприятия Америки создали
14,5 миллиона новых рабочих мест

05:05

over 75 straightПрямо monthsмесяцы.

103

293157

2774

за последние шесть с небольшим лет.

05:07

SSSS: So what's beingявляющийся synthesizedсинтезированный here
is only the mouthрот regionобласть,

104

295955

2905

СС: Здесь синтезируется
только область рта,

и вот как мы это делаем.

05:10

and here'sвот how we do it.

105

298884

1540

05:12

Our pipelineтрубопровод usesиспользования a neuralнервный networkсеть

106

300764

1826

Наше устройство использует нейронную сеть

05:14

to convertконвертировать and inputвход audioаудио
into these mouthрот pointsточки.

107

302614

2936

для преобразования и ввода
звука в эти точки рта.

05:18

(Videoвидео) BOBO: We get it throughчерез our jobработа
or throughчерез Medicareстрахование здоровья по старости or Medicaidфедеральная система медицинской помощи неимущим.

108

306547

4225

(Видео) БО: Мы получаем его на работе,
через Medicare или через Medicaid.

05:22

SSSS: Then we synthesizeсинтезировать the textureтекстура,
enhanceусилить detailsДетали and teethзубы,

109

310796

3420

СС: Затем мы синтезируем текстуру,
добавляем чёткости деталям, зубам

05:26

and blendсмесь it into the headглава
and backgroundзадний план from a sourceисточник videoвидео.

110

314240

3074

и накладываем их на изображение
головы и фона из исходного видео.

05:29

(Videoвидео) BOBO: Womenженщины can get freeсвободно checkupsмедосмотры,

111

317338

1905

(Видео) БО: Женщины могут пройти
бесплатное обследование,

05:31

and you can't get chargedзаряженный more
just for beingявляющийся a womanженщина.

112

319267

2968

и вы не обязаны переплачивать
лишь за то, что вы женщина.

Молодые люди могут воспользоваться планом
родителей, пока им не исполнится 26 лет.

05:34

Youngмолодой people can stayоставаться
on a parent'sродители planплан untilдо they turnочередь 26.

113

322973

3306

05:39

SSSS: I think these resultsРезультаты
seemказаться very realisticреалистический and intriguingинтригующий,

114

327267

2952

СС: Эти результаты кажутся очень
реалистичными и интригующими,

05:42

but at the sameодна и та же time
frighteningпугающий, even to me.

115

330243

3173

но в то же время пугающими даже меня.

05:45

Our goalЦель was to buildстроить an accurateточный modelмодель
of a personчеловек, not to misrepresentискажать them.

116

333440

4015

Нашей целью было создать
точную модель человека, а не исказить его.

Но больше всего меня беспокоит возможность
злоупотребления этой технологией.

05:49

But one thing that concernsпроблемы me
is its potentialпотенциал for misuseзлоупотребление.

117

337956

3111

05:53

People have been thinkingмышление
about this problemпроблема for a long time,

118

341958

2971

Люди уже давно пытаются
решить эту проблему,

05:56

sinceпоскольку the daysдней when PhotoshopPhotoshop
first hitудар the marketрынок.

119

344953

2381

ещё со времён, когда на рынке
впервые появился Photoshop.

05:59

As a researcherИсследователь, I'm alsoтакже workingза работой
on countermeasureконтрмера technologyтехнологии,

120

347862

3801

Как исследователь, я также работаю
над технологией противодействия

06:03

and I'm partчасть of an ongoingпостоянный
effortусилие at AIискусственный интеллект FoundationФонд,

121

351687

2942

и вхожу в команду «Фонд ИИ»,

06:06

whichкоторый usesиспользования a combinationсочетание
of machineмашина learningобучение and humanчеловек moderatorsМодераторы

122

354653

3397

который использует комбинацию
машинного обучения и человека

06:10

to detectобнаружить fakeне настоящие imagesизображений and videosвидео,

123

358074

2144

для обнаружения поддельных фото и видео,

06:12

fightingборьба againstпротив my ownсвоя work.

124

360242

1514

то есть борюсь со своей же работой.

Один из инструментов, который мы планируем
выпустить, — «Защитник реальности».

06:14

And one of the toolsинструменты we planплан to releaseвыпуск
is calledназывается Realityреальность DefenderЗащитник,

125

362675

3190

06:17

whichкоторый is a web-browserвеб браузер plug-inвставной
that can flagфлаг potentiallyпотенциально fakeне настоящие contentсодержание

126

365889

4039

Это плагин для браузера,
способный автоматически распознавать

06:21

automaticallyавтоматически, right in the browserбраузер.

127

369952

2533

потенциально поддельный контент
прямо в самом браузере.

06:24

(ApplauseАплодисменты)

128

372509

4228

(Аплодисменты)

06:28

DespiteНесмотря all this, thoughхоть,

129

376761

1453

Несмотря на всё это,

06:30

fakeне настоящие videosвидео could do a lot of damageнаносить ущерб,

130

378238

1840

поддельное видео может причинить вред

06:32

even before anyoneкто угодно has a chanceшанс to verifyпроверить,

131

380102

3294

ещё до того, как у кого-то
появится шанс его проверить,

06:35

so it's very importantважный
that we make everyoneвсе awareзнать

132

383420

2722

поэтому очень важно предупредить каждого

06:38

of what's currentlyВ данный момент possibleвозможное

133

386166

2007

о современных возможностях,

06:40

so we can have the right assumptionпредположение
and be criticalкритический about what we see.

134

388197

3369

чтобы составить правильное представление
и критично относиться к тому, что видим.

06:44

There's still a long way to go before
we can fullyв полной мере modelмодель individualиндивидуальный people

135

392423

5007

Нам ещё далеко до полного
моделирования конкретных людей

06:49

and before we can ensureобеспечивать
the safetyбезопасность of this technologyтехнологии.

136

397454

2786

и до обеспечения
безопасности этой технологии.

06:53

But I'm excitedв восторге and hopefulмногообещающий,

137

401097

1587

Но я воодушевлён и полон надежды,

06:54

because if we use it right and carefullyвнимательно,

138

402708

3539

ведь, если мы будем пользоваться
этим инструментом правильно и осторожно,

06:58

this toolинструмент can allowпозволять any individual'sиндивидуал
positiveположительный impactвлияние on the worldМир

139

406271

4309

он позволит любому человеку
положительно повлиять на наш мир

07:02

to be massivelyмассивно scaledмасштабируется

140

410604

2190

в огромных масштабах

07:04

and really help shapeформа our futureбудущее
the way we want it to be.

141

412818

2742

и помочь сделать наше будущее
таким, каким мы хотим.

07:07

Thank you.

142

415584

1151

Спасибо.

07:08

(ApplauseАплодисменты)

143

416759

5090

(Аплодисменты)

Translated by Alena Chernykh
Reviewed by Polina Nikitina

ABOUT THE SPEAKER

Supasorn Suwajanakorn - Computer scientist
Supasorn Suwajanakorn works on ways to reconstruct, preserve and reanimate anyone -- just from their existing photos and videos.

Why you should listen

Can we create a digital avatar that looks, acts and talks just like our sweet grandma? This question has inspired Supasorn Suwajanakorn, a recent PhD graduate from the University of Washington, to spend years developing new tools to make it a reality. He has developed a set of algorithms that can build a moving 3D face model of anyone from just photos, which was awarded the Innovation of the Year in 2016. He then introduced the first system that can replicate a person's speech and produce a realistic CG-animation by only analyzing their existing video footage -- all without ever bringing in the person to a Hollywood capture studio.

Suwajanakorn is working in the field of machine learning and computer vision. His goal is to bring vision algorithms out of the lab and make them work in the wild.

More profile about the speaker
Supasorn Suwajanakorn | Speaker | TED.com

THE ORIGINAL VIDEO ON TED.COM

Супасорн Суваджанакорн: Поддельные видео реальных людей — как их распознать | TED Talk | TED.com