ABOUT THE SPEAKER
Luis von Ahn - Computer scientist
Luis von Ahn builds systems that combine humans and computers to solve large-scale problems that neither can solve alone.

Why you should listen

Louis von Ahn is an associate professor of Computer Science at Carnegie Mellon University, and he's at the forefront of the crowdsourcing craze. His work takes advantage of the evergrowing Web-connected population to acheive collaboration in unprecedented numbers. His projects aim to leverage the crowd for human good. His company reCAPTCHA, sold to Google in 2009, digitizes human knowledge (books), one word at a time. His new project is Duolingo, which aims to get 100 million people translating the Web in every major language.

More profile about the speaker
Luis von Ahn | Speaker | TED.com
TEDxCMU

Luis von Ahn: Massive-scale online collaboration

` 루이스 폰 안: 대규모 온라인 협업

Filmed:
1,740,008 views

루이스 폰 안(Luis Von Ahn)은 사람들이 온라인상에서 입력한 답들을 모아서 종이책을 디지털화하는데 사용될 수 있도록 캡차(CAPTCHA, 웹사이트 등록인증 서비스)의 목적을 재설정 한 후, 그는 인터넷 시티즌의 이와같은 작은 기여를 어떤 다른 대의를 위해 사용할 수 있을지 생각해 봅니다. 루이스는 카네기멜론 대학에서 열린 TED 포럼에서 새로운 언어를 배우면서 인터넷상의 수많은 웹페이지를 무료로 빠르게 번역 할 수 있게 할 듀오링고라는 그의 대망에 찬 프로젝트에 대해 말합니다.
- Computer scientist
Luis von Ahn builds systems that combine humans and computers to solve large-scale problems that neither can solve alone. Full bio

Double-click the English transcript below to play the video.

00:15
How many많은 of you had to fill가득 따르다 out some sort종류 of web편물 form형태
0
0
2000
여러분 중에 몇 명이나 이렇게 구불구불한 문자열을 읽어서
00:17
where you've been asked물었다 to read독서 a distorted비뚤어진 sequence순서 of characters문자들 like this?
1
2000
2000
웹페이지의 입력양식을 채워 보셨나요?
00:19
How many많은 of you found녹이다 it really, really annoying성가신?
2
4000
2000
이것이 정말 짜증난다고 생각하는 사람은 몇 명 정도 되나요?
00:21
Okay, outstanding두드러진. So I invented발명 된 that.
3
6000
3000
그렇군요, 아주 많네요. 사실 그건 제가 발명했어요.
00:24
(Laughter웃음)
4
9000
2000
(웃음)
00:26
Or I was one of the people who did it.
5
11000
2000
그걸 발명한 사람들 중의 한 명이었죠.
00:28
That thing is called전화 한 a CAPTCHA보안 문자.
6
13000
2000
이런 것을 캡차(CAPTCHA)라고 하죠.
00:30
And the reason이유 it is there is to make sure you, the entity실재 filling충전재 out the form형태,
7
15000
2000
이것을 사용하는 이유는 양식을 입력하는 주체가
00:32
are actually사실은 a human인간의 and not some sort종류 of computer컴퓨터 program프로그램
8
17000
3000
수백만 개의 입력양식을 작성하는 컴퓨터 프로그램이 아니라
00:35
that was written to submit제출하다 the form형태 millions수백만 and millions수백만 of times타임스.
9
20000
2000
실제 사람이라는 것을 확인하기 위해서입니다.
00:37
The reason이유 it works공장 is because humans인간,
10
22000
2000
이런 방법이 효과가 있는 이유는
00:39
at least가장 작은 non-visually-impaired비 시각 장애인 humans인간,
11
24000
2000
우리는 시각장애가 없는 한
00:41
have no trouble수고 reading독서 these distorted비뚤어진 squiggly삐걱 거리다 characters문자들,
12
26000
2000
이렇게 왜곡된 문자를 읽는데 전혀 문제가 없기 때문이죠.
00:43
whereas이므로 computer컴퓨터 programs프로그램들 simply간단히 can't do it as well yet아직.
13
28000
3000
반면에 컴퓨터 프로그램은 아직 이런것을 잘 읽지 못합니다.
00:46
So for example, in the case케이스 of Ticketmaster티켓 마스터,
14
31000
2000
예를 들면, 티켓마스터 사이트에서, [역: 미국의 공연티켓 판매사]
00:48
the reason이유 you have to type유형 these distorted비뚤어진 characters문자들
15
33000
2000
여러분이 이런 구불구불한 문자들을 입력해야 하는 이유는,
00:50
is to prevent막다 scalpers스컬 퍼 from writing쓰기 a program프로그램
16
35000
2000
암표상들이 컴퓨터 프로그램으로 매번 두장씩
00:52
that can buy사다 millions수백만 of tickets티켓, two at a time.
17
37000
2000
수백만 장의 표를 사는것을 방지하기 위한 것이죠.
00:54
CAPTCHAs보안 문자 are used all over the Internet인터넷.
18
39000
2000
캡챠는 인터넷상의 다양한 서비스에 이용됩니다.
00:56
And since이후 they're used so often자주,
19
41000
2000
그런데 캡차가 그렇게 많이 사용되다 보니
00:58
a lot of times타임스 the precise정확한 sequence순서 of random무작위의 characters문자들 that is shown표시된 to the user사용자
20
43000
2000
유저의 화면에 나타나는 이런 랜덤 글자들은
01:00
is not so fortunate운 좋은.
21
45000
2000
어떤때는 히안한 단어를 만들기도 합니다.
01:02
So this is an example from the Yahoo야후 registration기재 page페이지.
22
47000
3000
그 일례로 이건 야후 서비스의 등록페이지입니다.
01:05
The random무작위의 characters문자들 that happened일어난 to be shown표시된 to the user사용자
23
50000
2000
사용자에게 무작위로 선택되어 나타났던 문자들이
01:07
were W, A, I, T, which어느, of course코스, spell주문 a word워드.
24
52000
3000
W, A, I, T이었지요. 즉, 기다리라는 단어가 나온거죠.
01:10
But the best베스트 part부품 is the message메시지
25
55000
3000
하지만 정말 재밌는 것은
01:13
that the Yahoo야후 help desk책상 got about 20 minutes의사록 later후에.
26
58000
3000
20분 후에 야후 고객센터에 접수된 메세지였지요.
01:16
Text본문: "Help! I've been waiting기다리는 for over 20 minutes의사록, and nothing happens일이."
27
61000
3000
메세지 : "도와주세요! 20분 기다렸는데 아무런 반응이 없습니다!"
01:19
(Laughter웃음)
28
64000
4000
(웃음)
01:23
This person사람 thought they needed필요한 to wait.
29
68000
2000
그 유저는 계속 기다려야한다고 생각했던 거죠.
01:25
This of course코스, is not as bad나쁜 as this poor가난한 person사람.
30
70000
3000
그래도 그건 이 캡차 보다는 낳죠.
01:28
(Laughter웃음)
31
73000
2000
(웃음)
01:30
CAPTCHA보안 문자 Project계획 is something that we did here at Carnegie카네기 Melllon멜론 over 10 years연령 ago...전에,
32
75000
3000
캡차는 여기 카네기멜론 대학에서 10년 전에 했던 프로젝트였는데
01:33
and it's been used everywhere어디에나.
33
78000
2000
지금은 누구나 다 사용하죠.
01:35
Let me now tell you about a project계획 that we did a few조금 years연령 later후에,
34
80000
2000
그 후 몇년 후에 우리가 한 프로젝트에 대해서 말씀드리겠습니다.
01:37
which어느 is sort종류 of the next다음 것 evolution진화 of CAPTCHA보안 문자.
35
82000
3000
그것은 개량형 캡차라고 말할 수 있는
01:40
This is a project계획 that we call reCAPTCHA리카 챠,
36
85000
2000
리캡차라는 프로젝트였는데
01:42
which어느 is something that we started시작한 here at Carnegie카네기 Mellon멜론,
37
87000
2000
카네기 멜론 대학에서 시작했었고,
01:44
then we turned돌린 it into a startup시작 company회사.
38
89000
2000
그후에는 신생회사가 되었는데
01:46
And then about a year and a half절반 ago...전에,
39
91000
2000
약 1년 반 전에
01:48
GoogleGoogle actually사실은 acquired획득 한 this company회사.
40
93000
2000
구글이 그 회사를 인수했죠.
01:50
So let me tell you what this project계획 started시작한.
41
95000
2000
이 프로젝트가 어떤 움직임을 시작했는지 말씀드리죠.
01:52
So this project계획 started시작한 from the following수행원 realization실현:
42
97000
3000
이 프로젝트는 다음과 같은 이유로 시작했습니다.
01:55
It turns회전 out that approximately대략 200 million백만 CAPTCHAs보안 문자
43
100000
2000
매일 약 2억 개의 캡차가
01:57
are typed타이핑 된 everyday매일 by people around the world세계.
44
102000
3000
전 세계적으로 입력되지요.
02:00
When I first heard들었던 this, I was quite아주 proud교만한 of myself자기.
45
105000
2000
제가 이사실을 처음 들었을 때 저는 매우 자랑스러웠지요.
02:02
I thought, look at the impact충격 that my research연구 has had.
46
107000
2000
"내 연구가 미친 영향력을 봐라!" 하며 좋아했어요.
02:04
But then I started시작한 feeling감각 bad나쁜.
47
109000
2000
하지만 저는 좀 미안한 생각이 들기 시작했습니다.
02:06
See here's여기에 the thing, each마다 time you type유형 a CAPTCHA보안 문자,
48
111000
2000
사람들이 캡차 문자열을 입력할 때마다
02:08
essentially본질적으로 you waste낭비 10 seconds of your time.
49
113000
3000
약 10초 정도의 시간을 낭비하게 됩니다.
02:11
And if you multiply곱하다 that by 200 million백만,
50
116000
2000
그 시간을 2억으로 곱하면
02:13
you get that humanity인류 as a whole완전한 is wasting낭비 about 500,000 hours시간 every...마다 day
51
118000
3000
우리는 전체적으로 이 짜증나는 문자열을 입력하기 위해
02:16
typing타자 these annoying성가신 CAPTCHAs보안 문자.
52
121000
2000
매일 50만 시간을 낭비하고 있다는 결론이 나옵니다.
02:18
So then I started시작한 feeling감각 bad나쁜.
53
123000
2000
그래서 좀 미안하다는 생각을 했어요.
02:20
(Laughter웃음)
54
125000
2000
(웃음)
02:22
And then I started시작한 thinking생각, well, of course코스, we can't just get rid구하다 of CAPTCHAs보안 문자,
55
127000
3000
그런데 웹페이지의 보안이 캡차에 의존하기 때문에
02:25
because the security보안 of the Web편물 sort종류 of depends의존하다 on them.
56
130000
2000
캡차를 그냥 버릴 수도 없지요
02:27
But then I started시작한 thinking생각, is there any way we can use this effort노력
57
132000
3000
저는 그래서 캡차를 입력하는 시간을 인류를 위해
02:30
for something that is good for humanity인류?
58
135000
2000
좋은 일을 하는데 쓸수 있을까 생각했죠.
02:32
So see, here's여기에 the thing.
59
137000
2000
자, 이런 생각을 해 보세요...
02:34
While you're typing타자 a CAPTCHA보안 문자, during...동안 those 10 seconds,
60
139000
2000
여러분이 10초 동안 캡차 문자열을 입력할 때
02:36
your brain is doing something amazing놀랄 만한.
61
141000
2000
여러분의 뇌는 매우 어려운 일을 하고 있죠.
02:38
Your brain is doing something that computers컴퓨터들 cannot~ 할 수 없다. yet아직 do.
62
143000
2000
컴퓨터는 아직 그런 일을 못합니다.
02:40
So can we get you to do useful유능한 work for those 10 seconds?
63
145000
3000
어떻게 하면 여러분이 그 10초 동안 어떤 유용한 일을
02:43
Another다른 way of putting퍼팅 it is,
64
148000
2000
할 수 있게 저희들이 도와드릴 수 있을까요? 다시 말하면,
02:45
is there some humongous엄청난 problem문제 that we cannot~ 할 수 없다. yet아직 get computers컴퓨터들 to solve풀다,
65
150000
2000
아직까지 컴퓨터가 풀지 못하는 어떤 거창한 문제를 찾아
02:47
yet아직 we can split스플릿 into tiny작은 10-second chunks덩어리
66
152000
3000
그것을 10초 단위의 작은 작업단위로 쪼개서
02:50
such이러한 that each마다 time somebody어떤 사람 solves해결하다 a CAPTCHA보안 문자
67
155000
2000
사람들이 캡차 질문에 답을 할때 마다 그 문제의
02:52
they solve풀다 a little bit비트 of this problem문제?
68
157000
2000
작은 부분을 해결하게 만드는 것이 가능할까요?
02:54
And the answer대답 to that is "yes," and this is what we're doing now.
69
159000
2000
그 질문에 대한 답은 "예" 이며 우리가 지금 하는 일이 바로 그겁니다.
02:56
So what you may할 수있다 not know is that nowadays현대 while you're typing타자 a CAPTCHA보안 문자,
70
161000
3000
여러분이 모르실지는 모르지만 요즘은 캡차 문자를 입력할 때
02:59
not only are you authenticating인증하는 yourself당신 자신 as a human인간의,
71
164000
2000
사람이 캡차 입력을 한다는 것을 증명할 뿐만이 아니라
03:01
but in addition부가 you're actually사실은 helping거들기 us to digitize디지털화하다 books서적.
72
166000
2000
저희들이 종이책을 디지털화하는 일을 실지로 도와줍니다.
03:03
So let me explain설명 how this works공장.
73
168000
2000
자, 그럼 제가 좀 더 자세히 설명드리겠습니다.
03:05
So there's a lot of projects프로젝트들 out there trying견딜 수 없는 to digitize디지털화하다 books서적.
74
170000
2000
책들을 디지털화하는 프로젝트는 많이 있습니다.
03:07
GoogleGoogle has one. The Internet인터넷 Archive아카이브 has one.
75
172000
3000
구글, 인터넷 아카이브, 아마존 그리고 지금은 킨들도
03:10
Amazon아마존, now with the Kindle빛나다, is trying견딜 수 없는 to digitize디지털화하다 books서적.
76
175000
2000
종이책을 디지털화 하려고 노력하고 있습니다.
03:12
Basically원래 the way this works공장
77
177000
2000
이런 작업은 주로
03:14
is you start스타트 with an old늙은 book도서.
78
179000
2000
오래된 책으로 부터 시작됩니다.
03:16
You've seen those things, right? Like a book도서?
79
181000
2000
그런것들 보셨죠? 책이라는 것 말이예요?
03:18
(Laughter웃음)
80
183000
2000
(웃음)
03:20
So you start스타트 with a book도서, and then you scan주사 it.
81
185000
2000
처음에 하는 일은 책을 스캔하는 것이죠.
03:22
Now scanning스캐닝 a book도서
82
187000
2000
책을 스캔하는것은
03:24
is like taking취득 a digital디지털 photograph사진 of every...마다 page페이지 of the book도서.
83
189000
2000
책의 모든 페이지를 디지털 사진기로 찍는것과 비슷합니다.
03:26
It gives주는 you an image영상 for every...마다 page페이지 of the book도서.
84
191000
2000
그렇게 각 페이지의 이미지를 포착해서
03:28
This is an image영상 with text본문 for every...마다 page페이지 of the book도서.
85
193000
2000
그 책에 담긴 텍스트의 모든 이미지를 얻는 거죠.
03:30
The next다음 것 step단계 in the process방법
86
195000
2000
다음 과정은 컴퓨터가
03:32
is that the computer컴퓨터 needs필요 to be able할 수 있는 to decipher풀다 all of the words in this image영상.
87
197000
3000
각 이미지에 있는 단어를 해독하는 것이지요.
03:35
That's using~을 사용하여 a technology과학 기술 called전화 한 OCROCR,
88
200000
2000
우리는 텍스트의 이미지를 읽으며
03:37
for optical광학 character캐릭터 recognition인식,
89
202000
2000
무슨 글이 써있는지 판독해 주는
03:39
which어느 takes a picture그림 of text본문
90
204000
2000
광학문자인식(OCR)이라는
03:41
and tries시도하다 to figure그림 out what text본문 is in there.
91
206000
2000
기술을 이용합니다.
03:43
Now the problem문제 is that OCROCR is not perfect완전한.
92
208000
2000
그런데 문제는 그 OCR 기술이 완벽하지 않습니다.
03:45
Especially특히 for older더 오래된 books서적
93
210000
2000
특히 잉크가 바래고, 페이지가 노랗게 변한
03:47
where the ink잉크 has faded시든 and the pages페이지들 have turned돌린 yellow노랑,
94
212000
3000
오래된 책은 OCR이
03:50
OCROCR cannot~ 할 수 없다. recognize인정하다 a lot of the words.
95
215000
2000
많은 단어를 인식하지 못합니다.
03:52
For example, for things that were written more than 50 years연령 ago...전에,
96
217000
2000
예를들어 50년이 넘은 책들은
03:54
the computer컴퓨터 cannot~ 할 수 없다. recognize인정하다 about 30 percent퍼센트 of the words.
97
219000
3000
컴퓨터가 대략 30%정도를 인식하지 못합니다.
03:57
So what we're doing now
98
222000
2000
그래서 우리가 지금 하고 있는 작업은
03:59
is we're taking취득 all of the words that the computer컴퓨터 cannot~ 할 수 없다. recognize인정하다
99
224000
2000
컴퓨터가 인식하지 못하는 모든 단어들을 모아서
04:01
and we're getting점점 people to read독서 them for us
100
226000
2000
여러분이 인터넷상에서 캡챠 문자를 입력할 때
04:03
while they're typing타자 a CAPTCHA보안 문자 on the Internet인터넷.
101
228000
2000
사람들이 그런 문자를 읽게 합니다.
04:05
So the next다음 것 time you type유형 a CAPTCHA보안 문자, these words that you're typing타자
102
230000
3000
그래서 다음에 여러분이 입력하는
04:08
are actually사실은 words that are coming오는 from books서적 that are being존재 digitized디지털화 된
103
233000
3000
캡차 문자는 디지털화 하는 과정에서
04:11
that the computer컴퓨터 could not recognize인정하다.
104
236000
2000
컴퓨터가 인식하지 못했던 것이지요.
04:13
And now the reason이유 we have two words nowadays현대 instead대신에 of one
105
238000
2000
그런데 요즘엔 한단어 대신 두단어를 보여주는데
04:15
is because, you see, one of the words
106
240000
2000
그중 하나는 컴퓨터가 디지털화하다가
04:17
is a word워드 that the system체계 just got out of a book도서,
107
242000
2000
판독하지 못했던 단어를
04:19
it didn't know what it was, and it's going to present선물 it to you.
108
244000
3000
보여주는 것이지요.
04:22
But since이후 it doesn't know the answer대답 for it, it cannot~ 할 수 없다. grade학년 it for you.
109
247000
3000
그런데 컴퓨터는가 그 단어를 모르기 때문에 정답이 입력됐는지 모르죠.
04:25
So what we do is we give you another다른 word워드,
110
250000
2000
그래서 컴퓨터는 자기가 답을 아는 다른 단어를 하나 더
04:27
one for which어느 the system체계 does know the answer대답.
111
252000
2000
화면에 보여줍니다.
04:29
We don't tell you which어느 one's사람의 which어느, and we say, please type유형 both양자 모두.
112
254000
2000
그리고는 그냥 두 단어를 모두 입력하라고 하지요.
04:31
And if you type유형 the correct옳은 word워드
113
256000
2000
그래서 컴퓨터가 이미 알고 있는 단어에 대해
04:33
for the one for which어느 the system체계 already이미 knows알고있다 the answer대답,
114
258000
2000
여러분이 정답을 입력하면,
04:35
it assumes가정하다 you are human인간의,
115
260000
2000
여러분을 인간으로 인정하고
04:37
and it also또한 gets도착 some confidence자신 that you typed타이핑 된 the other word워드 correctly바르게.
116
262000
2000
다른 단어도 옳게 입력했을거라는 자신을 어느정도 갖게 돼죠.
04:39
And if we repeat반복 this process방법 to like 10 different다른 people
117
264000
3000
만약 이런 과정을 10명의 다른 사람들에게 반복하고,
04:42
and all of them agree동의하다 on what the new새로운 word워드 is,
118
267000
2000
10명 모두가 그 단어를 똑같이 읽으면
04:44
then we get one more word워드 digitized디지털화 된 accurately정확히.
119
269000
2000
그 단어를 정확하게 디지털화 한 것으로 간주합니다.
04:46
So this is how the system체계 works공장.
120
271000
2000
캡차 시스템은 이렇게 작동합니다.
04:48
And basically원래, since이후 we released석방 된 it about three or four years연령 ago...전에,
121
273000
3000
약 3, 4년 전에 저희들이 이 시스템을 소개한 이후
04:51
a lot of websites웹 사이트 have started시작한 switching전환
122
276000
2000
많은 웹사이트가 시간을 낭비하던
04:53
from the old늙은 CAPTCHA보안 문자 where people wasted지나간 their그들의 time
123
278000
2000
구형 캡차 시스템으로 부터 책을 디지털화하는데
04:55
to the new새로운 CAPTCHA보안 문자 where people are helping거들기 to digitize디지털화하다 books서적.
124
280000
2000
도움을주는 신형 캡차 시스템으로 업그레이드 했지요.
04:57
So for example, Ticketmaster티켓 마스터.
125
282000
2000
예를들면, 티켓마스터도 업그레이드 했는데 그래서 거기서
04:59
So every...마다 time you buy사다 tickets티켓 on Ticketmaster티켓 마스터, you help to digitize디지털화하다 a book도서.
126
284000
3000
표를 살때마다 여러분은 책을 디지털화하는데 도움을 주게됩니다.
05:02
Facebook페이스 북: Every마다 time you add더하다 a friend친구 or poke찌름 somebody어떤 사람,
127
287000
2000
페이스북에서는 친구를 추가하거나 누군가를 찜할때 마다
05:04
you help to digitize디지털화하다 a book도서.
128
289000
2000
책을 디지털화하는데 도움을 주게 됩니다.
05:06
Twitter지저귀다 and about 350,000 other sites사이트 are all using~을 사용하여 reCAPTCHA리카 챠.
129
291000
3000
트위터와 약 35만개의 다른 사이트들도 신형 리캡차를 사용합니다.
05:09
And in fact, the number번호 of sites사이트 that are using~을 사용하여 reCAPTCHA리카 챠 is so high높은
130
294000
2000
사실 리캡차 서비스를 이용하는 사이트가 많아서
05:11
that the number번호 of words that we're digitizing디지털화 per day is really, really large.
131
296000
3000
매일 디지털화되는 단어 수는 정말 엄청나게 많습니다.
05:14
It's about 100 million백만 a day,
132
299000
2000
일일 대략 1억개 정도가 되는데
05:16
which어느 is the equivalent동등한 of about two and a half절반 million백만 books서적 a year.
133
301000
4000
이 숫자는 연간 250만권의 책들에 해당하는 숫자이죠.
05:20
And this is all being존재 done끝난 one word워드 at a time
134
305000
2000
이건 단순히 사람들이 인터넷상에서 리캡차 단어를
05:22
by just people typing타자 CAPTCHAs보안 문자 on the Internet인터넷.
135
307000
2000
하나씩 입력해서 가능하게 된 것입니다.
05:24
(Applause박수 갈채)
136
309000
8000
(박수)
05:32
Now of course코스,
137
317000
2000
물론,
05:34
since이후 we're doing so many많은 words per day,
138
319000
2000
우리가 매일 수많은 단어를 다루기 때문에
05:36
funny이상한 things can happen우연히 있다.
139
321000
2000
재미있는 일들이 벌어 질수도 있습니다.
05:38
And this is especially특히 true참된 because now we're giving주는 people
140
323000
2000
그런데 지금은 무작위로 선택된
05:40
two randomly무작위로 chosen선택된 English영어 words next다음 것 to each마다 other.
141
325000
2000
영어 단어를 두개 나란히 보여주기 때문에
05:42
So funny이상한 things can happen우연히 있다.
142
327000
2000
재미있는 일들이 발생 할 수 있죠.
05:44
For example, we presented제시된 this word워드.
143
329000
2000
그 일례로, 우리가 이 단어를 보여줬지요.
05:46
It's the word워드 "Christians기독교인"; there's nothing wrong잘못된 with it.
144
331000
2000
"Christians" 이라는 단어에는 전혀 문제가 없지요.
05:48
But if you present선물 it along...을 따라서 with another다른 randomly무작위로 chosen선택된 word워드,
145
333000
3000
그런데 다른 무작위로 선택된 다른 단어를 보여줄때
05:51
bad나쁜 things can happen우연히 있다.
146
336000
2000
좋지 않은 일이 발생할 수 있지요.
05:53
So we get this. (Text본문: bad나쁜 christians기독교인)
147
338000
2000
이런거죠. "나쁜 기독교인"
05:55
But it's even worse보다 나쁜, because the particular특별한 website웹 사이트 where we showed보여 주었다 this
148
340000
3000
더 나쁜 상황은 이 단어가
05:58
actually사실은 happened일어난 to be called전화 한 The Embassy대사관 of the Kingdom왕국 of God.
149
343000
3000
하나님의 왕국 단체라고 불리는 사이트에서 보여 줬다는거죠.
06:01
(Laughter웃음)
150
346000
2000
(웃음)
06:03
Oops죄송합니다..
151
348000
2000
이런..
06:05
(Laughter웃음)
152
350000
3000
(웃음)
06:08
Here's여기에 another다른 really bad나쁜 one.
153
353000
2000
여기 또다른 나쁜예가 있습니다.
06:10
JohnEdwards존 에드워즈.comcom
154
355000
2000
JohnEdwards.com
06:12
(Text본문: Damn조금도 liberal선심 쓰는)
155
357000
3000
(텍스트: 젠장할 자유당)
06:15
(Laughter웃음)
156
360000
2000
(웃음)
06:17
So we keep on insulting모욕하는 people left and right everyday매일.
157
362000
3000
그래서 우리는 매일 사람들에게 모욕을 줍니다.
06:20
Now, of course코스, we're not just insulting모욕하는 people.
158
365000
2000
물론 모욕만 하는것은 아니죠.
06:22
See here's여기에 the thing, since이후 we're presenting프리젠 테이션 two randomly무작위로 chosen선택된 words,
159
367000
3000
캡차는 무작위로 선택된 두 개의 단어를 보여 주기 때문에
06:25
interesting재미있는 things can happen우연히 있다.
160
370000
2000
재미있는 일도 벌어집니다.
06:27
So this actually사실은 has given주어진 rise오르기
161
372000
2000
리캡차는 수만명의 사람들이
06:29
to a really big Internet인터넷 meme
162
374000
3000
즐기는 캡차 아트라고 하는
06:32
that tens수십 of thousands수천 of people have participated참여한 in,
163
377000
2000
매우 인기있는
06:34
which어느 is called전화 한 CAPTCHA보안 문자 art미술.
164
379000
2000
인터넷 밈을 창출했지요.
06:36
I'm sure some of you have heard들었던 about it.
165
381000
2000
캡차아트에 대해 들어보신 분들이 계시겠지요.
06:38
Here's여기에 how it works공장.
166
383000
2000
어떻게 하는건지 말씀드리죠.
06:40
Imagine상상해 보라. you're using~을 사용하여 the Internet인터넷 and you see a CAPTCHA보안 문자
167
385000
2000
여러분이 인터넷을 사용하다가
06:42
that you think is somewhat약간 peculiar독특한,
168
387000
2000
흥미있는 캡차 문자를 보면
06:44
like this CAPTCHA보안 문자. (Text본문: invisible보이지 않는 toaster빵 굽는 사람)
169
389000
2000
이런 캡챠 말입니다 (텍스트: 보이지 않은 토스터)
06:46
Then what you're supposed가정의 to do is you take a screen화면 shot of it.
170
391000
2000
그 화면을 캡쳐하는것입니다.
06:48
Then of course코스, you fill가득 따르다 out the CAPTCHA보안 문자
171
393000
2000
그리고는 물론 캡챠 문자도 입력합니다.
06:50
because you help us digitize디지털화하다 a book도서.
172
395000
2000
왜냐하면 책을 디지털화하는 것을 도와야 하니까요.
06:52
But then, first you take a screen화면 shot,
173
397000
2000
그리구 나서 앞서 포착한 스크린 숏에
06:54
and then you draw무승부 something that is related관련 to it.
174
399000
2000
관련되는 그림을 그리는 거죠.
06:56
(Laughter웃음)
175
401000
2000
(웃음)
06:58
That's how it works공장.
176
403000
3000
이렇게 작동하는 거죠.
07:01
There are tens수십 of thousands수천 of these.
177
406000
3000
수만개의 이런 캡처가 있죠.
07:04
Some of them are very cute귀엽다. (Text본문: clenched꽉 쥐인 it)
178
409000
2000
어떤 것은 귀엽죠. (텍스트: 꽉 잡아)
07:06
(Laughter웃음)
179
411000
2000
(웃음)
07:08
Some of them are funnier더 우스운.
180
413000
2000
어떤것은 더 재밌습니다.
07:10
(Text본문: stoned술취한 founders설립자)
181
415000
3000
"취한 설립자들"
07:13
(Laughter웃음)
182
418000
3000
(웃음)
07:16
And some of them,
183
421000
2000
그리고
07:18
like paleontological고생물학의 shvisle수선,
184
423000
3000
"paleontological shvisle" 같은 것에는
07:21
they contain있다 Snoop탐정 Dogg독과.
185
426000
2000
Snoop Dogg의 사진이 나타나기도 합니다.
07:23
(Laughter웃음)
186
428000
3000
(웃음)
07:26
Okay, so this is my favorite특히 잘하는 number번호 of reCAPTCHA리카 챠.
187
431000
2000
자, 이것은 제가 좋아하는 리캡차 숫자입니다.
07:28
So this is the favorite특히 잘하는 thing that I like about this whole완전한 project계획.
188
433000
3000
이것은 전 프로젝에서 제가 좋아하는 부분입니다.
07:31
This is the number번호 of distinct뚜렷한 people
189
436000
2000
이 숫자는 리캡차를 통해 최소한 한개의 단어라도
07:33
that have helped도움이 된 us digitize디지털화하다 at least가장 작은 one word워드 out of a book도서 through...을 통하여 reCAPTCHA리카 챠:
190
438000
3000
디지털화하도록 도와준 각 사람들의 총 숫자입니다.
07:36
750 million백만,
191
441000
2000
전 세계 인구의 10%가 약간 넘는
07:38
which어느 is a little over 10 percent퍼센트 of the world's세계의 population인구,
192
443000
2000
7억 5천만명이 인간의 지식을
07:40
has helped도움이 된 us digitize디지털화하다 human인간의 knowledge지식.
193
445000
2000
디지털화할 수 있게 우리를 도와주었습니다.
07:42
And it is numbers번호 like these that motivate동기를 부여하다 my research연구 agenda비망록.
194
447000
3000
이와같은 거창한 숫자는 저를 격려해 줍니다.
07:45
So the question문제 that motivates동기 부여하다 my research연구 is the following수행원:
195
450000
3000
이 숫자가 제 연구에 용기를 주는 이유는 다음과 같습니다.
07:48
If you look at humanity's인류의 large-scale대규모 achievements업적,
196
453000
2000
인류 역사상 대규모의 사람들이
07:50
these really big things
197
455000
2000
협력하여 지금까지 성취한
07:52
that humanity인류 has gotten얻은 together함께 and done끝난 historically역사적으로 --
198
457000
3000
거창한 업적들을 살펴보면 --
07:55
like for example, building건물 the pyramids피라미드 of Egypt이집트
199
460000
2000
예를들면, 이집트의 피라미드,
07:57
or the Panama파나마 Canal운하
200
462000
2000
파나마 운하,
07:59
or putting퍼팅 a man on the Moon --
201
464000
2000
또는 인류의 달착륙 등을 보면
08:01
there is a curious이상한 fact about them,
202
466000
2000
특이한 공통된 사실이 하나 있는데 그것은
08:03
and it is that they were all done끝난 with about the same같은 number번호 off people.
203
468000
2000
모두 비슷한 수의 사람들이 협력해서 달성했다는 겁니다.
08:05
It's weird기묘한; they were all done끝난 with about 100,000 people.
204
470000
3000
그런데 각 경우에 약 10만 명이 일했다는 것은 참 신기합니다.
08:08
And the reason이유 for that is because, before the Internet인터넷,
205
473000
3000
인터넷 시대 이전에는 10만 명 이상의 임금을 지불하는 것은
08:11
coordinating조정 more than 100,000 people,
206
476000
2000
고사하고 그들을 관리하는 것이
08:13
let alone혼자 paying지불하는 them, was essentially본질적으로 impossible불가능한.
207
478000
3000
사실상 불가능했지요.
08:16
But now with the Internet인터넷, I've just shown표시된 you a project계획
208
481000
2000
하지만 지금은 인터넷을 사용해 제가 보여드린 것처럼
08:18
where we've우리는 gotten얻은 750 million백만 people
209
483000
2000
7억5천만 명의 사람들이 인간의 지식을
08:20
to help us digitize디지털화하다 human인간의 knowledge지식.
210
485000
2000
디지털화하기 위해서 저희를 돕고 있습니다.
08:22
So the question문제 that motivates동기 부여하다 my research연구 is,
211
487000
2000
그래서 제 연구에 용기를 주는 것은
08:24
if we can put a man on the Moon with 100,000,
212
489000
3000
우리가 10만 명의 노력으로 사람을 달에 보낼 수 있다면,
08:27
what can we do with 100 million백만?
213
492000
2000
1억명의 사람으로는 무엇이 가능하겠냐는 것이죠.
08:29
So based기반 on this question문제,
214
494000
2000
그래서 이 질문을 기반으로,
08:31
we've우리는 had a lot of different다른 projects프로젝트들 that we've우리는 been working on.
215
496000
2000
저희는 여러 가지 프로젝트를 진행하고 있습니다.
08:33
Let me tell you about one that I'm most가장 excited흥분한 about.
216
498000
3000
그중 제가 가장 좋아하는 프로젝트에 대해 말씀드리지요.
08:36
This is something that we've우리는 been semi-quietly반쯤 조용히 working on
217
501000
2000
지난 일년반 동안 저희들이
08:38
for the last year and a half절반 or so.
218
503000
2000
조용히 진행해 온 일입니다.
08:40
It hasn't~하지 않았다. yet아직 been launched시작한. It's called전화 한 DuolingoDuolingo.
219
505000
2000
아직 공식적으로 발표되지 않은 듀오링고라는 프로젝트죠.
08:42
Since이후 it hasn't~하지 않았다. been launched시작한, shhhhh!
220
507000
2000
아직 공개되지 않았으니.. 쉬~~ 비밀입니다.
08:44
(Laughter웃음)
221
509000
2000
(웃음)
08:46
Yeah, I can trust믿음 you'll do that.
222
511000
2000
저는 여러분이 비밀을 지켜주리라 믿습니다.
08:48
So this is the project계획. Here's여기에 how it started시작한.
223
513000
2000
이프로젝트는 다음과 같이 시직됐지요.
08:50
It started시작한 with me posing포즈를 취하는 a question문제 to my graduate졸업하다 student학생,
224
515000
2000
이 프로젝트는 제가 세버린 해커라는 제 대학원 학생에게 던진
08:52
Severin세브린 Hacker해커.
225
517000
2000
질문으로 부터 시작했지요.
08:54
Okay, that's Severin세브린 Hacker해커.
226
519000
2000
그래요. 이게 세버린 해커입니다.
08:56
So I posed제기 된 the question문제 to my graduate졸업하다 student학생.
227
521000
2000
제가 그 학생에게 그 질문을 던졌죠.
08:58
By the way, you did hear듣다 me correctly바르게;
228
523000
2000
녜, 여러분이 제말을 옳게 들으셨어요.
09:00
his last name이름 is Hacker해커.
229
525000
2000
이 학생의 성이 정말로 해커(Hacker) 예요.
09:02
So I posed제기 된 this question문제 to him:
230
527000
2000
하여튼 제가 그에게 질문을 던졌지요.
09:04
How can we get 100 million백만 people
231
529000
2000
어떻게하면 1억명의 사람이 모든 웹페이지를 모든 주요 언어로,
09:06
translating번역 the Web편물 into every...마다 major주요한 language언어 for free비어 있는?
232
531000
3000
그리고 무료로 번역을 하도록 만들 수 있을까?
09:09
Okay, so there's a lot of things to say about this question문제.
233
534000
2000
자, 이 질문에 대해서 할 말들이 많이 있습니다.
09:11
First of all, translating번역 the Web편물.
234
536000
2000
현재 웹은
09:13
So right now the Web편물 is partitioned분할 된 into multiple배수 languages언어.
235
538000
3000
여러 언어로 갈려져 있습니다.
09:16
A large fraction분수 of it is in English영어.
236
541000
2000
대부분의 페이지는 영어로 되어 있구요.
09:18
If you don't know any English영어, you can't access접속하다 it.
237
543000
2000
영어를 모르면 영어 페이지에 접할 수가 없지요.
09:20
But there's large fractions분수 in other different다른 languages언어,
238
545000
2000
하지만 다른 언어로된 웹페이지도 많이 있지요.
09:22
and if you don't know those languages언어, you can't access접속하다 it.
239
547000
3000
물론 그 언어를 모르면 그 웹페이지를 읽을 수 없지요.
09:25
So I would like to translate옮기다 all of the Web편물, or at least가장 작은 most가장 of the Web편물,
240
550000
3000
그래서 저는 웹의 전체 또는 최소한 일부라도
09:28
into every...마다 major주요한 language언어.
241
553000
2000
모든 주요 언어로 번역하고 싶습니다.
09:30
So that's what I would like to do.
242
555000
2000
바로 그게 제가 하고 싶은 일입니다.
09:32
Now some of you may할 수있다 say, why can't we use computers컴퓨터들 to translate옮기다?
243
557000
3000
어떤분은 왜 컴퓨터로 번역을 하지 못하냐고 물으실지 모르죠.
09:35
Why can't we use machine기계 translation번역?
244
560000
2000
왜 기계번역을 사용 할 수 없을까요?
09:37
Machine기계 translation번역 nowadays현대 is starting출발 to translate옮기다 some sentences문장 here and there.
245
562000
2000
요즘 기계번역한 문장들이 가끔 눈에 뜨입니다.
09:39
Why can't we use it to translate옮기다 the whole완전한 Web편물?
246
564000
2000
그런데 웹 전체를 기계로 번역할 수 있을가요?
09:41
Well the problem문제 with that is that it's not yet아직 good enough충분히
247
566000
2000
문제는 아직도 기계번역의 질이 낮다는 것입니다.
09:43
and it probably아마 won't습관 be for the next다음 것 15 to 20 years연령.
248
568000
2000
아마 앞으로 15 내지 20년 까지는 그럴 겁니다.
09:45
It makes~을 만든다 a lot of mistakes실수.
249
570000
2000
기계번역에는 오역이 많이 있습니다.
09:47
Even when it doesn't make a mistake잘못,
250
572000
2000
기계가 한 번역이 오역이 아니더라도
09:49
since이후 it makes~을 만든다 so many많은 mistakes실수, you don't know whether인지 어떤지 to trust믿음 it or not.
251
574000
3000
일반적으로 워낙 오역이 많기 때문에 믿지 못하죠.
09:52
So let me show보여 주다 you an example
252
577000
2000
기계번역의 일례를
09:54
of something that was translated번역 된 with a machine기계.
253
579000
2000
보여드리죠.
09:56
Actually사실은 it was a forum법정 post게시하다.
254
581000
2000
이 글은 어떤 포럼에 올라온 글입니다.
09:58
It was somebody어떤 사람 who was trying견딜 수 없는 to ask청하다 a question문제 about JavaScript자바 스크립트.
255
583000
3000
어떤분이 자바스크립트에 대해 질문하는 글이 었지요.
10:01
It was translated번역 된 from Japanese일본어 into English영어.
256
586000
3000
일본어를 영어로 번역한 것입니다.
10:04
So I'll just let you read독서.
257
589000
2000
한번 읽어보세요.
10:06
This person사람 starts시작하다 apologizing사과
258
591000
2000
그는 질문을 하기에 앞서 그의 질문을
10:08
for the fact that it's translated번역 된 with a computer컴퓨터.
259
593000
2000
컴퓨터로 번역한 것을 먼저 사과합니다.
10:10
So the next다음 것 sentence문장 is is going to be the preamble전문 to the question문제.
260
595000
3000
그 다음 문장은 그의 질문의 서두니까
10:13
So he's just explaining설명하는 something.
261
598000
2000
뭐를 설명하는 거죠.
10:15
Remember생각해 내다, it's a question문제 about JavaScript자바 스크립트.
262
600000
3000
이 질문은 자바스크립트에 대한 것이라것을 명심하세요.
10:19
(Text본문: At often자주, the goat-time염소 install설치하다 a error오류 is vomit토하다.)
263
604000
4000
(텍스트: 종종 염소시간에 에러를 설치하는것은 토하는것이다)
10:23
(Laughter웃음)
264
608000
4000
(웃음)
10:27
Then comes온다 the first part부품 of the question문제.
265
612000
3000
그리고 질문의 첫번째 부분이 나옵니다.
10:30
(Text본문: How many많은 times타임스 like the wind바람, a pole, and the dragon?)
266
615000
4000
(텍스트: 얼마나 자주 바람, 막대기, 용처럼 ?)
10:34
(Laughter웃음)
267
619000
2000
(웃음)
10:36
Then comes온다 my favorite특히 잘하는 part부품 of the question문제.
268
621000
3000
그리고 이 질문 중 제가 좋아하는 부분이 나옵니다.
10:39
(Text본문: This insult모욕 to father's아버지의 stones?)
269
624000
3000
(텍스트: 이것 아버지의 돌을 모욕한다?)
10:42
(Laughter웃음)
270
627000
2000
(웃음)
10:44
And then comes온다 the ending종결, which어느 is my favorite특히 잘하는 part부품 of the whole완전한 thing.
271
629000
3000
그리고 이 질문 전체중 제가 좋아하는 마지막 부분이 나옵니다.
10:47
(Text본문: Please apologize사과하다 for your stupidity우둔. There are a many많은 thank you.)
272
632000
4000
(텍스트: 여러분의 어리석음을 사과하세요. 많이 감사드립니다.)
10:51
(Laughter웃음)
273
636000
2000
(웃음)
10:53
Okay, so computer컴퓨터 translation번역, not yet아직 good enough충분히.
274
638000
2000
자, 컴퓨터 번역은 아직 질이 문제입니다.
10:55
So back to the question문제.
275
640000
2000
이제 다시 원래 질문으로 돌아가죠.
10:57
So we need people to translate옮기다 the whole완전한 Web편물.
276
642000
3000
우리는 웹 전체를 번역할 사람들이 필요합니다.
11:00
So now the next다음 것 question문제 you may할 수있다 have is,
277
645000
2000
그럼 여러분은 번역가에게 돈을 주고
11:02
well why can't we just pay지불 people to do this?
278
647000
2000
번역을 시키면 되지 않겠냐고 물으실지 모르죠.
11:04
We could pay지불 professional직업적인 language언어 translators번역가 to translate옮기다 the whole완전한 Web편물.
279
649000
3000
전문 번역가에게 돈을 주고 웹 전체를 번역 할 수 있겠지요.
11:07
We could do that.
280
652000
2000
그렇게 할 수 있어요.
11:09
Unfortunately운수 나쁘게, it would be extremely매우 expensive비싼.
281
654000
2000
하지만 불행히도 비용이 무지막지하게 들어갑니다.
11:11
For example, translating번역 a tiny작은, tiny작은 fraction분수 of the whole완전한 Web편물, Wikipedia위키피디아,
282
656000
3000
예를들어, 위키피디아 같은 웹 전체의 아주 작은 부분을
11:14
into one other language언어, Spanish스페인 사람.
283
659000
3000
스페인어로 번역하려면,
11:17
Wikipedia위키피디아 exists존재하다 in Spanish스페인 사람,
284
662000
2000
물론 스페인어 위키피디아가 있지만,
11:19
but it's very small작은 compared비교하다 to the size크기 of English영어.
285
664000
2000
영어페이지에 비하면 매우 작은 분량입니다.
11:21
It's about 20 percent퍼센트 of the size크기 of English영어.
286
666000
2000
영어판의 약 20% 정도지요.
11:23
If we wanted to translate옮기다 the other 80 percent퍼센트 into Spanish스페인 사람,
287
668000
3000
나머지 80%를 스페인어로 번역을 하려면
11:26
it would cost비용 at least가장 작은 50 million백만 dollars불화 --
288
671000
2000
학대받는 정도로 임금이 저렴한 국가로
11:28
and this is at even the most가장 exploited착취당한, outsourcing아웃소싱 country국가 out there.
289
673000
3000
아웃소싱하더라도 약 5천만달러가 들겁니다.
11:31
So it would be very expensive비싼.
290
676000
2000
웹 전체를 번역하려면 엄청난 돈이 들겠지요.
11:33
So what we want to do is we want to get 100 million백만 people
291
678000
2000
우리는 모든 웹페이지를 모든 주요 언어로,
11:35
translating번역 the Web편물 into every...마다 major주요한 language언어
292
680000
2000
그리고 무료로 번역해 줄
11:37
for free비어 있는.
293
682000
2000
1억명 정도의 사람이 필요합니다.
11:39
Now if this is what you want to do,
294
684000
2000
자, 이런식으로 일을 하려면
11:41
you pretty예쁜 quickly빨리 realize깨닫다 you're going to run운영 into two pretty예쁜 big hurdles장애,
295
686000
2000
두 개의 큰 문제가 있다는 것을
11:43
two big obstacles장애물.
296
688000
2000
금방 알수 있습니다.
11:45
The first one is a lack결핍 of bilinguals이중 언어.
297
690000
3000
첫번째는 이중언어 구사자들의 부족이죠.
11:48
So I don't even know
298
693000
2000
웹을 사용하는 사람중 우리의 번역을
11:50
if there exists존재하다 100 million백만 people out there using~을 사용하여 the Web편물
299
695000
3000
도와줄 수 있을 정도로 이중언어를 잘아는 사람이
11:53
who are bilingual이중 언어 enough충분히 to help us translate옮기다.
300
698000
2000
1억명 정도가 되는가도 의문이죠.
11:55
That's a big problem문제.
301
700000
2000
이건 큰 문제입니다.
11:57
The other problem문제 you're going to run운영 into is a lack결핍 of motivation자극.
302
702000
2000
두번째는 동기와 의욕 문제입니다.
11:59
How are we going to motivate동기를 부여하다 people
303
704000
2000
웹을 무료로 번역하도록 어떻게
12:01
to actually사실은 translate옮기다 the Web편물 for free비어 있는?
304
706000
2000
사람들에게 동기와 의욕을 줄 수 있을까요?
12:03
Normally정상적으로, you have to pay지불 people to do this.
305
708000
3000
번역을 하려면 보통 돈을 지불해야 하죠.
12:06
So how are we going to motivate동기를 부여하다 them to do it for free비어 있는?
306
711000
2000
그런데 어떻게 하면 무료로 번역을 하게 만들 수 있을까요?
12:08
Now when we were starting출발 to think about this, we were blocked막힌 by these two things.
307
713000
3000
애당초에 우리는 이 두가지 문제에 걸렸었지요.
12:11
But then we realized깨달은, there's actually사실은 a way
308
716000
2000
그런데 우리는 한가지 해결책으로
12:13
to solve풀다 both양자 모두 these problems문제들 with the same같은 solution해결책.
309
718000
2000
이 두 문제를 동시에 해결수 있다는 것을 깨달았지요.
12:15
There's a way to kill죽이다 two birds조류 with one stone.
310
720000
2000
일석이조의 방법을 찾은거죠.
12:17
And that is to transform변환 language언어 translation번역
311
722000
3000
그것은 번역 작업을 수백만명의 사람들이
12:20
into something that millions수백만 of people want to do,
312
725000
3000
원하는 언어교육으로 탈바꿈 시키는 것인데
12:23
and that also또한 helps도움이된다. with the problem문제 of lack결핍 of bilinguals이중 언어,
313
728000
3000
그렇게 하면 이중언어 구사자가 부족한 문제도
12:26
and that is language언어 education교육.
314
731000
3000
해결할 수 있죠.
12:29
So it turns회전 out that today오늘,
315
734000
2000
현재 전세계에서 외국어를
12:31
there are over 1.2 billion십억 people learning배우기 a foreign외국의 language언어.
316
736000
3000
배우고 있는 사람은 12억명이 넘습니다.
12:34
People really, really want to learn배우다 a foreign외국의 language언어.
317
739000
2000
사람들은 정말 외국어를 배우고 싶어합니다.
12:36
And it's not just because they're being존재 forced강요된 to do so in school학교.
318
741000
3000
이것은 단순히 학교에서 배우라고 그래서가 아니지요.
12:39
For example, in the United유나이티드 States alone혼자,
319
744000
2000
예를들어, 미국만 보더라도,
12:41
there are over five다섯 million백만 people who have paid유료 over $500
320
746000
2000
외국어 교육 소프트웨어에를 살려고 500달러 이상을
12:43
for software소프트웨어 to learn배우다 a new새로운 language언어.
321
748000
2000
지불한 사람이 500만 명이 넘습니다.
12:45
So people really, really want to learn배우다 a new새로운 language언어.
322
750000
2000
사람들은 정말로 새로운 외국어를 배우기를 원합니다.
12:47
So what we've우리는 been working on for the last year and a half절반 is a new새로운 website웹 사이트 --
323
752000
3000
그래서 저희들은 지난 일년반 동안 듀오링고라는
12:50
it's called전화 한 DuolingoDuolingo --
324
755000
2000
웹사이트를 개발하고 있습니다.
12:52
where the basic기본 idea생각 is people learn배우다 a new새로운 language언어 for free비어 있는
325
757000
3000
우리의 기본 아이디어는 사람들이 웹을 번역하면서
12:55
while simultaneously동시에 translating번역 the Web편물.
326
760000
2000
무료로 외국어를 배우게 하자는거죠.
12:57
And so basically원래 they're learning배우기 by doing.
327
762000
2000
간단히 말하면 번역을 하며 외국어를 배우게 하는거죠.
12:59
So the way this works공장
328
764000
2000
우리는 초보자에게는
13:01
is whenever할때는 언제나 you're a just a beginner초보자, we give you very, very simple단순한 sentences문장.
329
766000
3000
매우 간단한 문장을 주지요.
13:04
There's, of course코스, a lot of very simple단순한 sentences문장 on the Web편물.
330
769000
2000
웹 페이지에는 물론 간단한 문장들이 많이 있지요.
13:06
We give you very, very simple단순한 sentences문장
331
771000
2000
우리는 매우 간단한 문장과
13:08
along...을 따라서 with what each마다 word워드 means방법.
332
773000
2000
각 단어의 의미를 보여주지요.
13:10
And as you translate옮기다 them, and as you see how other people translate옮기다 them,
333
775000
3000
그러면 다른 사람들이 번역한 것을 보고 번역을 하면서
13:13
you start스타트 learning배우기 the language언어.
334
778000
2000
언어를 배울 수 있지요.
13:15
And as you get more and more advanced많은,
335
780000
2000
그리고 외국어 수준이 올라갈 수록
13:17
we give you more and more complex복잡한 sentences문장 to translate옮기다.
336
782000
2000
우리는 번역하기 더 복잡한 문장들을 보내죠.
13:19
But at all times타임스, you're learning배우기 by doing.
337
784000
2000
계속해서 실지로 번역을 하면서 배우는 거죠.
13:21
Now the crazy미친 thing about this method방법
338
786000
2000
그런데 히안한 것은 이 방법이 외국어를 배우는데
13:23
is that it actually사실은 really works공장.
339
788000
2000
매우 효과적이라는 겁니다.
13:25
First of all, people are really, really learning배우기 a language언어.
340
790000
2000
사람들이 이런 방법을 사용해서 정말로 외국어를 배웁니다.
13:27
We're mostly대개 done끝난 building건물 it, and now we're testing시험 it.
341
792000
2000
우리는 이 시스템을 거의 완성했고 지금은 테스트중이죠.
13:29
People really can learn배우다 a language언어 with it.
342
794000
2000
듀오링고를 통해 정말로 외국어를 배울 수 있습니다.
13:31
And they learn배우다 it about as well as the leading주요한 language언어 learning배우기 software소프트웨어.
343
796000
3000
듀오링고의 성과는 일류 외국어 학습 소프트웨어와 비등합니다.
13:34
So people really do learn배우다 a language언어.
344
799000
2000
그래서 사람들은 정말로 언어를 배울 수 있죠.
13:36
And not only do they learn배우다 it as well,
345
801000
2000
듀오링고는 다른 방법에 못지 않게
13:38
but actually사실은 it's way more interesting재미있는.
346
803000
2000
외국어를 쉽게 배울 있수 있을 뿐만아니라
13:40
Because you see with DuolingoDuolingo, people are actually사실은 learning배우기 with real레알 content함유량.
347
805000
3000
실제 컨텐츠를 사용하기 때문에 더 흥미가 있지요.
13:43
As opposed반대하는 to learning배우기 with made-up구성 sentences문장,
348
808000
2000
꾸며서 만든 문장과는 달리
13:45
people are learning배우기 with real레알 content함유량, which어느 is inherently본질적으로 interesting재미있는.
349
810000
3000
실제 컨텐츠를 사용하니까 본질적으로 더 흥미가 있지요.
13:48
So people really do learn배우다 a language언어.
350
813000
2000
그래서 사람들은 정말로 외국어를 배우게 되지요.
13:50
But perhaps혹시 more surprisingly놀랍게도,
351
815000
2000
하지만 더욱 놀랄만한 것은,
13:52
the translations번역 that we get from people using~을 사용하여 the site대지,
352
817000
3000
우리의 사이트에서 얻어낸 번역물들은
13:55
even though그래도 they're just beginners초보자,
353
820000
2000
초보자의 번역도
13:57
the translations번역 that we get are as accurate정확한 as those of professional직업적인 language언어 translators번역가,
354
822000
3000
전문 번역가의 번역물 만큼
14:00
which어느 is very surprising놀라운.
355
825000
2000
정확하다는 것입니다.
14:02
So let me show보여 주다 you one example.
356
827000
2000
한가지 예를 보여드리지요.
14:04
This is a sentence문장 that was translated번역 된 from German독일 사람 into English영어.
357
829000
2000
이 문장은 독일어를 영어로 번역한 것입니다.
14:06
The top상단 is the German독일 사람.
358
831000
2000
윗부분은 독일어입니다.
14:08
The middle중간 is an English영어 translation번역
359
833000
2000
중간 부분은 단어당 20센트를 받던
14:10
that was done끝난 by somebody어떤 사람 who was a professional직업적인 English영어 translator역자
360
835000
2000
영문 전문 번역가가
14:12
who we paid유료 20 cents센트 a word워드 for this translation번역.
361
837000
2000
번역한 문장입니다.
14:14
And the bottom바닥 is a translation번역 by users사용자 of DuolingoDuolingo,
362
839000
3000
그리고 밑 부분은 듀오링고 서비스를
14:17
none없음 of whom누구에게 knew알고 있었다 any German독일 사람
363
842000
2000
사용하기 전에는 독일어를 전혀 몰랐던
14:19
before they started시작한 using~을 사용하여 the site대지.
364
844000
2000
듀오링고 사용자가 번역한 문장입니다.
14:21
You can see, it's pretty예쁜 much perfect완전한.
365
846000
2000
보시듯이 거의 완벽한 번역이라고 할 수 있죠.
14:23
Now of course코스, we play놀이 a trick장난 here
366
848000
2000
물론 우리는 전문 번역가의 수준에
14:25
to make the translations번역 as good as professional직업적인 language언어 translators번역가.
367
850000
2000
도달하기 위해 약간의 속임수를 쓰죠.
14:27
We combine콤바인 the translations번역 of multiple배수 beginners초보자
368
852000
3000
우리는 전문 번역가 수준에 도달하도록
14:30
to get the quality품질 of a single단일 professional직업적인 translator역자.
369
855000
3000
여러 초보자자들의 번역을 합치지요.
14:33
Now even though그래도 we're combining결합하다 the translations번역,
370
858000
5000
우리가 여러 사람들의 번역을 합친다고 해도
14:38
the site대지 actually사실은 can translate옮기다 pretty예쁜 fast빠른.
371
863000
2000
듀오링고는 꽤 빨리 번역을 할 수 있습니다.
14:40
So let me show보여 주다 you,
372
865000
2000
제가 보여드리죠.
14:42
this is our estimates견적 of how fast빠른 we could translate옮기다 Wikipedia위키피디아
373
867000
2000
이 슬라이드는 영문 위키피디아를 스페인어로
14:44
from English영어 into Spanish스페인 사람.
374
869000
2000
얼마나 빨리 번역 할 수 있는지를 보여주는 예측 수치입니다.
14:46
Remember생각해 내다, this is 50 million백만 dollars-worth달러 가치 of value.
375
871000
3000
이건 5천만달러에 해당하는 외국어 교육 시스템이라는 것을 기억하세요.
14:49
So if we wanted to translate옮기다 Wikipedia위키피디아 into Spanish스페인 사람,
376
874000
2000
위키피디아를 스페인어로 번역한다면,
14:51
we could do it in five다섯 weeks with 100,000 active유효한 users사용자.
377
876000
3000
듀오링고는 약 10만 명의 유저가 도와주면 5주 안에 할 수 있지요.
14:54
And we could do it in about 80 hours시간 with a million백만 active유효한 users사용자.
378
879000
3000
그리고 백만 명이 도와주면 80시간 이내에 할 수 있습니다.
14:57
Since이후 all the projects프로젝트들 that my group그룹 has worked일한 on so far멀리 have gotten얻은 millions수백만 of users사용자,
379
882000
3000
저희가 지금까지 해온 모든 프로젝트에는 모두 수백만명의
15:00
we're hopeful유망한 that we'll be able할 수 있는 to translate옮기다
380
885000
2000
유저가 있었으니까 듀오링고 프로젝트를 사용하면
15:02
extremely매우 fast빠른 with this project계획.
381
887000
2000
정말로 빨리 번역을 할 수 있을 겁니다.
15:04
Now the thing that I'm most가장 excited흥분한 about with DuolingoDuolingo
382
889000
3000
이제 제가 듀오링코에 대해 가장 기쁘게 생각하는 것은
15:07
is I think this provides~을 제공하다 a fair공정한 business사업 model모델 for language언어 education교육.
383
892000
3000
언어교육에 대해 공정한 사업모델을 제공한다는 점입니다.
15:10
So here's여기에 the thing:
384
895000
2000
바로 이런것이죠.
15:12
The current흐름 business사업 model모델 for language언어 education교육
385
897000
2000
현재의 언어교육 모델은
15:14
is the student학생 pays지불하다,
386
899000
2000
학생이 비용을 지불하는 것인데,
15:16
and in particular특별한, the student학생 pays지불하다 Rosetta로제타 Stone 500 dollars불화.
387
901000
2000
특히 학생들이 로제타스톤에 500달러를 주는 것이지요.
15:18
(Laughter웃음)
388
903000
2000
(웃음)
15:20
That's the current흐름 business사업 model모델.
389
905000
2000
그게 현재 사업모델이죠.
15:22
The problem문제 with this business사업 model모델
390
907000
2000
이런 사업모델의 문제점은
15:24
is that 95 percent퍼센트 of the world's세계의 population인구 doesn't have 500 dollars불화.
391
909000
3000
전 세계 인구의 95%는 500달러를 가지고 있지 않다는 점입니다.
15:27
So it's extremely매우 unfair불공정 towards...쪽으로 the poor가난한.
392
912000
3000
그래서 가난한 사람들에게는 매우 불공정한 모델입니다.
15:30
This is totally전적으로 biased치우친 towards...쪽으로 the rich풍부한.
393
915000
2000
이것은 부자들에게 편향된 사업모델이지요.
15:32
Now see, in DuolingoDuolingo,
394
917000
2000
자 보시죠, 듀오링고에서는,
15:34
because while you learn배우다
395
919000
2000
사용자들이 배우면서 번역이라는
15:36
you're actually사실은 creating창조 value, you're translating번역 stuff물건 --
396
921000
3000
가치를 창조하게 됩니다.
15:39
which어느 for example, we could charge요금 somebody어떤 사람 for translations번역.
397
924000
3000
예를들면, 누구에게 번역료를 과금할 수 도 있다는 것이죠.
15:42
So this is how we could monetize수익 창출 this.
398
927000
2000
즉, 이런식으로 돈을 벌 수도 있다는 말이지요.
15:44
Since이후 people are creating창조 value while they're learning배우기,
399
929000
2000
듀오링고 유저들은 배우면서 가치를 창조하기 때문에
15:46
they don't have to pay지불 their그들의 money, they pay지불 with their그들의 time.
400
931000
3000
돈을 지불 할 필요가 없죠. 이미 시간으로 지불하니까요.
15:49
But the magical마법 같은 thing here is that they're paying지불하는 with their그들의 time,
401
934000
3000
그런데 여기서 기가 막히게 좋은 것은 유저들이 시간으로
15:52
but that is time that would have had to have been spent지출하다 anyways어쨌든
402
937000
2000
교육비를 내지만 그시간은 어차피 언어를 배우는데
15:54
learning배우기 the language언어.
403
939000
2000
소비해야 하는 시간이라는 거죠.
15:56
So the nice좋은 thing about DuolingoDuolingo is I think it provides~을 제공하다 a fair공정한 business사업 model모델 --
404
941000
3000
그래서 듀오링고의 정말로 좋은 점은 가난한 사람들을
15:59
one that doesn't discriminate차별하다 against반대 poor가난한 people.
405
944000
2000
차별하지 않는 공평한 사업모델을 제공한다는 것입니다.
16:01
So here's여기에 the site대지. Thank you.
406
946000
2000
이게 그 사이트입니다. 감사합니다.
16:03
(Applause박수 갈채)
407
948000
8000
(박수)
16:11
So here's여기에 the site대지.
408
956000
2000
이것이 듀오링고 사이트입니다.
16:13
We haven't~하지 않았다. yet아직 launched시작한,
409
958000
2000
아직 공식으로 발표하지는 않았지요.
16:15
but if you go there, you can sign기호 up to be part부품 of our private은밀한 beta베타,
410
960000
3000
하지만 그 사이트에 가보면, 베타 서비스에 가입 할 수 있는데,
16:18
which어느 is probably아마 going to start스타트 in about three or four weeks.
411
963000
2000
이 사이트는 아마도 3, 4주내로 작업을 시작 할 것입니다.
16:20
We haven't~하지 않았다. yet아직 launched시작한 this DuolingoDuolingo.
412
965000
2000
듀오링고 사이트는 아직 공식으로 발표되지 않았습니다.
16:22
By the way, I'm the one talking말하는 here,
413
967000
2000
여기서 제가 혼자 듀오링고에 대해 말하고 있지만
16:24
but actually사실은 DuolingoDuolingo is the work of a really awesome대단한 team, some of whom누구에게 are here.
414
969000
3000
듀오링고는 다음을 포함한 정말로 훌륭한 팀의 협력작입니다.
16:27
So thank you.
415
972000
2000
감사합니다.
16:29
(Applause박수 갈채)
416
974000
4000
(박수)
Translated by Woo Hwang
Reviewed by Young-ho Park

▲Back to top

ABOUT THE SPEAKER
Luis von Ahn - Computer scientist
Luis von Ahn builds systems that combine humans and computers to solve large-scale problems that neither can solve alone.

Why you should listen

Louis von Ahn is an associate professor of Computer Science at Carnegie Mellon University, and he's at the forefront of the crowdsourcing craze. His work takes advantage of the evergrowing Web-connected population to acheive collaboration in unprecedented numbers. His projects aim to leverage the crowd for human good. His company reCAPTCHA, sold to Google in 2009, digitizes human knowledge (books), one word at a time. His new project is Duolingo, which aims to get 100 million people translating the Web in every major language.

More profile about the speaker
Luis von Ahn | Speaker | TED.com