ABOUT THE SPEAKER
Rupal Patel - Speech scientist
People relying on synthetic speech use the voice they’re given, not their own. Rupal Patel created the vocaliD project to change that.

Why you should listen

Northeastern University computer science professor Rupal Patel looks for ways to give voice to the voiceless. As founder and director of the Communication Analysis and Design Laboratory (CadLab), she developed a technology that combines real human voices with the characteristics of individual speech patterns. The result is VocaliD, an innovation that gives people who can't speak the ability to communicate in a voice all their own.

"There's nothing better than seeing the person who's actually going to use it, seeing their reaction, seeing their smile," says Patel.

More profile about the speaker
Rupal Patel | Speaker | TED.com
TEDWomen 2013

Rupal Patel: Synthetic voices, as unique as fingerprints

Rupal Patel: Giọng nói cũng độc đáo như vân tay

Filmed:
944,754 views

Năng lực nói của nhiều người bị rối loạn nghiêm trọng nên họ phải dùng thiết bị máy tính để giao tiếp. Tuy nhiên người ta chỉ chon tập trung vào một số ít các giọng. Thế nên Stephen Hawking có giọng Mỹ, và nhiều người chọn cùng một giọng nói, dẫn đến hiệu ứng không thích hợp. Nhà khoa học về Giọng nói Rupal Patel muốn làm một điều gì đó trong việc này, trong câu chuyện, bà kể về việc chế ra những giọng nói riêng biệt duy nhất cho những người không nói được.
- Speech scientist
People relying on synthetic speech use the voice they’re given, not their own. Rupal Patel created the vocaliD project to change that. Full bio

Double-click the English transcript below to play the video.

00:12
I'd like to talk todayhôm nay
0
719
1490
Hôm nay tôi xin trình bày
00:14
about a powerfulquyền lực and fundamentalcăn bản aspectkhía cạnh
1
2209
2927
một khía cạnh căn bản
và mạnh mẽ trong
00:17
of who we are: our voicetiếng nói.
2
5136
3598
mỗi chúng ta: giọng nói.
00:20
EachMỗi one of us has a uniqueđộc nhất voiceprintvoiceprint
3
8734
2746
Mỗi người chúng ta
có một chất giọng độc đáo
00:23
that reflectsphản ánh our agetuổi tác, our sizekích thước,
4
11480
2289
phản ánh tuổi tác,
kích cỡ cơ thể,
00:25
even our lifestylelối sống and personalitynhân cách.
5
13769
3237
thậm chí phong cách sống và
nhân cách của mỗi người.
00:29
In the wordstừ ngữ of the poetnhà thơ LongfellowLongfellow,
6
17006
2142
Thơ của Longfellow đã nói rằng:
00:31
"the humanNhân loại voicetiếng nói is the organđàn organ of the soulLinh hồn."
7
19148
3870
"Giọng nói là âm điệu của tâm hồn."
00:35
As a speechphát biểu scientistnhà khoa học, I'm fascinatedquyến rũ
8
23018
2747
Là nhà nghiên cứu khoa học tiếng nói,
tôi bị hấp dẫn
00:37
by how the voicetiếng nói is producedsản xuất,
9
25765
1829
bởi cách giọng nói được cất lên,
00:39
and I have an ideaý kiến for how it can be engineeredthiết kế.
10
27594
3658
và cách nó
có thể được chế tạo.
00:43
That's what I'd like to sharechia sẻ with you.
11
31252
2210
Đó là câu chuyện tôi muốn chia sẻ.
00:45
I'm going to startkhởi đầu by playingđang chơi you a samplemẫu vật
12
33462
1814
Tôi sẽ cho các bạn
nghe một mẫu
00:47
of a voicetiếng nói that you mayTháng Năm recognizenhìn nhận.
13
35276
1871
giọng nói mà các bạn
có thế nhận ra.
00:49
(RecordingGhi âm) StephenStephen HawkingHawking: "I would have thought
14
37147
1304
(Băng) Stephen Hawking: "Tôi nghĩ
mình đã diễn đạt khá rõ điều muốn nói."
00:50
it was fairlycông bằng obvioushiển nhiên what I meantý nghĩa."
15
38451
2749
00:53
RupalRupal PatelPatel: That was the voicetiếng nói
16
41200
1280
Rupal Patel: Đó là giọng
00:54
of ProfessorGiáo sư StephenStephen HawkingHawking.
17
42480
2086
của Giáo sư Stephen Hawking.
00:56
What you mayTháng Năm not know is that sametương tự voicetiếng nói
18
44566
3849
Điều quý vị có thể không biết,
là giọng nói này
01:00
mayTháng Năm alsocũng thế be used by this little girlcon gái
19
48415
2478
cũng có thể được cô bé
này sử dụng
01:02
who is unablekhông thể to speaknói
20
50893
1697
cô không nói được
01:04
because of a neurologicalthần kinh conditionđiều kiện.
21
52590
2597
do mắc phải một bệnh thần kinh.
01:07
In factthực tế, all of these individualscá nhân
22
55187
2068
Thực tế là,
những người trên hình này
01:09
mayTháng Năm be usingsử dụng the sametương tự voicetiếng nói,
23
57255
2012
có thể đang
sử dụng cùng một giọng nói,
01:11
and that's because there's
only a fewvài optionslựa chọn availablecó sẵn.
24
59267
3557
đó là do họ chỉ có
một số ít các lựa chọn.
01:14
In the U.S. alonemột mình, there are 2.5 milliontriệu AmericansNgười Mỹ
25
62824
4317
Tính riêng ở Mỹ, có khoảng
2,5 triệu người
01:19
who are unablekhông thể to speaknói,
26
67141
1610
không thể nói,
01:20
and manynhiều of whomai use computerizedtrên máy vi tính devicesthiết bị
27
68751
2622
và nhiều người trong số họ
sử dụng các thiết bị máy tính
01:23
to communicategiao tiếp.
28
71373
1522
để giao tiếp.
01:24
Now that's millionshàng triệu of people worldwidetrên toàn thế giới
29
72895
3479
Có hàng triệu người trên trái đất
đang sử dụng những giọng nói chung,
01:28
who are usingsử dụng genericchung voicestiếng nói,
30
76374
1652
bao gồm giọng của
Giáo sư Hawking,
01:30
includingkể cả ProfessorGiáo sư HawkingHawking,
31
78026
1446
01:31
who usessử dụng an American-accentedNgười Mỹ có dấu voicetiếng nói.
32
79472
4833
giọng Mỹ đặc trưng.
01:36
This lackthiếu sót of individuationindividuation of the syntheticsợi tổng hợp voicetiếng nói
33
84305
3328
Khiếm khuyết về đặc điểm
cá nhân này của giọng nói nhân tạo
01:39
really hitđánh home
34
87633
1416
thực sự đã ám ảnh tôi
01:41
when I was at an assistivetrôï giuùp technologyCông nghệ conferencehội nghị
35
89049
2472
khi tham gia
một hội nghị kỹ thuật hỗ trợ
01:43
a fewvài yearsnăm agotrước,
36
91521
1850
cách đây vài năm,
01:45
and I recallhồi tưởng walkingđi dạo into an exhibittriển lãm hallđại sảnh
37
93371
3604
tôi còn nhớ khoảng khắc
thả bộ vào sảnh hội trường
01:48
and seeingthấy a little girlcon gái and a grownmới lớn man
38
96975
3044
và bắt gặp một cô bé con
cùng một người lớn
01:52
havingđang có a conversationcuộc hội thoại usingsử dụng theirhọ devicesthiết bị,
39
100019
2916
dùng thiết bị hỗ trợ
để nói chuyện với nhau,
01:54
differentkhác nhau devicesthiết bị, but the sametương tự voicetiếng nói.
40
102935
4284
thiết bị khác nhau,
nhưng cùng một giọng nói.
01:59
And I lookednhìn around and I saw this happeningxảy ra
41
107219
1909
Tôi quan sát và theo dõi
02:01
all around me, literallynghĩa đen hundredshàng trăm of individualscá nhân
42
109128
4190
quanh tôi, có hàng trăm người
02:05
usingsử dụng a handfulsố ít of voicestiếng nói,
43
113318
2738
đang dùng chỉ một vài giọng nói,
02:08
voicestiếng nói that didn't fitPhù hợp theirhọ bodiescơ thể
44
116056
3091
những giọng nói đó không hề
tương xứng với cơ thể
02:11
or theirhọ personalitiesnhân cách.
45
119147
2082
hoặc tính cách của họ.
02:13
We wouldn'tsẽ không dreammơ tưởng of fittinglắp a little girlcon gái
46
121229
2727
Chưa bao giờ nghĩ ta sẽ
nối tay hoặc chân giả
02:15
with the prostheticProsthetic limbchân tay of a grownmới lớn man.
47
123956
3396
của người trưởng thành
cho một cô bé gái.
02:19
So why then the sametương tự prostheticProsthetic voicetiếng nói?
48
127352
3304
Vậy tại sao lại chấp nhận
sử dụng giọng nói nhân tạo như thế?
02:22
It really strucktấn công me,
49
130656
1291
Nó thực sự dày vò tôi,
02:23
and I wanted to do something about this.
50
131947
3151
tôi muốn làm cái gì đó.
02:27
I'm going to playchơi you now a samplemẫu vật
51
135098
1953
Bây giờ tôi xin mở
một đoạn ví dụ
02:29
of someonengười nào who has, two people actuallythực ra,
52
137051
3288
của một người,
thực tế là hai,
mắc chứng rối loạn
giọng nói nghiêm trọng.
02:32
who have severenghiêm trọng speechphát biểu disordersrối loạn.
53
140339
1768
02:34
I want you to take a listen to how they soundâm thanh.
54
142107
3230
Tôi muốn các bạn
chú ý lắng nghe cách họ nói.
02:37
They're sayingnói the sametương tự utterancecâu phát biểu.
55
145337
2357
Họ đang diễn đạt cùng một ý.
02:39
(First voicetiếng nói)
56
147694
2432
(Giọng nói thứ nhất)
02:42
(SecondThứ hai voicetiếng nói)
57
150126
3617
(Giọng nói thứ 2)
02:45
You probablycó lẽ didn't understandhiểu không what they said,
58
153743
2412
Bạn có thể không hiểu
những gì họ nói,
02:48
but I hopemong that you heardnghe
59
156155
1854
nhưng tôi hy vọng
bạn có thể nhận ra
02:50
theirhọ uniqueđộc nhất vocalgiọng hát identitiesdanh tính.
60
158009
4283
đặc điểm riêng về giọng nói
của họ.
02:54
So what I wanted to do nextkế tiếp is,
61
162292
2813
Điều tiếp theo phải làm là,
02:57
I wanted to find out how we could harnesskhai thác
62
165105
2384
tôi muốn tìm ra cách tận dụng
02:59
these residual vocalgiọng hát abilitieskhả năng
63
167489
1821
khả năng nói chuyện
còn sót lại này
03:01
and buildxây dựng a technologyCông nghệ
64
169310
2016
và xây dựng một kỹ thuật
03:03
that could be customizedtùy chỉnh for them,
65
171326
2143
tương hợp với họ,
03:05
voicestiếng nói that could be customizedtùy chỉnh for them.
66
173469
2429
tạo ra giọng nói phù hợp nhất.
03:07
So I reachedđạt được out to my collaboratorcộng tác viên, TimTim BunnellBunnell.
67
175898
2685
Vì thế, tôi đã trao đổi
với đồng sự, Tim Bunnell.
03:10
DrTiến sĩ. BunnellBunnell is an expertchuyên gia in speechphát biểu synthesistổng hợp,
68
178583
3063
Tiến sĩ Bunnell là chuyên gia
trong lĩnh vực giọng nói nhân tạo,
03:13
and what he'danh ấy been doing is buildingTòa nhà
69
181646
2033
ông ấy đã và đang xây dựng
03:15
personalizedcá nhân hoá voicestiếng nói for people
70
183679
1881
giọng nói
mang đặc điểm cá nhân
03:17
by puttingđặt togethercùng với nhau
71
185560
2097
bằng cách ghép
những mẫu giọng nói của họ
03:19
pre-recordedtrước khi thu âm samplesmẫu of theirhọ voicetiếng nói
72
187657
2150
được ghi âm trước đó
03:21
and reconstructingxây dựng lại a voicetiếng nói for them.
73
189807
2879
và tái tạo giọng cho họ.
Đây là những người
mất đi giọng nói
03:24
These are people who had lostmất đi theirhọ voicetiếng nói
74
192686
1712
03:26
latermột lát sau in life.
75
194398
1911
trong những năm về sau
của cuộc đời.
03:28
We didn't have the luxurysang trọng
76
196309
1394
Chúng ta không có những
03:29
of pre-recordedtrước khi thu âm samplesmẫu of speechphát biểu
77
197703
1774
bản ghi âm tiếng nói
03:31
for those bornsinh ra with speechphát biểu disorderrối loạn.
78
199477
2292
của những người
mắc bệnh bẩm sinh.
03:33
But I thought, there had to be a way
79
201769
2537
Nhưng tôi nghĩ,
phải có một cách khác
03:36
to reverseđảo ngược engineerkỹ sư a voicetiếng nói
80
204306
1944
để tạo lại giọng nói
03:38
from whateverbất cứ điều gì little is left over.
81
206250
2291
từ bất kỳ thứ gì nhỏ nhoi
còn sót lại.
03:40
So we decidedquyết định to do exactlychính xác that.
82
208541
2714
Cuối cùng, chúng tôi quyết định
làm đúng như vậy.
03:43
We setbộ out with a little bitbit of fundingkinh phí
from the NationalQuốc gia ScienceKhoa học FoundationNền tảng,
83
211255
3403
Bắt đầu với nguồn quỹ ít ỏi
từ Quỹ Khoa học Quốc gia,
03:46
to createtạo nên custom-craftedCustom-crafted. voicestiếng nói that capturedbị bắt
84
214658
3565
để tạo ra
giọng nói nhân tạo tùy chỉnh
03:50
theirhọ uniqueđộc nhất vocalgiọng hát identitiesdanh tính.
85
218223
1536
dựa trên đặc điểm
từng người.
03:51
We call this projectdự án VocaliDVocaliD, or vocalgiọng hát I.D.,
86
219759
3203
Chúng tôi gọi dự án này là
VocaliD hay là vocal I.D
03:54
for vocalgiọng hát identitydanh tính.
87
222962
2033
tạo tiếng nói cá nhân.
03:56
Now before I get into the detailschi tiết of how
88
224995
2674
Trước khi đi vào chi tiết về
việc hình thành
03:59
the voicetiếng nói is madethực hiện and let you listen to it,
89
227669
2048
giọng nói
và để bạn có thể nghe thấy,
04:01
I need to give you a realthực quicknhanh chóng
speechphát biểu sciencekhoa học lessonbài học. Okay?
90
229717
3350
Tôi xin nói nhanh một bài khoa học
về giọng nói.
04:05
So first, we know that the voicetiếng nói is changingthay đổi
91
233067
3159
Trước tiên, chúng ta đều biết
giọng nói sẽ thay đổi nhiều
04:08
dramaticallyđột ngột over the coursekhóa học of developmentphát triển.
92
236226
2854
qua quá trình phát triển.
04:11
ChildrenTrẻ em soundâm thanh differentkhác nhau from teensthiếu niên
93
239080
2090
Trẻ em nói giọng
khác thanh thiếu niên
04:13
who soundâm thanh differentkhác nhau from adultsngười trưởng thành.
94
241170
1463
khác với giọng người lớn.
04:14
We'veChúng tôi đã all experiencedcó kinh nghiệm this.
95
242633
2642
Ai cũng đều trải qua
những thời kỳ đó.
04:17
FactThực tế numbercon số two is that speechphát biểu
96
245275
3363
Sự thật tiếp theo là
giọng nói
04:20
is a combinationsự phối hợp of the sourcenguồn,
97
248638
2553
là sự kết hợp
của âm nguồn,
04:23
which is the vibrationsrung động generatedtạo ra by your voicetiếng nói boxcái hộp,
98
251191
3479
những nhịp rung được tạo ra
từ hộp âm thanh,
04:26
which are then pushedđẩy throughxuyên qua
99
254670
1939
sau đó, được truyền qua
04:28
the restnghỉ ngơi of the vocalgiọng hát tractđường.
100
256609
2437
phần còn lại
của đường truyền tiếng.
04:31
These are the chambersChambers of your headcái đầu and neckcái cổ
101
259046
2484
Đây là những khoang
trong đầu và cổ
04:33
that vibratebaùo rung,
102
261530
1239
chúng sẽ rung lên,
04:34
and they actuallythực ra filterlọc that sourcenguồn soundâm thanh
103
262769
2110
và lọc những âm nguồn
04:36
to producesản xuất consonantsphụ âm and vowelsnguyên âm.
104
264879
2537
để phát ra
các nguyên âm và phụ âm.
04:39
So the combinationsự phối hợp of sourcenguồn and filterlọc
105
267416
3860
Như vậy, sự kết hợp
giữa âm nguồn và bộ lọc
04:43
is how we producesản xuất speechphát biểu.
106
271276
2630
là cách mà giọng nói
được phát ra.
04:45
And that happensxảy ra in one individualcá nhân.
107
273906
3026
Và quá trình đó xảy ra
ở từng cá nhân.
04:48
Now I told you earliersớm hơn that I'd spentđã bỏ ra
108
276932
2626
Ban nãy, tôi đã nói
04:51
a good partphần of my careernghề nghiệp
109
279558
2025
tôi dành nhiều thời gian
và công sức
04:53
understandinghiểu biết and studyinghọc tập
110
281583
2453
để hiểu và nghiên cứu
04:56
the sourcenguồn characteristicsđặc điểm of people
111
284036
1958
đặc điểm âm nguồn
của cá nhân
04:57
with severenghiêm trọng speechphát biểu disorderrối loạn,
112
285994
2301
mắc chứng rối loạn giọng nói
nghiêm trọng,
05:00
and what I've foundtìm
113
288295
1465
điều mà tôi tìm ra là
05:01
is that even thoughTuy nhiên theirhọ filtersbộ lọc were impairedbị khiếm khuyết,
114
289760
3366
mặc dù bộ lọc
bị hư hại và suy giảm,
05:05
they were ablecó thể to modulateđiều chỉnh theirhọ sourcenguồn:
115
293126
2961
họ vẫn có thể
tạo ra âm thanh nguồn:
05:08
the pitchsân cỏ, the loudnessâm sắc, the tempotiến độ of theirhọ voicetiếng nói.
116
296087
3262
gồm cao độ, cường độ, nhịp độ
05:11
These are calledgọi là prosodyYahoo!, and
I've been documentingghi chép for yearsnăm
117
299349
3368
gọi chung là âm điệu,
tôi đã nghiên cứu trong nhiều năm
05:14
that the prosodicprosodic abilitieskhả năng of these individualscá nhân
118
302717
2277
thấy rằng năng lực tạo âm điệu
của những người này vẫn còn được lưu giữ.
05:16
are preservedbảo quản.
119
304994
1575
05:18
So when I realizedthực hiện that those sametương tự cuestín hiệu
120
306569
4087
Vì thế, khi nhận ra
những tín hiệu này
05:22
are alsocũng thế importantquan trọng for speakerloa identitydanh tính,
121
310656
2769
là rất quan trọng
với giọng nói cá nhân,
05:25
I had this ideaý kiến.
122
313425
2015
tôi đã nảy ra ý tưởng.
05:27
Why don't we take the sourcenguồn
123
315440
2516
Sao không lấy âm nguồn
05:29
from the personngười we want the voicetiếng nói to soundâm thanh like,
124
317956
2213
từ chính người cần tạo giọng nói,
05:32
because it's preservedbảo quản,
125
320169
1463
vì nó vẫn còn được lưu giữ,
05:33
and borrowvay the filterlọc
126
321632
2135
rồi mượn bộ lọc
05:35
from someonengười nào about the sametương tự agetuổi tác and sizekích thước,
127
323767
3229
từ một người cùng tuổi
và kích cỡ,
05:39
because they can articulate speechphát biểu,
128
327011
2407
vì họ có thể phát ra
giọng nói rõ ràng,
05:41
and then mixpha trộn them?
129
329418
1791
rồi kết hợp chúng lại?
05:43
Because when we mixpha trộn them,
130
331209
1787
Làm thế, chúng ta có thể
05:44
we can get a voicetiếng nói that's as cleartrong sáng
131
332996
1698
có được giọng nói rõ ràng
05:46
as our surrogatethay thế talkertalker --
132
334694
1754
như chính giọng
của người nói --
05:48
that's the personngười we borrowedvay mượn the filterlọc from—
133
336448
2595
người mà ta đã mượn bộ lọc--
05:51
and is similargiống in identitydanh tính to our targetMục tiêu talkertalker.
134
339043
4649
đồng thời có đặc điểm tương tự
với âm nguồn của người nói mục tiêu.
05:55
It's that simpleđơn giản.
135
343692
1427
Đơn giản thế thôi.
05:57
That's the sciencekhoa học behindphía sau what we're doing.
136
345119
2934
Đó là cơ sở khoa học
của việc chúng tôi đang làm.
06:00
So onceMột lần you have that in mindlí trí,
137
348053
3533
Vì thế, một khi bạn hỏi,
06:03
how do you go about buildingTòa nhà this voicetiếng nói?
138
351586
2258
làm thế nào
tạo ra giọng cho người này?
06:05
Well, you have to find someonengười nào
139
353844
1480
Bạn phải tìm ra ai đó
06:07
who is willingsẵn lòng to be a surrogatethay thế.
140
355324
2400
sẵn lòng là người thay thế.
06:09
It's not suchnhư là an ominousxấu xa thing.
141
357724
2264
Đó không phải là
một điều quá khó.
06:11
BeingĐang a surrogatethay thế donornhà tài trợ
142
359988
1523
Để là người
tặng giọng
06:13
only requiresđòi hỏi you to say a fewvài hundredhàng trăm
143
361511
2788
điều bạn cần làm
là nói vài trăm
06:16
to a fewvài thousandnghìn utteranceslời.
144
364299
2242
đến vài ngàn lời.
06:18
The processquá trình goesđi something like this.
145
366541
2003
Quá trình đó diễn ra
đại loại như.
06:20
(VideoVideo) VoiceGiọng nói: Things happenxảy ra in pairscặp.
146
368544
2190
(Video) Giọng nói:
Những thứ xảy ra cùng lúc.
06:22
I love to sleepngủ.
147
370734
1925
Tôi muốn đi ngủ.
06:24
The skybầu trời is bluemàu xanh da trời withoutkhông có cloudsđám mây.
148
372659
3882
Bầu trời xanh không gợn chút mây.
06:28
RPRP: Now she's going to go on like this
149
376541
2002
Rupal Patel: Cô ấy sẽ tiếp tục như thế
06:30
for about threesố ba to fourbốn hoursgiờ,
150
378543
1919
trong khoảng 3 đến 4 giờ,
06:32
and the ideaý kiến is not for her to say everything
151
380462
3005
vấn đề không phải là
cô ấy phải nói mọi thứ
06:35
that the targetMục tiêu is going to want to say,
152
383467
2045
mà người mục tiêu
sẽ nói trong tương lai,
06:37
but the ideaý kiến is to coverche all the differentkhác nhau combinationskết hợp
153
385512
3395
vấn đề ở đây là tạo ra tất cả
những kết hợp âm
06:40
of the soundsâm thanh that occurxảy ra in the languagengôn ngữ.
154
388907
3271
có thể có trong ngôn ngữ.
06:44
The more speechphát biểu you have,
155
392178
1638
Càng nhiều lời nói
được tập hợp,
06:45
the better soundingnghe voicetiếng nói you're going to have.
156
393816
2305
giọng được tổng hợp
càng có âm điệu tốt hơn.
06:48
OnceMột lần you have those recordingsđoạn ghi âm,
157
396121
1673
Khi đã có
những bản ghi âm thế này,
06:49
what we need to do
158
397794
1413
điều tiếp theo là
06:51
is we have to parsephân tích cú pháp these recordingsđoạn ghi âm
159
399207
2718
tách chúng
06:53
into little snippetsđoạn trích of speechphát biểu,
160
401925
2449
thành những đoạn nhỏ,
06:56
one-một- or two-sound2-âm thanh combinationskết hợp,
161
404374
2337
từ một đến hai âm kết hợp,
06:58
sometimesđôi khi even wholetoàn thể wordstừ ngữ
162
406711
1883
thậm chí là
toàn bộ từ
07:00
that startkhởi đầu populatingPopulating a datasetsố liệu or a databasecơ sở dữ liệu.
163
408594
4516
và tạo thành một bộ dữ liệu.
07:05
We're going to call this databasecơ sở dữ liệu a voicetiếng nói bankngân hàng.
164
413110
3717
Chúng tôi gọi bộ dữ liệu này
là ngân hàng giọng nói.
07:08
Now the powerquyền lực of the voicetiếng nói bankngân hàng
165
416827
2096
Bạn có thể thấy sức mạnh
của ngân hàng giọng nói
07:10
is that from this voicetiếng nói bankngân hàng,
166
418923
2014
07:12
we can now say any newMới utterancecâu phát biểu,
167
420937
2011
chúng ta có thể nói
bất cứ câu nào,
07:14
like, "I love chocolatesô cô la" --
168
422948
1424
như: "Tôi thích Sô cô la" --
07:16
everyonetất cả mọi người needsnhu cầu to be ablecó thể to say that—
169
424372
1739
mọi người đều cần phải nói thế--
07:18
fish throughxuyên qua that databasecơ sở dữ liệu
170
426111
1831
chỉ cần tìm trong bộ dữ liệu
07:19
and find all the segmentsphân đoạn necessarycần thiết
171
427942
1940
để có tất cả
những phân đoạn cần thiết
07:21
to say that utterancecâu phát biểu.
172
429882
1929
để nói ra điều này.
(Video) Giọng nói:
Tôi thích Sô Cô La.
07:23
(VideoVideo) VoiceGiọng nói: I love chocolatesô cô la.
173
431811
1789
07:25
RPRP: So that's speechphát biểu synthesistổng hợp.
174
433600
1391
RP: Đó là lời nói nhân tạo
07:26
It's calledgọi là concatenativeconcatenative synthesistổng hợp,
and that's what we're usingsử dụng.
175
434991
2573
được gọi là tổng hợp tập kết,
cái chúng tôi đang dùng.
07:29
That's not the novelcuốn tiểu thuyết partphần.
176
437564
1533
Không có gì mới mẻ.
07:31
What's novelcuốn tiểu thuyết is how we make it soundâm thanh
177
439097
2221
Điều lạ là cách ta tạo ra âm điệu
giống như người phụ nữ trẻ này.
07:33
like this youngtrẻ womanđàn bà.
178
441318
1457
07:34
This is SamanthaSamantha.
179
442775
1524
Đây là Samantha.
07:36
I metgặp her when she was ninechín,
180
444299
2346
Tôi đã gặp cô lần đầu
khi cô ấy 9 tuổi,
07:38
and sincekể từ then, my teamđội and I
181
446645
1897
và kể từ đó,
nhóm của tôi
07:40
have been tryingcố gắng to buildxây dựng her a personalizedcá nhân hoá voicetiếng nói.
182
448542
2714
đã cố gắng tạo ra
giọng nói riêng cho cô ấy.
07:43
We first had to find a surrogatethay thế donornhà tài trợ,
183
451256
3099
Đầu tiên, chúng tôi phải tìm ra
người hiến giọng nói,
07:46
and then we had to have SamanthaSamantha
184
454355
1818
và sau đó, để Samantha
07:48
producesản xuất some utteranceslời.
185
456173
1929
tạo ra vài câu nói,
07:50
What she can producesản xuất are mostlychủ yếu vowel-likegiống như nguyên âm soundsâm thanh,
186
458102
2379
hầu như
chỉ là những nguyên âm,
07:52
but that's enoughđủ for us to extracttrích xuất
187
460481
2479
nhưng như vậy là đã đủ
để trích xuất
07:54
her sourcenguồn characteristicsđặc điểm.
188
462960
2285
âm nguồn riêng của cô.
07:57
What happensxảy ra nextkế tiếp is besttốt describedmô tả
189
465245
3271
Để diễn đạt một cách tốt nhất
những gì xảy ra tiếp theo
08:00
by my daughter'scon gái analogysự giống nhau. She's sixsáu.
190
468516
2767
cần phải dùng lời của con gái tôi.
Nó lên 6 tuổi.
08:03
She callscuộc gọi it mixingpha trộn colorsmàu sắc to paintSơn voicestiếng nói.
191
471283
5422
Nó gọi đó là
trộn màu để vẽ nên giọng nói.
08:08
It's beautifulđẹp. It's exactlychính xác that.
192
476705
2555
Miêu tả tài tình.
Chính xác là vậy.
08:11
Samantha'sCủa Samantha voicetiếng nói is like a concentratedtập trung samplemẫu vật
193
479260
2860
Giọng nói của Samantha
giống như mẫu cô đặc
08:14
of redđỏ foodmón ăn dyethuốc nhuộm which we can infuseinfuse
194
482120
2609
của màu đỏ thực phẩm
ta dùng
08:16
into the recordingsđoạn ghi âm of her surrogatethay thế
195
484729
2540
để tô vào bản ghi âm
giọng nói thay thế
08:19
to get a pinkHồng voicetiếng nói just like this.
196
487269
4387
tạo ra chất giọng màu hồng
như thế này.
08:23
(VideoVideo) SamanthaSamantha: AaaaaahAaaaaah.
197
491656
4491
(Video) Samantha: Aaaaaah.
08:28
RPRP: So now, SamanthaSamantha can say this.
198
496147
2808
Và bây giờ, Samantha
có thể nói như thế này.
08:30
(VideoVideo) SamanthaSamantha: This voicetiếng nói is only for me.
199
498955
3069
(Video) Samantha:
Giọng nói này chỉ dành cho tôi.
08:34
I can't wait to use my newMới voicetiếng nói with my friendsbạn bè.
200
502024
6305
Tôi nóng lòng muốn dùng nó
để nói chuyện với các bạn.
08:40
RPRP: Thank you. (ApplauseVỗ tay)
201
508329
6417
RP: Cảm ơn (Tiếng vỗ tay)
08:46
I'll never forgetquên the gentledịu dàng smilenụ cười
202
514746
2333
Tôi không bao giờ quên được
nụ cười dịu dàng
08:49
that spreadLan tràn acrossbăng qua her faceđối mặt
203
517079
1902
tỏa ra trên khuôn mặt
của Samantha
08:50
when she heardnghe that voicetiếng nói for the first time.
204
518981
3649
khi cô nghe giọng nói của mình
lần đầu tiên.
08:54
Now there's millionshàng triệu of people
205
522630
1882
Hiện nay, có hàng triệu người
08:56
around the worldthế giới like SamanthaSamantha, millionshàng triệu,
206
524512
2833
khắp thế giới như Samantha,
vâng hàng triệu,
08:59
and we'vechúng tôi đã only begunbắt đầu to scratchvết trầy the surfacebề mặt.
207
527345
3440
và chúng tôi chỉ mới bắt đầu
hỗ trợ được phần nổi.
09:02
What we'vechúng tôi đã donelàm xong so farxa is we have
208
530785
1642
Cho tới lúc này
09:04
a fewvài surrogatethay thế talkerstalkers from around the U.S.
209
532427
3859
có một vài người hiến giọng
trên khắp nước Mỹ.
09:08
who have donatedquyên góp theirhọ voicestiếng nói,
210
536286
1507
Chúng tôi đang sử dụng
những giọng nói này
09:09
and we have been usingsử dụng those
211
537793
1928
09:11
to buildxây dựng our first fewvài personalizedcá nhân hoá voicestiếng nói.
212
539721
4472
để xây dựng
những giọng nói cá nhân.
09:16
But there's so much more work to be donelàm xong.
213
544193
1756
Nhưng vẫn còn rất nhiều
việc phải làm khác .
09:17
For SamanthaSamantha, her surrogatethay thế
214
545949
2188
Với Samantha,
người hiến giọng cho cô ấy
09:20
cameđã đến from somewheremột vài nơi in the MidwestMidwest, a strangerlạ
215
548137
3046
đến từ Trung Tây,
một người lạ
09:23
who gaveđưa ra her the giftquà tặng of voicetiếng nói.
216
551183
3841
đã trao cho cô
món quà quý giá là giọng nói.
09:27
And as a scientistnhà khoa học, I'm so excitedbị kích thích
217
555024
2153
Là nhà khoa học,
tôi háo hức
09:29
to take this work out of the laboratoryphòng thí nghiệm
218
557177
1935
đưa dự án này
ra khỏi phòng thí nghiệm
09:31
and finallycuối cùng into the realthực worldthế giới
219
559112
1800
đến với đời thực
09:32
so it can have real-worldthế giới thực impactva chạm.
220
560912
3165
để nó có được
những tác động thực.
Tôi muốn chia sẻ
với các bạn tiếp theo
09:36
What I want to sharechia sẻ with you nextkế tiếp
221
564077
1582
09:37
is how I envisionhình dung takinglấy this work
222
565659
2175
đó là tôi
đã hình dung đưa dự án này
09:39
to that nextkế tiếp levelcấp độ.
223
567834
2711
lên một tầm cao hơn
như thế nào.
09:42
I imaginetưởng tượng a wholetoàn thể worldthế giới of surrogatethay thế donorsCác nhà tài trợ
224
570545
3887
Tôi tưởng tượng ra một thế giới
gồm những người hiến tặng giọng nói
09:46
from all walksđi bộ of life, differentkhác nhau sizeskích thước, differentkhác nhau ageslứa tuổi,
225
574432
3260
từ mọi hoàn cảnh,
mọi tầm vóc, mọi tuỏi tác,
09:49
comingđang đến togethercùng với nhau in this voicetiếng nói drivelái xe
226
577692
3058
đến với nhau
vì mục đích chung
09:52
to give people voicestiếng nói
227
580750
2270
trao tặng giọng nói cho con người
09:55
that are as colorfulĐầy màu sắc as theirhọ personalitiesnhân cách.
228
583020
3799
để cho giọng nói của họ cũng có sắc màu
như chính tính cách của họ vậy.
09:58
To do that as a first stepbậc thang,
229
586819
2300
Để thực hiện điều này
bước đầu tiên,
10:01
we'vechúng tôi đã put togethercùng với nhau this websitetrang mạng, VocaliDVocaliD.orgtổ chức,
230
589119
3275
chúng tôi cùng tạo
một website, VocaliD.org,
10:04
as a way to bringmang đến togethercùng với nhau those
231
592394
1624
như là một cách tập hợp
10:06
who want to jointham gia us as voicetiếng nói donorsCác nhà tài trợ,
232
594018
2675
những người mong muốn
hiến tặng giọng nói,
10:08
as expertisechuyên môn donorsCác nhà tài trợ,
233
596693
1772
cũng như
kiến thức chuyên môn,
10:10
in whateverbất cứ điều gì way to make this visiontầm nhìn a realitythực tế.
234
598465
5339
hoặc bất kỳ cách nào để đưa
dự án trở thành hiện thực.
10:15
They say that givingtặng bloodmáu can savetiết kiệm livescuộc sống.
235
603804
4153
Có người đã nói
hiến máu có thể cứu người.
10:19
Well, givingtặng your voicetiếng nói can changethay đổi livescuộc sống.
236
607957
4982
Và bây giờ, trao tặng giọng nói
cũng sẽ làm thay đổi cuộc đời.
10:24
All we need is a fewvài hoursgiờ of speechphát biểu
237
612939
3050
Tất cả những gì ta cần
là vài giờ nói chuyện
10:27
from our surrogatethay thế talkertalker,
238
615989
1491
từ những người hiến giọng,
10:29
and as little as a vowelnguyên âm from our targetMục tiêu talkertalker,
239
617480
4733
cũng như chỉ với vài nguyên âm
từ người cần giọng nói,
10:34
to createtạo nên a uniqueđộc nhất vocalgiọng hát identitydanh tính.
240
622213
3711
chúng ta có thể tạo ra
giọng nói cá nhân độc đáo.
10:37
So that's the sciencekhoa học behindphía sau what we're doing.
241
625924
2626
Đó là cơ sở khoa học
của việc chúng tôi đang làm.
10:40
I want to endkết thúc by circlingQuanh back to the humanNhân loại sidebên
242
628550
4455
Tôi muốn kết thúc bằng việc trở lại
nói về khía cạnh con người
10:45
that is really the inspirationcảm hứng for this work.
243
633005
4102
cảm hứng đưa chúng tôi
đến với dự án này.
10:49
About fivesố năm yearsnăm agotrước, we builtđược xây dựng our very first voicetiếng nói
244
637107
3699
Cách đây 5 năm, khi
xây dựng giọng nói đầu tiên
10:52
for a little boycon trai namedđặt tên WilliamWilliam.
245
640806
2501
cho một cậu bé tên là William.
10:55
When his mommẹ first heardnghe this voicetiếng nói,
246
643307
2357
Lần đầu tiên nghe được
giọng nói của con mình,
10:57
she said, "This is what WilliamWilliam
247
645664
2345
mẹ cậu ấy bảo,
11:00
would have soundednghe like
248
648009
1546
"Đây chính là giọng William
11:01
had he been ablecó thể to speaknói."
249
649555
2449
nếu như nó có thể nói."
11:04
And then I saw WilliamWilliam typingđánh máy a messagethông điệp
250
652004
2418
Và sau đó, tôi thấy William
11:06
on his devicethiết bị.
251
654422
1362
viết tin nhắn trên máy.
11:07
I wonderedtự hỏi, what was he thinkingSuy nghĩ?
252
655784
3293
Tôi tự hỏi, cậu ấy đang nghĩ gì?
11:11
ImagineHãy tưởng tượng carryingchở around someonengười nào else'scủa người khác voicetiếng nói
253
659077
3590
Hãy tưởng tượng mà xem,
ta mang giọng nói của một ai đó
11:14
for ninechín yearsnăm
254
662667
2193
trong 9 năm ròng
11:16
and finallycuối cùng findingPhát hiện your ownsở hữu voicetiếng nói.
255
664860
4844
và cuối cùng, tìm thấy
giọng nói của chính mình.
11:21
ImagineHãy tưởng tượng that.
256
669704
1377
Tưởng tượng thử xem.
11:23
This is what WilliamWilliam said:
257
671081
2797
Đây là điều William đã nói:
11:25
"Never heardnghe me before."
258
673878
4463
"Trước đây, chưa bao giờ
tôi nghe thấy tiếng mình."
11:32
Thank you.
259
680417
1619
Xin cảm ơn.
11:34
(ApplauseVỗ tay)
260
682036
4724
(Tiếng vỗ tay).
Translated by Nam Nguyen Cong
Reviewed by Nhu PHAM

▲Back to top

ABOUT THE SPEAKER
Rupal Patel - Speech scientist
People relying on synthetic speech use the voice they’re given, not their own. Rupal Patel created the vocaliD project to change that.

Why you should listen

Northeastern University computer science professor Rupal Patel looks for ways to give voice to the voiceless. As founder and director of the Communication Analysis and Design Laboratory (CadLab), she developed a technology that combines real human voices with the characteristics of individual speech patterns. The result is VocaliD, an innovation that gives people who can't speak the ability to communicate in a voice all their own.

"There's nothing better than seeing the person who's actually going to use it, seeing their reaction, seeing their smile," says Patel.

More profile about the speaker
Rupal Patel | Speaker | TED.com