English-Video.net comment policy

The comment field is common to all languages

Let's write in your language and use "Google Translate" together

Please refer to informative community guidelines on TED.com

TEDWomen 2013

Rupal Patel: Synthetic voices, as unique as fingerprints

ルパル・パテル: 指紋のようにユニークな合成音声

Filmed
Views 857,597

重度の言語障害をもつ多くの患者はコンピューターを駆使してコミュニケーションをはかっています。でもその音声の選択肢には限りがあります。そのため、イギリス人のスティーヴン・ホーキングの声はアメリカ訛りで、多くの人達が同じ声を使い、しばしば不似合いな声で我慢しているのです。スピーチ・サイエンティストのルパル・パテルはこの現状をどうにか変えたいと願いました。素晴らしい講演の中で、パテルは声なき人達のためにユニークな声を生み出す方法について紹介します。

- Speech scientist
People relying on synthetic speech use the voice they’re given, not their own. Rupal Patel created the vocaliD project to change that. Full bio

I'd like to talkトーク today今日
今日 皆さんにお話したいのは
00:12
about a powerful強力な and fundamental基本的な aspectアスペクト
私たちのあり方を決める
パワフルで
00:14
of who we我々 are: our我々の voice音声.
基礎的なもの―
「声」についてです
00:17
Each one1 of us has a uniqueユニークな voiceprint声紋
私たち一人一人に独特の声紋があり
00:20
thatそれ reflects反映する our我々の age年齢, our我々の sizeサイズ,
私たちの年齢、体格
00:23
even our我々の lifestyleライフスタイル and personality.
生活習慣や個性までも映し出します
00:25
In the words言葉 of the poet詩人 Longfellowロングフェロー,
ヘンリー・ワーズワース・ロングフェローは
00:29
"the human人間 voice音声 is the organ器官 of the soul."
「人の声は心のオルガン(心の臓器)である」と
詩でつづりました
00:31
As a speechスピーチ scientist科学者, I'm私は fascinated魅惑的な
スピーチ・サイエンティストである私は
00:35
by howどうやって the voice音声 is produced生産された,
発声の仕組みに魅せられ
00:37
and I have an ideaアイディア for howどうやって itそれ can be engineered設計された.
これを人工的に作り出す方法を
見つけました
00:39
That'sそれです what I'd like to shareシェア with〜と you君は.
これを皆さんと共有いたします
00:43
I'm私は going to start開始 by playing遊ぶ you君は a sampleサンプル
まずは皆さんが
ご存知かもしれない
00:45
of a voice音声 thatそれ you君は mayかもしれない recognize認識する.
声のサンプルを流します
00:47
(Recording録音) Stephenスティーヴン Hawkingホーキング: "I would have thought
(音声)スティーヴン・ホーキング:
「私が意図することは
00:49
itそれ was fairlyかなり obvious明らか what I meant意味した."
かなり明確だと思っていました」
00:50
Rupalルパール Patelパテル: Thatそれ was the voice音声
お聞きいただいたのは
00:53
of Professor教授 Stephenスティーヴン Hawkingホーキング.
スティーヴン・ホーキング教授の声です
00:54
What you君は mayかもしれない notない know知っている is thatそれ same同じ voice音声
皆さんが
ご存知ないかもしれないのは
00:56
mayかもしれない alsoまた、 be used by thisこの little少し girl女の子
同じ声を
こちらの女の子のような
01:00
who is unableできない to speak話す
神経疾患で話すことができない
01:02
becauseなぜなら of a neurological神経学 condition調子.
子供も使っている
可能性があることです
01:04
In fact事実, allすべて of theseこれら individuals個人
実は このような方々は
01:07
mayかもしれない be usingを使用して the same同じ voice音声,
声の選択肢が ごく限られているため
01:09
and that'sそれは becauseなぜなら there'sそこに
onlyのみ a few少数 optionsオプション available利用可能な.
同じ声を使っていることがあるのです
01:11
In the U.S. alone単独で, thereそこ are 2.5 million百万 Americansアメリカ人
アメリカだけでも
話すことができない人達が
01:14
who are unableできない to speak話す,
250万人もいます
01:19
and manyたくさんの of whom useつかいます computerizedコンピュータ化された devicesデバイス
その多くの人達が
コミュニケーション手段として
01:20
to communicate通信する.
コンピューターを使用します
01:23
Now that'sそれは millions何百万 of people worldwide世界的に
世界規模で
数百万の人々が
01:24
who are usingを使用して genericジェネリック voices,
人工音声を使っているのです
01:28
includingを含む Professor教授 Hawkingホーキング,
ホーキング教授も その1人で
01:30
who uses用途 an American-accentedアメリカンアクセント型 voice音声.
アメリカ訛りの音声を使っていますね
01:31
Thisこれ lack欠如 of individuation個性化 of the synthetic合成 voice音声
この個性に欠けた
合成音声には
01:36
really本当に hitヒット home自宅
本当にショックを受けました
01:39
whenいつ I was at an assistive補助的 technology技術 conference会議
数年前に障害を持つ人の
技術支援に関する会議に
01:41
a few少数 years ago,
参加した時のことです
01:43
and I recall想起 walking歩く into an exhibit示す hallホール
展示ホールに足を入れると
01:45
and seeing見る a little少し girl女の子 and a grown成長した manおとこ
小さい女の子から
成人男性まで
01:48
having持つ a conversation会話 usingを使用して their彼らの devicesデバイス,
それぞれの機器を使って
話しているんですが
01:52
different異なる devicesデバイス, butだけど the same同じ voice音声.
機器は違えど
同じ声でした
01:54
And I looked見た aroundまわり and I saw thisこの happeningハプニング
周りを見回すと
私の周りでも
01:59
allすべて aroundまわり me, literally文字通り hundreds数百 of individuals個人
同じことが起こっていました
文字通り数百人の人達が
02:01
usingを使用して a handful一握りの of voices,
ごく限られた音声を使っていて
02:05
voices thatそれ didn'tしなかった fitフィット their彼らの bodies
それぞれの身体や個性に
02:08
orまたは their彼らの personalities人格.
合っていないんです
02:11
We私たち wouldn'tしないだろう dream of fittingフィッティング a little少し girl女の子
小さい女の子に
成人男性用の義足を
02:13
with〜と the prosthetic補綴 limb手足 of a grown成長した manおとこ.
あてがうなんて想像できませんよね
02:15
Soだから whyなぜ then次に the same同じ prosthetic補綴 voice音声?
ではなぜ人工音声もそうしないのか?
02:19
Itそれ really本当に struck打たれた me,
これが大変気に掛かり
02:22
and I wanted to do something何か about thisこの.
この状況を何とかしたいと思ったのです
02:23
I'm私は going to play遊びます you君は now a sampleサンプル
これから お聞きいただくのは
02:27
of someone誰か who has, two people actually実際に,
重度の言語障害を患っている
02:29
who have severe厳しい speechスピーチ disorders障害.
2人の音声サンプルです
02:32
I want you君は to take a listen聴く to howどうやって they彼ら sound.
どのように聞こえるか
お聞きください
02:34
They're彼らは saying言って the same同じ utterance発話.
同じ内容を発話しています
02:37
(Firstまずは voice音声)
(第1音声)
02:39
(Second二番目 voice音声)
(第2音声)
02:42
Youあなたが probably多分 didn'tしなかった understandわかる what they彼ら said前記,
話の内容までは
分からなかったかもしれませんが
02:45
butだけど I hope希望 thatそれ you君は heard聞いた
2人の個性的な
02:48
their彼らの uniqueユニークな vocalボーカル identitiesアイデンティティ.
音声はお分かりいただけたでしょう
02:50
Soだから what I wanted to do next is,
次に私がやりたかったことは
02:54
I wanted to find見つける outでる howどうやって we我々 could harnessハーネス
このように残された
発話能力を
02:57
theseこれら residual残余 vocalボーカル abilities能力
活かして
02:59
and buildビルドする a technology技術
使用者に合わせて カスタマイズできる
03:01
thatそれ could be customizedカスタマイズされた for themそれら,
テクノロジー
つまり彼らのために
03:03
voices thatそれ could be customizedカスタマイズされた for themそれら.
カスタマイズできる声を
開発することでした
03:05
Soだから I reached到達した outでる to myじぶんの collaborator協力者, Timティム Bunnellブンネル.
そこで協力者の
ティム・バンネルに助言を仰ぎました
03:07
DrDr. Bunnellブンネル is an expert専門家 in speechスピーチ synthesis合成,
バンネル博士は音声合成の
第一人者で
03:10
and what he'd彼は been doing is building建物
彼がやっているのは
03:13
personalizedパーソナライズド voices for people
事前に録音してあった
03:15
by puttingパッティング together一緒に
本人の音声サンプルを用いて
03:17
pre-recorded事前に録音した samplesサンプル of their彼らの voice音声
音声を復元することで
03:19
and reconstructing再構築する a voice音声 for themそれら.
個人用の音声を作っているのです
03:21
Theseこれら are people who had lost失われた their彼らの voice音声
対象となるのは後天性の障害で
03:24
later後で in life.
声を失った人達です
03:26
We私たち didn'tしなかった have the luxury贅沢
生まれながらに
03:28
of pre-recorded事前に録音した samplesサンプル of speechスピーチ
言語障害がある人達には
03:29
for thoseそれら bornうまれた with〜と speechスピーチ disorder障害.
「事前に録音した音声サンプル」なんてありません
03:31
Butだがしかし I thought, thereそこ had to be a way
でも私が考えたのは
残された かすかな声から
03:33
to reverse engineerエンジニア a voice音声
その人の声を
03:36
fromから whateverなんでも little少し is left over.
蘇らせることができるはずだと
03:38
Soだから we我々 decided決定しました to do exactly正確に thatそれ.
そこで これに取り組むことにしたのです
03:40
We私たち setセット outでる with〜と a little少し bitビット of funding資金調達
fromから the Nationalナショナル Science科学 Foundation財団,
アメリカ国立科学財団から
わずかな資金援助を受け
03:43
to create作成する custom-craftedカスタムメイド voices thatそれ captured捕獲
話者の独特な声の特徴を反映した
03:46
their彼らの uniqueユニークな vocalボーカル identitiesアイデンティティ.
個人用音声の開発を始めました
03:50
We私たち callコール thisこの projectプロジェクト VocaliDVocaliD, orまたは vocalボーカル I.D.,
私たちは このプロジェクトを
“VocaliD”や“vocal I.D.”と
03:51
for vocalボーカル identity身元.
名づけました
03:54
Now before I get into the details詳細 of howどうやって
これから皆さんに
この特注の声がどのように作られ
03:56
the voice音声 is made and let you君は listen聴く to itそれ,
実際の声を お聞きいただく前に
03:59
I need必要 to give you君は a realリアル quickクイック
speechスピーチ science科学 lessonレッスン. Okayオーケー?
音声科学についての ごく簡単な講義をします
いいですか?
04:01
Soだから first最初, we我々 know知っている thatそれ the voice音声 is changing変化
まず私たちの音声は
成長過程において
04:05
dramatically劇的に over the courseコース of development開発.
劇的に変化します
04:08
Children子供 sound different異なる fromから teens十代の若者たち
小さな子供の声は
十代の人達と異なりますし
04:11
who sound different異なる fromから adults大人.
成人の人達も異なります
04:13
We've私たちは allすべて experienced経験豊富な thisこの.
皆さん これを経験しますね
04:14
Fact事実 number two is thatそれ speechスピーチ
2つ目の事実は発声とは
04:17
is a combination組み合わせ of the sourceソース,
皆さんの喉頭から発せられた
04:20
whichどの is the vibrations振動 generated生成された by yourきみの voice音声 boxボックス,
振動による音源が
04:23
whichどの are then次に pushed押された throughを通して
残りの声道を通過することで
04:26
the rest残り of the vocalボーカル tract.
起こります
04:28
Theseこれら are the chambers部屋 of yourきみの head and neckネック
皆さんの頭と首の中にある
スペースが
04:31
thatそれ vibrate振動する,
振動することで
04:33
and they彼ら actually実際に filterフィルタ thatそれ sourceソース sound
音源をフィルターにかけて
04:34
to produce作物 consonants子音 and vowels母音.
母音と子音が発音されるのです
04:36
Soだから the combination組み合わせ of sourceソース and filterフィルタ
つまり音源がフィルターにかかることが
04:39
is howどうやって we我々 produce作物 speechスピーチ.
発声のメカニズムなのです
04:43
And thatそれ happens起こる in one1 individual個人.
これが一人一人に起きているわけです
04:45
Now I told言った you君は earlier先に thatそれ I'd spent過ごした
先ほど申し上げたように
04:48
a good良い part of myじぶんの careerキャリア
私は重い言語障害を患う人達の
04:51
understanding理解 and studying勉強する
音源の特性についての
04:53
the sourceソース characteristics特性 of people
理解と研究に
長いこと
04:56
with〜と severe厳しい speechスピーチ disorder障害,
携わってきました
04:57
and what I've私は found見つけた
そこで気づいたのは
05:00
is thatそれ even thoughしかし their彼らの filtersフィルター were impaired障害者,
彼らのフィルターに障害があっても
05:01
they彼ら were ableできる to modulate変調する their彼らの sourceソース:
音源は調節可能であるということで
05:05
the pitchピッチ, the loudnessラウドネス, the tempoテンポ of their彼らの voice音声.
それは声のピッチ、大きさ、テンポです
05:08
Theseこれら are calledと呼ばれる prosody韻律, and
I've私は been documenting文書化する for years
これらはプロソディー(韻律)と呼ばれるもので
長年の調査で
05:11
thatそれ the prosodic韻律 abilities能力 of theseこれら individuals個人
言語障害者のプロソディーが
健在であることを
05:14
are preserved保存された.
実証してきました
05:16
Soだから whenいつ I realized実現した thatそれ thoseそれら same同じ cues合図
ですから これらの表現が
話し手のアイデンティティにも
05:18
are alsoまた、 important重要 for speakerスピーカー identity身元,
重要だと気づいた時
05:22
I had thisこの ideaアイディア.
このアイデアを思いついたのです
05:25
Whyなぜでしょうか don'tしない we我々 take the sourceソース
それは発話させたい人の
05:27
fromから the person we我々 want the voice音声 to sound like,
音源を使い
05:29
becauseなぜなら it'sそれは preserved保存された,
―これは残っているんですね
05:32
and borrowかりて the filterフィルタ
対象となる人と同じ年齢で
05:33
fromから someone誰か about the same同じ age年齢 and sizeサイズ,
同じ体格の人から
フィルターを借りて
05:35
becauseなぜなら they彼ら can articulate明瞭な speechスピーチ,
この明瞭な音声と
05:39
and then次に mixミックス themそれら?
混ぜたらどうかと考えたのです
05:41
Becauseというのは whenいつ we我々 mixミックス themそれら,
合成した声は
05:43
we我々 can get a voice音声 that'sそれは as clearクリア
フィルターを借りた
05:44
as our我々の surrogate代理 talkerトーカー --
代理話者と同じくらい
05:46
that'sそれは the person we我々 borrowed借りた the filterフィルタ fromから
明瞭な声で
私たちがターゲットとしている話者の
05:48
and is similar類似 in identity身元 to our我々の targetターゲット talkerトーカー.
アイデンティティにも
類似しているんです
05:51
It'sそれは、します。 thatそれ simple単純.
こんなに簡単なんです
05:55
That'sそれです the science科学 behind後ろに what we're私たちは doing.
これが私たちがやっていることの
裏にある科学です
05:57
Soだから once一度 you君は have thatそれ in mindマインド,
では アイデアが思いついたところで
06:00
howどうやって do you君は go about building建物 thisこの voice音声?
どうやって実際に声を構築したらいいでしょう?
06:03
Well, you君は have to find見つける someone誰か
まずはフィルターを提供してくれる人を
探す必要がありました
06:05
who is willing喜んで to be a surrogate代理.
まずはフィルターを提供してくれる人を
探す必要がありました
06:07
It'sそれは、します。 notない suchそのような an ominous不吉 thingもの.
全然難しいことではないんです
06:09
Beingであること a surrogate代理 donorドナー
提供者になるということは
06:11
onlyのみ requires要求する you君は to sayいう a few少数 hundred
数百から数千の言葉を
06:13
to a few少数 thousand utterances発話.
発声するだけです
06:16
The processプロセス goes行く something何か like thisこの.
この過程はこんな感じです
06:18
(Videoビデオ) Voice音声: Thingsもの happen起こる in pairsペア.
声:物事は対になって起こります
06:20
I love to sleep睡眠.
寝るのが大好きです
06:22
The sky is blue withoutなし clouds.
雲一つない青い空です
06:24
RPRP: Now she's彼女は going to go on like thisこの
これを3時間から
06:28
for about three to four4つの hours時間,
4時間ほど続けます
06:30
and the ideaアイディア is notない for her彼女 to sayいう everythingすべて
ここでのポイントは
対象となる人が話したい文章を
06:32
thatそれ the targetターゲット is going to want to sayいう,
代理人に言わせるのではなく
06:35
butだけど the ideaアイディア is to coverカバー allすべて the different異なる combinations組み合わせ
言葉の中で生じる
全ての異なる
06:37
of the sounds thatそれ occur発生する in the language言語.
音の組み合わせを
拾っていくことです
06:40
The moreもっと speechスピーチ you君は have,
サンプルが多ければ多いほど
06:44
the betterより良い sounding聞こえる voice音声 you'reあなたは going to have.
より質の良い声を得ることができます
06:45
Once一度 you君は have thoseそれら recordings録音,
収録が終わったら
06:48
what we我々 need必要 to do
次に必要なのは
06:49
is we我々 have to parse解析する theseこれら recordings録音
読まれた文章を解析し
06:51
into little少し snippetsスニペット of speechスピーチ,
言語の要素に分割することです
06:53
one-1- orまたは two-sound2音色 combinations組み合わせ,
1つの音や 2つの音の組み合わせや
06:56
sometimes時々 even whole全体 words言葉
時には 単語全体を
06:58
thatそれ start開始 populatingポピュレートする a datasetデータセット orまたは a databaseデータベース.
データセットすなわちデータベースに
集積していきます
07:00
We're我々 はしています。 going to callコール thisこの databaseデータベース a voice音声 bankバンク.
このデータベースを
音声バンクと呼びましょう
07:05
Now the powerパワー of the voice音声 bankバンク
音声バンクのパワフルな点は
07:08
is thatそれ fromから thisこの voice音声 bankバンク,
この音声バンクから
07:10
we我々 can now sayいう anyどれか new新しい utterance発話,
新しい言葉を発声できることで
07:12
like, "I love chocolateチョコレート" --
「チョコレートが好き」とか
07:14
everyoneみんな needsニーズ to be ableできる to sayいう thatそれ
これは誰でも言いたいですよね
07:16
fish throughを通して thatそれ databaseデータベース
データベースを駆使して
07:18
and find見つける allすべて the segmentsセグメント necessary必要
その言葉の発声に必要な
07:19
to sayいう thatそれ utterance発話.
全ての断片を見つけるのです
07:21
(Videoビデオ) Voice音声: I love chocolateチョコレート.
声:チョコレートが好きです
07:23
RPRP: Soだから that'sそれは speechスピーチ synthesis合成.
これが音声合成です
07:25
It'sそれは、します。 calledと呼ばれる concatenative連結 synthesis合成,
and that'sそれは what we're私たちは usingを使用して.
波形接続合成という
私たちが使っている手法です
07:26
That'sそれです notない the novel小説 part.
これは目新しくありませんが
07:29
What's何の novel小説 is howどうやって we我々 make作る itそれ sound
新しい点は どうやって
この若い女性が
07:31
like thisこの young若い woman女性.
話すような音声にするかです
07:33
Thisこれ is Samanthaサマンサ.
彼女の名前はサマンサです
07:34
I met会った her彼女 whenいつ she彼女 was nine9人,
私が彼女に出会ったのは
07:36
and since以来 then次に, myじぶんの teamチーム and I
彼女が9歳の時で
07:38
have been trying試す to buildビルドする her彼女 a personalizedパーソナライズド voice音声.
私のチームは
彼女のための声を構築してきました
07:40
We私たち first最初 had to find見つける a surrogate代理 donorドナー,
まずは代理ドナーを探して
07:43
and then次に we我々 had to have Samanthaサマンサ
サマンサにも いくつかの
07:46
produce作物 some一部 utterances発話.
発声をお願いしました
07:48
What she彼女 can produce作物 are mostly主に vowel-like母音のような sounds,
彼女が発声できるのは
主に母音だけですが
07:50
butだけど that'sそれは enough十分な for us to extractエキス
彼女の音源特性を引き出すのには
07:52
her彼女 sourceソース characteristics特性.
十分な情報でした
07:54
What happens起こる next is bestベスト described記載された
次のステップは
07:57
by myじぶんの daughter's娘の analogy類推. She's彼女は six6.
私の6歳の娘が上手く例えています
08:00
She彼女が callsコール itそれ mixing混合 colors to paintペイント voices.
娘は「声を色づかせるために
絵の具を混ぜているんだね」と
08:03
It'sそれは、します。 beautiful綺麗な. It'sそれは、します。 exactly正確に thatそれ.
きれいですよね
まさにその通りなんです
08:08
Samantha'sサマンサ voice音声 is like a concentrated濃縮 sampleサンプル
サマンサの声は
濃縮された食紅のように
08:11
of red foodフード dye染料 whichどの we我々 can infuse注入する
彼女の代理ドナーの
録音した声に混ぜることで
08:14
into the recordings録音 of her彼女 surrogate代理
彼女の代理ドナーの
録音した声に混ぜることで
08:16
to get a pinkピンク voice音声 justちょうど like thisこの.
ピンク色の声になるのです
まさに こんな風に
08:19
(Videoビデオ) Samanthaサマンサ: Aaaaaahアアアア.
サマンサ:ああああああ
08:23
RPRP: Soだから now, Samanthaサマンサ can sayいう thisこの.
今では こんな風に話せます
08:28
(Videoビデオ) Samanthaサマンサ: Thisこれ voice音声 is onlyのみ for me.
サマンサ:この声は私だけのもの
08:30
I can'tできない wait待つ to useつかいます myじぶんの new新しい voice音声 with〜と myじぶんの friends友達.
友達と新しい声で話すのが楽しみ
08:34
RPRP: Thankありがとうございます you君は. (Applause拍手)
ありがとう (拍手)
08:40
I'll never決して forget忘れる the gentle優しい smileスマイル
彼女が 最初に
この声を聞いた時の
08:46
thatそれ spread普及 across横断する her彼女 face
顔いっぱいに広がった
08:49
whenいつ she彼女 heard聞いた thatそれ voice音声 for the first最初 time時間.
優しい笑みは ずっと忘れないでしょう
08:50
Now there'sそこに millions何百万 of people
世界中には数百万人もの
08:54
aroundまわり the world世界 like Samanthaサマンサ, millions何百万,
サマンサのような人々がいます
数百万ですよ
08:56
and we've私たちは onlyのみ begun始まった to scratchスクラッチ the surface表面.
私たちの取り組みは
まだまだ始まったばかりです
08:59
What we've私たちは done完了 soそう far遠い is we我々 have
これまでの取り組みは
09:02
a few少数 surrogate代理 talkers話す人 fromから aroundまわり the U.S.
アメリカ国内で
声を提供してくれる人々を
09:04
who have donated寄付された their彼らの voices,
数名集めて
09:08
and we我々 have been usingを使用して thoseそれら
私たちの初の試みとなる
09:09
to buildビルドする our我々の first最初 few少数 personalizedパーソナライズド voices.
個人用の声の構築に
利用しています
09:11
Butだがしかし there'sそこに soそう muchたくさん moreもっと work to be done完了.
でも やることは山ほどあります
09:16
For Samanthaサマンサ, her彼女 surrogate代理
例えばサマンサの代理ドナーは
09:17
came来た fromから somewhereどこかで in the Midwest中西部, a strangerストレンジャー
中西部の出身で
見ず知らずの他人が
09:20
who gave与えた her彼女 the gift贈り物 of voice音声.
声の贈り物をしてくれたのです
09:23
And as a scientist科学者, I'm私は soそう excited興奮した
私が科学者として
とても楽しみなのは
09:27
to take thisこの work outでる of the laboratory研究室
研究室でやっていた仕事を
09:29
and finally最後に into the realリアル world世界
ついに実用化して
09:31
soそう itそれ can have real-world現実の世界 impact影響.
実社会に影響を与えることです
09:32
What I want to shareシェア with〜と you君は next
次に皆さんと共有させていただくのは
09:36
is howどうやって I envision想像 taking取る thisこの work
この成果を
どうやって次のレベルに
09:37
to thatそれ next levelレベル.
進めるかです
09:39
I imagine想像する a whole全体 world世界 of surrogate代理 donorsドナー
私が考えているのは
世界中の あらゆる階層の人々
09:42
fromから allすべて walksあるきます of life, different異なる sizesサイズ, different異なる ages年齢,
異なる体格や
違う年齢層の人々が
09:46
coming到来 together一緒に in thisこの voice音声 driveドライブ
代理ドナーとなって
09:49
to give people voices
個性と同じくらい
09:52
thatそれ are as colorfulカラフル as their彼らの personalities人格.
色彩に富んだ声を
人々に贈ることです
09:55
To do thatそれ as a first最初 stepステップ,
これを叶えるための第一歩として
09:58
we've私たちは put together一緒に thisこの websiteウェブサイト, VocaliDVocaliD.org組織,
『VocaliD.org』というウェブサイトを
立ち上げました
10:01
as a way to bring持参する together一緒に thoseそれら
声や専門知識の提供を
10:04
who want to join参加する us as voice音声 donorsドナー,
募るためのサイトで
私たちのビジョンを
10:06
as expertise専門知識 donorsドナー,
いろいろな形で
10:08
in whateverなんでも way to make作る thisこの visionビジョン a reality現実.
支援してくれる人たちを
集める試みです
10:10
They彼らが sayいう thatそれ giving与える blood血液 can saveセーブ lives人生.
献血で他人の命を救うことができますね
10:15
Well, giving与える yourきみの voice音声 can change変化する lives人生.
声を提供することで
他人の人生を変えることができます
10:19
Allすべての we我々 need必要 is a few少数 hours時間 of speechスピーチ
ほんの数時間分の
代理話者の
10:24
fromから our我々の surrogate代理 talkerトーカー,
音声サンプルと
10:27
and as little少し as a vowel母音 fromから our我々の targetターゲット talkerトーカー,
声を受け取る人の発声した
母音が1つでもあれば
10:29
to create作成する a uniqueユニークな vocalボーカル identity身元.
独特な声のアイデンティティを
作れます
10:34
Soだから that'sそれは the science科学 behind後ろに what we're私たちは doing.
これが私たちがやっている裏にある
科学なんです
10:37
I want to end終わり by circling旋回する backバック to the human人間 side
この仕事に
インスピレーションをもたらしてくれた
10:40
thatそれ is really本当に the inspirationインスピレーション for thisこの work.
人間的な部分に立ち返ることで
締めくくります
10:45
About five years ago, we我々 built建てられた our我々の very非常に first最初 voice音声
約5年前のことです
私たちが最初に作った声は
10:49
for a little少し boy男の子 named名前 Williamウィリアム.
ウィリアムという男の子のためでした
10:52
Whenいつ his momママ first最初 heard聞いた thisこの voice音声,
母親が この声を始めて耳にした時
10:55
she彼女 said前記, "Thisこれ is what Williamウィリアム
「まさにウィリアムの声だ
10:57
would have sounded聞こえた like
もし この子が話せていたら
11:00
had he been ableできる to speak話す."
きっとこんな声だったに違いない」と
11:01
And then次に I saw Williamウィリアム typingタイピング a messageメッセージ
するとウィリアムが
彼の機器で
11:04
on his deviceデバイス.
メッセージをタイプするんです
11:06
I wondered疑問に思った, what was he thinking考え?
私は彼が何を考えているのか
思いを馳せました
11:07
Imagine想像する carrying運ぶ aroundまわり someone誰か else's他の voice音声
9年間も他人の声を使っていた
11:11
for nine9人 years
男の子が
11:14
and finally最後に finding所見 yourきみの own自分の voice音声.
ついに自分の声を手に入れたのです
11:16
Imagine想像する thatそれ.
どんな気分だと思いますか
11:21
Thisこれ is what Williamウィリアム said前記:
ウィリアムはこう言いました
11:23
"Neverぜんぜん heard聞いた me before."
「自分の声でしゃべったのは初めてだ」
11:25
Thankありがとうございます you君は.
ありがとうございました
11:32
(Applause拍手)
(拍手)
11:34
Translated by Mari Arimitsu
Reviewed by Akiko Hicks

▲Back to top

About the speaker:

Rupal Patel - Speech scientist
People relying on synthetic speech use the voice they’re given, not their own. Rupal Patel created the vocaliD project to change that.

Why you should listen

Northeastern University computer science professor Rupal Patel looks for ways to give voice to the voiceless. As founder and director of the Communication Analysis and Design Laboratory (CadLab), she developed a technology that combines real human voices with the characteristics of individual speech patterns. The result is VocaliD, an innovation that gives people who can't speak the ability to communicate in a voice all their own.

"There's nothing better than seeing the person who's actually going to use it, seeing their reaction, seeing their smile," says Patel.

More profile about the speaker
Rupal Patel | Speaker | TED.com