ABOUT THE SPEAKER
Deb Roy - Cognitive scientist
Deb Roy studies how children learn language, and designs machines that learn to communicate in human-like ways. On sabbatical from MIT Media Lab, he's working with the AI company Bluefin Labs.

Why you should listen

Deb Roy directs the Cognitive Machines group at the MIT Media Lab, where he studies how children learn language, and designs machines that learn to communicate in human-like ways. To enable this work, he has pioneered new data-driven methods for analyzing and modeling human linguistic and social behavior. He has authored numerous scientific papers on artificial intelligence, cognitive modeling, human-machine interaction, data mining, and information visualization.

Deb Roy was the co-founder and serves as CEO of Bluefin Labs, a venture-backed technology company. Built upon deep machine learning principles developed in his research over the past 15 years, Bluefin has created a technology platform that analyzes social media commentary to measure real-time audience response to TV ads and shows.

Follow Deb Roy on Twitter>

Roy adds some relevant papers:

Deb Roy. (2009). New Horizons in the Study of Child Language Acquisition. Proceedings of Interspeech 2009. Brighton, England. bit.ly/fSP4Qh

Brandon C. Roy, Michael C. Frank and Deb Roy. (2009). Exploring word learning in a high-density longitudinal corpus. Proceedings of the 31st Annual Meeting of the Cognitive Science Society. Amsterdam, Netherlands. bit.ly/e1qxej

Plenty more papers on our research including technology and methodology can be found here, together with other research from my lab at MIT: bit.ly/h3paSQ

The work that I mentioned on relationships between television content and the social graph is being done at Bluefin Labs (www.bluefinlabs.com). Details of this work have not been published. The social structures we are finding (and that I highlighted in my TED talk) are indeed new. The social media communication channels that are leading to their formation did not even exist a few years ago, and Bluefin's technology platform for discovering these kinds of structures is the first of its kind. We'll certainly have more to say about all this as we continue to dig into this fascinating new kind of data, and as new social structures continue to evolve!

More profile about the speaker
Deb Roy | Speaker | TED.com
TED2011

Deb Roy: The birth of a word

Deb Roy:一個字詞的誕生

Filmed:
2,809,941 views

MIT研究員Deb Roy想了解他襁褓中的兒子如何學習語言,因此在家裡裝設了攝影機,以便了解他兒子在生命中的每一個時刻(包含例外),然後分析了九萬個小時的家庭影片,觀察「gaaaa」慢慢地轉變為「water」的過程。在驚人且豐富的資料研究之下,富含深遠意義,幫助了解我們是如何學習。
- Cognitive scientist
Deb Roy studies how children learn language, and designs machines that learn to communicate in human-like ways. On sabbatical from MIT Media Lab, he's working with the AI company Bluefin Labs. Full bio

Double-click the English transcript below to play the video.

00:15
Imagine想像 if you could record記錄 your life --
0
0
4000
想一想,如果你能記錄下你的生命-
00:19
everything you said, everything you did,
1
4000
3000
你的一言、你的一行
00:22
available可得到 in a perfect完善 memory記憶 store商店 at your fingertips指尖,
2
7000
3000
指頭點按一下,即可從完美的記憶體取得
00:25
so you could go back
3
10000
2000
那麽你便能回顧
00:27
and find memorable難忘 moments瞬間 and relive復活 them,
4
12000
3000
重溫值得回憶的時刻
00:30
or sift through通過 traces痕跡 of time
5
15000
3000
或是在過去的時光中篩選
00:33
and discover發現 patterns模式 in your own擁有 life
6
18000
2000
並發現自己的生命中
00:35
that previously先前 had gone走了 undiscovered未被發現.
7
20000
3000
先前沒有注意到的模式
00:38
Well that's exactly究竟 the journey旅程
8
23000
2000
那就是我的家庭
00:40
that my family家庭 began開始
9
25000
2000
在過去五年半以來
00:42
five and a half years年份 ago.
10
27000
2000
經過的歷程
00:44
This is my wife妻子 and collaborator合作者, RupalRupal線路.
11
29000
3000
這是我太太也是同事Rupal
00:47
And on this day, at this moment時刻,
12
32000
2000
就是在那一天的那一刻
00:49
we walked into the house with our first child兒童,
13
34000
2000
我們帶著第一個孩子
00:51
our beautiful美麗 baby寶寶 boy男孩.
14
36000
2000
漂亮的兒子進入家門
00:53
And we walked into a house
15
38000
3000
我們走進的房子是一棟
00:56
with a very special特別 home video視頻 recording記錄 system系統.
16
41000
4000
裝配了非常特別的錄影系統的房子
01:07
(Video視頻) Man: Okay.
17
52000
2000
(影片) 男聲:好了
01:10
Deb德布 Roy羅伊: This moment時刻
18
55000
1000
Deb Roy:這個時刻以及
01:11
and thousands數千 of other moments瞬間 special特別 for us
19
56000
3000
其他無數個對我們而言是特別的時刻
01:14
were captured捕獲 in our home
20
59000
2000
都在我們家被記錄下來了
01:16
because in every一切 room房間 in the house,
21
61000
2000
因爲在房裡的每個房間
01:18
if you looked看著 up, you'd see a camera相機 and a microphone麥克風,
22
63000
3000
如果往上看就會看到攝影機和麥克風
01:21
and if you looked看著 down,
23
66000
2000
如果往下看
01:23
you'd get this bird's-eye鳥瞰 view視圖 of the room房間.
24
68000
2000
就能鳥瞰這房間
01:25
Here's這裡的 our living活的 room房間,
25
70000
3000
這是我們的客廳
01:28
the baby寶寶 bedroom臥室,
26
73000
3000
這是嬰兒房
01:31
kitchen廚房, dining用餐 room房間
27
76000
2000
廚房、飯廳
01:33
and the rest休息 of the house.
28
78000
2000
還有房子的其他地方
01:35
And all of these fed美聯儲 into a disc圓盤 array排列
29
80000
3000
這些都儲存到一組設計來
01:38
that was designed設計 for a continuous連續 capture捕獲.
30
83000
3000
攫取連續影音的硬碟中
01:41
So here we are flying飛行 through通過 a day in our home
31
86000
3000
現在快速看一下我們家的一天
01:44
as we move移動 from sunlit陽光 morning早上
32
89000
3000
從太陽升起的早晨
01:47
through通過 incandescent白熾燈 evening晚間
33
92000
2000
到點亮燈火的夜晚
01:49
and, finally最後, lights燈火 out for the day.
34
94000
3000
到最後熄燈就寢
01:53
Over the course課程 of three years年份,
35
98000
3000
這整整三年裡
01:56
we recorded記錄 eight to 10 hours小時 a day,
36
101000
2000
我們每天紀錄
01:58
amassing再再 roughly大致 a quarter-million25萬 hours小時
37
103000
3000
8到10個小時
02:01
of multi-track多軌 audio音頻 and video視頻.
38
106000
3000
積聚了大約25萬小時的影音
02:04
So you're looking at a piece of what is by far
39
109000
2000
大家現在看到的是有史以來
02:06
the largest最大 home video視頻 collection採集 ever made製作.
40
111000
2000
最長的家庭影集的一小部分
02:08
(Laughter笑聲)
41
113000
3000
(笑聲)
02:11
And what this data數據 represents代表
42
116000
2000
這些資料所代表的
02:13
for our family家庭 at a personal個人 level水平,
43
118000
4000
對我的家庭而言,在個人的層面上
02:17
the impact碰撞 has already已經 been immense巨大,
44
122000
2000
已有巨大的影響
02:19
and we're still learning學習 its value.
45
124000
3000
我們仍須進一步了解其中的意義
02:22
Countless無數 moments瞬間
46
127000
2000
有無數的時刻
02:24
of unsolicited不請自來 natural自然 moments瞬間, not posed構成 moments瞬間,
47
129000
3000
無預期、不造作的自然時刻
02:27
are captured捕獲 there,
48
132000
2000
都被記錄了起來
02:29
and we're starting開始 to learn學習 how to discover發現 them and find them.
49
134000
3000
我們還在學習如何發現找到那些時刻
02:32
But there's also a scientific科學 reason原因 that drove開車 this project項目,
50
137000
3000
不過這個專案也有其科學上的目的
02:35
which哪一個 was to use this natural自然 longitudinal data數據
51
140000
4000
爲的是要利用這個縱向紀錄的資料
02:39
to understand理解 the process處理
52
144000
2000
來了解一個小孩
02:41
of how a child兒童 learns獲悉 language語言 --
53
146000
2000
如何學習語言-
02:43
that child兒童 being存在 my son兒子.
54
148000
2000
那個小孩就是我的兒子
02:45
And so with many許多 privacy隱私 provisions規定 put in place地點
55
150000
4000
在設置隱私保護的條件下
02:49
to protect保護 everyone大家 who was recorded記錄 in the data數據,
56
154000
3000
讓每個在影片中的人都受到保護
02:52
we made製作 elements分子 of the data數據 available可得到
57
157000
3000
我們讓我信任的MIT
02:55
to my trusted信任 research研究 team球隊 at MITMIT
58
160000
3000
研究團隊取用這些資料
02:58
so we could start開始 teasing戲弄 apart距離 patterns模式
59
163000
3000
於是我們可以開始從這巨大的
03:01
in this massive大規模的 data數據 set,
60
166000
3000
資料集裡拆解出其中的模式
03:04
trying to understand理解 the influence影響 of social社會 environments環境
61
169000
3000
試圖了解社交環境
03:07
on language語言 acquisition獲得.
62
172000
2000
對語言習得有哪些影響
03:09
So we're looking here
63
174000
2000
我們看到這裡
03:11
at one of the first things we started開始 to do.
64
176000
2000
這是我們首先進行的
03:13
This is my wife妻子 and I cooking烹飪 breakfast早餐 in the kitchen廚房,
65
178000
4000
這是太太和我在廚房做早餐
03:17
and as we move移動 through通過 space空間 and through通過 time,
66
182000
3000
當我們在時空中移動
03:20
a very everyday每天 pattern模式 of life in the kitchen廚房.
67
185000
3000
會出現一條在廚房裡的日常生活軌跡
03:23
In order訂購 to convert兌換
68
188000
2000
爲了轉換
03:25
this opaque不透明, 90,000 hours小時 of video視頻
69
190000
3000
這九萬小時的影像
03:28
into something that we could start開始 to see,
70
193000
2000
成爲能辨識的東西
03:30
we use motion運動 analysis分析 to pull out,
71
195000
2000
我們利用動作分析
03:32
as we move移動 through通過 space空間 and through通過 time,
72
197000
2000
汲取我們的移動軌跡
03:34
what we call space-time時空 worms蠕蟲.
73
199000
3000
我們稱之爲「時空蟲」
03:37
And this has become成為 part部分 of our toolkit工具包
74
202000
3000
這是我們的工具之一
03:40
for being存在 able能夠 to look and see
75
205000
3000
用來查看
03:43
where the activities活動 are in the data數據,
76
208000
2000
資料中所發生的活動
03:45
and with it, trace跟踪 the pattern模式 of, in particular特定,
77
210000
3000
再利用此法去追蹤,特別是
03:48
where my son兒子 moved移動 throughout始終 the home,
78
213000
2000
我兒子在家中活動的軌跡
03:50
so that we could focus焦點 our transcription轉錄 efforts努力,
79
215000
3000
好讓我們能聚焦在解讀
03:53
all of the speech言語 environment環境 around my son兒子 --
80
218000
3000
有關我兒子學說話的環境-
03:56
all of the words that he heard聽說 from myself, my wife妻子, our nanny保姆,
81
221000
3000
所有他聽到的我、我太太和保姆說的字詞
03:59
and over time, the words he began開始 to produce生產.
82
224000
3000
然後經過長時間他開始說那樣的字詞
04:02
So with that technology技術 and that data數據
83
227000
3000
利用那樣的科技和資料
04:05
and the ability能力 to, with machine assistance幫助,
84
230000
2000
再利用機器輔助
04:07
transcribe錄製 speech言語,
85
232000
2000
便能轉譯他說出的言語
04:09
we've我們已經 now transcribed轉錄
86
234000
2000
我們現在已經轉譯完成
04:11
well over seven million百萬 words of our home transcripts成績單.
87
236000
3000
足足超過700萬個家中言談的字詞
04:14
And with that, let me take you now
88
239000
2000
我們利用這樣的轉譯來
04:16
for a first tour遊覽 into the data數據.
89
241000
3000
瀏覽一下這些資料
04:19
So you've all, I'm sure,
90
244000
2000
我相信各位一定
04:21
seen看到 time-lapse時間推移 videos視頻
91
246000
2000
都看過時間推移影片
04:23
where a flower will blossom開花 as you accelerate加速 time.
92
248000
3000
加快時間推移就可以看到花朵綻放
04:26
I'd like you to now experience經驗
93
251000
2000
我現在想讓各位體驗一下
04:28
the blossoming朵朵 of a speech言語 form形成.
94
253000
2000
言語的花朵是怎麽綻放的
04:30
My son兒子, soon不久 after his first birthday生日,
95
255000
2000
我兒子過第一個生日後不久
04:32
would say "gaga加加" to mean water.
96
257000
3000
會說「gaga」來表示「水」
04:35
And over the course課程 of the next下一個 half-year半年,
97
260000
3000
再接下來的半年時間裡
04:38
he slowly慢慢地 learned學到了 to approximate近似
98
263000
2000
他慢慢學會說出接近
04:40
the proper正確 adult成人 form形成, "water."
99
265000
3000
成年人說的正確的「water」
04:43
So we're going to cruise巡航 through通過 half a year
100
268000
2000
我們現在要用40秒
04:45
in about 40 seconds.
101
270000
2000
快步瀏覽半年的歷程
04:47
No video視頻 here,
102
272000
2000
這裡不播放影片
04:49
so you can focus焦點 on the sound聲音, the acoustics聲學,
103
274000
3000
這樣各位便能聚焦在聲音的
04:52
of a new kind of trajectory彈道:
104
277000
2000
這種新的軌跡變化
04:54
gaga加加 to water.
105
279000
2000
從gaga到水
04:56
(Audio音頻) Baby寶寶: GagagagagagaGagagagagaga
106
281000
12000
(語音) 嬰兒:Gagagagagaga
05:08
Gaga加加 gaga加加 gaga加加
107
293000
4000
Gaga gaga gaga
05:12
gugaGUGA gugaGUGA gugaGUGA
108
297000
5000
guga guga guga
05:17
wada世界反興奮劑機構 gaga加加 gaga加加 gugaGUGA gaga加加
109
302000
5000
wada gaga gaga guga gaga
05:22
wader涉水 gugaGUGA gugaGUGA
110
307000
4000
wader guga guga
05:26
water water water
111
311000
3000
water water water
05:29
water water water
112
314000
6000
water water water
05:35
water water
113
320000
4000
water water
05:39
water.
114
324000
2000
water
05:41
DRDR: He sure nailed it, didn't he.
115
326000
2000
DR: 他的確說中了吧
05:43
(Applause掌聲)
116
328000
7000
(掌聲)
05:50
So he didn't just learn學習 water.
117
335000
2000
他不僅學到「水」這個字詞
05:52
Over the course課程 of the 24 months個月,
118
337000
2000
在24個月的歷程裡
05:54
the first two years年份 that we really focused重點 on,
119
339000
3000
頭兩年我們專注在這事上
05:57
this is a map地圖 of every一切 word he learned學到了 in chronological實足 order訂購.
120
342000
4000
這裡有張圖列出他學到的所有字詞的時序
06:01
And because we have full充分 transcripts成績單,
121
346000
3000
由於我們有完整的轉譯
06:04
we've我們已經 identified確定 each of the 503 words
122
349000
2000
我們辨識出他在第二個生日前學到的
06:06
that he learned學到了 to produce生產 by his second第二 birthday生日.
123
351000
2000
這503個字詞的每一個
06:08
He was an early talker健談.
124
353000
2000
他算是早說話的
06:10
And so we started開始 to analyze分析 why.
125
355000
3000
所以我們開始分析原因
06:13
Why were certain某些 words born天生 before others其他?
126
358000
3000
爲什麽有些字詞來得早?
06:16
This is one of the first results結果
127
361000
2000
這是最早發現的結果之一
06:18
that came來了 out of our study研究 a little over a year ago
128
363000
2000
大約一年前的研究結果
06:20
that really surprised詫異 us.
129
365000
2000
真的很讓我們吃驚
06:22
The way to interpret this apparently顯然地 simple簡單 graph圖形
130
367000
3000
這張圖看來簡單,但解讀起來
06:25
is, on the vertical垂直 is an indication跡象
131
370000
2000
在垂直線上有一顯示
06:27
of how complex複雜 caregiver護理人員 utterances話語 are
132
372000
3000
從言語長度來看,照顧者的話語
06:30
based基於 on the length長度 of utterances話語.
133
375000
2000
是很複雜的
06:32
And the [horizontal] axis is time.
134
377000
3000
垂直軸線表示時間
06:35
And all of the data數據,
135
380000
2000
我們將所有的資料
06:37
we aligned對齊 based基於 on the following以下 idea理念:
136
382000
3000
根據下述的想法排列:
06:40
Every一切 time my son兒子 would learn學習 a word,
137
385000
3000
每當發現我兒子就要學會一個字詞
06:43
we would trace跟踪 back and look at all of the language語言 he heard聽說
138
388000
3000
我們就回溯查看他先前聽到出現
06:46
that contained that word.
139
391000
2000
那個字詞的所有言語裡
06:48
And we would plot情節 the relative相對的 length長度 of the utterances話語.
140
393000
4000
我們就繪製出那個比較長的言語
06:52
And what we found發現 was this curious好奇 phenomena現象,
141
397000
3000
結果我們發現這麽一個奇特的現象
06:55
that caregiver護理人員 speech言語 would systematically系統 dip to a minimum最低限度,
142
400000
3000
照顧者都會有系統地把字詞減降到最少
06:58
making製造 language語言 as simple簡單 as possible可能,
143
403000
3000
讓語言儘量變得簡單
07:01
and then slowly慢慢地 ascend back up in complexity複雜.
144
406000
3000
然後又逐漸升回到複雜
07:04
And the amazing驚人 thing was
145
409000
2000
令人訝異的是
07:06
that bounce彈跳, that dip,
146
411000
2000
那個升、那個降
07:08
lined up almost幾乎 precisely恰恰
147
413000
2000
幾乎與每個字詞
07:10
with when each word was born天生 --
148
415000
2000
誕生的時間恰恰吻合-
07:12
word after word, systematically系統.
149
417000
2000
一詞接一詞,很有系統
07:14
So it appears出現 that all three primary caregivers護理人員 --
150
419000
2000
因此看來所有三個主要的照顧者-
07:16
myself, my wife妻子 and our nanny保姆 --
151
421000
3000
我自己、太太和我們的保姆-
07:19
were systematically系統 and, I would think, subconsciously下意識
152
424000
3000
都有系統地,而且我認為是下意識地
07:22
restructuring重組 our language語言
153
427000
2000
重新建構我們的語言
07:24
to meet遇到 him at the birth分娩 of a word
154
429000
3000
好迎接一個字詞的誕生
07:27
and bring帶來 him gently平緩 into more complex複雜 language語言.
155
432000
4000
然後讓我兒子慢慢學習更複雜的語言
07:31
And the implications啟示 of this -- there are many許多,
156
436000
2000
這之中蘊含了許多意義
07:33
but one I just want to point out,
157
438000
2000
但我現在想指出的一點是
07:35
is that there must必須 be amazing驚人 feedback反饋 loops循環.
158
440000
3000
這過程中必有令人驚異的反應循環
07:38
Of course課程, my son兒子 is learning學習
159
443000
2000
當然,我的兒子正在
07:40
from his linguistic語言 environment環境,
160
445000
2000
從他的語言環境中學習
07:42
but the environment環境 is learning學習 from him.
161
447000
3000
但他所處的環境也會跟著有調整
07:45
That environment環境, people, are in these tight feedback反饋 loops循環
162
450000
3000
環境和人也都在這緊密的反應循環裡
07:48
and creating創建 a kind of scaffolding腳手架
163
453000
2000
彼此建立起某種
07:50
that has not been noticed注意到 until直到 now.
164
455000
3000
以往沒有注意到的橋梁
07:54
But that's looking at the speech言語 context上下文.
165
459000
2000
不過,那是從言語情境來看
07:56
What about the visual視覺 context上下文?
166
461000
2000
若從視覺情境來看又是如何呢?
07:58
We're not looking at --
167
463000
2000
現在看到的還不是-
08:00
think of this as a dollhouse玩具屋 cutaway of our house.
168
465000
2000
想像這是我家剪下來的玩具屋
08:02
We've我們已經 taken採取 those circular fish-eye魚眼 lens鏡片 cameras相機,
169
467000
3000
我們使用環狀連結的魚眼攝影機
08:05
and we've我們已經 doneDONE some optical光纖 correction更正,
170
470000
2000
然後再做一些光學修正
08:07
and then we can bring帶來 it into three-dimensional三維 life.
171
472000
4000
因此我們可以做成3D影像
08:11
So welcome歡迎 to my home.
172
476000
2000
歡迎來到我家
08:13
This is a moment時刻,
173
478000
2000
這是其中一個時刻
08:15
one moment時刻 captured捕獲 across橫過 multiple cameras相機.
174
480000
3000
透過多重攝影機攫取的一個時刻
08:18
The reason原因 we did this is to create創建 the ultimate最終 memory記憶 machine,
175
483000
3000
這樣做是要創造出最高端的記憶機器
08:21
where you can go back and interactively交互式 fly around
176
486000
3000
可在其中以互動方式前後快速地搜尋
08:24
and then breathe呼吸 video-life視頻生活 into this system系統.
177
489000
3000
從而爲此系統的影像注入生息
08:27
What I'm going to do
178
492000
2000
我現在要讓各位
08:29
is give you an accelerated加速 view視圖 of 30 minutes分鐘,
179
494000
3000
看的是壓縮30分鐘的加快影像
08:32
again, of just life in the living活的 room房間.
180
497000
2000
這次也只在客廳裡
08:34
That's me and my son兒子 on the floor地板.
181
499000
3000
那是我和我兒子在地板上
08:37
And there's video視頻 analytics分析
182
502000
2000
加上了影片分析
08:39
that are tracking追踪 our movements運動.
183
504000
2000
追蹤我們的動作
08:41
My son兒子 is leaving離開 red ink墨水. I am leaving離開 green綠色 ink墨水.
184
506000
3000
我兒子留下紅色軌迹,我留下綠色軌迹
08:44
We're now on the couch長椅,
185
509000
2000
我們現在在沙發上
08:46
looking out through通過 the window窗口 at cars汽車 passing通過 by.
186
511000
3000
看著窗外駛過的汽車
08:49
And finally最後, my son兒子 playing播放 in a walking步行 toy玩具 by himself他自己.
187
514000
3000
最後我兒子獨自玩會動的玩具
08:52
Now we freeze凍結 the action行動, 30 minutes分鐘,
188
517000
3000
我們在此停格,這段有30分鐘
08:55
we turn time into the vertical垂直 axis,
189
520000
2000
我們把時間放到垂直軸上
08:57
and we open打開 up for a view視圖
190
522000
2000
然後從中來看一下
08:59
of these interaction相互作用 traces痕跡 we've我們已經 just left behind背後.
191
524000
3000
剛才留下來的互動軌迹
09:02
And we see these amazing驚人 structures結構 --
192
527000
3000
我們看到這個令人訝異的結構-
09:05
these little knots of two colors顏色 of thread
193
530000
3000
這些兩種顔色的小結點
09:08
we call "social社會 hot spots斑點."
194
533000
2000
我們稱之爲社交熱點
09:10
The spiral螺旋 thread
195
535000
2000
這個蜿蜒交纏的點串
09:12
we call a "solo獨奏 hot spot."
196
537000
2000
我們稱之爲單一熱點
09:14
And we think that these affect影響 the way language語言 is learned學到了.
197
539000
3000
我們認爲這些熱點對語言學習有影響
09:17
What we'd星期三 like to do
198
542000
2000
我們想要做的是
09:19
is start開始 understanding理解
199
544000
2000
開始理解
09:21
the interaction相互作用 between之間 these patterns模式
200
546000
2000
這些模式與我兒子接觸的
09:23
and the language語言 that my son兒子 is exposed裸露 to
201
548000
2000
語言之間的互動關係
09:25
to see if we can predict預測
202
550000
2000
看看是否能夠預測
09:27
how the structure結構體 of when words are heard聽說
203
552000
2000
聽到字詞時的結構
09:29
affects影響 when they're learned學到了 --
204
554000
2000
如何影響到字詞的學習-
09:31
so in other words, the relationship關係
205
556000
2000
換句話說就是
09:33
between之間 words and what they're about in the world世界.
206
558000
4000
字詞與現實世界之間的關係
09:37
So here's這裡的 how we're approaching接近 this.
207
562000
2000
這就是我們的解讀方法
09:39
In this video視頻,
208
564000
2000
在這個影片裡
09:41
again, my son兒子 is being存在 traced追踪 out.
209
566000
2000
同樣是追蹤我的兒子
09:43
He's leaving離開 red ink墨水 behind背後.
210
568000
2000
他留下紅色的軌迹
09:45
And there's our nanny保姆 by the door.
211
570000
2000
門旁的是我們的保姆
09:47
(Video視頻) Nanny保姆: You want water? (Baby寶寶: AaaaAAAA.)
212
572000
3000
(影片) 保姆:你要喝水?(嬰孩:Aaaa.)
09:50
Nanny保姆: All right. (Baby寶寶: AaaaAAAA.)
213
575000
3000
保姆:好的 (嬰孩:Aaaa.)
09:53
DRDR: She offers報價 water,
214
578000
2000
DR:她問他要不要水
09:55
and off go the two worms蠕蟲
215
580000
2000
然後兩條時空蟲
09:57
over to the kitchen廚房 to get water.
216
582000
2000
開始蠕動到廚房拿水
09:59
And what we've我們已經 doneDONE is use the word "water"
217
584000
2000
我們用來標示那個時刻
10:01
to tag標籤 that moment時刻, that bit of activity活動.
218
586000
2000
那個活動的字詞是「water」
10:03
And now we take the power功率 of data數據
219
588000
2000
我們現在有龐大的資料
10:05
and take every一切 time my son兒子
220
590000
3000
從中汲取我兒子何時聽到
10:08
ever heard聽說 the word water
221
593000
2000
「水」這個字以及
10:10
and the context上下文 he saw it in,
222
595000
2000
他看到水的情境
10:12
and we use it to penetrate穿透 through通過 the video視頻
223
597000
3000
我們利用來這些透析整個影片
10:15
and find every一切 activity活動 trace跟踪
224
600000
3000
找出每一個與水相關
10:18
that co-occurred共發生 with an instance of water.
225
603000
3000
同時發生的活動的軌迹
10:21
And what this data數據 leaves樹葉 in its wake喚醒
226
606000
2000
這些資料留下了
10:23
is a landscape景觀.
227
608000
2000
一幅風景
10:25
We call these wordscapeswordscapes.
228
610000
2000
我們稱之爲「字詞風景」
10:27
This is the wordscapewordscape for the word water,
229
612000
2000
這就是water的「字詞風景」
10:29
and you can see most of the action行動 is in the kitchen廚房.
230
614000
2000
各位可以看到大多在廚房發生
10:31
That's where those big peaks are over to the left.
231
616000
3000
即是在左邊那個大尖峰所表示的
10:34
And just for contrast對比, we can do this with any word.
232
619000
3000
做個比較,也可以爲別的字詞做個風景
10:37
We can take the word "bye再見"
233
622000
2000
比方說「good bye」裡的
10:39
as in "good bye再見."
234
624000
2000
這個「bye」
10:41
And we're now zoomed放大 in over the entrance入口 to the house.
235
626000
2000
我們現在放大房子入口部分
10:43
And we look, and we find, as you would expect期望,
236
628000
3000
我們查找也發現,各位看得出來
10:46
a contrast對比 in the landscape景觀
237
631000
2000
可以作爲對比的風景
10:48
where the word "bye再見" occurs發生 much more in a structured結構化的 way.
238
633000
3000
在那兒「bye」的頻率建構出清楚的風景
10:51
So we're using運用 these structures結構
239
636000
2000
所以我們利用這種風景結構
10:53
to start開始 predicting預測
240
638000
2000
開始進行預測
10:55
the order訂購 of language語言 acquisition獲得,
241
640000
3000
語言習得的先後順序
10:58
and that's ongoing不斷的 work now.
242
643000
2000
那就是在我們目前的工作
11:00
In my lab實驗室, which哪一個 we're peering窺視 into now, at MITMIT --
243
645000
3000
我在MIT的研究室-即是現在看到的-
11:03
this is at the media媒體 lab實驗室.
244
648000
2000
那是在媒體實驗室裡
11:05
This has become成為 my favorite喜愛 way
245
650000
2000
從影片汲取任何空間影像
11:07
of videographingvideographing just about any space空間.
246
652000
2000
已經成爲我最喜歡的方法
11:09
Three of the key people in this project項目,
247
654000
2000
這個專案有三個主要人物
11:11
Philip菲利普 DeCamp逃走, Rony羅尼 Kubat庫巴特 and Brandon布蘭登 Roy羅伊 are pictured合照 here.
248
656000
3000
即是影像裡的Philip DeCamp、Rony Kubat和Brandon Roy
11:14
Philip菲利普 has been a close collaborator合作者
249
659000
2000
Philip是大家看到的
11:16
on all the visualizations可視化 you're seeing眼看.
250
661000
2000
影片製作的同事
11:18
And Michael邁克爾 Fleischman弗萊施曼
251
663000
3000
還有Michael Fleischman是在我實驗室裡的
11:21
was another另一個 Ph博士.D. student學生 in my lab實驗室
252
666000
2000
另一位博士生
11:23
who worked工作 with me on this home video視頻 analysis分析,
253
668000
3000
他和我一同分析這支家庭影片
11:26
and he made製作 the following以下 observation意見:
254
671000
3000
他說了以下的意見:
11:29
that "just the way that we're analyzing分析
255
674000
2000
他說「我們分析
11:31
how language語言 connects所連接 to events事件
256
676000
3000
語言如何與事件相關聯
11:34
which哪一個 provide提供 common共同 ground地面 for language語言,
257
679000
2000
以作爲語言的共通基礎
11:36
that same相同 idea理念 we can take out of your home, Deb德布,
258
681000
4000
同樣想法也可帶到你家之外,Deb
11:40
and we can apply應用 it to the world世界 of public上市 media媒體."
259
685000
3000
我們可以用它來分析外面世界的公衆媒體」
11:43
And so our effort功夫 took an unexpected意外 turn.
260
688000
3000
結果我們的研究有了料想不到的轉折
11:46
Think of mass media媒體
261
691000
2000
想到公衆媒體
11:48
as providing提供 common共同 ground地面
262
693000
2000
提供共同的基礎
11:50
and you have the recipe食譜
263
695000
2000
那就可以將我們的
11:52
for taking服用 this idea理念 to a whole整個 new place地點.
264
697000
3000
想法帶到嶄新的境地
11:55
We've我們已經 started開始 analyzing分析 television電視 content內容
265
700000
3000
於是我們開始採用相同的原則
11:58
using運用 the same相同 principles原則 --
266
703000
2000
分析電視的內容-
12:00
analyzing分析 event事件 structure結構體 of a TV電視 signal信號 --
267
705000
3000
分析電視訊號的事件結構-
12:03
episodes發作 of shows節目,
268
708000
2000
播出節目的分集、
12:05
commercials廣告,
269
710000
2000
商業廣告、
12:07
all of the components組件 that make up the event事件 structure結構體.
270
712000
3000
構成事件結構的所有元件
12:10
And we're now, with satellite衛星 dishes碗碟, pulling and analyzing分析
271
715000
3000
結果我們現在用衛星碟抽出並分析
12:13
a good part部分 of all the TV電視 being存在 watched看著 in the United聯合的 States狀態.
272
718000
3000
相當一大部分在美國被觀看的電視節目
12:16
And you don't have to now go and instrument儀器 living活的 rooms客房 with microphones麥克風
273
721000
3000
現在不用再到各個客廳去裝設麥克風
12:19
to get people's人們 conversations對話,
274
724000
2000
來取得人們的談話
12:21
you just tune調 into publicly公然 available可得到 social社會 media媒體 feeds供稿.
275
726000
3000
只要收聽公衆能取得的社交媒體訊息就行了
12:24
So we're pulling in
276
729000
2000
於是我們每個月抽取
12:26
about three billion十億 comments註釋 a month,
277
731000
2000
大約三十億則電視評論
12:28
and then the magic魔法 happens發生.
278
733000
2000
然後美妙的事發生了
12:30
You have the event事件 structure結構體,
279
735000
2000
這當中可以找到事件結構
12:32
the common共同 ground地面 that the words are about,
280
737000
2000
那些字詞內容的共同基礎
12:34
coming未來 out of the television電視 feeds供稿;
281
739000
3000
從這些電視訊息裡透露出來
12:37
you've got the conversations對話
282
742000
2000
我們取得了關於
12:39
that are about those topics主題;
283
744000
2000
那些話題的談話
12:41
and through通過 semantic語義 analysis分析 --
284
746000
3000
再經過語意分析-大家現在看到的
12:44
and this is actually其實 real真實 data數據 you're looking at
285
749000
2000
確實是來自於我們進行
12:46
from our data數據 processing處理 --
286
751000
2000
資料處理的真實資料-
12:48
each yellow黃色 line is showing展示 a link鏈接 being存在 made製作
287
753000
3000
每一條黃線顯示一則評論
12:51
between之間 a comment評論 in the wild野生
288
756000
3000
在外間造成的連結
12:54
and a piece of event事件 structure結構體 coming未來 out of the television電視 signal信號.
289
759000
3000
於是從電視訊號逐漸顯出一點事件的結構
12:57
And the same相同 idea理念 now
290
762000
2000
同樣的想法現在
12:59
can be built內置 up.
291
764000
2000
可以用來建構關聯
13:01
And we get this wordscapewordscape,
292
766000
2000
於是我們得到了這個「字詞風景」
13:03
except now words are not assembled組裝 in my living活的 room房間.
293
768000
3000
只不過這些字詞並非在我家客廳裡組造出來的
13:06
Instead代替, the context上下文, the common共同 ground地面 activities活動,
294
771000
4000
而是情境,即共同基礎的活動
13:10
are the content內容 on television電視 that's driving主動 the conversations對話.
295
775000
3000
即電視的內容在推動談話
13:13
And what we're seeing眼看 here, these skyscrapers摩天大樓 now,
296
778000
3000
我們現在看到的這些高聳的結構
13:16
are commentary評論
297
781000
2000
都是電視評論
13:18
that are linked關聯 to content內容 on television電視.
298
783000
2000
在電視內容上有相互關聯
13:20
Same相同 concept概念,
299
785000
2000
同樣的構想
13:22
but looking at communication通訊 dynamics動力學
300
787000
2000
但請看它在另一個
13:24
in a very different不同 sphere領域.
301
789000
2000
非常不同的空間所造成的溝通動態
13:26
And so fundamentally從根本上, rather than, for example,
302
791000
2000
而且深入根本,舉例來說,
13:28
measuring測量 content內容 based基於 on how many許多 people are watching觀看,
303
793000
3000
與測量收視率所得的結果極爲不同
13:31
this gives us the basic基本 data數據
304
796000
2000
此研究讓我們得到了
13:33
for looking at engagement訂婚 properties性能 of content內容.
305
798000
3000
用來檢視內容「佔用特性」的基本資料
13:36
And just like we can look at feedback反饋 cycles週期
306
801000
3000
如同我們可以檢視一個
13:39
and dynamics動力學 in a family家庭,
307
804000
3000
家庭裡的反應循環和動態
13:42
we can now open打開 up the same相同 concepts概念
308
807000
3000
我們現在可以利用同樣的構想
13:45
and look at much larger groups of people.
309
810000
3000
檢視更大的人群
13:48
This is a subset子集 of data數據 from our database數據庫 --
310
813000
3000
這是從我們資料庫來的一個子集-
13:51
just 50,000 out of several一些 million百萬 --
311
816000
3000
只是透過公衆媒體來源取得的
13:54
and the social社會 graph圖形 that connects所連接 them
312
819000
2000
幾百萬則訊息中的五萬則
13:56
through通過 publicly公然 available可得到 sources來源.
313
821000
3000
以及其間互相關聯的「社交圖」
13:59
And if you put them on one plain,
314
824000
2000
如果把它們放到一個平面上
14:01
a second第二 plain is where the content內容 lives生活.
315
826000
3000
另一個平面是內容活躍的地方
14:04
So we have the programs程式
316
829000
3000
於是我們有了節目
14:07
and the sporting運動的 events事件
317
832000
2000
和體育運動事件
14:09
and the commercials廣告,
318
834000
2000
以及商業廣告
14:11
and all of the link鏈接 structures結構 that tie領帶 them together一起
319
836000
2000
還有所有把它們綁在一起的連結結構
14:13
make a content內容 graph圖形.
320
838000
2000
形成了一個「內容圖」
14:15
And then the important重要 third第三 dimension尺寸.
321
840000
4000
然後是重要的第三個面向
14:19
Each of the links鏈接 that you're seeing眼看 rendered呈現 here
322
844000
2000
大家在這裡看到的每個連結
14:21
is an actual實際 connection連接 made製作
323
846000
2000
是某個人說了某東西
14:23
between之間 something someone有人 said
324
848000
3000
和某一件內容之間的
14:26
and a piece of content內容.
325
851000
2000
真實關聯
14:28
And there are, again, now tens of millions百萬 of these links鏈接
326
853000
3000
這裡又有這些關聯的幾千萬條連結
14:31
that give us the connective結締組織 tissue組織 of social社會 graphs
327
856000
3000
這讓我們看見「社交圖」的「關聯組織」
14:34
and how they relate涉及 to content內容.
328
859000
3000
以及它們是如何與內容相關的情況
14:37
And we can now start開始 to probe探測 the structure結構體
329
862000
2000
我們現在可以開始用
14:39
in interesting有趣 ways方法.
330
864000
2000
有趣的方式來探索這個結構
14:41
So if we, for example, trace跟踪 the path路徑
331
866000
3000
例如,如果我們追蹤
14:44
of one piece of content內容
332
869000
2000
某一件內容的路徑
14:46
that drives驅動器 someone有人 to comment評論 on it,
333
871000
2000
那個內容讓某個人對它評論
14:48
and then we follow跟隨 where that comment評論 goes,
334
873000
3000
然後我們隨著那個評論的走向
14:51
and then look at the entire整個 social社會 graph圖形 that becomes activated活性
335
876000
3000
然後檢視整個啓動的「社交圖」
14:54
and then trace跟踪 back to see the relationship關係
336
879000
3000
然後又回頭追蹤查看那個「社交圖」
14:57
between之間 that social社會 graph圖形 and content內容,
337
882000
2000
和內容之間的關係
14:59
a very interesting有趣 structure結構體 becomes visible可見.
338
884000
2000
於是顯現出一個非常有趣的結構
15:01
We call this a co-viewing共同觀看 clique集團,
339
886000
2000
我們稱之爲「共看集團」
15:03
a virtual虛擬 living活的 room房間 if you will.
340
888000
3000
要說是一個虛擬客廳也可以
15:06
And there are fascinating迷人 dynamics動力學 at play.
341
891000
2000
這裡頭上演著引人注目的戲劇
15:08
It's not one way.
342
893000
2000
這不是單向的
15:10
A piece of content內容, an event事件, causes原因 someone有人 to talk.
343
895000
3000
一件內容,一個事件讓某個人說了話
15:13
They talk to other people.
344
898000
2000
這讓其他的人有感
15:15
That drives驅動器 tune-in調入 behavior行為 back into mass media媒體,
345
900000
3000
那就驅動了大衆傳媒的收視行爲
15:18
and you have these cycles週期
346
903000
2000
於是出現了這樣的循環
15:20
that drive駕駛 the overall總體 behavior行為.
347
905000
2000
驅動了整體的收視行爲
15:22
Another另一個 example -- very different不同 --
348
907000
2000
另一個例子-情況很不同
15:24
another另一個 actual實際 person in our database數據庫 --
349
909000
3000
我們的資料庫裡有一位人士-
15:27
and we're finding發現 at least最小 hundreds數以百計, if not thousands數千, of these.
350
912000
3000
其實我們可以找到成千上百個例子
15:30
We've我們已經 given特定 this person a name名稱.
351
915000
2000
我們給這位人士一個名字
15:32
This is a pro-amateur親業餘, or pro-am親我 media媒體 critic評論家
352
917000
3000
這是一位專業業餘者,或專業美國媒體評論員
15:35
who has this high fan-out扇出 rate.
353
920000
3000
此人有高度的粉絲收視率
15:38
So a lot of people are following以下 this person -- very influential有影響 --
354
923000
3000
許多人追隨這位人士-他很有影響力-
15:41
and they have a propensity傾向 to talk about what's on TV電視.
355
926000
2000
那些追隨者傾向於在電視上說話
15:43
So this person is a key link鏈接
356
928000
3000
那麽這位人士是關聯大衆傳媒
15:46
in connecting mass media媒體 and social社會 media媒體 together一起.
357
931000
3000
和社交媒體的一個主要連結
15:49
One last example from this data數據:
358
934000
3000
這份資料的最後一個例子是:
15:52
Sometimes有時 it's actually其實 a piece of content內容 that is special特別.
359
937000
3000
有時確實是一件特別的內容
15:55
So if we go and look at this piece of content內容,
360
940000
4000
因此我們現在來檢視這一件內容
15:59
President主席 Obama's奧巴馬 State of the Union聯盟 address地址
361
944000
3000
才幾個星期前的歐巴馬總統
16:02
from just a few少數 weeks ago,
362
947000
2000
國情咨文演講
16:04
and look at what we find in this same相同 data數據 set,
363
949000
3000
再檢視我們在這組資料中發現些什麽
16:07
at the same相同 scale規模,
364
952000
3000
用同樣的尺度來衡量
16:10
the engagement訂婚 properties性能 of this piece of content內容
365
955000
2000
這件內容的「佔用特性」
16:12
are truly remarkable卓越.
366
957000
2000
真是令人驚奇
16:14
A nation國家 exploding爆炸 in conversation會話
367
959000
2000
整個國家頓時同步
16:16
in real真實 time
368
961000
2000
爆發了談話
16:18
in response響應 to what's on the broadcast廣播.
369
963000
3000
那是對廣播的訊息所做出的反應
16:21
And of course課程, through通過 all of these lines
370
966000
2000
當然,所有這些連結線也
16:23
are flowing流動 unstructured非結構化 language語言.
371
968000
2000
也流動著缺乏結構的語言
16:25
We can X-rayX-射線
372
970000
2000
我們可以在「社交圖」上
16:27
and get a real-time即時的 pulse脈衝 of a nation國家,
373
972000
2000
透視一下
16:29
real-time即時的 sense
374
974000
2000
在不同的圈子裡
16:31
of the social社會 reactions反應 in the different不同 circuits電路 in the social社會 graph圖形
375
976000
3000
這個被這件內容啓動的國家
16:34
being存在 activated活性 by content內容.
376
979000
3000
有怎樣的即時脈動和即時官感
16:37
So, to summarize總結, the idea理念 is this:
377
982000
3000
總結來說,我們的想法是這樣的:
16:40
As our world世界 becomes increasingly日益 instrumented儀表
378
985000
3000
正當我們的世界變得越來越工具化
16:43
and we have the capabilities功能
379
988000
2000
我們有能力搜集
16:45
to collect蒐集 and connect the dots
380
990000
2000
並在人們說了些什麽
16:47
between之間 what people are saying
381
992000
2000
和他們說話的情境之間
16:49
and the context上下文 they're saying it in,
382
994000
2000
將那些點連結起來
16:51
what's emerging新興 is an ability能力
383
996000
2000
那麽呈現的將會是洞悉
16:53
to see new social社會 structures結構 and dynamics動力學
384
998000
3000
社交結構和社交動態的新視野
16:56
that have previously先前 not been seen看到.
385
1001000
2000
那將是前所未有的能力
16:58
It's like building建造 a microscope顯微鏡 or telescope望遠鏡
386
1003000
2000
這像是製造了麥克風
17:00
and revealing揭示 new structures結構
387
1005000
2000
和望遠鏡而顯現了
17:02
about our own擁有 behavior行為 around communication通訊.
388
1007000
3000
我們的溝通行爲的新結構
17:05
And I think the implications啟示 here are profound深刻,
389
1010000
3000
我認爲其中隱含深遠的意義
17:08
whether是否 it's for science科學,
390
1013000
2000
無論是對科學而言
17:10
for commerce商業, for government政府,
391
1015000
2000
對商業而言,對政府而言
17:12
or perhaps也許 most of all,
392
1017000
2000
或也許最重要的是
17:14
for us as individuals個人.
393
1019000
3000
對我們個人而言
17:17
And so just to return返回 to my son兒子,
394
1022000
3000
那麽我們回到我的兒子
17:20
when I was preparing準備 this talk, he was looking over my shoulder,
395
1025000
3000
我在準備這個談話時,他就在我身後看著
17:23
and I showed顯示 him the clips剪輯 I was going to show顯示 to you today今天,
396
1028000
2000
我讓他看今天給大家看的短片
17:25
and I asked him for permission允許 -- granted理所當然.
397
1030000
3000
也徵求他的准許-他同意了
17:28
And then I went on to reflect反映,
398
1033000
2000
然後我開始醒思
17:30
"Isn't it amazing驚人,
399
1035000
3000
「這不是很令人訝異的嗎?
17:33
this entire整個 database數據庫, all these recordings錄音,
400
1038000
3000
這整個資料庫,所有這些錄影紀錄
17:36
I'm going to hand off to you and to your sister妹妹" --
401
1041000
2000
我把它們交給你和妹妹」
17:38
who arrived到達 two years年份 later後來 --
402
1043000
3000
妹妹晚了兩年出生
17:41
"and you guys are going to be able能夠 to go back and re-experience再體驗 moments瞬間
403
1046000
3000
「你們倆將能夠回顧並重溫
17:44
that you could never, with your biological生物 memory記憶,
404
1049000
3000
你們的生物記憶可能
17:47
possibly或者 remember記得 the way you can now?"
405
1052000
2000
不會記得的那些時刻」
17:49
And he was quiet安靜 for a moment時刻.
406
1054000
2000
他沈默了半响
17:51
And I thought, "What am I thinking思維?
407
1056000
2000
我想「我想到哪裡去了
17:53
He's five years年份 old. He's not going to understand理解 this."
408
1058000
2000
他不過才五歲,不會懂的」
17:55
And just as I was having that thought, he looked看著 up at me and said,
409
1060000
3000
我才剛這麽想,他抬頭看著我
17:58
"So that when I grow增長 up,
410
1063000
2000
說:「那麽,我長大了
18:00
I can show顯示 this to my kids孩子?"
411
1065000
2000
可以讓我的孩子看這個?」
18:02
And I thought, "Wow, this is powerful強大 stuff東東."
412
1067000
3000
我想「哇,這說得可真好」
18:05
So I want to leave離開 you
413
1070000
2000
那麽,我要給各位
18:07
with one last memorable難忘 moment時刻
414
1072000
2000
留下最後一個
18:09
from our family家庭.
415
1074000
3000
我們家值得回憶的時刻
18:12
This is the first time our son兒子
416
1077000
2000
這是我兒子第一次
18:14
took more than two steps腳步 at once一旦 --
417
1079000
2000
走出兩步以上的情況-
18:16
captured捕獲 on film電影.
418
1081000
2000
拍攝在影片裡
18:18
And I really want you to focus焦點 on something
419
1083000
3000
我真的希望讓大家看的時候
18:21
as I take you through通過.
420
1086000
2000
要注意到其中一點
18:23
It's a cluttered凌亂 environment環境; it's natural自然 life.
421
1088000
2000
周遭有點吵,這是自然的生活環境
18:25
My mother's母親 in the kitchen廚房, cooking烹飪,
422
1090000
2000
我媽在廚房做飯
18:27
and, of all places地方, in the hallway門廳,
423
1092000
2000
就在走道上
18:29
I realize實現 he's about to do it, about to take more than two steps腳步.
424
1094000
3000
我感覺到他就要走出兩步以上
18:32
And so you hear me encouraging鼓舞人心的 him,
425
1097000
2000
因此各位聽到我鼓勵他
18:34
realizing實現 what's happening事件,
426
1099000
2000
感到有事就要發生
18:36
and then the magic魔法 happens發生.
427
1101000
2000
然後美妙的事發生了
18:38
Listen very carefully小心.
428
1103000
2000
請仔細聽
18:40
About three steps腳步 in,
429
1105000
2000
大概在走三步後
18:42
he realizes實現 something magic魔法 is happening事件,
430
1107000
2000
他感到發生了美妙的事
18:44
and the most amazing驚人 feedback反饋 loop循環 of all kicks in,
431
1109000
3000
這時最令人訝異的反應循環全都作動了
18:47
and he takes a breath呼吸 in,
432
1112000
2000
他鬆了一口氣
18:49
and he whispers耳語 "wow"
433
1114000
2000
輕輕地說了「哇」
18:51
and instinctively本能 I echo迴聲 back the same相同.
434
1116000
4000
我直覺反應地也說了同樣的話
18:56
And so let's fly back in time
435
1121000
3000
我們現在重回那個時光
18:59
to that memorable難忘 moment時刻.
436
1124000
2000
回到那個難忘的時刻
19:05
(Video視頻) DRDR: Hey.
437
1130000
2000
(影片) DR:喂
19:07
Come here.
438
1132000
2000
來,過來
19:09
Can you do it?
439
1134000
3000
你辦得到嗎?
19:13
Oh, boy男孩.
440
1138000
2000
啊,孩子
19:15
Can you do it?
441
1140000
3000
你辦得到嗎?
19:18
Baby寶寶: Yeah.
442
1143000
2000
嬰孩:可以
19:20
DRDR: Ma, he's walking步行.
443
1145000
3000
DR:媽,他走路了
19:24
(Laughter笑聲)
444
1149000
2000
(笑聲)
19:26
(Applause掌聲)
445
1151000
2000
(掌聲)
19:28
DRDR: Thank you.
446
1153000
2000
DR:謝謝大家
19:30
(Applause掌聲)
447
1155000
15000
(掌聲)
Translated by Wenjer Leuschel
Reviewed by Joyce Chou

▲Back to top

ABOUT THE SPEAKER
Deb Roy - Cognitive scientist
Deb Roy studies how children learn language, and designs machines that learn to communicate in human-like ways. On sabbatical from MIT Media Lab, he's working with the AI company Bluefin Labs.

Why you should listen

Deb Roy directs the Cognitive Machines group at the MIT Media Lab, where he studies how children learn language, and designs machines that learn to communicate in human-like ways. To enable this work, he has pioneered new data-driven methods for analyzing and modeling human linguistic and social behavior. He has authored numerous scientific papers on artificial intelligence, cognitive modeling, human-machine interaction, data mining, and information visualization.

Deb Roy was the co-founder and serves as CEO of Bluefin Labs, a venture-backed technology company. Built upon deep machine learning principles developed in his research over the past 15 years, Bluefin has created a technology platform that analyzes social media commentary to measure real-time audience response to TV ads and shows.

Follow Deb Roy on Twitter>

Roy adds some relevant papers:

Deb Roy. (2009). New Horizons in the Study of Child Language Acquisition. Proceedings of Interspeech 2009. Brighton, England. bit.ly/fSP4Qh

Brandon C. Roy, Michael C. Frank and Deb Roy. (2009). Exploring word learning in a high-density longitudinal corpus. Proceedings of the 31st Annual Meeting of the Cognitive Science Society. Amsterdam, Netherlands. bit.ly/e1qxej

Plenty more papers on our research including technology and methodology can be found here, together with other research from my lab at MIT: bit.ly/h3paSQ

The work that I mentioned on relationships between television content and the social graph is being done at Bluefin Labs (www.bluefinlabs.com). Details of this work have not been published. The social structures we are finding (and that I highlighted in my TED talk) are indeed new. The social media communication channels that are leading to their formation did not even exist a few years ago, and Bluefin's technology platform for discovering these kinds of structures is the first of its kind. We'll certainly have more to say about all this as we continue to dig into this fascinating new kind of data, and as new social structures continue to evolve!

More profile about the speaker
Deb Roy | Speaker | TED.com