ABOUT THE SPEAKER
Deb Roy - Cognitive scientist
Deb Roy studies how children learn language, and designs machines that learn to communicate in human-like ways. On sabbatical from MIT Media Lab, he's working with the AI company Bluefin Labs.

Why you should listen

Deb Roy directs the Cognitive Machines group at the MIT Media Lab, where he studies how children learn language, and designs machines that learn to communicate in human-like ways. To enable this work, he has pioneered new data-driven methods for analyzing and modeling human linguistic and social behavior. He has authored numerous scientific papers on artificial intelligence, cognitive modeling, human-machine interaction, data mining, and information visualization.

Deb Roy was the co-founder and serves as CEO of Bluefin Labs, a venture-backed technology company. Built upon deep machine learning principles developed in his research over the past 15 years, Bluefin has created a technology platform that analyzes social media commentary to measure real-time audience response to TV ads and shows.

Follow Deb Roy on Twitter>

Roy adds some relevant papers:

Deb Roy. (2009). New Horizons in the Study of Child Language Acquisition. Proceedings of Interspeech 2009. Brighton, England. bit.ly/fSP4Qh

Brandon C. Roy, Michael C. Frank and Deb Roy. (2009). Exploring word learning in a high-density longitudinal corpus. Proceedings of the 31st Annual Meeting of the Cognitive Science Society. Amsterdam, Netherlands. bit.ly/e1qxej

Plenty more papers on our research including technology and methodology can be found here, together with other research from my lab at MIT: bit.ly/h3paSQ

The work that I mentioned on relationships between television content and the social graph is being done at Bluefin Labs (www.bluefinlabs.com). Details of this work have not been published. The social structures we are finding (and that I highlighted in my TED talk) are indeed new. The social media communication channels that are leading to their formation did not even exist a few years ago, and Bluefin's technology platform for discovering these kinds of structures is the first of its kind. We'll certainly have more to say about all this as we continue to dig into this fascinating new kind of data, and as new social structures continue to evolve!

More profile about the speaker
Deb Roy | Speaker | TED.com
TED2011

Deb Roy: The birth of a word

Deb Roy: Sự ra đời của một từ

Filmed:
2,809,941 views

Nghiên cứu sinh tại MIT, Deb Roy muốn hiểu con trai của mình học ngôn ngữ như thế nào -- nên anh ta cài đặt máy quay phim trong nhà để thu mọi khoảnh khắc (trừ vài tình huống) của con trai anh, và rồi phân tích 90.000 giờ phim để xem "gaaa" dần chuyển thành "water." Một cách kinh ngạc, dữ liệu nghiên cứu chúng ta học như thế nào.
- Cognitive scientist
Deb Roy studies how children learn language, and designs machines that learn to communicate in human-like ways. On sabbatical from MIT Media Lab, he's working with the AI company Bluefin Labs. Full bio

Double-click the English transcript below to play the video.

00:15
ImagineHãy tưởng tượng if you could recordghi lại your life --
0
0
4000
Tưởng tượng nếu bạn có thể ghi lại cuộc đời bạn...
00:19
everything you said, everything you did,
1
4000
3000
mọi điều bạn nói, mọi thứ bạn làm,
00:22
availablecó sẵn in a perfecthoàn hảo memoryký ức storecửa hàng at your fingertipstrong tầm tay,
2
7000
3000
sẵn sàng có trong một ký ức hoàn hảo ngay trên tay bạn,
00:25
so you could go back
3
10000
2000
nên bạn có thể quay lại
00:27
and find memorableđáng ghi nhớ momentskhoảnh khắc and relivesống lại them,
4
12000
3000
và tìm những khoảnh khắc đáng nhớ và hồi tưởng chúng,
00:30
or siftsàng lọc throughxuyên qua tracesdấu vết of time
5
15000
3000
hay lướt qua vệt thời gian
00:33
and discoverkhám phá patternsmẫu in your ownsở hữu life
6
18000
2000
và khám phá các hình mẫu trong chính cuộc đời của bạn
00:35
that previouslytrước đây had goneKhông còn undiscoveredChưa được khám phá.
7
20000
3000
mà đã đi qua chưa được khám phá.
00:38
Well that's exactlychính xác the journeyhành trình
8
23000
2000
Và đó chính là cuộc hành trình
00:40
that my familygia đình beganbắt đầu
9
25000
2000
mà gia đình tôi đã bắt đầu
00:42
fivesố năm and a halfmột nửa yearsnăm agotrước.
10
27000
2000
5 năm rưỡi trước.
00:44
This is my wifengười vợ and collaboratorcộng tác viên, RupalRupal.
11
29000
3000
Đây là vợ và là người cộng tác của tôi, Rupal.
00:47
And on this day, at this momentchốc lát,
12
32000
2000
Và vào ngày này, vào thời điểm này,
00:49
we walkedđi bộ into the housenhà ở with our first childđứa trẻ,
13
34000
2000
chúng tôi đã bước vào nhà với đứa con đầu lòng của chúng tôi,
00:51
our beautifulđẹp babyđứa bé boycon trai.
14
36000
2000
bé trai tuyệt vời của chúng tôi.
00:53
And we walkedđi bộ into a housenhà ở
15
38000
3000
Và chúng tôi đi vào nhà
00:56
with a very specialđặc biệt home videovideo recordingghi âm systemhệ thống.
16
41000
4000
với một hệ thống ghi hình đặc biệt trong nhà.
01:07
(VideoVideo) Man: Okay.
17
52000
2000
(Phim) Người đàn ông: Được rồi.
01:10
DebDeb RoyRoy: This momentchốc lát
18
55000
1000
Deb Roy: Khoảnh khắc này
01:11
and thousandshàng nghìn of other momentskhoảnh khắc specialđặc biệt for us
19
56000
3000
và hàng ngàn khoảnh khắc đặc biệt khác đối với chúng tôi,
01:14
were capturedbị bắt in our home
20
59000
2000
đã được thu tại nhà chúng tôi
01:16
because in everymỗi roomphòng in the housenhà ở,
21
61000
2000
vì trong mỗi phòng trong nhà,
01:18
if you lookednhìn up, you'dbạn muốn see a cameraMáy ảnh and a microphonemicrophone,
22
63000
3000
nếu bạn nhìn lên, bạn sẽ thấy một máy quay và một micro.
01:21
and if you lookednhìn down,
23
66000
2000
và nếu bạn nhìn xuống,
01:23
you'dbạn muốn get this bird's-eyebird's-eye viewlượt xem of the roomphòng.
24
68000
2000
bạn sẽ có một tầm nhìn bao quát của căn phòng.
01:25
Here'sĐây là our livingsống roomphòng,
25
70000
3000
Đây là phòng khách của chúng tôi,
01:28
the babyđứa bé bedroomphòng ngủ,
26
73000
3000
phòng ngủ em bé,
01:31
kitchenphòng bếp, diningăn uống roomphòng
27
76000
2000
nhà bếp, phòng ăn
01:33
and the restnghỉ ngơi of the housenhà ở.
28
78000
2000
và phần còn lại của ngôi nhà.
01:35
And all of these fedđã nuôi into a discđĩa arraymảng
29
80000
3000
Và tất cả được lưu trong một dãy đĩa
01:38
that was designedthiết kế for a continuousliên tiếp capturenắm bắt.
30
83000
3000
được thiết kế cho việc thu liên tục.
01:41
So here we are flyingbay throughxuyên qua a day in our home
31
86000
3000
Viì ậy chúng ta đang lướt qua một ngày trong nhà chúng tôi
01:44
as we movedi chuyển from sunlitchiếu morningbuổi sáng
32
89000
3000
khi mà chúng ta đi từ sáng sớm
01:47
throughxuyên qua incandescentsáng chói eveningtối
33
92000
2000
cho tới chiều tà
01:49
and, finallycuối cùng, lightsđèn out for the day.
34
94000
3000
và cuối cùng, tắt đèn đi ngủ.
01:53
Over the coursekhóa học of threesố ba yearsnăm,
35
98000
3000
Trong vòng 3 năm,
01:56
we recordedghi lại eighttám to 10 hoursgiờ a day,
36
101000
2000
chúng tôi đã ghi 8 tới 10 tiếng mỗi ngày,
01:58
amassingtích lũy roughlygần a quarter-millionQuarter-triệu hoursgiờ
37
103000
3000
tích lũy xấp xỉ 250.000 giờ
02:01
of multi-trackđa rãnh audioâm thanh and videovideo.
38
106000
3000
hình và tiếng
02:04
So you're looking at a piececái of what is by farxa
39
109000
2000
Vì vậy bạn đang xem một mẫu trong cái mà cho đến nay gọi là
02:06
the largestlớn nhất home videovideo collectionbộ sưu tập ever madethực hiện.
40
111000
2000
bộ sưu tập phim gia đình lớn nhất từng được làm.
02:08
(LaughterTiếng cười)
41
113000
3000
(Tiếng cười)
02:11
And what this datadữ liệu representsđại diện
42
116000
2000
Và cái mà dữ liệu này thể hiện
02:13
for our familygia đình at a personalcá nhân levelcấp độ,
43
118000
4000
cho gia đình chúng tôi ở mức độ cá nhân,
02:17
the impactva chạm has alreadyđã been immensebao la,
44
122000
2000
ảnh hương đã là rất lớn,
02:19
and we're still learninghọc tập its valuegiá trị.
45
124000
3000
và chúng tôi vẫn tiếp tục học giá trị của nó.
02:22
CountlessVô số momentskhoảnh khắc
46
127000
2000
Vô số thời điểm
02:24
of unsolicitedkhông được yêu cầu naturaltự nhiên momentskhoảnh khắc, not posedĐặt ra momentskhoảnh khắc,
47
129000
3000
tự nhiên, không giả tạo,
02:27
are capturedbị bắt there,
48
132000
2000
được thu lại,
02:29
and we're startingbắt đầu to learnhọc hỏi how to discoverkhám phá them and find them.
49
134000
3000
và chúng tôi đang bắt đầu học làm cách nào để khám phá chúng và tìm chúng.
02:32
But there's alsocũng thế a scientificthuộc về khoa học reasonlý do that drovelái this projectdự án,
50
137000
3000
Nhưng cũng có một lý do khoa học dẫn tới dự án này,
02:35
which was to use this naturaltự nhiên longitudinaltheo chiều dọc datadữ liệu
51
140000
4000
đó là để dùng dữ liệu tự nhiên theo chiều dọc này
02:39
to understandhiểu không the processquá trình
52
144000
2000
để hiểu quá trình
02:41
of how a childđứa trẻ learnshọc languagengôn ngữ --
53
146000
2000
một đứa trẻ học ngôn ngữ như thế nào--
02:43
that childđứa trẻ beingđang my sonCon trai.
54
148000
2000
đứa trẻ đó là con trai chúng tôi
02:45
And so with manynhiều privacysự riêng tư provisionsquy định put in placeđịa điểm
55
150000
4000
Và vì với nhiều điều khoảng riêng tư
02:49
to protectbảo vệ everyonetất cả mọi người who was recordedghi lại in the datadữ liệu,
56
154000
3000
để bảo vệ mọi người đã được ghi lại trong dữ liệu,
02:52
we madethực hiện elementscác yếu tố of the datadữ liệu availablecó sẵn
57
157000
3000
chúng tôi để những thành phần của dữ liệu
02:55
to my trustedđáng tin cậy researchnghiên cứu teamđội at MITMIT
58
160000
3000
cho nhóm nghiên cứu tin cậy của tôi tại MIT
02:58
so we could startkhởi đầu teasingtrêu chọc apartxa nhau patternsmẫu
59
163000
3000
vì vậy chúng tôi có thể bắt đầu gỡ ra những mẫu
03:01
in this massiveto lớn datadữ liệu setbộ,
60
166000
3000
trong bộ dữ liệu khổng lồ này,
03:04
tryingcố gắng to understandhiểu không the influenceảnh hưởng of socialxã hội environmentsmôi trường
61
169000
3000
cố gắng hiểu sự ảnh hưởng của môi trường xã hội
03:07
on languagengôn ngữ acquisitionmua lại.
62
172000
2000
đối với tiếp nhận ngôn ngữ.
03:09
So we're looking here
63
174000
2000
Vì vậy chúng ta xem ở đây
03:11
at one of the first things we startedbắt đầu to do.
64
176000
2000
là vào một trong những thứ đầu tiên chúng tôi bắt đầu làm.
03:13
This is my wifengười vợ and I cookingnấu nướng breakfastbữa ăn sáng in the kitchenphòng bếp,
65
178000
4000
Đây là vợ tôi và tôi đang nấu bữa sáng trong bếp.
03:17
and as we movedi chuyển throughxuyên qua spacekhông gian and throughxuyên qua time,
66
182000
3000
Và khi chúng tôi di chuyển qua không gian và thời gian,
03:20
a very everydaymỗi ngày patternmẫu of life in the kitchenphòng bếp.
67
185000
3000
một kiểu cuộc sống hoạt động trong nhà bếp mang tính thường nhật.
03:23
In ordergọi món to convertđổi
68
188000
2000
Để có thể chuyển đổi
03:25
this opaquemờ mịt, 90,000 hoursgiờ of videovideo
69
190000
3000
90.000 giờ phim không ý nghĩa này
03:28
into something that we could startkhởi đầu to see,
70
193000
2000
sang một thứ gì đó mà chúng tôi có thể bắt đầu thấy,
03:30
we use motionchuyển động analysisphân tích to pullkéo out,
71
195000
2000
chúng tôi sử dụng chương trình phân tích chuyển động để thực hiện,
03:32
as we movedi chuyển throughxuyên qua spacekhông gian and throughxuyên qua time,
72
197000
2000
khi chúng ta di chuyển theo không gian và thời gian,
03:34
what we call space-timekhông thời gian wormsWorms.
73
199000
3000
cái mà chúng tôi gọi là các con sâu không-thời gian.
03:37
And this has becometrở nên partphần of our toolkitbộ công cụ
74
202000
3000
Và nó trở thành một phần của bộ công cụ của chúng tôi
03:40
for beingđang ablecó thể to look and see
75
205000
3000
để có thể nhìn và thấy
03:43
where the activitieshoạt động are in the datadữ liệu,
76
208000
2000
địa điểm của các hoạt động trong dữ liệu,
03:45
and with it, tracedấu vết the patternmẫu of, in particularcụ thể,
77
210000
3000
và với nó, tìm ra hình thức của, cụ thể là,
03:48
where my sonCon trai moveddi chuyển throughoutkhắp the home,
78
213000
2000
những nơi con trai chúng tôi di chuyển trong nhà.
03:50
so that we could focustiêu điểm our transcriptionPhiên âm effortsnỗ lực,
79
215000
3000
thì chúng tôi có thể tập trung các nỗ lực chuyển đổi
03:53
all of the speechphát biểu environmentmôi trường around my sonCon trai --
80
218000
3000
tất cả các môi trường nói quanh con trai chúng tôi --
03:56
all of the wordstừ ngữ that he heardnghe from myselfriêng tôi, my wifengười vợ, our nannyvú em,
81
221000
3000
tất cả các từ mà nó nghe từ tôi, vợ tôi, và người giữ trẻ của chúng tôi,
03:59
and over time, the wordstừ ngữ he beganbắt đầu to producesản xuất.
82
224000
3000
và theo thời gian, các từ ngữ bắt đầu hình thành.
04:02
So with that technologyCông nghệ and that datadữ liệu
83
227000
3000
Vì vậy với công nghệ đó và dữ liệu đó
04:05
and the abilitycó khả năng to, with machinemáy móc assistancehỗ trợ,
84
230000
2000
và khả năng để, với sự giúp đỡ của máy móc,
04:07
transcribesao lại speechphát biểu,
85
232000
2000
chuyển âm,
04:09
we'vechúng tôi đã now transcribedPhiên âm
86
234000
2000
chúng tôi hiện tại đã chuyển
04:11
well over sevenbảy milliontriệu wordstừ ngữ of our home transcriptsbảng điểm.
87
236000
3000
xấp xỉ hơn 7 triệu từ từ những chuyển âm trong nhà của chúng tôi.
04:14
And with that, let me take you now
88
239000
2000
Và với nó, để tôi giới thiệu với các bạn
04:16
for a first tourchuyến du lịch into the datadữ liệu.
89
241000
3000
đi một vòng đầu vào trong dữ liệu này.
04:19
So you've all, I'm sure,
90
244000
2000
Tôi chắc là hẳn các bạn,,
04:21
seenđã xem time-lapsethời gian trôi đi videosvideo
91
246000
2000
từng xem những đoạn phim tua nhanh
04:23
where a flowerhoa will blossomBlossom as you accelerateđẩy nhanh time.
92
248000
3000
một bông hoa nở khi mà bạn tăng thời gian chạy.
04:26
I'd like you to now experiencekinh nghiệm
93
251000
2000
Tôi muốn các bạn trải nghiệm
04:28
the blossomingnở of a speechphát biểu formhình thức.
94
253000
2000
sự nở hoa của thể nói.
04:30
My sonCon trai, soonSớm after his first birthdaysinh nhật,
95
255000
2000
Con trai chúng tôi, sau lần sinh nhật đầu của nó,
04:32
would say "gagaGaga" to mean waterNước.
96
257000
3000
nói "gaga" để chỉ "water".
04:35
And over the coursekhóa học of the nextkế tiếp half-yearnửa năm,
97
260000
3000
Và trong vòng nửa năm,
04:38
he slowlychậm rãi learnedđã học to approximategần đúng
98
263000
2000
nó dần học để phỏng theo
04:40
the properthích hợp adultngười lớn formhình thức, "waterNước."
99
265000
3000
thể hoàn chỉnh nhất, "water"
04:43
So we're going to cruisehành trình throughxuyên qua halfmột nửa a yearnăm
100
268000
2000
Vì vậy chúng ta sẽ đi qua nửa năm
04:45
in about 40 secondsgiây.
101
270000
2000
trong khoảng 40 giây.
04:47
No videovideo here,
102
272000
2000
Không có phim ở đây,
04:49
so you can focustiêu điểm on the soundâm thanh, the acousticsâm học,
103
274000
3000
vì vậy bạn có thể tập trung vào âm thanh, chỉ âm thanh,
04:52
of a newMới kindloại of trajectoryquỹ đạo:
104
277000
2000
của một dạng mới của một con đường:
04:54
gagaGaga to waterNước.
105
279000
2000
"gaga" thành "water"
04:56
(AudioÂm thanh) BabyEm bé: GagagagagagaGagagagagaga
106
281000
12000
(Âm thanh) Em bé: Gagagagagaga
05:08
GagaGaga gagaGaga gagaGaga
107
293000
4000
Gaga gaga gaga
05:12
gugaguga gugaguga gugaguga
108
297000
5000
guga guga guga
05:17
wadaWada gagaGaga gagaGaga gugaguga gagaGaga
109
302000
5000
wada gaga gaga guga gaga
05:22
wadercẳng gugaguga gugaguga
110
307000
4000
wader guga guga
05:26
waterNước waterNước waterNước
111
311000
3000
water water water
05:29
waterNước waterNước waterNước
112
314000
6000
water water water
05:35
waterNước waterNước
113
320000
4000
water water
05:39
waterNước.
114
324000
2000
water.
05:41
DRTIẾN SĨ: He sure nailedđóng đinh it, didn't he.
115
326000
2000
DR: Nó làm được rồi, phải không.
05:43
(ApplauseVỗ tay)
116
328000
7000
(Vỗ tay)
05:50
So he didn't just learnhọc hỏi waterNước.
117
335000
2000
Và nó không chỉ học từ "water".
05:52
Over the coursekhóa học of the 24 monthstháng,
118
337000
2000
Sau khoảng thời gian 24 tháng,
05:54
the first two yearsnăm that we really focusedtập trung on,
119
339000
3000
2 năm đầu mà chúng tôi thực sự tập trung vào,
05:57
this is a mapbản đồ of everymỗi wordtừ he learnedđã học in chronologicalThứ tự thời gian ordergọi món.
120
342000
4000
đây là một bản đồ về mọi từ mà đứa trẻ học được theo thứ tự thời gian.
06:01
And because we have fullđầy transcriptsbảng điểm,
121
346000
3000
Và bởi vì chúng tôi có một bản ghi chép đầy đủ,
06:04
we'vechúng tôi đã identifiedxác định eachmỗi of the 503 wordstừ ngữ
122
349000
2000
chúng tôi đã xác định được từng từ trong 503 từ
06:06
that he learnedđã học to producesản xuất by his secondthứ hai birthdaysinh nhật.
123
351000
2000
mà đứa trẻ học được vào lần sinh nhật thứ hai của nó.
06:08
He was an earlysớm talkertalker.
124
353000
2000
Nó là một đứa trẻ biết nói sớm.
06:10
And so we startedbắt đầu to analyzephân tích why.
125
355000
3000
Và vì vậy chúng tôi bắt đầu phân tích tại sao.
06:13
Why were certainchắc chắn wordstừ ngữ bornsinh ra before othersKhác?
126
358000
3000
Tại sao một vài từ học được trước những từ khác?
06:16
This is one of the first resultscác kết quả
127
361000
2000
Đây là một trong những kết quả trước hết
06:18
that cameđã đến out of our studyhọc a little over a yearnăm agotrước
128
363000
2000
hoàn thành trong nghiên cứu của chúng tôi khoảng hơn 1 năm
06:20
that really surprisedngạc nhiên us.
129
365000
2000
làm chúng tôi sửng sốt.
06:22
The way to interpretgiải thích this apparentlydường như simpleđơn giản graphbiểu đồ
130
367000
3000
Cách để phiên dịch biểu đồ tương đối đơn giản này
06:25
is, on the verticaltheo chiều dọc is an indicationdấu hiệu
131
370000
2000
là dựa vào chiều cao
06:27
of how complexphức tạp caregiverngười chăm sóc utteranceslời are
132
372000
3000
chỉ thị độ phức tạp của lời nói của người chăm sóc bé
06:30
baseddựa trên on the lengthchiều dài of utteranceslời.
133
375000
2000
dựa trên chiều dài của lời nói.
06:32
And the [horizontalngang] axistrục is time.
134
377000
3000
Và cột dọc là số lần.
06:35
And all of the datadữ liệu,
135
380000
2000
Và tất cả dữ liệu,
06:37
we alignedliên kết baseddựa trên on the followingtiếp theo ideaý kiến:
136
382000
3000
chúng tôi sắp xếp dựa trên ý tưởng sau:
06:40
EveryMỗi time my sonCon trai would learnhọc hỏi a wordtừ,
137
385000
3000
Mỗi lần đứa trẻ học một từ,
06:43
we would tracedấu vết back and look at all of the languagengôn ngữ he heardnghe
138
388000
3000
chúng tôi sẽ quay lại và nhìn vào tất cả từ mà nó đã nghe
06:46
that containedcó chứa that wordtừ.
139
391000
2000
có chứa từ đó.
06:48
And we would plotâm mưu the relativequan hệ lengthchiều dài of the utteranceslời.
140
393000
4000
Và chúng tôi ghi nhận độ dài của câu nói.
06:52
And what we foundtìm was this curiousHiếu kỳ phenomenahiện tượng,
141
397000
3000
Và cái mà chúng tôi tìm ra hiện tượng gây tò mò này,
06:55
that caregiverngười chăm sóc speechphát biểu would systematicallycó hệ thống dipDIP to a minimumtối thiểu,
142
400000
3000
rằng lời nói của người chăm sóc được giảm xuống một cách có hệ thống đến mức tối thiểu,
06:58
makingchế tạo languagengôn ngữ as simpleđơn giản as possiblekhả thi,
143
403000
3000
làm cho ngôn ngữ đơn giản hết mức có thể,
07:01
and then slowlychậm rãi ascendAscend back up in complexityphức tạp.
144
406000
3000
và rồi dần nâng lên phức tạp.
07:04
And the amazingkinh ngạc thing was
145
409000
2000
Và điều kỳ diệu là
07:06
that bouncethư bị trả lại, that dipDIP,
146
411000
2000
sự lên xuống đó
07:08
linedlót up almosthầu hết preciselyđúng
147
413000
2000
xếp ngay ngắn một cách gần như chính xác
07:10
with when eachmỗi wordtừ was bornsinh ra --
148
415000
2000
với khi mỗi từ được sinh ra --
07:12
wordtừ after wordtừ, systematicallycó hệ thống.
149
417000
2000
từ này tới từ khác một cách có hệ thống.
07:14
So it appearsxuất hiện that all threesố ba primarysơ cấp caregiversnhững người chăm sóc --
150
419000
2000
Vì vậy có vẻ như là tất cả 3 người chăm sóc chính--
07:16
myselfriêng tôi, my wifengười vợ and our nannyvú em --
151
421000
3000
tôi, vợ tôi và người giữ trẻ --
07:19
were systematicallycó hệ thống and, I would think, subconsciouslytiềm thức
152
424000
3000
tôi nghĩ rằng, chúng tôi đang định hình lại ngôn ngữ của mình
07:22
restructuringtái cơ cấu our languagengôn ngữ
153
427000
2000
một cách có hệ thống và ít ý thức
07:24
to meetgặp him at the birthSinh of a wordtừ
154
429000
3000
để giúp đứa trẻ học được một từ
07:27
and bringmang đến him gentlynhẹ nhàng into more complexphức tạp languagengôn ngữ.
155
432000
4000
và nhẹ nhàng giúp nó học những từ phức tạp hơn.
07:31
And the implicationshàm ý of this -- there are manynhiều,
156
436000
2000
Và sự ngụ ý của điều này -- có nhiều,
07:33
but one I just want to pointđiểm out,
157
438000
2000
nhưng cái mà tôi muốn chỉ ra,
07:35
is that there mustphải be amazingkinh ngạc feedbackPhản hồi loopsvòng.
158
440000
3000
là phải có những vòng phản hồi tuyệt vời.
07:38
Of coursekhóa học, my sonCon trai is learninghọc tập
159
443000
2000
Tất nhiên, con trai tôi đang học
07:40
from his linguisticngôn ngữ học environmentmôi trường,
160
445000
2000
từ môi trường ngôn ngữ của nó,
07:42
but the environmentmôi trường is learninghọc tập from him.
161
447000
3000
nhưng môi trường đang học từ nó.
07:45
That environmentmôi trường, people, are in these tightchặt chẽ feedbackPhản hồi loopsvòng
162
450000
3000
Môi trường đó, tức là mọi người, ở trong một vòng phản hồi khép kín
07:48
and creatingtạo a kindloại of scaffoldingđoạn đầu đài
163
453000
2000
và tạo ra một dạng của cấu trúc
07:50
that has not been noticednhận thấy untilcho đến now.
164
455000
3000
cho đến bây giờ vẫn chưa được chú ý
07:54
But that's looking at the speechphát biểu contextbối cảnh.
165
459000
2000
Nhưng đó là xét từ khía cạnh ngữ cảnh nói.
07:56
What about the visualtrực quan contextbối cảnh?
166
461000
2000
Vậy còn ngữ cảnh nhìn như thế nào?
07:58
We're not looking at --
167
463000
2000
Chúng ta không đang xem --
08:00
think of this as a dollhouseDollhouse cutawaycutaway of our housenhà ở.
168
465000
2000
Xem đây là một mặt cắt của nhà chúng tôi.
08:02
We'veChúng tôi đã takenLấy those circulartròn fish-eyemắt cá lensống kính camerasmáy ảnh,
169
467000
3000
Chúng tôi lấy những dữ liệu từ máy quay,
08:05
and we'vechúng tôi đã donelàm xong some opticalquang học correctionđiều chỉnh,
170
470000
2000
và làm vài phép chỉnh quang học,
08:07
and then we can bringmang đến it into three-dimensionalba chiều life.
171
472000
4000
và rồi chúng tôi có thể làm thành mô hình 3 chiều.
08:11
So welcomechào mừng to my home.
172
476000
2000
Và chào mừng đến ngôi nhà của chúng tôi.
08:13
This is a momentchốc lát,
173
478000
2000
Đây là một khoảnh khắc,
08:15
one momentchốc lát capturedbị bắt acrossbăng qua multiplenhiều camerasmáy ảnh.
174
480000
3000
một khoảnh khắc được ghi lại bằng nhiều phía máy quay.
08:18
The reasonlý do we did this is to createtạo nên the ultimatetối hậu memoryký ức machinemáy móc,
175
483000
3000
Mục đích chúng tôi làm vậy là để tạo một cỗ máy kí ức,
08:21
where you can go back and interactivelytương tác flybay around
176
486000
3000
nơi mọi người có thể quay lại và bay vòng quanh bằng cách tương tác
08:24
and then breathethở video-lifevideo-cuộc sống into this systemhệ thống.
177
489000
3000
và rồi thổi cuộc sống trong đoạn phim vào hệ thống này.
08:27
What I'm going to do
178
492000
2000
Cái mà tôi sắp làm
08:29
is give you an acceleratedtăng tốc viewlượt xem of 30 minutesphút,
179
494000
3000
là chiếu cho các bạn một đoạn phim tua nhanh có độ dài 30 phút,
08:32
again, of just life in the livingsống roomphòng.
180
497000
2000
một lần nữa, về cuộc sống trong phòng khách.
08:34
That's me and my sonCon trai on the floorsàn nhà.
181
499000
3000
Trên sàn nhà là tôi và con trai tôi
08:37
And there's videovideo analyticsphân tích
182
502000
2000
Và có phần mềm phân tích phim
08:39
that are trackingtheo dõi our movementsphong trào.
183
504000
2000
theo vết cử động của chúng tôi.
08:41
My sonCon trai is leavingđể lại redđỏ inkmực. I am leavingđể lại greenmàu xanh lá inkmực.
184
506000
3000
Con trai tôi là vệt màu đỏ, tôi là vệt màu xanh.
08:44
We're now on the couchđi văng,
185
509000
2000
Chúng tôi đang ở trên ghế,
08:46
looking out throughxuyên qua the windowcửa sổ at carsxe hơi passingđi qua by.
186
511000
3000
nhìn ra ngoài cửa sổ xem xe chạy.
08:49
And finallycuối cùng, my sonCon trai playingđang chơi in a walkingđi dạo toyđồ chơi by himselfbản thân anh ấy.
187
514000
3000
Và cuối cùng, con trai tôi chơi trong chiếc xe tập đi một mình.
08:52
Now we freezeĐông cứng the actionhoạt động, 30 minutesphút,
188
517000
3000
Bây giờ chúng dừng lại, 30 phút phim,
08:55
we turnxoay time into the verticaltheo chiều dọc axistrục,
189
520000
2000
chúng ta chuyển thời gian thành trục thẳng đứng,
08:57
and we openmở up for a viewlượt xem
190
522000
2000
và chúng ta mở một tầm nhìn
08:59
of these interactionsự tương tác tracesdấu vết we'vechúng tôi đã just left behindphía sau.
191
524000
3000
của những vệt tương tác mà chúng tôi để lại.
09:02
And we see these amazingkinh ngạc structurescấu trúc --
192
527000
3000
Và chúng ta thấy những cấu trúc tuyệt vời này --
09:05
these little knotshải lý of two colorsmàu sắc of threadchủ đề
193
530000
3000
những nút nhỏ của hai dải màu này
09:08
we call "socialxã hội hotnóng bức spotsđiểm."
194
533000
2000
chúng tôi gọi chúng là những điểm nóng.
09:10
The spiralxoắn ốc threadchủ đề
195
535000
2000
Dải xoắn
09:12
we call a "solosolo hotnóng bức spotnơi."
196
537000
2000
chúng tôi gọi là điểm nóng đơn.
09:14
And we think that these affectcó ảnh hưởng đến the way languagengôn ngữ is learnedđã học.
197
539000
3000
Và chúng tôi nghĩ rằng chúng ảnh hưởng tới cách mà ngôn ngữ được học.
09:17
What we'dThứ Tư like to do
198
542000
2000
Cái mà chúng tôi muốn làm
09:19
is startkhởi đầu understandinghiểu biết
199
544000
2000
là bước đầu hiểu được
09:21
the interactionsự tương tác betweengiữa these patternsmẫu
200
546000
2000
sự tương tắc giữa những hình mẫu
09:23
and the languagengôn ngữ that my sonCon trai is exposedlộ ra to
201
548000
2000
và ngôn ngữ mà con trai tôi tiếp xúc
09:25
to see if we can predicttiên đoán
202
550000
2000
để xem nếu chúng ta có thể đoán
09:27
how the structurekết cấu of when wordstừ ngữ are heardnghe
203
552000
2000
cái cấu trúc khi từ ngữ được nghe nhận
09:29
affectsảnh hưởng when they're learnedđã học --
204
554000
2000
ảnh hưởng tới khi mà chúng được học như thế nào --
09:31
so in other wordstừ ngữ, the relationshipmối quan hệ
205
556000
2000
nói cách khác, mối quan hệ
09:33
betweengiữa wordstừ ngữ and what they're about in the worldthế giới.
206
558000
4000
giữa các từ và nghĩa của chúng.
09:37
So here'sđây là how we're approachingtiếp cận this.
207
562000
2000
Vì vậy đây là cách mà chúng tôi tiếp cận.
09:39
In this videovideo,
208
564000
2000
Trong đoạn phim này.
09:41
again, my sonCon trai is beingđang tracedtruy tìm out.
209
566000
2000
Một lần nữa, con trai tôi được đánh dấu.
09:43
He's leavingđể lại redđỏ inkmực behindphía sau.
210
568000
2000
Nó là vạch màu đỏ phía sau
09:45
And there's our nannyvú em by the doorcửa.
211
570000
2000
Và đây là người giữ trẻ của chúng tôi ở cửa.
09:47
(VideoVideo) NannyVú em: You want waterNước? (BabyEm bé: AaaaAaaa.)
212
572000
3000
(Phim) Người giữ trẻ: Con muốn uống nước hả? (Em bé: Aaaa )
09:50
NannyVú em: All right. (BabyEm bé: AaaaAaaa.)
213
575000
3000
Người giữ trẻ: Được rồi (Em bé: Aaaa )
09:53
DRTIẾN SĨ: She offerscung cấp waterNước,
214
578000
2000
DR: Cô ta cho uống nước,
09:55
and off go the two wormsWorms
215
580000
2000
và để lại 2 vạch
09:57
over to the kitchenphòng bếp to get waterNước.
216
582000
2000
tới nhà bếp để lấy nước.
09:59
And what we'vechúng tôi đã donelàm xong is use the wordtừ "waterNước"
217
584000
2000
Và cái mà chúng tôi làm là sử dụng từ "nước"
10:01
to tagtừ khóa that momentchốc lát, that bitbit of activityHoạt động.
218
586000
2000
để đánh dấu khoảnh khắc, một phần hành động đó.
10:03
And now we take the powerquyền lực of datadữ liệu
219
588000
2000
Bây giờ chúng tôi sử dụng lượng lớn dữ liệu
10:05
and take everymỗi time my sonCon trai
220
590000
3000
và ghi nhận mọi thời điểm con trai chúng tôi
10:08
ever heardnghe the wordtừ waterNước
221
593000
2000
nghe từ "nước"
10:10
and the contextbối cảnh he saw it in,
222
595000
2000
và ngữ cảnh mà nó thấy xuất hiện từ "nước",
10:12
and we use it to penetratexâm nhập throughxuyên qua the videovideo
223
597000
3000
chúng tôi sửa dụng nó xuyên qua đoạn phim
10:15
and find everymỗi activityHoạt động tracedấu vết
224
600000
3000
và tìm mọi hoạt động
10:18
that co-occurredđồng xảy ra with an instanceví dụ of waterNước.
225
603000
3000
mà có liên quan tới nước.
10:21
And what this datadữ liệu leaves in its wakeđánh thức
226
606000
2000
Và cái mà dữ liệu để lại
10:23
is a landscapephong cảnh.
227
608000
2000
là một bức tranh.
10:25
We call these wordscapeswordscapes.
228
610000
2000
Chúng tôi gọi chúng là bức tranh từ vựng.
10:27
This is the wordscapewordscape for the wordtừ waterNước,
229
612000
2000
Đây là một bức tranh về từ "nước",
10:29
and you can see mostphần lớn of the actionhoạt động is in the kitchenphòng bếp.
230
614000
2000
và các bạn có thể thấy hầu hết mọi hoạt động là trong nhà bếp.
10:31
That's where those biglớn peaksđỉnh núi are over to the left.
231
616000
3000
Đó là nơi có mấy cái đỉnh đó ở phía bên trái.
10:34
And just for contrasttương phản, we can do this with any wordtừ.
232
619000
3000
Về độ tương phản, chúng tôi có thể dịch âm thanh này với bất kỳ từ nào.
10:37
We can take the wordtừ "byeTạm biệt"
233
622000
2000
Chúng ta có thể chọn từ "bye"
10:39
as in "good byeTạm biệt."
234
624000
2000
trong từ "good bye."
10:41
And we're now zoomedthu nhỏ in over the entrancecổng vào to the housenhà ở.
235
626000
2000
Và chúng ta có thể xem rõ ở cửa ra vào của ngôi nhà.
10:43
And we look, and we find, as you would expectchờ đợi,
236
628000
3000
Và chúng tôi xem, và tìm ra, như các bạn có thể đoán được
10:46
a contrasttương phản in the landscapephong cảnh
237
631000
2000
là một sự tương phản trong bức tranh
10:48
where the wordtừ "byeTạm biệt" occursxảy ra much more in a structuredcấu trúc way.
238
633000
3000
nơi mà từ "bye" xuất hiện nhiều hơn một cách có cấu trúc.
10:51
So we're usingsử dụng these structurescấu trúc
239
636000
2000
Vì vậy chúng tôi sử dụng những cấu trúc này
10:53
to startkhởi đầu predictingdự báo
240
638000
2000
để bắt đầu suy đoán
10:55
the ordergọi món of languagengôn ngữ acquisitionmua lại,
241
640000
3000
thứ tự của việc tiếp nhận ngôn ngữ.
10:58
and that's ongoingđang diễn ra work now.
242
643000
2000
và đó là công việc chúng tôi đang làm bây giờ.
11:00
In my labphòng thí nghiệm, which we're peeringpeering into now, at MITMIT --
243
645000
3000
Trong phòng lab của tôi, nơi mà chúng tôi đang làm việc, tại MIT --
11:03
this is at the mediaphương tiện truyền thông labphòng thí nghiệm.
244
648000
2000
đây là ở phòng lab kĩ thuật.
11:05
This has becometrở nên my favoriteyêu thích way
245
650000
2000
Nơi đây trở thành nơi yêu thích của tôi
11:07
of videographingvideographing just about any spacekhông gian.
246
652000
2000
ghi hình về bất cứ không gian nào.
11:09
ThreeBa of the keyChìa khóa people in this projectdự án,
247
654000
2000
Ba trong số những người làm chính trong dự án này,
11:11
PhilipPhilip DeCampDeCamp, RonyTien KubatKubat and BrandonBrandon RoyRoy are picturedhình here.
248
656000
3000
Philip DeCamp, Rony Kubat và Brandon Roy ở trên hình:
11:14
PhilipPhilip has been a closegần collaboratorcộng tác viên
249
659000
2000
Philip là một người cộng tác thân thuộc
11:16
on all the visualizationshình ảnh hóa you're seeingthấy.
250
661000
2000
trong tất cả các hình ảnh mà các bạn đang xem.
11:18
And MichaelMichael FleischmanFleischman
251
663000
3000
Và Michael Fleischman
11:21
was anotherkhác PhĐộ pH.D. studentsinh viên in my labphòng thí nghiệm
252
666000
2000
là một nghiên cứu sinh tiến sĩ khác trong lab của tôi
11:23
who workedđã làm việc with me on this home videovideo analysisphân tích,
253
668000
3000
người này mà làm việc phân tích phim ghi hình gia đình này với tôi
11:26
and he madethực hiện the followingtiếp theo observationquan sát:
254
671000
3000
và anh ta có được quan sát sau:
11:29
that "just the way that we're analyzingphân tích
255
674000
2000
rằng "chỉ có cách là chúng ta phân tích
11:31
how languagengôn ngữ connectskết nối to eventssự kiện
256
676000
3000
về việc ngôn ngữ liên kết với sự kiện như thế nào
11:34
which providecung cấp commonchung groundđất for languagengôn ngữ,
257
679000
2000
để đưa ra nền tảng chung về ngôn ngữ,
11:36
that sametương tự ideaý kiến we can take out of your home, DebDeb,
258
681000
4000
chúng ta có thể làm ý tưởng giống vậy với nhà của anh, Deb ạ,
11:40
and we can applyứng dụng it to the worldthế giới of publiccông cộng mediaphương tiện truyền thông."
259
685000
3000
và chúng ta có thể áp dụng nó vào phương tiện công cộng."
11:43
And so our effortcố gắng tooklấy an unexpectedbất ngờ turnxoay.
260
688000
3000
Và vì vậy cố gắng của chúng tôi có một chuyển biến ngoài mong đợi.
11:46
Think of masskhối lượng mediaphương tiện truyền thông
261
691000
2000
Suy nghĩ về truyền thông đại chúng
11:48
as providingcung cấp commonchung groundđất
262
693000
2000
là nơi cung cấp nền tảng hiểu biết chung
11:50
and you have the recipecông thức
263
695000
2000
và các bạn có công thức
11:52
for takinglấy this ideaý kiến to a wholetoàn thể newMới placeđịa điểm.
264
697000
3000
để mang ý tưởng này tới một nơi mới.
11:55
We'veChúng tôi đã startedbắt đầu analyzingphân tích televisiontivi contentNội dung
265
700000
3000
Chúng tôi đã bắt đầu phân tích nội dung TV
11:58
usingsử dụng the sametương tự principlesnguyên lý --
266
703000
2000
sử dụng cũng những nguyên lý như vậy --
12:00
analyzingphân tích eventbiến cố structurekết cấu of a TVTRUYỀN HÌNH signaltín hiệu --
267
705000
3000
phân tích cấu trúc sự kiện của một lần phát sóng TV --
12:03
episodestập phim of showstrình diễn,
268
708000
2000
các phần của các chương trình,
12:05
commercialsquảng cáo,
269
710000
2000
quảng cáo,
12:07
all of the componentscác thành phần that make up the eventbiến cố structurekết cấu.
270
712000
3000
tất cả mọi thành phần làm nên một cấu trúc sự kiện.
12:10
And we're now, with satellitevệ tinh disheschén đĩa, pullingkéo and analyzingphân tích
271
715000
3000
Và chúng tôi hiện tại sử dụng đĩa vệ tinh, lấy và phân tích
12:13
a good partphần of all the TVTRUYỀN HÌNH beingđang watchedđã xem in the UnitedVương StatesTiểu bang.
272
718000
3000
một mảng hay của tất cả chương trình TV được xem ở Mỹ.
12:16
And you don't have to now go and instrumentdụng cụ livingsống roomsphòng with microphonesMicro
273
721000
3000
Và bây giờ bạn không phải đi và trang bị micro trong phòng khách
12:19
to get people'sngười conversationscuộc trò chuyện,
274
724000
2000
để ghi lại các cuộc đối thoại của mọi người,
12:21
you just tuneđiều chỉnh into publiclycông khai availablecó sẵn socialxã hội mediaphương tiện truyền thông feedsnguồn cấp dữ liệu.
275
726000
3000
bạn chỉ cần chỉnh sang nguồn truyền thông sẵn sàng ở chế độ công khai.
12:24
So we're pullingkéo in
276
729000
2000
Vì vậy chúng tôi lấy
12:26
about threesố ba billiontỷ commentsbình luận a monththáng,
277
731000
2000
khoảng 3 tỉ ý kiến một tháng.
12:28
and then the magicma thuật happensxảy ra.
278
733000
2000
Và rồi điều kì diệu xuất hiện.
12:30
You have the eventbiến cố structurekết cấu,
279
735000
2000
Bạn có được cấu trúc sự kiện,
12:32
the commonchung groundđất that the wordstừ ngữ are about,
280
737000
2000
nền tảng ý nghĩa của các từ
12:34
comingđang đến out of the televisiontivi feedsnguồn cấp dữ liệu;
281
739000
3000
xuất hiện từ các chương trình TV;
12:37
you've got the conversationscuộc trò chuyện
282
742000
2000
bạn có các cuộc hội thoại
12:39
that are about those topicschủ đề;
283
744000
2000
về những chủ đề đó:
12:41
and throughxuyên qua semanticngữ nghĩa analysisphân tích --
284
746000
3000
và thông qua phân tích về ngữ nghĩa --
12:44
and this is actuallythực ra realthực datadữ liệu you're looking at
285
749000
2000
đây thực sự là dữ liệu thực mà bạn đang tìm kiếm
12:46
from our datadữ liệu processingChế biến --
286
751000
2000
từ phân tích dữ liệu của chúng tôi --
12:48
eachmỗi yellowmàu vàng linehàng is showinghiển thị a linkliên kết beingđang madethực hiện
287
753000
3000
mỗi đường màu vàng cho thấy một liên kết hình thành
12:51
betweengiữa a commentbình luận in the wildhoang dã
288
756000
3000
giữa một ý kiện tự nhiên
12:54
and a piececái of eventbiến cố structurekết cấu comingđang đến out of the televisiontivi signaltín hiệu.
289
759000
3000
và một mẫu cấu trúc sự kiện từ phát sóng TV.
12:57
And the sametương tự ideaý kiến now
290
762000
2000
Giờ thì ý tưởng tương tự
12:59
can be builtđược xây dựng up.
291
764000
2000
cũng có thể được xây dựng.
13:01
And we get this wordscapewordscape,
292
766000
2000
Và chúng tôi có bảng từ này.
13:03
exceptngoại trừ now wordstừ ngữ are not assembledlắp ráp in my livingsống roomphòng.
293
768000
3000
trừ những từ không lấy từ trong phòng khách của tôi.
13:06
InsteadThay vào đó, the contextbối cảnh, the commonchung groundđất activitieshoạt động,
294
771000
4000
thay vì là ngữ cảnh, các hoạt động chung mới là
13:10
are the contentNội dung on televisiontivi that's drivingđiều khiển the conversationscuộc trò chuyện.
295
775000
3000
là nội dung dẫn tới các cuộc nói chuyện trên TV.
13:13
And what we're seeingthấy here, these skyscrapersnhà chọc trời now,
296
778000
3000
Và cái mà chúng tôi thấy ở đây, những tòa nhà chọc trời,
13:16
are commentarybình luận
297
781000
2000
là nội dung bình luận
13:18
that are linkedliên kết to contentNội dung on televisiontivi.
298
783000
2000
liên quan tới chủ đề trên TV.
13:20
SameTương tự conceptkhái niệm,
299
785000
2000
Cùng khái niệm,
13:22
but looking at communicationgiao tiếp dynamicsđộng lực học
300
787000
2000
nhưng khi nhìn vào các động lực của việc giao tiếp
13:24
in a very differentkhác nhau spherequả cầu.
301
789000
2000
trên một khía cạnh rất khác.
13:26
And so fundamentallyvề cơ bản, ratherhơn than, for examplethí dụ,
302
791000
2000
Động lực đó hình thành theo một cách thiết yếu cần thiết, chứ không hẳn là, như là
13:28
measuringđo lường contentNội dung baseddựa trên on how manynhiều people are watchingxem,
303
793000
3000
việc đo lường nội dung dựa trên số lượng người đang xem.
13:31
this givesđưa ra us the basiccăn bản datadữ liệu
304
796000
2000
điều này cho chúng tôi dữ liệu cơ bản
13:33
for looking at engagementhôn ước propertiestính chất of contentNội dung.
305
798000
3000
để nhìn vào các tính chất tiềm năng của chủ đề.
13:36
And just like we can look at feedbackPhản hồi cycleschu kỳ
306
801000
3000
Và chỉ như cách chúng ta nhìn vào các vòng phản hồi
13:39
and dynamicsđộng lực học in a familygia đình,
307
804000
3000
và các hoạt động trong một gia đình,
13:42
we can now openmở up the sametương tự conceptscác khái niệm
308
807000
3000
chúng ta bây giờ có thể tạo ra khái niệm giống vậy
13:45
and look at much largerlớn hơn groupscác nhóm of people.
309
810000
3000
và nhìn vào một nhóm người lớn hơn nhiều.
13:48
This is a subsettập hợp con of datadữ liệu from our databasecơ sở dữ liệu --
310
813000
3000
Đây là tập hợp con của dữ liệu trong cơ sở dữ liệu của chúng tôi ==
13:51
just 50,000 out of severalmột số milliontriệu --
311
816000
3000
chỉ 50.000 trong hàng triệu dữ liệu--
13:54
and the socialxã hội graphbiểu đồ that connectskết nối them
312
819000
2000
và biểu đồ xã hội kết nối chúng
13:56
throughxuyên qua publiclycông khai availablecó sẵn sourcesnguồn.
313
821000
3000
thông qua các nguồn công cộng sẵn có.
13:59
And if you put them on one plaintrơn,
314
824000
2000
Và nếu bạn cho các dữ liệu vào một nơi,
14:01
a secondthứ hai plaintrơn is where the contentNội dung livescuộc sống.
315
826000
3000
một nơi thứ hai để chứa nội dung.
14:04
So we have the programschương trình
316
829000
3000
Chúng ta có các chương trình
14:07
and the sportingthể thao eventssự kiện
317
832000
2000
và các sự kiện thể thao
14:09
and the commercialsquảng cáo,
318
834000
2000
và các quảng cáo,
14:11
and all of the linkliên kết structurescấu trúc that tiecà vạt them togethercùng với nhau
319
836000
2000
và tất cả cấu trúc liên kết kết nối các dữ liệu đó với nhau
14:13
make a contentNội dung graphbiểu đồ.
320
838000
2000
tạo nên một biểu đồ nội dung.
14:15
And then the importantquan trọng thirdthứ ba dimensionkích thước.
321
840000
4000
Và sau đó là biểu đồ ba chiều quan trọng.
14:19
EachMỗi of the linksliên kết that you're seeingthấy renderedkết xuất here
322
844000
2000
Mỗi một liên kết mà bạn đang xem được biểu diễn ở đây
14:21
is an actualthực tế connectionkết nối madethực hiện
323
846000
2000
là một liên kết thực sự được tạo ra
14:23
betweengiữa something someonengười nào said
324
848000
3000
giữa điều mà một ai đó nói ra
14:26
and a piececái of contentNội dung.
325
851000
2000
và kà một phần nội dung.
14:28
And there are, again, now tenshàng chục of millionshàng triệu of these linksliên kết
326
853000
3000
Hiện tại có hàng triệu những liên kết này
14:31
that give us the connectiveliên kết tissue of socialxã hội graphsđồ thị
327
856000
3000
cho chúng ta mối liên kết của các biểu đồ xã hội
14:34
and how they relateliên hệ to contentNội dung.
328
859000
3000
và cách mà chúng liên hệ với nội dung.
14:37
And we can now startkhởi đầu to probethăm dò the structurekết cấu
329
862000
2000
Và chúng ta hiện tại có thể bắt đầu dò tìm cấu trúc
14:39
in interestinghấp dẫn wayscách.
330
864000
2000
bằng những cách thú vị.
14:41
So if we, for examplethí dụ, tracedấu vết the pathcon đường
331
866000
3000
Và nếu chúng ta, như là dò con đường
14:44
of one piececái of contentNội dung
332
869000
2000
của một mẩu tin
14:46
that drivesổ đĩa someonengười nào to commentbình luận on it,
333
871000
2000
dẫn dắt người nào đó bình luận về nó,
14:48
and then we followtheo where that commentbình luận goesđi,
334
873000
3000
và rồi chúng ta đi theo bình luận đó,
14:51
and then look at the entiretoàn bộ socialxã hội graphbiểu đồ that becomestrở thành activatedkích hoạt
335
876000
3000
và rồi nhìn vào toàn bộ biểu đồ xã hội được kích hoạt
14:54
and then tracedấu vết back to see the relationshipmối quan hệ
336
879000
3000
và rồi theo ngược về để thấy mỗi liên hệ
14:57
betweengiữa that socialxã hội graphbiểu đồ and contentNội dung,
337
882000
2000
giữa biểu đồ xã hội và nội dung,
14:59
a very interestinghấp dẫn structurekết cấu becomestrở thành visiblecó thể nhìn thấy.
338
884000
2000
một cấu trúc rất thú vị hiện ra.
15:01
We call this a co-viewingcùng xem cliquetập đoàn,
339
886000
2000
Chúng tôi gọi đó là xem kép,
15:03
a virtualảo livingsống roomphòng if you will.
340
888000
3000
nếu bạn muốn, thì sẽ là phòng khách ảo.
15:06
And there are fascinatinghấp dẫn dynamicsđộng lực học at playchơi.
341
891000
2000
Có những động cơ cuốn hút hoạt động diễn ra.
15:08
It's not one way.
342
893000
2000
Không phải là một chiều.
15:10
A piececái of contentNội dung, an eventbiến cố, causesnguyên nhân someonengười nào to talk.
343
895000
3000
Một mẫu nội dung, một sự kiện, làm cho người nào đó nói.
15:13
They talk to other people.
344
898000
2000
Họ nói chuyện với những người khác.
15:15
That drivesổ đĩa tune-ingiai điệu trong behaviorhành vi back into masskhối lượng mediaphương tiện truyền thông,
345
900000
3000
Điều này dẫn đến điều chỉnh hành trở ngược vi với đối tượng truyền thông,
15:18
and you have these cycleschu kỳ
346
903000
2000
và những vòng luân chuyển này
15:20
that drivelái xe the overalltổng thể behaviorhành vi.
347
905000
2000
điều khiển toàn bộ hành vi.
15:22
AnotherKhác examplethí dụ -- very differentkhác nhau --
348
907000
2000
Một ví dụ khác -- rất khác biệt --
15:24
anotherkhác actualthực tế personngười in our databasecơ sở dữ liệu --
349
909000
3000
một người thật khác trong cơ sở dữ liệu của chúng tôi --
15:27
and we're findingPhát hiện at leastít nhất hundredshàng trăm, if not thousandshàng nghìn, of these.
350
912000
3000
và chúng tôi tìm thấy ít nhất hàng trăm, thay vì lài hàng ngàn, những người như vậy.
15:30
We'veChúng tôi đã givenđược this personngười a nameTên.
351
915000
2000
Chúng tôi gọi người đó bằng một tên.
15:32
This is a pro-amateurchuyên nghiệp dư, or pro-ampro-am mediaphương tiện truyền thông criticnhà phê bình
352
917000
3000
Đây là một nhà phê bình truyền hình bán chuyên nghiệp
15:35
who has this highcao fan-outfan-out ratetỷ lệ.
353
920000
3000
có tỉ lệ người hâm mộ cao.
15:38
So a lot of people are followingtiếp theo this personngười -- very influentialảnh hưởng --
354
923000
3000
Vì vậy nhiều người đang nghe theo người này -- chịu ảnh hưởng rất nhiều --
15:41
and they have a propensityxu hướng to talk about what's on TVTRUYỀN HÌNH.
355
926000
2000
và họ có khuynh hướng nói về những thứ chiếu trên TV.
15:43
So this personngười is a keyChìa khóa linkliên kết
356
928000
3000
Vì vậy người này là một liên kết quan trọng
15:46
in connectingkết nối masskhối lượng mediaphương tiện truyền thông and socialxã hội mediaphương tiện truyền thông togethercùng với nhau.
357
931000
3000
trong việc kết nối phương tiện truyền thông và phương tiện xã hội với nhau.
15:49
One last examplethí dụ from this datadữ liệu:
358
934000
3000
Một ví dụ cuối cùng từ dữ liệu này:
15:52
SometimesĐôi khi it's actuallythực ra a piececái of contentNội dung that is specialđặc biệt.
359
937000
3000
Đôi khi nó thực sự là một mẩu tin đặc biệt.
15:55
So if we go and look at this piececái of contentNội dung,
360
940000
4000
Vì vậy nếu chúng ta nhìn vào mẩu tin,
15:59
PresidentTổng thống Obama'sCủa Obama StateNhà nước of the UnionLiên minh addressđịa chỉ nhà
361
944000
3000
Nhà nước liên minh của Tổng thống Obama phát biểu
16:02
from just a fewvài weekstuần agotrước,
362
947000
2000
từ vài tuần trước,
16:04
and look at what we find in this sametương tự datadữ liệu setbộ,
363
949000
3000
và nhìn vào cái mà chúng ta thấy trong tập dữ liệu tương tự này,
16:07
at the sametương tự scaletỉ lệ,
364
952000
3000
ở một mức độ tương tự,
16:10
the engagementhôn ước propertiestính chất of this piececái of contentNội dung
365
955000
2000
các tính chất hấp dẫn của mẩu tin này
16:12
are trulythực sự remarkableđáng chú ý.
366
957000
2000
là thực sự đáng chú ý.
16:14
A nationquốc gia explodingbùng nổ in conversationcuộc hội thoại
367
959000
2000
Một cuộc hội thoại bùng nổ trên cả nước
16:16
in realthực time
368
961000
2000
trên thực tế
16:18
in responsephản ứng to what's on the broadcastphát sóng.
369
963000
3000
là sự phản hồi lại những điều được phát sóng.
16:21
And of coursekhóa học, throughxuyên qua all of these linesđường dây
370
966000
2000
Và tất nhiên, thông tất cả các đường thẳng này
16:23
are flowingchảy unstructuredkhông có cấu trúc languagengôn ngữ.
371
968000
2000
là dòng chảy ngôn ngữ không cấu trúc.
16:25
We can X-rayX-quang
372
970000
2000
Chúng ta có thể chụp X-quang
16:27
and get a real-timethời gian thực pulsexung of a nationquốc gia,
373
972000
2000
và có được một nhịp thời gian hiện thực của đất nước,
16:29
real-timethời gian thực sensegiác quan
374
974000
2000
cái nhìn thời gian thực
16:31
of the socialxã hội reactionsphản ứng in the differentkhác nhau circuitsmạch in the socialxã hội graphbiểu đồ
375
976000
3000
về các phản ứng xã hội về những mạch dẫn khác nhau trong một biểu đồ xã hội
16:34
beingđang activatedkích hoạt by contentNội dung.
376
979000
3000
được nội dung kích hoạt.
16:37
So, to summarizetóm tắt, the ideaý kiến is this:
377
982000
3000
Vì vậy, để tóm tắt lại, ý tưởng ở đây là:
16:40
As our worldthế giới becomestrở thành increasinglyngày càng instrumentedinstrumented
378
985000
3000
Khi thế giới giới chúng ta được trang bị công cụ ngày càng nhiều
16:43
and we have the capabilitieskhả năng
379
988000
2000
và chúng ta có những khả năng
16:45
to collectsưu tầm and connectkết nối the dotsdấu chấm
380
990000
2000
để thu thập và liên kết các chấm
16:47
betweengiữa what people are sayingnói
381
992000
2000
giữa những cái mà người ta nói
16:49
and the contextbối cảnh they're sayingnói it in,
382
994000
2000
và ngữ cảnh mà họ đang nói.
16:51
what's emergingmới nổi is an abilitycó khả năng
383
996000
2000
điều mà đem đến một khả năng
16:53
to see newMới socialxã hội structurescấu trúc and dynamicsđộng lực học
384
998000
3000
để thấy các cấu trúc xã hội mới và các động lực
16:56
that have previouslytrước đây not been seenđã xem.
385
1001000
2000
điều này trước đó chưa hề thấy được.
16:58
It's like buildingTòa nhà a microscopekính hiển vi or telescopekính viễn vọng
386
1003000
2000
Nó giống như là xây một cái kính hiển vi hay một cái kính viễn vọng
17:00
and revealingđể lộ newMới structurescấu trúc
387
1005000
2000
và khám phá ra các cấu trúc mới
17:02
about our ownsở hữu behaviorhành vi around communicationgiao tiếp.
388
1007000
3000
về hành vì của chúng ta quanh việc giao tiếp
17:05
And I think the implicationshàm ý here are profoundthâm thúy,
389
1010000
3000
Và tôi nghĩ ý nghĩa của việc này thực sâu sắc.
17:08
whetherliệu it's for sciencekhoa học,
390
1013000
2000
dù nó là vì khoa học,
17:10
for commercethương mại, for governmentchính quyền,
391
1015000
2000
để quảng cáo, hay cho mục đích của chính phủ,
17:12
or perhapscó lẽ mostphần lớn of all,
392
1017000
2000
hay có thể cho tất cả,
17:14
for us as individualscá nhân.
393
1019000
3000
cho cá nhân chúng ta
17:17
And so just to returntrở về to my sonCon trai,
394
1022000
3000
và vì vậy quay lại với con trai của tôi,
17:20
when I was preparingchuẩn bị this talk, he was looking over my shouldervai,
395
1025000
3000
khi tôi đang chuẩn bị buổi nói chuyện này, nó đang nhìn qua vai của tôi,
17:23
and I showedcho thấy him the clipsclip I was going to showchỉ to you todayhôm nay,
396
1028000
2000
và tôi cho nó thấy những cái đoạn phim mà tôi cho các bạn xem hôm nay,
17:25
and I askedyêu cầu him for permissionsự cho phép -- grantedđược cấp.
397
1030000
3000
và tôi hỏi sự đồng ý của nó -- và nó chấp nhận.
17:28
And then I wentđã đi on to reflectphản chiếu,
398
1033000
2000
Và rồi tôi tự ngẫm,
17:30
"Isn't it amazingkinh ngạc,
399
1035000
3000
"Điều đó không tuyệt sao,
17:33
this entiretoàn bộ databasecơ sở dữ liệu, all these recordingsđoạn ghi âm,
400
1038000
3000
toàn bộ cơ sở dữ liệu này, tất cả những đoạn thu này,
17:36
I'm going to handtay off to you and to your sisterem gái" --
401
1041000
2000
ba sẽ giao lại cho con và em gái của con,"
17:38
who arrivedđã đến two yearsnăm latermột lát sau --
402
1043000
3000
đứa em mà được sinh ra 2 năm sau.
17:41
"and you guys are going to be ablecó thể to go back and re-experiencelại kinh nghiệm momentskhoảnh khắc
403
1046000
3000
"Và các con sẽ có thể quay lại và trải nghiệm lại những khoảnh khắc
17:44
that you could never, with your biologicalsinh học memoryký ức,
404
1049000
3000
mà với trí nhớ bình thường của mình, các con có thể chưa bao giờ
17:47
possiblycó thể remembernhớ lại the way you can now?"
405
1052000
2000
có thể nhớ được như bây giờ."
17:49
And he was quietYên tĩnh for a momentchốc lát.
406
1054000
2000
Và nó im lặng một lúc.
17:51
And I thought, "What am I thinkingSuy nghĩ?
407
1056000
2000
Và tôi nghĩ. "Tôi đang nghĩ gì vậy?
17:53
He's fivesố năm yearsnăm old. He's not going to understandhiểu không this."
408
1058000
2000
Nó mới 5 tuổi. Nó chưa hiểu điều này đâu."
17:55
And just as I was havingđang có that thought, he lookednhìn up at me and said,
409
1060000
3000
Và ngay khi tôi đang có ý nghĩ đó, nó nhìn lên tôi và nói,
17:58
"So that when I growlớn lên up,
410
1063000
2000
"Vậy khi con lớn lên,
18:00
I can showchỉ this to my kidstrẻ em?"
411
1065000
2000
con có thể chiếu cái này cho con của con phải không?"
18:02
And I thought, "WowWow, this is powerfulquyền lực stuffđồ đạc."
412
1067000
3000
Và tôi nghĩ, "Wow, đây là thứ đầy quyền lực."
18:05
So I want to leaverời khỏi you
413
1070000
2000
Vì vậy tôi muốn nói cho các bạn
18:07
with one last memorableđáng ghi nhớ momentchốc lát
414
1072000
2000
về một khoảng khắc cuối
18:09
from our familygia đình.
415
1074000
3000
từ gia đình tôi.
18:12
This is the first time our sonCon trai
416
1077000
2000
Đây là lần đầu tiên con trai chúng tôi
18:14
tooklấy more than two stepscác bước at onceMột lần --
417
1079000
2000
đi hơn 2 bước một lần --
18:16
capturedbị bắt on filmphim ảnh.
418
1081000
2000
được ghi lại trong đoạn phim.
18:18
And I really want you to focustiêu điểm on something
419
1083000
3000
Và tôi thực sự muốn các bạn tập trung vài cái điều
18:21
as I take you throughxuyên qua.
420
1086000
2000
như tôi đang dẫn bạn đi đây
18:23
It's a clutteredlộn xộn environmentmôi trường; it's naturaltự nhiên life.
421
1088000
2000
Đó là một môi trường đầy xáo trộn: nó là cuộc sống tự nhiên.
18:25
My mother'smẹ in the kitchenphòng bếp, cookingnấu nướng,
422
1090000
2000
Mẹ của tôi trong nhà bếp, đang nấu ăn,
18:27
and, of all placesnơi, in the hallwayhành lang,
423
1092000
2000
và, tất cả mọi nơi, trong lối đi,
18:29
I realizenhận ra he's about to do it, about to take more than two stepscác bước.
424
1094000
3000
Tôi nhận ra nó đang sắp làm việc đó, sắp bước hơn 2 bước.
18:32
And so you hearNghe me encouragingkhuyến khích him,
425
1097000
2000
các bạn nghe tôi cỗ vũ con,
18:34
realizingnhận ra what's happeningxảy ra,
426
1099000
2000
đang nhận ra điều đang diễn ra,
18:36
and then the magicma thuật happensxảy ra.
427
1101000
2000
và rồi phép màu xuất hiện.
18:38
Listen very carefullycẩn thận.
428
1103000
2000
Hãy nghe kỹ
18:40
About threesố ba stepscác bước in,
429
1105000
2000
Sắp được 3 bước,
18:42
he realizesnhận ra something magicma thuật is happeningxảy ra,
430
1107000
2000
con trai tôi nhận ra cái gì đó màu nhiệm đang diễn ra.
18:44
and the mostphần lớn amazingkinh ngạc feedbackPhản hồi loopvòng lặp of all kicksđá in,
431
1109000
3000
Và vòng phản hồi tuyệt diệu nhất xảy ra,
18:47
and he takes a breathhơi thở in,
432
1112000
2000
và nó thở vào,
18:49
and he whispersthì thầm "wowwow"
433
1114000
2000
và nó thì thầm "wow"
18:51
and instinctivelytheo bản năng I echoecho back the sametương tự.
434
1116000
4000
và một cách bản năng tôi phản hồi lại như vậy.
18:56
And so let's flybay back in time
435
1121000
3000
Và vì vậy quay lại thời gian
18:59
to that memorableđáng ghi nhớ momentchốc lát.
436
1124000
2000
tới thời điểm đáng nhớ đó.
19:05
(VideoVideo) DRTIẾN SĨ: Hey.
437
1130000
2000
(Phim) DR: Hey.
19:07
Come here.
438
1132000
2000
Tới đây.
19:09
Can you do it?
439
1134000
3000
Con làm được không?
19:13
Oh, boycon trai.
440
1138000
2000
Oh, con trai.
19:15
Can you do it?
441
1140000
3000
Con làm được không?
19:18
BabyEm bé: Yeah.
442
1143000
2000
Em bé: Yeah.
19:20
DRTIẾN SĨ: MaMa, he's walkingđi dạo.
443
1145000
3000
DR: Mẹ, nó đang đi nè.
19:24
(LaughterTiếng cười)
444
1149000
2000
(Tiếng cười)
19:26
(ApplauseVỗ tay)
445
1151000
2000
(Vỗ tay)
19:28
DRTIẾN SĨ: Thank you.
446
1153000
2000
DR: Cảm ơn.
19:30
(ApplauseVỗ tay)
447
1155000
15000
(Vỗ tay)
Translated by Minh-Tuan Ta
Reviewed by Tu Tran

▲Back to top

ABOUT THE SPEAKER
Deb Roy - Cognitive scientist
Deb Roy studies how children learn language, and designs machines that learn to communicate in human-like ways. On sabbatical from MIT Media Lab, he's working with the AI company Bluefin Labs.

Why you should listen

Deb Roy directs the Cognitive Machines group at the MIT Media Lab, where he studies how children learn language, and designs machines that learn to communicate in human-like ways. To enable this work, he has pioneered new data-driven methods for analyzing and modeling human linguistic and social behavior. He has authored numerous scientific papers on artificial intelligence, cognitive modeling, human-machine interaction, data mining, and information visualization.

Deb Roy was the co-founder and serves as CEO of Bluefin Labs, a venture-backed technology company. Built upon deep machine learning principles developed in his research over the past 15 years, Bluefin has created a technology platform that analyzes social media commentary to measure real-time audience response to TV ads and shows.

Follow Deb Roy on Twitter>

Roy adds some relevant papers:

Deb Roy. (2009). New Horizons in the Study of Child Language Acquisition. Proceedings of Interspeech 2009. Brighton, England. bit.ly/fSP4Qh

Brandon C. Roy, Michael C. Frank and Deb Roy. (2009). Exploring word learning in a high-density longitudinal corpus. Proceedings of the 31st Annual Meeting of the Cognitive Science Society. Amsterdam, Netherlands. bit.ly/e1qxej

Plenty more papers on our research including technology and methodology can be found here, together with other research from my lab at MIT: bit.ly/h3paSQ

The work that I mentioned on relationships between television content and the social graph is being done at Bluefin Labs (www.bluefinlabs.com). Details of this work have not been published. The social structures we are finding (and that I highlighted in my TED talk) are indeed new. The social media communication channels that are leading to their formation did not even exist a few years ago, and Bluefin's technology platform for discovering these kinds of structures is the first of its kind. We'll certainly have more to say about all this as we continue to dig into this fascinating new kind of data, and as new social structures continue to evolve!

More profile about the speaker
Deb Roy | Speaker | TED.com