ABOUT THE SPEAKER
Rajesh Rao - Computational neuroscientist
Rajesh Rao seeks to understand the human brain through computational modeling, on two fronts: developing computer models of our minds, and using tech to decipher the 4,000-year-old lost script of the Indus Valley civilization.

Why you should listen

Rajesh Rao is looking for the computational principles underlying the brain's remarkable ability to learn, process and store information --  hoping to apply this knowledge to the task of building adaptive robotic systems and artificially intelligent agents.

Some of the questions that motivate his research include: How does the brain learn efficient representations of novel objects and events occurring in the natural environment? What are the algorithms that allow useful sensorimotor routines and behaviors to be learned? What computational mechanisms allow the brain to adapt to changing circumstances and remain fault-tolerant and robust?

By investigating these questions within a computational and probabilistic framework, it is often possible to derive algorithms that not only provide functional interpretations of neurobiological properties but also suggest solutions to difficult problems in computer vision, speech, robotics and artificial intelligence.

More profile about the speaker
Rajesh Rao | Speaker | TED.com
TED2011

Rajesh Rao: A Rosetta Stone for a lost language

Rajesh Rao: 破解印度河文字的罗塞塔石碑

Filmed:
2,103,451 views

Rajesh Rao 着迷于“所有填字游戏的鼻祖”, 破解具有4000年历史的印度河文字。 在TED2011年大会上, 他讲述了他怎样运用现代计算机技术来解读印度河流域的语言文字,帮助解开印度古文明之谜的关键。
- Computational neuroscientist
Rajesh Rao seeks to understand the human brain through computational modeling, on two fronts: developing computer models of our minds, and using tech to decipher the 4,000-year-old lost script of the Indus Valley civilization. Full bio

Double-click the English transcript below to play the video.

00:15
I'd like to begin开始 with a thought experiment实验.
0
0
3000
首先,我们来做个思考的实验
00:19
Imagine想像 that it's 4,000 years年份 into the future未来.
1
4000
3000
想像距今4000年后
00:22
Civilization文明 as we know it
2
7000
2000
我们所了解的文明
00:24
has ceased停止 to exist存在 --
3
9000
2000
不复存在
00:26
no books图书,
4
11000
2000
没有书籍
00:28
no electronic电子 devices设备,
5
13000
3000
没有电子设备
00:31
no FacebookFacebook的 or Twitter推特.
6
16000
3000
没有脸书没有推特
00:34
All knowledge知识 of the English英语 language语言 and the English英语 alphabet字母
7
19000
3000
英语和英语字母
00:37
has been lost丢失.
8
22000
2000
也都消失殆尽
00:39
Now imagine想像 archeologists考古学家
9
24000
2000
现在再来想想考古学家们
00:41
digging挖掘 through通过 the rubble瓦砾 of one of our cities城市.
10
26000
2000
在我们城市残砖碎瓦中挖掘
00:43
What might威力 they find?
11
28000
2000
他们会发现什么呢?
00:45
Well perhaps也许 some rectangular长方形 pieces of plastic塑料
12
30000
3000
可能会发现长方形的塑胶
00:48
with strange奇怪 symbols符号 on them.
13
33000
3000
上面印着奇怪的符号
00:51
Perhaps也许 some circular pieces of metal金属.
14
36000
3000
或者发现一些圆形的金属碎片
00:54
Maybe some cylindrical圆柱形 containers集装箱
15
39000
2000
也可能是些圆柱型的容器
00:56
with some symbols符号 on them.
16
41000
2000
上头有些符号
00:58
And perhaps也许 one archeologist考古学家 becomes an instant瞬间 celebrity名人
17
43000
3000
还可能有某个考古学家在
01:01
when she discovers发现的 --
18
46000
2000
北美的某个地方
01:03
buried隐藏 in the hills丘陵 somewhere某处 in North America美国 --
19
48000
2000
发现了大量相似的符号后
01:05
massive大规模的 versions版本 of these same相同 symbols符号.
20
50000
3000
一夜成名
01:10
Now let's ask ourselves我们自己,
21
55000
2000
让我们来问问我们自己
01:12
what could such这样 artifacts文物 say about us
22
57000
3000
我们的这些残存给4000年后
01:15
to people 4,000 years年份 into the future未来?
23
60000
3000
的人们展示了一个怎样的我们
01:18
This is no hypothetical假想 question.
24
63000
2000
这不是假设
01:20
In fact事实, this is exactly究竟 the kind of question we're faced面对 with
25
65000
3000
事实上,这正是我们面对
01:23
when we try to understand理解 the Indus梧桐 Valley civilization文明,
26
68000
3000
4000年前存在的印度河流域文明时
01:26
which哪一个 existed存在 4,000 years年份 ago.
27
71000
2000
面对的问题
01:28
The Indus梧桐 civilization文明 was roughly大致 contemporaneous同期
28
73000
3000
古印度河流域文明和较为人所熟知的
01:31
with the much better known已知 Egyptian埃及人 and the Mesopotamian美索不达米亚 civilizations文明,
29
76000
3000
埃及以及美所不达米亚文化大概处于同时期
01:34
but it was actually其实 much larger than either of these two civilizations文明.
30
79000
3000
但其实它的范围超过这两个文明中的任何一个
01:37
It occupied占据 the area
31
82000
2000
它涵盖了
01:39
of approximately one million百万 square广场 kilometers公里,
32
84000
2000
大约一百万平方公里
01:41
covering覆盖 what is now Pakistan巴基斯坦,
33
86000
2000
包括今天的巴基斯坦
01:43
Northwestern西北方 India印度
34
88000
2000
印度的西北部
01:45
and parts部分 of Afghanistan阿富汗 and Iran伊朗.
35
90000
2000
部分阿富汗和伊朗
01:47
Given特定 that it was such这样 a vast广大 civilization文明,
36
92000
2000
如此广大的文明
01:49
you might威力 expect期望 to find really powerful强大 rulers统治者, kings国王,
37
94000
4000
你可能会期待有强大的统治者,国王
01:53
and huge巨大 monuments纪念碑 glorifying荣耀 these powerful强大 kings国王.
38
98000
3000
以及用来纪念王者的巨大纪念碑
01:56
In fact事实,
39
101000
2000
事实上
01:58
what archeologists考古学家 have found发现 is none没有 of that.
40
103000
2000
考古学者没有发现那些
02:00
They've他们已经 found发现 small objects对象 such这样 as these.
41
105000
3000
他们发现了这样一些小物件
02:03
Here's这里的 an example of one of these objects对象.
42
108000
3000
这就是其中的一样
02:06
Well obviously明显 this is a replica复制品.
43
111000
2000
当然这只是个复制品
02:08
But who is this person?
44
113000
3000
但这是谁呢?
02:11
A king国王? A god?
45
116000
2000
是一个国王?一个神?
02:13
A priest牧师?
46
118000
2000
还是某个祭祀?
02:15
Or perhaps也许 an ordinary普通 person
47
120000
2000
或者是一个普通人
02:17
like you or me?
48
122000
2000
如你和我?
02:19
We don't know.
49
124000
2000
我们不知道
02:21
But the Indus梧桐 people also left behind背后 artifacts文物 with writing写作 on them.
50
126000
3000
但是古印度流域的人们也留下了背面写有字符的手工制品
02:24
Well no, not pieces of plastic塑料,
51
129000
2000
不是在塑料片上
02:26
but stone seals密封件, copper tablets平板电脑,
52
131000
3000
而是在石头图章,铜片上
02:29
pottery陶器 and, surprisingly出奇,
53
134000
2000
陶器,还有令人惊讶的
02:31
one large sign标志 board,
54
136000
2000
在很大的符号石板上
02:33
which哪一个 was found发现 buried隐藏 near the gate of a city.
55
138000
2000
掩埋在城门附近的
02:35
Now we don't know if it says Hollywood好莱坞,
56
140000
2000
所以我们不知道上面是否写了好莱坞
02:37
or even Bollywood宝莱坞 for that matter.
57
142000
2000
甚至是宝莱坞
02:39
In fact事实, we don't even know
58
144000
2000
事实上,我们不知道
02:41
what any of these objects对象 say,
59
146000
2000
上面写的任何东西
02:43
and that's because the Indus梧桐 script脚本 is undeciphered破译.
60
148000
3000
因为我们还不能破译这些印度河文字
02:46
We don't know what any of these symbols符号 mean.
61
151000
2000
我们不知道这些符号是什么意思
02:48
The symbols符号 are most commonly常用 found发现 on seals密封件.
62
153000
3000
这些符号大多数出现在印章上
02:51
So you see up there one such这样 object目的.
63
156000
2000
你们可以看到这个物品
02:53
It's the square广场 object目的 with the unicorn-like麒麟状 animal动物 on it.
64
158000
3000
这个方形的物品上有个像是独角兽的动物
02:56
Now that's a magnificent华丽的 piece of art艺术.
65
161000
2000
这是一件很精致的艺术品
02:58
So how big do you think that is?
66
163000
2000
你觉得这块有多大呢?
03:00
Perhaps也许 that big?
67
165000
2000
这么大?
03:02
Or maybe that big?
68
167000
2000
也许这么大?
03:04
Well let me show显示 you.
69
169000
2000
让我来给你看看
03:07
Here's这里的 a replica复制品 of one such这样 seal密封.
70
172000
3000
这是这枚印章的复制品
03:10
It's only about one inch英寸 by one inch英寸 in size尺寸 --
71
175000
2000
只有一平方英吋大
03:12
pretty漂亮 tiny.
72
177000
2000
很小
03:14
So what were these used for?
73
179000
2000
那这是干什么用的呢?
03:16
We know that these were used for stamping冲压 clay粘土 tags标签
74
181000
3000
我们知道这是用来盖在黏土标签上的
03:19
that were attached to bundles捆绑 of goods产品 that were sent发送 from one place地点 to the other.
75
184000
3000
一捆捆的货物被附上标签,从一地被运往另一地
03:22
So you know those packing填料 slips卡瓦 you get on your FedEx联邦快递 boxes盒子?
76
187000
3000
你知道联邦快递盒子里的那种装箱单吧?
03:25
These were used to make those kinds of packing填料 slips卡瓦.
77
190000
3000
这些就是用来做那些送货单的
03:28
You might威力 wonder奇迹 what these objects对象 contain包含
78
193000
3000
你也许会想知道这些东西
03:31
in terms条款 of their text文本.
79
196000
2000
包涵了什么文字含义
03:33
Perhaps也许 they're the name名称 of the sender寄件人
80
198000
2000
也许是寄件人的名字
03:35
or some information信息 about the goods产品
81
200000
2000
或者是某些货物的信息
03:37
that are being存在 sent发送 from one place地点 to the other -- we don't know.
82
202000
3000
从一地被送往别处-我们不知道
03:40
We need to decipher解码 the script脚本 to answer回答 that question.
83
205000
2000
我们需要破解这段文字才能回答那个问题
03:42
Deciphering解读 the script脚本
84
207000
2000
破解这段文字
03:44
is not just an intellectual知识分子 puzzle难题;
85
209000
2000
不只是破解一个智力难题
03:46
it's actually其实 become成为 a question
86
211000
2000
事实上这个问题
03:48
that's become成为 deeply intertwined交织
87
213000
2000
深深地和南亚的政治
03:50
with the politics政治 and the cultural文化 history历史 of South Asia亚洲.
88
215000
3000
文化历史交织在一起
03:53
In fact事实, the script脚本 has become成为 a battleground战场 of sorts排序
89
218000
3000
而对这些文字的争论已经形成了一个战场
03:56
between之间 three different不同 groups of people.
90
221000
2000
三群持不同见解团体各持己见
03:58
First, there's a group of people
91
223000
2000
第一群人
04:00
who are very passionate多情 in their belief信仰
92
225000
2000
热切地坚信
04:02
that the Indus梧桐 script脚本
93
227000
2000
这些印度河流域的字符
04:04
does not represent代表 a language语言 at all.
94
229000
2000
完全不代表语言
04:06
These people believe that the symbols符号
95
231000
2000
这些人认为这些符号
04:08
are very similar类似 to the kind of symbols符号 you find on traffic交通 signs迹象
96
233000
3000
和交通标示的符号相似
04:11
or the emblems徽记 you find on shields盾牌.
97
236000
3000
也像盾上面的一些象征符号
04:14
There's a second第二 group of people
98
239000
2000
第二群人
04:16
who believe that the Indus梧桐 script脚本 represents代表 an Indo-European印欧 language语言.
99
241000
3000
相信印度河文字代表着某个印欧语言
04:19
If you look at a map地图 of India印度 today今天,
100
244000
2000
如果你看看印度今日的版图
04:21
you'll你会 see that most of the languages语言 spoken in North India印度
101
246000
3000
很多在印度北部使用的语言
04:24
belong属于 to the Indo-European印欧 language语言 family家庭.
102
249000
3000
都是属于印欧语系
04:27
So some people believe that the Indus梧桐 script脚本
103
252000
2000
所以一些人相信古印度河文字
04:29
represents代表 an ancient Indo-European印欧 language语言 such这样 as Sanskrit梵文.
104
254000
3000
是某种古老的印欧语,就像梵语一样
04:32
There's a last group of people
105
257000
2000
最后一群人
04:34
who believe that the Indus梧桐 people
106
259000
3000
相信古印度人
04:37
were the ancestors祖先 of people living活的 in South India印度 today今天.
107
262000
3000
是现居南印度的人的祖先
04:40
These people believe that the Indus梧桐 script脚本
108
265000
2000
这些人觉得古印度文字
04:42
represents代表 an ancient form形成
109
267000
2000
是达罗毗荼语系下的
04:44
of the Dravidian德拉威 language语言 family家庭,
110
269000
2000
一种古老的文字形式
04:46
which哪一个 is the language语言 family家庭 spoken in much of South India印度 today今天.
111
271000
3000
现今南印度多数人皆使用达罗毗荼语
04:49
And the proponents支持者 of this theory理论
112
274000
2000
支持这一理论的人
04:51
point to that small pocket口袋 of Dravidian-speaking德拉威语 people in the North,
113
276000
3000
指出印度北部有一小部份使用达罗毗荼语的人
04:54
actually其实 near Afghanistan阿富汗,
114
279000
2000
事实上靠近阿富汗
04:56
and they say that perhaps也许, sometime某时 in the past过去,
115
281000
3000
他们说或许,过去曾经有一段时间
04:59
Dravidian德拉威 languages语言 were spoken all over India印度
116
284000
3000
整个印度都使用达罗毗荼语
05:02
and that this suggests提示
117
287000
2000
这也意味着
05:04
that the Indus梧桐 civilization文明 is perhaps也许 also Dravidian德拉威.
118
289000
3000
印度河文明或许就是达罗毗荼文明
05:07
Which哪一个 of these hypotheses假设 can be true真正?
119
292000
3000
这些假设哪个是真的呢?
05:10
We don't know, but perhaps也许 if you deciphered破译 the script脚本,
120
295000
2000
我们不知道, 但如果你能解开这些文字符号
05:12
you would be able能够 to answer回答 this question.
121
297000
2000
你就能回答这个问题
05:14
But deciphering破译 the script脚本 is a very challenging具有挑战性的 task任务.
122
299000
2000
但是破解文字密码是一项很具有挑战性的任务
05:16
First, there's no Rosetta罗塞塔 Stone.
123
301000
2000
首先, 我们没有罗塞塔石碑
05:18
I don't mean the software软件;
124
303000
2000
我不是指那软件
05:20
I mean an ancient artifact神器
125
305000
2000
我是指那件文物
05:22
that contains包含 in the same相同 text文本
126
307000
2000
上面用我们知道和不知道的文字
05:24
both a known已知 text文本 and an unknown未知 text文本.
127
309000
3000
书写了同样的内容。
05:27
We don't have such这样 an artifact神器 for the Indus梧桐 script脚本.
128
312000
3000
印度河文化中并没有发现同样的古物
05:30
And furthermore此外, we don't even know what language语言 they spoke.
129
315000
3000
而且,我们不知道他们说的是什么语言
05:33
And to make matters事项 even worse更差,
130
318000
2000
更糟的是
05:35
most of the text文本 that we have are extremely非常 short.
131
320000
2000
大部份的文字都相当短
05:37
So as I showed显示 you, they're usually平时 found发现 on these seals密封件
132
322000
2000
就像我刚才给大家看的,最常发现的是在印章类的东西上
05:39
that are very, very tiny.
133
324000
2000
他们都非常非常地小
05:41
And so given特定 these formidable强大 obstacles障碍,
134
326000
2000
给我们解读带来了难以克服的障碍
05:43
one might威力 wonder奇迹 and worry担心
135
328000
2000
有些人或许会担心
05:45
whether是否 one will ever be able能够 to decipher解码 the Indus梧桐 script脚本.
136
330000
3000
是否真的有谁可以解开古印度河文字之谜呢?
05:48
In the rest休息 of my talk,
137
333000
2000
在我接下来的演讲中
05:50
I'd like to tell you about how I learned学到了 to stop worrying令人担忧
138
335000
2000
我要来告诉各位我怎么学会停止担心
05:52
and love the challenge挑战 posed构成 by the Indus梧桐 script脚本.
139
337000
2000
并喜欢上解读古印度河文字所带来的挑战
05:54
I've always been fascinated入迷 by the Indus梧桐 script脚本
140
339000
3000
我对古印度河文字的痴迷
05:57
ever since以来 I read about it in a middle中间 school学校 textbook教科书.
141
342000
2000
从在中学课本中读到便开始
05:59
And why was I fascinated入迷?
142
344000
2000
我为什么会着迷呢?
06:01
Well it's the last major重大的 undeciphered破译 script脚本 in the ancient world世界.
143
346000
4000
因为这是历史上目前唯一未被破解的重要的古文字
06:05
My career事业 path路径 led me to become成为 a computational计算 neuroscientist神经学家,
144
350000
3000
我的职业生涯让我成为一个计算机神经科学家
06:08
so in my day job工作,
145
353000
2000
我白天的工作
06:10
I create创建 computer电脑 models楷模 of the brain
146
355000
2000
是在电脑上模拟大脑
06:12
to try to understand理解 how the brain makes品牌 predictions预测,
147
357000
3000
试图了借大脑是怎样预知事物的
06:15
how the brain makes品牌 decisions决定,
148
360000
2000
大脑是怎样做决定的,
06:17
how the brain learns获悉 and so on.
149
362000
2000
大脑是怎样学习的等等
06:19
But in 2007, my path路径 crossed越过 again with the Indus梧桐 script脚本.
150
364000
3000
但在2007年,我与古印度河文字重逢
06:22
That's when I was in India印度,
151
367000
2000
当时在印度
06:24
and I had the wonderful精彩 opportunity机会
152
369000
2000
我有幸得到机会
06:26
to meet遇到 with some Indian印度人 scientists科学家们
153
371000
2000
跟一些印度科学家会面
06:28
who were using运用 computer电脑 models楷模 to try to analyze分析 the script脚本.
154
373000
3000
他们在用计算机模型分析这些文字
06:31
And so it was then that I realized实现
155
376000
2000
那个时候我认识到
06:33
there was an opportunity机会 for me to collaborate合作 with these scientists科学家们,
156
378000
3000
这是我跟这些科学家合作的一个机会
06:36
and so I jumped跳下 at that opportunity机会.
157
381000
2000
所以我立刻就抓住了这个机会
06:38
And I'd like to describe描述 some of the results结果 that we have found发现.
158
383000
2000
我想在这里介绍我们发现的一些结果
06:40
Or better yet然而, let's all collectively decipher解码.
159
385000
3000
或者更好的是,让我们一起来破解吧
06:43
Are you ready准备?
160
388000
2000
你们准备好了吗?
06:45
The first thing that you need to do when you have an undeciphered破译 script脚本
161
390000
3000
当你想要破解文字符号时,首先你要
06:48
is try to figure数字 out the direction方向 of writing写作.
162
393000
2000
分辨书写的方向
06:50
Here are two texts文本 that contain包含 some symbols符号 on them.
163
395000
3000
这里有两段相同符号的文字
06:53
Can you tell me
164
398000
2000
你能告诉我
06:55
if the direction方向 of writing写作 is right to left or left to right?
165
400000
3000
书写的方向是从右到左还是从左到右?
06:58
I'll give you a couple一对 of seconds.
166
403000
3000
我给大家几秒钟想一想
07:01
Okay. Right to left, how many许多? Okay.
167
406000
3000
好, 从右到左,有多少人同意?好
07:04
Okay. Left to right?
168
409000
2000
从左到右呢?
07:06
Oh, it's almost几乎 50/50. Okay.
169
411000
2000
噢,大约是一半一半
07:08
The answer回答 is:
170
413000
2000
答案是:
07:10
if you look at the left-hand左手 side of the two texts文本,
171
415000
2000
如果你看这两段文字的左边
07:12
you'll你会 notice注意 that there's a cramping抽筋 of signs迹象,
172
417000
3000
你会注意到左边的符号挤在一起
07:15
and it seems似乎 like 4,000 years年份 ago,
173
420000
2000
好像是4000年前
07:17
when the scribe was writing写作 from right to left,
174
422000
2000
当书写者从右写到左时
07:19
they ran out of space空间.
175
424000
2000
因为最后没地方了写了
07:21
And so they had to cram填满 the sign标志.
176
426000
2000
只能缩小间距
07:23
One of the signs迹象 is also below下面 the text文本 on the top最佳.
177
428000
2000
其中有一个符号也出现在下面的文字上面
07:25
This suggests提示 the direction方向 of writing写作
178
430000
2000
意味着书写的方向
07:27
was probably大概 from right to left,
179
432000
2000
是从右到左的
07:29
and so that's one of the first things we know,
180
434000
2000
所以我们知道的第一件事是
07:31
that directionality方向性 is a very key aspect方面 of linguistic语言 scripts脚本.
181
436000
3000
书写方向是语言符号中一个很关键的方面
07:34
And the Indus梧桐 script脚本 now has
182
439000
2000
因此古印度河文字就有了这个
07:36
this particular特定 property属性.
183
441000
2000
特别的特征
07:38
What other properties性能 of language语言 does the script脚本 show显示?
184
443000
2000
这文字符号中还有什么其他语言特征?
07:40
Languages语言 contain包含 patterns模式.
185
445000
2000
语言会有一定模式
07:42
If I give you the letter Q
186
447000
2000
如果我给你一个字母Q
07:44
and ask you to predict预测 the next下一个 letter, what do you think that would be?
187
449000
3000
然后请你猜下一个字母,你们觉得会是什么呢?
07:47
Most of you said U, which哪一个 is right.
188
452000
2000
大部份人都会说U,那是对的
07:49
Now if I asked you to predict预测 one more letter,
189
454000
2000
现在我请你们再猜下个字母
07:51
what do you think that would be?
190
456000
2000
你们觉得会是什么呢?
07:53
Now there's several一些 thoughts思念. There's E. It could be I. It could be A,
191
458000
3000
现在这边有很多种答案,有人说E,可能是I, 也可能是一个A,
07:56
but certainly当然 not B, C or D, right?
192
461000
3000
但是肯定不是B,C,或者D,对吗?
07:59
The Indus梧桐 script脚本 also exhibits展品 similar类似 kinds of patterns模式.
193
464000
3000
印度河文字也有类似的模式
08:02
There's a lot of text文本 that start开始 with this diamond-shaped菱形 symbol符号.
194
467000
3000
有很多段文字的开头都有菱形符号
08:05
And this in turn tends趋向 to be followed其次
195
470000
2000
接着常常是跟着一个
08:07
by this quotation行情 marks-like商标类 symbol符号.
196
472000
2000
有点象引号那样的符号
08:09
And this is very similar类似 to a Q and U example.
197
474000
2000
这就跟Q跟U的例子很相似
08:11
This symbol符号 can in turn be followed其次
198
476000
2000
这符号之后
08:13
by these fish-like鱼肉状 symbols符号 and some other signs迹象,
199
478000
3000
会有着类似鱼等其他的符号
08:16
but never by these other signs迹象 at the bottom底部.
200
481000
2000
但从来不会是最底下出现的这些符号
08:18
And furthermore此外, there's some signs迹象
201
483000
2000
进一步来说,有些符号
08:20
that really prefer比较喜欢 the end结束 of texts文本,
202
485000
2000
常常出现在文章结尾
08:22
such这样 as this jar-shaped罐子形 sign标志,
203
487000
2000
像是这壶型的记号
08:24
and this sign标志, in fact事实, happens发生 to be
204
489000
2000
事实上,这记号刚好是
08:26
the most frequently经常 occurring发生 sign标志 in the script脚本.
205
491000
2000
在这些文句中最常出现的记号
08:28
Given特定 such这样 patterns模式, here was our idea理念.
206
493000
3000
看出这些惯用模式后,我们有个想法
08:31
The idea理念 was to use a computer电脑
207
496000
2000
就是用电脑
08:33
to learn学习 these patterns模式,
208
498000
2000
去了解这些图案
08:35
and so we gave the computer电脑 the existing现有 texts文本.
209
500000
3000
我们将这些现存的文字符号输入电脑
08:38
And the computer电脑 learned学到了 a statistical统计 model模型
210
503000
2000
然后电脑以某种统计模型
08:40
of which哪一个 symbols符号 tend趋向 to occur发生 together一起
211
505000
2000
算出哪些符号会一起出现
08:42
and which哪一个 symbols符号 tend趋向 to follow跟随 each other.
212
507000
2000
而哪些符号常以先后顺序出现
08:44
Given特定 the computer电脑 model模型,
213
509000
2000
使用此电脑模式
08:46
we can test测试 the model模型 by essentially实质上 quizzingquizzing it.
214
511000
3000
我们可以用考试的方法来测试这个模式
08:49
So we could deliberately故意 erase抹去 some symbols符号,
215
514000
2000
我们可以故意去掉某些符号
08:51
and we can ask it to predict预测 the missing失踪 symbols符号.
216
516000
3000
我们让计算机来预测缺少的字符
08:54
Here are some examples例子.
217
519000
3000
这是一些例子
09:00
You may可能 regard看待 this
218
525000
2000
你们可以把这个看作
09:02
as perhaps也许 the most ancient game游戏
219
527000
2000
最古老的
09:04
of Wheel of Fortune幸运.
220
529000
3000
幸运大转盘游戏(一个填字游戏)
09:08
What we found发现
221
533000
2000
我们发现
09:10
was that the computer电脑 was successful成功 in 75 percent百分 of the cases
222
535000
2000
计算机预测正确字符的
09:12
in predicting预测 the correct正确 symbol符号.
223
537000
2000
成功率是75%
09:14
In the rest休息 of the cases,
224
539000
2000
剩下的例子中
09:16
typically一般 the second第二 best最好 guess猜测 or third第三 best最好 guess猜测 was the right answer回答.
225
541000
3000
正确答案不是在第二选择就是在第三选择中
09:19
There's also practical实际的 use
226
544000
2000
这种预测方法
09:21
for this particular特定 procedure程序.
227
546000
2000
会派到实际的用处
09:23
There's a lot of these texts文本 that are damaged破损.
228
548000
2000
很多文字符号都已经损坏
09:25
Here's这里的 an example of one such这样 text文本.
229
550000
2000
这里有个例子
09:27
And we can use the computer电脑 model模型 now to try to complete完成 this text文本
230
552000
3000
我们可以使用电脑模式来修复这段文字内容
09:30
and make a best最好 guess猜测 prediction预测.
231
555000
2000
并做出最好的猜测
09:32
Here's这里的 an example of a symbol符号 that was predicted预料到的.
232
557000
3000
这就是一个预测的例子
09:35
And this could be really useful有用 as we try to decipher解码 the script脚本
233
560000
2000
这非常有用, 在我们破解字符的过程中
09:37
by generating发电 more data数据 that we can analyze分析.
234
562000
3000
让我们得到了更多可供分析的数据
09:40
Now here's这里的 one other thing you can do with the computer电脑 model模型.
235
565000
3000
还有另一件事也是可以利用电脑模式来做的
09:43
So imagine想像 a monkey
236
568000
2000
想象有个猴子
09:45
sitting坐在 at a keyboard键盘.
237
570000
2000
坐在键盘上
09:47
I think you might威力 get a random随机 jumble混乱 of letters that looks容貌 like this.
238
572000
3000
我猜会得到一堆像这样随机跑出的字母
09:50
Such这样 a random随机 jumble混乱 of letters
239
575000
2000
这些随机混乱的字母
09:52
is said to have a very high entropy.
240
577000
2000
说明了很高的熵
09:54
This is a physics物理 and information信息 theory理论 term术语.
241
579000
2000
这是物理学和信息理论的说法
09:56
But just imagine想像 it's a really random随机 jumble混乱 of letters.
242
581000
3000
但想像这是相当随机混乱的字母排列
09:59
How many许多 of you have ever spilled coffee咖啡 on a keyboard键盘?
243
584000
4000
你们中多少人曾经将咖啡溅在键盘上?
10:03
You might威力 have encountered遇到 the stuck-key卡键 problem问题 --
244
588000
2000
你也许会碰到键盘卡住的问题
10:05
so basically基本上 the same相同 symbol符号 being存在 repeated重复 over and over again.
245
590000
3000
所以同一个字符会一再重复
10:08
This kind of a sequence序列 is said to have a very low entropy
246
593000
3000
这类的数列可以说有着非常低的熵
10:11
because there's no variation变异 at all.
247
596000
2000
因为它们一点都没变化
10:13
Language语言, on the other hand, has an intermediate中间 level水平 of entropy;
248
598000
3000
语言,从别个角度说,有着中间程度的熵
10:16
it's neither也不 too rigid死板,
249
601000
2000
它不是很严格
10:18
nor也不 is it too random随机.
250
603000
2000
也不是很随机
10:20
What about the Indus梧桐 script脚本?
251
605000
2000
那印度河字符呢?
10:22
Here's这里的 a graph图形 that plots地块 the entropies of a whole整个 bunch of sequences序列.
252
607000
4000
这个图表显示了一大堆顺序的熵值
10:26
At the very top最佳 you find the uniformly均匀 random随机 sequence序列,
253
611000
2000
你会在上面发现那些随机顺序
10:28
which哪一个 is a random随机 jumble混乱 of letters --
254
613000
2000
那是一些杂乱随机放置的字母
10:30
and interestingly有趣, we also find
255
615000
2000
有趣的是, 我们同时发现
10:32
the DNA脱氧核糖核酸 sequence序列 from the human人的 genome基因组 and instrumental仪器的 music音乐.
256
617000
3000
人类基因的DNA排序和乐器演奏的音乐
10:35
And both of these are very, very flexible灵活,
257
620000
2000
它们都非常非常灵活
10:37
which哪一个 is why you find them in the very high range范围.
258
622000
2000
所以他们处在高程度的范围里
10:39
At the lower降低 end结束 of the scale规模,
259
624000
2000
在低端范围里
10:41
you find a rigid死板 sequence序列, a sequence序列 of all A's,
260
626000
2000
你可以发现很严格的顺序, 比如全是字母A的排列
10:43
and you also find a computer电脑 program程序,
261
628000
2000
你还会发现一个计算机程序
10:45
in this case案件 in the language语言 FortranFortran语言,
262
630000
2000
是用FORTRAN语言写的
10:47
which哪一个 obeys服从 really strict严格 rules规则.
263
632000
2000
它遵循严格的规则
10:49
Linguistic语言 scripts脚本
264
634000
2000
语言文字
10:51
occupy占据 the middle中间 range范围.
265
636000
2000
占中间段
10:53
Now what about the Indus梧桐 script脚本?
266
638000
2000
那印度河文字呢?
10:55
We found发现 that the Indus梧桐 script脚本
267
640000
2000
我们发现印度河流域的文字
10:57
actually其实 falls下降 within the range范围 of the linguistic语言 scripts脚本.
268
642000
2000
的数值正好落在语言文字段里
10:59
When this result结果 was first published发表,
269
644000
2000
这个结果刚公布的时候
11:01
it was highly高度 controversial争论的.
270
646000
3000
引起了很大的争议
11:04
There were people who raised上调 a hue色调 and cry,
271
649000
3000
有人提出强烈反对
11:07
and these people were the ones那些 who believed相信
272
652000
2000
这些批评的人认为
11:09
that the Indus梧桐 script脚本 does not represent代表 language语言.
273
654000
3000
古印度河文字根本不是文字
11:12
I even started开始 to get some hate讨厌 mail邮件.
274
657000
2000
我甚至收到一些恶意信函
11:14
My students学生们 said
275
659000
2000
我的学生说
11:16
that I should really seriously认真地 consider考虑 getting得到 some protection保护.
276
661000
3000
我应该要严肃地考虑怎样保护自身安危
11:19
Who'd谁愿意 have thought
277
664000
2000
谁会想到
11:21
that deciphering破译 could be a dangerous危险 profession职业?
278
666000
2000
解读古文字会变成一种危险职业
11:23
What does this result结果 really show显示?
279
668000
2000
这结果说明了什么呢?
11:25
It shows节目 that the Indus梧桐 script脚本
280
670000
2000
说明了古印度河文字
11:27
shares分享 an important重要 property属性 of language语言.
281
672000
2000
有着重要的语言特征
11:29
So, as the old saying goes,
282
674000
2000
所以,就像老话说的那样
11:31
if it looks容貌 like a linguistic语言 script脚本
283
676000
2000
如果这看起来像是语言性文字
11:33
and it acts行为 like a linguistic语言 script脚本,
284
678000
2000
且它也有语言性文字的功用
11:35
then perhaps也许 we may可能 have a linguistic语言 script脚本 on our hands.
285
680000
3000
恐怕我们手里捧着的大概就是一种语言文字
11:38
What other evidence证据 is there
286
683000
2000
有什么其他证据显示
11:40
that the script脚本 could actually其实 encode编码 language语言?
287
685000
2000
这类文字事实上包涵语言
11:42
Well linguistic语言 scripts脚本 can actually其实 encode编码 multiple languages语言.
288
687000
3000
语言字符其实可以被包括在多种语言中
11:45
So for example, here's这里的 the same相同 sentence句子 written书面 in English英语
289
690000
3000
比如,这是同样一句话写成英语
11:48
and the same相同 sentence句子 written书面 in Dutch荷兰人
290
693000
2000
这是这句话写成荷兰语
11:50
using运用 the same相同 letters of the alphabet字母.
291
695000
2000
用到同样的字母
11:52
If you don't know Dutch荷兰人 and you only know English英语
292
697000
3000
如果你不懂荷兰语只知道英语
11:55
and I give you some words in Dutch荷兰人,
293
700000
2000
我给你看一些荷兰语单词
11:57
you'll你会 tell me that these words contain包含
294
702000
2000
你会说这些词包涵了
11:59
some very unusual异常 patterns模式.
295
704000
2000
一些独特的模式
12:01
Some things are not right,
296
706000
2000
有些地方不对
12:03
and you'll你会 say these words are probably大概 not English英语 words.
297
708000
3000
你也会说这些不是英文单词
12:06
The same相同 thing happens发生 in the case案件 of the Indus梧桐 script脚本.
298
711000
2000
这同样也发生在印度河文字中
12:08
The computer电脑 found发现 several一些 texts文本 --
299
713000
2000
计算机也发现一些文字
12:10
two of them are shown显示 here --
300
715000
2000
这里有两三个
12:12
that have very unusual异常 patterns模式.
301
717000
2000
他们具有很独特的模式
12:14
So for example the first text文本:
302
719000
2000
比如,第一个例子
12:16
there's a doubling加倍 of this jar-shaped罐子形 sign标志.
303
721000
3000
这个壶形字符被重复
12:19
This sign标志 is the most frequently-occurring多发病 sign标志
304
724000
2000
这个符号是印度河文字里
12:21
in the Indus梧桐 script脚本,
305
726000
2000
最常见的一个记号
12:23
and it's only in this text文本
306
728000
2000
而只在这段文字里
12:25
that it occurs发生 as a doubling加倍 pair.
307
730000
2000
它以成对的模式出现
12:27
Why is that the case案件?
308
732000
2000
为什么呢?
12:29
We went back and looked看着 at where these particular特定 texts文本 were found发现,
309
734000
3000
我们回去找这些特殊的文字是在哪里找到的
12:32
and it turns out that they were found发现
310
737000
2000
我们发现它们出现在离
12:34
very, very far away from the Indus梧桐 Valley.
311
739000
2000
印度河谷十分遥远的地方
12:36
They were found发现 in present当下 day Iraq伊拉克 and Iran伊朗.
312
741000
3000
它们是在现在的伊朗和伊拉克被发现的
12:39
And why were they found发现 there?
313
744000
2000
它们怎么会出现在那里呢?
12:41
What I haven't没有 told you is that
314
746000
2000
我还没有告诉你们
12:43
the Indus梧桐 people were very, very enterprising进取.
315
748000
2000
印度人相当会做生意
12:45
They used to trade贸易 with people pretty漂亮 far away from where they lived生活,
316
750000
3000
他们曾跑到离他们居住很远的地方去做交易
12:48
and so in this case案件, they were traveling旅行 by sea
317
753000
3000
在这个例子中,他们跨越海洋
12:51
all the way to Mesopotamia美索不达米亚, present-day今天 Iraq伊拉克.
318
756000
3000
到了两河流域,也就是今天的伊拉克
12:54
And what seems似乎 to have happened发生 here
319
759000
2000
看起来
12:56
is that the Indus梧桐 traders贸易商, the merchants商家,
320
761000
3000
印度的生意人,商人
12:59
were using运用 this script脚本 to write a foreign国外 language语言.
321
764000
3000
在用这些文字记录外语
13:02
It's just like our English英语 and Dutch荷兰人 example.
322
767000
2000
就好比英语和荷兰语的例子
13:04
And that would explain说明 why we have these strange奇怪 patterns模式
323
769000
2000
这可以解释为什么我们会发现这些奇怪的规律
13:06
that are very different不同 from the kinds of patterns模式 you see in the text文本
324
771000
3000
它们和在印度河流域发现的文字的规律
13:09
that are found发现 within the Indus梧桐 Valley.
325
774000
3000
非常不同
13:12
This suggests提示 that the same相同 script脚本, the Indus梧桐 script脚本,
326
777000
2000
这说明印度河文字,同样的文字
13:14
could be used to write different不同 languages语言.
327
779000
3000
可能被用来记录不同的语言
13:17
The results结果 we have so far seem似乎 to point to the conclusion结论
328
782000
3000
根据我们现有的研究结果指向的结论来看
13:20
that the Indus梧桐 script脚本 probably大概 does represent代表 language语言.
329
785000
3000
印度河流域的这些字符代表语言
13:23
If it does represent代表 language语言,
330
788000
2000
而如果它的确代表语言
13:25
then how do we read the symbols符号?
331
790000
2000
那么我们怎样来解读这些符号
13:27
That's our next下一个 big challenge挑战.
332
792000
2000
这是对我们最大的挑战
13:29
So you'll你会 notice注意 that many许多 of the symbols符号
333
794000
2000
你注意到很多这些符号
13:31
look like pictures图片 of humans人类, of insects昆虫,
334
796000
2000
看上去像人和昆虫的图画
13:33
of fishes鱼类, of birds鸟类.
335
798000
3000
或者鱼,鸟
13:36
Most ancient scripts脚本
336
801000
2000
很多古代的字符
13:38
use the rebus画谜 principle原理,
337
803000
2000
都使用了画谜原则
13:40
which哪一个 is, using运用 pictures图片 to represent代表 words.
338
805000
3000
也就是用图画代表字词
13:43
So as an example, here's这里的 a word.
339
808000
3000
比如, 这是一个词
13:46
Can you write it using运用 pictures图片?
340
811000
2000
你能用图画来书写吗?
13:48
I'll give you a couple一对 seconds.
341
813000
2000
我给你们几秒钟
13:50
Got it?
342
815000
2000
画好了吗
13:52
Okay. Great.
343
817000
2000
13:54
Here's这里的 my solution.
344
819000
2000
这是我的答案
13:56
You could use the picture图片 of a bee蜜蜂 followed其次 by a picture图片 of a leaf --
345
821000
2000
你可以用一片树叶(leaf)跟了一只蜜蜂(bee)
13:58
and that's "belief信仰," right.
346
823000
2000
那就是"相信“(发音跟bee加leaf接近)对吗?
14:00
There could be other solutions解决方案.
347
825000
2000
也可能有其他的答案
14:02
In the case案件 of the Indus梧桐 script脚本,
348
827000
2000
对印度河字符来说
14:04
the problem问题 is the reverse相反.
349
829000
2000
我们的面临着反向的挑战
14:06
You have to figure数字 out the sounds声音 of each of these pictures图片
350
831000
3000
你得找到每幅图的发声
14:09
such这样 that the entire整个 sequence序列 makes品牌 sense.
351
834000
2000
整个排列秩序意义通顺
14:11
So this is just like a crossword填字游戏 puzzle难题,
352
836000
3000
所以这就跟填字游戏一样
14:14
except that this is the mother母亲 of all crossword填字游戏 puzzles谜题
353
839000
3000
只不过这是所有填字游戏的鼻祖
14:17
because the stakes赌注 are so high if you solve解决 it.
354
842000
4000
因为破解它的价值太可观了
14:21
My colleagues同事, IravathamIravatham Mahadevan马哈德 and Asko阿斯科 ParpolaParpola,
355
846000
3000
我的同事, Iravatham Mahadevan 和 Asko Parpola
14:24
have been making制造 some headway前进 on this particular特定 problem问题.
356
849000
2000
已经在这个特殊的问题上取得了一定的进展
14:26
And I'd like to give you a quick example of Parpola'sParpola的 work.
357
851000
2000
我给你你们看一个Parpola研究的例子
14:28
Here's这里的 a really short text文本.
358
853000
2000
这是一段很短的文字
14:30
It contains包含 seven vertical垂直 strokes followed其次 by this fish-like鱼肉状 sign标志.
359
855000
3000
它里面有7个竖笔,跟了一个象鱼的形状
14:33
And I want to mention提到 that these seals密封件 were used
360
858000
2000
我得提一下这些章用于
14:35
for stamping冲压 clay粘土 tags标签
361
860000
2000
印在黏土标签上
14:37
that were attached to bundles捆绑 of goods产品,
362
862000
2000
然后附在一捆捆的货物上
14:39
so it's quite相当 likely容易 that these tags标签, at least最小 some of them,
363
864000
3000
所以这些标签,至少其中的一些
14:42
contain包含 names of merchants商家.
364
867000
2000
有商品的名字
14:44
And it turns out that in India印度
365
869000
2000
而在印度
14:46
there's a long tradition传统
366
871000
2000
这是一个久远的传统
14:48
of names being存在 based基于 on horoscopes八字
367
873000
2000
名字是根据星座
14:50
and star constellations星座 present当下 at the time of birth分娩.
368
875000
3000
和生日的时候展示的星宿来定的
14:53
In Dravidian德拉威 languages语言,
369
878000
2000
在达罗毗荼语系中
14:55
the word for fish is "meenmeen"
370
880000
2000
鱼的发音是“meen”
14:57
which哪一个 happens发生 to sound声音 just like the word for star.
371
882000
3000
而这个字的发音跟星星刚好相同
15:00
And so seven stars明星
372
885000
2000
所以七颗星星
15:02
would stand for "elu埃卢 meenmeen,"
373
887000
2000
代表“elu meen”
15:04
which哪一个 is the Dravidian德拉威 word
374
889000
2000
就是达罗毗荼语的
15:06
for the Big Dipper star constellation星座.
375
891000
2000
北斗七星
15:08
Similarly同样, there's another另一个 sequence序列 of six stars明星,
376
893000
3000
同样地,这里有六颗星
15:11
and that translates转换 to "aru阿鲁 meenmeen,"
377
896000
2000
可以听作“aru meen”
15:13
which哪一个 is the old Dravidian德拉威 name名称
378
898000
2000
是一个达罗毗荼语的旧名词
15:15
for the star constellation星座 Pleiades.
379
900000
2000
代表昴宿星团
15:17
And finally最后, there's other combinations组合,
380
902000
3000
最后, 还有其他的组合
15:20
such这样 as this fish sign标志 with something that looks容貌 like a roof屋顶 on top最佳 of it.
381
905000
3000
比如鱼的符号上有个顶
15:23
And that could be translated翻译 into "meyMEY meenmeen,"
382
908000
3000
可以说成“MEY meen”
15:26
which哪一个 is the old Dravidian德拉威 name名称 for the planet行星 Saturn土星.
383
911000
3000
在旧达罗毗荼语中指土星
15:29
So that was pretty漂亮 exciting扣人心弦.
384
914000
2000
让人感到振奋的是
15:31
It looks容貌 like we're getting得到 somewhere某处.
385
916000
2000
我们似乎有所进展
15:33
But does this prove证明
386
918000
2000
但这样是否就能证明
15:35
that these seals密封件 contain包含 Dravidian德拉威 names
387
920000
2000
这些印章上达罗毗荼语的名字
15:37
based基于 on planets行星 and star constellations星座?
388
922000
2000
是基于星球和星座呢?
15:39
Well not yet然而.
389
924000
2000
还不能
15:41
So we have no way of validating证实
390
926000
2000
我们没有办法验证
15:43
these particular特定 readings读数,
391
928000
2000
这些解读方式是正确的
15:45
but if more and more of these readings读数 start开始 making制造 sense,
392
930000
3000
但是如果越来越多的解读开始有道理
15:48
and if longer and longer sequences序列
393
933000
2000
而越来越长的排序
15:50
appear出现 to be correct正确,
394
935000
2000
显示出正确性
15:52
then we know that we are on the right track跟踪.
395
937000
2000
那我们就知道我们走上了正道
15:54
Today今天,
396
939000
2000
今天
15:56
we can write a word such这样 as TEDTED
397
941000
3000
我们可以用埃及象形文字以及楔形文字
15:59
in Egyptian埃及人 hieroglyphics象形文字 and in cuneiform楔形的 script脚本,
398
944000
3000
写下的TED这样的名字
16:02
because both of these were deciphered破译
399
947000
2000
因为人们在十九世纪
16:04
in the 19th century世纪.
400
949000
2000
就破解了这两种文字符号
16:06
The decipherment解密 of these two scripts脚本
401
951000
2000
这两种文字的破解
16:08
enabled启用 these civilizations文明 to speak说话 to us again directly.
402
953000
3000
使得这些古文明能与我们再次直接的交流
16:11
The Mayans玛雅人
403
956000
2000
玛雅文明
16:13
started开始 speaking请讲 to us in the 20th century世纪,
404
958000
2000
也在20世纪开始与我们对话
16:15
but the Indus梧桐 civilization文明 remains遗迹 silent无声.
405
960000
3000
而印度河流域的文明至今保持沉默
16:18
Why should we care关心?
406
963000
2000
我们为什么在乎呢?
16:20
The Indus梧桐 civilization文明 does not belong属于
407
965000
2000
印度河流域的文化不仅仅属于
16:22
to just the South Indians印度人 or the North Indians印度人
408
967000
2000
南印度或者是北印度
16:24
or the Pakistanis巴基斯坦人;
409
969000
2000
或者是巴基斯坦
16:26
it belongs属于 to all of us.
410
971000
2000
它是属于我们大家的
16:28
These are our ancestors祖先 --
411
973000
2000
他们是我们的祖先
16:30
yours你的 and mine.
412
975000
2000
你们的也是我们的
16:32
They were silenced沉默
413
977000
2000
因为在历史发展中不幸
16:34
by an unfortunate不幸的 accident事故 of history历史.
414
979000
2000
偶然地沉寂了
16:36
If we decipher解码 the script脚本,
415
981000
2000
如果我们破解了这些字符
16:38
we would enable启用 them to speak说话 to us again.
416
983000
2000
我们可以让他们再一次和我们交流
16:40
What would they tell us?
417
985000
3000
他们会告诉我们什么呢?
16:43
What would we find out about them? About us?
418
988000
3000
我们会在他们身上和我们自己身上发现什么呢?
16:46
I can't wait to find out.
419
991000
3000
我迫不及待地想要找到答案
16:49
Thank you.
420
994000
2000
谢谢
16:51
(Applause掌声)
421
996000
4000
(掌声)
Translated by Jenny Yang
Reviewed by Lan Xu

▲Back to top

ABOUT THE SPEAKER
Rajesh Rao - Computational neuroscientist
Rajesh Rao seeks to understand the human brain through computational modeling, on two fronts: developing computer models of our minds, and using tech to decipher the 4,000-year-old lost script of the Indus Valley civilization.

Why you should listen

Rajesh Rao is looking for the computational principles underlying the brain's remarkable ability to learn, process and store information --  hoping to apply this knowledge to the task of building adaptive robotic systems and artificially intelligent agents.

Some of the questions that motivate his research include: How does the brain learn efficient representations of novel objects and events occurring in the natural environment? What are the algorithms that allow useful sensorimotor routines and behaviors to be learned? What computational mechanisms allow the brain to adapt to changing circumstances and remain fault-tolerant and robust?

By investigating these questions within a computational and probabilistic framework, it is often possible to derive algorithms that not only provide functional interpretations of neurobiological properties but also suggest solutions to difficult problems in computer vision, speech, robotics and artificial intelligence.

More profile about the speaker
Rajesh Rao | Speaker | TED.com