ABOUT THE SPEAKER
Joseph Redmon - Computer scientist
Joseph Redmon works on the YOLO algorithm, which combines the simple face detection of your phone camera with a cloud-based AI -- in real time.

Why you should listen

Computer scientist Joseph Redmon is working on the YOLO (You Only Look Once) algorithm, which has a simple goal: to deliver image recognition and object detection at a speed that would seem science-fictional only a few years ago. The algorithm looks like the simple face detection of a camera app but with the level complexity of systems like Google's Deep Mind Cloud Vision, using Convolutional Deep Neural Networks to crunch object detection in realtime. It's the kind of technology that will be embedded on all smartphones in the next few years.

Redmon is also internet-famous for his resume.

More profile about the speaker
Joseph Redmon | Speaker | TED.com
TED2017

Joseph Redmon: How computers learn to recognize objects instantly

वक्ता: जोसेफ रेडमन: कंप्यूटर वस्तुओं को पहचानना कैसे सीखता है?

Filmed:
2,471,805 views

दस साल पहले, शोधकर्ताओं ने सोचा कि एक बिल्ली और कुत्ते के बीच के अंतर को बताने के लिए कंप्यूटर मिलना लगभग असंभव होगा आज, कम्प्यूटर विज़न सिस्टम 99 प्रतिशत सटीकता से अधिक है कैसे? यूसुफ रेडमन, योलो (आप केवल एक बार देखो) सिस्टम, ऑब्जेक्ट का पता लगाने का एक खुले स्रोत तरीका है जो छवियों और वीडियो में ऑब्जेक्ट की पहचान कर सकता है - ज़ाबरा से संकेतों को रोकने के लिए - बिजली की तेज़ गति के साथ एक उल्लेखनीय लाइव डेमो में, रेडमोन स्वयं-ड्राइविंग कारों, रोबोटिक्स और यहां तक ​​कि कैंसर का पता लगाने जैसे अनुप्रयोगों के लिए इस महत्वपूर्ण कदम को आगे दिखाता है।
- Computer scientist
Joseph Redmon works on the YOLO algorithm, which combines the simple face detection of your phone camera with a cloud-based AI -- in real time. Full bio

Double-click the English transcript below to play the video.

00:12
Tenदस yearsवर्षों agoपूर्व,
0
825
1151
दस साल पहले,
00:14
computerकंप्यूटर visionदृष्टि researchersशोधकर्ताओं
thought that gettingमिल रहा a computerकंप्यूटर
1
2000
2776
कंप्यूटर दृष्टि शोधकर्ताओं ने
सोचा था कि एक कंप्यूटर द्वारा
00:16
to tell the differenceअंतर
betweenके बीच a catबिल्ली and a dogकुत्ता
2
4800
2696
एक बिल्ली और एक कुत्ते
के बीच अंतर बताना
00:19
would be almostलगभग impossibleअसंभव,
3
7520
1976
लगभग असंभव होगा,
00:21
even with the significantमहत्वपूर्ण advanceअग्रिम
in the stateराज्य of artificialकृत्रिम intelligenceबुद्धि.
4
9520
3696
कृत्रिम बुद्धि में महत्वपूर्ण
प्रगति के बावजूद भी
00:25
Now we can do it at a levelस्तर
greaterअधिक से अधिक than 99 percentप्रतिशत accuracyशुद्धता.
5
13240
3560
अब हम इसे 99 प्रतिशत से भी
अधिक यथार्थता के साथ कर सकते हैं
00:29
This is calledबुलाया imageछवि classificationवर्गीकरण --
6
17680
1856
इसे छबी वर्गीकरण कहा जाता है -
00:31
give it an imageछवि,
put a labelलेबल to that imageछवि --
7
19560
3096
इसे एक छबी दें,
उस छवि पर एक लेबल डालें -
00:34
and computersकंप्यूटर know
thousandsहजारों of other categoriesश्रेणियाँ as well.
8
22680
3040
और कंप्यूटर हजारों अन्य श्रेणीयां
भी जानते हैं
00:38
I'm a graduateस्नातक studentछात्र
at the Universityविश्वविद्यालय of Washingtonवाशिंगटन,
9
26680
2896
मैं वॉशिंगटन विश्वविद्यालय में
एक स्नातक छात्र हूँ,
मैं डार्कनेट परियोजना
पर काम करता हूं,
00:41
and I work on a projectपरियोजना calledबुलाया DarknetDarknet,
10
29600
1896
00:43
whichकौन कौन से is a neuralतंत्रिका networkनेटवर्क frameworkढांचा
11
31520
1696
जो एक तंत्रिका नेटवर्क ढांचा है
00:45
for trainingप्रशिक्षण and testingपरिक्षण
computerकंप्यूटर visionदृष्टि modelsमॉडल के.
12
33240
2816
कंप्यूटर दृष्टि मॉडल के
प्रशिक्षण और परीक्षण के लिए
00:48
So let's just see what DarknetDarknet thinksसोचता
13
36080
2976
चलो देखते हैं कि डार्कनेट क्या सोचता है?
00:51
of this imageछवि that we have.
14
39080
1760
इस छवि के बारे में, जो हमारे पास है.
00:54
When we runरन our classifierवर्गीकारक
15
42520
2336
जब हम अपने वर्गीकारक को
00:56
on this imageछवि,
16
44880
1216
इस छवि पर चलाते हैं.
00:58
we see we don't just get
a predictionभविष्यवाणी of dogकुत्ता or catबिल्ली,
17
46120
2456
फिर हम केवल
कुत्ते या बिल्ली का ही नहीं ,
01:00
we actuallyवास्तव में get
specificविशिष्ट breedनस्ल predictionsभविष्यवाणियों.
18
48600
2336
वास्तव में हमें विशिष्ट नस्ल का
पूर्वानुमान भी हो जाता है
01:02
That's the levelस्तर
of granularityGranularity we have now.
19
50960
2176
अब ग्रैन्युलैरिटी का यह स्तर है
01:05
And it's correctसही बात.
20
53160
1616
और यह सही है
01:06
My dogकुत्ता is in factतथ्य a malamutemalamute.
21
54800
1840
मेरा कुत्ता वास्तव मेंअलास्का का है
इसलिए हमने आश्चर्यजनक प्रगति की है
छवि वर्गीकरण में,
01:09
So we'veहमने madeबनाया गया amazingगजब का stridesप्रगति
in imageछवि classificationवर्गीकरण,
22
57040
4336
लेकिन क्या होता है
जब हम अपने वर्गीकारक को चलाते हैं
01:13
but what happensहो जाता
when we runरन our classifierवर्गीकारक
23
61400
2000
01:15
on an imageछवि that looksदिखता है like this?
24
63424
1960
ऐसी छवि पर जो इस तरह दिखती है?
01:19
Well ...
25
67080
1200
अच्छा तो ...
01:24
We see that the classifierवर्गीकारक comesआता हे back
with a prettyसुंदर similarसमान predictionभविष्यवाणी.
26
72640
3896
हम देखते हैं कि क्लासिफायर वापस आता है
एक बहुत ही समान भविष्यवाणी के साथ
01:28
And it's correctसही बात,
there is a malamutemalamute in the imageछवि,
27
76560
3096
और यह सही है,छबी में एक मलम्यूट है,
01:31
but just givenदिया हुआ this labelलेबल,
we don't actuallyवास्तव में know that much
28
79680
3696
लेकिन सिर्फ इस लेबल से ,
हम वास्तव में इतना नहीं जानते हैं
01:35
about what's going on in the imageछवि.
29
83400
1667
कि छवि में क्या हो रहा है?
01:37
We need something more powerfulशक्तिशाली.
30
85091
1560
हमें कुछ अधिक शक्तिशाली चाहिए।
मैं वस्तु का पता लगाने की
समस्या पर काम करता हूँ,
01:39
I work on a problemमुसीबत
calledबुलाया objectवस्तु detectionखोज,
31
87240
2616
जहां हम एक छवि को देखते हैं,
वस्तुओं को खोजने का प्रयास करते हैं,
01:41
where we look at an imageछवि
and try to find all of the objectsवस्तुओं,
32
89880
2936
उनके आसपास बाउंडिंग बक्से लगाते हैं
01:44
put boundingBounding boxesबक्से around them
33
92840
1456
01:46
and say what those objectsवस्तुओं are.
34
94320
1520
और कहते हैं कि वे वस्तुओं क्या हैं?
01:48
So here'sयहाँ है what happensहो जाता
when we runरन a detectorवेक्षक on this imageछवि.
35
96400
3280
जब हम इस छवि पर डिटेक्टर चलाते हैं
तो यह होता है।
01:53
Now, with this kindमेहरबान of resultपरिणाम,
36
101240
2256
अब, इस तरह के परिणाम के साथ,
01:55
we can do a lot more
with our computerकंप्यूटर visionदृष्टि algorithmsएल्गोरिदम.
37
103520
2696
हम बहुत कुछ कर सकते हैं कंप्यूटर
दूर दृष्टि एल्गोरिदम के साथ
01:58
We see that it knowsजानता है
that there's a catबिल्ली and a dogकुत्ता.
38
106240
2976
हम जानते हैं कि इसे पता है
कि एक बिल्ली व एक कुत्ता है
02:01
It knowsजानता है theirजो अपने relativeसापेक्ष locationsस्थानों,
39
109240
2256
यह उनके सम्बंधित स्थानों को जानता है
02:03
theirजो अपने sizeआकार.
40
111520
1216
उनका आकार
02:04
It mayहो सकता है even know some extraअतिरिक्त informationजानकारी.
41
112760
1936
यह कुछ अतिरिक्त
जानकारी भी जान सकता है
02:06
There's a bookकिताब sittingबैठक in the backgroundपृष्ठभूमि.
42
114720
1960
कि पृष्ठभूमि में किताब है
02:09
And if you want to buildनिर्माण a systemप्रणाली
on topचोटी of computerकंप्यूटर visionदृष्टि,
43
117280
3256
और अगर आप कंप्यूटर दृष्टि के
शीर्ष पर एक सिस्टम बनाना चाहते हैं
02:12
say a self-drivingसेल्फ ड्राइविंग vehicleवाहन
or a roboticरोबोट systemप्रणाली,
44
120560
3456
जैसे कि एक स्वयं संचालित वाहन
या एक रोबोट प्रणाली,
02:16
this is the kindमेहरबान
of informationजानकारी that you want.
45
124040
2456
आप इस प्रकार
की जानकारी चाहते हैं
02:18
You want something so that
you can interactबातचीत with the physicalभौतिक worldविश्व.
46
126520
3239
आप कुछ ऐसा चाहते हैं जिससे
आप भौतिक दुनिया के साथ बातचीत कर सकते हैं
02:22
Now, when I startedशुरू कर दिया है workingकाम कर रहे
on objectवस्तु detectionखोज,
47
130759
2257
अब, जब मैंने वस्तु का पता लगाने पर
काम करना शुरू किया
02:25
it tookलिया 20 secondsसेकंड
to processप्रक्रिया a singleएक imageछवि.
48
133040
3296
एक एकल छवि को संसाधित
करने के लिए 20 सेकंड लगे
02:28
And to get a feel for why
speedगति is so importantजरूरी in this domainडोमेन,
49
136360
3880
इस डोमेन में गति कितनी महत्वपूर्ण है,
ऐसा महसूस करने के लिए
02:33
here'sयहाँ है an exampleउदाहरण of an objectवस्तु detectorवेक्षक
50
141120
2536
यहाँ एक वस्तु डिटेक्टर का उदाहरण है
02:35
that takes two secondsसेकंड
to processप्रक्रिया an imageछवि.
51
143680
2416
जो दो सेकंड लेता है
एक छबी को संसाधित करने के लिए
02:38
So this is 10 timesटाइम्स fasterऔर तेज
52
146120
2616
तो यह 10 गुना तेज है
02:40
than the 20-seconds-per-image-सेकंड-प्रति-छवि detectorवेक्षक,
53
148760
3536
20 सेकंड प्रति छवि डिटेक्टर से,
02:44
and you can see that by the time
it makesबनाता है predictionsभविष्यवाणियों,
54
152320
2656
और आप उस समय में देख सकते हैं
जब यह पूर्वानुमान लगता है,
02:47
the entireसंपूर्ण stateराज्य of the worldविश्व has changedबदल गया,
55
155000
2040
दुनिया की संपूर्ण स्थिति बदल गई है,
02:49
and this wouldn'tनहीं होगा be very usefulउपयोगी
56
157880
2416
और यह बहुत उपयोगी नहीं होगा
02:52
for an applicationआवेदन.
57
160320
1416
लागू करने के लिए
02:53
If we speedगति this up
by anotherएक और factorफ़ैक्टर of 10,
58
161760
2496
अगर हम इसे दस गुना
और तेज करते हैं
02:56
this is a detectorवेक्षक runningदौड़ना
at fiveपंज framesफ्रेम perप्रति secondदूसरा.
59
164280
2816
यानि कि डिटेक्टर के पांच
फ्रेम प्रति सेकंड पर चलते हुए
02:59
This is a lot better,
60
167120
1536
यह बहुत बेहतर है,
03:00
but for exampleउदाहरण,
61
168680
1976
लेकिन उदाहरण के लिए
03:02
if there's any significantमहत्वपूर्ण movementआंदोलन,
62
170680
2296
अगर कोई बहुत अधिक हिलना डुलना है,
03:05
I wouldn'tनहीं होगा want a systemप्रणाली
like this drivingड्राइव my carगाड़ी.
63
173000
2560
मैं अपनी कार चलाने के लिए
ऐसा सिस्टम नहीं चाहूंगा
03:09
This is our detectionखोज systemप्रणाली
runningदौड़ना in realअसली time on my laptopलैपटॉप.
64
177120
3240
लैपटॉप पर वास्तविक समय में चलती हुई
यह हमारी पहचान प्रणाली है
03:13
So it smoothlyसुचारू रूप से tracksपटरियों me
as I moveचाल around the frameढांचा,
65
181000
3136
तो यह आसानी से ट्रैक करता है
जब मैं फ्रेम के पास गति विधि करता हूँ
03:16
and it's robustमजबूत to a wideचौड़ा varietyविविधता
of changesपरिवर्तन in sizeआकार,
66
184160
3720
और यह विविध आकार
03:21
poseढोंग,
67
189440
1200
मुद्रा में,
03:23
forwardआगे, backwardपिछड़े.
68
191280
1856
आगे, पीछे परिवर्तन में मजबूत है।
03:25
This is great.
69
193160
1216
यह भी खूब रही।
03:26
This is what we really need
70
194400
1736
हमें वास्तव में यही चाहिए
03:28
if we're going to buildनिर्माण systemsसिस्टम
on topचोटी of computerकंप्यूटर visionदृष्टि.
71
196160
2896
अगर हम सिस्टम कंप्यूटर दृष्टि के
शीर्ष पर बनाने जा रहे हैं
03:31
(Applauseप्रशंसा)
72
199080
4000
(तालियां)
03:36
So in just a fewकुछ yearsवर्षों,
73
204280
2176
तो बस कुछ ही वर्षों में,
03:38
we'veहमने goneगया हुआ from 20 secondsसेकंड perप्रति imageछवि
74
206480
2656
हम प्रति छवि 20 सेकंड से
03:41
to 20 millisecondsमिलीसेकंड perप्रति imageछवि,
a thousandहज़ार timesटाइम्स fasterऔर तेज.
75
209160
3536
प्रति छवि 20 मिलीसेकंड तक चले गए हैं
यानि कि एक हजार गुना तेज!
03:44
How did we get there?
76
212720
1416
हम वहां कैसे पहुंचे?
03:46
Well, in the pastअतीत,
objectवस्तु detectionखोज systemsसिस्टम
77
214160
3016
ठीक है, अतीत में,
ऑब्जेक्ट डिटेक्शन सिस्टम
03:49
would take an imageछवि like this
78
217200
1936
इस तरह की एक छवि ले कर
03:51
and splitविभाजित करें it into a bunchझुंड of regionsक्षेत्रों
79
219160
2456
और इसे क्षेत्रों के एक गुच्छे में
विभाजित कर के
03:53
and then runरन a classifierवर्गीकारक
on eachसे प्रत्येक of these regionsक्षेत्रों,
80
221640
3256
और फिर इन क्षेत्रों में प्रत्येक पर
क्लासिफायर चलाते हुए
03:56
and highउच्च scoresस्कोर for that classifierवर्गीकारक
81
224920
2536
और उस क्लासिफायर के उच्च स्कोर को

03:59
would be consideredमाना
detectionsसंसूचन in the imageछवि.
82
227480
3136
छवि में पहचान माना जाता था
04:02
But this involvedलिप्त runningदौड़ना a classifierवर्गीकारक
thousandsहजारों of timesटाइम्स over an imageछवि,
83
230640
4056
लेकिन इसमें छवि पहचान के लिए
छवि पर हजारों बार क्लासिफायर चलाना,
04:06
thousandsहजारों of neuralतंत्रिका networkनेटवर्क evaluationsमूल्यांकन
to produceउत्पादित करें detectionखोज.
84
234720
2920
हजारों तंत्रिका नेटवर्क मूल्यांकन
करना होता था
04:11
Insteadबजाय, we trainedप्रशिक्षित a singleएक networkनेटवर्क
to do all of detectionखोज for us.
85
239240
4536
इसके बजाय, हमने हर पहचान के लिए
एक एकल नेटवर्क को प्रशिक्षित किया
04:15
It producesपैदा करता है all of the boundingBounding boxesबक्से
and classकक्षा probabilitiesसंभावनाओं simultaneouslyएक साथ.
86
243800
4280
यह एक साथ सभी बक्सों और श्रेणी
संभावनाओं को बनाता है
04:20
With our systemप्रणाली, insteadबजाय of looking
at an imageछवि thousandsहजारों of timesटाइम्स
87
248680
3496
हमारे सिस्टम से एक छवि को
हजारों बार देखने की बजाय
04:24
to produceउत्पादित करें detectionखोज,
88
252200
1456
उसका पता लगाने के लिए,
04:25
you only look onceएक बार,
89
253680
1256
आप केवल एक बार देखते हैं,
04:26
and that's why we call it
the YOLOYOLO methodतरीका of objectवस्तु detectionखोज.
90
254960
2920
यही कारण है कि हम इसे कहते हैं
वस्तु का पता लगाने की योलो विधि
04:31
So with this speedगति,
we're not just limitedसीमित to imagesइमेजिस;
91
259360
3976
तो इस गति के साथ,
हम सिर्फ छवियों तक सीमित नहीं हैं;
04:35
we can processप्रक्रिया videoवीडियो in realअसली time.
92
263360
2416
हम वास्तविक समय में वीडियो
संसाधित कर सकते हैं
04:37
And now, insteadबजाय of just seeingदेख के
that catबिल्ली and dogकुत्ता,
93
265800
3096
और अब, सिर्फ देखने के बजाय
कि बिल्ली और कुत्ते,
04:40
we can see them moveचाल around
and interactबातचीत with eachसे प्रत्येक other.
94
268920
2960
हम उन्हें चारों ओर घूमते देख सकते हैं
और एक दूसरे के साथ बातचीत करते हुए।
04:46
This is a detectorवेक्षक that we trainedप्रशिक्षित
95
274560
2056
यह एक डिटेक्टर है जिसे
हमने प्रशिक्षित किया है
04:48
on 80 differentविभिन्न classesवर्गों
96
276640
4376
80 विभिन्न वर्गों पर
04:53
in Microsoft'sमाइक्रोसॉफ्ट के COCOकोको datasetडेटासेट.
97
281040
3256
माइक्रोसॉफ्ट के कोको डाटासेट में
04:56
It has all sortsप्रकार of things
like spoonचम्मच and forkकांटा, bowlकटोरा,
98
284320
3336
इसमें सभी प्रकार की चीजें हैं
जैसे चम्मच और कांटा, कटोरा,
04:59
commonसामान्य objectsवस्तुओं like that.
99
287680
1800
उस तरह की सामान्य वस्तुएं
05:02
It has a varietyविविधता of more exoticविदेशी things:
100
290360
3096
इसमें कई प्रकार की विदेशी चीजें हैं:
05:05
animalsजानवरों, carsकारों, zebrasजेब्रा, giraffesजिराफ.
101
293480
3256
जानवर, कार, ज़ेबरा, जिराफ
05:08
And now we're going to do something funमज़ा.
102
296760
1936
और अब हम कुछ मज़ा करने वाले हैं
05:10
We're just going to go
out into the audienceदर्शक
103
298720
2096
अब हम दर्शकों के
बीच जाने वाले हैं
देखें किस प्रकार की
चीजों का पता लगाते हैं
05:12
and see what kindमेहरबान of things we can detectपता लगाना.
104
300840
2016
क्या कोई भरवां पशु चाहता है?
05:14
Does anyoneकिसी को want a stuffedभरवां animalजानवर?
105
302880
1620
05:18
There are some teddyटेडी bearsभालू out there.
106
306000
1762
वहाँ कुछ टेडी भालू हैं
05:22
And we can turnमोड़ down
our thresholdद्वार for detectionखोज a little bitबिट,
107
310040
4536
और हम पता लगाने की अपनी सीमा
थोड़ी सी नीचे कर सकते हैं
05:26
so we can find more of you guys
out in the audienceदर्शक.
108
314600
3400
ताकि हम अधिक लोगों को
दर्शकों में ढूंढ सकते हैं
05:31
Let's see if we can get these stop signsसंकेत.
109
319560
2336
चलो देखते हैं कि हम रोकने के
संकेत प्राप्त कर सकते हैं।
05:33
We find some backpacksBackpacks.
110
321920
1880
हमें कुछ बैकपैक मिलते हैं
05:37
Let's just zoomज़ूम in a little bitबिट.
111
325880
1840
चलो थोड़ा सा साइज बड़ा करें
05:42
And this is great.
112
330320
1256
और यह बढ़िया है
05:43
And all of the processingप्रसंस्करण
is happeningहो रहा है in realअसली time
113
331600
3176
और सभी प्रसंस्करण
वास्तविक समय में हो रहा है
05:46
on the laptopलैपटॉप.
114
334800
1200
लैपटॉप पर
05:49
And it's importantजरूरी to rememberयाद है
115
337080
1456
और यह याद रखना महत्वपूर्ण है

05:50
that this is a generalसामान्य purposeउद्देश्य
objectवस्तु detectionखोज systemप्रणाली,
116
338560
3216
कि यह एक सामान्य उद्देश्य है
ऑब्जेक्ट डिटेक्शन सिस्टम,
05:53
so we can trainरेल गाडी this for any imageछवि domainडोमेन.
117
341800
5000
इसलिए हम इसे किसी भी छवि डोमेन
के लिए प्रशिक्षित कर सकते हैं।
06:00
The sameवही codeकोड that we use
118
348320
2536
उसी कोड का, जिसका हम उपयोग करते हैं
06:02
to find stop signsसंकेत or pedestriansपैदल चलने वालों,
119
350880
2456
रोकने के संकेत या
पैदल चलने वालों को ढूंढने के लिए,
06:05
bicyclesसाइकिल in a self-drivingसेल्फ ड्राइविंग vehicleवाहन,
120
353360
1976
स्वयं संचालित वाहन में साईकलों का,
06:07
can be used to find cancerकैंसर cellsकोशिकाओं
121
355360
2856
कैंसर कोशिकाओं को खोजने के लिए
इस्तेमाल किया जा सकता है
06:10
in a tissueऊतक biopsyबायोप्सी.
122
358240
3016
ऊतक बायोप्सी में
06:13
And there are researchersशोधकर्ताओं around the globeग्लोब
alreadyपहले से usingका उपयोग करते हुए this technologyप्रौद्योगिकी
123
361280
4040
और दुनिया भर के शोधकर्ता पहले से ही
इस तकनीक का इस्तेमाल
06:18
for advancesअग्रिमों in things
like medicineदवा, roboticsरोबोटिक्स.
124
366240
3416
दवाइओं ,रोबोटिक्स जैसी चीजों
की प्रगति के लिए कर रहे हैं
06:21
This morningसुबह, I readपढ़ना a paperकागज़
125
369680
1376
आज सुबह, मैंने एक पेपर पढ़ा
06:23
where they were takingले रहा a censusजनगणना
of animalsजानवरों in Nairobiनैरोबी Nationalराष्ट्रीय Parkपार्क
126
371080
4576
जहां वे नैरोबी राष्ट्रीय उद्यान में
पशुओं की जनगणना कर रहे थे
06:27
with YOLOYOLO as partअंश
of this detectionखोज systemप्रणाली.
127
375680
3136
योलो पहचान प्रणाली के साथ
जो इसका हिस्सा रहा
06:30
And that's because DarknetDarknet is openखुला sourceस्रोत
128
378840
3096
और इसका कारण यह है कि
डार्कनेट खुला स्रोत है
06:33
and in the publicजनता domainडोमेन,
freeमुक्त for anyoneकिसी को to use.
129
381960
2520
और सार्वजनिक डोमेन में है,
जो सभी के लिए नि:शुल्क है
06:37
(Applauseप्रशंसा)
130
385600
5696
(तालियां)

06:43
But we wanted to make detectionखोज
even more accessibleसुलभ and usableउपयोगी,
131
391320
4936
हमने पड़ताल को और भी पहुँच वाला
व उपयोगी बनाना चाहा¶
06:48
so throughके माध्यम से a combinationमेल
of modelआदर्श optimizationअनुकूलन,
132
396280
4056
मॉडल अनुकूलन की नेटवर्क
बिनारिजेशन और सन्निकटन के
06:52
networkनेटवर्क binarizationbinarization and approximationसन्निकटन,
133
400360
2296
संयोजन माध्यम से,
06:54
we actuallyवास्तव में have objectवस्तु detectionखोज
runningदौड़ना on a phoneफ़ोन.
134
402680
3920
हमारी वस्तु जाँच प्रणाली
एक फोन पर चल रही है
07:04
(Applauseप्रशंसा)
135
412800
5320
(तालियां)

07:10
And I'm really excitedउत्साहित because
now we have a prettyसुंदर powerfulशक्तिशाली solutionउपाय
136
418960
5056
और मैं वास्तव में उत्साहित हूँ क्योंकि
अब हमारे पास एक बहुत शक्तिशाली समाधान है¶
07:16
to this low-levelनिम्न computerकंप्यूटर visionदृष्टि problemमुसीबत,
137
424040
2296
इस निम्न स्तरीय
कंप्यूटर दृष्टि समस्या के लिए,
07:18
and anyoneकिसी को can take it
and buildनिर्माण something with it.
138
426360
3856
कोई भी इसे ले सकता है
और कुछ निर्माण कर सकता है
07:22
So now the restआराम is up to all of you
139
430240
3176
अतः बाकी सब आप व
दुनिया भर के लोगों पर,
07:25
and people around the worldविश्व
with accessपहुंच to this softwareसॉफ्टवेयर,
140
433440
2936
इस सॉफ़्टवेयर की पहुंच
के साथ, निर्भर करता है
07:28
and I can't wait to see what people
will buildनिर्माण with this technologyप्रौद्योगिकी.
141
436400
3656
और मैं इंतजार नहीं कर सकता कि
लोग इस तकनीक से क्या बनायेगें
07:32
Thank you.
142
440080
1216
धन्यवाद।
07:33
(Applauseप्रशंसा)
143
441320
3440
Translated by Dr Prem P. Atreja
Reviewed by arvind patil

▲Back to top

ABOUT THE SPEAKER
Joseph Redmon - Computer scientist
Joseph Redmon works on the YOLO algorithm, which combines the simple face detection of your phone camera with a cloud-based AI -- in real time.

Why you should listen

Computer scientist Joseph Redmon is working on the YOLO (You Only Look Once) algorithm, which has a simple goal: to deliver image recognition and object detection at a speed that would seem science-fictional only a few years ago. The algorithm looks like the simple face detection of a camera app but with the level complexity of systems like Google's Deep Mind Cloud Vision, using Convolutional Deep Neural Networks to crunch object detection in realtime. It's the kind of technology that will be embedded on all smartphones in the next few years.

Redmon is also internet-famous for his resume.

More profile about the speaker
Joseph Redmon | Speaker | TED.com