ABOUT THE SPEAKER
Ben Wellington - Data scientist
Ben Wellington blends his love of statistics, the city, and comedy in his entertaining analysis of the story of New York City, told through data.

Why you should listen

Ben Wellington runs the I Quant NY blog, in which he crunches city-released data to find out what's really going on in the Big Apple. To date he has tackled topics such as measles outbreaks in New York City schools, analyzed how companies like Airbnb are really doing in NYC, and asked questions such as "does gentrification cause a reduction in laundromats?" (Answer: inconclusive.)

Ben is a visiting assistant professor in the City & Regional Planning program at the Pratt Institute in Brooklyn; his day job involves working as a quantitative analyst at the investment management firm, Two Sigma. A budding comedian and performer, he also teaches team building workshops through Cherub Improv, a non-profit that uses improv comedy for social good.

More profile about the speaker
Ben Wellington | Speaker | TED.com
TEDxNewYork

Ben Wellington: How we found the worst place to park in New York City -- using big data

Ben Wellington: Hoe we de slechtste parkeerplekken in New York vonden - met big data

Filmed:
1,055,247 views

Lokale overheden beschikken over een weelde aan gegevens en statistieken, waarin elk deel van het stadsleven is opgetekend. Gegevensanalist Ben Wellington suggereert in deze onderhoudende talk dat ze echter soms gewoon niet weten hoe ze die gegevens kunnen gebruiken. Hij laat zie hoe een combinatie van vragen die je niet zou verwachten en slimme gegevensverwerking verrassend bruikbare inzichten kan opleveren. Ook deelt hij tips over het vrijgeven van grote verzamelingen gegevens, zodat iedereen daarvan gebruik kan maken.
- Data scientist
Ben Wellington blends his love of statistics, the city, and comedy in his entertaining analysis of the story of New York City, told through data. Full bio

Double-click the English transcript below to play the video.

00:12
SixZes thousandduizend milesmijlen of roadweg,
0
711
2820
Bijna 10.000 kilometer wegen,
00:15
600 milesmijlen of subwaymetro trackspoor,
1
3531
2203
zo'n 1000 kilometer metrolijnen,
bijna 650 kilometer fietspaden
00:17
400 milesmijlen of bikefiets lanesrijstroken
2
5734
1644
00:19
and a halfvoor de helft a milemijl of tramtram trackspoor,
3
7378
1821
en 800 meter tramspoor --
00:21
if you've ever been to RooseveltRoosevelt IslandEiland.
4
9199
1953
die liggen op Roosevelt Island.
Dat is de infrastructuur
van de stad New York in cijfers.
00:23
These are the numbersgetallen that make up
the infrastructureinfrastructuur of NewNieuw YorkYork CityStad.
5
11152
3334
De statistieken van onze infrastructuur.
00:26
These are the statisticsstatistieken
of our infrastructureinfrastructuur.
6
14486
2619
Deze cijfers verschijnen
in rapporten van de lokale overheid.
00:29
They're the kindsoort of numbersgetallen you can find
releasedvrijgelaten in reportsrapporten by citystad agenciesagentschappen.
7
17105
3706
Afdeling Transport
kan je bijvoorbeeld vertellen
00:32
For examplevoorbeeld, the DepartmentDepartement
of TransportationVervoer will probablywaarschijnlijk tell you
8
20811
3199
hoeveel kilometer wegen ze onderhouden.
Openbaar Vervoer pocht
met kilometers metrolijnen.
00:36
how manyveel milesmijlen of roadweg they maintainin stand houden.
9
24010
1781
00:37
The MTAMTA will boastbogen how manyveel milesmijlen
of subwaymetro trackspoor there are.
10
25791
2821
Afdelingen geven statistieken uit.
00:40
MostDe meeste citystad agenciesagentschappen give us statisticsstatistieken.
11
28612
1807
Uit een rapport van vorig jaar
van de commissie voor taxiverkeer,
00:42
This is from a reportrapport this yearjaar
12
30419
1483
00:43
from the TaxiTaxi and LimousineLimousine CommissionCommissie,
13
31902
1892
leren we dat er zo'n 13.500 taxi's
in New York rijden.
00:45
where we learnleren that there's about
13,500 taxistaxi's here in NewNieuw YorkYork CityStad.
14
33794
3276
Dat is toch interessant?
00:49
PrettyVrij interestinginteressant, right?
15
37070
1290
Maar waar komen
die cijfers vandaan?
00:50
But did you ever think about
where these numbersgetallen camekwam from?
16
38360
2784
Op zo'n gemeentelijke afdeling
00:53
Because for these numbersgetallen to existbestaan,
someoneiemand at the citystad agencyagentschap
17
41144
2903
moet iemand bedacht hebben
welke cijfers ons interesseren.
00:56
had to stop and say, hmmHmm, here'shier is a numberaantal
that somebodyiemand mightmacht want want to know.
18
44047
3880
Hier zit men op te wachten.
00:59
Here'sHier is a numberaantal
that our citizensburgers want to know.
19
47927
2250
Dus spitten ze in hun ruwe gegevens,
01:02
So they go back to theirhun rawrauw datagegevens,
20
50177
1830
tellen en calculeren
01:04
they counttellen, they addtoevoegen, they calculateberekenen,
21
52007
1797
en brengen hun rapporten uit,
01:05
and then they put out reportsrapporten,
22
53804
1467
waar dit soort cijfers in staan.
01:07
and those reportsrapporten
will have numbersgetallen like this.
23
55271
2177
Maar hoe kennen ze al onze vragen?
01:09
The problemprobleem is, how do they know
all of our questionsvragen?
24
57448
2540
We zitten vol met vragen.
01:11
We have lots of questionsvragen.
25
59988
1243
We kunnen waarschijnlijk
01:13
In factfeit, in some waysmanieren there's literallyletterlijk
an infiniteeindeloos numberaantal of questionsvragen
26
61231
3340
een eindeloos aantal
vragen stellen over onze stad.
01:16
that we can askvragen about our citystad.
27
64571
1649
Teveel voor die afdelingen.
01:18
The agenciesagentschappen can never keep up.
28
66220
1475
Het model werkt dus niet,
en de beleidsmakers zien dat ook in,
01:19
So the paradigmparadigma isn't exactlyprecies workingwerkend,
and I think our policymakersbeleidsmakers realizerealiseren that,
29
67695
4056
want burgemeester Bloomberg heeft in 2012
een wet ondertekend, die hij beschreef
01:23
because in 2012, MayorBurgemeester BloombergBloomberg
signedondertekend into lawwet what he calledriep
30
71751
3959
01:27
the mostmeest ambitiousambitieuze and comprehensiveuitgebreid
openOpen datagegevens legislationwetgeving in the countryland.
31
75710
3837
als de meest ambitieuze en uitgebreide
'open data'-wetgeving in het land.
01:31
In a lot of waysmanieren, he's right.
32
79547
1573
Op veel punten heeft hij gelijk.
01:33
In the last two yearsjaar,
the citystad has releasedvrijgelaten 1,000 datasetsdatasets
33
81120
2861
De afgelopen twee jaar
gaf de stad 1000 gegevenssets vrij
01:35
on our openOpen datagegevens portalportaal,
34
83981
1610
op het open data-portaal.
01:37
and it's prettymooi awesomegeweldig.
35
85591
1764
Dat is fantastisch.
01:39
So you go and look at datagegevens like this,
36
87355
1968
Je kunt in die gegevens duiken
01:41
and insteadin plaats daarvan of just countingtelling
the numberaantal of cabscabines,
37
89323
2289
en dan niet alleen de taxi's tellen,
maar ook andere vragen stellen.
01:43
we can startbegin to askvragen differentverschillend questionsvragen.
38
91612
1943
Ik had dus een vraag.
01:45
So I had a questionvraag.
39
93555
1200
Wanneer is de spits in New York?
01:46
When'sWanneer de rushstormloop houruur in NewNieuw YorkYork CityStad?
40
94755
1701
01:48
It can be prettymooi bothersomelastig.
When is rushstormloop houruur exactlyprecies?
41
96456
2581
Hoe laat begint de spits precies?
Toen dacht ik: een taxi
is niet alleen een nummer,
01:51
And I thought to myselfmezelf,
these cabscabines aren'tzijn niet just numbersgetallen,
42
99037
2625
maar ook een gps-recorder
die door onze straten rijdt
01:53
these are GPSGPS recordersrecorders
drivinghet rijden around in our citystad streetsstraten
43
101662
2711
en elke rit vastlegt.
01:56
recordingopname eachelk and everyelk riderijden they take.
44
104373
1913
Ik heb de gegevens ervan bekeken
01:58
There's datagegevens there,
and I lookedkeek at that datagegevens,
45
106286
2322
en een diagram van de gemiddelde snelheid
van taxi's in New York gemaakt.
02:00
and I madegemaakt a plotplot of the averagegemiddelde speedsnelheid of
taxistaxi's in NewNieuw YorkYork CityStad throughoutoveral the day.
46
108608
3961
Je ziet dan dat van middernacht
tot 5:18 uur 's ochtends
02:04
You can see that from about midnightmiddernacht
to around 5:18 in the morningochtend-,
47
112569
3412
de snelheid toeneemt,
en dan afneemt.
02:07
speedsnelheid increasestoeneemt, and at that pointpunt,
things turnbeurt around,
48
115981
3563
Dan gaan ze steeds langzamer rijden
02:11
and they get slowertragere and slowertragere and slowertragere
untiltot about 8:35 in the morningochtend-,
49
119544
3962
tot ze om 8:35 uur 's ochtends
02:15
when they endeinde up at around
11 and a halfvoor de helft milesmijlen perper houruur.
50
123506
2693
nog maar 18,5 km/u rijden.
De gemiddelde taxi rijdt dan
18,5 km/u op onze straten,
02:18
The averagegemiddelde taxitaxi is going 11 and a halfvoor de helft
milesmijlen perper houruur on our citystad streetsstraten,
51
126199
3562
en dat blijft dan zo, gedurende...
02:21
and it turnsbochten out it staysverblijven that way
52
129761
1987
02:23
for the entiregeheel day.
53
131748
3368
de hele dag.
(Gelach)
02:27
(LaughterGelach)
54
135116
1373
02:28
So I said to myselfmezelf, I guessraden
there's no rushstormloop houruur in NewNieuw YorkYork CityStad.
55
136489
3180
Er is dus geen spitsuur in New York.
Het is spitsdág.
02:31
There's just a rushstormloop day.
56
139669
1537
02:33
MakesMaakt sensezin. And this is importantbelangrijk
for a couplepaar of reasonsredenen.
57
141206
2850
Dat klinkt logisch en is belangrijk.
Voor een transportplanner
is dat interessant.
02:36
If you're a transportationvervoer plannerplanner,
this mightmacht be prettymooi interestinginteressant to know.
58
144056
3637
02:39
But if you want to get somewhereergens quicklysnel,
59
147693
1975
Maar als je snel ergens moet zijn,
weet je nu dat je je wekker
op 4:45 uur moet zetten.
02:41
you now know to setreeks your alarmalarm for
4:45 in the morningochtend- and you're all setreeks.
60
149668
3468
New York, hè?
02:45
NewNieuw YorkYork, right?
61
153136
1044
Die gegevens hebben een verhaal.
02:46
But there's a storyverhaal behindachter this datagegevens.
62
154180
1762
Ze bleken niet zomaar beschikbaar.
02:47
This datagegevens wasn'twas niet
just availablebeschikbaar, it turnsbochten out.
63
155942
2185
Hier was een aanvraag voor nodig
via de Wet openbaarheid van bestuur,
02:50
It actuallywerkelijk camekwam from something calledriep
a FreedomVrijheid of InformationInformatie LawWet RequestAanvraag,
64
158127
3619
een Wob-aanvraag.
02:53
or a FOILFOLIE RequestAanvraag.
65
161746
1076
Het staat op de website
van de Commissie voor taxiverkeer.
02:54
This is a formformulier you can find on the
TaxiTaxi and LimousineLimousine CommissionCommissie websitewebsite.
66
162822
3466
Voor deze gegevens
heb je zo'n formulier nodig.
02:58
In orderbestellen to accesstoegang this datagegevens,
you need to go get this formformulier,
67
166288
2826
Als je het invult, krijg je bericht.
03:01
fillvullen it out, and they will notifyHoud op de hoogte you,
68
169114
1846
Chris Wong deed dit.
03:02
and a guy namedgenaamd ChrisChris WhongWhong
did exactlyprecies that.
69
170960
2130
Chris ging langs en ze zeiden:
03:05
ChrisChris wentgegaan down, and they told him,
70
173090
1890
"Breng een nieuwe harddisk
naar ons kantoor.
03:06
"Just bringbrengen a brandmerk newnieuwe hardhard driverijden
down to our officekantoor,
71
174980
2827
03:09
leavehet verlof it here for fivevijf hoursuur,
we'llgoed copykopiëren the datagegevens and you take it back."
72
177807
3424
Vijf uur later staan de gegevens erop
en kun je hem ophalen."
Daar komen die gegevens vandaan.
03:13
And that's where this datagegevens camekwam from.
73
181231
2032
Chris is zo iemand
die gegevens publiek wil delen,
03:15
Now, ChrisChris is the kindsoort of guy
who wants to make the datagegevens publicopenbaar,
74
183263
3005
en zo kwam het online te staan,
wat deze grafiek mogelijk heeft gemaakt.
03:18
and so it endedbeëindigde up onlineonline for all to use,
and that's where this graphdiagram camekwam from.
75
186268
3784
Fantastisch dat het beschikbaar is,
die GPS-recorders -- echt perfect.
03:22
And the factfeit that it existsbestaat is amazingverbazingwekkend.
These GPSGPS recordersrecorders -- really coolkoel.
76
190052
3518
Maar dat burgers met een harddisk
03:25
But the factfeit that we have citizensburgers
walkingwandelen around with hardhard drivesdrives
77
193570
3118
bij afdelingen gegevens
op moeten halen om die te delen --
03:28
pickingpluk up datagegevens from citystad agenciesagentschappen
to make it publicopenbaar --
78
196688
2582
als je erom vroeg, kreeg je ze,
03:31
it was alreadynu al kindsoort of publicopenbaar,
you could get to it,
79
199270
2390
maar het was 'openbaar', niet gedeeld.
03:33
but it was "publicopenbaar," it wasn'twas niet publicopenbaar.
80
201660
1812
Dat kunnen we als stad béter doen.
03:35
And we can do better than that as a citystad.
81
203472
1962
Onze burgers hoeven niet
rond te lopen met een harddisk.
03:37
We don't need our citizensburgers
walkingwandelen around with hardhard drivesdrives.
82
205434
2756
Niet voor alle gegevens
heb je de Wob nodig.
03:40
Now, not everyelk datasetDataset
is behindachter a FOILFOLIE RequestAanvraag.
83
208190
2337
03:42
Here is a mapkaart I madegemaakt with the mostmeest
dangerousgevaarlijk intersectionskruispunten in NewNieuw YorkYork CityStad
84
210527
3802
Ik heb deze kaart gemaakt
van de gevaarlijkste kruisingen,
03:46
basedgebaseerde on cyclistwielrenner accidentsongevallen.
85
214329
1878
gebaseerd op fietsongelukken.
03:48
So the redrood areasgebieden are more dangerousgevaarlijk.
86
216207
1939
De rode gebieden zijn dus gevaarlijker.
03:50
And what it showsshows is first
the EastEast sidekant of ManhattanManhattan,
87
218146
2553
Je ziet dat er in
het oosten van Manhattan,
03:52
especiallyvooral in the lowerlager areaGebied of ManhattanManhattan,
has more cyclistwielrenner accidentsongevallen.
88
220699
3611
vooral het zuidoosten,
meer fietsongelukken zijn.
03:56
That mightmacht make sensezin
89
224310
1019
Logisch, omdat daar meer fietsers
van de bruggen af komen.
03:57
because there are more cyclistsfietsers
comingkomt eraan off the bridgesbruggen there.
90
225329
2896
Maar je ziet ook
andere gevaarlijke plekken,
04:00
But there's other hotspotshotspots worthwaard studyingaan het studeren.
91
228225
2014
zoals Williamsburg
en Roosevelt Avenue in Queens.
04:02
There's WilliamsburgWilliamsburg.
There's RooseveltRoosevelt AvenueAvenue in QueensQueens.
92
230239
2669
Dit soort gegevens
zoeken we voor Vision Zero.
04:04
And this is exactlyprecies the kindsoort of datagegevens
we need for VisionVisie ZeroNul.
93
232908
2852
Precies wat we zoeken.
04:07
This is exactlyprecies what we're looking for.
94
235760
1990
Maar ook deze gegevens hebben een verhaal.
04:09
But there's a storyverhaal
behindachter this datagegevens as well.
95
237750
2135
04:11
This datagegevens didn't just appearverschijnen.
96
239885
2067
Ze kwamen niet zomaar aandrijven.
Kennen jullie dit logo?
04:13
How manyveel of you guys know this logologo?
97
241952
2391
Ik zie mensen knikken.
04:16
Yeah, I see some shakesschudt.
98
244343
1352
04:17
Have you ever triedbeproefd to copykopiëren
and pasteplakken datagegevens out of a PDFPDF
99
245695
2655
Weleens geprobeerd om gegevens
van een pdf te kopiëren
en daar wijs uit te worden?
04:20
and make sensezin of it?
100
248350
1357
Ik zie meer knikken.
04:21
I see more shakesschudt.
101
249707
1060
04:22
More of you triedbeproefd copyingkopiëren and pastingplakken
than knewwist the logologo. I like that.
102
250767
3345
Meer die hebben geprobeerd te kopiëren,
dan die het logo kennen. Leuk.
04:26
So what happenedgebeurd is, the datagegevens
that you just saw was actuallywerkelijk on a PDFPDF.
103
254112
3510
Deze gegevens stonden dus in een pdf.
Een pdf van honderden pagina's lang,
04:29
In factfeit, hundredshonderden and hundredshonderden
and hundredshonderden of pagespagina's of PDFPDF
104
257622
3105
gepubliceerd door de NYPD [politie].
04:32
put out by our very owneigen NYPDNYPD,
105
260727
2159
04:34
and in orderbestellen to accesstoegang it,
you would eithereen van beide have to copykopiëren and pasteplakken
106
262886
3152
Om dat te gebruiken
moest je dus
honderden uren gaan kopiëren,
04:38
for hundredshonderden and hundredshonderden of hoursuur,
107
266038
1726
of John Krauss zijn.
04:39
or you could be JohnJohn KraussKrauss.
108
267764
1344
04:41
JohnJohn KraussKrauss was like,
109
269108
1043
John Krauss dacht:
ik kopieer die gegevens niet,
maar schrijf een programma.
04:42
I'm not going to copykopiëren and pasteplakken this datagegevens.
I'm going to writeschrijven a programprogramma.
110
270151
3413
Het heet de 'NYPD-
ongevallen-gegevens-pleister'.
04:45
It's calledriep the NYPDNYPD CrashCrash DataGegevens Band-AidPleister,
111
273564
2288
04:47
and it goesgaat to the NYPD'sDe NYPD websitewebsite
and it would downloaddownloaden PDFsPDF-bestanden.
112
275852
3032
Het haalt pdf's van de website
van de NYPD af.
04:50
EveryElke day it would searchzoeken;
if it foundgevonden a PDFPDF, it would downloaddownloaden it
113
278884
3126
Elke nacht start het een zoekopdracht;
downloadt gevonden pdf's,
04:54
and then it would runrennen
some PDF-scrapingPDF-schrapen programprogramma,
114
282010
2250
en bewerkt die
zodat je losse tekst krijgt,
04:56
and out would come the texttekst,
115
284260
1336
04:57
and it would go on the InternetInternet,
and then people could make mapskaarten like that.
116
285596
3565
die op het internet wordt geplaatst,
zodat je dit soort kaarten kunt maken.
05:01
And the factfeit that the data'sData's here,
the factfeit that we have accesstoegang to it --
117
289161
3429
En het feit dat die gegevens
voor ons beschikbaar zijn --
05:04
EveryElke accidentongeval, by the way,
is a rowrij in this tabletafel.
118
292590
2450
Ieder ongeluk is trouwens
een rij in deze tabel.
05:07
You can imaginestel je voor how manyveel PDFsPDF-bestanden that is.
119
295040
1836
Stel je voor hoeveel pdf's dat zijn --
05:08
The factfeit that we
have accesstoegang to that is great,
120
296876
2207
Prachtig dat we die gegevens hebben,
05:11
but let's not releasevrijlating it in PDFPDF formformulier,
121
299083
2110
maar laten we geen pdf's maken,
05:13
because then we're havingmet our citizensburgers
writeschrijven PDFPDF scrapersschrapers.
122
301193
2739
anders moeten burgers
bewerkingsprogramma's maken.
05:15
It's not the bestbeste use
of our citizens'burgers time,
123
303932
2076
Zonde van de tijd.
Als stad kunnen we dat béter oplossen.
05:18
and we as a citystad can do better than that.
124
306008
2004
Gelukkig zijn onder
burgemeester de Blasio
05:20
Now, the good newsnieuws is that
the dede BlasioBlasio administrationadministratie
125
308012
2736
05:22
actuallywerkelijk recentlykort geleden releasedvrijgelaten this datagegevens
a fewweinig monthsmaanden agogeleden,
126
310748
2532
recentelijk deze gegevens vrijgegeven,
05:25
and so now we can
actuallywerkelijk have accesstoegang to it,
127
313280
2158
zodat we er gewoon bij kunnen.
Maar veel gegevens staan
nog steeds ingepakt in pdf.
05:27
but there's a lot of datagegevens
still entombedEntombed in PDFPDF.
128
315438
2536
05:29
For examplevoorbeeld, our crimemisdrijf datagegevens
is still only availablebeschikbaar in PDFPDF.
129
317974
3197
Misdaadgegevens krijg je
bijvoorbeeld alleen in pdf.
05:33
And not just our crimemisdrijf datagegevens,
our owneigen citystad budgetbegroting.
130
321171
3755
Niet alleen misdaadgegevens,
maar ook de begroting van de stad.
05:36
Our citystad budgetbegroting is only readableleesbaar
right now in PDFPDF formformulier.
131
324926
3729
De begroting van de stad
is alleen in een pdf te lezen.
05:40
And it's not just us
that can't analyzeanalyseren it --
132
328655
2141
Niet alleen wij hebben daar last van --
onze eigen wetgevers
die over de begroting beslissen
05:42
our owneigen legislatorswetgevers
who votestemmen for the budgetbegroting
133
330796
2955
05:45
alsoook only get it in PDFPDF.
134
333751
1943
krijgen het ook alleen in pdf.
05:47
So our legislatorswetgevers cannotkan niet analyzeanalyseren
the budgetbegroting that they are votingstemming for.
135
335694
3844
Onze wetgevers kunnen de begroting
waarover ze beslissen dus niet analyseren.
05:51
And I think as a citystad we can do
a little better than that as well.
136
339538
3608
Dat moeten we als stad
toch ook beter kunnen doen.
05:55
Now, there's a lot of datagegevens
that's not hiddenverborgen in PDFsPDF-bestanden.
137
343146
2488
Veel gegevens staan niet verborgen in pdf.
05:57
This is an examplevoorbeeld of a mapkaart I madegemaakt,
138
345634
1700
Hier heb ik een kaart gemaakt
05:59
and this is the dirtiestsmerigste waterwayswaterwegen
in NewNieuw YorkYork CityStad.
139
347334
2926
van de smerigste vaarwaters
in de stad New York.
06:02
Now, how do I measuremaatregel dirtyvuil?
140
350260
1509
Maar hoe meet ik smerigheid?
06:03
Well, it's kindsoort of a little weirdvreemd,
141
351769
1857
Dat is misschien een beetje vreemd;
06:05
but I lookedkeek at the levelniveau
of fecalfecal coliformcolibacteriën,
142
353626
2113
ik keek naar het aandeel darmbacterieën,
06:07
whichwelke is a measurementmeting of fecalfecal matterer toe doen
in eachelk of our waterwayswaterwegen.
143
355739
3506
waardoor je ontlasting
in onze vaarwaters kunt meten.
06:11
The largergrotere the circlecirkel,
the dirtiervuiler the waterwater,
144
359245
3274
Hoe groter de cirkel is,
hoe viezer het water.
06:14
so the largegroot circlescirkels are dirtyvuil waterwater,
the smallklein circlescirkels are cleanerschoonmaakster.
145
362519
3357
Grote cirkels duiden op vies water,
kleinere op schoner water.
06:17
What you see is inlandbinnenlands waterwayswaterwegen.
146
365876
1644
Dat is binnenwater.
06:19
This is all datagegevens that was sampledbemonsterd
by the citystad over the last fivevijf yearsjaar.
147
367520
3404
Dit zijn alle gegevens die de stad
de laatste vijf jaar verzamelde.
06:22
And inlandbinnenlands waterwayswaterwegen are,
in generalalgemeen, dirtiervuiler.
148
370924
2694
Binnenwater is meestal viezer.
06:25
That makesmerken sensezin, right?
149
373618
1218
Logisch toch?
06:26
And the biggergroter circlescirkels are dirtyvuil.
And I learnedgeleerd a fewweinig things from this.
150
374836
3374
Ik concludeer allereerst:
zwem niet waar de naam
eindigt op 'creek' of 'canal'.
06:30
NumberNummer one: Never swimzwemmen in anything
that endsloopt af in "creekCreek" or "canalkanaal."
151
378210
3164
06:33
But numberaantal two: I alsoook foundgevonden
the dirtiestsmerigste waterwaybinnenwateren in NewNieuw YorkYork CityStad,
152
381374
4318
Maar ten tweede: ik vond
de smerigste vaarweg in de stad New York,
06:37
by this measuremaatregel, one measuremaatregel.
153
385692
1834
volgens deze meting althans.
06:39
In ConeyConey IslandEiland CreekCreek, whichwelke is not
the ConeyConey IslandEiland you swimzwemmen in, luckilygelukkig.
154
387526
3648
Het is Coney Island Creek --
niet waar we zwemmen bij Coney Island --
maar aan de andere kant.
06:43
It's on the other sidekant.
155
391174
1158
06:44
But ConeyConey IslandEiland CreekCreek, 94 percentprocent
of samplessamples takeningenomen over the last fivevijf yearsjaar
156
392332
3878
De afgelopen vijf jaar had 94 procent
van de monsters uit Coney Island Creek
06:48
have had fecalfecal levelslevels so highhoog
157
396210
2157
zulke hoge sporen van ontlasting
06:50
that it would be againsttegen statestaat lawwet
to swimzwemmen in the waterwater.
158
398367
3093
dat het illegaal zou zijn
om daar te zwemmen.
06:53
And this is not the kindsoort of factfeit
that you're going to see
159
401460
2729
Dat is zo'n feitje
waar ze niet mee opscheppen
06:56
boastedpochte in a citystad reportrapport, right?
160
404189
1537
in de gemeentelijke rapporten.
06:57
It's not going to be
the frontvoorkant pagepagina on nycNYC.govgov.
161
405726
2250
Dat staat niet prominent op nyc.gov.
Daar vind je het niet,
06:59
You're not going to see it there,
162
407976
1580
maar het is prachtig
dat we die gegevens hebben.
07:01
but the factfeit that we can get
to that datagegevens is awesomegeweldig.
163
409556
2518
Maar ook dit was geen eitje.
07:04
But onceeen keer again, it wasn'twas niet supersuper easygemakkelijk,
164
412074
1773
Het stond niet in de
open data-portal.
07:05
because this datagegevens was not
on the openOpen datagegevens portalportaal.
165
413847
2358
07:08
If you were to go to the openOpen datagegevens portalportaal,
166
416205
2013
Daar vind je maar een deel:
een jaar en wat maanden.
07:10
you'dje zou see just a snippetfragment of it,
a yearjaar or a fewweinig monthsmaanden.
167
418218
2613
Het stond op de website
van de afdeling Milieubeheer.
07:12
It was actuallywerkelijk on the DepartmentDepartement
of EnvironmentalMilieu Protection'sBescherming van websitewebsite.
168
420831
3390
Iedere link is een Excel-bestand.
En ieder Excel-bestand is verschillend.
(Gelach)
07:16
And eachelk one of these linkskoppelingen is an ExcelExcel
sheetvel, and eachelk ExcelExcel sheetvel is differentverschillend.
169
424221
3878
De koppen zijn anders.
Je moet kopiëren en reorganiseren.
07:20
EveryElke headingtitel is differentverschillend:
you copykopiëren, pasteplakken, reorganizereorganiseren.
170
428099
2630
Als je de moeite neemt,
kun je een kaart maken,
07:22
When you do you can make mapskaarten
and that's great, but onceeen keer again,
171
430729
2952
maar dat kan beter als stad,
door het glad te strijken.
07:25
we can do better than that
as a citystad, we can normalizenormaliseren things.
172
433681
2969
En het gaat steeds beter,
want Socrata heeft een website:
07:28
And we're gettingkrijgen there, because
there's this websitewebsite that SocrataSocrata makesmerken
173
436650
3384
de 'Open Data Portal NYC'.
Hierop staan al 1100 gegevenssets
07:32
calledriep the OpenOpen DataGegevens PortalPortaal NYCNYC.
174
440034
1541
07:33
This is where 1,100 datagegevens setssets
that don't sufferlijden
175
441575
2257
zonder de problemen die ik noemde,
en gelukkig groeit dat aantal.
07:35
from the things I just told you liveleven,
176
443832
1781
Je kunt gegevens in elk formaat
downloaden, zoals csv, pdf of Excel.
07:37
and that numberaantal is growinggroeiend,
and that's great.
177
445613
2148
07:39
You can downloaddownloaden datagegevens in any formatformaat,
be it CSVCSV or PDFPDF or ExcelExcel documentdocument.
178
447761
3412
Wat je ook wilt,
je kan het downloaden hoe je wilt.
07:43
WhateverWat you want,
you can downloaddownloaden the datagegevens that way.
179
451173
2547
Het enige probleem is,
07:45
The problemprobleem is, onceeen keer you do,
180
453720
1352
07:47
you will find that eachelk agencyagentschap
codescodes theirhun addressesadressen differentlyanders.
181
455072
3686
dat elke afdeling een andere opmaak
voor adressen gebruikt.
07:50
So one is streetstraat namenaam,
intersectionkruispunt streetstraat,
182
458758
2141
Dus op straatnaam, kruising,
07:52
streetstraat, boroughborough, addressadres, buildinggebouw,
buildinggebouw addressadres.
183
460899
2491
straat, wijk, adres/gebouw, gebouw/adres.
07:55
So onceeen keer again, you're spendinguitgaven time,
even when we have this portalportaal,
184
463390
3180
Je bent dus weer veel tijd kwijt,
zelfs met deze portal,
om de adresvelden gelijk te trekken.
07:58
you're spendinguitgaven time
normalizingnormaliseren our addressadres fieldsvelden.
185
466570
2606
08:01
And that's not the bestbeste use
of our citizens'burgers time.
186
469176
2423
Dat willen burgers niet.
Als stad kunnen we dat beter doen.
08:03
We can do better than that as a citystad.
187
471599
1796
08:05
We can standardizestandaardiseren our addressesadressen,
188
473395
1645
Adressen in een standaardopmaak,
08:07
and if we do,
we can get more mapskaarten like this.
189
475040
2185
zodat we meer kaarten
kunnen maken zoals deze.
08:09
This is a mapkaart of firebrand hydrantsbrandkranen
in NewNieuw YorkYork CityStad,
190
477225
2285
Dit is een kaart
van brandkranen in New York,
08:11
but not just any firebrand hydrantsbrandkranen.
191
479510
1531
maar niet zomaar brandkranen.
08:13
These are the toptop 250 grossingbrutowinst firebrand
hydrantsbrandkranen in termstermen of parkingparkeren ticketskaartjes.
192
481041
4726
Dit zijn de 250 brandkranen
die de meeste parkeerboetes opleveren.
08:17
(LaughterGelach)
193
485767
1986
(Gelach)
08:19
So I learnedgeleerd a fewweinig things from this mapkaart,
and I really like this mapkaart.
194
487753
3358
Ik heb geleerd van deze kaart,
die ik erg leuk vind.
08:23
NumberNummer one, just don't parkpark
on the UpperBovenste EastEast SideKant.
195
491111
2402
Ten eerste, parkeer nooit
in de Upper East Side.
08:25
Just don't. It doesn't matterer toe doen where
you parkpark, you will get a hydrantHYDRANT ticketticket.
196
493513
3587
Gewoon niet doen want
je krijgt overal een brandkraanbekeuring.
08:29
NumberNummer two, I foundgevonden the two highesthoogst
grossingbrutowinst hydrantsbrandkranen in all of NewNieuw YorkYork CityStad,
197
497100
4153
Ten tweede, ik heb de twee kranen gevonden
die het meeste opbrengen in New York,
08:33
and they're on the LowerLagere EastEast SideKant,
198
501253
1886
in de Lower East Side.
Die brengen ieder jaar 50.000 euro
aan parkeerboetes binnen.
08:35
and they were bringingbrengen in over
55,000 dollarsdollars a yearjaar in parkingparkeren ticketskaartjes.
199
503139
5098
08:40
And that seemedscheen a little strangevreemd
to me when I noticedmerkte it,
200
508237
2738
Dat vond ik een beetje vreemd,
dus ging ik graven en ontdekte
dat hier een brandkraan stond
08:42
so I did a little digginghet graven and it turnsbochten out
what you had is a hydrantHYDRANT
201
510975
3269
naast een 'stoepverbreding':
08:46
and then something calledriep
a curbCurb extensionuitbreiding,
202
514244
1996
zo'n twee meter extra loopruimte.
08:48
whichwelke is like a seven-footzeven-voet
spaceruimte to walklopen on,
203
516240
2059
Dan een parkeerplaats.
08:50
and then a parkingparkeren spotplek.
204
518299
1156
08:51
And so these carsauto's camekwam alonglangs,
and the hydrantHYDRANT --
205
519455
2254
Automobilisten zagen de brandkraan --
"Die staat ver weg, geen probleem".
08:53
"It's all the way over there, I'm fine,"
206
521709
1911
Er was zelfs een mooie
parkeerplaats getekend.
08:55
and there was actuallywerkelijk a parkingparkeren spotplek
paintedgeschilderd there beautifullymooi for them.
207
523620
3474
Dus ze parkeerden,
maar de politie dacht daar anders over
08:59
They would parkpark there, and the NYPDNYPD
disagreedniet eens with this designationaanwijzing
208
527094
3155
en gaf je een bon.
Ik ben niet de enige
die dit opmerkte.
09:02
and would ticketticket them.
209
530249
1058
09:03
And it wasn'twas niet just me
who foundgevonden a parkingparkeren ticketticket.
210
531307
2344
Hier fotografeert de
Streetview-auto van Google
09:05
This is the GoogleGoogle
StreetStraat ViewWeergave carauto drivinghet rijden by
211
533651
2146
diezelfde parkeerboete. (Gelach)
09:07
findingbevinding the samedezelfde parkingparkeren ticketticket.
212
535797
1617
Ik schreef erover op mijn blog I Quant NY,
en kreeg antwoord van de afdeling Verkeer,
09:09
So I wroteschreef about this on my blogblog,
on I QuantQuant NYNY, and the DOTSTIP respondedreageerden,
213
537414
4504
die zeiden:
09:13
and they said,
214
541918
1020
"Hoewel we nooit klachten
over deze locatie hebben gehad,
09:14
"While the DOTSTIP has not receivedontvangen
any complaintsklachten about this locationplaats,
215
542938
3410
09:18
we will reviewbeoordeling the roadwayrijbaan markingsMarkeringen
and make any appropriategeschikt alterationswijzigingen."
216
546348
4542
zullen we de markeringen bekijken
en noodzakelijke wijzigingen aanbrengen."
09:22
And I thought to myselfmezelf,
typicaltypisch governmentregering responseantwoord,
217
550890
2959
Typisch antwoord van de overheid,
dacht ik nog,
09:25
all right, movedverhuisd on with my life.
218
553849
1881
en ik ging verder met mijn leven.
09:27
But then, a fewweinig weeksweken laterlater,
something incredibleongelooflijk happenedgebeurd.
219
555730
3970
Maar een paar weken later
was er iets ongelooflijks gebeurd.
09:31
They repaintedvernieuwd the spotplek,
220
559700
2520
Ze hadden nieuwe lijnen
op die plek getekend,
09:34
and for a secondtweede I thought I saw
the futuretoekomst of openOpen datagegevens,
221
562220
2690
en even zag ik
de toekomst van open data.
09:36
because think about what happenedgebeurd here.
222
564910
2000
Wat is hier namelijk gebeurd?
Vijf jaar lang werden hier boetes
uitgedeeld op een onduidelijke plek,
09:38
For fivevijf yearsjaar, this spotplek was beingwezen
ticketedticket, and it was confusingverwarrend,
223
566910
5100
09:44
and then a citizeninwoner foundgevonden something,
they told the citystad, and withinbinnen a fewweinig weeksweken
224
572010
4306
totdat een burger iets vond
wat hij meldde aan de gemeente,
en binnen een paar weken
was het probleem opgelost.
09:48
the problemprobleem was fixedvast.
225
576316
1294
09:49
It's amazingverbazingwekkend. And a lot of people
see openOpen datagegevens as beingwezen a watchdogwaakhond.
226
577610
3200
Fantastisch. Veel mensen zien
open data als een bedreiging.
09:52
It's not, it's about beingwezen a partnerpartner.
227
580810
1772
Maar ze kunnen ons juist helpen.
09:54
We can empowermachtigen our citizensburgers
to be better partnerspartners for governmentregering,
228
582582
3138
Je kan burgers laten
meedenken met de overheid.
09:57
and it's not that hardhard.
229
585720
1881
Dat is niet zo moeilijk.
09:59
All we need are a fewweinig changesveranderingen.
230
587601
1459
Dat vraagt om wat aanpassingen.
10:01
If you're FOILingVerhinderen datagegevens,
231
589060
1107
Als je wob-aanvragen hebt,
10:02
if you're seeingziend your datagegevens
beingwezen FOILedVerijdeld over and over again,
232
590167
2867
en dezelfde gegevens
worden telkens opgevraagd,
deel die dan gewoon,
dat willen mensen blijkbaar weten.
10:05
let's releasevrijlating it to the publicopenbaar, that's
a signteken that it should be madegemaakt publicopenbaar.
233
593034
3574
En als een overheidsdienst
een pdf uitbrengt,
10:08
And if you're a governmentregering agencyagentschap
releasingvrijgeven a PDFPDF,
234
596608
2482
zou ze wettelijk verplicht moeten zijn
de onderliggende gegevens te geven,
10:11
let's passslagen voor legislationwetgeving that requiresvereist you
to postpost it with the underlyingonderliggende datagegevens,
235
599090
3649
10:14
because that datagegevens
is comingkomt eraan from somewhereergens.
236
602739
2028
want die komen ergens vandaan.
Je kan ze vrijgeven via diezelfde pdf.
10:16
I don't know where, but it's
comingkomt eraan from somewhereergens,
237
604767
2482
10:19
and you can releasevrijlating it with the PDFPDF.
238
607249
1725
En laten we standaarden gaan gebruiken.
10:20
And let's adoptadopteren and sharedelen
some openOpen datagegevens standardsstandaarden.
239
608974
2411
Als eerste voor de adressen in New York.
10:23
Let's startbegin with our addressesadressen
here in NewNieuw YorkYork CityStad.
240
611385
2481
Altijd dezelfde adresopmaak.
10:25
Let's just startbegin
normalizingnormaliseren our addressesadressen.
241
613866
2074
Want ondanks dit alles
loopt New York voorop in open data,
10:27
Because NewNieuw YorkYork is a leaderleider in openOpen datagegevens.
242
615940
2062
10:30
DespiteOndanks all this, we are absolutelyAbsoluut
a leaderleider in openOpen datagegevens,
243
618002
2789
en als wij beginnen met
een open data-standaard,
10:32
and if we startbegin normalizingnormaliseren things,
and setreeks an openOpen datagegevens standardstandaard-,
244
620791
3121
dan volgt de rest.
Eerst de staat en misschien
zelfs de federale overheid.
10:35
othersanderen will followvolgen. The statestaat will followvolgen,
and maybe the federalfederaal governmentregering,
245
623912
3634
Vervolgens andere landen,
zodat je in de nabije toekomst
één programma kunt schrijven
10:39
Other countrieslanden could followvolgen,
246
627546
1445
10:40
and we're not that farver off from a time
where you could writeschrijven one programprogramma
247
628991
3411
om informatie uit 100 landen
inzichtelijk te maken.
10:44
and mapkaart informationinformatie from 100 countrieslanden.
248
632402
1890
Dat is geen sciencefiction.
We zijn al dichtbij.
10:46
It's not sciencewetenschap fictionfictie.
We're actuallywerkelijk quiteheel closedichtbij.
249
634292
2487
Wie doen we daar een plezier mee?
10:48
And by the way, who are we
empoweringempowerment with this?
250
636779
2240
Niet alleen John Kraus en Chris Wong.
10:51
Because it's not just JohnJohn KraussKrauss
and it's not just ChrisChris WhongWhong.
251
639019
3005
Er zijn momenteel honderden
burgerinitiatieven in New York,
10:54
There are hundredshonderden of meetupsMeetups
going on in NewNieuw YorkYork CityStad right now,
252
642024
3095
actieve bijeenkomsten.
10:57
activeactief meetupsMeetups.
253
645119
1025
Duizenden mensen zijn daarbij betrokken.
10:58
There are thousandsduizenden of people
attendingBijwonen these meetupsMeetups.
254
646144
2572
Die mensen ontmoeten elkaar
na werktijd en in het weekend
11:00
These people are going after work
and on weekendsweekends,
255
648716
2368
11:03
and they're attendingBijwonen these meetupsMeetups
to look at openOpen datagegevens
256
651084
2636
om door middel van open data
onze stad te verbeteren.
11:05
and make our citystad a better placeplaats.
257
653720
1640
BetaNYC heeft vorige week bijvoorbeeld
citygram.nyc geopenbaard
11:07
GroupsGroepen like BetaNYCBetaNYC, who just last weekweek
releasedvrijgelaten something calledriep citygramcitygram.nycNYC
258
655360
4073
11:11
that allowstoestaat you to subscribeAbonneren
to 311 complaintsklachten
259
659433
2147
zodat je meldingen kunt krijgen
11:13
around your owneigen home,
or around your officekantoor.
260
661580
2068
van klachten in je omgeving.
11:15
You put in your addressadres,
you get locallokaal complaintsklachten.
261
663648
2427
Vul je adres in en je ziet
klachten uit de omgeving.
11:18
And it's not just the techtech communitygemeenschap
that are after these things.
262
666075
3374
En niet alleen it'ers
houden zich hier mee bezig.
Ook stadsplanners,
zoals mijn studenten op Pratt.
11:21
It's urbanstedelijk plannersplanners like
the studentsstudenten I teachonderwijzen at PrattPratt.
263
669449
2622
Beleidsvoorstanders, echt iedereen,
11:24
It's policyhet beleid advocatesadvocaten, it's everyoneiedereen,
264
672071
1919
11:25
it's citizensburgers from a diverseverschillend
setreeks of backgroundsachtergronden.
265
673990
2563
burgers met verschillende achtergronden.
11:28
And with some smallklein, incrementalincrementele changesveranderingen,
266
676553
2786
Met kleine stap-voor-stap-veranderingen
11:31
we can unlockontgrendelen the passionpassie
and the abilityvermogen of our citizensburgers
267
679339
3225
geven we burgers de inspiratie
en de mogelijkheden
11:34
to harnessharnas openOpen datagegevens
and make our citystad even better,
268
682564
3156
om met behulp van open data
onze stad te verbeteren.
11:37
whetherof it's one datasetDataset,
or one parkingparkeren spotplek at a time.
269
685720
3626
Elke set gegevens -- of parkeerplaats --
draagt daaraan bij.
11:41
Thank you.
270
689346
2322
Dank jullie wel.
(Applaus)
11:43
(ApplauseApplaus)
271
691668
3305
Translated by Robert de Ridder
Reviewed by Dick Stada

▲Back to top

ABOUT THE SPEAKER
Ben Wellington - Data scientist
Ben Wellington blends his love of statistics, the city, and comedy in his entertaining analysis of the story of New York City, told through data.

Why you should listen

Ben Wellington runs the I Quant NY blog, in which he crunches city-released data to find out what's really going on in the Big Apple. To date he has tackled topics such as measles outbreaks in New York City schools, analyzed how companies like Airbnb are really doing in NYC, and asked questions such as "does gentrification cause a reduction in laundromats?" (Answer: inconclusive.)

Ben is a visiting assistant professor in the City & Regional Planning program at the Pratt Institute in Brooklyn; his day job involves working as a quantitative analyst at the investment management firm, Two Sigma. A budding comedian and performer, he also teaches team building workshops through Cherub Improv, a non-profit that uses improv comedy for social good.

More profile about the speaker
Ben Wellington | Speaker | TED.com