
Door Anne Bruinsma

Big Data op de MestHack
Het belangrijkste ingrediënt op een hackathon is data. Voor de MestHack graven we in het datalandschap, om zoveel mogelijk relevante data naar boven te halen. Zodat teams tijdens de Mest Hack hun tanden kunnen zetten in uitdagingen rond bijvoorbeeld mesttransport, een transparante mestmarkt of het meten van milieu-impact. Een belangrijke bron voor hackathons is beschikbare open data.
We zijn supertrots om aan te kondigen dat we tijdens de Mest Hack de gelegenheid krijgen om met de AgroDataCube te werken, een perceel-gebaseerde Big Data collectie voor Nederland. De Cube is een initiatief van Wageningen UR en het Ministerie van EZ, vertelt Sander Janssen, teamleider Earth Informatics bij Wageningen Environmental Research en trekker van het WUR brede Big Data programma.
Foto: Sander Janssen, tijdens een GODAN bijeenkomst: Global Open Data for Agriculture and Nutrition
De AgroDataCube is een datawarehouse met Open Data gegevens relevant voor agro-productie, met de Nederlandse gewaspercelen als gemeenschappelijk referentiepunt. De gegevens bestrijken de periode 2012 tot en met 2016. De uitdaging voor deelnemers is om na te gaan hoe – in dit geval specifiek voor het mest dossier – Open Data kan dienen als versneller voor Big Data. Janssen: “We gaan de komende maanden flink aan de slag met de AgroDataCube. We zijn heel benieuwd wat volgens teams verdere ontwikkeling behoeft, wat de krachten en zwaktes zijn en bijvoorbeeld welke data nog ontbreekt”.
De huidige versie van de datawarehouse bevat de volgende data:
- Perceelsgegevens: AAN en BRP (2012-2016)
- Administratieve regio’s: Gemeenten 2015, provincies
- Hoogtegegevens: AHN
- Bodemgegevens: Bodemkaart 1:250.000, 1:50.000 (Waaruit afgeleid: grondsoorten, pH, organische stof, C/N ratio)
- Weergegevens: KNMI meetstations en meteodata (2012-2016)
- GroenMonitor-gegevens: NDVI data (2013-2016), waaruit afgeleid: gewasgroei-variabelen voor suikerbietpercelen
De huidige data warehouse is opgeslagen in het PostGIS RDBMS, en toegankelijk via SQL (bijvoorbeeld met pgAdmin, of vanuit een programmeertaal zoals Python). Het PostGIS RDBMS bevat circa 80 GB aan voorbewerkte data. Lees hier meer over de Cube.
In het onderzoek ‘Open Data voor precisielandbouw’ staat dat beperkingen voor het optimaal benutten van open data in de agro-foodsector vooral liggen op het vlak van datamanagement, licenties, eigendomsrechten, interoperability en exploitatie/verdienmodellen. De AgroDataCube speelt in op de gesignaleerde knelpunten door verschillende open data bestanden te integreren.
Tweet: Toepassing van Big Data in mest
Kool variabel over bemest. @BertRijk @sulky_burel @RavenPrecision pic.twitter.com/ON6DTF3dts
— Nico Knibbe (@nknibbe) 21 september 2017
MestHack
Op 12 en 13 oktober duiken we op de schitterende Dairy Campus in Leeuwarden tijdens de Mest Hack in milieu, transport, over- en onderbemesting, papierloze administratie en een online mestmarkt. Dus ben jij data scientist of machine learning expert en kan data niet Big genoeg zijn? Schrijf je nu in voor de Mest Hack!
I am a PhD candidate from TU Delft supervised by Marijn Janssen. My research is about investigating citizen engagement with Open Government Data (OGD) for tackling societal issues. I think that this event may provide stocks of potential cases to be studied. Therefore, I would like to attend the event. Thank you!