Door Anne Bruinsma
Veldnotities #2: Dataruimte voor de Boer
De vraag naar landbouwdata is groot, en neemt alleen nog maar verder toe. Data is nodig voor betere technische resultaten, monitoring van kosten, voor het begrijpen en monitoren van duurzaamheid en het meten en belonen van prestaties. Maar zijn landbouwdata en IT de krachtige hulpmiddelen voor boeren die ze zouden kunnen zijn? Waar wordt op dit moment aan gewerkt, wat gaat goed, wat kan beter? In de serie ‘Veldnotities’ doen we verslag van de zoektocht naar de vraag hoe data en IT kunnen bijdragen aan een duurzame landbouw.
Iedere boer een datakluis?
De datapositie van boeren moet beter. Eigenlijk is iedereen het daarover eens. Om die positie te verbeteren, gaat het steeds vaker over “een eigen dataruimte voor iedere boer”. Er worden verschillende termen voor gebruikt, zoals data wallets of datakluizen, maar de rode draad is een digitale omgeving waarin je als boer je eigen data kan beheren, analyseren en gebruiken. De dataruimte moet ook helpen om data meer gecontroleerd te delen met derden. En het zou een belangrijke voorwaarde zijn om zelf data meer te verwaarden. In aflevering 2 van veldnotities zetten we op aantal zaken op een rij over dataruimtes en decentrale opslag van landbouwdata. We schetsen eerst de huidige dynamiek, staan dan stil bij decentrale data opslag, en tenslotte benoemen we een aantal kanttekeningen.
Gecoördineerde aanpak?
Vooral in de akkerbouw staat de dataruimte van de boer volop in de aandacht. In de recent gepubliceerde visie op data-uitwisseling in open teelten staat dat de BO Akkerbouw, LNV, WUR en RVO vastbesloten zijn “om de noodzakelijke regie te nemen voor de ontwikkeling van de dataruimte, het data-ecosysteem daaromheen en de benodigde afspraken over data-eigendom, -uitwisseling en -gebruik” (zie voor meer informatie: de Roadmap Data-ecosysteem Open Teelten).
Tel daarbij op dat recent de 2 jarige PPS DOOPT (Data op Orde in Open Teelten) is gestart, waarin men de regels en criteria voor effectieve, efficiënte en veilige boerendataruimtes in beeld wil brengen. En bovendien dat vanuit het Groeifonds in principe voor zeven jaar financiering is toegezegd om het informatiehuis van de landbouw in te richten. Onder de noemer “De Hollandse Datalinie” is een breed consortium aan de slag. En het ministerie van LNV probeert regie te voeren vanuit het Actieprogramma Digitalisering.
Het begint zomaar te lijken op een gecoördineerde operatie, die de komende jaren in de open teelten op data gebied bepalend beoogt te zijn. Daarvoor zijn dan ook vele tientallen miljoenen gereserveerd. Grote ambities dus. En dat is in principe hard nodig. We ontwikkelen in agri namelijk erg versnipperd. Ook in het domein van ‘de dataruimte voor de boer’ buitelen de proposities al over elkaar heen. We starten in de landbouw eigenlijk te veel IT projecten op, maar ronden er te weinig af. Valt daar dit keer aan te ontkomen? We duiken eerst iets dieper in het concept van de dataruimte, en delen dan een aantal overwegingen.
Figuur 1: De relatie tussen de 2 jarige PPS DOOPT en het zevenjarige programma Hollandse Datalinie (NXTGEN-HighTech), bron: Tamme van der Wal (projectleider)
Kracht van decentraal
Het concept van de dataruimte komt niet uit de lucht vallen. Al langer en breder dan de landbouw vindt een verschuiving plaats naar gedecentraliseerde gegevensopslag. In heel Europa raast er een discours over Data Spaces. Een mooi overzicht van het concept Data Spaces in het Geo Domein vind je hier. De wens om gebruikers meer vertrouwen te laten krijgen in het functioneren van het data-ecosysteem wordt breed gedeeld.
In het verleden werd vaak gekozen voor gecentraliseerde gegevensopslag vanwege schaalvoordelen en het borgen van gegevensintegriteit. Een centrale aanpak maakt efficiënt beheer mogelijk en kan zorgen voor consistentie van gegevens. Het zorgt voor schaalvoordelen, aangezien meerdere gebruikers dezelfde bronnen en infrastructuur kunnen delen. Maar er ontstonden zorgen over zaken als privacy, beveiliging en data eigendom.
Zo ontstond de vraag naar decentrale oplossingen, die meer controle over je gegevens mogelijk maken en regie over datagebruik. Als boer kan je dan beter beslissen wie toegang heeft tot je data en onder welke voorwaarden. Er ontstaan ook meer mogelijkheden om de verzameling gegevens in je eigen dataruimte voor te leggen aan onafhankelijke derde partijen die je kunnen helpen om met geavanceerde gegevensanalyse inzichten uit je eigen data te halen. Ook ontstaan er nieuwe mogelijkheden om zelf gegevens te verwaarden, bijvoorbeeld buiten de huidige landbouwwaardeketen om.
Gedecentraliseerde opslagsystemen hebben dus als doel om de datapositie van individuen te versterken. Er bestaan verschillende onderliggende technologieën, allemaal met een eigen focus. Sommigen zijn gespecialiseerd in het garanderen van gegevensbeschikbaarheid en -beveiliging, wat bij een complex netwerk van lokale systemen geen kleinigheid is. Anderen zijn juist gespecialiseerd in het bij elkaar brengen van vraag en aanbod en mogelijkheden om data te verkopen. Maar gedecentraliseerde opslagsystemen zijn dus al wel ‘proven technology’.
Decentraal in de landbouw
In de landbouw bestaat er nog niet zoiets als een eigen dataruimte voor boeren. Veel serviceproviders zijn eigenlijk pas net klaar met de migratie naar de cloud, met juist vaak een gecentraliseerde benadering van gegevensopslag. De gegevens worden opgeslagen en beheerd door de cloudprovider, gebruikers hebben er op afstand toegang toe via het internet.
Decentrale gegevensopslag kan worden ondersteund door serviceproviders met een andere cloudstrategie. De cloud infrastructuur is dan juist ontworpen om gegevens te distribueren. Elke gebruiker heeft dan de mogelijkheid voor eigen opslagruimte. Zoiets bestaat (bij mijn weten) in de landbouw nog niet, maar er is nu wel veel in ontwikkeling. Het idee van centrale platforms wordt wat losgelaten, en er wordt meer gedacht langs de lijn van het loskoppelen van functies, zoals data opslag en applicaties. In de praktijk zie je nu tussenvormen ontstaan.
Laten we FarmMaps als voorbeeld nemen. Het platform speelt een centrale rol in veel lopende PPS-en en wordt in belangrijke mate publiek gefinancierd. Als opvolger van Akkerweb is FarmMaps een webgebaseerd platform, gespecialiseerd in het maken van visuele representaties van gegevens. Alhoewel geo een belangrijke plaats inneemt, kan het platform een bredere variëteit aan data aan. De gebruiker ziet zijn gegevens, zoals grondsoorten, gewasopbrengsten en veldgrenzen, terug op een kaart. En hij heeft toegang tot applicaties voor precisielandbouw, zoals variabele dosering en veldverkenning.
FarmMaps is nu geen dataruimte voor de boer, in de zin dat het gebruik maakt van een gecentraliseerde cloudgebaseerde architectuur om gegevens op te slaan en te beheren. Aan de andere kant stelt het platform gebruikers wel in staat om eigen gegevens in verschillende formaten te exporteren, wat de interoperabiliteit van gegevens met andere platforms vergemakkelijkt. De nieuwe architectuur van FarmMaps maakt het wel mogelijk om de switch naar decentrale opslag te maken. In het kader van het eerder genoemde programma ‘De Hollandse Datalinie’ wil men dit aan gaan tonen door enkele applicaties te splitsen van onderliggende data opslag (op basis van het solid protocol).
Discussie
Het is dus nog vroeg, en we moeten het gaan zien. Maar toch is het goed om vast een aantal kanttekeningen te plaatsen. In de eerste plaats vallen we wel vaker in de valkuil dat we veel laten afhangen van een bepaalde technologie. Decentrale opslag is geen toverdrank waarmee huidige onvolkomenheden en tegengestelde belangen in het data ecosysteem van het toneel verdwijnen. Sterker nog, het implementeren en beheren van een gedecentraliseerd opslagsysteem vereist al snel een hoger niveau van technische expertise en kennis dan bij traditionele gecentraliseerde oplossingen. Dit kan drempels opwerpen voor adoptie en onderhoud, vooral voor organisaties met beperkte middelen of technische mogelijkheden. En soms is gecentraliseerde opslag gewoon meer geschikt, bijvoorbeeld als gegevens regelmatig worden geraadpleegd en doorvoereisen hoog zijn.
Figuur 2: Een bonte verzameling velddata. Een dataruimte voor de boer, die alle voor de bedrijfsvoering relevante gegevens omvat, zal een grote variëteit moeten kunnen behappen (bron: Peter Lerink, https://hwodka.nl/)
In de tweede plaats is het de vraag of we dataruimtes de beste oplossing zijn voor mogelijk het belangrijkste pijnpunt in het dataverkeer, namelijk kostbare en tijdrovende gegevensinteroperabiliteit tussen verschillende landbouwapplicaties en -diensten. Boeren willen hun gegevens eenvoudig kunnen overdragen en integreren tussen verschillende platforms en applicaties. De dataruimte voor de boer kàn daar een deeloplossing in zijn, maar zeker niet vanzelf. Mogelijk dat het juist allerlei nieuwe interoperabiliteitskwesties introduceert. Zou een korte klap voor een betere datapositie van de boer niet zijn geweest om regie te voeren op betere ontsluiting van data in huidige systemen en applicaties? Om de autonomie en keuzevrijheid van boeren op die manier te versterken, in plaats van een groot nieuw infrastructureel project te starten? Ik heb op dat soort grote vragen de antwoorden niet, maar ik mis wel een eerlijk debat over dit soort grote keuzes.
Tenslotte praten we te weinig over de werkelijke meerwaarde van data voor boeren. De adoptie van technologie blijft nu achter omdat het erg lastig is om waarde uit data te halen. Afgezien van een groep koplopers haken de meeste boeren niet aan. De dataruimte voor de boer gaat alleen vliegen als de boer ermee kan en wil werken. De vraag hoe het gebruik van data door boeren zelf versterkt wordt, is een vraag die een bredere oplossing vraagt dan alleen het introduceren van een bepaalde technologie. Zeker als de technologie zelf serieuze complexiteit met zich meebrengt. Het lijkt een verraderlijk simpele vraag, maar we weten hem in landbouw zelden goed te antwoorden: wat wil een boer nu eigenlijk?
We hopen met de serie ‘Veldnotities’ bij te dragen aan een gedeelde kennisbasis, meer begrip en meer nuance, in de gezamenlijke zoektocht naar LandbouwData en Duurzaamheid. Zien we iets over het hoofd? Heb je aanvullingen? We horen het graag! Laat een reactie achter of neem contact met ons op
Vraag is wat in deze digitale clud based wereld centraal voor zin heeft. Interoperabiliteit is de key….