Opinie: Meer AI met minder gegevens: wie het kleine niet eert, is het grote niet weerd
02.12.2021
Artificiële intelligentie is geen synoniem voor big data. Er bestaan ook alternatieve benaderingen. Niettemin moet er altijd een bepaald minimum aan gegevens beschikbaar zijn. Het Europees en Vlaams gegevensbeleid moet daarom sterker inzetten op het faciliteren van uitwisseling en (her)gebruik van gegevens binnen de wettelijke grenzen. Beleidsprototypering kan een methode zijn om ervoor te zorgen dat dit beleid werkelijk wordt afgestemd op de (praktische) noden van de betrokken actoren.
Een vaak gehoorde bewering over artificiële intelligentie (AI) is dat de voortdurend verdere ontwikkeling van AI-systemen een evenredig groeiende beschikbaarheid van grote hoeveelheden (persoons)gegevens vereist (zie bv. de gigantische modellen GPT-3 of Wu Dao 2.0). Op die manier zouden door AI-ondersteunde producten en diensten steeds kwalitatiever en accurater worden. Deze bewering vindt weerklank in de vele Europese, maar ook internationale beleidsstrategieën met betrekking tot AI, big data en digitalisering. Daarbij kan niet worden ontkend dat er sprake is van zogenaamde beleidsconcurrentie: de belangrijkste globale jurisdicties streven ernaar om de meest aantrekkelijke plaats te worden voor bedrijven en organisaties die AI-technologieën ontwikkelen. Of, om het in de woorden van de Britse AI-strategie te zeggen, om de “most pro-innovation regulatory environment in the world” te zijn.
Focus op ontsluiting en kwaliteit in plaats van kwantiteit
Een belangrijk terugkerend element in die strategieën is bijgevolg de betrokken bedrijven en onderzoeksinstellingen een uitgebreidere toegang tot meer gegevens te verlenen. Wat betreft de absolute hoeveelheid gegevens moeten we echter erkennen dat grotere landen zoals de Verenigde Staten en China een inherent bevoordeelde positie hebben omwille van hun grotere omvang. De focus van Europese en Vlaamse beleidsinitiatieven (denk aan de Data Governance Act, de Data Act, de ePrivacy-verordening maar ook het Vlaams datanutsbedrijf) kan dan ook beter op het eerste aspect liggen, namelijk het verbeteren van de toegang tot gegevens. Dit kan door de reeds beschikbare (publieke en private) gegevens beter te ontsluiten en te kaderen binnen efficiënte deel- , beheer- en controlemechanismen zodat gegevens optimaal kunnen (her)benut worden. Het mogelijke Europese ‘datavoordeel’ zal immers niet schuilen in de absolute hoeveelheid ruwe Europese gegevens, maar wel in de kwaliteit van die gegevens en hoe vlot die gegevens gedeeld en gebruikt kunnen worden.
Recent onderzoek van het Amerikaanse Center for Security and Emerging Technology bevestigt trouwens dat het gebrek aan grote hoeveelheden gegevens niet noodzakelijk een nadeel hoeft te zijn voor de ontwikkeling van AI-technologieën. In hun rapport wijzen ze op het groeiende belang van zogenaamde ‘small data’-aanpakken zoals transfer learning of het gebruik van artificiële gegevens. Ook de auteurs van dit opiniestuk in De Tijd (19/11) alluderen op dergelijke technische mogelijkheden. Niettemin vereisen deze benaderingen nog altijd een bepaald minimum aan relevante gegevens en komt het er dus op aan dat die gegevens vlot(ter) beschikbaar zijn.
Beleidsprototypering als noodzakelijk onderdeel van het beleidsvormingsproces
Kortom, als Europa een aantrekkelijke jurisdictie voor AI-bedrijven wil zijn, dan moet er sterker worden ingezet op het faciliteren van uitwisseling en toegang tot gegevens binnen de wettelijke grenzen. Dergelijke, in EU-lingo, “data-economie” zal echter enkel goed functioneren indien de noden van de beoogde deelnemers aan die economie als voornaamste inspiratie dienen. Om dit te verzekeren moet overwogen worden om de discussie op Europees niveau over de eerder vernoemde beleidsdocumenten te laten vergezellen door een experiment in beleidsprototypering (policy prototyping) op Europees, nationaal of regionaal niveau. Beleidsprototypering is een iteratief proces waarbij een diverse groep van betrokken partijen gevraagd wordt om een beleidsvoorstel in praktijk te testen en een proefimplementatie uit te voeren. Op die manier kan een doelmatigheidsbeoordeling plaatsvinden en kan het draagvlak voor het beleid in de praktijk worden geëvalueerd. Daarenboven kunnen ook het begrip en de bruikbaarheid van de voorgestelde regels in kaart worden gebracht zodat ze gewijzigd kunnen worden voorafgaand aan de inwerkingtreding. Gelet op de aanwezige betrokken partijen en kennis, kan Vlaanderen (en meer bepaald het Kenniscentrum Data & Maatschappij) daar zeker een pioniersrol in spelen.
Photo by Julia Cheperis on Unsplash
Auteur
Thomas Gils (CiTiP KU Leuven)