Algoritmes en AI: welke vragen stel jij?

Inzicht begint met vragen stellen. Vragen stellen helpt je om rekenmodellen, algoritmes en artificiële intelligentie (AI) beter te begrijpen. Met meer inzicht maak je betere keuzes. Over welk thema wil jij meer inzicht in AI?

Maatschappij

In onze samenleving worden algoritmes en AI vaak gebruikt. Denk aan de dienstregeling van het openbaar vervoer of de selectie van je favoriete muziek. Klik hieronder voor meer voorbeelden.

Toeslag fraude

Haattaal

Taxi app

Muziekherkenning

Spotify gebruikt data van gebruikers om hun algoritme te leren welke muziek mensen willen horen. Het herkennen en classificeren van muziek is voor een algoritme veel lastiger dan voor een mens. Door data zoals gebruikersvoorkeuren te gebruiken, verbetert het algoritme.

Zelfrijdende auto

Anno 2022 werken zelfrijdende auto’s als combinatie van allerlei verschillende AI’s. Een grote uitdaging zit hem in de ethische dilemma’s die je tegenkomt: hoe bepalen we of het algoritme kiest voor de veiligheid van een voetganger of van de bijrijder?

Schaakcomputer

Velen waren verbijsterd toen een schaakcomputer in 1996 won van wereldkampioen Kasparov. AI getraind als schaakcomputer kan supersnel alle mogelijke schaakscenario’s doordenken, maar kan niet dammen.

Sollicitatie

Train je een algoritme op data waarin voornamelijk mannelijke werknemers zitten, dan zal het bij werving ook vooral mannelijke sollicitanten selecteren. Het algoritme maakt dit sociale vooroordeel zichtbaar, maar introduceert het niet zelf.

Dienstregeling trein

De dienstregeling van de NS is een goed voorbeeld van de meerwaarde van AI bij complexe problemen. Algoritmes kunnen vele malen beter een efficiënt spoorboekje maken dan wij als mensen.

Gezondheid

Rondom onze gezondheid en zorg worden algoritmes en AI vaak gebruikt. Denk aan fitness apps op je smartwatch of onderzoek naar betere diagnoses. Klik hieronder voor meer voorbeelden.

Smartwatch

IC-alarm

Röntgenfoto

Diagnose

Een diagnostisch algoritme werd ontwikkeld om huidkanker op te sporen in foto’s van huidsamples. Het algoritme bleek daar beter in te zijn dan artsen. Geweldig, al werd het algoritme getraind op foto’s van voornamelijk lichte huid. Daardoor werkte het slecht in het detecteren van huidkanker in gekleurde huid.

Intake

De analyse van patiëntendata, zoals DNA of medische geschiedenis, helpt bij het ontwikkelen van nieuwe therapieën of medicijnen. De uitdaging is om dataverzameling te standaardiseren. Bijvoorbeeld bij een intake moment. Zo worden kwaliteit en betrouwbaarheid gegarandeerd en is data goed vergelijkbaar.

Smoothie

Uit data-analyses blijkt dat mensen die vaak groene smoothies drinken, gezonder zijn. Zijn de smoothies de oorzaak van betere gezondheid (causatie) of is het een voorspellende factor (correlatie)? Kiezen mensen die bezig zijn met gezonde leefstijl vaker voor groene smoothies?

CoronaMelder

De CoronaMelder app waarschuwt je als je in de buurt van een besmet persoon bent geweest.  Alléén wanneer de andere persoon ook gebruik maakt van de app. Een lastige situatie. De app werkt pas goed als genoeg mensen hem gebruiken, maar mensen gaan hem pas gebruiken als ze weten dat de app werkt.

Chemotherapie

Chemotherapie lijkt zeer gevaarlijk bij data-analyse over de risico’s van borstkanker behandelingen. Deze patiënten leven korter dan na bestraling. Chemotherapie afschaffen? Toch maar niet. Juist deze behandelmethode werkt bij agressieve vormen van kanker, waar patiënten anders nóg korter zouden leven.

Energie

Bij de transitie van fossiele naar duurzame energie worden algoritmes en AI vaak gebruikt. Denk aan de slimme meter in je woning of de aansturing van een windmolen. Klik hieronder voor meer voorbeelden.

Slimme meter

Kernenergie

Aardgasvrij

Windmolens

Er komt veel kijken bij het opwekken van windenergie. Algoritmes sturen windmolens aan om rekening te houden met windkracht, bewolking en zetten zichzelf stil bij slagschaduw of als er vleermuizen of trekvogels langs vliegen.

Zonnepanelen

Op een zonnige zomermiddag produceren zonnevelden maximaal. Voor het elektriciteitsnet is piekbelasting een probleem, want het kan dan overbelast raken. Algoritmes die weersvoorspellingen en elektriciteitsverbruik met elkaar combineren, helpen overbelasting voorkomen.

Energielabel

Energielabels zijn 10 jaar geldig en tussendoor bijwerken is niet verplicht. Hierdoor loopt data over energiezuinige woningen vaak achter de feiten aan. Hoe gaat onderzoek naar energiearmoede daarmee om?

Smart-grids

Slimme meters zijn aardig ingeburgerd, maar hoeveel slimme apparaten heb jij? Met algoritmes en AI kan gebruik op elkaar afgestemd worden. Zodat bijvoorbeeld je slimme wasmachine aangaat als je zonnepanelen veel stroom produceren, en je elektrische auto stopt met laden als het bewolkt is.

Klimaat

Om inzicht te krijgen in ons veranderende klimaat worden algoritmes en rekenmodellen gebruikt. Denk aan het ontstaan van wolken of voorspellen hoeveel de zeespiegel stijgt. Klik hieronder voor meer voorbeelden.

Weersvoorspelling

Zeespiegelstijging

Vulkaanuitbarsting

Boomringen

Hoe weten onderzoekers hoe veel het 200 jaar geleden regende? Ze gebruiken proxy’s. Dit zijn uitvoerig onderzochte en geteste methoden, zoals het meten van jaarringen van bomen. Elk jaar komt er een ring bij. In natte jaren is de ring dikker omdat de boom meer groeit.

Satellietmetingen

Wat klinkt meer nauwkeurig: temperatuur meten met een satelliet of met een thermometer? In beide gevallen is het een indirecte meting met voordelen, nadelen en gevoeligheden. Met deze bekende (on)nauwkeurigheden houden rekenmodellen rekening.

IPCC-rapport

Een indrukwekkende wetenschappelijke samenwerking. Het IPCC-rapport wordt gemaakt door wetenschappers over de hele wereld. Daarbij staan data uitwisseling, kritische openheid en ontzettend veel complexe rekenmodellen centraal.

Wolken

Wolken hebben een gigantische invloed op het weer, maar zijn nog steeds een van de grootste uitdagingen om te voorspellen en modelleren. Wolken weerspiegelen modelleerbare weerseffecten en worden daarom zelf niet in klimaatmodellen meegenomen.

Temperatuur

Wist je dat rekenmodellen eenvoudiger de temperatuur kunnen voorspellen voor een groot gebied? Hoe kleiner het gebied, hoe moeilijker dit wordt. Zo is 1 graden stijging globaal beter te modelleren dan de lokale temperatuur van volgende week.

Maatschappij

Gezondheid

Energie

Klimaat

Klimaat

Weersvoorspelling

Ella werkt bij het KNMI waar ze zo nauwkeurig mogelijke weersvoorspellingen maakt. Dat lukt heel aardig, maar is nooit 100% accuraat. Ze krijgt vaak vragen van mensen. Het weer van morgen is al niet zeker. Hoe kunnen we dan weten dat het klimaat verandert en de temperatuur over de hele wereld stijgt?

Vraag 1

Bron: waar komt de data vandaan?

Weerdata en klimaatdata hebben veel overeenkomsten. Er wordt bijvoorbeeld gekeken naar temperatuur, vochtigheid en oceaan- en luchtstromen. Het grote verschil zit hem in tijdschaal. Een klimaatmodel gebruikt data die laten zien hoe het weer honderden jaren geleden was, zoals boomringen en koolstofdateringen. Een weermodel kijkt op zeer korte termijn. Het richt zich daarbij bijvoorbeeld op wolken en temperatuurverschillen tussen luchtlagen. Voor klimaat zijn deze individuele gebeurtenissen niet relevant en gaat het om het gemiddelde effect van bewolking op langere termijn.

Vraag 2

Analyse: wat wordt er met de data gedaan?

Zowel een weermodel als een klimaatmodel zijn complex. De modellen houden rekening met veel verschillende invloeden. De dagelijkse gang van de zon heeft op het weer een grote invloed. Een dag in de winter zal minder zonuren krijgen dan een zomerdag. Is het dan ook kouder? Dat kan, maar hoeft niet. Een weermodel moet zo nauwkeurig mogelijk zijn voor een heel specifieke plaats en tijd. Voor het klimaat tellen de lokale, dagelijkse of seizoensgebonden veranderingen minder. Klimaatmodellen rekenen op een andere schaal en geven daarmee niet aan hoe het weer er op een bepaalde plek over 100 jaar uitziet. Het kijkt naar het effect van dit weer op de omstandigheden op aarde, zoals de bandbreedte van temperatuur en zeespiegelniveau.

Vraag 3

Uitkomst: hoe worden bron en analyse gebruikt?

Een weermodel kent vele verschillende omstandigheden die bestaan uit zekerheden en onzekerheden. Het is een uitdaging om dit zo precies mogelijk uit te rekenen. Luchtstromen en windrichtingen zijn bijvoorbeeld vrij goed te voorspellen, maar het ontstaan van wolken is veel onvoorspelbaarder. Daarom is de weersvoorspelling van morgen in jouw stad niet altijd juist. Echter heeft dit weer zeer weinig invloed op het klimaat over 100 jaar. Hiervoor gebruiken modellen meer stabiele factoren en hebben ze te maken met andere soorten onzekerheden. Zo kan het dat het weer van morgen lastiger te voorspellen is dan een wereldwijde temperatuurstijging van 1.5℃.

Inzicht

Welk inzicht levert dit op?

Rekenmodellen die het weer berekenen gebruiken andere soorten data dan rekenmodellen die het klimaat berekenen. Voor beide modellen wordt gekozen voor een aanpak die past bij de vraag en waarbij de betrouwbaarheid van de uitkomst zo hoog mogelijk is.

Lees meer over de vragen
Swipe
Klimaat

Zeespiegelstijging

Mounir is op zoek naar een koophuis. Zijn droomhuis staat in een regio die onder de zeespiegel ligt. Met een hypotheek van 30 jaar in gedachten, vraagt Mounir zich af of het wel verstandig is om dit huis te kopen. Als de zeespiegel blijft stijgen, staat de hele regio over een paar jaar toch onder water?

Vraag 1

Bron: waar komt de data vandaan?

Data voor klimaatmodellen zijn een combinatie van natuurkundige ‘zekerheden’ en van variabelen die afhankelijk zijn van ‘onzekerheden’. Zekerheden zijn bijvoorbeeld hoe moleculen reageren op temperaturen (water bevriest altijd bij 0℃). Een onzekerheid is bijvoorbeeld hoeveel CO2 er over 50 jaar uitgestoten wordt. In een rekenmodel worden deze data gecombineerd. Zo ontstaat een beeld van het effect van de ‘onzekerheden’ op het klimaat en de uiteindelijke zeespiegelstijging.

Vraag 2

Analyse: wat wordt er met de data gedaan?

Wat er morgen gaat gebeuren is onbekend, maar dat de zon opkomt is zeker. Bepaalde natuurkundige wetten gelden ook over 100 jaar nog. Een rekenmodel combineert ‘zekerheden’ met factoren waarvan bekend is dat ze onzeker zijn. Hoe meer factoren, hoe groter het aantal mogelijke uitkomsten. Door modellen al die verschillende scenario’s te laten uitrekenen, krijgen de onderzoekers meer inzicht in de meest waarschijnlijke scenario’s. Op die manier worden de voorspellingen steeds betrouwbaarder.

Vraag 3

Uitkomst: hoe worden bron en analyse gebruikt?

Uit de rekenmodellen komt een spreiding aan mogelijke uitkomsten voor het klimaat. Zo is er bijvoorbeeld grote zekerheid dat de zeespiegel zal stijgen, maar is de mate van stijging meer onzeker. Dit is immers mede afhankelijk van factoren die in de toekomst gaan spelen en nu nog onbekend zijn. In Nederland houden we nu rekening met een zeespiegelstijging van 30-80cm in het jaar 2100 in het meest optimistische scenario. En tot 1.2m in het minst gunstige geval. In beide gevallen heeft de stijging tot gevolg dat de kans op overstromingen sterk toeneemt.

Inzicht

Welk inzicht levert dit op?

Rekenmodellen geven een spreiding aan mogelijke uitkomsten. Dat de zeespiegel en de kans op overstromingen stijgt is zeker, maar hoeveel precies is onzeker. Ook Mounir’s toekomstige huis krijgt hiermee te maken.

Lees meer over de vragen
Swipe
Klimaat

Vulkaanuitbarsting

Klimaatwetenschapper Asha werkt aan rekenmodellen die veel factoren combineren om het klimaat te voorspellen. Vulkaanuitbarstingen worden niet als factor meegenomen in de modellen die ze gebruikt. Toch weet Asha dat vulkanen bijdragen aan klimaatverandering door het vrijkomen van CO2, as en andere stoffen.

Vraag 1

Bron: waar komt de data vandaan?

Klimaatmodellen gebruiken verschillende soorten data over bijvoorbeeld de samenstelling van de atmosfeer en temperatuur van oceaan en land. Ook na vulkaanuitbarstingen wordt veel data verzameld. Zoals hoeveel as er vrijkomt, hoe dit zich verspreidt en welke andere stoffen in de lucht en op land terechtkomen.

Vraag 2

Analyse: wat wordt er met de data gedaan?

De verandering van atmosfeer en de effecten daarvan op het klimaat, zijn voor vulkaanuitbarstingen goed te voorspellen door klimaatmodellen. Bijvoorbeeld aan de hand van de grootte van de uitbarsting en de samenstelling van de as. De modellen nemen immers dit soort factoren al mee. De modellen hebben echter onvoldoende data om te voorspellen wanneer en waar een vulkaanuitbarsting plaatsvindt.

Vraag 3

Uitkomst: hoe worden bron en analyse gebruikt?

Klimaatmodellen kunnen de gevolgen van een vulkaanuitbarsting nabootsen, maar voorspellen niet wanneer die in de toekomst plaatsvinden. Dit brengt dus een grote onzekerheid met zich mee. Daarom kiest Asha ervoor om ze niet mee te nemen in voorspellende modellen. Ze betrekt dit soort afgebakende gebeurtenissen pas op het moment dat ze zich voordoen of hebben gedaan. Op die manier wordt een scenario bijgewerkt aan de hand van actuele gebeurtenissen, en wordt het rekenmodel zelf krachtiger.

Inzicht

Welk inzicht levert dit op?

Voor Asha is het belangrijk om te begrijpen welk effect vulkaanuitbarstingen hebben. Zo kunnen deze verwerkt worden in haar rekenmodellen. De uitkomst van haar rekenmodellen wordt betrouwbaarder door haar criteria zorgvuldig te kiezen.

 

Lees meer over de vragen
Swipe
Energie

Slimme meter

Ravi woont met zijn kinderen in een huis met een slimme energiemeter. De meter houdt bij hoeveel stroom zijn apparaten verbruiken en wanneer. Ravi kan dat zien via een app. Hij vraagt zich wel eens af; wie heeft er nog meer toegang tot die data en wat wordt daarmee gedaan?

Vraag 1

Bron: waar komt de data vandaan?

Slimme energiemeters verzamelen dag in dag uit grote hoeveelheden data. De energiemeter meet de hoeveelheid elektriciteit- en gasverbruik op elk moment van de dag. In de app zie je precies hoeveel energie je wanneer gebruikt hebt; jouw verbruiksdata. Data over jouw type woning, je adres, en persoonsgegevens worden ook verzameld, zodat de data die jij ziet in de app bij jou hoort.

Vraag 2

Analyse: wat wordt er met de data gedaan?

De app die inzicht geeft in jouw energieverbruik laat alleen data zien zonder daar analyse op toe te passen. Wel maakt het digitaal verzamelen van data het mogelijk om grote analyses te doen en patronen te herkennen. Het analyseren van de verbruiksdata van alle energiemeters geeft inzicht in hoe bepaalde wijken, of misschien zelfs mensen, hun leven hebben ingericht. Hoe laat sta je op en hoe laat ga je slapen? Je energieverbruik geeft inzicht.

Vraag 3

Uitkomst: hoe worden bron en analyse gebruikt?

Het is handig om naar je eigen verbruik te kijken, maar het is niet vanzelfsprekend dat deze data voor anderen toegankelijk is. Met dit soort privacygevoelige data moet zorgvuldig worden omgegaan. Bijvoorbeeld door strenge regels voor het verzamelen en opslaan van data, zodat persoonsgegevens niet gelinkt zijn aan verbruiksgegevens. De data van energieverbruik gaan dan op een grote hoop en zijn niet te koppelen aan jouw eigen huis. Op die manier zorg je ervoor dat privacy-gevoelige data, ofwel de bron, verantwoord gebruikt worden.

Inzicht

Welk inzicht levert dit op?

Ravi heeft voordelen van het inzien van zijn verbruiksdata. Om privacy te beschermen, moet duidelijk zijn wie welke data kan inzien. Ook inzicht in of en hoe persoonsgegevens gekoppeld zijn aan verbruiksgegevens is belangrijk.

Lees meer over de vragen
Swipe
Energie

Kernenergie

Politicus Wim verdiept zich in de energietransitie. Hoe kan Nederland het beste elektriciteit opwekken zonder gebruik van fossiele brandstoffen? Hij vraagt zich af waarom kernenergie geen haalbare optie is volgens de rekenmodellen van TNO, de Nederlandse organisatie die onafhankelijk toegepast-natuurwetenschappelijk onderzoek doet naar onder andere de energietransitie.

Vraag 1

Bron: waar komt de data vandaan?

TNO maakt gebruik van rekenmodellen met kostenoptimalisatie. Daarmee zijn de kosten en technische kenmerken van verschillende scenario’s van energietransitie te beoordelen. De algoritmes in het model gebruiken gegevens (data) over de kosten en technische kenmerken van heel veel verschillende technologieën. Kernenergie is een van de technologieën waar data van wordt gebruikt.

Vraag 2

Analyse: wat wordt er met de data gedaan?

Het kostenoptimalisatie model wordt gebruikt om te kijken hoe je een doel als klimaatneutraliteit haalt tegen de laagst mogelijke kosten. In alle scenario’s van dit model blijkt dat elektriciteit uit zon en wind een grote rol speelt. Een scenario aangevuld met kernenergie blijkt minder optimaal. De opdracht van het algoritme is om te selecteren op betaalbaarheid. Om die reden kiest het model niet voor duurdere opties met kernenergie.

Vraag 3

Uitkomst: hoe worden bron en analyse gebruikt?

Dit model kijkt op basis van kosten hoe Nederland het beste elektriciteit kan opwekken in een klimaatneutrale toekomst. Betekent dit dat kernenergie bij voorbaat is uitgesloten om (ideologische) redenen? Nee, juist niet. Het is aan politici als Wim om te besluiten wat er met de uitkomst van de TNO-modellen wordt gedaan. Het financiële aspect is maar één van de afwegingen in het keuzeproces bij energietransitie.

Inzicht

Welk inzicht levert dit op?

Meer kennis van de selectiecriteria van een rekenmodel, in dit geval kosten optimaliseren. Dit geeft Wim inzicht over hoe de uitkomst van het model gebruikt kan worden. Daarmee kan hij de afweging maken en zijn besluit onderbouwen.

Lees meer over de vragen
Swipe
Energie

Aardgasvrij

Brechtje is gemeenteambtenaar op de afdeling Duurzaamheid. Ze werkt aan een plan om wijken van aardgas af te krijgen. Om aardgasvrij te worden, zijn er een aantal uitdagingen. Denk aan de mate van isolatie, betaalbaarheid en alternatieve warmtebronnen. Deze uitdagingen zijn anders voor iedere wijk. Modellen helpen Brechtje, maar welke informatie gebruiken die en hoe?

Vraag 1

Bron: waar komt de data vandaan?

Bij een model dat berekent hoe een wijk aardgasvrij kan worden, komt veel data kijken. Denk daarbij aan data over type woningen, mate van isolatie, ligging voor zonnepanelen en mogelijkheden voor bijvoorbeeld aardwarmte of warmtenetten. Het is ook relevant of het gaat om koop- of huurwoningen. Bovendien moet de gebruiker kiezen welke data exact gebruikt worden, bijvoorbeeld bouwjaar of energielabel. Informatie over het bouwjaar van een woning is betrouwbaar, maar zegt niet zoveel over het energielabel. Energielabels leveren misschien betekenisvolle informatie over een woning, maar zijn vaak verouderd.

Vraag 2

Analyse: wat wordt er met de data gedaan?

Het maken van keuzes en het doen van aannames is belangrijk bij een rekenmodel om de meest efficiënte manier te vinden om aardgasvrij te worden. Bij een keuze om te kijken naar bouwjaar is de aanname bijvoorbeeld dat moderne woningen beter geïsoleerd zijn dan oude. Als je kiest voor energielabel is de aanname dat deze informatie voldoende beeld geeft van de huidige situatie. Het is belangrijk om deze aannames zorgvuldig te overwegen en goed vast te leggen.

Vraag 3

Uitkomst: hoe worden bron en analyse gebruikt?

Welke aanname Brechtje kiest, heeft invloed op de uitkomst van het model. Bij het gebruiken van energielabels weet ze bijvoorbeeld al dat de data verouderd kan zijn. De huidige situatie is in veel gevallen verbeterd. Hoeveel isolatie nog nodig is kan dus overschat worden. Daardoor lijken aardgas alternatieven misschien minder haalbaar dan ze zijn. Ditzelfde probleem speelt in grotere mate bij een keuze voor bouwjaar.

Inzicht

Welk inzicht levert dit op?

Een rekenmodel kan Brechtje goed op weg helpen, maar is slechts een van de nodige onderzoeken om tot een oplossing te komen.

Lees meer over de vragen
Swipe
Gezondheid

Smartwatch

Een sportieve gewoonte; Jamai gaat een paar keer per week hardlopen en houdt met een app op zijn smartwatch zijn hartslag en loopafstand bij. Hij krijgt bovendien korting op zijn zorgverzekering dankzij de app. Jamai is blij met de korting, maar vraagt zich af wat de verzekeraar met al die data doet.

Vraag 1

Bron: waar komt de data vandaan?

Data uit smartwatch apps kan op verschillende manieren verzameld worden. Door observatie: de data van alle gebruikers die toestemming hebben gegeven wordt opgeslagen. Deze data is dus passief verkregen en kan achteraf geanalyseerd worden. Of door selectie via een ontworpen experiment. Daarbij selecteren de onderzoekers van tevoren het type deelnemers gebaseerd op hun onderzoeksvraag en benaderen hen actief om deel te nemen. Op de eerste manier kan zeer veel data met weinig moeite worden verzameld. De tweede manier kost meer tijd en inspanning.

Vraag 2

Analyse: wat wordt er met de data gedaan?

Als een zorgverzekeraar data analyseert die door observatie zijn verzameld, dan moet hij er rekening mee houden dat deze geen volledige afspiegeling van de samenleving geven. De data komt immers van een bepaalde groep. Namelijk; mensen die om uiteenlopende redenen een smartwatch app gebruiken. De actieve manier van data verzamelen door selectie kost meer tijd en moeite, maar geeft meer kans op een objectief antwoord op de onderzoeksvraag. Want ook mensen die uit zichzelf geen smartwatch app gebruiken, worden onderzocht.

Vraag 3

Uitkomst: hoe worden bron en analyse gebruikt?

De zorgverzekeraar concludeert dat mensen die een smartwatch app gebruiken gezonder zijn en dus korting op hun zorgverzekering krijgen. Dit kan kloppen. Echter het is op basis van alleen observatiedata niet mogelijk om te weten of het gebruik van smartwatch apps mensen gezonder maakt. Om een oorzaak-gevolg verband vast te stellen is data afkomstig van een representatieve groep mensen nodig.

Inzicht

Welk inzicht levert dit op?

De data verzameld door apps kan waardevolle informatie bevatten en aanwijzingen geven over de gezondheid van mensen. Zorgverzekeraars met goede bedoelingen moeten zich blijven afvragen: maakt zijn smartwatch Jamai echt gezonder?

Lees meer over de vragen
Swipe
Gezondheid

IC-alarm

Op de IC-afdeling waar Joyce werkt, wordt een ‘Checklist app’ gebruikt. De app ondersteunt artsen en verpleegkundigen. Het algoritme in de app geeft aan en houdt bij hoeveel en welke medicatie een patiënt krijgt. Bijvoorbeeld wanneer een patiënt extra pijnmedicatie nodig heeft. Het algoritme geeft dan op basis van gepersonaliseerde gegevens advies over het type en de dosis. De app geeft Joyce aan de ene kant duidelijkheid en aan de andere kant twijfelt ze aan de betrouwbaarheid van het algoritme.

Vraag 1

Bron: waar komt de data vandaan?

Het algoritme maakt gebruik van data om keuzes te maken in de checklist. In dit geval zijn het twee soorten data; de gegevens van de patiënt (zoals gewicht, leeftijd, onderliggende aandoeningen) en de data die gebruikt zijn om het algoritme te maken (zoals wetenschappelijk onderzoek, beschikbare medicatie, ziekenhuisprotocollen). Voor beide soorten geldt dat er keuzes zijn gemaakt over welke data wel en niet verwerkt worden. Bijvoorbeeld of sociaaleconomische status zoals inkomen of afkomst van de patiënt relevant is. Maar ook over hoe ver de data teruggaat in de medische geschiedenis van de patiënt. Verder moet de data uit wetenschappelijke onderzoeken recent genoeg zijn.

Vraag 2

Analyse: wat wordt er met de data gedaan?

Een algoritme is een serie berekeningen, waarbij de volgende stap afhangt van aanpasbare instellingen. Deze instellingen worden gemaakt door mensen en zijn gebaseerd op aannames of keuzes. Samen met artsen moet bijvoorbeeld besloten worden welke leverfunctie past bij welke dosis pijnmedicatie. Door deze stappen zo volledig mogelijk in te stellen, ontstaat een algoritme dat met veel verschillende medische aspecten rekening houdt. Een algoritme met de juiste instellingen en relevante data is een ondersteuning voor de artsen en verpleegkundigen op de IC-afdeling.

Vraag 3

Uitkomst: hoe worden bron en analyse gebruikt?

De Checklist-app biedt Joyce en haar collega’s steun bij het maken van beslissingen over IC-patiënten. Op basis van vooraf gemaakte keuzes en instellingen geeft het algoritme gepersonaliseerde informatie. Dit verkleint de kans op menselijke fouten of vergissingen. Het is daarbij belangrijk om inzicht te kunnen krijgen in de data die wel of juist niet gebruikt is, en de aannames die gedaan zijn. Het aanpassen van instellingen naar aanleiding van nieuwe inzichten is cruciaal bij het verantwoord gebruik van deze app.

Inzicht

Welk inzicht levert dit op?

Een algoritme is door mensen gemaakt en biedt steun bij het maken van keuzes. Het blijft belangrijk om regelmatig na te gaan hoe betrouwbaar de instellingen zijn en of er factoren zijn die aangepast kunnen worden. Dit is waar mens en computer elkaar aanvullen.

Lees meer over de vragen
Swipe
Gezondheid

Röntgenfoto

Arts-onderzoeker Jin werkt aan een zelflerend algoritme dat botbreuken herkent op röntgenfoto’s. Het algoritme werkt enorm goed en haalt 90% van de foto’s met breuken eruit. Voor sommige afdelingen ligt dat percentage zelfs nog hoger. Voordat Jin het succes van de daken schreeuwt, is hij benieuwd hoe het algoritme dit geleerd heeft. Wat herkent het precies?

Vraag 1

Bron: waar komt de data vandaan?

Bij het trainen van het algoritme gebruikte Jin zoveel mogelijk röntgenfoto’s van verschillende afdelingen uit het ziekenhuis. Een algoritme ‘ziet’ een foto niet zoals wij als een geheel, maar als een verzameling pixels van verschillende intensiteit. De data bestaat voor het algoritme dus niet uit een stapel foto’s, maar uit lange series getallen waar het algoritme de relevante informatie uit moet leren halen.

Vraag 2

Analyse: wat wordt er met de data gedaan?

Bij ‘black box’ AI leert een algoritme zichzelf welke informatie in de serie getallen relevant is. Het algoritme wordt getraind met uiteenlopende foto’s die gemarkeerd zijn als ‘wel botbreuk’ of ‘geen botbreuk’. Hierdoor gaat het algoritme patronen herkennen in de twee categorieën. Na de trainingsfase komt de testfase. Met een serie nieuwe foto’s wordt het algoritme gevraagd om zelf de categorie te kiezen. Het is bij Jin niet bekend welk patroon precies geleerd is. Als Jin dat wil weten, dan kan hij kiezen voor zogenaamd ‘explainable’ of ‘verklaarbare’ AI. Het leerproces is dan in stappen opgedeeld en het algoritme laat bij elke stap zien welke patronen het herkent.

Vraag 3

Uitkomst: hoe worden bron en analyse gebruikt?

Het ‘black box’ algoritme van Jin blijkt erg goed in het herkennen van foto’s met botbreuken. Echter kwam Jin er door explainable AI achter dat het herkende patroon weinig te maken heeft met de medische gegevens op de foto. Op de eerste hulp staat op relatief zeer groot deel van de foto’s een botbreuk. Deze worden bovendien vaak op net andere manier genomen dan op de andere afdelingen. Het algoritme herkent dit patroon; andere achtergrond, positie etc. Het algoritme moet dus leren om het afdeling-specifieke patroon over te slaan. Pas dan is het echt nuttig in het vinden van botbreuken.

Inzicht

Welk inzicht levert dit op?

Om de toegevoegde waarde van een zelflerend algoritme in te schatten, is het nuttig om te vragen naar hoe het getraind is. Explainable AI kan extra inzicht geven in het trainingsproces, waardoor de uitkomst van het algoritme betrouwbaarder wordt.

Lees meer over de vragen
Swipe
Maatschappij

Toeslag fraude

Pieter werkt bij de Belastingdienst. Hij moet beslissen wie recht heeft op kinderopvangtoeslag en wie niet. Hij laat zich daarbij leiden door een zelflerend algoritme. Welke vragen kan Pieter stellen om te controleren of de keuzes van het algoritme kloppen?

Vraag 1

Bron: waar komt de data vandaan?

Het zelflerend algoritme werd getraind op data uit 30.000 voorbeelddossiers. Een deel daarvan waren door ambtenaren behandelde dossiers waarvan was vastgesteld of ze ‘goed’ of ‘fout’ waren. Een ander deel van de dossiers kwam van een ‘zwarte lijst’ van potentiële fraudeurs. Daarmee werd een niet-representatieve risico-inschatting geïntroduceerd in het model; het werd getraind met dossiers waarvan deels onbekend was of ze ‘goed’ of ‘fout’ waren. Hierdoor ontstaat ‘selection-bias’. Wanneer zou de uitkomst van de risico-inschatting betrouwbaarder zijn geweest? Als het algoritme getraind zou zijn op representatieve voorbeelddossiers, waarvan gecheckt is of ze inderdaad ‘goed’ of ‘fout’ zijn.

Vraag 2

Analyse: wat wordt er met de data gedaan?

Het algoritme gebruikte criteria op basis van een lijst indicatoren, gekozen door werknemers van de afdeling. Helaas kunnen op die manier menselijke vooroordelen doorgezet worden in het algoritme. Zo werden de kenmerken Nederlander/niet-Nederlander en inkomen gezien als indicatoren voor fraude. Om dit soort vooringenomenheid tegen te gaan, moeten criteria voor selectie toetsbaar en openbaar zijn. Dit maakt ze niet automatisch perfect of objectief, maar biedt de mogelijkheid tot aanpassing en verbetering.

Vraag 3

Uitkomst: hoe worden bron en analyse gebruikt?

Bij de Toeslagenaffaire was er geen mechanisme om te controleren of de risico-inschatting voor fraude ook daadwerkelijk klopte. Daardoor werden jaar-in-jaar-uit duizenden mensen gedupeerd, zonder dat het systeem werd aangepast. Bij gebruik van zelflerende algoritmes dient de uitkomst altijd steekproefsgewijs getoetst te worden. Zodat de methode gecorrigeerd kan worden wanneer dat nodig is.

Inzicht

Welk inzicht levert dit op?

Algoritmes zijn een krachtig hulpmiddel om grote hoeveelheden data te analyseren. De uitkomsten moeten echter wel gecontroleerd kunnen worden. Door het stellen van de juiste vragen kunnen eventuele fouten voorkomen worden.

Lees meer over de vragen
Swipe
Maatschappij

Haattaal

Andor volgt verschillende sociale media en merkt dat opmerkingen soms gefilterd worden op basis van het taalgebruik. Hij is blij dat er aandacht is voor gedragsregels online, maar vraagt zich af hoe dit werkt. AI werkt goed voor taalherkenning, maar hoe beslist Facebook welk commentaar als haattaal wordt bestempeld en welke niet?

Vraag 1

Bron: waar komt de data vandaan?

Alles dat je post, deelt of schrijft op sociale media wordt opgeslagen als data. Recent hebben onderzoekers van Oxford en het Alan Turing Institute een database van 4000 voorbeelden gemaakt. De database is wereldwijd voor iedereen beschikbaar: Hatecheck. Deze dataset is ontwikkeld door een combinatie van 29 verschillende testen en handmatig vast te stellen of iets geclassificeerd wordt als haattaal of niet.

Vraag 2

Analyse: wat wordt er met de data gedaan?

De onderzoekers hebben werknemers van 16 verschillende non-profit organisaties die werken aan online haattaal geïnterviewd. Op basis van deze interviews zijn 18 verschillende typen geschreven Engelse haattaal gedefinieerd, inclusief denigrerende en bedreigende taal. Daarnaast werden 11 scenario’s gedefinieerd die AI kunnen misleiden. Denk aan vulgaire woorden in onschuldige uitspraken of gebruik van beledigende taal in protestberichten, zogenaamde ‘counter-speech’.

Vraag 3

Uitkomst: hoe worden bron en analyse gebruikt?

De criteria werden getest op drie commerciële diensten die ‘content-moderation’ gebruiken en reacties van hun lezerspubliek verzamelen. Een van de conclusies was dat haatspraakdetectie door AI nog veel uitdagingen kent. Als je te weinig modereert los je het probleem van online discriminatie en intimidatie niet op. Als je te veel modereert zou je het soort taal kunnen censureren dat gemarginaliseerde groepen gebruiken om zichzelf te versterken en te verdedigen.

Inzicht

Welk inzicht levert dit op?

Het is moeilijk voor AI om nuances in taal te identificeren en de context en intonatie van woorden te herkennen. De scheidslijn tussen censuur van haattaal en bescherming van onderdrukte groepen is heel smal.

Lees meer over de vragen
Swipe
Maatschappij

Taxi app

Taxichauffeur Mike vindt het soms best een gek idee. Zijn werkdag wordt niet ingedeeld door zijn werkgever, maar door een algoritme dat hem zo efficiënt mogelijk van klant naar klant stuurt. Welke criteria gebruikt het algoritme in de taxi app eigenlijk om zijn ritten te plannen? En wat kan hij doen als hij daar verandering in wil brengen?

Vraag 1

Bron: waar komen de data vandaan?

Taxi apps verzamelen dagelijks duizenden gegevens. Zowel chauffeurs als klanten delen via de app hun locatie- en verplaatsingsgegevens. Het systeem weet waar een chauffeur is. Maar ook wat de afstand van de laatste klant naar een potentiële nieuwe klant is. Alles wordt gebruikt om vraag en aanbod zo snel mogelijk aan te laten sluiten.

Vraag 2

Analyse: wat wordt er met de data gedaan?

De taxi app gebruikt een algoritme waarbij chauffeurs zo snel mogelijk van de ene naar andere rit overgaan. De verwachte tijd voor de huidige rit wordt berekend en de verwachte aankomst voor de volgende wordt alvast doorgegeven. Er worden dus keuzes gemaakt door het algoritme bij het selecteren van de ritten. Met voldoende tijd om de volgende te halen, maar niet zo veel dat de chauffeur staat te ‘niksen’. De aanname is hierbij dat zowel klant als chauffeur zo kort mogelijk willen wachten.

Vraag 3

Uitkomst: hoe worden bron en analyse gebruikt?

Het algoritme is zo ingesteld dat het optimaliseert op het inplannen van zo veel mogelijk ritten. Chauffeurs hoeven op deze manier zelf geen tijd te besteden aan het vinden van nieuwe ritten. In theorie kunnen zij zoveel mogelijk geld verdienen en onafgebroken en lang doorwerken. In de praktijk kunnen chauffeurs een grote druk ervaren, doordat ze continu opgeroepen worden. Het algoritme zou ook zo ingesteld kunnen worden dat de chauffeurs meer pauzes nemen. Hierdoor hebben zij betere arbeidsomstandigheden.

Inzicht

Welk inzicht levert dit op?

Apps van taxibedrijven maken op indrukwekkende manier gebruik van data om efficiënt taxivervoer te plannen. Het algoritme kan ingesteld worden om chauffeurs zo veel mogelijk ritten te laten maken. Het kan ook aangepast worden om voldoende pauzes te waarborgen en overwerking tegen te gaan.

Lees meer over de vragen
Swipe

Wat zijn algoritmes en AI?

Algoritmes en AI kom je vaak tegen. Wat betekenen ze precies? De belangrijkste begrippen op een rijtje.

Lees verder

Waarom moet ik er iets mee?

Je kunt niet meer om AI heen. Als je meer inzicht hebt, kun je betere beslissingen nemen.

Lees verder

Welke vragen kan ik stellen?

Inzicht krijgen begint met vragen stellen. Maar waar begin je? Wij helpen je op weg.

Lees verder