Ga direct naar inhoud

Algoritme als containerbegrip: waar hebben we het nu eigenlijk over?

Capgemini
2021-08-25

In dit blog voorzien wij het containerbegrip algoritme van de broodnodige context, zonder te vervallen in technische specificaties.

Een algoritme is een stappenplan om van input tot output te komen. Een algoritme kan berekenen hoe hoog een hypotheek mag zijn (input: het inkomen van de aanvrager) of hoe je een appeltaart bakt (input: appels, boter, suiker, etc.). In dit blog richten we ons op algoritmes die door een computer kunnen worden uitgevoerd. Om inzichtelijk te maken hoe en waarvoor deze algoritmes ingezet kunnen worden binnen een organisatie, zal de Nederlandse woningmarkt constant als voorbeeld worden gebruikt.

Een algoritme is opgebouwd uit vier onderscheidende eigenschappen (zie Figuur 1).

Figuur 1: Een overzicht van de eigenschappen voor een algoritme.
 Figuur 1: Een overzicht van de eigenschappen voor een algoritme.

Eigenschap 1: beschrijvend, diagnostisch, voorspellend of voorschrijvend

Er zijn vier soorten analyseniveaus waarin een algoritme kan worden ingezet om vragen te beantwoorden (zie Figuur 2). Beschrijvende en diagnostische algoritmes helpen een situatie te begrijpen door inzicht te geven in wat er gebeurd is en waarom; ze kijken naar het verleden. Voorspellende en voorschrijvende algoritmes geven de gebruiker inzicht in wat kan of moet gebeuren, door verschillende mogelijkheden te vergelijken en te kiezen voor de beste uitkomst.

de vier soorten data-analyse
Figuur 2: de vier soorten data-analyse [1]

Beschrijvende algoritmes geven antwoord op de vraag: wat is er gebeurd? Zo kan een beschrijvend algoritme bijvoorbeeld inzicht geven in de historische prijsontwikkeling op de Nederlandse woningmarkt.  Het doel van een diagnostisch algoritme is te begrijpen waarom iets is gebeurd. Bijvoorbeeld hoe het huidige woningmarktbeleid door een lage hypotheekrente en schaarste impact heeft op de kansen van starters in de Randstad. Een voorspellend algoritme, dat een verwachting afgeeft of waarschijnlijkheid van een toekomstige gebeurtenis, heeft de potentie om bijvoorbeeld te voorspellen wat het ideale bod op een beschikbaar huis is. En in het Verenigd Koninkrijk heeft de woningbouwminister geprobeerd om het woningtekort op te lossen door het planningsysteem te versimpelen door een voorschrijvend huizenalgoritme in te zetten dat bepaalt waar in het land extra huizen gebouwd moeten worden.

Vaak overlappen deze data-analyses. Een goed voorspellend algoritme kan niet zonder een gedegen analyse waarom iets is gebeurd (diagnostisch). En een data-analyse die tot een voorschrijvende uitkomst leidt, zal als het ware ‘voortbouwen’ op wat er in een beschrijvende, diagnostische en eventueel voorspellende analyse al is verwezenlijkt. In de regel geldt daarbij: naarmate de data-analyses complexer worden, en meer naar voorschrijvend opschuiven, des te meer waarde organisaties uit deze data kunnen halen. Overigens is het niet altijd zo dat een voorschrijvend algoritme complexer is of meer waarde heeft. Neem bijvoorbeeld een algoritme dat voor elk huis in Amsterdam een verkoopprijs van een miljoen euro voorspelt: simpel, maar dit heeft niet echt een toegevoegde waarde.

Eigenschap 2: informerend, adviserend of beslissend

De tweede relevante vraag is hoe autonoom het algoritme wordt ingezet. Bij beschrijvende, diagnostische en voorspellende data-analyses is er sprake van een menselijke tussenkomst. Dit betekent dat er altijd een handeling volgt op de uitkomst van het gebruikte algoritme. Bij een voorschrijvend algoritme hoeft dit echter niet het geval te zijn, omdat de uitkomst een beslissing of actie kan dicteren óf uitvoeren. Het volgende onderscheid in de rol, en daarmee de impact van het algoritme, is hierbij relevant:

  • Informerend: het algoritme geeft informatie over een proces. De gebruiker van (de uitkomsten van) het algoritme kan deze informatie gebruiken om een beslissing te nemen. Beschrijvende, diagnostische en voorspellende algoritmes zijn altijd informerend, omdat ze nog geen invulling geven aan de vervolgacties.
  • Adviserend: het algoritme beveelt een of meerdere acties aan. Een huizenvoorbeeld is, vergelijkend met de ‘Aanbevolen voor jou’-optie van Netflix, om op basis van zoekgedrag specifieke opties aan huizen voor te stellen in een postcodegebied dat bij jou zouden kunnen passen.
  • Beslissend: het algoritme neemt besluiten zonder verdere menselijke tussenkomst. Het algoritme opereert dus autonoom. Geautomatiseerde hypotheeksoftware, die op basis van documenten zoals salarisstroken, bankafschriften of een postcodegebied bepaalt of een lening wordt verleend aan een persoon, zou een voorbeeld kunnen zijn van een beslissend algoritme. De impact van zo’n beslissend algoritme is wel direct duidelijk: als het algoritme een fout maakt kan dat ertoe leiden dat mensen ten onrechte een hypotheek wordt ontnomen.

In het kort: de grootte van de rol, de invloed en de (mate van) autonomie van het gebruikte algoritme is, bepaalt welke impact de data-analyse op een beslissing of actie kan hebben.

Figuur 3: de vier soorten data-analyse kunnen met/zonder menselijke tussenkomst worden ingezet om inzichten te verwerven en besluiten/acties te nemen [2]

Eigenschap 3: rule-based of case-based (zelflerend)

De methodes om tot een bepaalde analyse te komen, zijn grofweg te verdelen in rule-based algoritmes en case-based algoritmes. In de eerste categorie vallen algoritmes die bepaalde, door mensen opgestelde regels volgen om tot een bepaalde conclusie te komen. Dit kan zo simpel zijn als één regel of zo complex als duizenden op elkaar volgende regels. In ieder geval is het bij regelbepaalde algoritmes mogelijk te achterhalen hoe het algoritme tot een uitkomst is gekomen (zie Figuur 4). Bij case-based algoritmes werkt het precies andersom: algoritmes leiden hun ‘eigen regels’ af uit bestaande casussen en data om tot een beslissing of voorspelling te komen (zie Figuur 5).

Een risico bij deze case-based algoritmes is dat het black boxes kunnen zijn, dat wil zeggen dat niet te achterhalen valt waarom het algoritme een specifieke uitkomst heeft. Het gebrek aan transparantie betekent niet dat zelflerende algoritmes moeten worden afgezworen. Wel noopt het tot het doen van grondig onderzoek naar eventuele risico’s die gepaard gaan met een gebrek aan transparantie.

Figuur 4: Een voorbeeld van een rule-based huizenalgoritme dat de gemiddelde prijs berekent over 100 huizen (in pseudocode).
Figuur 4: Een voorbeeld van een rule-based huizenalgoritme dat de gemiddelde prijs berekent over 100 huizen (in pseudocode).
Figuur 5: Dit case-based algoritme leert op basis van verschillende plaatjes van huizen welke eigenschappen een trapgevel heeft
Figuur 5: Dit case-based algoritme leert op basis van verschillende plaatjes van huizen welke eigenschappen een trapgevel heeft

Eigenschap 4: prioriteren, classificeren, associëren of filteren

Als laatste vraag is het van belang om te kijken welke taak, of combinatie aan taken, kan worden uitgevoerd om tot een bepaald inzicht te komen. Met andere woorden: Wat is de functie van het algoritme? Hannah Fry noemt in haar boek Algoritmes aan de macht vier van zulke functies:

  • Prioriteren, ofwel het maken van een rangschikking. Een voorbeeld is het maken van een lijst met alle huizen op de markt, gerangschikt van het huis dat het best bij de gebruiker past tot het huis dat het minst goed bij de gebruiker past.
  • Classificeren, ofwel het indelen in categorieën. Een voorbeeld is een algoritme dat op basis van foto’s herkent of huizen een tuin hebben en vervolgens de huizen onderverdeelt in huizen met tuin en huizen zonder tuin.
  • Associëren, ofwel het leggen van verbindingen. Een voorbeeld is een algoritme dat op basis van eerdere bezichtigingen, huizen aanraadt die lijken op de bezichtigde huizen.
  • Filteren, ofwel het toevoegen of weglaten van relevante informatie. Voor huizenkopers is het bijvoorbeeld wel relevant of hoe groot de tuin is, maar hoeft de koper niet te weten of er narcissen of orchideeën in de tuin staan.

Deze categorieën zijn niet uitputtend, maar geven wel een goed beeld van de verschillende taken die algoritmes kunnen volbrengen. Overigens kan een algoritme ook meerdere doelstellingen hebben: soms zul je eerst iets willen classificeren, voordat je gaat prioriteren.

Conclusie

Om grip te krijgen op algoritmes is het cruciaal om eerst een geschikt gezamenlijk vocabulaire te construeren. Deze vier eigenschappen zijn hierbij van belang: ten eerste is relevant of het algoritme beschrijvend, diagnostisch, voorspellend of voorschrijvend is; ten tweede, of het algoritme een informerende, adviserende of beslissende rol heeft; ten derde of het algoritme rule-based of case-based is; en tot slot wat de functie van het algoritme is. Verschillende typen algoritmes dragen – door hun impact op beslissing en uitkomst – verschillende risico’s met zich mee voor een organisatie. Pas als men de inhoud van het containerbegrip algoritme begrijpt, kan een geïnformeerde discussie binnen de organisatie worden gestart.

Auteurs

[1] Bron: 4 types of Data Analytics, Principa, januari 2017
[2] Bron: Four Types of Analytics Capability, Gartner, oktober 2014