Skip to content

Commit

Permalink
Maatregel data kwaliteit (#274)
Browse files Browse the repository at this point in the history
  • Loading branch information
ruthkoole authored Sep 23, 2024
1 parent 62ce4c4 commit 96858ab
Showing 1 changed file with 69 additions and 0 deletions.
69 changes: 69 additions & 0 deletions docs/maatregelen/datakwaliteit.md
Original file line number Diff line number Diff line change
@@ -0,0 +1,69 @@
---
title: Data is van voldoende kwaliteit
toelichting: Stel vast of de gebruikte data van voldoende kwaliteit is voor de beoogde toepassing.
vereiste:
- juistheid_en_actualiteit_van_persoonsgegevens
- kwaliteitscriteria_voor_data
levenscyclus:
- dataverkenning-en-datapreparatie
onderwerp:
- data
rollen:
- data-scientist
- data-engineer
hide:
- navigation
---

<!-- tags -->

## Maatregel
Stel vast of de gebruikte data van voldoende kwaliteit is voor de beoogde toepassing.

## Toelichting
- Stel functionele eisen voor de data kwaliteit vast en analyseer structureel of er aan deze eisen wordt voldaan.
- De kwaliteit van de data die als input voor het algoritme wordt gebruikt is bepalend voor de uitkomsten van het algoritme. Hier wordt soms ook naar gerefereerd als *garbage in = garbage out*.
- Een vraag die gesteld dient te worden: beschrijft de data het fenomeen dat onderzocht dient te worden?
- Het [Raamwerk gegevenskwaliteit](https://www.noraonline.nl/wiki/Raamwerk_gegevenskwaliteit) bevat een breed toepasbare set van kwaliteitsdimensies:

- juistheid
- compleetheid
- validiteit
- consistentie
- actualiteit
- precisie
- plausibiliteit
- traceerbaarheid
- begrijpelijkheid

Deze dimensies zijn aangevuld met [kwaliteitsattributen](https://www.noraonline.nl/wiki/Raamwerk_gegevenskwaliteit/Kwaliteitsattributen) welke gebruikt kunnen worden om de verschillende dimensies meetbaar te maken.

- De vraag of de data kwaliteit voldoende is hangt sterk samen met de vraag of er bias in de onderliggende data zit. Analyseer daarom ook welke bias en aannames er besloten zijn in de onderliggende data. Denk hierbij onder andere aan de volgende vormen van bias:

- [historische bias](../onderwerpen/bias-en-non-discriminatie/index.md#verschillende-vormen-van-bias)
- [meetbias](../onderwerpen/bias-en-non-discriminatie/index.md#verschillende-vormen-van-bias)
- [representatie bias](../onderwerpen/bias-en-non-discriminatie/index.md#verschillende-vormen-van-bias)

!!! note "Let op!"

Wanneer je een algoritme inkoopt en de ontwikkeling van het algoritme uitbesteedt aan een derde partij, houdt er dan dan rekening mee dat data traceerbaar en reproduceerbaar moet zijn. Maak hier heldere afspraken over met de aanbieder.

## Bijbehorende vereiste(n)

<!-- list_vereisten_on_maatregelen_page -->

## Risico
- Door onjuiste beslissingen van gegevens kunnen verkeerde beslissingen genomen worden.
- Het model creëert onwenselijke systematische afwijking voor specifieke personen, groepen of andere eenheden. Dit kan leiden tot ongelijke behandeling en discriminerende effecten met eventuele schade voor betrokkenen.

## Bronnen
- [Onderzoekskader Algoritmes Auditdienst Rijk, DM.9, DM.19](https://www.rijksoverheid.nl/documenten/rapporten/2023/07/11/onderzoekskader-algoritmes-adr-2023)
- [Toetsingskader Algoritmes, Algemene Rekenkamder, 2.18](https://www.rekenkamer.nl/onderwerpen/algoritmes/documenten/publicaties/2024/05/15/het-toetsingskader-aan-de-slag)
- [NORA, Raamwerk gegevenskwaliteit](https://www.noraonline.nl/wiki/Raamwerk_gegevenskwaliteit)
- [Impact Assessment Mensenrechten en Algoritmes, 2A.2.2](../instrumenten/IAMA.md)
- [Handreiking non-discriminatie by design](https://www.rijksoverheid.nl/documenten/rapporten/2021/06/10/handreiking-non-discriminatie-by-design)

## Voorbeeld

Heb jij een goed voorbeeld? Laat het ons weten!

0 comments on commit 96858ab

Please sign in to comment.