diff --git a/docs/levenscyclus/dataverkenning-en-datapreparatie.md b/docs/levenscyclus/dataverkenning-en-datapreparatie.md index 3bb7b63dce..8fe7c8d646 100644 --- a/docs/levenscyclus/dataverkenning-en-datapreparatie.md +++ b/docs/levenscyclus/dataverkenning-en-datapreparatie.md @@ -2,7 +2,18 @@ title: Dataverkenning en datapreparatie --- -In deze fase worden relevante datasets geidentificeerd en genaliseerd om inziichten te krijgen. Daarna worden de gegevens verzameld, gereinigd en voorbereid voor gebruik. +In deze fase worden relevante datasets geïdentificeerd, wanneer nodig verzameld, en geanalyseerd. Ook worden de gegevens opgeschoond en geschikt gemaakt. + +Het is van belang dat dataverzameling op de juiste manier gebeurd, en dat bestaande datasets die gebruikt gaan worden van goede kwaliteit zijn. Daarbij is het van belang dat opschoning van datasets (een standaard stap in het proces data science) geen nieuwe onvoorziene effecten met zich meebrengt. + +In de _gehele_ AI-levenscyclus is van belang: +- (Ethische) risico's zijn in kaart gebracht. +- De AI governance is duidelijk. (Wie in de organisatie gaat over naleven van AI-wetgeving.) +- Transparantie en navolgbaarheid van modellen en processen. + +Hieronder komen vereisten en maatregelen die relevant zijn tijdens deze fase in de levenscyclus: + +## Vereisten ## Maatregelen