Wine Quality Dataset

Dataset Overview

This dataset comprises information on red and white variants of Cinsault Wine. It includes physicochemical (inputs) and sensory (output) variables, omitting details like grape types and brand due to privacy concerns. The dataset is suitable for classification or regression tasks, with unbalanced classes. Refer to [Cortez et al., 2009] for more details.

Tips and Usage

Consider setting a quality cutoff to distinguish 'good' and 'not good' wines.
Experiment with hyperparameter tuning using decision trees and evaluate the AUC value.
KNIME GUI is recommended for analysis.

Implementation Steps

Utilize File Reader for EDA.
Apply Rule Engine Node for classification.
Use Column Filter Node to prevent data leakage.
Partition data for train/test split.
Connect nodes for decision tree modeling.
Evaluate model performance using ROC analysis.

Acknowledgements

This dataset is sourced from UCI ML repository. Please cite [Cortez et al., 2009] if using this database.

Publication

[Cortez et al., 2009] "Modeling wine preferences by data mining from physicochemical properties" in Decision Support Systems, Elsevier, 47(4):547-553.

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
README.md		README.md
redwinedecisiontree.ipynb		redwinedecisiontree.ipynb
redwinequality.ipynb		redwinequality.ipynb
winequality-red.csv		winequality-red.csv

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Wine Quality Dataset

Dataset Overview

Contents

Tips and Usage

Implementation Steps

Acknowledgements

Publication

About

Releases

Packages

Languages

robmesseng/Wine_classification

Folders and files

Latest commit

History

Repository files navigation

Wine Quality Dataset

Dataset Overview

Contents

Tips and Usage

Implementation Steps

Acknowledgements

Publication

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages