-
Notifications
You must be signed in to change notification settings - Fork 4
/
02-présentation-du-package-ggplot2.Rmd
43 lines (27 loc) · 2.38 KB
/
02-présentation-du-package-ggplot2.Rmd
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
# (PART) Créer des graphiques sous R avec ggplot 2 {-}
# Package ggplot2
## Présentation de ggplot2
- [ggplot2](http://ggplot2.tidyverse.org/) est un package créé par Hadley Wickham et Winston Chang pour implémenter dans R la vision développée par Leland Wilkinson dans [The Grammar of Graphics (Statistics and Computing)](https://www.amazon.com/Grammar-Graphics-Statistics-Computing/dp/0387245448/ref=as_li_ss_tl?ie=UTF8&qid=1477928463&sr=8-1&keywords=the+grammar+of+graphics&linkCode=sl1&tag=ggplot2-20&linkId=f0130e557161b83fbe97ba0e9175c431) de la conception de graphiques.
- Le but est de fournir une approche unique pour produire quasiment **toute valorisation graphique** de données que l'on peut trouver dans des revues scientifiques, les journaux, dans l'analyse statistique ou la data visualisation.
- Ce package s'inscrit aujourd'hui dans R par le **framework tidyverse** qui propose une approche cohérente entre l'importation et la préparation des données, leur analyse et leur valorisation.
## Le Tidyverse
![le tidyverse](images/tidyverse.png "le tidyverse"){#id .class width=800}
## Les concepts clefs
Pour construire un graphique avec ggplot2, il faut définir plusieurs éléments :
- **la donnée** : ggplot2 permet de travailler sur des vecteurs, des dataframes, des tibbles, ou des données spatiales ;
- le **mapping** : on définit dans l'aesthetic (ou aes) le **mapping**, c'est à dire la correspondance entre éléments visuels et les variables. C'est dans l'aesthetic (ou aes) qu'est déclaré que l’on veut représenter qui **dépend des variables** (quelle variable sur l'axe x, sur l'axe y, quelle variable pour définir une graduation de couleurs...) ;
- les **paramètres** : on définit les autres paramètres qui dépendent de constantes (par exemple : je veux que toutes mes lignes soient rouge ou de taille 2 pixels) ;
- le **layer ("forme géométrique")** : on définit sous quelle représentation graphique on représente les paramètres précédents. Sous `ggplot`, ces fonctions sont de la forme `geom_XX` ;
L'écriture type d'un graphique est donc:
```
ggplot(data = <DATA>) +
<FORME_GEO>(mapping = aes(<MAPPINGS>),...=<PARAMS>)
```
On va ensuite pouvoir enrichir avec des fonctions supplémentaires.
Chaque fonction s'enchaine avec des `+` comme les pipe.
```
ggplot(data = <DATA>) +
<FORME_GEO>(mapping = aes(<MAPPINGS>),...=<PARAMS>)+
<FONCTION1>+
...
```