Exercice 3.1 : Tracé d’une fonction
- Définissons une grille de variation pour x puis traçons la courbe sinus:
x <- seq(0,2*pi,length=1000)
plot(sin(x)~x,type="l")
- Pour rajouter le titre, on utilise la fonction title (on aurait pu directement utiliser l’argument main dans la fonction plot):
Exercice 3.2 : Comparaison de distributions
- Pour tracer une loi normale, il suffit de tracer la densité en utilisant la fonction dnorm. On peut ensuite améliorer le graphique en traçant l’axe des abscisses puis un segment entre 0 et le maximum de la loi normale:
plot(dnorm,-4,4)
abline(h=0)
segments(0,0,0,dnorm(0),lty=2)
- Pour tracer de nouvelles courbes nous utilisons la fonction curve avec l’argument add=TRUE. Pour différencier les courbes, on utilise une couleur différentes pour chaque distribution.
curve(dt(x,5),add=TRUE,col=2)
curve(dt(x,30),add=TRUE,col=3)
- Il suffit d’utiliser la fonction legend et de la positionner en haut à gauche:
Exercice 3.3 : Tracé de points
- L’importation et la construction du nuage de points sont immédiates:
ozone <- read.table("https://r-stat-sc-donnees.github.io/ozone.txt",header=TRUE)
plot(maxO3~T12,data=ozone)
- Pour relier les points, il suffit d’utiliser l’argument type=“l”; ce graphe n’est pas lisible car il faut préalablement trier les données par abscisses croissantes.
- C’est ce que permet la fonction order:
Exercice 3.4 : Loi des grands nombres
- On crée un vecteur \(X\) de longueur 1000:
- La fonction cumsum permet de construire un vecteur de sommes cumulées:
Le graphique obtenu illustre la loi des grands nombres.
Exercice 3.5 : Théorème central limite
- S_N suit une loi binomiale de paramètres N et p, de moyenne N p* et d’écart-type racine(Np/(1-p)*.
- On fixe la graine du générateur aléatoire avant de simuler un vecteur de 1000 réalisations d’une loi binomiale de paramètres N et p :
- Afin de dessiner la courbe de la loi normale centrée-réduite, on crée une grille de \(x\) variant entre -4 et 4. On découpe alors la fenêtre graphique en 1 ligne et 3 colonnes puis on trace un histogramme et on superpose la courbe de la loi normale.
Exercice 3.6 : Tracé des taches solaires
- Le séparateur de décimale est ici la virgule, ce qu’il est important de préciser, sinon la variable nbe_tach est considérée comme qualitative.
- Créons la variable qualitative trenteans:
- Vérifions que les couleurs citées appartiennent bien à la palette de couleur
- Pour tracer la série chronologique de la figure, on construit d’abord le graphe sans courbe et sans point (argument type=“n”) ce qui permet de définir les plages de variation de x et y ainsi que les libellés des axes. On dessine alors les morceaux de courbe un par un en changeant de couleur à chaque modalité de trenteans:
Exercice 3.7 : Tracé d’une densité
- Pour tracer la courbe de la loi normale, on définit d’abord l’intervalle de variation de x:
x <- seq(-3.5,3.5,length=1000)
plot(x,dnorm(x),type="l",ylab="Densité")
- Pour tracer une droite horizontale, on utilise abline et l’argument h:
abline(h=0)
- à 5. Pour les questions 3 à 5, on utilise les fonctions polygon, arrows et text. Pour pouvoir écrire des mathématiques avec la fonction text, on utilise expression:
Exercice 3.8 : Plusieurs graphiques
- Pour générer le graphique, on est amené à redéfinir les marges de chaque graphique à l’aide de la fonction par. On utilise également la fonction layout pour définir la disposition des trois graphiques:
- L’argument widths de layout permet de préciser la largeur de chaque colonne:
Exercice 3.9 : Nombre d’étudiants par ville universitaire
- L’importation avec séparateur ; la classe et le résumé sont donnés par:
- Le vecteur decoupe est créé avec
- Le découpage est obtenu avec la fonction cut en incluant les extrêmes:
- Le changement des modalités est effectué par:
- Après avoir chargé le package ggmap, la bounding box est obtenue avec
- La variable qualitative Xq est ajoutée à villes:
- Le téléchargement s’effectue simplement:
- Le tracé est alors (en enlevant la légende automatique pour “size” avec la fonction guides)
Exercice 3.10 : Chômage et élection régionale
- L’importation utilise la fonction read_sf du package sf et importe le contenu du répertoire grâce à:
- Le graphique (pour la première variable) est simplement
- Le résumé et la classe sont obtenues par
- Le résumé pécédent nous a affiché les noms de variables et nous pouvons lire que la variable NOM contient le nom des région et son contenu s’affiche bien avec
La première variable NOM donne l’intitulé de la région, la seconde son code. 5. Le graphique s’obtient comme suit:
- La région correspondante, le Limousin, est donnée par
- Nous sélectionnons dans l’objet regions les lignes qui correspondent à une valeur pour la variable NOM d’Alsace grâce à filter et nous traçons:
- L’importation se fait avec read_delim du package readr qui importe directement au format tibble:
Nous créons une variable de type caractère NUMERO et supprimons la variable CODGEO avec:
- Nous fusionnons selon NUMERO:
- Le graphique qui colorie par ordre décroissant (signe “-”) selon le taux de chômage 2011 est obtenu avec:
- La variable Majorite est ajoutee au tibble chomtot avec
Remarquons que les niveaux (et l’ordre) des facteurs est contrôlé avec l’argument levels de la fonction factor. Ensuite le graphique est obtenu par
Exercice 3.11 : Représentation graphique et projection
- Le package est chargé puis la carte est tracée avec la fonction map:
- L’objet de type map est en suite transformé en type sfc
- Transformons le en sfc
- Il est ensuite représenté:
- La projection en polyconique puis le graphique:
Exercice 3.12 : Représentation de tuiles
- Trouvons les coordonnées avec la projection de Mercator (à la main):
- Arrondissons pour trouver xtile et ytile
- Téléchargeons la tuile:
- dans un premier temps composons l’URL
- dans un second temps téléchargeons l’image
- dans un troisième temps importons l’image PNG dans R et transformons l’objet importé en type raster
- Changement de classe et premiers attributs declasse ggmap
- Dernier attribut de la classe ggmap: la bounding box, l’attribut bb
- programmons une fonction pour calculer la longitude latitude depuis les coordonnées de Mercator
- les 4 bords de la tuiles (en coordonnées de Mercator) sont obtenus en partant du bord xtile ytile (en bas à gauche) et en ajoutant 1 ou pas
- en utilisant la fonction lonlat transformons les 4 bords de Mercator vers lon/lat et calculons la bounding box
- ajustons le resultat au bon format: data-frame avec noms adequats dans le bon ordre et le tout devient l’attribut bb
- Trace de la tuile qui est maintenant au bon format
- Plusieurs tuiles: Le départ est identique
Le télechargement de plusieurs tuiles autour (2 couronnes d’où le vecteurs de -2 à +2)
L’agencement de ces tuiles (256x256) en une seule matrice raster
Les attributs basiques et la classe ggmap
Le calcul de la bounding box (en réutilisant la fonction lonlat du 5.a)
Le graphique final
