Riepilogo Geometrie ed Estetiche
Oggi iniziamo con un riepilogo del Giorno 1
Cosa abbiamo visto:
Obiettivi di questo recap:
1. Relazioni (2 variabili continue)
geom_point() - scatter plotgeom_line() - time series (ordinato per x)geom_path() - traiettorie (ordine dati)geom_smooth() - trend lines2. Distribuzioni 1D
geom_histogram() - barre di frequenzageom_density() - curve smoothgeom_freqpoly() - histogram come lineageom_dotplot() - ogni punto visibile3. Distribuzioni 2D
geom_bin2d() - heatmap rettangolaregeom_hex() - heatmap esagonalegeom_density2d() - contour lines4. Statistiche Riassuntive
geom_boxplot() - mediana, quartili, outliersgeom_violin() - forma distribuzione completageom_bar() / geom_col() - conteggi/valori5. Incertezza
geom_errorbar(), geom_pointrange(), geom_ribbon()Cosa ricordare:
Ogni geom interpreta i dati in modo specifico
Si possono combinare più geom
Ogni geom ha parametri specifici
geom_histogram(): bins, binwidthgeom_smooth(): method, se, levelgeom_point(): size, shape, alphaRegola pratica
Inizia sempre con il geom più semplice, poi aggiungi complessità.
1. Color (bordi/linee)
2. Fill (riempimento aree)
color3. Size (dimensione)
MAPPING (dentro aes())
Proprietà dipende dai dati
✅ Crea scala automatica
✅ Genera legenda
✅ Usa nome variabile
Quando usare: - Vuoi che colore/size/etc. cambi con i dati - Vuoi distinguere gruppi - Hai bisogno di legenda
SETTING (fuori aes())
Proprietà fissa per tutti
ggplot(mpg, aes(x = displ, y = hwy)) +
geom_point(color = "blue", # FISSO
size = 3, # FISSO
alpha = 0.6) # FISSO❌ Nessuna scala
❌ Nessuna legenda
✅ Valore diretto
Quando usare: - Vuoi migliorare leggibilità - Stile costante per tutto il layer - Non servono legende
Errore più comune
aes(color = "blue") ❌ crea variabile chiamata “blue”!
Usa geom_point(color = "blue") ✅ per colore fisso.
Si possono combinare mapping e setting:
# Color mappato + size fisso + alpha fisso
ggplot(mpg, aes(x = displ, y = hwy, color = class)) +
geom_point(size = 3, alpha = 0.6)
# Multiple aesthetics mappate
ggplot(mpg, aes(x = displ, y = hwy,
color = class, # gruppi principali
shape = drv)) + # sottogruppi
geom_point(size = 3) # dimensione fissaLinee guida:
alpha, size fissiCOLOR = bordi, linee, punti
Spesso insieme:
Quando mappi un’estetica, ggplot2 crea automaticamente la scala appropriata:
Variabili Discrete:
→ scale_color_discrete() automatica
→ Colori distinti per categoria
→ Legenda con tutti i livelli
Variabili Continue:
→ scale_color_continuous() automatica
→ Gradient blu scuro → blu chiaro
→ Legenda con barra colore
Problema comune: troppi punti sovrapposti
Soluzioni imparate:
Alpha (trasparenza)
Jitter (rumore casuale)
Heatmaps 2D
Dimensione ridotta
Combinazioni
Temi comuni da chiarire:
geom_bar() vs geom_col()?geom_histogram()?geom_line() e geom_path()?Domande dal gruppo:
(Spazio per discussione)
Mattina:
facet_wrap() e facet_grid() - small multiplesPomeriggio:
Documentazione:
Cheat sheets:
Dataset per pratica:
mpg, diamonds, economics (già usati)mtcars, iris, faithful (altri built-in)Ricorda
La pratica è fondamentale! Continua a sperimentare con gli esercizi.

REVELO Training - Data Viz 2025