Gestione delle Tabelle
Trattiamo gli spreadsheet come quaderni di laboratorio:
Gli umani capiscono, i computer no!
Le regole cardinali:
Dataset reale usato in 100+ pubblicazioni:
Durante il corso useremo un subset semplificato di questo dataset per gli esercizi
Buone pratiche:
Scarica i dati:
Attività:
❌ Non create tabelle multiple in un foglio
Il computer vede ogni riga come un’osservazione unica e si confonde con associazioni false
✅ Una tabella per foglio, colonne coerenti
❌ Un tab per ogni giorno/condizione
Problemi:
✅ Aggiungere una colonna “data” o “condizione”
Differenza importante:
❌ Lasciare celle vuote per gli zeri
✅ Scrivere sempre 0 quando il valore è zero
Valori problematici per dati mancanti:
❌ -999, 0, “N/A”, “missing”, “-”
Soluzioni consigliate:
✅ Celle vuote (migliore per la maggior parte dei software)
✅ NA (per R)
❌ Usare colori/grassetti per trasmettere informazioni
❌ Celle unite
❌ Righe vuote per separare sezioni
✅ Creare una nuova colonna con l’informazione codificata
❌ Commenti nelle celle dati
❌ Unità nelle celle (es. “25 kg”)
✅ Colonna separata per commenti
✅ Unità nei nomi delle colonne (es. “peso_kg”)
Buone pratiche:
✅ Descrittivi ma concisi
✅ Nessuno spazio (usare _)
✅ Nessun carattere speciale
✅ Non iniziare con numeri
✅ Includere unità (es. temp_C, peso_kg)
| Buono | Buona Alternativa | Da evitare |
|---|---|---|
| Max_temp_C | MaxTemp | Maximum Temp (°C) |
| Precipitation_mm | Precipitation | precmm |
| Mean_year_growth | MeanYearGrowth | Mean growth/year |
| cell_type | CellType | Cell Type |
❌ Evitare:
✅ Trattare le celle come semplici form di testo
Metadata = dati sui dati
❌ Non includere legenda/note nel file dati
✅ File separato (es. README.txt)
Riferimenti:
Dati per l’esercizio disponibili nella cartella data/

REVELO Training - Data Viz 2025