Esercizio Titanic#1 – Difficoltà: bassa
In questo esercizio ti chiedo di importare in Excel dei dati salvati in un file con estensione .csv e di eseguire alcune verifiche sulla correttezza delle informazioni.
I dati su cui lavoriamo sono stati scaricati da Kaggle.com, un noto sito dedicato al Machine Learning (https://www.kaggle.com/c/titanic/data) e sono stati poi elaborati in modo funzionale all’esercizio.
DATI DI PARTENZA: A questo link puoi scaricare il file .csv con i dati su cui svolgere l’esercizio.
Di seguito le domande a cui ti chiedo di dare risposta.
DOMANDE ESERCIZIO:
- Apri il file .csv
- Se tutti i dati ti vengono inseriti nella colonna A, devi fare in modo che ogni informazione venga mostrata su una colonna dedicata. Devi in sostanza far sì che i dati abbiano la classica struttura di un file Excel.
- Salva il file con formato ‘.xlsx e con nome ‘Esercizio Excel – Titanic #1 – soluzioni”.
- Cambia il nome del foglio rinominandolo in ‘Titanic’.
- Controlla ed elimina eventuali righe duplicate (righe con lo stesso valore su tutte le colonne).
- Colonna ‘PassengerId’: controlla se ci sono codici passeggero duplicati ed eventualmente verifica quanti sono.
- Colonna ‘Sex’: verifica che gli unici due valori della colonna del genere siano ‘male’ e ‘female’.
- Colonna ‘Age’: nella colonna contenente l’età dei passeggeri ci sono valori ‘anomali’? Controlla le prime celle nel modo più semplice che conosci.
- Elimina la colonna ‘Cabin’.
- Colonna ‘Embarked’: controlla che i valori della colonna siano S, C oppure Q, sigle che rappresentano i 3 porti da cui si sono imbarcati i passeggeri.
- Salva il file (potrai utilizzarlo per svolgere l’esercizio successivo Titanic#2).
SOLUZIONI ESERCIZIO: a questo link puoi scaricare il file con le soluzioni.
Buon lavoro! 🙂