Importazione dati

Esercizio Titanic#1 – Difficoltà: bassa

In questo esercizio ti chiedo di importare in Excel dei dati salvati in un file con estensione .csv e di eseguire alcune verifiche sulla correttezza delle informazioni.

I dati su cui lavoriamo sono stati scaricati da Kaggle.com, un noto sito dedicato al Machine Learning (https://www.kaggle.com/c/titanic/data) e sono stati poi elaborati in modo funzionale all’esercizio.

DATI DI PARTENZA: A questo link puoi scaricare il file .csv con i dati su cui svolgere l’esercizio.

Di seguito le domande a cui ti chiedo di dare risposta.

DOMANDE ESERCIZIO:

  1. Apri il file .csv
  2. Se tutti i dati ti vengono inseriti nella colonna A, devi fare in modo che ogni informazione venga mostrata su una colonna dedicata. Devi in sostanza far sì che i dati abbiano la classica struttura di un file Excel.
  3. Salva il file con formato ‘.xlsx e con nome ‘Esercizio Excel – Titanic #1 – soluzioni”.
  4. Cambia il nome del foglio rinominandolo in ‘Titanic’.
  5. Controlla ed elimina eventuali righe duplicate (righe con lo stesso valore su tutte le colonne).
  6. Colonna ‘PassengerId’: controlla se ci sono codici passeggero duplicati ed eventualmente verifica quanti sono.
  7. Colonna ‘Sex’: verifica che gli unici due valori della colonna del genere siano ‘male’ e ‘female’.
  8. Colonna ‘Age’: nella colonna contenente l’età dei passeggeri ci sono valori ‘anomali’? Controlla le prime celle nel modo più semplice che conosci.
  9. Elimina la colonna ‘Cabin’.
  10. Colonna ‘Embarked’: controlla che i valori della colonna siano S, C oppure Q, sigle che rappresentano i 3 porti da cui si sono imbarcati i passeggeri.
  11. Salva il file (potrai utilizzarlo per svolgere l’esercizio successivo Titanic#2).

SOLUZIONI ESERCIZIO: a questo link puoi scaricare il file con le soluzioni.

Buon lavoro! 🙂