Transformar y limpiar DataFrames
Una vez que los datos se han curado en una estructura de datos Python limpia, como una lista de listas, es fácil convertirla en un DataFrame pandas. Practicarás haciendo esto con los datos que se curaron en el último ejercicio.
Como de costumbre, pandas se ha importado como pd, y la variable normalized_testing_scores almacena la lista de datos de las pruebas de cada escuela, como se muestra a continuación.
[
['01M539', '111 Columbia Street', 'Manhattan', 657.0, 601.0, 601.0],
...
]
Este ejercicio forma parte del curso
ETL y ELT en Python
Instrucciones del ejercicio
- Crea un DataFrame
pandasa partir de la lista de listas almacenadas en la variablenormalized_testing_scores. - Establece los nombres de las columnas del DataFrame
normalized_data.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Create a DataFrame from the normalized_testing_scores list
normalized_data = ____(normalized_testing_scores)
# Set the column names
normalized_data.____ = ["school_id", "street_address", "city", "avg_score_math", "avg_score_reading", "avg_score_writing"]
normalized_data = normalized_data.set_index("school_id")
print(normalized_data.head())