Ingestão de dados JSON com o pandas
Ao desenvolver um pipeline de dados, você pode ter que trabalhar com dados não tabulares e fontes de dados, como APIs ou arquivos JSON. Neste exercício, vamos praticar a extração de dados de um arquivo JSON usando pandas.
pandas foi importado como pd, e o arquivo JSON que você vai ingerir está armazenado no caminho "testing_scores.json".
Este exercício faz parte do curso
ETL e ELT em Python
Instruções do exercício
- Atualize a função
extract()para ler um arquivo JSON em um DataFramepandas, orientando por registros. - Passe o caminho
testing_scores.jsonpara a funçãoextract()e armazene a saída em uma variável chamadaraw_testing_scores. - Imprima a parte superior do DataFrame
raw_testing_scores.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
def extract(file_path):
# Read the JSON file into a DataFrame
return pd.____(____, orient="____")
# Call the extract function with the appropriate path, assign to raw_testing_scores
____
# Output the head of the DataFrame
print(raw_testing_scores.____())