Chargement de données dans une base de données Postgres
Une fois que les données ont été extraites d'un système source et transformées pour s'aligner sur les cas d'utilisation analytiques ou de reporting, il est temps de charger les données sur un support de stockage final. Le stockage des données nettoyées dans une base de données SQL facilite l'accès des consommateurs de données et l'exécution de requêtes. Dans cet exemple, vous vous entraînerez à charger des données nettoyées dans une base de données Postgres.
sqlalchemy a été importé, et pandas est disponible en tant que pd. Les premières lignes du DataFrame cleaned_testing_scores sont présentées ci-dessous :
street_address city math_score ... best_score
01M539 111 Columbia Street Manhattan 657.0 Math
02M545 350 Grand Street Manhattan 613.0 Math
01M292 220 Henry Street Manhattan 410.0 Math
Cet exercice fait partie du cours
ETL et ELT en Python
Instructions
- Mettez à jour la chaîne de connexion pour écrire dans la base de données
schoolset créez un objet de connexion en utilisantsqlalchemy. - Utilisez
pandaspour écrire le DataFramecleaned_testing_scoresdans le tableauscoresde la base de donnéesschools. - Si le tableau est déjà rempli de données, veillez à remplacer les valeurs par le DataFrame actuel.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Update the connection string, create the connection object to the schools database
db_engine = sqlalchemy.____("postgresql+psycopg2://repl:password@localhost:5432/____")
# Write the DataFrame to the scores table
cleaned_testing_scores.____(
name="____",
con=db_engine,
index=False,
if_exists="____"
)