Ausführen einer ETL-Pipeline
Bist du bereit, deine erste ETL-Pipeline zu betreiben? Los geht’s!
Hier sind die Funktionen extract(), transform() und load() für dich definiert worden. Um diese Daten-ETL-Pipeline auszuführen, musst du jede dieser Funktionen ausführen. Wenn du neugierig bist, sieh dir an, wie die Funktion extract() aussieht.
def extract(file_name):
print(f"Extracting data from {file_name}")
return pd.read_csv(file_name)
Diese Übung ist Teil des Kurses
ETL und ELT in Python
Anleitung zur Übung
- Verwende die Funktion
extract(), um Daten aus der Dateiraw_data.csvzu extrahieren. - Transformiere den DataFrame
extracted_datamit der Funktiontransform(). - Lade schließlich den DataFrame
transformed_datain die SQL-Tabellecleaned_data.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Extract data from the raw_data.csv file
extracted_data = ____(file_name="raw_data.csv")
# Transform the extracted_data
transformed_data = transform(data_frame=____)
# Load the transformed_data to cleaned_data.csv
____(data_frame=transformed_data, target_table="cleaned_data")