Fluggesellschaft
In dieser Aufgabe erstellst du einen StringIndexer und einen OneHotEncoder, um die Spalte carrier zu kodieren. Dazu rufst du die Klassenkonstruktoren mit den Argumenten inputCol und outputCol auf.
inputCol ist der Name der Spalte, die du indizieren oder kodieren willst, und outputCol ist der Name der neuen Spalte, die der Transformer erstellen soll.
Diese Übung ist Teil des Kurses
Einführung in PySpark
Anleitung zur Übung
- Erstelle einen
StringIndexernamenscarr_indexer, indem duStringIndexer()mitinputCol="carrier"undoutputCol="carrier_index"aufrufst. - Erstelle einen
OneHotEncodernamenscarr_encoder, indem duOneHotEncoder()mitinputCol="carrier_index"undoutputCol="carrier_fact"aufrufst.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Create a StringIndexer
carr_indexer = StringIndexer(____)
# Create a OneHotEncoder
carr_encoder = OneHotEncoder(____)