Codificación de variables categóricas - binarias
Echa un vistazo al conjunto de datos hiking. Aquí hay varias columnas que hay que codificar antes de modelarlas, una de ellas es la columna Accessible. Accessible es una característica binaria, por lo que tiene dos valores, Y o N, que hay que codificar en 1 y 0. Utiliza el método LabelEncoder de scikit-learn para realizar esta transformación.
Este ejercicio forma parte del curso
Preprocesamiento para machine learning en Python
Instrucciones del ejercicio
- Guarda
LabelEncoder()en una variable llamadaenc. - Utilizando el método
.fit_transform()del codificador, codifica la columna"Accessible"del conjunto de datoshiking. Llama a la nueva columnaAccessible_enc. - Compara las dos columnas una al lado de la otra para ver la codificación.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Set up the LabelEncoder object
enc = ____
# Apply the encoding to the "Accessible" column
____ = ____.____(____)
# Compare the two columns
print(____[[____, ____]].head())