Dimensionamento de dados - padronização de colunas
Como sabemos que as colunas Ash, Alcalinity of ash e Magnesium no conjunto de dados wine estão todas em escalas diferentes, vamos padronizá-las de forma a permitir o uso em um modelo linear.
Este exercício faz parte do curso
Pré-processamento para aprendizado de máquina em Python
Instruções do exercício
- Importe a classe
StandardScaler. - Instanciar um
StandardScaler()e armazená-lo na variávelscaler. - Crie um subconjunto do DataFrame
wineque contenha as colunasAsh,Alcalinity of asheMagnesiume atribua-o awine_subset. - Ajuste e transforme o escalonador padrão para
wine_subset.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Import StandardScaler
from sklearn.preprocessing import ____
# Create the scaler
scaler = ____
# Subset the DataFrame you want to scale
____ = wine[[____]]
# Apply the scaler to wine_subset
wine_subset_scaled = scaler.____(____)