Validação cruzada com R-quadrado
A validação cruzada é uma abordagem vital para a avaliação de um modelo. Ela maximiza a quantidade de dados disponíveis para o modelo, pois o modelo não é apenas treinado, mas também testado com todos os dados disponíveis.
Neste exercício, você deve criar um modelo de regressão linear e, em seguida, usar a validação cruzada com 6 grupos (6 folds) para avaliar sua precisão na previsão de vendas usando gastos com publicidade em redes sociais. Você deve exibir a pontuação individual de cada um dos seis grupos.
O conjunto de dados sales_df foi dividido em y para a variável dependente e X para as variáveis independentes e já foi pré-carregado para você. LinearRegression foi importado de sklearn.linear_model.
Este exercício faz parte do curso
Aprendizado Supervisionado com o scikit-learn
Instruções do exercício
- Importe
KFoldecross_val_score. - Crie
kfchamandoKFold(), definindo o número de divisões como seis,shufflecomoTruee definindo uma semente igual a5. - Faça a validação cruzada usando
regcomXey, passandokfemcv. - Imprima
cv_scores.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Import the necessary modules
from ____.____ import ____, ____
# Create a KFold object
kf = ____(n_splits=____, shuffle=____, random_state=____)
reg = LinearRegression()
# Compute 6-fold cross-validation scores
cv_scores = ____(____, ____, ____, cv=____)
# Print scores
print(____)