Validación cruzada para r_squared
La validación cruzada es un enfoque vital para evaluar un modelo. Maximiza la cantidad de datos de que dispone el modelo, ya que éste no solo se entrena, sino que también se prueba con todos los datos disponibles.
En este ejercicio, construirás un modelo de regresión lineal y, a continuación, utilizarás la validación cruzada a 6 para evaluar su precisión a la hora de predecir las ventas mediante el gasto en publicidad en redes sociales. Visualizarás la puntuación individual de cada uno de los seis pliegues.
El conjunto de datos sales_df se ha dividido en y para la variable objetivo, y X para las características, y se ha precargado para ti. LinearRegression se ha importado de sklearn.linear_model.
Este ejercicio forma parte del curso
Aprendizaje supervisado con scikit-learn
Instrucciones del ejercicio
- Importa
KFoldycross_val_score. - Crea
kfllamando aKFold(), fijando el número de divisiones en seis,shuffleenTrue, y fijando una semilla en5. - Realiza una validación cruzada utilizando
regenXyy, pasandokfacv. - Imprime la página
cv_scores.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Import the necessary modules
from ____.____ import ____, ____
# Create a KFold object
kf = ____(n_splits=____, shuffle=____, random_state=____)
reg = LinearRegression()
# Compute 6-fold cross-validation scores
cv_scores = ____(____, ____, ____, cv=____)
# Print scores
print(____)