Création de caractéristiques
Dans ce chapitre, vous travaillerez avec un ensemble de données appelé sales_df, qui contient des informations sur les dépenses des campagnes publicitaires dans différents types de médias, et le montant des ventes générées en dollars pour la campagne respective. L’ensemble de données a été préchargé pour vous. Voici les deux premières lignes :
tv radio social_media sales
1 13000.0 9237.76 2409.57 46677.90
2 41000.0 15886.45 2913.41 150177.83
Vous utiliserez les dépenses publicitaires comme caractéristiques pour prédire les valeurs des ventes, en travaillant d’abord avec la colonne "radio". Cependant, avant de faire des prédictions, vous devrez créer les tableaux de caractéristiques et de cibles, en les adaptant au format correct pour scikit-learn.
Cet exercice fait partie du cours
Apprentissage supervisé avec scikit-learn
Instructions
- Créez
X, un tableau contenant les valeurs de la colonne"radio"du DataFramesales_df. - Créez
y, un tableau contenant les valeurs de la colonne"sales"du DataFramesales_df. - Convertissez
Xen un tableau NumPy à deux dimensions. - Affichez la forme de
Xety.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
import numpy as np
# Create X from the radio column's values
X = ____
# Create y from the sales column's values
y = ____
# Reshape X
X = ____
# Check the shape of the features and targets
print(____)