Visualiser les relations entre les variables
Dans le dernier exercice, vous avez peut-être remarqué qu'un mariage plus long, représenté par marriage_duration est corrélé avec le fait d'avoir plus d'enfants (représenté par la colonne num_kids). Le coefficient de corrélation entre les variables marriage_duration et num_kids est 0.45.
Dans cet exercice, vous créerez un diagramme en nuage de points pour visualiser la relation entre ces variables. pandas a été chargé en tant que pd, matplotlib.pyplot a été chargé en tant que plt, et Seaborn a été chargé en tant que sns. Le nom de l'ensemble de données est divorce.
Cet exercice fait partie du cours
Analyse de données exploratoires en Python
Instructions
- Créez un nuage de points représentant
marriage_durationsur l'axe des x etnum_kidssur l'axe des y.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create the scatterplot
____
plt.show()