Avaliação do ajuste da distribuição para a variável ldl
Neste exercício, você se concentrará em uma variável do conjunto de dados de diabetes dia: o soro sanguíneo ldl. Você determinará se a distribuição normal ainda é uma boa opção para ldl com base nas informações adicionais fornecidas por um teste de Kolmogorov-Smirnov.
O DataFrame dia foi carregado para você. As seguintes bibliotecas também foram importadas: pandas como pd, numpy como np, e scipy.stats como st.
Este exercício faz parte do curso
Simulações de Monte Carlo em Python
Instruções do exercício
- Defina uma lista chamada
list_of_distsque contenha suas distribuições candidatas: Laplace, normal e exponencial (nessa ordem); use os nomes corretos descipy.stats. - Dentro do loop, ajuste os dados com a distribuição de probabilidade correspondente, salvando como
param. - Realize um teste de Kolmogorov-Smirnov para avaliar a qualidade do ajuste, salvando os resultados em
result.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# List candidate distributions to evaluate
list_of_dists = [____]
for i in list_of_dists:
dist = getattr(st, i)
# Fit the data to the probability distribution
param = dist.____
# Perform the ks test to evaluate goodness-of-fit
result = ____
print(result)