Regressão logística multivariada
Em geral, você não usará apenas o site loan_int_rate para prever a probabilidade de inadimplência. Você deverá usar todos os dados que tiver para fazer previsões.
Com isso em mente, tente treinar um novo modelo com colunas diferentes, chamadas de recursos, dos dados do site cr_loan_clean. Esse modelo será diferente do primeiro? Para isso, você pode verificar facilmente o .intercept_ da regressão logística. Lembre-se de que essa é a interceptação y da função e as probabilidades logarítmicas gerais de não inadimplência.
Os dados do cr_loan_clean foram carregados no espaço de trabalho junto com o modelo anterior clf_logistic_single.
Este exercício faz parte do curso
Modelagem de risco de crédito em Python
Instruções do exercício
- Crie um novo conjunto de dados
Xcomloan_int_rateeperson_emp_length. Armazene-o comoX_multi. - Crie um conjunto de dados
ycom apenasloan_status. - Crie e
.fit()um modeloLogisticRegression()nos novos dadosX. Armazene-o comoclf_logistic_multi. - Imprima o valor
.intercept_do modelo
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Create X data for the model
X_multi = ____[[____,____]]
# Create a set of y data for training
y = ____[[____]]
# Create and train a new logistic regression
clf_logistic_multi = ____(solver='lbfgs').____(____, np.ravel(____))
# Print the intercept of the model
print(____.____)