Regressão logística multivariada

Em geral, você não usará apenas o site loan_int_rate para prever a probabilidade de inadimplência. Você deverá usar todos os dados que tiver para fazer previsões.

Com isso em mente, tente treinar um novo modelo com colunas diferentes, chamadas de recursos, dos dados do site cr_loan_clean. Esse modelo será diferente do primeiro? Para isso, você pode verificar facilmente o .intercept_ da regressão logística. Lembre-se de que essa é a interceptação y da função e as probabilidades logarítmicas gerais de não inadimplência.

Os dados do cr_loan_clean foram carregados no espaço de trabalho junto com o modelo anterior clf_logistic_single.

Este exercício faz parte do curso

Modelagem de risco de crédito em Python

Ver curso

Instruções do exercício

Crie um novo conjunto de dados X com loan_int_rate e person_emp_length. Armazene-o como X_multi.
Crie um conjunto de dados y com apenas loan_status.
Crie e .fit() um modelo LogisticRegression() nos novos dados X. Armazene-o como clf_logistic_multi.
Imprima o valor .intercept_ do modelo

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Create X data for the model
X_multi = ____[[____,____]]

# Create a set of y data for training
y = ____[[____]]

# Create and train a new logistic regression
clf_logistic_multi = ____(solver='lbfgs').____(____, np.ravel(____))

# Print the intercept of the model
print(____.____)

Editar e executar o código