Mantendo-o descritivo
Para entender melhor as experiências dos viajantes no aeroporto de São Francisco, o departamento de garantia de qualidade enviou um questionário qualitativo a todos os viajantes que deram ao aeroporto a pior pontuação em todas as categorias possíveis. O objetivo desse questionário é identificar padrões comuns no que os viajantes estão dizendo sobre o aeroporto.
Suas respostas estão armazenadas na coluna survey_response. Após uma análise mais detalhada, você percebeu que algumas das respostas apresentavam a menor quantidade possível de caracteres sem muita substância. Neste exercício, você isolará as respostas com uma contagem de caracteres superior a 40 e garantirá que seu novo DataFrame contenha respostas com 40 caracteres ou mais usando uma instrução assert.
O DataFrame airlines está em seu ambiente e pandas é importado como pd.
Este exercício faz parte do curso
Limpeza de dados em Python
Instruções do exercício
- Usando o DataFrame
airlines, armazene o comprimento de cada instância na colunasurvey_responseemresp_lengthusando.str.len(). - Isole as linhas de
airlinescomresp_lengthmaior que40. - Afirme que o menor comprimento de
survey_responseemairlines_surveyagora é maior do que em40.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Store length of each row in survey_response column
resp_length = ____
# Find rows in airlines where resp_length > 40
airlines_survey = airlines[____ > ____]
# Assert minimum survey_response length is > 40
assert ____.str.len().____ > _____
# Print new survey_response column
print(airlines_survey['survey_response'])