Exemplo de when()
A cláusula when() permite que você modifique condicionalmente um Data Frame com base em seu conteúdo. Você deverá modificar nosso DataFrame voter_df para adicionar um número aleatório a qualquer membro votante definido como "Councilmember".
O DataFrame voter_df está definido e disponível para você. A biblioteca pyspark.sql.functions está disponível como F.. Você pode usar F.rand() para gerar o valor aleatório.
Este exercício faz parte do curso
Limpeza de dados com o PySpark
Instruções do exercício
- Adicione uma coluna a
voter_dfchamadarandom_valcom os resultados do métodoF.rand()para qualquer eleitor com o título Councilmember. - Mostre algumas das linhas do DataFrame, observando se a cláusula
.when()funcionou.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Add a column to voter_df for any voter with the title **Councilmember**
voter_df = voter_df.____('random_val',
____(____, ____))
# Show some of the DataFrame rows, noting whether the when clause worked
voter_df.____