Parte 1: Explorando a função to_categorical()
Você sabia que, nos problemas do mundo real, o tamanho do vocabulário pode ficar bem grande (por exemplo, mais de cem mil palavras)?
Esse exercício é dividido em duas partes e você vai aprender a importância de definir o argumento “ num_classes ” da função “ to_categorical() ”. Na parte 1, você vai implementar a função compute_onehot_length() que gera vetores one-hot para uma lista de palavras e calcula o comprimento desses vetores.
A função to_categorical() já foi importada.
Este exercício faz parte do curso
Tradução automática com Keras
Instruções do exercício
- Crie IDs de palavras usando
wordseword2indexemcompute_onehot_length(). - Crie vetores onehot usando a função “
to_categorical()” com os IDs das palavras. - Retorna o comprimento de um único vetor onehot usando a sintaxe
<array>.shape. - Calcule e imprima o comprimento dos vetores onehot usando
compute_onehot_length()para a lista de palavrasHe,drank,milk.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
def compute_onehot_length(words, word2index):
# Create word IDs for words
word_ids = [____[w] for w in ____]
# Convert word IDs to onehot vectors
onehot = ____(____)
# Return the length of a single one-hot vector
return onehot.____[1]
word2index = {"He":0, "drank": 1, "milk": 2}
# Compute and print onehot length of a list of words
print(____([____,____,____], ____))