1.ª parte: Explorando la función to_categorical()
¿Sabías que en los problemas del mundo real, el tamaño del vocabulario puede llegar a ser muy grande (por ejemplo, más de cien mil palabras)?
Este ejercicio se divide en dos partes y aprenderás la importancia de establecer el argumento « num_classes » de la función « to_categorical() ». En la parte 1, implementarás la función compute_onehot_length() que genera vectores one-hot para una lista de palabras dada y calcula la longitud de esos vectores.
La función to_categorical() ya se ha importado.
Este ejercicio forma parte del curso
Traducción automática con Keras
Instrucciones del ejercicio
- Crea identificadores de palabras utilizando
wordsyword2indexencompute_onehot_length(). - Crea vectores onehot utilizando la función «
to_categorical()» con los ID de las palabras. - Devuelve la longitud de un único vector onehot utilizando la sintaxis «
<array>.shape». - Calcula e imprime la longitud de los vectores onehot utilizando
compute_onehot_length()para la lista de palabrasHe,drank,milk.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
def compute_onehot_length(words, word2index):
# Create word IDs for words
word_ids = [____[w] for w in ____]
# Convert word IDs to onehot vectors
onehot = ____(____)
# Return the length of a single one-hot vector
return onehot.____[1]
word2index = {"He":0, "drank": 1, "milk": 2}
# Compute and print onehot length of a list of words
print(____([____,____,____], ____))