Misalkan kita punya kumpulan lima kata-kata baik dan enam kata-kata jelek seperti dibawah. Kata-kata baik kita labelkan dengan angka "1" sedangkan kata-kata jelek kita labelkan dengan angka "0".
import numpy as np kata = ["Bagus!", "Ampuh!", "cantik!", "Mantap!", "Cakep!", "Jelek", "Rusak", "Nol", "Omong kosong", "Busuk", "Tidak"] label = np.array ([1, 1, 1, 1, 1, 0, 0, 0, 0, 0, 0])
Kemudian kata-kata di atas kita rubah menjadi integer
# merubah kata menjadi integer from keras.preprocessing.text import one_hot vocab_size = 50 encoded_docs = [one_hot(d, vocab_size) for d in kata] print(encoded_docs)
Karena panjang maksimal dari elemen kata adalah dua buah (yakni kata "Omong kosong"), kita jadikan kata-kata lainnya memiliki panjang dua buah kata.