One-hot vector là gì?

Noun AI NLP

Trong xử lý ngôn ngữ tự nhiên (natural language processing), one-hot vector là ma trận 1 × N (vectơ) được sử dụng để phân biệt từng từ (word) trong một từ vựng (vocabulary) với mọi từ khác trong từ vựng. Vectơ bao gồm các số 0 trong tất cả các ô, ngoại trừ một số 1 duy nhất trong ô được sử dụng duy nhất để xác định từ. One-hot encoding bảo rằng học máy (machine learning) không cho rằng các số cao hơn là quan trọng hơn. Ví dụ: giá trị "8" lớn hơn giá trị "1", nhưng điều đó không làm cho "8" quan trọng hơn "1". Điều này cũng đúng với từ: giá trị 'laughter' không quan trọng hơn 'laugh'.

Learning English Everyday