Vocabulary là gì?
Noun
AI NLP
- ★
- ★
- ★
- ★
- ★
Từ vựng
Tập hợp các từ (word) duy nhất được sử dụng trong ngữ liệu văn bản (text corpus) được gọi là từ vựng (vocabulary). Khi xử lý văn bản thô (raw text) cho NLP, mọi thứ được thực hiện xung quanh từ vựng (vocabulary).
print(text_corpus) # a list of different texts (sentences)
print(vocabulary) # a list of the words that make up those texts
Output:
['bob ate apples', 'fred ate apples', 'bob ate pears'] ['bob', 'fred', 'ate', 'apples', 'pears']
Learning English Everyday