Balanced dataset là gì?

Noun AI
Tập dữ liệu cân bằng

Tập dữ liệu cân bằng (balanced dataset) đề cập đến một tập dữ liệu (dataset) mà phân phối (distribution) các nhãn (label) của nó gần như bằng nhau. Các nhãn trong ngữ cảnh này đề cập đến một lớp (class) được liên kết với mỗi điểm dữ liệu (data point).

Ví dụ: hãy xem xét một tập dữ liệu có hai lớp nam và nữ. Nếu khoảng một nửa phân phối đại diện cho lớp nam và một nửa còn lại đại diện cho lớp nữ, chúng ta nói rằng tập dữ liệu là cân bằng.

Learning English Everyday