Cross-validation là gì?

Noun AI Machine learning
rotation estimation out-of-sample testing k-fold cross-validation

Trong học máy (machine learning), cross-validation hoặc k-fold cross-validation là khi tập dữ liệu (dataset) được chia ngẫu nhiên thành k nhóm (nhóm ở đây còn gọi là fold). Một trong các nhóm được sử dụng làm tập thử nghiệm (test set) và nhóm còn lại được sử dụng làm tập huấn luyện (training set). Mô hình (model) được huấn luyện (train) trên tập huấn luyện và cho điểm trên tập thử nghiệm. Sau đó, quá trình này được lặp lại cho đến khi từng nhóm duy nhất được sử dụng làm tạp thử nghiệm.

Ví dụ: đối với 5-fold cross validation, tập dữ liệu sẽ được chia thành 5 nhóm và mô hình sẽ được huấn luyện và thử nghiệm 5 lần riêng biệt để mỗi nhóm sẽ có cơ hội trở thành tập thử nghiệm.

Learning English Everyday