Generalization error là gì?

Noun AI
out-of-sample error risk
Sai số khái quát hóa

Đối với các ứng dụng học có giám sát trong học máy (machine learning) và lý thuyết học thống kê, sai số khái quát hóa (generalization error) là thước đo mức độ chính xác của một thuật toán (algorithm) có thể dự đoán các giá trị kết quả cho dữ liệu chưa từng thấy (unseen data) trước đây. Vì thuật toán học được đánh giá trên các mẫu (sample) hữu hạn, nên việc đánh giá thuật toán học có thể nhạy với lỗi lấy mẫu (sampling error). Do đó, các phép đo sai số dự đoán trên dữ liệu hiện tại có thể không cung cấp nhiều thông tin về khả năng dự đoán trên dữ liệu mới.

Sai số khái quát hóa (generalization error) có thể được giảm thiểu bằng cách tránh overfitting trong thuật toán học. Hiệu suất của một thuật toán học máy được trực quan hóa bằng các biểu đồ hiển thị các giá trị ước tính của sai số khai quát hóa (generalization error) thông qua quá trình học (learning), được gọi là đường cong học (learning curve).

Learning English Everyday