Soft margin là gì?

Noun AI

Trong trường hợp khả tách tuyến tính (linearly separable), máy hỗ trợ véctơ (support vector machine) cố gắng tìm đường thẳng (nếu số lượng đặc trưng đầu vào (input feature) là 2) tối đa hóa lề (margin), là khoảng cách giữa các diểm dữ liệu (data point) gần nhất với đường thẳng. Nói cách khác, tập dữ liệu (dataset) khả tách tuyến tính, nhưng trong cuộc sống thực, chúng ra hiếm khi tìm thấy tập dữ liệu nào khả tách tuyến tính. Chúng ta có hai giải pháp cho vấn đề này:

  • Chúng ta vẫn có thể cố gắng tìm một đường thẳng để phân tách các điểm dữ liệu, nhưng chúng ta chấp nhận một hoặc một số điểm dữ liệu bị phân loại sai. Đây được gọi là soft margin.
  • Hoặc chúng ta có thể cố gắng tìm một decision boundary phi tuyến tính để phân tách các điểm dữ liệu. Đây được gọi là kernel trick.

Những gì soft margin làm là:

  • Nó chấp nhận một vài điểm dữ liệu để bị phân loại sai.
  • Nó cố gắng cân bằng sự đánh đổi giữa việc tìm kiếm một đường tối đa hóa lề (margin) và giảm thiểu việc phân loại sai.
Learning English Everyday