Encoding categorical data là gì?

Noun AI
Mã hóa dữ liệu phân loại

Như chúng ta đã biết, hầu hết dữ liệu trong cuộc sống thực đi kèm với các giá trị chuỗi phân loại và hầu hết các mô hình học máy (machine learning model) chỉ hoạt động với các giá trị nguyên và. Tất cả các mô hình về cơ bản đều thực hiện các phép toán có thể được thực hiện bằng các công cụ và kỹ thuật khác nhau. Nhưng sự thật phũ phàng là toán học hoàn toàn phụ thuộc vào các con số. Vì vậy, tóm lại, chúng ta có thể nói rằng hầu hết các mô hình yêu cầu các số là dữ liệu, không phải chuỗi hoặc không phải bất kỳ thứ gì khác và những số này có thể là số thực hoặc số nguyên.

Mã hóa dữ liệu phân loại (encoding categorical data) là một quá trình chuyển đổi dữ liệu phân loại (categorical data) sang định dạng số nguyên để dữ liệu có các giá trị phân loại đã chuyển đổi có thể được cung cấp cho các mô hình (model) khác nhau.

Learning English Everyday