Trang này được dịch bởi Cloud Translation API.

Làm việc với dữ liệu số

Chuyên viên công nghệ học máy dành nhiều thời gian hơn để đánh giá, làm sạch và cải tiến hơn là mô hình xây dựng. Dữ liệu quan trọng đến mức khoá học này dành toàn bộ ba học phần cho chủ đề:

Làm việc với dữ liệu số (bài này)
Làm việc với dữ liệu phân loại
Tập dữ liệu, tổng quát hoá và tích hợp quá mức

Bài này tập trung vào dữ liệu số, nghĩa là số nguyên hoặc giá trị dấu phẩy động hoạt động như những con số. Chúng có thể được thêm vào, có thể đếm được, được sắp xếp theo thứ tự và cứ tiếp tục như vậy. Bài tiếp theo sẽ tập trung vào dữ liệu phân loại, có thể bao gồm các số có hành vi giống như danh mục. Học phần thứ ba tập trung vào cách chuẩn bị dữ liệu nhằm đảm bảo kết quả chất lượng cao khi huấn luyện và đánh giá mô hình của bạn.

Ví dụ về dữ liệu dạng số:

Nhiệt độ
Trọng lượng
Số lượng hươu mùa đông trong khu bảo tồn thiên nhiên

Ngược lại, mã bưu chính của Hoa Kỳ, mặc dù là số có năm chữ số hoặc chín chữ số, đừng hoạt động như số hoặc biểu thị mối quan hệ toán học. Mã bưu chính 40004 (tại Hạt Dublin, Kentucky) là không gấp đôi số lượng mã bưu chính 20002 (ở Washington, D.C.). Các số này đại diện cho các danh mục, cụ thể là khu vực địa lý và được xem xét dữ liệu phân loại.

Kiểm tra kiến thức (10 phút)

Tiếp

Cách mô hình nhập dữ liệu bằng vectơ đặc trưng (5 phút)