Skip to main content

Học máy trong tài chính

📄️ Lời mở đầu

Ở những chương trước, chúng ta đã làm quen với các công cụ phục vụ phân tích dữ liệu, như Pandas, Numpy, Matplotlib, Scikit-learn, và các thư viện khác. Đồng thời, chúng ta đã có cái nhìn tổng quan về những thuật toán cơ bản trong học máy như Logistic Regression, Decision Tree, Random Forest, SVM, Neural Network và thực hành các phương pháp này trên một số tập dữ liệu mẫu. Tuy nhiên, chúng ta chưa thực sự áp dụng các kiến thức này vào một mảng hay bài toán thực tế cần kết hợp với kiến thức chuyên môn.

📄️ Bài 2: Thấu hiểu dữ liệu

Nếu trong lĩnh vực tài chính thuần, ta đã quen thuộc với khái niệm "thấu hiểu khách hàng" (KYC, viết tắt của Know Your Customer), thì dưới góc nhìn kĩ thuật, khi xử lý dữ liệu tài chính, ta có một thuật ngữ tương tự, đó là "thấu hiểu dữ liệu" (KYD, viết tắt của Know Your Data). Đây là một bước quan trọng trong quá trình xử lý dữ liệu, đặc biệt là khi ta xử lý dữ liệu phi và bán cấu trúc. Vậy làm thế nào để chúng ta có thể thấu hiểu dữ liệu?