Skip to main content

Học máy trong tài chính

📄️ Lời mở đầu

Ở những chương trước, chúng ta đã làm quen với các công cụ phục vụ phân tích dữ liệu, như Pandas, Numpy, Matplotlib, Scikit-learn, và các thư viện khác. Đồng thời, chúng ta đã có cái nhìn tổng quan về những thuật toán cơ bản trong học máy như Logistic Regression, Decision Tree, Random Forest, SVM, Neural Network và thực hành các phương pháp này trên một số tập dữ liệu mẫu. Tuy nhiên, chúng ta chưa thực sự áp dụng các kiến thức này vào một mảng hay bài toán thực tế cần kết hợp với kiến thức chuyên môn.

📄️ Bài 2: Thấu hiểu dữ liệu

Nếu trong lĩnh vực tài chính thuần, ta đã quen thuộc với khái niệm "thấu hiểu khách hàng" (KYC, viết tắt của Know Your Customer), thì dưới góc nhìn kĩ thuật, khi xử lý dữ liệu tài chính, ta có một thuật ngữ tương tự, đó là "thấu hiểu dữ liệu" (KYD, viết tắt của Know Your Data). Đây là một bước quan trọng trong quá trình xử lý dữ liệu, đặc biệt là khi ta xử lý dữ liệu phi và bán cấu trúc. Vậy làm thế nào để chúng ta có thể thấu hiểu dữ liệu?

📄️ Bài 4: Xác suất vỡ nợ

Trước khi tiếp cận với ứng dụng các thuật toán Học máy đối với dữ liệu tài chính, chúng ta sẽ cùng nhau tiếp cận bài toán xác suất vỡ nợ (tiếng anh là Probability of Default hay viết tắt là PD). Trong thị trường tài chính, xác suất vỡ nợ là xác suất mà một công ty phát hành trái phiếu không đáp ứng được các nghĩa vụ hợp đồng của mình theo đúng tiến độ. Bên cạnh trường hợp phổ biến nhất là doanh nghiệp không thanh toán dẫn đến phá sản, ta có thể xây bản cáo bạch trái phiếu xác định các trường hợp vỡ nợ khác, chẳng hạn như việc không đáp ứng một nghĩa vụ nào đó trong hợp đồng hoặc vi phạm giao ước tài chính.