Big Data cho ngành tài chính
Giới thiệu khóa học:
Xu hướng sử dụng dữ liệu hỗ trợ quyết định kinh doanh (data-driven decision making) đang trở nên phổ biến và giúp các doanh nghiệp ra quyết định nhanh chóng, chính xác và tối ưu nhất. Rất nhiều nghề nghiệp hiện nay sẽ được thay thế bằng máy móc và chương trình, với bộ não là phân tích dữ liệu. Các ngành nghề khác cũng sẽ biến đối sâu sắc bởi dữ liệu.
Lớp học “Khoa học Dữ liệu Cơ bản” nhằm cung cấp những khái niệm cơ bản của việc ứng dụng khoa học dữ liệu trong vận hành doanh nghiệp, đặc biệt là doanh nghiệp dịch vụ tài chính. Lớp học trang bị cho học viên kiến thức nền tảng, công cụ xử lý dữ liệu, quy trình vận hành dự án và tổ chức dữ liệu tối ưu nhất nhằm nâng cao năng suất lao động và tạo giá trị đột phá.
Thời lượng:
40 giờ (05 ngày)
Hình thức đào tạo:
- Đào tạo trực tiếp tại lớp học, đào tạo tại văn phòng khách hàng theo yêu cầu.
Mục tiêu khóa học:
Sau khi hoàn tất khóa học, học viên trang bị đủ kiến thức và kỹ năng cần thiết trong việc:
- Thấu hiểu vai trò của dữ liệu và xu hướng ứng dụng dữ liệu trong kinh doanh
- Quy trình và cách thức tổ chức dự án dữ liệu
- Tính chất Dữ liệu và dữ liệu tài chính
- Mô tả, mô phỏng dữ liệu
- Sử dụng thành thao ngôn ngữ dữ liệu phổ biến nhất R và giao diện Rstudio
- Thực hành mô hình trên các bộ dữ liệu tài chính
- Hiển thị dữ liệu – xu hướng tương tác hình ảnh
Đối tượng tham gia khóa học:
- Các thành viên làm việc nhiều với dữ liệu hoặc muốn tìm hiểu ứng dụng công cụ dữ liệu trong doanh nghiệp: Giao dịch viên - traders, nhà quản lý quỹ, quản lý rủi ro, chuyên viên phân tích, nhân viên mid-office, nhà quản lý,…
Yêu cầu:
- Lớp học sẽ bổ sung các kiến thức Toán cần thiết. Học viên cần có máy tính cài đặt trước: Excel; R/Rstudio; local MySQL server.
Nội dung khóa học:
1. Giới thiệu lớp học. Cơ bản về xác suất thống kê. Giới thiệu R
- Mục đích, nội dung và cách tổ chức lớp học.
- Các biến ngẫu nhiên, thống kê miêu tả, thống kê suy diễn,…
- Xác suất thống kê và rủi ro trong tài chính.
- Giới thiệu ngôn ngữ R
2. Quy trình phân tích dữ liệu. Giới thiệu Dự án
- Giới thiệu dự án Dữ liệu, Quy trình tổ chức bộ phận dữ liệu và dự án dữ liệu.
- Lựa chọn biến mục tiêu, biến độc lập, lựa chọn và đánh giá mô hình. Ví dụ đầu tiên về mô hình dữ liệu.
- Giới thiệu dự án cuối lớp học
3. Mô tả và chuẩn bị dữ liệu
- Mô tả dữ liệu, ước lượng tham số, kiểm định giả thuyết.
- Xử lý dữ liệu thô
- Ứng dụng:
- Đặc điểm thống kê của dữ liệu tài chính
4. Mô hình tuyến tính 1
- Mô hình tuyến tính đa biến, các kỹ thuật chọn biến
- Ứng dụng:
- Ước lượng volatility theo tham số doanh nghiệp và lịch sử giao dịch
5. Chuẩn hóa và Biến đổi dữ liệu
- Các kỹ thuật biến đổi biến số (Dimension reduction: Principal component analysis/SVD/t-SNE)
- Ứng dụng:
- Data visualization cho dữ liệu nhiều chiều
- Phân tích sự thay đổi của Yield curve
6. Mô hình tuyến tính 2
- Mô hình phân loại, hồi quy Logistic và các kỹ thuật nâng cao (Lasso, Ridge, SVM)
- Ứng dụng:
- Tính xác suất default của khách hàng
- Ước lượng volatility theo tham số doanh nghiệp và lịch sử giao dịch
7. Các mô hình cây (Tree based model)
- Cây quyết định, các kỹ thuật nâng cao (Random forest, Boosting)
- Ứng dụng:
- Tính xác suất default
8. Kỹ thuật gom cụm
- K-means, Hierarchical clustering, DBSCAN
- Ứng dụng:
- Dự báo giá cổ phiếu
9. Cơ bản về time series
- Ứng dụng:
- Xây dựng mô hình volatility ARMA/GARCH
10. Phân tích điểm bất thường (Change point detection)
- Ứng dụng trong phân tích sự thay đổi của cổ phiếu
11. Hiển thị dữ liệu hình ảnh
- Thực hành Data visualization
12. Dự án/Seminar
- Hướng dẫn/Thuyết trình dự á
Học trực tuyến
Học tại Hồ Chí Minh
Học tại Hà Nội