Data Pre-Processing and Data Analysis

 I. Giới thiệu khóa học:

Khóa học Data Pre-Processing and Data Analysis giúp học viên nắm vững quy trình xử lý và phân tích dữ liệu từ dữ liệu thô đến báo cáo phân tích hoàn chỉnh. Thông qua các bài thực hành chuyên sâu với Power BI, học viên sẽ được hướng dẫn cách kết nối dữ liệu từ nhiều nguồn, đánh giá chất lượng dữ liệu, làm sạch và chuẩn hóa dữ liệu bằng Power Query, xây dựng mô hình dữ liệu, thiết kế KPI bằng DAX, trực quan hóa dữ liệu và triển khai báo cáo phục vụ ra quyết định kinh doanh. Khóa học phù hợp với nhu cầu thực tế của doanh nghiệp, giúp học viên nâng cao năng lực khai thác dữ liệu, phát hiện insight và xây dựng báo cáo phân tích có tính ứng dụng cao.

II. Thời lượng: 24 giờ (3 ngày)
III. Hình thức đào tạo:

Đào tạo trực tiếp tại lớp học, đào tạo online tương tác với giảng viên, đào tạo kết hợp online và trực tiếp tại lớp học, đào tạo tại văn phòng khách hàng theo yêu cầu

IV. Mục tiêu khóa học:
  • Hiểu vai trò của Data Pre-Processing và Data Analysis trong doanh nghiệp.
  • Nắm được quy trình phân tích dữ liệu từ nguồn dữ liệu đến insight.
  • Hiểu vai trò của Power BI trong hệ sinh thái phân tích dữ liệu.
  • Kết nối được dữ liệu từ nhiều nguồn phổ biến.
  • Đánh giá chất lượng dữ liệu bằng data profiling.
  • Làm sạch và chuẩn hóa dữ liệu bằng Power Query.
  • Thiết kế được mô hình dữ liệu đúng logic phân tích.
  • Phân biệt fact table, dimension table và star schema.
  • Quản lý relationship, hierarchy và metadata để model dễ sử dụng.
  • Viết được các DAX measure cơ bản và nâng cao.
  • Hiểu filter context, row context và cách DAX phản hồi tương tác trên report.
  • Xây dựng KPI phục vụ phân tích kinh doanh.
  • Thiết kế report rõ ràng, dễ dùng và phản ánh đúng insight.
  • Lựa chọn visual phù hợp với từng loại câu hỏi phân tích.
  • Tạo tương tác phân tích bằng filter, slicer, drill down và drill through.
  • Áp dụng advanced analytics để phát hiện insight sâu hơn.
  • Hiểu cách publish, quản lý, bảo mật và vận hành nội dung phân tích.
  • Hiểu checklist vận hành cơ bản cho báo cáo phân tích trong doanh nghiệp.
V. Đối tượng tham gia
  • Nhân sự phụ trách báo cáo, phân tích dữ liệu, phân tích kinh doanh trong doanh nghiệp.
  • Chuyên viên Business Analyst, Data Analyst, nhân sự BI hoặc người đang định hướng phát triển trong lĩnh vực phân tích dữ liệu.
  • Nhân sự các phòng ban như Kinh doanh, Marketing, Tài chính, Kế toán, Vận hành, Nhân sự có nhu cầu khai thác dữ liệu để lập báo cáo và hỗ trợ ra quyết định.
  • Quản lý cấp trung, trưởng nhóm hoặc nhân sự phụ trách theo dõi KPI, hiệu quả kinh doanh và hiệu suất vận hành.
  • Người đã từng sử dụng Excel hoặc Power BI ở mức cơ bản và muốn nâng cao kỹ năng xử lý, mô hình hóa, phân tích và trực quan hóa dữ liệu.
VI. Điều kiện tiên quyết:
  • Có kỹ năng sử dụng máy tính và thao tác với dữ liệu ở mức cơ bản.
  • Có kinh nghiệm làm việc với Excel hoặc các bảng dữ liệu là một lợi thế.
  • Hiểu cơ bản về báo cáo, chỉ số kinh doanh hoặc nhu cầu phân tích dữ liệu trong công việc
VII. Nội dung khóa học:

MODULE 1 – Tổng quan Data Analytics và quy trình phân tích dữ liệu

Nội dung

  • Data analytics overview: Prepare, Model, Visualize, Analyze, Manage.
  • Vai trò của Data Analyst, Business Analyst, Data Engineer và stakeholder nghiệp vụ.
  • Power BI ecosystem: Desktop, Service, dataset, report, dashboard, workspace.
  • Từ dữ liệu thô đến insight phục vụ quyết định kinh doanh.
  • Các lỗi thường gặp khi bắt đầu phân tích dữ liệu: sai nguồn, thiếu chất lượng, mô hình không rõ, KPI không thống nhất.

Lab thực hành

  • Khởi động Power BI Desktop và làm quen giao diện.
  • Khảo sát dataset mẫu và xác định câu hỏi phân tích.
  • Mapping yêu cầu nghiệp vụ thành chỉ số phân tích.
  • Xác định luồng dữ liệu: Source -> Clean -> Model -> Report.

Đầu ra

  • Hiểu rõ end-to-end analytics workflow và xác định được mục tiêu phân tích cho case study xuyên suốt.

MODULE 2 – Data Pre-Processing: Kết nối, profiling, làm sạch và biến đổi dữ liệu

Nội dung

  • Kết nối dữ liệu: Excel, CSV, folder, database, online services.
  • Import, DirectQuery, Live Connection và khi nào nên sử dụng.
  • Data profiling: column quality, column distribution, column profile, cardinality.
  • Xử lý lỗi dữ liệu: missing value, data type error, duplicate, inconsistent format.
  • Các transformation phổ biến: filter, remove columns, split, extract, replace values, change data type.
  • Merge, append, pivot, unpivot và shaping table structure.
  • Query folding, parameter và khuyến nghị tối ưu hiệu năng dữ liệu.

Lab thực hành

  • Connect tới dataset mẫu từ file và folder.
  • Profile dữ liệu để phát hiện lỗi chất lượng dữ liệu.
  • Clean và transform dữ liệu bán hàng, khách hàng, sản phẩm.
  • Merge/append các query thành dataset phân tích.
  • Kiểm tra query steps và load dữ liệu vào model.

Đầu ra

  • Dataset đã được làm sạch, chuẩn hóa và sẵn sàng cho data model.

MODULE 3 – Data Modeling: Thiết kế mô hình dữ liệu phục vụ phân tích

Nội dung

  • Data modeling introduction trong Power BI.
  • Fact table, dimension table và nguyên tắc thiết kế star schema.
  • Cardinality, filter direction và relationship management.
  • Tạo, chỉnh sửa và kiểm tra relationship.
  • Rủi ro circular relationship và many-to-many relationship.
  • Hierarchy, display folder, column formatting và model usability.
  • Best practices cho mô hình dữ liệu dễ bảo trì và có khả năng mở rộng.

Lab thực hành

  • Thiết kế star schema cho case study.
  • Tạo relationship giữa Sales, Customer, Product, Date và Region.
  • Cấu hình data type, format, hidden columns và hierarchy.
  • Kiểm tra model bằng các visual kiểm thử.

Đầu ra

  • Data model chuẩn hóa theo star schema, có relationship rõ ràng và sẵn sàng cho phân tích KPI.

MODULE 4 – Data Analysis với DAX: KPI, measure và phân tích theo ngữ cảnh

Nội dung

  • DAX overview: calculated column, calculated table, measure.
  • So sánh implicit measure, explicit measure và quick measure.
  • Columns vs measures và tiêu chí lựa chọn.
  • Filter context, CALCULATE(), USERELATIONSHIP() và context transition.
  • Date table và time intelligence.
  • Semi-additive measures và phân tích theo thời gian.
  • DAX performance: variables, query plan, giảm độ phức tạp measure.

Lab thực hành

  • Tạo calculated table, calculated column và measure.
  • Xây dựng KPI: revenue, margin, quantity, average order value.
  • Tạo measure theo thời gian: month-to-date, year-to-date, previous period, growth rate.
  • Sử dụng CALCULATE() để thay đổi filter context.
  • Refactor measure bằng variable để dễ đọc và tối ưu hiệu năng.

Đầu ra

  • Bộ KPI và DAX measure phục vụ phân tích doanh thu, khách hàng, sản phẩm và xu hướng thời gian.

MODULE 5 – Report Design và Data Analysis: Trực quan hóa, tương tác và storytelling

Nội dung

  • Nguyên tắc chọn visual: comparison, trend, composition, distribution, relationship.
  • Report layout, page structure và information hierarchy.
  • Conditional formatting, tooltip và formatting chuẩn hóa.
  • Cross-highlighting, drill down, drill through và bookmark.
  • Navigation, slicer, filter pane và report state.
  • Accessibility: selection order, naming, contrast và trải nghiệm người dùng.
  • Khi nào dùng report, dashboard hoặc paginated report.

Lab thực hành

  • Thiết kế report phân tích Sales Overview, Customer Analysis và Product Performance.
  • Cấu hình visual fields, format properties và conditional formatting.
  • Tạo slicer, drill through page và bookmark navigation.
  • Kiểm thử report với các câu hỏi phân tích thực tế.

Đầu ra

  • Report phân tích hoàn chỉnh, có tương tác, điều hướng và insight rõ ràng cho người dùng nghiệp vụ.

MODULE 6 – Advanced Analytics và triển khai an toàn

Nội dung

1. Advanced Analytics

  • Analyze feature, grouping, binning và outlier detection.
  • KPI visual, clustering, what-if parameter và forecasting.
  • AI visuals: Q&A, Key Influencers, Decomposition Tree.

2. Delivery and Governance

  • Publish report lên Power BI Service.
  • Workspace, app, refresh dataset, incremental refresh và data lineage.
  • Dataset endorsement, usage metrics và quản lý vòng đời nội dung.
  • Row-level security: static role, dynamic role và kiểm thử quyền truy cập.

3. Monitoring and Operational Readiness

  • Kiểm tra refresh, ownership, data quality và access control.
  • Review lineage, usage metrics và các điểm cần theo dõi sau khi triển khai.
  • Chuẩn hóa checklist bàn giao báo cáo cho người dùng nghiệp vụ.

Lab thực hành

  • Mở rộng báo cáo Sales Analysis đã xây dựng ở buổi trước.
  • Thêm advanced analytics: forecast, decomposition tree hoặc key influencers.
  • Publish báo cáo và kiểm tra dataset/report trong workspace.
  • Cấu hình row-level security theo vùng hoặc nhân viên bán hàng.
  • Review refresh, lineage, usage metrics và quyền truy cập.

Đầu ra

  • Báo cáo được bổ sung advanced analytics và security cơ bản.
  • Checklist vận hành gồm refresh, ownership, data quality và access control.
  • Học trực tuyến

  • Học tại Hồ Chí Minh

  • Học tại Hà Nội


Các khóa học khác