Triển khai kho dữ liệu với Microsoft SQL Server
I. Giới thiệu khóa học:
Khóa học này mô tả cách triển khai nền tảng kho dữ liệu để hỗ trợ giải pháp BI. Học viên sẽ học cách tạo kho dữ liệu bằng Microsoft SQL Server 2014, triển khai ETL bằng SQL Server Integration Services và xác thực, làm sạch dữ liệu bằng SQL Server Data Quality Services và SQL Server Master Data Services.
Lưu ý: Khóa học này được thiết kế cho những khách hàng quan tâm đến việc học SQL Server 2012 hoặc SQL Server 2014. Khóa học bao gồm các tính năng mới trong SQL Server 2014, nhưng cũng bao gồm các khả năng quan trọng trên nền tảng dữ liệu SQL Server.
II. Thời lượng: 40 giờ (05 ngày)
III. Hình thức đào tạo:
Đào tạo trực tiếp tại lớp học, đào tạo online tương tác với giảng viên, đào tạo kết hợp online và trực tiếp tại lớp học, đào tạo tại văn phòng khách hàng theo yêu cầu.
IV. Mục tiêu khóa học:
Sau khi hoàn thành khóa học này, học viên sẽ có thể:
- Mô tả các khái niệm về kho dữ liệu và các cân nhắc về kiến trúc.
- Chọn một nền tảng phần cứng phù hợp cho kho dữ liệu.
- Thiết kế và triển khai kho dữ liệu.
- Triển khai Luồng dữ liệu trong gói SSIS.
- Triển khai Luồng điều khiển trong gói SSIS.
- Gỡ lỗi và Khắc phục sự cố các gói SSIS.
- Triển khai giải pháp ETL hỗ trợ trích xuất dữ liệu gia tăng.
- Triển khai giải pháp ETL hỗ trợ tải dữ liệu gia tăng.
- Triển khai làm sạch dữ liệu bằng cách sử dụng dịch vụ chất lượng dữ liệu của Microsoft.
- Triển khai dịch vụ dữ liệu chính để thực thi tính toàn vẹn của dữ liệu.
- Mở rộng SSIS bằng các tập lệnh và thành phần tùy chỉnh.
- Triển khai và cấu hình các gói SSIS.
- Mô tả cách các giải pháp BI có thể sử dụng dữ liệu từ kho dữ liệu.
V. Đối tượng tham gia:
Khóa học này dành cho các chuyên gia cơ sở dữ liệu cần tạo và hỗ trợ giải pháp kho dữ liệu. Trách nhiệm chính bao gồm:
- Triển khai kho dữ liệu.
- Phát triển các gói SSIS để trích xuất, chuyển đổi và tải dữ liệu.
- Thực thi tính toàn vẹn của dữ liệu bằng cách sử dụng dịch vụ dữ liệu chính.
- Làm sạch dữ liệu bằng cách sử dụng dịch vụ chất lượng dữ liệu.
VI. Điều kiện tiên quyết:
Khóa học này yêu cầu bạn phải đáp ứng các điều kiện tiên quyết sau:
- Có ít nhất 2 năm kinh nghiệm làm việc với cơ sở dữ liệu quan hệ, bao gồm:
- Thiết kế cơ sở dữ liệu chuẩn hóa.
- Tạo bảng và mối quan hệ.
- Truy vấn bằng Transact-SQL.
- Có một số kinh nghiệm về các cấu trúc lập trình cơ bản (như vòng lặp và phân nhánh).
- Có nhận thức về các ưu tiên kinh doanh chính như doanh thu, lợi nhuận và kế toán tài chính là điều mong muốn.
VII. Nội dung khóa học:
1. Module 1: Giới thiệu về kho dữ liệu
Module này cung cấp phần giới thiệu về các thành phần chính của giải pháp kho dữ liệu và những cân nhắc quan trọng mà bạn phải tính đến khi bắt đầu một dự án kho dữ liệu.
Bài học
- Tổng quan về kho dữ liệu
- Những cân nhắc cho giải pháp kho dữ liệu
Lab: Khám phá giải pháp kho dữ liệu
- Khám phá các nguồn dữ liệu
- Khám phá và quy trình ETL
- Khám phá kho dữ liệu
Sau khi hoàn thành module này, bạn sẽ có thể:
- Mô tả các yếu tố chính của giải pháp kho dữ liệu
- Mô tả các cân nhắc chính cho một dự án kho dữ liệu
2. Module 2: Lập kế hoạch cơ sở hạ tầng kho dữ liệu
Module này thảo luận về các cân nhắc khi lựa chọn phần cứng và phân phối các tiện ích SQL Server trên các máy chủ.
Bài học
- Các cân nhắc cho cơ sở hạ tầng kho dữ liệu
- Lên kế hoạch phần cứng kho dữ liệu
Lab: Lập kế hoạch cơ sở hạ tầng kho dữ liệu
- Lập kế hoạch phần cứng kho dữ liệu
Sau khi hoàn thành module này, bạn sẽ có thể:
- Mô tả các cân nhắc chính cho cơ sở hạ tầng BI.
- Lên kế hoạch cho cơ sở hạ tầng kho dữ liệu.
3. Module 3: Thiết kế và triển khai kho dữ liệu
Module này mô tả những cân nhắc chính cho thiết kế logic của kho dữ liệu và sau đó thảo luận về các phương pháp hay nhất để triển khai thực tế.
Bài học
- Tổng quan về thiết kế kho dữ liệu
- Thiết kế bảng chiều
- Thiết kế bảng sự kiện
- Thiết kế vật lý cho kho dữ liệu
Lab: Triển khai kho dữ liệu
- Triển khai sơ đồ hình sao
- Triển khai sơ đồ hình bông tuyết
- Triển khai chiều thời gian
Sau khi hoàn thành module này, bạn sẽ có thể:
- Mô tả quy trình thiết kế mô hình chiều cho kho dữ liệu
- Thiết kế bảng chiều cho kho dữ liệu
- Thiết kế bảng dữ liệu thực tế cho kho dữ liệu
- Thiết kế và triển khai các cấu trúc dữ liệu vật lý hiệu quả cho kho dữ liệu
4. Module 4: Tạo giải pháp ETL với SSIS
Module này thảo luận về các cân nhắc khi triển khai quy trình ETL và sau đó tập trung vào Microsoft SQL Server Integration Services (SSIS) như một nền tảng để xây dựng các giải pháp ETL.
Bài học
- Giới thiệu về ETL với SSIS
- Khám phá các nguồn dữ liệu
- Triển khai luồng dữ liệu
Lab: Triển khai luồng dữ liệu trong gói SSIS
- Khám phá các nguồn dữ liệu
- Chuyển dữ liệu bằng cách sử dụng tác vụ luồng dữ liệu
- Sử dụng chuyển đổi trong luồng dữ liệu
Sau khi hoàn thành module này, bạn sẽ có thể:
- Mô tả các tính năng chính của SSIS.
- Khám phá dữ liệu nguồn cho giải pháp ETL.
- Triển khai luồng dữ liệu bằng cách sử dụng SSIS
5. Module 5: Triển khai luồng điều khiển trong gói SSIS
Module này mô tả cách triển khai các giải pháp ETL kết hợp nhiều tác vụ và logic quy trình công việc.
Bài học
- Giới thiệu về kiểm soát luồng
- Tạo các gói động
- Sử dụng các thùng chứa
- Quản lý tính nhất quán
Lab: Implementing Control Flow in an SSIS Package
- Using Tasks and Precedence in a Control Flow
- Using Variables and Parameters
- Using Containers
Lab: Sử dụng Giao dịch và Điểm kiểm tra
- Sử dụng Giao dịch
- Sử dụng Điểm kiểm tra
Sau khi hoàn thành module này, bạn sẽ có thể:
- Triển khai luồng điều khiển với các tác vụ và ràng buộc ưu tiên
- Tạo các gói động bao gồm các biến và tham số
- Sử dụng các vùng chứa trong luồng điều khiển gói
- Thực thi tính nhất quán với các giao dịch và điểm kiểm tra
6. Module 6: Gỡ lỗi và khắc phục sự cố các gói SSIS
Module này mô tả cách bạn có thể gỡ lỗi các gói để tìm nguyên nhân gây ra lỗi trong quá trình thực thi. Sau đó, Module thảo luận về chức năng ghi nhật ký được tích hợp vào SSIS mà bạn có thể sử dụng để ghi nhật ký các sự kiện nhằm mục đích khắc phục sự cố. Cuối cùng, Module mô tả các phương pháp tiếp cận phổ biến để xử lý lỗi trong luồng điều khiển và luồng dữ liệu.
Bài học
- Gỡ lỗi một gói SSIS
- Ghi nhật ký các sự kiện gói SSIS
- Xử lý lỗi trong một gói SSIS
Lab: Gỡ lỗi và khắc phục sự cố gói SSIS
- Gỡ lỗi một gói SSIS
- Ghi nhật ký thực thi gói SSIS
- Triển khai trình xử lý sự kiện
- Xử lý lỗi trong luồng dữ liệu
Sau khi hoàn thành module này, bạn sẽ có thể:
- Gỡ lỗi một gói SSIS
- Triển khai ghi nhật ký cho một gói SSIS
- Xử lý lỗi trong một gói SSIS
7. Module 7: Triển khai giải pháp trích xuất dữ liệu
Module này mô tả các kỹ thuật bạn có thể sử dụng để triển khai quy trình làm mới kho dữ liệu gia tăng.
Bài học
- Lập kế hoạch trích xuất dữ liệu
- Trích xuất dữ liệu đã sửa đổi
Lab: Trích xuất dữ liệu đã sửa đổi
- Sử dụng cột Ngày giờ
- Sử dụng chụp dữ liệu thay đổi
- Sử dụng nhiệm vụ kiểm soát CDC
- Sử dụng theo dõi thay đổi
Sau khi hoàn thành module này, bạn sẽ có thể:
- Kế hoạch trích xuất dữ liệu
- Trích xuất dữ liệu đã sửa đổi
8. Module 8: Tải dữ liệu vào kho dữ liệu
Module này mô tả các kỹ thuật bạn có thể sử dụng để triển khai quy trình tải kho dữ liệu.
Bài học
- Lên kế hoạch tải dữ liệu
- Sử dụng SSIS cho tải gia tăng
- Sử dụng kỹ thuật tải Transact-SQL
Lab: Đang tải một kho dữ liệu
- Tải dữ liệu từ các bảng đầu ra của CDC
- Sử dụng chuyển đổi tra cứu để chèn hoặc cập nhật dữ liệu chiều
- Triển khai chiều thay đổi chậm
- Sử dụng câu lệnh MERGE
Sau khi hoàn thành module này, bạn sẽ có thể:
- Mô tả các cân nhắc khi lập kế hoạch tải dữ liệu
- Sử dụng SQL Server Integration Services (SSIS) để tải dữ liệu mới và đã sửa đổi vào kho dữ liệu
- Sử dụng các kỹ thuật Transact-SQL để tải dữ liệu vào kho dữ liệu
9. Module 9: Thực thi chất lượng dữ liệu
Module này giới thiệu dịch vụ chất lượng dữ liệu Microsoft SQL Server (DQS) và mô tả cách bạn có thể sử dụng nó để làm sạch và loại bỏ dữ liệu trùng lặp.
Bài học
- Giới thiệu về chất lượng dữ liệu
- Sử dụng dịch vụ chất lượng dữ liệu để làm sạch dữ liệu
Lab: Làm sạch dữ liệu
- Creating a DQS Knowledge Base
- Using a DQS Project to Cleanse Data
- Using DQS in an SSIS Package
Sau khi hoàn thành module này, bạn sẽ có thể:
- Mô tả cách dịch vụ chất lượng dữ liệu có thể giúp bạn quản lý chất lượng dữ liệu
- Sử dụng dịch vụ chất lượng dữ liệu để làm sạch dữ liệu của bạn
- Sử dụng dịch vụ chất lượng dữ liệu để khớp dữ liệu
10. Module 10: Dịch vụ dữ liệu chính
Dịch vụ dữ liệu chính cung cấp một cách để các tổ chức chuẩn hóa dữ liệu và cải thiện chất lượng, tính nhất quán và độ tin cậy của dữ liệu hướng dẫn các quyết định kinh doanh quan trọng. Module này giới thiệu dịch vụ dữ liệu chính và giải thích các lợi ích khi sử dụng nó.
Bài học
- Giới thiệu về Master Data Services
- Triển khai mô hình Master Data Services
- Quản lý Master Data
- Tạo Master Data Hub
Lab: Triển khai dịch vụ dữ liệu chính
- Tạo mô hình dịch vụ dữ liệu Chính
- Sử dụng tiện ích bổ sung dịch vụ dữ liệu chính cho Excel
- Thực thi quy tắc kinh doanh
- Tải dữ liệu vào mô hình
- Sử dụng dữ liệu dịch vụ dữ liệu Chính
Sau khi hoàn thành module này, bạn sẽ có thể:
- Mô tả các khái niệm chính của Master Data Services
- Triển khai mô hình Master Data Services
- Sử dụng các công cụ Master Data Services để quản lý dữ liệu chính
- Sử dụng các công cụ Master Data Services để tạo trung tâm dữ liệu chính
11. Module 11: Mở rộng dịch vụ tích hợp SQL Server
Module này mô tả các kỹ thuật bạn có thể sử dụng để mở rộng SSIS. Module này không được thiết kế để trở thành hướng dẫn toàn diện về việc phát triển các giải pháp SSIS tùy chỉnh, mà để cung cấp nhận thức về các bước cơ bản cần thiết để sử dụng các thành phần và tập lệnh tùy chỉnh trong quy trình ETL dựa trên SSIS.
Bài học
- Sử dụng Scripts trong SSIS
- Sử dụng Custom Components trong SSIS
Lab: Sử dụng tập lệnh tùy chỉnh
- Sử dụng một tác vụ tập lệnh
Sau khi hoàn thành module này, bạn sẽ có thể:
- Bao gồm các tập lệnh tùy chỉnh trong gói SSIS
- Mô tả cách các thành phần tùy chỉnh có thể được sử dụng để mở rộng SSIS
12. Module 12: Triển khai và cấu hình các gói SSIS
Trong Module này, học viên sẽ học cách triển khai các gói và các phụ thuộc của chúng lên máy chủ và cách quản lý, giám sát việc thực hiện các gói đã triển khai.
Bài học
- Tổng quan về triển khai SSIS
- Triển khai các dự án SSIS
- Lên kế hoạch thực hiện gói SSIS
Lab: Triển khai và cấu hình các gói SSIS
- Tạo danh mục SSIS
- Triển khai dự án SSIS
- Chạy gói SSIS trong SQL Server Management Studio
- Lên lịch gói SSIS với SQL Server Agent
Sau khi hoàn thành module này, bạn sẽ có thể:
- Mô tả các cân nhắc cho việc triển khai SSIS.
- Triển khai các dự án SSIS.
- Lên kế hoạch thực hiện gói SSIS.
13. Module 13: Tiêu thụ dữ liệu trong kho dữ liệu
Module này giới thiệu các giải pháp trí tuệ kinh doanh (BI) và mô tả cách bạn có thể sử dụng kho dữ liệu làm cơ sở cho BI doanh nghiệp và tự phục vụ.
Bài học
- Giới thiệu về BI
- BI doanh nghiệp
- BI tự phục vụ và Big Data
Lab: Sử dụng kho dữ liệu
- Khám phá giải pháp BI doanh nghiệp
- Khám phá giải pháp BI tự phục vụ
Sau khi hoàn thành module này, bạn sẽ có thể:
- Mô tả BI và các kịch bản BI phổ biến
- Mô tả cách kho dữ liệu có thể được sử dụng trong các kịch bản BI doanh nghiệp
- Mô tả cách kho dữ liệu có thể được sử dụng trong các kịch bản BI tự phục vụ
Học trực tuyến
Học tại Hồ Chí Minh
Học tại Hà Nội



