Xây dựng hệ thống AI nội bộ (chatbot và xử lý ảnh)
I. Giới thiệu khóa học:
Khóa học "Xây dựng hệ thống AI nội bộ" được thiết kế dành riêng cho nhân viên IT, nhằm trang bị kiến thức và kỹ năng cần thiết để phát triển, triển khai, và quản lý các hệ thống AI (chatbot và xử lý ảnh) sử dụng nội bộ trong công ty. Trong 4 ngày, học viên sẽ nắm vững các khái niệm cốt lõi về AI (NLP, LLM, AI Agent), hiểu kiến trúc và quy trình triển khai hệ thống AI local, cũng như thực hành xử lý dữ liệu nội bộ, fine-tuning mô hình, và đánh giá hiệu năng. Khóa học kết hợp các công cụ mã nguồn mở (Ollama, Rasa, YOLO) và công nghệ Microsoft (Azure AI Studio, Copilot Studio) để xây dựng các giải pháp thực tiễn như chatbot hỗ trợ nhân viên hoặc hệ thống nhận diện ảnh. Với trọng tâm vào bảo mật, giám sát, và tối ưu hóa, khóa học giúp học viên tự tin triển khai hệ thống AI hiệu quả, đáp ứng nhu cầu cụ thể của doanh nghiệp.
II. Thời lượng: 32 giờ (4 ngày)
III. Hình thức đào tạo:
Đào tạo trực tiếp tại lớp học, đào tạo online tương tác với giảng viên, đào tạo kết hợp online và trực tiếp tại lớp học, đào tạo tại văn phòng khách hàng theo yêu cầu
IV. Mục tiêu khóa học:
Sau khóa học, học viên có thể:
- Hiểu các khái niệm cốt lõi, thành phần, và kiến trúc của hệ thống AI.
- Nắm quy trình triển khai, huấn luyện, và tối ưu hóa hệ thống AI local.
- Thành thạo xử lý dữ liệu nội bộ, fine-tuning mô hình, và giám sát hệ thống.
- Thực hành xây dựng chatbot và hệ thống xử lý ảnh với các công cụ mã nguồn mở và Microsoft (Azure AI Studio, Copilot Studio).
- Đánh giá hiệu năng và lập kế hoạch bảo trì hệ thống AI.
V. Đối tượng tham gia
- Nhân viên IT có kiến thức cơ bản về lập trình (Python, JavaScript), cơ sở dữ liệu, và quản trị hệ thống.
- Không yêu cầu kinh nghiệm sâu về AI, nhưng cần hiểu cơ bản về xử lý dữ liệu và lập trình
VI. Nội dung khóa học:
Module 1: Các khái niệm và thành phần trong AI
Mục tiêu: Hiểu các khái niệm cơ bản và thuật ngữ liên quan đến AI.
- Nội dung:
- Giới thiệu AI: Machine Learning, Deep Learning, AI tổng quát.
- Thành phần cốt lõi:
- Model: Mô hình AI, cách hoạt động (VD: mô hình ngôn ngữ, mô hình thị giác).
- NLP (Natural Language Processing): Tokenization, embedding, ứng dụng trong chatbot.
- LLM (Large Language Model): Cấu trúc, ví dụ (GPT, LLaMA), ứng dụng nội bộ.
- Token: Vai trò, giới hạn trong xử lý văn bản.
- NPU (Neural Processing Unit): So sánh với GPU/CPU, vai trò trong AI local.
- AI Agent: Khái niệm, ví dụ (chatbot, trợ lý ảo).
- Framework và công cụ: TensorFlow, PyTorch, Hugging Face, Ollama, LangChain, Open WebUI.
- Case study: Ứng dụng AI trong doanh nghiệp (chatbot hỗ trợ nhân viên, nhận diện sản phẩm qua ảnh).
- Hoạt động: Thảo luận nhóm về các ứng dụng AI nội bộ, phân tích case study thực tế.
Module 2: Kiến trúc và quy trình triển khai hệ thống AI local
Mục tiêu: Nắm kiến trúc hệ thống AI và quy trình triển khai local.
- Nội dung:
- Kiến trúc hệ thống AI:
- Infrastructure layer: Server, GPU/NPU, lưu trữ.
- Data layer: Cơ sở dữ liệu, data lake, pipeline dữ liệu.
- Model layer: Lựa chọn và triển khai mô hình (pre-trained, custom).
- Application layer: Giao diện người dùng (chatbot, ứng dụng xử lý ảnh).
- Quy trình triển khai:
- Xác định yêu cầu: Chatbot (hỗ trợ nội bộ) hoặc xử lý ảnh (nhận diện đối tượng).
- Chuẩn bị hạ tầng: Docker, Kubernetes, NVIDIA Triton.
- Tích hợp dữ liệu: Kết nối cơ sở dữ liệu nội bộ.
- Triển khai mô hình: REST API, FastAPI, Open WebUI.
- Bảo mật:
- Mã hóa dữ liệu, kiểm soát truy cập.
- Tuân thủ GDPR/CCPA (nếu áp dụng).
- Kiến trúc hệ thống AI:
- Hoạt động:
- Vẽ sơ đồ kiến trúc hệ thống AI dựa trên kịch bản công ty.
- Thực hành setup môi trường local (Docker, Ollama) và chạy thử LLM.
Module 3: Xử lý dữ liệu nội bộ và huấn luyện mô hình
Mục tiêu: Học cách thu thập, xử lý dữ liệu, và fine-tune mô hình AI.
- Nội dung:
- Xử lý dữ liệu nội bộ:
- Thu thập: Văn bản (FAQ, tài liệu), hình ảnh (ảnh sản phẩm, tài liệu scan).
- Làm sạch: Loại bỏ nhiễu, chuẩn hóa (Pandas, OpenCV).
- Gắn nhãn: Công cụ như Label Studio, Prodigy.
- Phương pháp phát triển AI:
- Prompt Engineering: Viết prompt hiệu quả cho LLM.
- RAG (Retrieval-Augmented Generation): Tăng độ chính xác với dữ liệu nội bộ.
- Fine-tuning: Điều chỉnh mô hình pre-trained (Hugging Face Transformers, PyTorch).
- Bảo mật dữ liệu:
- Mã hóa dữ liệu huấn luyện.
- Quản lý phiên bản dữ liệu (DVC - Data Version Control).
- Demo: So sánh Prompt Engineering, RAG, và fine-tuning trên cùng use case (VD: chatbot FAQ công ty).
- Xử lý dữ liệu nội bộ:
- Hoạt động:
- Thực hành làm sạch dữ liệu nội bộ và gắn nhãn với Label Studio.
- Fine-tune mô hình BERT hoặc LLaMA trên dữ liệu văn bản nội bộ.
Module 4: Thực hành triển khai hệ thống AI local
Mục tiêu: Triển khai thực tế chatbot và hệ thống xử lý ảnh trên hạ tầng local.
- Nội dung:
- Chatbot:
- Xây dựng chatbot với Rasa, Open WebUI, hoặc Hugging Face.
- Tích hợp dữ liệu nội bộ qua RAG, triển khai giao diện với Flask/FastAPI.
- Xử lý ảnh:
- Triển khai mô hình YOLO cho nhận diện đối tượng (VD: sản phẩm, tài liệu).
- Xây dựng pipeline xử lý ảnh với OpenCV.
- Công cụ:
- Framework: Rasa, LangChain, Hugging Face, YOLO.
- Hạ tầng: Docker, Kubernetes, NVIDIA Triton Inference Server.
- Chatbot:
- Hoạt động:
- Nhóm thực hành: Triển khai chatbot FAQ hoặc hệ thống nhận diện ảnh.
- Kiểm tra tích hợp: Kết nối với cơ sở dữ liệu nội bộ và chạy thử API.
Module 5: Benchmark test và tối ưu hóa hiệu năng
Mục tiêu: Đánh giá và tối ưu hóa hiệu năng hệ thống AI.
- Nội dung:
- Chỉ số đánh giá:
- Chatbot: Độ chính xác, F1-score, thời gian phản hồi.
- Xử lý ảnh: mAP (mean Average Precision), FPS (frames per second).
- Công cụ benchmark: Locust, JMeter, TensorRT.
- Tối ưu hóa:
- Giảm latency, tăng throughput.
- Tối ưu tài nguyên (CPU/GPU/NPU) với NVIDIA Triton.
- Chỉ số đánh giá:
- Hoạt động: Chạy benchmark trên hệ thống đã triển khai, báo cáo kết quả và đề xuất tối ưu.
Module 6: Giám sát và bảo trì hệ thống AI
Mục tiêu: Hiểu cách giám sát và duy trì hệ thống AI lâu dài.
- Nội dung:
- Giám sát:
- Theo dõi hiệu năng: Thời gian phản hồi, tỷ lệ lỗi (Prometheus, Grafana).
- Logging và alerts: ELK Stack, cảnh báo lỗi hệ thống.
- Bảo trì:
- Phát hiện data drift, tái huấn luyện định kỳ.
- Sao lưu dữ liệu và mô hình.
- Bảo mật: Giám sát truy cập trái phép, mã hóa dữ liệu.
- Giám sát:
- Hoạt động: Cài đặt dashboard giám sát với Prometheus/Grafana, thiết lập cảnh báo.
Module 7: Xây dựng AI với Azure AI Studio & Copilot Studio
Mục tiêu: Thành thạo xây dựng chatbot và AI agent với công cụ Microsoft.
- Nội dung:
- Azure AI Studio:
- Tổng quan: Model catalog, prompt flow, tích hợp dữ liệu.
- Ứng dụng: Xây dựng chatbot hoặc mô hình xử lý ảnh.
- Copilot Studio:
- Low-code AI agent builder, tích hợp với Microsoft Teams/SharePoint.
- Sử dụng RAG để tăng cường dữ liệu nội bộ.
- Thực hành:
- Tạo chatbot FAQ với Azure AI Studio, kết nối dữ liệu nội bộ.
- Tạo AI agent với Copilot Studio, tích hợp với Teams.
- Azure AI Studio:
- Hoạt động: Triển khai chatbot nội bộ và trình bày kết quả.
Module 8: Tổng kết và lập kế hoạch triển khai
Mục tiêu: Đánh giá toàn bộ khóa học và xây dựng roadmap triển khai.
- Nội dung:
- Decision framework: Khi nào dùng local LLM, Azure AI Studio, hoặc Copilot Studio.
- Roadmap triển khai: Lập kế hoạch triển khai AI nội bộ (hạ tầng, dữ liệu, bảo trì).
- Q&A: Giải đáp thắc mắc, thảo luận các vấn đề thực tế.
- Hoạt động: Nhóm trình bày dự án cuối khóa (chatbot hoặc hệ thống xử lý ảnh), báo cáo hiệu năng và kế hoạch triển khai.
Học trực tuyến
Học tại Hồ Chí Minh
Học tại Hà Nội



