Khoa học dữ liệu với Python
I. Tổng quan
Khóa học “Khoa học dữ liệu với Python” sẽ giúp học viên các kiến thức cơ bản về khoa học dữ liệu và kỹ thuật phân tích sử dụng ngôn ngữ lập trình Python. Học viên cũng sẽ được hướng dẫn về học máy, trực quan hóa dữ liệu, xử lý ảnh, video, ngôn ngữ tự nhiên,.v.v..với Python. Python là một ngôn ngữ lập trình bắt buộc đối với nhiều vị trí khoa học dữ liệu, vì vậy hãy bắt đầu sự nghiệp của bạn với khóa học thực hành tương tác này.
II. Thời lượng: 40h
III. Mục tiêu:
- Hiểu sâu hơn về các quy trình Khoa học dữ liệu như xử lý dữ liệu, khám phá dữ liệu, trực quan hóa dữ liệu, xây dựng giả thuyết và thử nghiệm.
- Cài đặt Python và các thư viện liên quan
- Hiểu các khái niệm cơ bản của lập trình Python như kiểu dữ liệu, tuples, danh sách, dictionary, toán tử và hàm cơ bản
- Thực hiện tính toán bằng cách sử dụng thư viện NumPy, SciPy, Pandas
- Tích lũy kinh nghiệm về Machine Learning bằng cách sử dụng thư viện Scikit-Learn
- Hiểu về mô hình học có giám sát và không giám sát như hồi quy tuyến tính, phân cụm, giảm chiều dữ liệu, KNN và cách sử dụng Scikit-Learn để xử lý ngôn ngữ tự nhiên
- Sử dụng thư viện Matplotlib của Python để trực quan hóa dữ liệu
- Trích xuất dữ liệu hữu ích từ websites bằng cách sử dụng các thư viện trong Python
- Tích hợp Python với Hadoop, Spark và MapReduce
IV. Đối tượng tham gia:
Với nhu cầu về việc áp dụng Trí tuệ nhân tạo trong các ngành khác nhau như ngân hàng, tài chính, sản xuất, vận tải và hậu cần, chăm sóc sức khỏe, khóa học Trí tuệ nhân tạo phù hợp cho nhiều đối tượng khác nhau như:
- Kỹ sư công nghệ thông tin mong muốn trở thành “Kỹ sư trí tuệ nhân tạo”
- Cấp quản lý đang lãnh đạo các nhà phân tích dữ liệu và phân tích kinh doanh.
- Sinh viên đã tốt nghiệp muốn phát triển sự nghiệp trong lĩnh vực trí tuệ nhân tạo và máy học
- Các nhà phân tích dữ liệu/ phân tích kinh doanh mong muốn áp dụng trí tuệ nhân tạo trong môi trường công việc
V. Nội dung khóa học:
- Phần 1: Data Science Overview
- Phần 2: Data Analytics Overview
- Phần 3: Statistical Analysis and Business Applications
- Phần 4: Python Environment Setup and Essentials
- Phần 5: Mathematical Computing with Python (NumPy)
- Phần 6 - Scientific computing with Python (Scipy)
- Phần 7 - Data Manipulation with Pandas
- Phần 8 - Machine Learning with Scikit–Learn
- Phần 9 - Natural Language Processing with Scikit Learn
- Phần 10 - Data Visualization in Python using matplotlib
- Phần 11 - Web Scraping with BeautifulSoup
- Phần 12 - Python integration with Hadoop MapReduce and Spark
Học trực tuyến
Học tại Hồ Chí Minh
Học tại Hà Nội