Cơ sở dữ liệu và Truy vấn cho Khóa học dữ liệu
I. Tổng quan
- Khóa học cung cấp cho học viên (HV) các kiến thức và kỹ năng cần thiết khi làm việc với cơ sở dữ liệu (database)
- Trang bị cho HV những kiến thức nền tảng vững chắc về ngôn ngữ truy vấn (SQL): các loại truy vấn rút trích, thêm, xóa, cập nhật dữ liệu trong môi trường Data Science.
- Hướng dẫn HV cách xây dựng và làm việc với CSDL trên Cloud (đám mây), truy cập CSDL với Python sử dụng DB-API
- Hướng dẫn HV cách thu thập dữ liệu từ Twitter APIs sử dụng Tweepy Python Package
- Cung cấp cho HV kiến thức phân tích dữ liệu với Python
II. Thời lượng: 40 giờ.
III. Đối tượng học:
- Sinh viên các trường Đại học, Cao đẳng
- HV có định hướng sẽ làm việc trong lĩnh vực Data Science
IV. Mục tiêu khóa học
Sau khi hoàn thành khóa học, học viên sẽ đạt được các kỹ năng:
- Áp dụng kiến thức về ngôn ngữ SQL trong việc sắp xếp và rút trích thông tin từ CSDL
- Thực hiện các truy vấn có chọn lọc, nhóm, thống kê dữ liệu
- Cập nhật dữ liệu trên bảng như thêm, xóa, cập nhật
- Thu thập dữ liệu từ Twitter APIs sử dụng Tweepy Python Package
- Làm việc với CSDL trên Cloud
- Làm việc với cơ sở dữ liệu thực, công cụ khoa học dữ liệu thực và bộ dữ liệu trong thế giới thực
V. Nội dung khóa học
1. Database
- Giới thiệu Database
- Phân biệt DDL (Data Definition Language) và DML (Data Manipulation Language)
- Tạo Database instance trên Cloud/máy tính
2. Basic SQL
- CREATE/DROP TABLE
- SELECT
- COUNT/DISTINCT/LIMIT
- INSERT
- UPDATE
- DELETE
- CONSTRAINT
- WHERE AND/OR/BETWEEN/IN
3. Advanced SQL
- String Patterns (%), Ranges
- ORDER BY
- GROUP BY, HAVING
- Built-in Function, Date, Timestamps
- Sub-query, Nested-select
- Multiple table: dùng sub-query, implicit JOIN, JOIN operators (INNER JOIN, OUTER JOIN)
- Sử dụng operations để làm việc với multiple tables: INNER JOIN, LEFT OUTER JOIN, RIGHT OUTER JOIN, FULL OUTER JOIN
- UNION
4. Truy cập Database với Python
- Python và DB
- Ưu điểm của Python khi làm việc với DB
- Mô hình truy cập
- SQL API
- API của các SQL-Based DBMS system
- Sử dụng DB API
- Khái niệm DB-API
- Khái niệm Python DB-API: Connection Ojbect, Cursor Object
- Connection method
- Cusor method
- Khái niệm DB cursor
- Sử dụng DB-API
- Python code tạo table, tải dữ liệu và truy vấn dữ liệu
- CREATE, INSERT, QUERY
- Sử dụng pandas nhận dữ liệu từ tableipython-sql
- Sử dụng Python Variables trong SQL Statements
5. Phân tích dữ liệu với Python
- Tải csv file vào database warehouse trên cloud
- Làm việc với SQLite/PostGre SQL
6. Twitter API
- Truy cập Twitter API
- Phân loại Twitter API
- Tweets dạng JSON
- Sử dụng Tweepy Python Package
Học trực tuyến
Học tại Hồ Chí Minh
Học tại Hà Nội