Cơ sở dữ liệu và Truy vấn cho Khóa học dữ liệu

I.       Tổng quan

-       Khóa học cung cấp cho học viên (HV) các kiến thức và kỹ năng cần thiết khi làm việc với cơ sở dữ liệu (database)

-       Trang bị cho HV những kiến thức nền tảng vững chắc về ngôn ngữ truy vấn (SQL): các loại truy vấn rút trích, thêm, xóa, cập nhật dữ liệu trong môi trường Data Science.

-       Hướng dẫn HV cách xây dựng và làm việc với CSDL trên Cloud (đám mây), truy cập CSDL với Python sử dụng DB-API

-       Hướng dẫn HV cách thu thập dữ liệu từ Twitter APIs sử dụng Tweepy Python Package

-       Cung cấp cho HV kiến thức phân tích dữ liệu với Python

II.    Thời lượng:  40 giờ.
III. Đối tượng học:

-       Sinh viên các trường Đại học, Cao đẳng

-       HV có định hướng sẽ làm việc trong lĩnh vực Data Science

IV.   Mục tiêu khóa học

Sau khi hoàn thành khóa học, học viên sẽ đạt được các kỹ năng:

-       Áp dụng kiến thức về ngôn ngữ SQL trong việc sắp xếp và rút trích thông tin từ CSDL

-       Thực hiện các truy vấn có chọn lọc, nhóm, thống kê dữ liệu

-       Cập nhật dữ liệu trên bảng như thêm, xóa, cập nhật

-       Thu thập dữ liệu từ Twitter APIs sử dụng Tweepy Python Package

-       Làm việc với CSDL trên Cloud

-       Làm việc với cơ sở dữ liệu thực, công cụ khoa học dữ liệu thực và bộ dữ liệu trong thế giới thực

V.    Nội dung khóa học

1.      Database

 • Giới thiệu Database
 • Phân biệt DDL (Data Definition Language) và DML (Data Manipulation Language)
 • Tạo Database instance trên Cloud/máy tính

2.      Basic SQL

 • CREATE/DROP TABLE
 • SELECT
 • COUNT/DISTINCT/LIMIT
 • INSERT
 • UPDATE
 • DELETE
 • CONSTRAINT
 • WHERE AND/OR/BETWEEN/IN

3.      Advanced SQL

 • String Patterns (%), Ranges
 • ORDER BY
 • GROUP BY, HAVING
 • Built-in Function, Date, Timestamps
 • Sub-query, Nested-select
 • Multiple table: dùng sub-query, implicit JOIN, JOIN operators (INNER JOIN, OUTER JOIN)
 • Sử dụng operations để làm việc với multiple tables: INNER JOIN, LEFT OUTER JOIN, RIGHT OUTER JOIN, FULL OUTER JOIN
 • UNION

4.      Truy cập Database với Python

 • Python và DB
  • Ưu điểm của Python khi làm việc với DB
  • Mô hình truy cập
  • SQL API
  • API của các SQL-Based DBMS system
 • Sử dụng DB API
  • Khái niệm DB-API
  • Khái niệm Python DB-API: Connection Ojbect, Cursor Object
  • Connection method
  • Cusor method
  • Khái niệm DB cursor
  • Sử dụng DB-API
 • Python code tạo table, tải dữ liệu và truy vấn dữ liệu
  • CREATE, INSERT, QUERY
  • Sử dụng pandas nhận dữ liệu từ tableipython-sql
  • Sử dụng Python Variables trong SQL Statements

5.      Phân tích dữ liệu với Python

 • Tải csv file vào database warehouse trên cloud
 • Làm việc với SQLite/PostGre SQL

6.      Twitter API

 • Truy cập Twitter API
 • Phân loại Twitter API
 • Tweets dạng JSON
 • Sử dụng Tweepy Python Package
 • Học trực tuyến

 • Học tại Hồ Chí Minh

 • Học tại Hà Nội


Các khóa học khác