Cơ sở dữ liệu và Truy vấn cho Khóa học dữ liệu

I.       Tổng quan

-       Khóa học cung cấp cho học viên (HV) các kiến thức và kỹ năng cần thiết khi làm việc với cơ sở dữ liệu (database)

-       Trang bị cho HV những kiến thức nền tảng vững chắc về ngôn ngữ truy vấn (SQL): các loại truy vấn rút trích, thêm, xóa, cập nhật dữ liệu trong môi trường Data Science.

-       Hướng dẫn HV cách xây dựng và làm việc với CSDL trên Cloud (đám mây), truy cập CSDL với Python sử dụng DB-API

-       Hướng dẫn HV cách thu thập dữ liệu từ Twitter APIs sử dụng Tweepy Python Package

-       Cung cấp cho HV kiến thức phân tích dữ liệu với Python

II.    Thời lượng:  40 giờ.
III. Đối tượng học:

-       Sinh viên các trường Đại học, Cao đẳng

-       HV có định hướng sẽ làm việc trong lĩnh vực Data Science

IV.   Mục tiêu khóa học

Sau khi hoàn thành khóa học, học viên sẽ đạt được các kỹ năng:

-       Áp dụng kiến thức về ngôn ngữ SQL trong việc sắp xếp và rút trích thông tin từ CSDL

-       Thực hiện các truy vấn có chọn lọc, nhóm, thống kê dữ liệu

-       Cập nhật dữ liệu trên bảng như thêm, xóa, cập nhật

-       Thu thập dữ liệu từ Twitter APIs sử dụng Tweepy Python Package

-       Làm việc với CSDL trên Cloud

-       Làm việc với cơ sở dữ liệu thực, công cụ khoa học dữ liệu thực và bộ dữ liệu trong thế giới thực

V.    Nội dung khóa học

1.      Database

  • Giới thiệu Database
  • Phân biệt DDL (Data Definition Language) và DML (Data Manipulation Language)
  • Tạo Database instance trên Cloud/máy tính

2.      Basic SQL

  • CREATE/DROP TABLE
  • SELECT
  • COUNT/DISTINCT/LIMIT
  • INSERT
  • UPDATE
  • DELETE
  • CONSTRAINT
  • WHERE AND/OR/BETWEEN/IN

3.      Advanced SQL

  • String Patterns (%), Ranges
  • ORDER BY
  • GROUP BY, HAVING
  • Built-in Function, Date, Timestamps
  • Sub-query, Nested-select
  • Multiple table: dùng sub-query, implicit JOIN, JOIN operators (INNER JOIN, OUTER JOIN)
  • Sử dụng operations để làm việc với multiple tables: INNER JOIN, LEFT OUTER JOIN, RIGHT OUTER JOIN, FULL OUTER JOIN
  • UNION

4.      Truy cập Database với Python

  • Python và DB
    • Ưu điểm của Python khi làm việc với DB
    • Mô hình truy cập
    • SQL API
    • API của các SQL-Based DBMS system
  • Sử dụng DB API
    • Khái niệm DB-API
    • Khái niệm Python DB-API: Connection Ojbect, Cursor Object
    • Connection method
    • Cusor method
    • Khái niệm DB cursor
    • Sử dụng DB-API
  • Python code tạo table, tải dữ liệu và truy vấn dữ liệu
    • CREATE, INSERT, QUERY
    • Sử dụng pandas nhận dữ liệu từ tableipython-sql
    • Sử dụng Python Variables trong SQL Statements

5.      Phân tích dữ liệu với Python

  • Tải csv file vào database warehouse trên cloud
  • Làm việc với SQLite/PostGre SQL

6.      Twitter API

  • Truy cập Twitter API
  • Phân loại Twitter API
  • Tweets dạng JSON
  • Sử dụng Tweepy Python Package
  • Học trực tuyến

  • Học tại Hồ Chí Minh

  • Học tại Hà Nội


Các khóa học khác