Lập trình R cho Khoa học dữ liệu
I. Tổng quan
- Khóa học cung cấp cho học viên (HV) những kiến thức nền tảng và những kỹ năng cần thiết để có thể thực hiện việc phân tích, thống kê, biểu diễn đồ họa và báo cáo bằng R – một ngôn ngữ lập trình luôn đứng trong “TOP TEN” các ngôn ngữ lập trình được sử dụng nhiều và phổ biến nhất .
- Cung cấp kiến thức cơ bản về Machine Learning, một lĩnh vực đang rất “hot” của Data Science
- Rèn luyện và phát triển kỹ năng lập trình, tư duy logic
- Xây dựng nền tảng cơ bản vững chắc trong ngôn ngữ lập trình R tạo tiền đề cho việc học các kiến thức lập trình nâng cao, phát triển nghề nghiệp.
II. Thời lượng: 40 giờ.
III. Đối tượng học:
- HV có kiến thức tin học văn phòng và sử dụng Internet
- Sinh viên các trường Đại học, Cao đẳng, Trung cấp nghề
- Bất kỳ ai làm việc trong lĩnh vực CNTT có định hướng sẽ lập trình bằng ngôn ngữ R
- Bất kỳ ai làm việc trong các lĩnh vực khác cần trang bị kiến thức lập trình R phục vụ công việc
- Bất kỳ ai quan tâm đến việc phát triển các kỹ năng và kinh nghiệm để theo đuổi sự nghiệp trong lĩnh vực Data Science
IV. Mục tiêu khóa học
Sau khi hoàn thành khóa học, học viên sẽ đạt được các kỹ năng:
- Sử dụng các cấu trúc trong ngôn ngữ lập trình R để giải quyết các bài toán
- Vận dụng các cấu trúc điều kiện, cấu trúc lặp, function
- Sử dụng các thư viện có sẵn của R để thực hiện các công việc tính toán, thống kê
- Nắm vững và vận dụng các kiểu dữ liệu String, Vector, List, Matric, Array, Data Frame, Object và Class
- Làm việc với các kiểu dữ liệu tập tin như txt file, CSV file, Excel file, XML file, JSON file
- Thiết lập các Chart và Graph, trực quan hóa dữ liệu
- Lập trình thống kê và báo cáo với các built-in function trong R
- Áp dụng một số thuật toán Machine Learning trong việc phân loại, dự đoán và phân nhóm dữ liệu
V. Nội dung khóa học
1. Part 1: Basic
- Tổng quan lập trình R
- Giới thiệu R
- Cài đặt R & R Studio
- Tạo và thực thi R script
- R cơ bản
- Cú pháp cơ bản, biến, hằng
- Kiểu dữ liệu, toán tử (Operators)
- String, Date
- Cấu trúc điều kiện
- if
- switch
- Cấu trúc lặp
- repeat, while, for
- Sử dụng break, next
- Function
- Xây dựng function
- Gọi và sử dụng function
2. Part 2: Data Structure
- Vector
- Factor
- Array
- Matrix
- List
- Data Frame
- Object và class
3. Part 3: Làm việc với dữ liệu tập tin
- Txt
- CSV
- Excel
- XML
- JSON
4. Part 4: Graph và Chart
- Pie Chart
- Bar Chart
- Histogram
- Line Graph
- Scatterplot
5. Part 5: Thống kê
- Mean, Median & Mode
- Time Series Analysis
- Normal Distribution
- Binomial Distribution
6. Part 6: Machine Learning
- Giới thiệu, phân loại
- Linear Regression
- Logistic Regression
- Decision tree
- K-Means
Học trực tuyến
Học tại Hồ Chí Minh
Học tại Hà Nội