Phân tích và Mô hình hóa Dữ liệu với R

PHÂN TÍCH VÀ MÔ HÌNH HÓA DỮ LIỆU VỚI R – DATA ANALYTICS AND MODELLING WITH R (LEVEL 1)

Trong thời đại 4.0, dữ liệu chính là tài sản quý giá nhất trong mọi lĩnh vực từ kinh doanh, giáo dục đến y tế. Nhanh chóng nắm bắt kiến thức và công cụ xử lý dữ liệu sẽ giúp bạn nắm trong tay một sức mạnh khổng lồ và mở ra cánh cửa cho những ứng dụng thông minh và tri thức vô hạn xung quanh.

R là một ngôn ngữ lập trình và môi trường phần mềm dành cho tính toán và đồ thị thống kê. Không giống như SAS hay Matlab, R là nguồn mở tức là người dùng có thể sử dụng hoàn toàn miễn phí. Điều này rất phù hợp với học sinh sinh viên cũng như các doanh nghiệp. Với ước tính khoảng 2 triệu người dùng, R là một trong những ngôn ngữ lập trình hàng đầu năm 2017.

R có một thư viện trực quan mạnh mẽ và được công nhận rộng rãi nhất vì khả năng hiển thị tuyệt đẹp, giúp nó vượt trội so với ngôn ngữ lập trình khoa học dữ liệu khác. Bên cạnh những thư viện sẵn có, R còn cho phép người dùng viết các chức năng của riêng bạn để đáp ứng nhu cầu cụ thể của mình.

Vậy bạn đã biết cách phân tích và mô hình hóa dữ liệu với R chưa? Khóa học sẽ giúp bạn hiểu và sử dụng thành thạo R để khai phá dữ liệu doanh nghiệp.


 THÔNG TIN KHÓA HỌC


Lợi ích đạt được

Sau khi hoàn thành khóa học, học viên sẽ nắm vững các kiến thức sau:

  • Thành thạo ngôn ngữ R
  • Khai phá dữ liệu: tổng hợp, làm sạch, chuẩn hóa, biến đổi dữ liệu kinh doanh
  • Biểu diễn hình ảnh và tạo lập các báo cáo Business Intelligence hiệu quả
  • Sử dụng các phương pháp thống kê để phân tích dữ liệu kinh doanh
  • Xây dựng các mô hình dự báo xu hướng và rủi ro
  • Làm chủ quá trình triển khai dự án khoa học dữ liệu trong Doanh nghiệp

—————————————————————

Đối tượng

Dành cho học viên muốn trở thành

  • Data Analyst
  • Business Analyst
  • Business Intelligence
  • Machine Learning Specialist
  • Data Manager

—————————————————————

Học viên tối thiểu: 15 học viên/lớp

—————————————————————

Giảng viên:

  • Nguyễn Quang Giảng viên tại ĐH Quốc tế Hồng Bàng
  • Có nhiều năm kinh nghiệm đào tạo Khoa học Dữ liệu (Data Science), đã hướng dẫn nhiều học viên từ VNPT, FPT Media, Vietinbank, Sacombank, ACB, PVEP, iCareBenefits, …

—————————————————————

Thời gian

  • Thời lượng: 30 giờ
  • Thời gian học: 4 ngày cuối tuần, từ 8h30 – 17h

CHƯƠNG TRÌNH HỌC


Phần 1: Giới thiệu

  • Giá trị của Dữ liệu và vai trò của Khoa học Dữ liệu
  • Quy trình một dự án Khoa học dữ liệu
  • Cách nhận diện bài toán Dữ liệu trong Doanh nghiệp và giá trị mang lại
  • Giới thiệu công cụ: R, RStudio, Markdown

Phần 2: Ngôn ngữ R

Ngôn ngữ lập trình R từ cơ bản đến nâng cao

Thao tác với dữ liệu

  • Tải dữ liệu, ghép nối, tổng hợp, làm sạch, xây dựng từ điển dữ liệu
  • Xây dựng báo cáo kinh doanh cơ bản

Phần 3: Khai phá dữ liệu

  • Khai phá dữ liệu kinh doanh (EDA): thống kê và biểu diễn đồ thị đơn biến phân loại và liên tục
  • Thống kê và biểu diễn đồ thị đa biến với ggplot2
  • Phân nhóm dữ liệu

Phần 4: Business Intelligence

  • Giới thiệu về Business Intelligence
  • Thực hành xây dựng báo cáo Business Intelligence với Tableau

Phần 5: Biến đổi dữ liệu và Mô hình thống kê

Biến đổi dữ liệu

  • Tìm kiếm điểm bất thường
  • Chuẩn hóa dữ liệu, xử lý phân bố
  • Tạo biến mới từ dữ liệu

Các mô hình thống kê

  • Khoảng tin cậy
  • Kiểm định giả thiết
  • Phương pháp Bootstrap dữ liệu
  • Phân tích phương sai (ANOVA)

Phần 6: Mô hình dự báo biến liên tục

Mô hình Hồi quy:

  • Hồi quy đơn biến
  • Phân tích sai số
  • Hồi quy đa biến
  • Mô hình k-nearest neighbour (KNN)

Phần 7: Mô hình dự báo biến phân loại

  • Các mô hình phân loại
  • Giới thiệu các mô hình phân loại
  • Mô hình Hồi quy Logistics
  • Mô hình Cây quyết định
  • Mô hình Bagging và Random Forest

Phần 8: Đánh giá mô hình và nâng cao

  • Đánh giá và hiệu chỉnh mô hình
  • Đánh giá mô hình liên tục
  • Đánh giá mô hình phân loại
  • Xây dựng biến mới
  • Lựa chọn biến

Phần 9: Các mô hình không giám sát

  • Mô hình phân cụm: “k-mean” và “hierarchical clustering”
  • Mô hình khuyến nghị “collaborative filtering”

Phần 10: Giới thiệu về mạng Neuron và Deep Learning

  • Giới thiệu về mạng Neuron và Deep Learning
  • Cách trình bày kết quả dự án ML
  • Dự án cuối khóa học

Nối tiếp chương trình của khóa học “Phân tích và mô hình hóa dữ liệu với R” (level1), khóa học tiếp theo Machine Learning with Python (Level 2) sẽ giúp trang bị cho học viên những kiến thức chuyên sâu hơn về Phân tích dữ liệu.


THÔNG TIN LIÊN HỆ


Học viện Doanh nghiệp ABIZ- ĐH Đà Nẵng

Trung tâm phát triển phần mềm ĐH Đà Nẵng (SDC)

——————————————————————————————————————————————

Học viện doanh nghiệp ABIZ- ĐH Đà Nẵng là đơn vị đối tác của Học viện chiến lược, một đơn vị thành viên của VMCG do ôngTrịnh Minh Giang (MBA) làm Chủ tịch và là người sáng lập Học viện Chiến lược, đồng sáng lập Học viện Dữ liệu, tư vấn trưởng, giảng viên về các mô hình phân tích chiến lược, về chiến lược chuyển đổi số, nền tảng số và phát triển chương trình thành viên. Bên cạnh đó, ABIZ còn là đối tác của nhiều đơn vị giáo dục lớn uy tín ở Việt Nam và trên thế giới. Chương trinh đào tạo chất lượng, đa dạng, đón đầu xu hướng tại ABIZ sẽ trang bị cho người học những kiến thức mới giúp tối ưu hóa giá trị kinh doanh.

——————————————————————————————————————————————

Bài viết tiếp theo

Đăng ký học





Khóa học
Số lượng

Academy Of Business (ABIZ)