ỨNG DỤNG PHÂN TÍCH DỮ LIỆU CỦA CÁC CÔNG TY CÔNG NGHỆ HÀNG ĐẦU TẠI VIỆT NAM

Phân tích dữ liệu là một thuật ngữ đang được nhiều người nhắc đến. Không ai có thể phủ nhận những lợi ích mà phân tích tích dữ liệu mang lại trong thời kỳ bùng nổ dữ liệu như hiện nay. Hôm nay, ABIZ sẽ chia sẻ với các bạn cái nhìn thực tế về việc áp dụng phân tích dữ liệu để giải quyết các bài toán khó của doanh nghiệp.

FPT Telecom – Phân tích dữ liệu để dự đoán khách hàng rời mạng

Trong buổi chia sẻ tại diễn đàn công nghệ Solution Forum tại FPT Software tại Hồ Chí Minh, chị Võ Thị Hồng Phương – Data Scientist (nhà khoa học dữ liệu), Trưởng nhóm phân tích dữ liệu FPT Telecom, đã cung cấp cho một cái nhìn thực tế về ứng dụng phân tích dữ liệu, Machine Learning trong việc giải quyết một bài toán cụ thể phục vụ kinh doanh.

FPT Telecom cung cấp nhiều dịch vụ, trong đó dịch vụ chính là Internet và Truyền hình FPT. Hiện tỷ lệ rời mạng của FPT Telecom chiếm 1%. Liệu tỷ lệ thấp này có đáng để dùng dữ liệu phân tích?

Theo chị Phương, việc chú trọng đến tập khách hàng (có khả năng) rời mạng được Ban lãnh đạo FPT Telecom quan tâm vì nhiều lý do. Bởi giữ chân khách hàng sẽ giúp tăng uy tín thương hiệu, tăng doanh thu. Do lợi nhuận chỉ bắt đầu có sau 12 – 18 tháng. Cạnh đó, chi phí đầu tư mỗi khách hàng mới nhiều gấp 5 – 10 lần khách hàng cũ. Việc bán cho khách hàng mới cũng sẽ bị ảnh hưởng bởi việc khách cũ rời mạng. Nhận thức được những điều đó, FPT Telecom luôn cố gắng níu kéo từng khách hàng một, tìm biện pháp để kịp thời giữ chân khách hàng có nguy cơ rời mạng.

Đề bài chỉ có một câu hỏi: “Ai là khách hàng có thể rời mạng?”, ngoài ra không có thêm thông số đi kèm hay gợi ý nào. Nhóm phân tích dữ liệu phải trải qua nhiều bước khác nhau như cắt nghĩa vấn đề (define problem), tập hợp dữ liệu, làm sạch – chuẩn hóa dữ liệu, huấn luyện mô hình, kiểm thử, hoàn thiện và triển khai vào hệ thống.

Chị Võ Thị Hồng Phương, Trưởng nhóm phân tích dữ liệu FPT Telecom (Thứ 2 bên trái qua)

“Define problem là cực kỳ quan trọng”, chị Phương nhấn mạnh. Đây chính là tiền đề của cả quá trình về sau. Sau đó, cần chú ý các khâu lấy thông tin, tập hợp thông tin (chẳng hạn như số liệu các chi nhánh, các thông số liên quan chính sách bán hàng, thông tin khách hàng và hành vi sử dụng dịch vụ, độ hài lòng…).

Phần lớn thời gian công sức ở bước preprocessing (tiền xử lý) dữ liệu, xoay sở sao cho dữ liệu được sắp xếp logic nhất, đẹp nhất. “Không tin ai hết” là điều đội ngũ luôn tâm niệm bởi vì chỉ cần một ngày máy không lưu dữ liệu hay người nhập liệu vô tình gõ sai thì dữ liệu vẫn sai. Nhiều tình huống tưởng chừng như không thể vẫn có thể xảy ra. Bởi thế, luôn luôn chú ý làm sạch và chuẩn hóa dữ liệu và đây là một trong những mục tiêu hàng đầu của nhóm trong suốt 3-4 năm qua.

Khâu chuyển đổi dữ liệu (transforming data) lại là một quá trình mất thời gian không kém. Từ dữ liệu thu thập được, nhóm cần tìm ra những dữ liệu có ý nghĩa cho việc phân tích, dự đoán, từ đó chọn feature (đặc tính) sáng cho model (mô hình) học. Trước tiên, nhóm phải nghĩ ra khá nhiều yếu tố, giả định tác động để tách 2 nhóm khách hàng (có khả năng rời mạng hoặc không) như tần suất liên lạc đội kỹ thuật, đặc điểm hợp đồng, độ tuổi người ký, hạ tầng xung quanh, thời hạn hợp đồng… Sau đó, theo dõi và phân tích xem đâu là những logic thật sự, cho model học điểm rời mạng và kiểm thử.

“Suy nghĩ chủ quan chưa chắc đúng” và “cần cố gắng suy nghĩ nhiều khía cạnh nhất” là lời khuyên mà chị Phương đúc kết qua những kinh nghiệm thực tế của mình. Chạy một thuật toán mất rất nhiều thời gian và theo chị, cần khéo léo tính toán để không phải thử quá nhiều lần, từ đó rút ngắn thời gian xây dựng model. Chính vì thế, nếu cùng bài toán tương tự nhưng nếu ở công ty khác, trường hợp kinh doanh khác, đội ngũ vẫn phải tìm hiểu lại việc kinh doanh, chính sách, cách phân bố dữ liệu…

Và sau khi xây dựng, kiểm thử, cho chạy mô hình, nhóm phân tích dữ liệu FPT Telecom phải thuyết phục doanh nghiệp tin tưởng vào hệ thống của mình bằng chính hiệu quả chạy thử được đo đếm kỹ lưỡng qua thời gian dài.

 

CMC SISG – Áp dụng phân tích dữ liệu để giúp ngân hàng tiên đoán chính xác rủi ro tín dụng

(Ông) Huỳnh Ngọc Tấn – Chủ nhiệm Chương trình Dịch vụ Khoa học Dữ liệu, khối GPDV Doanh nghiệp, CMC SISG trình bày tham luận tại sự kiện

Ông Huỳnh Ngọc Tấn – Chủ nhiệm chương trình Dịch vụ Khoa học Dữ liệu, khối Giải pháp Dịch vụ doanh nghiệp, CMC SISG đã từng trình bày về việc áp dự phân tích dữ liệu để giúp ngân hàng dự báo một cách chính xác về rủi ro tín dụng tại Diễn đàn ngân hàng bán lẻ 2017.

Theo ông, chuyển đổi dữ liệu số rất cần thiết với ngân hàng bán lẻ. Chuyển đổi dữ liệu số hay Data Driven Transformation là một hình thức phát triển chiến lược kinh doanh tài chính số của doanh nghiệp tài chính ngân hàng trong đó tận dụng ưu thế nguồn dữ liệu hiện hữu của mình để thực hiện những phân tích sâu nhằm hiểu rõ hơn về khách hàng, vận hành hay tài chính. Và từ đó tiến hành cải thiện hiệu suất kinh doanh, tạo ra những điều chỉnh trong chiến lược kinh doanh số của mình.

Hiện nay, vấn đề về nợ xấu, rủi ro tín dụng đang khiến nhiều ngân hàng phải đau đầu. Và bài toán được đưa ra là làm thế nào để có thể dự báo chính xác con số này cho ngân hàng?

Việc áp dụng phân tích dữ liệu vào hoạt động kinh doanh trong ngành tài chính ngân hàng đã có từ rất lâu, tuy nhiên với những hạn chế về mặt thông tin lẫn nguồn lực, các phân tích hiện đang chỉ xoay quanh các hình thái báo cáo tổng hợp hoặc các Dashboard vận hành.

Ngày nay, với sự bùng nổ của lượng dữ liệu (Big Data), việc áp dụng phương pháp phân tích dữ liệu nâng cao như Big Data Analytic hay Machine Learning sẽ giúp Ngân hàng có thể nhìn vào thật sâu trong dữ liệu hiện hữu của mình, có được những năng lực tiên đoán tốt hơn, chính xác hơn trong rủi ro tín dụng. Việc tiên đoán chính xác hơn rủi ro tín dụng kéo theo sự cải thiện các thông số tài chính khác, ví dụ như hoạt động trích lập dự phòng sẽ được cải thiện đáng kể.

Hi vọng sau bài viết này, các bạn sẽ hiểu rõ hơn giá trị của dữ liệu và nắm được phần nào công việc của một nhà phân tích dữ liệu.

>>> Xem thêm

Academy Of Business (ABIZ)