Thay vì nhấn mạnh vào lý thuyết thuần túy, nhóm tác giả trình bày quyển sách “KHAI THÁC DỮ LIỆU VỚI R” theo cách mà bạn đọc có thể tham chiếu nhanh các lệnh thực thi cũng như ví dụ minh họa cho các nội dung phân tích dữ liệu phổ biến: Xử lý dữ liệu cơ bản, trực quan hóa dữ liệu với các biểu đồ thông dụng, kiểm định thống kê, phân tích phương sai, phân tích hồi quy, các kỹ thuật phân tích quy trình và chất lượng với Six Sigma, khai thác dữ liệu văn bản (text mining).
Phân tích dữ liệu là một trong các chủ đề được quan tâm và thu hút bạn đọc trên toàn thế giới. Bởi vì quá trình chuyển dữ liệu thô thành dữ liệu có thể dùng được và phân tích dữ liệu để đưa ra kết luận khoa học là rất quan trọng trong hầu hết các quyết định kinh tế và kỹ thuật. Các kỹ thuật phân tích dữ liệu ngày càng trở nên quan trọng hơn trong thời đại kỹ thuật số với sự bùng nổ của dữ liệu. Theo sự phát triển của khoa học kỹ thuật, hiện nay có rất nhiều công cụ hỗ trợ để phân tích dữ liệu, bao gồm cả phần mềm thương mại và mã nguồn mở.
R đem đến sự khác biệt lớn vì R là phần mềm với mã nguồn mở, hoàn toàn miễn phí, không bị ràng buộc về bản quyền, có rất nhiều tính năng phân tích dữ liệu từ thống kê cho đến tài chính, dự báo chuỗi thời gian và đặc biệt luôn được cập nhật từ các nhà nghiên cứu trên toàn thế giới, kể cả bạn đọc cũng có thể đóng góp vào sự phát triển của R.
Tuy nhiên, bạn đọc cần biết cách sử dụng mã nguồn (package), hàm và viết cú pháp đúng trong R để phục vụ cho việc phân tích, điều này làm cho R kém thân thiện. Mặc dù có rất nhiều tài liệu hướng dẫn về ngôn ngữ R, nhưng nội dung quyển sách này được chọn lọc và tập trung nhằm phục vụ đa dạng các kỹ thuật khai thác dữ liệu trong công việc, từ kế toán cho đến kỹ sư sản xuất. Ngoài ra, cấu trúc quyển sách được thiết kế sao cho bạn đọc có thể tham khảo nhanh với đầy đủ các hàm, cú pháp nhằm tối giản thời gian tìm kiếm các lệnh trong R.
Quyển sách này không thể hoàn thành nếu không có nguồn tài liệu tham khảo phong phú từ các nhà nghiên cứu, các chuyên gia đã tạo ra các package nói riêng cũng như R nói chung. Ngoài ra, nhóm tác giả cũng cảm ơn các đồng nghiệp đã đóng góp ý kiến và giúp đỡ hoàn thiện quyển sách này. Sai sót là không thể tránh khỏi. Nhóm tác giả rất trân trọng và biết ơn những ý kiến đóng góp quý báu từ bạn đọc.
Phân Tích Dữ Liệu (Lean Six Sigma) với Phần Mêm R Dành Cho Chuyên Gia Và Doanh Nghiệp
Sách có đính kèm tập dữ liệu thực hành: Downloads
Trở thành người tiên phong và chuyên gia cải tiến quy trình sản xuất tinh gọn.
Người học sẽ được trang bị kiến thức và kỹ năng để cải thiện hiệu quả vận hành của tổ chức, cung cấp các giải pháp cho các vấn đề liên quan tới quy trình như năng suất và chất lượng, và hiểu rõ triết lý quản lý Lean.
Ứng dung tốt các phương pháp Lean Six Sigma, tự tin và dẫn dắt dự án cải tiến.
Người học đai xanh có khả năng áp dụng Lean Six Sigma, nhận diện tiềm năng cải tiến, tối ưu hóa quy trình với DMAIC, khám phá nguyên nhân gốc rễ, và dẫn dắt dự án cải tiến với sự tham gia từ nhiều bộ phận.
Thông thạo hầu hết các phương pháp Lean Six Sigma, dẫn dắt và quản lý dự án cải tiến.
Người học đai đen sẽ nắm vững các phương pháp Lean Six Sigma, tối ưu hóa quy trình với DMAIC, mô hình hóa quy trình bằng Thiết Kế Thực Nghiệm, dẫn dắt dự án cải tiến và điều hành nhóm để đạt kết quả tốt nhất cho tổ chức.