Thư viện tri thức trực tuyến
Kho tài liệu với 50,000+ tài liệu học thuật
© 2023 Siêu thị PDF - Kho tài liệu học thuật hàng đầu Việt Nam

Tích hợp khai phá dữ liệu trong InfoSphere Warehouse với việc tạo báo cáo Cognos của IBM, Phần 3:
Nội dung xem thử
Mô tả chi tiết
Tích hợp khai phá dữ liệu trong InfoSphere Warehouse với việc tạo báo cáo
Cognos của IBM, Phần 3: Gọi khai phá động từ Cognos khi sử dụng một ví
dụ phân tích giỏ thị trường
Benjamin G. Leonhardi, Kỹ sư phần mềm, IBM
Christoph Sieb, Kỹ sư phần mềm cao cấp, IBM
Dr. Michael J. Wurst, Kỹ sư phần mềm cao cấp, IBM
Tóm tắt: Các quy tắc kết hợp biểu thị các mặt hàng, các sự kiện hoặc các thực thể
khác nào thường xảy ra đồng thời trong các tập dữ liệu lớn. Ví dụ, có thể áp dụng
kiến thức này trong việc phân tích giỏ hàng (ND: một lần mua sắm ở một cửa
hàng có thể được xem như một giao dịch và tất cả các mặt hàng đã mua trong quá
trình này sau đó cùng xuất hiện và được gọi là một giỏ hàng hay giỏ thị trường) để
sử dụng các tiềm năng bán hàng chéo bằng cách giới thiệu các sản phẩm thường
được mua cùng với nhau. Bạn có thể áp dụng khai phá các quy tắc kết hợp trong
InfoSphere Warehouse và xuất khẩu mô hình kết quả tới các báo cáo Cognos,
tương tự như cách các bài viết trước trong loạt bài này đã làm với các mô hình
Cụm và Phân loại. Do việc khai phá quy tắc kết hợp là một nhiệm vụ tương tác
cao, nên một giải pháp tốt hơn sẽ là cho phép người dùng gọi khai phá trực tiếp từ
một báo cáo Cognos, có thể chỉ định các tham số bổ sung. Cách tiếp cận như vậy
có thể được bao hàm như là khai phá đặc biệt hoặc khai phá động. Trong bài viết
này, bạn sẽ tìm hiểu để đạt được điều này.
Mở đầu
Khi bạn đang làm việc với lượng dữ liệu lớn, điều quan trọng là bạn hiểu rõ các
quy tắc về các thực thể khác nhau có liên quan với nhau như thế nào. Thường phát
hiện ra các quy tắc này là một quá trình phức tạp. Các quy tắc kết hợp rất đơn giản
chỉ là chủ nghĩa hình thức có tác động mạnh đến các quy tắc mô tả các tập dữ liệu
vì chúng biểu thị các thực thể nào có thể xuất hiện đồng thời với nhau.
Một ví dụ truyền thống về các quy tắc kết hợp có thể thường thấy trong lĩnh vực
bán lẻ. Ví dụ, một quy tắc kết hợp chung là “NẾU trứng VÀ sữa thì SAU ĐÓ là
đường” nói lên rằng khi mua hàng nhiều khách hàng mua trứng và sữa cũng mua
đường. Quy tắc này có thể được phát hiện có hiệu quả thậm chí từ các các tập dữ
liệu rất lớn. InfoSphere Warehouse cho phép bạn tìm các quy tắc này một cách
thuận tiện như bài viết này đã mô tả chi tiết.
Bài viết trước của loạt bài này đã mô tả cách trước hết xây dựng mô hình khai phá
trong InfoSphere Warehouse và sau đó xuất bản các kết quả bằng cách sử dụng
Cognos. Điều này là tốt trong một số kịch bản. Tuy nhiên, một nhà phân tích
thường muốn tác động đến việc phân tích tương tác, ví dụ, hạn chế các quy tắc
được tìm thấy. Chuyển sang InfoSphere Warehouse DesignStudio rồi quay lại
Cognos mỗi khi thay đổi một tham số thật không thuận tiện chút nào. Do đó bạn
muốn tạo các bản ghi tương tác cho phép người dùng thiết lập các tham số trong
một báo cáo Cognos, tự động gọi khai phá trong nền tảng rồi cung cấp các kết quả
trả lại Cognos. Bài viết này cho bạn thấy cách thực hiện chính xác các bước đó.
Trước tiên, hãy tìm hiểu về nhiệm vụ khai phá quy tắc kết hợp và cách có được nó
trong InfoSphere Warehouse. Sau đó, hãy xem cách gọi động khai phá dữ liệu từ
Cognos. Cuối cùng, hãy xem một ví dụ về việc có thể sử dụng cơ chế này theo
thời gian thực.
Phân tích giỏ hàng và khai phá quy tắc kết hợp
Các quy tắc kết hợp và các ứng dụng của chúng
Các quy tắc kết hợp mô tả những mục nào thường xảy ra cùng nhau. Khái niệm về
một giao dịch có tầm quan trọng thiết yếu trong ngữ cảnh này. (Một truy cập đơn
vào một cửa hàng có thể được xem như một giao dịch và tất cả các mặt hàng đã
mua trong quá trình truy cập này sau đó đang cùng xuất hiện và được gọi là một
giỏ hàng hay tổng quát hơn là giỏ thị trường). Mặc dù, tất cả các mua sắm của
một khách hàng trong suốt một năm cũng có thể được xem như là một giao dịch.
Điều đó phụ thuộc vào loại các quy tắc nào mà bạn quan tâm.
Hãy xem xét một ví dụ đơn giản. Bảng sau đây chứa các giao dịch về các mặt
hàng. Mỗi giao dịch có chứa tất cả các mặt hàng mà một khách hàng đã mua trong
một lần truy cập vào một cửa hàng.
Hình 1. Các giao dịch mẫu
Như bạn thấy, máy tính (PC) được mua khá thường xuyên. Ngoài ra, sự kết hợp
của máy tính và màn hình (Monitor) xuất hiện trong 20% các giao dịch. Như bạn
cũng có thể thấy, trong 50% trường hợp đã mua một máy tính (PC) và màn hình
(Monitor), cũng mua một con chuột (Mouse). Nếu chúng ta lấy điều này làm một
quy tắc: [PC, Monitor]->Mouse, ở đây [Pc, Monitor] là phần thân còn Mouse là
phần đầu hoặc phần đích, thì số lượng các giao dịch bao gồm các phần thân và