Siêu thị PDFTải ngay đi em, trời tối mất

Thư viện tri thức trực tuyến

Kho tài liệu với 50,000+ tài liệu học thuật

© 2023 Siêu thị PDF - Kho tài liệu học thuật hàng đầu Việt Nam

Tích hợp khai phá dữ liệu trong InfoSphere Warehouse với việc tạo báo cáo Cognos của IBM, Phần 3:
MIỄN PHÍ
Số trang
38
Kích thước
1.2 MB
Định dạng
PDF
Lượt xem
1030

Tích hợp khai phá dữ liệu trong InfoSphere Warehouse với việc tạo báo cáo Cognos của IBM, Phần 3:

Nội dung xem thử

Mô tả chi tiết

Tích hợp khai phá dữ liệu trong InfoSphere Warehouse với việc tạo báo cáo

Cognos của IBM, Phần 3: Gọi khai phá động từ Cognos khi sử dụng một ví

dụ phân tích giỏ thị trường

Benjamin G. Leonhardi, Kỹ sư phần mềm, IBM

Christoph Sieb, Kỹ sư phần mềm cao cấp, IBM

Dr. Michael J. Wurst, Kỹ sư phần mềm cao cấp, IBM

Tóm tắt: Các quy tắc kết hợp biểu thị các mặt hàng, các sự kiện hoặc các thực thể

khác nào thường xảy ra đồng thời trong các tập dữ liệu lớn. Ví dụ, có thể áp dụng

kiến thức này trong việc phân tích giỏ hàng (ND: một lần mua sắm ở một cửa

hàng có thể được xem như một giao dịch và tất cả các mặt hàng đã mua trong quá

trình này sau đó cùng xuất hiện và được gọi là một giỏ hàng hay giỏ thị trường) để

sử dụng các tiềm năng bán hàng chéo bằng cách giới thiệu các sản phẩm thường

được mua cùng với nhau. Bạn có thể áp dụng khai phá các quy tắc kết hợp trong

InfoSphere Warehouse và xuất khẩu mô hình kết quả tới các báo cáo Cognos,

tương tự như cách các bài viết trước trong loạt bài này đã làm với các mô hình

Cụm và Phân loại. Do việc khai phá quy tắc kết hợp là một nhiệm vụ tương tác

cao, nên một giải pháp tốt hơn sẽ là cho phép người dùng gọi khai phá trực tiếp từ

một báo cáo Cognos, có thể chỉ định các tham số bổ sung. Cách tiếp cận như vậy

có thể được bao hàm như là khai phá đặc biệt hoặc khai phá động. Trong bài viết

này, bạn sẽ tìm hiểu để đạt được điều này.

Mở đầu

Khi bạn đang làm việc với lượng dữ liệu lớn, điều quan trọng là bạn hiểu rõ các

quy tắc về các thực thể khác nhau có liên quan với nhau như thế nào. Thường phát

hiện ra các quy tắc này là một quá trình phức tạp. Các quy tắc kết hợp rất đơn giản

chỉ là chủ nghĩa hình thức có tác động mạnh đến các quy tắc mô tả các tập dữ liệu

vì chúng biểu thị các thực thể nào có thể xuất hiện đồng thời với nhau.

Một ví dụ truyền thống về các quy tắc kết hợp có thể thường thấy trong lĩnh vực

bán lẻ. Ví dụ, một quy tắc kết hợp chung là “NẾU trứng VÀ sữa thì SAU ĐÓ là

đường” nói lên rằng khi mua hàng nhiều khách hàng mua trứng và sữa cũng mua

đường. Quy tắc này có thể được phát hiện có hiệu quả thậm chí từ các các tập dữ

liệu rất lớn. InfoSphere Warehouse cho phép bạn tìm các quy tắc này một cách

thuận tiện như bài viết này đã mô tả chi tiết.

Bài viết trước của loạt bài này đã mô tả cách trước hết xây dựng mô hình khai phá

trong InfoSphere Warehouse và sau đó xuất bản các kết quả bằng cách sử dụng

Cognos. Điều này là tốt trong một số kịch bản. Tuy nhiên, một nhà phân tích

thường muốn tác động đến việc phân tích tương tác, ví dụ, hạn chế các quy tắc

được tìm thấy. Chuyển sang InfoSphere Warehouse DesignStudio rồi quay lại

Cognos mỗi khi thay đổi một tham số thật không thuận tiện chút nào. Do đó bạn

muốn tạo các bản ghi tương tác cho phép người dùng thiết lập các tham số trong

một báo cáo Cognos, tự động gọi khai phá trong nền tảng rồi cung cấp các kết quả

trả lại Cognos. Bài viết này cho bạn thấy cách thực hiện chính xác các bước đó.

Trước tiên, hãy tìm hiểu về nhiệm vụ khai phá quy tắc kết hợp và cách có được nó

trong InfoSphere Warehouse. Sau đó, hãy xem cách gọi động khai phá dữ liệu từ

Cognos. Cuối cùng, hãy xem một ví dụ về việc có thể sử dụng cơ chế này theo

thời gian thực.

Phân tích giỏ hàng và khai phá quy tắc kết hợp

Các quy tắc kết hợp và các ứng dụng của chúng

Các quy tắc kết hợp mô tả những mục nào thường xảy ra cùng nhau. Khái niệm về

một giao dịch có tầm quan trọng thiết yếu trong ngữ cảnh này. (Một truy cập đơn

vào một cửa hàng có thể được xem như một giao dịch và tất cả các mặt hàng đã

mua trong quá trình truy cập này sau đó đang cùng xuất hiện và được gọi là một

giỏ hàng hay tổng quát hơn là giỏ thị trường). Mặc dù, tất cả các mua sắm của

một khách hàng trong suốt một năm cũng có thể được xem như là một giao dịch.

Điều đó phụ thuộc vào loại các quy tắc nào mà bạn quan tâm.

Hãy xem xét một ví dụ đơn giản. Bảng sau đây chứa các giao dịch về các mặt

hàng. Mỗi giao dịch có chứa tất cả các mặt hàng mà một khách hàng đã mua trong

một lần truy cập vào một cửa hàng.

Hình 1. Các giao dịch mẫu

Như bạn thấy, máy tính (PC) được mua khá thường xuyên. Ngoài ra, sự kết hợp

của máy tính và màn hình (Monitor) xuất hiện trong 20% các giao dịch. Như bạn

cũng có thể thấy, trong 50% trường hợp đã mua một máy tính (PC) và màn hình

(Monitor), cũng mua một con chuột (Mouse). Nếu chúng ta lấy điều này làm một

quy tắc: [PC, Monitor]->Mouse, ở đây [Pc, Monitor] là phần thân còn Mouse là

phần đầu hoặc phần đích, thì số lượng các giao dịch bao gồm các phần thân và

Tải ngay đi em, còn do dự, trời tối mất!