Thư viện tri thức trực tuyến
Kho tài liệu với 50,000+ tài liệu học thuật
© 2023 Siêu thị PDF - Kho tài liệu học thuật hàng đầu Việt Nam

Tích hợp khai phá dữ liệu trong InfoSphere Warehouse với việc tạo báo cáo Cognos của IBM, Phần 2:
Nội dung xem thử
Mô tả chi tiết
Tích hợp khai phá dữ liệu trong InfoSphere Warehouse với việc tạo báo cáo
Cognos của IBM, Phần 2: Phát hiện sai lệch với InfoSphere Warehouse và
Cognos
Phổ biến kết quả khai phá dữ liệu của bạn có hiệu quả
Benjamin G. Leonhardi, Kỹ sư phần mềm, IBM
Christoph Sieb, Kỹ sư phần mềm cao cấp, IBM
Dr. Michael J. Wurst, Kỹ sư phần mềm cao cấp, IBM
Tóm tắt: Trong phần trước của loạt bài này, bạn đã tìm hiểu cách hiển thị hóa các
kết quả khai phá dữ liệu đơn giản trong IBM® Cognos®. Trong bài viết này, hãy
tìm hiểu một số kỹ thuật tiên tiến, như hoạt động truy vấn ngược (drill-down) và
trích xuất thông tin có cấu trúc từ các mô hình khai phá dữ liệu với Cognos. Khi
sử dụng kịch bản nghiệp vụ và ví dụ hoạt động đi kèm, cần hiểu nhiệm vụ khai
phá dữ liệu về phát hiện sai lệch, đó là, nhiệm vụ nhận biết các bản ghi dữ liệu
khác thường. Xem cách tìm các bản ghi như vậy với khai phá dữ liệu IBM
InfoSphere™ Warehouse (Kho dữ liệu InfoSphere của IBM) và tạo các báo cáo
tương tác cho phép thăm dò tương tác.
Mở đầu
Phát hiện hành vi đáng ngờ đúng lúc là một nhiệm vụ quan trọng trong nhiều ứng
dụng CNTT hiện nay. Ví dụ, hãy tưởng tượng các giao dịch thẻ tín dụng. Nếu một
người dùng cho thấy có hành vi mua sắm cao bất thường (ví dụ, mua sắm tại một
cửa hàng giảm giá thường xuyên và sau đó mua đồ trang sức đắt tiền), thì thật là
tốt để có thể kiểm tra các giao dịch tương ứng có dấu hiệu gian lận. Tuy nhiên, có
thể sử dụng các sai lệch trong nhiều tình huống khác hơn là chỉ để phát hiện gian
lận và giả mạo. Các cơ quan về nguồn nhân lực sử dụng việc phát hiện sai lệch để
tìm ra các nhân viên hoặc các ứng cử viên không phù hợp với các phạm trù thông
thường và có thể bỏ qua khi áp dụng các quy tắc cố định để xác định các tiềm
năng cao.
Các bản ghi dữ liệu lệch khỏi toàn bộ phân bố các bản ghi dữ liệu được gọi là các
ngoại lệ. Việc xử lý ngoại lệ thường không phải là một nhiệm vụ hoàn toàn được
tự động hóa. Đúng hơn là, sử dụng việc khai phá dữ liệu để chỉ ra các bản ghi dữ
liệu đáng được xem xét kỹ hơn bởi một nhà phân tích hoặc một chuyên gia về con
người, là người sau đó phải quyết định xem có hành động hay không. Vì thế, một
giao diện người dùng và mô hình tương tác tinh vi là một điều kiện tiên quyết để
xử lý thành công các ngoại lệ. Cognos rất thích hợp cho công việc này. Trên thực
tế, một bản ghi tương tự như bản ghi được tạo ra trong bài viết đầu tiên của loạt
bài này có thể được sử dụng để hiển thị trực quan các ngoại lệ. Hãy tận dụng toàn
bộ tiềm năng của Cognos để hiển thị các ngoại lệ, tuy nhiên, bạn cần sử dụng một
số tính năng cao cấp hơn. Trước tiên, hãy xem cách sử dụng "truy vấn ngược-drillthrough" (ND: drill-through là một tính năng cho phép người dùng từ báo cáo tổng
hợp tìm ngược về tận bản ghi dữ liệu gốc. Sau đây gọi là truy vấn ngược) để tạo
các báo cáo Cognos tương tác và cách liên kết các bản ghi. Điều này sẽ giúp tóm
tắt thông tin và vẫn dành chỗ để truy cập nhanh đến các bản ghi dữ liệu ngoại lệ có
liên quan. Thứ hai, tìm hiểu cách có thể trích xuất thông tin bổ xung từ các mô
hình khai phá dữ liệu giúp các chuyên gia về con người hiểu bản chất của một
ngoại lệ.
Ví dụ đang chạy trong bài viết này là một ứng dụng giúp các nhân viên của một
ngân hàng nhận biết các khách hàng tỏ ra có hành vi bất thường. Có thể sử dụng
việc này để tránh gian lận hoặc để phát hiện khách hàng đáng được quan tâm đặc
biệt. Trong phần sau, trình bày một tổng quan về phát hiện sai lệch và xem cách có
thể sử dụng InfoSphere Warehouse để tìm ra các ngoại lệ trong các tập dữ liệu lớn.
Các phần tiếp theo trình bày các vấn đề cơ bản về truy vấn ngược (drill-through)