Siêu thị PDFTải ngay đi em, trời tối mất

Thư viện tri thức trực tuyến

Kho tài liệu với 50,000+ tài liệu học thuật

© 2023 Siêu thị PDF - Kho tài liệu học thuật hàng đầu Việt Nam

Dự báo trên chuỗi thời gian dựa vào phương pháp gom cụm sử dụng thuật toán K - Mean :Luận văn thạc sĩ - Chuyên ngành: Khoa học máy tính
PREMIUM
Số trang
67
Kích thước
3.0 MB
Định dạng
PDF
Lượt xem
1905

Dự báo trên chuỗi thời gian dựa vào phương pháp gom cụm sử dụng thuật toán K - Mean :Luận văn thạc sĩ - Chuyên ngành: Khoa học máy tính

Nội dung xem thử

Mô tả chi tiết

BỘ CÔNG THƯƠNG

TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP THÀNH PHỐ HỒ CHÍ MINH

NGUYỄN MINH QUÂN

DỰ BÁO TRÊN CHUỖI THỜI GIAN

DỰA VÀO PHƯƠNG PHÁP GOM CỤM

SỬ DỤNG THUẬT TOÁN K-MEAN

Chuyên ngành: KHOA HỌC MÁY TÍNH

Mã chuyên ngành: 60480101

LUẬN VĂN THẠC SĨ

THÀNH PHỐ HỒ CHÍ MINH, NĂM 2019

Công trình được hoàn thành tại Trường Đại học Công nghiệp TP. Hồ Chí Minh.

Người hướng dẫn khoa học: TS. Nguyễn Thành Sơn

Người phản biện 1: ...................................................................................................

Người phản biện 2:....................................................................................................

Luận văn thạc sĩ được bảo vệ tại Hội đồng chấm bảo vệ Luận văn thạc sĩ Trường Đại

học Công nghiệp thành phố Hồ Chí Minh ngày . . . . . tháng . . . . năm . . . . .

Thành phần Hội đồng đánh giá luận văn thạc sĩ gồm:

1. ......................................................................- Chủ tịch Hội đồng

2. ......................................................................- Phản biện 1

3. ......................................................................- Phản biện 2

4. ......................................................................- Ủy viên

5. ......................................................................- Thư ký

(Ghi rõ họ, tên, học hàm, học vị của Hội đồng chấm bảo vệ luận văn thạc sĩ)

CHỦ TỊCH HỘI ĐỒNG TRƯỞNG KHOA CNTT

NHIỆM VỤ LUẬN VĂN THẠC SĨ

Họ tên học viên: Nguyễn Minh Quân MSHV: 15118331

Ngày, tháng, năm sinh: 28/09/1990 Nơi sinh: Đồng Nai

Chuyên ngành: Khoa học máy tính Mã chuyên ngành: 60480101

I. TÊN ĐỀ TÀI:

Dự báo trên chuỗi thời gian bằng phương pháp gom cụm sử dụng thuật toán k-Mean

NHIỆM VỤ VÀ NỘI DUNG:

Nghiên cứu các kiến thức nền tảng về bài toán dự báo trên chuỗi thời gian, các phương

pháp dự báo trên chuỗi thời gian. Nghiên cứu ứng dụng phương pháp gom cụm bằng

thuật toán k-Mean vào bài toán dự báo dữ liệu chuỗi thời gian. Từ đó xây dựng

chương trình thực nghiệm để đánh giá tính hiệu quả cũng như ứng dụng vào thực tế

của phương pháp.

II. NGÀY GIAO NHIỆM VỤ: Theo quyết định số 1486/QĐ-ĐHCN 25/6/2018

III. NGÀY HOÀN THÀNH NHIỆM VỤ: 25/12/2018

IV. NGƯỜI HƯỚNG DẪN KHOA HỌC: TS. Nguyễn Thành Sơn

Tp. Hồ Chí Minh, ngày … tháng … năm 2019

NGƯỜI HƯỚNG DẪN CHỦ NHIỆM BỘ MÔN ĐÀO TẠO

TRƯỞNG KHOA CÔNG NGHỆ THÔNG TIN

BỘ CÔNG THƯƠNG

TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP

THÀNH PHỐ HỒ CHÍ MINH

CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM

Độc lập - Tự do - Hạnh phúc

i

LỜI CẢM ƠN

Sau thời gian học tập và nghiên cứu tại trường đại học Công Nghiệp TP. HCM, bằng

sự biết ơn và kính trọng, tôi xin gửi lời cảm ơn chân thành đến Ban Giám Hiệu, các

phòng, các khoa thuộc trường đại học Công Nghiệp TP. HCM và quý thầy cô đã nhiệt

tình hướng dẫn, giảng dạy và tạo mọi điều kiện thuận lợi giúp đỡ tôi trong suốt quá

trình học tập, nghiên cứu và hoàn thành đề tài nghiên cứu khoa học này.

Đặc biệt, tôi xin bày tỏ lòng biết ơn sâu sắc tới TS. Nguyễn Thành Sơn, người thầy

đã trực tiếp hướng dẫn, giúp đỡ tôi trong quá trình thực hiện đề tài này.

Tôi cũng xin cảm ơn các bạn lớp CHKHMT 5B đã đóng góp ý kiến cũng như giúp

đỡ động viên tôi vững tin hơn, có động lực hơn trong suốt quá trình học và nghiên

cứu.

Tuy nhiên, điều kiện và năng lực bản thân còn hạn chế, chuyên đề nghiên cứu khoa

học chắc chắn không tránh khỏi những thiếu sót. Kính mong nhận được sự đóng góp

ý kiến của quý thầy cô, bạn bè và đồng nghiệp đề bài nghiên cứu của tôi được hoàn

thiện hơn.

Tôi xin trân trọng cảm ơn.

ii

TÓM TẮT LUẬN VĂN THẠC SĨ

Dữ liệu chuỗi thời gian là loại dữ liệu được sử dụng phổ biến trong các lĩnh vực khoa

học, công nghệ, y học và thương mại. Chẳng hạn, trong y khoa người ta có thể sử

dụng các bài toán về chuỗi thời gian để xây dựng chương trình dò tìm tự động trên

điện não đồ của bệnh nhân để phát hiện bệnh, hoặc trong lĩnh vực chứng khoán ta có

thể ứng dụng các bài toán về chuỗi thời gian để xây dựng chương trình dự báo xu thế

biến động của chứng khoán trong thời gian sắp tới…

Dự báo trên dữ liệu chuỗi thời gian đã và đang là một công việc phức tạp và thách

thức đối với các nhà nghiên cứu. Đã có nhiều phương pháp dự báo chuỗi thời gian đã

được giới thiệu và đưa vào ứng dụng trong thực tế .

Gần đây một số phương pháp dự báo trên dữ liệu chuỗi thời gian dựa vào hướng tiếp

cận gom cụm đã được ứng dụng dự báo cho một số lĩnh vực cụ thể (như thời tiết,

chứng khoán, giá điện và nhu cầu sử dụng điện)

Trong luận văn này, chúng tôi tập trung nghiên cứu đánh giá hiệu quả của việc sử

dụng phương pháp gom cụm bằng thuật toán k-Mean. So sánh với một số phương

pháp khác. Tính hiệu quả của phương pháp này được đánh giá bằng thực nghiệm trên

các tập dữ liệu thực.

iii

ABSTRACT

Time series data is the most commonly data that used in the fields of science,

technology, medicine and commerce. For example, in medicine, the time series

problems is used to build an automatic detection program on a patient's

electroencephalogram to detect disease, or in the field of securities we can using the

time series problems to build a program to forecast the volatility trend of securities in

the near future ...

Forecasting on time series data has been a complex and challenging task for

researchers. There have been many time series prediction methods that have been

introduced and put into practice.

Recently, a number of prediction methods on time series data based on clustering

approaches have been applied for a number of specific areas (such as weather,

securities, electricity prices and electricity demand).

In this thesis, we focus on studying the effectiveness of using a k-Mean clustering

algorithm. Compare with some other methods. The effectiveness of this method is

evaluated experimentally on real data sets.

Tải ngay đi em, còn do dự, trời tối mất!