Thư viện tri thức trực tuyến
Kho tài liệu với 50,000+ tài liệu học thuật
© 2023 Siêu thị PDF - Kho tài liệu học thuật hàng đầu Việt Nam

Dự báo trên chuỗi thời gian dựa vào phương pháp gom cụm sử dụng thuật toán K - Mean :Luận văn thạc sĩ - Chuyên ngành: Khoa học máy tính
Nội dung xem thử
Mô tả chi tiết
BỘ CÔNG THƯƠNG
TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP THÀNH PHỐ HỒ CHÍ MINH
NGUYỄN MINH QUÂN
DỰ BÁO TRÊN CHUỖI THỜI GIAN
DỰA VÀO PHƯƠNG PHÁP GOM CỤM
SỬ DỤNG THUẬT TOÁN K-MEAN
Chuyên ngành: KHOA HỌC MÁY TÍNH
Mã chuyên ngành: 60480101
LUẬN VĂN THẠC SĨ
THÀNH PHỐ HỒ CHÍ MINH, NĂM 2019
Công trình được hoàn thành tại Trường Đại học Công nghiệp TP. Hồ Chí Minh.
Người hướng dẫn khoa học: TS. Nguyễn Thành Sơn
Người phản biện 1: ...................................................................................................
Người phản biện 2:....................................................................................................
Luận văn thạc sĩ được bảo vệ tại Hội đồng chấm bảo vệ Luận văn thạc sĩ Trường Đại
học Công nghiệp thành phố Hồ Chí Minh ngày . . . . . tháng . . . . năm . . . . .
Thành phần Hội đồng đánh giá luận văn thạc sĩ gồm:
1. ......................................................................- Chủ tịch Hội đồng
2. ......................................................................- Phản biện 1
3. ......................................................................- Phản biện 2
4. ......................................................................- Ủy viên
5. ......................................................................- Thư ký
(Ghi rõ họ, tên, học hàm, học vị của Hội đồng chấm bảo vệ luận văn thạc sĩ)
CHỦ TỊCH HỘI ĐỒNG TRƯỞNG KHOA CNTT
NHIỆM VỤ LUẬN VĂN THẠC SĨ
Họ tên học viên: Nguyễn Minh Quân MSHV: 15118331
Ngày, tháng, năm sinh: 28/09/1990 Nơi sinh: Đồng Nai
Chuyên ngành: Khoa học máy tính Mã chuyên ngành: 60480101
I. TÊN ĐỀ TÀI:
Dự báo trên chuỗi thời gian bằng phương pháp gom cụm sử dụng thuật toán k-Mean
NHIỆM VỤ VÀ NỘI DUNG:
Nghiên cứu các kiến thức nền tảng về bài toán dự báo trên chuỗi thời gian, các phương
pháp dự báo trên chuỗi thời gian. Nghiên cứu ứng dụng phương pháp gom cụm bằng
thuật toán k-Mean vào bài toán dự báo dữ liệu chuỗi thời gian. Từ đó xây dựng
chương trình thực nghiệm để đánh giá tính hiệu quả cũng như ứng dụng vào thực tế
của phương pháp.
II. NGÀY GIAO NHIỆM VỤ: Theo quyết định số 1486/QĐ-ĐHCN 25/6/2018
III. NGÀY HOÀN THÀNH NHIỆM VỤ: 25/12/2018
IV. NGƯỜI HƯỚNG DẪN KHOA HỌC: TS. Nguyễn Thành Sơn
Tp. Hồ Chí Minh, ngày … tháng … năm 2019
NGƯỜI HƯỚNG DẪN CHỦ NHIỆM BỘ MÔN ĐÀO TẠO
TRƯỞNG KHOA CÔNG NGHỆ THÔNG TIN
BỘ CÔNG THƯƠNG
TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP
THÀNH PHỐ HỒ CHÍ MINH
CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM
Độc lập - Tự do - Hạnh phúc
i
LỜI CẢM ƠN
Sau thời gian học tập và nghiên cứu tại trường đại học Công Nghiệp TP. HCM, bằng
sự biết ơn và kính trọng, tôi xin gửi lời cảm ơn chân thành đến Ban Giám Hiệu, các
phòng, các khoa thuộc trường đại học Công Nghiệp TP. HCM và quý thầy cô đã nhiệt
tình hướng dẫn, giảng dạy và tạo mọi điều kiện thuận lợi giúp đỡ tôi trong suốt quá
trình học tập, nghiên cứu và hoàn thành đề tài nghiên cứu khoa học này.
Đặc biệt, tôi xin bày tỏ lòng biết ơn sâu sắc tới TS. Nguyễn Thành Sơn, người thầy
đã trực tiếp hướng dẫn, giúp đỡ tôi trong quá trình thực hiện đề tài này.
Tôi cũng xin cảm ơn các bạn lớp CHKHMT 5B đã đóng góp ý kiến cũng như giúp
đỡ động viên tôi vững tin hơn, có động lực hơn trong suốt quá trình học và nghiên
cứu.
Tuy nhiên, điều kiện và năng lực bản thân còn hạn chế, chuyên đề nghiên cứu khoa
học chắc chắn không tránh khỏi những thiếu sót. Kính mong nhận được sự đóng góp
ý kiến của quý thầy cô, bạn bè và đồng nghiệp đề bài nghiên cứu của tôi được hoàn
thiện hơn.
Tôi xin trân trọng cảm ơn.
ii
TÓM TẮT LUẬN VĂN THẠC SĨ
Dữ liệu chuỗi thời gian là loại dữ liệu được sử dụng phổ biến trong các lĩnh vực khoa
học, công nghệ, y học và thương mại. Chẳng hạn, trong y khoa người ta có thể sử
dụng các bài toán về chuỗi thời gian để xây dựng chương trình dò tìm tự động trên
điện não đồ của bệnh nhân để phát hiện bệnh, hoặc trong lĩnh vực chứng khoán ta có
thể ứng dụng các bài toán về chuỗi thời gian để xây dựng chương trình dự báo xu thế
biến động của chứng khoán trong thời gian sắp tới…
Dự báo trên dữ liệu chuỗi thời gian đã và đang là một công việc phức tạp và thách
thức đối với các nhà nghiên cứu. Đã có nhiều phương pháp dự báo chuỗi thời gian đã
được giới thiệu và đưa vào ứng dụng trong thực tế .
Gần đây một số phương pháp dự báo trên dữ liệu chuỗi thời gian dựa vào hướng tiếp
cận gom cụm đã được ứng dụng dự báo cho một số lĩnh vực cụ thể (như thời tiết,
chứng khoán, giá điện và nhu cầu sử dụng điện)
Trong luận văn này, chúng tôi tập trung nghiên cứu đánh giá hiệu quả của việc sử
dụng phương pháp gom cụm bằng thuật toán k-Mean. So sánh với một số phương
pháp khác. Tính hiệu quả của phương pháp này được đánh giá bằng thực nghiệm trên
các tập dữ liệu thực.
iii
ABSTRACT
Time series data is the most commonly data that used in the fields of science,
technology, medicine and commerce. For example, in medicine, the time series
problems is used to build an automatic detection program on a patient's
electroencephalogram to detect disease, or in the field of securities we can using the
time series problems to build a program to forecast the volatility trend of securities in
the near future ...
Forecasting on time series data has been a complex and challenging task for
researchers. There have been many time series prediction methods that have been
introduced and put into practice.
Recently, a number of prediction methods on time series data based on clustering
approaches have been applied for a number of specific areas (such as weather,
securities, electricity prices and electricity demand).
In this thesis, we focus on studying the effectiveness of using a k-Mean clustering
algorithm. Compare with some other methods. The effectiveness of this method is
evaluated experimentally on real data sets.