Thư viện tri thức trực tuyến
Kho tài liệu với 50,000+ tài liệu học thuật
© 2023 Siêu thị PDF - Kho tài liệu học thuật hàng đầu Việt Nam

Phân tích dữ liệu chuỗi thời gian áp dụng cho bài toán dự báo xu hướng :Luận văn thạc sĩ - Chuyên ngành: Khoa học máy tính
Nội dung xem thử
Mô tả chi tiết
BỘ CÔNG THƢƠNG
TRƢỜNG ĐẠI HỌC CÔNG NGHIỆP THÀNH PHỐ HỒ CHÍ MINH
HÀ THỊ KIM THOA
PHÂN TÍCH DỮ LIỆU CHUỖI THỜI GIAN ÁP
DỤNG CHO BÀI TOÁN DỰ BÁO XU HƢỚNG
Chuyên ngành: KHOA HỌC MÁY TÍNH
Mã chuyên ngành: 60480101
LUẬN VĂN THẠC SĨ
THÀNH PHỐ HỒ CHÍ MINH, NĂM 2017
Công trình đƣợc hoàn thành tại Trƣờng Đại học Công nghiệp TP. Hồ Chí Minh.
Ngƣời hƣớng dẫn khoa học: TS. Võ Thị Thanh Vân
Ngƣời phản iện 1: TS. Nguyễn Thành Sơn
Ngƣời phản iện 2: TS. Võ Thị Ngọc Châu
Luận văn thạc sĩ đƣợc ảo vệ tại Hội đồng chm ảo vệ Luận văn thạc sĩ Trƣờng
Đại học Công nghiệp thành phố Hồ Chí Minh ngày 19 tháng 12 năm 2017.
Thành phần Hội đồng đánh giá luận văn thạc sĩ gồm:
1. PGS.TS. Huỳnh Trung Hiếu - Chủ tịch Hội đồng
2. TS. Nguyễn Thành Sơn - Phản iện 1
3. TS. Võ Thị Ngọc Châu - Phản iện 2
4. TS. Phạm Văn Chung - Ủy viên
5. TS. Phạm Thị Thiết - Thƣ ký
CHỦ TỊCH HỘI ĐỒNG TRƢỞNG KHOA CNTT
NHIỆM VỤ LUẬN VĂN THẠC SĨ
Họ tên học viên: HÀ THỊ KIM THOA MSHV: 15001251
Ngày, tháng, năm sinh: 21/7/1984 Nơi sinh: Long An
Chuyên ngành: Khoa học máy tính Mã chuyên ngành: 60480101
I. TÊN ĐỀ TÀI:
Phân tích dữ liệu chuỗi thời gian áp dụng cho ài toán dự áo xu hƣớng
NHIỆM VỤ VÀ NỘI DUNG:
Xây dựng một mô hình dự áo xu hƣớng của dữ liệu chứng khoán, đề tài quan tâm
đến các phƣơng pháp kỹ thuật tiền xử lý dữ liệu, thực hiện hun luyện việc học và
kiểm tra dữ liệu với mục tiêu đƣa ra dự áo xu hƣớng của dữ liệu chứng khoán. Đề
tài “Phân tích dữ liệu chuỗi thời gian áp dụng cho bài toán dự báo xu hướng”
nghiên cứu thực hiện công việc tìm hiểu về các kỹ thuật tính toán thông minh để
phân tích dữ liệu chuỗi thời gian áp dụng cho ài toán dự áo xu hƣớng trong lĩnh
vực chứng khoán.
II. NGÀY GIAO NHIỆM VỤ: QĐ giao đề tài số 2538/QĐ-ĐHCN ngày
29/12/2016
III. NGÀY HOÀN THÀNH NHIỆM VỤ: 29/6/2017
IV. NGƢỜI HƢỚNG DẪN KHOA HỌC: TS. Võ Thị Thanh Vân
Tp. Hồ Chí Minh, ngày … tháng … năm 2017
NGƢỜI HƢỚNG DẪN CHỦ NHIỆM BỘ MÔN ĐÀO TẠO
TS. Võ Thị Thanh Vân
TRƢỞNG KHOA CNTT
BỘ CÔNG THƢƠNG
TRƢỜNG ĐẠI HỌC CÔNG NGHIỆP
THÀNH PHỐ HỒ CHÍ MINH
CỘNG HÕA XÃ HỘI CHỦ NGHĨA VIỆT NAM
Độc lập - Tự do - Hạnh phúc
1
LỜI CẢM ƠN
Để hoàn thành chƣơng trình Cao học và Luận văn Thạc sĩ với đề tài “Phân tích dữ
liệu chuỗi thời gian áp dụng cho bài toán dự báo xu hướng ” tôi đã nhận đƣợc sự
giúp đỡ, động viên khích lệ, hƣớng dẫn nhiệt tình của quý Thầy Cô Trƣờng Đại
học Công Nghiệp Tp. Hồ Chí Minh, ạn è, đồng nghiệp và ngƣời thân. Qua
những dòng viết này tôi xin gửi lời cảm ơn chân thành đến những ngƣời đã giúp
đỡ tôi trong thời gian học tập và nghiên cứu khoa học trong thời gian qua.
Xin chân thành cảm ơn Ban giám hiệu nhà trƣờng, các Thầy Cô, anh chị của
Phòng Sau Đại học, Khoa Công Nghệ Thông Tin – Trƣờng Đại học Công Nghiệp
Tp. Hồ Chí Minh đã tạo điều kiện tốt nht cho tôi trong quá trình học tập và thực
hiện Luận văn này.
Cuối cùng, tôi xin chân thành cảm ơn gia đình, ạn è, ngƣời thân, đồng nghiệp,
đơn vị công tác đã giúp đỡ tôi trong quá trình học tập và thực hiện Luận văn này.
Mặc dù, đã có nhiều cố gắng để thực hiện Luận văn một cách hoàn chỉnh nht.
Song do lần đầu tiên thực hiện việc nghiên cứu khoa học cũng nhƣ hạn chế về kiến
thức và kinh nghiệm nên không thể tránh khỏi những thiếu sót nht định mà ản
thân chƣa nhận thy đƣợc. Tôi rt mong đƣợc sự góp ý của quý Thầy, Cô và các
ạn để khóa luận đƣợc hoàn chỉnh hơn.
Tôi xin chân thành cảm ơn!
Học viên
Hà Thị Kim Thoa
2
TÓM TẮT LUẬN VĂN THẠC SĨ
Luận văn giới thiệu tổng quan về các khái niệm, kỹ thuật khai phá và ứng dụng
của khai phá dữ liệu. Đối tƣợng nghiên cứu là dữ liệu chuỗi thời gian với chuỗi
thời gian đƣợc định nghĩa là một chuỗi các điểm dữ liệu đƣợc đo lƣờng theo từng
khoảng khắc thời gian theo một tần sut thời gian nht định. Phạm vi nghiên cứu
của Luận văn ao gồm: các phƣơng pháp tính toán thông minh (Support Vector
Machine và Deep learning) để thực hiện ài toán dự áo xung hƣớng dữ liệu
chứng khoán, các thuật toán về xác định phần tử ngoại lai, thu giảm số chiều và dự
áo trên dữ liệu chuỗi thời gian.
Luận văn đã đề xut mô hình dự áo trong lĩnh vực chứng khoán với đầu vào là dữ
liệu chuỗi thời gian kết hợp với một số chỉ số kỹ thuật trong lĩnh vực chứng khoán.
Phƣơng pháp tiếp cận sử dụng tính toán thông minh để hun luyện, kiểm tra dữ
liệu và phân tích xu hƣớng của chứng khoán. Dựa vào kết quả phân tích này và
việc kết hợp với tập luật sẽ hỗ trợ ngƣời dùng ra quyết định là nên án, nên mua
hay giữ lại chứng khoán. Với mô hình này, Luận văn đã thực hiện thực nghiệm
trên 5 ộ dữ liệu chứng khoán ly từ Yahoo! Finance: APPL, GE, HSBC, IBM,
YHOO với các tập dữ liệu hun luyện 10% và 33% thì toàn ộ mã chứng khoán áp
dụng phƣơng pháp Deep learning sẽ có độ chính xác cao hơn so với cách tiếp cận
sử dụng SVM.
3
ABSTRACT
The thesis introduces an overview concept about mining techniques and
application of data mining. The main research objective is working with time
series data related through time, it is defined as a series of data points obtained
through repeated measurements over time. The research scope of this thesis
includes: intelligence calculation methods (Support Vector Machine and Deep
learning) in order to analyze the stock trend, prepocessing data algorithms to
detect outliers of time series data.
The thesis is proposed a trend prediction framework with the inputs as time series
data combined with the calculation of some technical indicators. The approach
uses computational intelligence approaches to train, test data and analyze financial
stock trend. Based on the results of this analysis with the combination of rules will
help users decide when should sell, should buy or hold stock. With this model, the
thesis conducted the experiment on 5 sets of stock data from Yahoo! Finance:
APPL, GE, HSBC, IBM, YHOO with training data sets of 10% and 33% using
Deep learning method will be more accurate than SVM.