Siêu thị PDFTải ngay đi em, trời tối mất

Thư viện tri thức trực tuyến

Kho tài liệu với 50,000+ tài liệu học thuật

© 2023 Siêu thị PDF - Kho tài liệu học thuật hàng đầu Việt Nam

Phân tích dữ liệu chuỗi thời gian áp dụng cho bài toán dự báo xu hướng :Luận văn thạc sĩ - Chuyên ngành: Khoa học máy tính
PREMIUM
Số trang
63
Kích thước
2.4 MB
Định dạng
PDF
Lượt xem
1767

Phân tích dữ liệu chuỗi thời gian áp dụng cho bài toán dự báo xu hướng :Luận văn thạc sĩ - Chuyên ngành: Khoa học máy tính

Nội dung xem thử

Mô tả chi tiết

BỘ CÔNG THƢƠNG

TRƢỜNG ĐẠI HỌC CÔNG NGHIỆP THÀNH PHỐ HỒ CHÍ MINH

HÀ THỊ KIM THOA

PHÂN TÍCH DỮ LIỆU CHUỖI THỜI GIAN ÁP

DỤNG CHO BÀI TOÁN DỰ BÁO XU HƢỚNG

Chuyên ngành: KHOA HỌC MÁY TÍNH

Mã chuyên ngành: 60480101

LUẬN VĂN THẠC SĨ

THÀNH PHỐ HỒ CHÍ MINH, NĂM 2017

Công trình đƣợc hoàn thành tại Trƣờng Đại học Công nghiệp TP. Hồ Chí Minh.

Ngƣời hƣớng dẫn khoa học: TS. Võ Thị Thanh Vân

Ngƣời phản ￾iện 1: TS. Nguyễn Thành Sơn

Ngƣời phản ￾iện 2: TS. Võ Thị Ngọc Châu

Luận văn thạc sĩ đƣợc ￾ảo vệ tại Hội đồng ch￾m ￾ảo vệ Luận văn thạc sĩ Trƣờng

Đại học Công nghiệp thành phố Hồ Chí Minh ngày 19 tháng 12 năm 2017.

Thành phần Hội đồng đánh giá luận văn thạc sĩ gồm:

1. PGS.TS. Huỳnh Trung Hiếu - Chủ tịch Hội đồng

2. TS. Nguyễn Thành Sơn - Phản ￾iện 1

3. TS. Võ Thị Ngọc Châu - Phản ￾iện 2

4. TS. Phạm Văn Chung - Ủy viên

5. TS. Phạm Thị Thiết - Thƣ ký

CHỦ TỊCH HỘI ĐỒNG TRƢỞNG KHOA CNTT

NHIỆM VỤ LUẬN VĂN THẠC SĨ

Họ tên học viên: HÀ THỊ KIM THOA MSHV: 15001251

Ngày, tháng, năm sinh: 21/7/1984 Nơi sinh: Long An

Chuyên ngành: Khoa học máy tính Mã chuyên ngành: 60480101

I. TÊN ĐỀ TÀI:

Phân tích dữ liệu chuỗi thời gian áp dụng cho ￾ài toán dự ￾áo xu hƣớng

NHIỆM VỤ VÀ NỘI DUNG:

Xây dựng một mô hình dự ￾áo xu hƣớng của dữ liệu chứng khoán, đề tài quan tâm

đến các phƣơng pháp kỹ thuật tiền xử lý dữ liệu, thực hiện hu￾n luyện việc học và

kiểm tra dữ liệu với mục tiêu đƣa ra dự ￾áo xu hƣớng của dữ liệu chứng khoán. Đề

tài “Phân tích dữ liệu chuỗi thời gian áp dụng cho bài toán dự báo xu hướng”

nghiên cứu thực hiện công việc tìm hiểu về các kỹ thuật tính toán thông minh để

phân tích dữ liệu chuỗi thời gian áp dụng cho ￾ài toán dự ￾áo xu hƣớng trong lĩnh

vực chứng khoán.

II. NGÀY GIAO NHIỆM VỤ: QĐ giao đề tài số 2538/QĐ-ĐHCN ngày

29/12/2016

III. NGÀY HOÀN THÀNH NHIỆM VỤ: 29/6/2017

IV. NGƢỜI HƢỚNG DẪN KHOA HỌC: TS. Võ Thị Thanh Vân

Tp. Hồ Chí Minh, ngày … tháng … năm 2017

NGƢỜI HƢỚNG DẪN CHỦ NHIỆM BỘ MÔN ĐÀO TẠO

TS. Võ Thị Thanh Vân

TRƢỞNG KHOA CNTT

BỘ CÔNG THƢƠNG

TRƢỜNG ĐẠI HỌC CÔNG NGHIỆP

THÀNH PHỐ HỒ CHÍ MINH

CỘNG HÕA XÃ HỘI CHỦ NGHĨA VIỆT NAM

Độc lập - Tự do - Hạnh phúc

1

LỜI CẢM ƠN

Để hoàn thành chƣơng trình Cao học và Luận văn Thạc sĩ với đề tài “Phân tích dữ

liệu chuỗi thời gian áp dụng cho bài toán dự báo xu hướng ” tôi đã nhận đƣợc sự

giúp đỡ, động viên khích lệ, hƣớng dẫn nhiệt tình của quý Thầy Cô Trƣờng Đại

học Công Nghiệp Tp. Hồ Chí Minh, ￾ạn ￾è, đồng nghiệp và ngƣời thân. Qua

những dòng viết này tôi xin gửi lời cảm ơn chân thành đến những ngƣời đã giúp

đỡ tôi trong thời gian học tập và nghiên cứu khoa học trong thời gian qua.

Xin chân thành cảm ơn Ban giám hiệu nhà trƣờng, các Thầy Cô, anh chị của

Phòng Sau Đại học, Khoa Công Nghệ Thông Tin – Trƣờng Đại học Công Nghiệp

Tp. Hồ Chí Minh đã tạo điều kiện tốt nh￾t cho tôi trong quá trình học tập và thực

hiện Luận văn này.

Cuối cùng, tôi xin chân thành cảm ơn gia đình, ￾ạn ￾è, ngƣời thân, đồng nghiệp,

đơn vị công tác đã giúp đỡ tôi trong quá trình học tập và thực hiện Luận văn này.

Mặc dù, đã có nhiều cố gắng để thực hiện Luận văn một cách hoàn chỉnh nh￾t.

Song do lần đầu tiên thực hiện việc nghiên cứu khoa học cũng nhƣ hạn chế về kiến

thức và kinh nghiệm nên không thể tránh khỏi những thiếu sót nh￾t định mà ￾ản

thân chƣa nhận th￾y đƣợc. Tôi r￾t mong đƣợc sự góp ý của quý Thầy, Cô và các

￾ạn để khóa luận đƣợc hoàn chỉnh hơn.

Tôi xin chân thành cảm ơn!

Học viên

Hà Thị Kim Thoa

2

TÓM TẮT LUẬN VĂN THẠC SĨ

Luận văn giới thiệu tổng quan về các khái niệm, kỹ thuật khai phá và ứng dụng

của khai phá dữ liệu. Đối tƣợng nghiên cứu là dữ liệu chuỗi thời gian với chuỗi

thời gian đƣợc định nghĩa là một chuỗi các điểm dữ liệu đƣợc đo lƣờng theo từng

khoảng khắc thời gian theo một tần su￾t thời gian nh￾t định. Phạm vi nghiên cứu

của Luận văn ￾ao gồm: các phƣơng pháp tính toán thông minh (Support Vector

Machine và Deep learning) để thực hiện ￾ài toán dự ￾áo xung hƣớng dữ liệu

chứng khoán, các thuật toán về xác định phần tử ngoại lai, thu giảm số chiều và dự

￾áo trên dữ liệu chuỗi thời gian.

Luận văn đã đề xu￾t mô hình dự ￾áo trong lĩnh vực chứng khoán với đầu vào là dữ

liệu chuỗi thời gian kết hợp với một số chỉ số kỹ thuật trong lĩnh vực chứng khoán.

Phƣơng pháp tiếp cận sử dụng tính toán thông minh để hu￾n luyện, kiểm tra dữ

liệu và phân tích xu hƣớng của chứng khoán. Dựa vào kết quả phân tích này và

việc kết hợp với tập luật sẽ hỗ trợ ngƣời dùng ra quyết định là nên ￾án, nên mua

hay giữ lại chứng khoán. Với mô hình này, Luận văn đã thực hiện thực nghiệm

trên 5 ￾ộ dữ liệu chứng khoán l￾y từ Yahoo! Finance: APPL, GE, HSBC, IBM,

YHOO với các tập dữ liệu hu￾n luyện 10% và 33% thì toàn ￾ộ mã chứng khoán áp

dụng phƣơng pháp Deep learning sẽ có độ chính xác cao hơn so với cách tiếp cận

sử dụng SVM.

3

ABSTRACT

The thesis introduces an overview concept about mining techniques and

application of data mining. The main research objective is working with time

series data related through time, it is defined as a series of data points obtained

through repeated measurements over time. The research scope of this thesis

includes: intelligence calculation methods (Support Vector Machine and Deep

learning) in order to analyze the stock trend, prepocessing data algorithms to

detect outliers of time series data.

The thesis is proposed a trend prediction framework with the inputs as time series

data combined with the calculation of some technical indicators. The approach

uses computational intelligence approaches to train, test data and analyze financial

stock trend. Based on the results of this analysis with the combination of rules will

help users decide when should sell, should buy or hold stock. With this model, the

thesis conducted the experiment on 5 sets of stock data from Yahoo! Finance:

APPL, GE, HSBC, IBM, YHOO with training data sets of 10% and 33% using

Deep learning method will be more accurate than SVM.

Tải ngay đi em, còn do dự, trời tối mất!