Siêu thị PDFTải ngay đi em, trời tối mất

Thư viện tri thức trực tuyến

Kho tài liệu với 50,000+ tài liệu học thuật

© 2023 Siêu thị PDF - Kho tài liệu học thuật hàng đầu Việt Nam

Nghiên cứu ứng dụng Machine Learning trong dự đoán chỉ số giá xây dựng công trình dân dụng tại Thành phố Hồ Chí Minh
PREMIUM
Số trang
122
Kích thước
12.6 MB
Định dạng
PDF
Lượt xem
1911

Nghiên cứu ứng dụng Machine Learning trong dự đoán chỉ số giá xây dựng công trình dân dụng tại Thành phố Hồ Chí Minh

Nội dung xem thử

Mô tả chi tiết

1

BỘ GIÁO DỤC VÀ ĐÀO TẠO

TRƯỜNG ĐẠI HỌC MỞ THÀNH PHỐ HỒ CHÍ MINH

--------∞0∞--------

TRẦN VŨ NGHIÊM

NGHIÊN CỨU ỨNG DỤNG

MACHINE LEARNING TRONG DỰ ĐOÁN CHỈ SỐ

GIÁ XÂY DỰNG CÔNG TRÌNH DÂN DỤNG

TẠI THÀNH PHỐ HỒ CHÍ MINH

LUẬN VĂN THẠC SĨ

XÂY DỰNG CÔNG TRÌNH DÂN DỤNG VÀ CÔNG NGHIỆP

TP. HỒ CHÍ MINH, NĂM 2020

2

BỘ GIÁO DỤC VÀ ĐÀO TẠO

TRƯỜNG ĐẠI HỌC MỞ THÀNH PHỐ HỒ CHÍ MINH

--------∞0∞--------

TRẦN VŨ NGHIÊM

NGHIÊN CỨU ỨNG DỤNG

MACHINE LEARNING TRONG DỰ ĐOÁN CHỈ SỐ

GIÁ XÂY DỰNG CÔNG TRÌNH DÂN DỤNG

TẠI THÀNH PHỐ HỒ CHÍ MINH

Chuyên ngành: Xây dựng công trình dân dụng và công nghiệp

Mã số chuyên ngành: 60 58 02 08

LUẬN VĂN THẠC SĨ

XÂY DỰNG CÔNG TRÌNH DÂN DỤNG VÀ CÔNG NGHIỆP

Giảng viên hướng dẫn: TS. NGUYỄN THANH PHONG

TP. HỒ CHÍ MINH, NĂM 2020

TRƯỜNG ĐẠI HỌC MỞ

THÀNH PHỐ HỒ CHÍ MINH

KHOA ĐÀO TẠO SAU ĐẠI HỌC

CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM

Độc lập – Tự do – Hạnh phúc

GIẤY XÁC NHẬN

Tôi tên là: TRẦN VŨ NGHIÊM

Ngày sinh: 27/07/1991 Nơi sinh: Bình Định

Chuyên ngành: Xây dựng dân dụng và công nghiệp Mã học viên: 1685802080003

Tôi đồng ý cung cấp toàn văn thông tin luận văn tốt nghiệp hợp lệ về bản quyền cho

Thư viện trường đại học Mở Thành phố Hồ Chí Minh. Thư viện trường đại học Mở

Thành phố Hồ Chí Minh sẽ kết nối toàn văn thông tin luận văn tốt nghiệp vào hệ thống

thông tin khoa học của Sở Khoa học và Công nghệ Thành phố Hồ Chí Minh.

Ký tên

(Ghi rõ họ và tên)

d2 ceNG ndn xA ngr cu0 Ncnia. vrET NAM

D6c lf,p - Tu do - Hanh phlic

''f Xrnx CHO PHEP nAo VE LUAN vAN THAC si

CUA GIANG VINN rrrTdNC DAN

r\u

'f Uen ctu gi6o vi6n hu6ng adn vC vi6c cho ph6p hec vi6n.. .IR/N.. yQ.. Mg*fEU...

duoc bAo vQ luQn vdn tru6c H6i d6ng:

b.dr, .G. ......1.t+[.+.......q44-"+.

Thdnh phii ruA Cnt Urnh, ngdy..4{.thdng ..?... ndm 20tO

Ngudi nh0nx6t

7\7r-

=----

.Nguyril {.K*nk..Pk^'f

ran cr6 tai: ...hhli& qi^i d ,tq 4rg....Pi...nt*.fr1 ....No..chi*- ..t*ot*rg-,,,...

frrry { f*6 *N aJ ?{ N dw ry fffi de *a

\ J .-\

Hsc vi6n thuc hiQn: . TP.IN...{!1...Nft11.8N...

Nedy sinh: . AU.oX l.lgg n. Noi sinh: ...&til.. e'd..

1

LỜI CAM ĐOAN

Tôi xin cam đoan Luận văn “ NGHIÊN CỨU ỨNG DỤNG MACHINE

LEARNING TRONG DỰ ĐOÁN CHỈ SỐ GIÁ XÂY DỰNG CÔNG TRÌNH

DÂN DỤNG TẠI THÀNH PHỐ HỒ CHÍ MINH” là đề tài nghiên cứu thật sự của

cá nhân tôi, được thực hiện dựa trên cơ sở nghiên cứu lý thuyết tính toán và số liệu

dưới sự hướng dẫn của: TS. NGUYỄN THANH PHONG.

Ngoại trừ những tài liệu tham khảo được trích dẫn trong luận văn này, tôi cam đoan

rằng toàn phần hay những phần nhỏ của luận văn này chưa từng được công bố hoặc

được sử dụng để nhận bằng cấp ở những nơi khác.

Không có sản phẩm/nghiên cứu nào của người khác được sử dụng trong luận văn này

mà không được trích dẫn theo đúng quy định.

Luận văn này chưa bao giờ được nộp để nhận bất kỳ bằng cấp nào tại các trường đại

học hoặc cơ sở đào tạo khác.

TP. HCM, ngày……tháng……năm 2020.

HỌC VIÊN

TRẦN VŨ NGHIÊM

2

LỜI CẢM ƠN

Để hoàn thành Luận văn này, ngoài sự cố gắng và nỗ lực của bản thân, tôi đã

nhận được sự giúp đỡ từ nhiều từ tập thể và các cá nhân. Tôi xin ghi nhận và tỏ lòng

biết ơn đến tập thể và các cá nhân đã giúp đỡ tôi một cách chân thành.

Tôi xin bày tỏ sự biết ơn sâu sắc đến Thầy TS. NGUYỄN THANH PHONG,

Trưởng Bộ Môn Quản lý Dự Án XD, Trường Đại học Mở Thành Phố Hồ Chí Minh.

Thầy đã góp ý cho tôi rất nhiều về cách nhận định đúng đắn trong những vấn đề

nghiên cứu, cũng như cách tiếp cận giải quyết vấn đề nghiên cứu sao cho hiệu quả.

Tôi cũng xin bày tỏ lòng biết ơn đối với các thầy cô trong Khoa Xây dựng và Khoa

Sau Đại Học, Trường Đại học Mở Thành Phố Hồ Chí Minh đã tạo điều kiện thuận

lợi nhất cho tôi trong quá trình học tập, nghiên cứu.

Luận văn tốt nghiệp đã hoàn thành trong thời gian quy định với sự nỗ lực của

bản thân, tuy nhiên không thể không có những thiếu sót. Kính mong Quý Thầy/Cô

chỉ dẫn thêm để tôi bổ sung những kiến thức và hoàn thiện hơn.

Xin trân trọng cảm ơn.

TP.HCM, ngày ….. tháng ….. năm 2020.

HỌC VIÊN

TRẦN VŨ NGHIÊM

3

TÓM TẮT LUẬN VĂN THẠC SĨ

NGHIÊN CỨU ỨNG DỤNG MACHINE LEARNING TRONG DỰ

ĐOÁN CHỈ SỐ GIÁ XÂY DỰNG CÔNG TRÌNH DÂN DỤNG TẠI

THÀNH PHỐ HỒ CHÍ MINH

TÓM TẮT:

Đề tài nghiên cứu ứng dụng Machine Learning trong dự đoán chỉ số giá xây

dựng công trình dân dụng là công trình nghiên cứu về các yếu tố gây ảnh hưởng đến

chỉ số giá xây dựng, bằng các phương pháp lập bảng câu hỏi khảo sát ý kiến của

chuyên gia, từ đó rút ra những yếu tố quan trọng nhất và thu thập số liệu của những

yếu tố này để làm dữ liệu đầu vào cho mô hình dự đoán, xây dựng mô hình ứng dụng

Machine Learning, cụ thể là Phương pháp KNN (K-Nearest Neighbor), từ cơ sở dữ

liệu về chỉ số giá xây dựng, các chỉ số kinh tế, tài chính, xã hội… thu thập được từ

Sở Xây dựng và Cục Thống kê TP, dựa vào kết quả dự đoán dữ liệu mới sau khi chạy

mô hình, tiến hành so sánh chỉ số giá xây dựng đã dự đoán với chỉ số giá xây dựng

thực tế đã được Sở Xây dựng công bố và tính toán sai số. Kết luận và kiến nghị về độ

chính xác và tính ứng dụng của mô hình dự đoán. Từ đó đề xuất cách tính toán chi

phí dự phòng.

4

RESEARCH ON THE APPLICATION OF MACHINE LEARNING IN

THE PROJECT OF CONSTRUCTION PRICE INDICATOR FOR CIVIL

WORKS IN HO CHI MINH CITY

ABSTRACT: The research topic of Machine Learning in predicting the price

index of civil works is the study of the factors affecting the construction price index,

by the methods of preparing questionnaires. expert's opinion, from which to draw the

most important factors and collect data of these factors to make input data for

prediction model, build machine learning application model, namely KNN method

(K-Nearest Neighbor), from the database of construction price indexes, economic,

financial, social indicators ... collected from the Department of Construction and the

Municipal Statistics Office, based on the results. Predict new data after running the

model, compare the predicted construction price index with the actual construction

price index announced by the Department of Construction and calculate the error.

Conclusions and recommendations on the accuracy and applicability of the prediction

model. From there propose a way to calculate contingency costs.

4

MỤC LỤC

CHƯƠNG 1 : MỞ ĐẦU ..................................................................................8

1.1 ĐẶT VẤN ĐỀ:...........................................................................................8

1.2 MỤC TIÊU NGHIÊN CỨU CỦA ĐỀ TÀI:..............................................9

1.3 CÂU HỎI NGHIÊN CỨU: ........................................................................9

1.4 ĐỐI TƯỢNG VÀ PHẠM VI NGHIÊN CỨU:........................................10

1.5 Ý NGHĨA KHOA HỌC VÀ THỰC TIỄN..............................................10

Ý nghĩa khoa học ......................................................................10

Ý nghĩa thực tiễn.......................................................................10

CHƯƠNG 2 : TỔNG QUAN.........................................................................12

2.1 CƠ SỞ LÝ THUYẾT VỀ MACHINE LEARNING ...............................12

2.2 CHỈ SỐ GIÁ XÂY DỰNG .................................................................15

2.2.1 Khái niệm................................................................................15

2.2.2 Phân loại..................................................................................15

2.2.3 Giải thích một số thuật ngữ.................................................16

2.3 PHƯƠNG PHÁP XÁC ĐỊNH CHỈ SỐ GIÁ XÂY DỰNG............17

2.3.1 Xác định chỉ số giá xây dựng công trình .........................17

2.3.2 Xác định các chỉ số theo yếu tố chi phí ..........................18

2.3.3 Xác định các chỉ số theo cơ cấu chi phí..........................21

2.4 THU THẬP DỮ LIỆU BẰNG PHƯƠNG PHÁP PHỎNG VẤN...........24

2.5 TÌNH HÌNH NGHIÊN CỨU TRONG NƯỚC VÀ THẾ GIỚI...............26

2.5.1 Các nghiên cứu trong nước .......................................................26

2.5.2 Các nghiên cứu trên thế giới .....................................................27

CHƯƠNG 3: PHƯƠNG PHÁP NGHIÊN CỨU ...........................................29

5

3.1 QUY TRÌNH NGHIÊN CỨU..................................................................29

3.2 PHƯƠNG PHÁP KHẢO SÁT BẢNG CÂU HỎI...................................31

3.2.1 Giới thiệu chung........................................................................31

3.2.2 Các bước thực hiện ...................................................................31

3.2.3 Xử lý dữ liệu .............................................................................33

3.3 THUẬT TOÁN KNN (K-NEAREST NEIGHBOR)...........................34

3.3.1 Định nghĩa................................................................................34

3.3.2 Ý tưởng của KNN .................................................................35

3.3.3 KNN cho Regression ..............................................................38

3.3.4 Sai số toàn phương trung bình ..................................................39

3.3.5 Ví dụ minh họa..........................................................................39

CHƯƠNG 4: XÂY DỰNG MÔ HÌNH .........................................................44

4.1 XÁC ĐỊNH DỮ LIỆU ĐẦU VÀO..........................................................44

4.1.1 Tổng quan các yếu tố ảnh hưởng CCI ......................................44

4.1.2 Khảo sát ý kiến chuyên gia và chọn ra các yếu tố chính ..........44

4.1.3 Chọn các yếu tố chính...............................................................45

4.1.4 Sự tương quan giữa biến đầu vào và CCI.................................50

4.2 THỰC THI BÀI TOÁN BẰNG PYTHON ............................................52

4.3 ĐỀ XUẤT CÁCH TÍNH TOÁN CHI PHÍ DỰ PHÒNG ........................70

CHƯƠNG 5: KẾT LUẬN VÀ KIẾN NGHỊ.................................................77

5.1 KẾT LUẬN..............................................................................................77

5.2 HẠN CHẾ ................................................................................................78

5.3 KIẾN NGHỊ .............................................................................................79

TÀI LIỆU THAM KHẢO..............................................................................80

6

DANH MỤC HÌNH ẢNH

Hình 2.1: MNIST: bộ cơ sở dữ liệu của chữ số viết tay.

Hình 3.1: Hình ảnh mô phỏng thuật toán KNN

Hình 3.2: Công thức tính khoảng cách giữa các điểm dữ liệu

Hình 3.3: Quy ntrình nthực nhiện ncủa nthuật ntoán nKNN

Hình 3.4: Đồ thị so sánh giữa kết quả dự đoán và dữ liệu đầu vào

Hình 3.5: Biểu đồ ví dụ minh họa

Hình 3.6: Biểu đồ ví dụ minh họa

Hình 3.7: Biểu đồ ví dụ minh họa

Hình 4.1: Màn hình code

Hình 4.2: Màn hình code

Hình 4.3: Dữ liệu đầu vào

Hình 4.4: Màn hình code

Hình 4.5: Màn hình code

Hình 4.6: Màn hình code

Hình 4.7: Màn hình code

Hình 4.8: Biểu đồ tương quan giữa K và MSE

DANH MỤC BẢNG

Bảng 3.1: Sơ đồ nghiên cứu

Bảng 3.2: Sơ đồ xác định các yếu tố ảnh hưởng đến chỉ số giá xây dựng

Bảng 3.3: Thang đo mức độ quan trọng

Bảng 3.4: Bảng dữ liệu ví dụ minh họa

Bảng 4.1. Các yếu tố ảnh hưởng đến chỉ số giá xây dựng

Bảng 4.2. Kết quả khảo sát

Bảng 4.3. Các yếu tố đầu vào cho mô hình

Bảng 4.4. Bảng dữ liệu các yếu tố đầu vào cho mô hình

Bảng 4.5: Thống kê hệ số tương quan Pearson giữa các biến đầu vào với CCI

Bảng 4.6. Bộ dữ liệu huấn luyện cho mô hình

7

Bảng 4.7. Bộ dữ liệu kiểm tra và đánh giá mô hình

Bảng 4.8: Kết quả MSE với K tương ứng

Bảng 4.9: Kết quả của mô hình dự đoán chỉ số giá xây dựng

Bảng 4.10: Phân bổ vốn đầu tư theo tiến độ thực hiện

Bảng 4.11: Tính mức độ trượt giá bình quân

Bảng 4.12: Tính chi phí dự phòng theo yếu tố trượt giá

Bảng 4.13: Dữ liệu đầu vào cho mô hình dự đoán chỉ số giá xây dựng theo từng

năm

Bảng 4.14: Tính mức độ trượt giá bình quân từ kết quả của mô hình

Bảng 4.15: Chi phí dự phòng cho yếu tố trượt giá (theo kết quả từ mô hình)

Bảng 4.16: Kết quả chi phí dự phòng tính theo các cách khác nhau

MỘT SỐ KÝ HIỆU VÀ VIẾT TẮT

CCI : Chỉ số giá xây dựng

KNN : K-Nearest Neighbor

TP.HCM : Thành phố Hồ Chí Minh

Tải ngay đi em, còn do dự, trời tối mất!