Thư viện tri thức trực tuyến
Kho tài liệu với 50,000+ tài liệu học thuật
© 2023 Siêu thị PDF - Kho tài liệu học thuật hàng đầu Việt Nam

Nghiên cứu hệ thống file phân tán và ứng dụng tại công ty thí nghiệm điện miền trung
Nội dung xem thử
Mô tả chi tiết
BỘ GIÁO DỤC VÀ ĐÀO TẠO
ĐẠI HỌC ĐÀ NẴNG
NGUYỄN TUẤN ANH
NGHIÊN CỨU HỆ THỐNG FILE PHÂN TÁN
VÀ ỨNG DỤNG TẠI CÔNG TY THÍ NGHIỆM
ĐIỆN MIỀN TRUNG
Chuyên ngành: Hệ thống thông tin
Mã số: 60.48.01.04
TÓM TẮT LUẬN VĂN THẠC SĨ HỆ THỐNG THÔNG TIN
Đà Nẵng - Năm 2016
Công trình được hoàn thành tại
ĐẠI HỌC ĐÀ NẴNG
Người hướng dẫn khoa học: PGS.TS. Lê Văn Sơn
Phản biện 1: TS. Huỳnh Công Pháp
Phản biện 2: TS. Vũ Thị Trà
Luận văn đã được bảo vệ trước Hội đồng chấm Luận văn tốt
nghiệp thạc sĩ kỹ thuật họp tại Đại học Sư phạm, ĐHĐN vào ngày
7 tháng 1 năm 2017.
Có thể tìm hiểu luận văn tại:
- Trung tâm Thông tin - Học liệu, Đại học Đà nẵng.
- Thư viện trường Đại học Sư phạm, Đại học Đà Nẵng.
1
MỞ ĐẦU
Cùng với sự phát triển của các mạng máy tính, việc quản lý,
lưu trữ và xử lý thông tin ngày nay không chỉ được thực hiện trong
từng máy tính đơn lẻ như trước. Các hệ thống thông tin cần được xây
dựng từ các máy tính kết nối với nhau qua mạng tốc độ cao. Hệ
thống file phân tán (Distributed File System) là hệ thống quản lý và
lưu trữ các file được xây dựng trên cơ sở mạng máy tính, trong đó
các file được quản lý và lưu trữ trên nhiều máy tính trên mạng. Hệ
thống file phân tán có những ưu điểm vượt trội so với hệ thống file
tập trung (hệ thống file trên 1 máy tính), như dung lượng lưu trữ lớn,
độ tin cậy cao, khả năng chịu lỗi cao, hỗ trợ tốc độ truy cập cao cho
nhiều người dùng đồng thời. Tuy có nhiều ưu điểm vượt trội, nhưng
do chi phí lắp đặt và vận hành còn tương đối cao, nên các thống file
phân tán chưa được sử dụng rộng rãi trong các doanh nghiệp và tổ
chức có quy mô vừa và nhỏ.Trong điều kiện hạ tầng công nghệ thông
tin còn yếu ở Việt Nam, hầu hết các doanh nghiệp và tổ chức có quy
mô vừa và nhỏ đều sử dụng một hoặc một số máy chủ riêng rẽ để
quản lý và lưu trữ thông tin. Phương pháp này có ưu điểm là chi phí
thấp, nhưng không đảm bảo dung lượng, tính tin cậy và tốc độ truy
nhập cho nhiều người dùng.
Bên cạnh đó việc ứng dụng các mô hình quản lý file, dữ liệu
tại Công ty thí nghiệm điện Miền Trung chưa đáp ứng được nhu cầu
công việc cũng như các yêu cầu đề ra của lãnh đạo công ty, hiện nay
công ty vẫn còn sử dụng các phương thức quản lý file theo kiểu tập
2
trung, điều này làm cho việc quản lý file cũng như dữ liệu gặp rất
nhiều khó khăn làm ảnh hưởng rất lớn đến hiệu quả công việc tại các
bộ phận khác của Công ty.
Do vậy, việc nghiên cứu sâu về hệ thống file phân tán và ứng
dụng hiệu quả vào các doanh nghiệp và tổ chức có quy mô vừa và
nhỏ, đặc biệt là ứng dụng thực tế vào công ty là yêu cầu thực tế cấp
thiết.
Đây cũng là lý do tôi chọn đề tài: "Nghiên cứu hệ thống file
phân tán và ứng dụng tại Công ty thí nghiệm Điện Miền Trung"
2. Mục đích nghiên cứu
- Nghiên cứu tổng quan về hệ thống file phân tán, các kỹ
thuật xây dựng hệ thống file phân tán.
- Xây dựng mô hình ứng dụng và thử nghiệm hệ thống file
phân tán cho doanh nghiệp vừa và nhỏ.
- Cài đặt thử nghiệm hệ thống file phân tán dựa trên DFS
của MS Windows 2008 Server
- Ứng dụng hệ thống file phân tán và cân bằng tải
trên Windows 2008 Server cho ứng dụng web.
3. Đối tượng và phạm vi nghiên cứu
- Đối tượng nghiên cứu: Một số hệ thống file phân tán điển
hình.
- Phạm vi nghiên cứu: Nghiên cứu hệ thống file phân tán
và ứng dụng thực tế.
3
4. Phương pháp nghiên cứu
- Phương pháp nghiên cứu lý thuyết với thực nghiệm và
phân tích, đánh giá kết quả.
4
CHƯƠNG 1
TỔNG QUAN VỀ HỆ THỐNG FILE PHÂN TÁN
1.1. KHÁI NIỆM VỀ HỆ THỐNG FILE VÀ HỆ THỐNG FILE
PHÂN TÁN
1.1.1. Khái niệm về hệ thống file
Hệ thống file (File System) là một phương pháp tổ chức
lưu trữ các file và dữ liệu của chúng, thường được thực hiện bởi hệ
điều hành. Hệ thống file cho phép người sử dụng dễ dàng tìm kiếm
và truy nhập các file.
1.1.2. Khái niệm về hệ thống file phân tán
Hệ thống file phân tán (Distributed File System - DFS) là
một hệ thống file hỗ trợ chia sẻ files và các tài nguyên trên mạng.
1.2. LỊCH SỬ PHÁT TRIỂN
Một số mốc phát triển của các hệ thống file phân tán:
- 1980s: Chia sẻ file dùng đĩa mềm (copy – vận chuyển –
copy).
-1980s: Chia sẻ file dùng giao thức FTP, vẫn cần 2 lần copy
và user phải biết địa chỉ vật lý của ftp server.
- SPRITE Network OS: được phát triển vào giữa những
năm 1980 tại ĐH Universty of California at Berkerly, Mỹ.
- Năm 1983: Andrew File System (AFS) được phát triển
tại ĐH Carnegie Mellon với sự hỗ trợ của hãng IBM, Mỹ.
- Năm 1985: Sun NFS được hãng Sun Microsystems phát
triển.
5
- Đầu năm 1990s: Hệ thống file CODE được phát triển. Đây
là bản kế tiếp của AFS.
- ZEBRA: Được phát triển vào đầu những năm 1990 tại
ĐH University of California at Berkerly, Mỹ.
- HARP: Được phát triển vào đầu những năm 1990 tại ĐH
MIT, Mỹ.
- Lustre: Là một DFS mã mở, có khả năng kết hợp hàng
chục ngàn nút và cung cấp dung lượng lưu trữ đến petabytes. Phiên
bản 1.80 được phát hành vào tháng 5 năm 2009.
1.3. CÁC YÊU CẦU ĐỐI VỚI HỆ THỐNG FILE PHÂN TÁN
Các yêu cầu chính đối với hệ thống file phân tán bao gồm:
tính trong suốt, hiệu năng, khả năng chịu lỗi và khả năng mở rộng.
1.4. CÁC KỸ THUẬT ĐẶT TÊN FILE TRONG HỆ THỐNG
FILE PHÂN TÁN
Các kỹ thuật thực hiện việc đặt tên file trong hệ thống file
phân tán bao gồm: Dịch tên đường dẫn, Tên nhận dạng có cấu
trúc, Thông tin gợi ý hint và Các cơ chế mount.
1.4.1. Dịch tên đường dẫn (Pathname translation)
Dịch tên đường dẫn là ánh xạ từ trên file sang tên nhận
dạng mức thấp và thường được thực hiện bằng một thủ tục tìm kiếm
đệ quy.
1.4.2. Tên nhận dạng có cấu trúc (Structured Identifiers)
Mỗi tên nhận dạng có cấu trúc là một chuỗi bit, thường gồm
2 thành phần:
- Phần đầu dùng để nhận dạng đơn vị thành phần chứa file.
6
- Phần còn lại nhận dạng file cụ thể trong đơn vị thành phần.
1.4.3. Thông tin gợi ý (Hint)
Hint là một kỹ thuật thường được sử dụng trong ánh xạ vị trí
(location mapping) của các DFS.
1.4.4. Các cơ chế mount (Mount mechanism)
Cơ chế mount là việc kết hợp các hệ thống file từ xa vào hệ
thống file cục bộ để tạo thành một cấu trúc tên toàn cục.
7
KẾT LUẬN CHƯƠNG 1
Chương 1 trình bày các khái niệm chung về hệ thống file
phân tán: khái niệm và các yêu cầu đối với hệ thống file phân tán.
Ngoài ra, sơ lược lịch sử phát triển và các kỹ thuật thực hiện việc
đặt tên trong hệ thống file phân tán cũng được trình bày.
8
CHƯƠNG 2
MỘT SỐ HỆ THỐNG FILE PHÂN TÁN
2.1. HỆ THỐNG FILE PHÂN TÁN NFS (NETWORK FILE
SYSTEM)
Hệ thống file mạng phát triển bởi hãng Sun
Microsystem (Mỹ) - thường được gọi tắt là NFS. NFS ban đầu
được phát triển chủ yếu dành cho các máy trạm UNIX, tuy nhiên
sau đó nó cũng có thể chạy tốt trên các hệ điều hành khác
2.1.1. Tổng quan về NFS
Trong mô hình dịch vụ file từ xa (Remote file service), các
client truy cập một cách trong suốt đến hệ thống file được quản lý
bởi một server ở xa. Vì thế, thông thường các client không biết vị
trí lưu trữ thực sự của các file. Thay vào đó, chúng được cung cấp
một giao diện truy nhập đến hệ thống file, tương tự như giao diện
của các hệ thống file cục bộ thông thường. Trong trường hợp riêng,
client chỉ được cung cấpmột giao diện chứa nhiều các thao tác file
khác nhau, server chỉ có nhiệm vụ thực thi các thao tác file đó.
Mô hình hệ thống file được đưa ra bởi NFS cũng giống như
mô hình được đưa ra bởi hệ thống dựa trên UNIX. Các file sẽ được
xem như dãy tuần tự các byte. Chúng được tổ chức phân cấp trong
một đồ thị định danh, trong đó các nút biểu diễn các thư mục và các
file. Để truy cập một file, client phải tìm tên của nó trong một dịch
vụ định danh (naming service) và sẽ nhận được điều khiển file kết
hợp (associated file handle). Ngoài ra mỗi file có một số các