Thư viện tri thức trực tuyến
Kho tài liệu với 50,000+ tài liệu học thuật
© 2023 Siêu thị PDF - Kho tài liệu học thuật hàng đầu Việt Nam

Nghiên cứu xây dựng các mô hình quan hệ cấu trúc - tinh chất (QSPR) của các phức chất giữa Thiosemicarbazone với các ion kim loại :Báo cáo Khoa học tổng kết đề tài cấp trường
Nội dung xem thử
Mô tả chi tiết
BỘ CÔNG THƯƠNG
ĐẠI HỌC CÔNG NGHIỆP THÀNH PHỐ HỒ CHÍ MINH
BÁO CÁO TỔNG KẾT ĐỀ TÀI KHOA HỌC
KẾT QUẢ THỰC HIỆN ĐỀ TÀI
NGHIÊN CỨU KHOA HỌC CẤP TRƯỜNG
Tên đề tài: NGHIÊN CỨU XÂY DỰNG CÁC MÔ HÌNH QUAN HỆ
CẤU TRÚC – TÍNH CHẤT (QSPR) CỦA CÁC PHỨC CHẤT GIỮA
THIOSEMICARBAZONE VỚI CÁC ION KIM LOẠI.
Mã số đề tài : 184.HH09
Chủ nhiệm đề tài : Nguyễn Minh Quang
Đơn vị thực hiện : Khoa Công nghệ Hóa học
TP Hồ Chí Minh, 2019
a
LỜI CÁM ƠN
Nhóm tác giả xin chân thành cảm ơn đến:
Trường Đại học Công nghiệp TP. HCM đã hỗ trợ kinh phí thực hiện đề tài thuộc mã
đề tài 184.HH09 theo hợp đồng 34/HĐ-ĐHCN ngày 24 tháng 01 năm 2018;
Ban chủ nhiệm Khoa Công nghệ hóa học – Trường Đại học Công nghiệp Thành phố
Hồ Chí Minh đã giúp đỡ trong suốt thời gian thực hiện đề tài;
Phòng Quản lý Khoa học và Hợp tác Quốc tế – Trường Đại học Công nghiệp Thành
phố Hồ Chí Minh đã hướng dẫn và hỗ trợ các thủ tục hành chính trong quá trình
thực hiện và nghiệm thu đề tài nghiên cứu khoa học cấp trường;
PGS. TS. Phạm Văn Tất – người đóng vai trò cố vấn nghiên cứu trong đề tài;
Prof. James Stewart đã hỗ trợ cung cấp miễn phí phần mềm MOPAC2016 với
license đến [email protected] phiên bản Version 17.240W 64BITS.
Một lần nữa xin chân thành cảm ơn các đơn vị và cá nhân đã giúp đỡ.
Chủ nhiệm đề tài: Nguyễn Minh Quang.
b
PHẦN I. THÔNG TIN CHUNG
I. Thông tin tổng quát
1.1. Tên đề tài: “Nghiên cứu xây dựng các mô hình quan hệ cấu trúc – tính chất (QSPR)
của các phức chất giữa thiosemicarbazone với các ion kim loại”.
1.2. Mã số: 184.HH09
1.3. Danh sách chủ trì, thành viên tham gia thực hiện đề tài
TT
Họ và tên
(học hàm, học vị)
Đơn vị công tác Vai trò thực hiện đề tài
1 ThS. Nguyễn Minh Quang Khoa Công nghệ Hóa
học - IUH Chủ nhiệm đề tài
2 ThS. Nguyễn Hoàng Minh Khoa Công nghệ Hóa
học - IUH Thành viên nghiên cứu
3 TS. Trần Nguyễn Minh Ân Khoa Công nghệ Hóa
học - IUH Thành viên nghiên cứu
1.4. Đơn vị chủ trì: Khoa Công nghệ Hóa học
1.5. Thời gian thực hiện:
1.5.1. Theo hợp đồng: từ tháng 01 năm 2018 đến tháng 10 năm 2018.
1.5.2. Gia hạn (nếu có): không.
1.5.3. Thực hiện thực tế: từ tháng 01 năm 2018 đến tháng 10 năm 2018.
1.6. Những thay đổi so với thuyết minh ban đầu:
Mục Nội dung Kết quả đề xuất Kết quả thực tế Ghi chú
11.7 Xây dựng mô hình
QSPR bằng mạng
thần kinh nhân tạo
(ANN);
Mô hình:
QSPROLS_ANN;
QSPRPLS_ANN;
QSPRPCR_ANN
Mô hình:
QSPRANN
Nguyên nhân: khi xây dựng ba mô hình mạng thần kinh nhân tạo (QSPROLS_ANN,
QSPRPLS_ANN và QSPRPCR_ANN) tất cả các bộ biến đầu vào (input) đều giống nhau và đồng
thời để dễ dàng so sánh khả năng dự đoán của các mô hình nên kết quả mạng ANN chỉ là
một (QSPRANN).
Ý kiến cơ quan chủ quản: Đồng ý với ý kiến tác giả.
1.7. Tổng kinh phí được phê duyệt của đề tài: 15 triệu đồng.
c
II. Kết quả nghiên cứu
1. Đặt vấn đề
Trong những năm qua, sự phát triển mạnh mẽ của khoa học máy tính đã cho ra đời các
công cụ tính toán lượng tử như Hyperchem, MoPac, Gaussian cùng với các phần mềm mô
phỏng trong hóa học được sử dụng rộng rãi trong nghiên cứu lý thuyết như QSARIS, Spartan,
MOE, Materials Studio, Dragon… nhằm xây dựng các mô hình dự đoán hoạt tính/tính chất
của các hợp chất hóa học dựa trên mối quan hệ định lượng cấu trúc và hoạt tính/tính chất
(QSAR/QSPR). Trong một số công trình đã công bố, các tác giả đã phát triển các mô hình
QSPR trên các đối tượng khác nhau với các tính chất khác nhau như nhiệt độ sôi, độ hòa tan,
tính kỵ nước, tính axít của các hợp chất chứa nhóm xeton, chỉ số thời gian lưu của pha đảo
trong phân tích sắc ký lỏng của các hợp chất hydrocacbon thơm đa vòng… Mặc dù, việc
nghiên cứu phát triển mô hình QSPR trên các hợp chất khác nhau với các tính chất khác nhau
nhưng điểm chung của các nghiên cứu này là sử dụng các phương pháp hồi quy đa biến và
mạng thần kinh nhân tạo để phát triển mô hình.
QSPR là một phương pháp mô hình hóa đã được áp dụng thành công trong lĩnh vực hóa
học. Nó bắt đầu với bộ dữ liệu dựa trên công cụ mô hình hóa này để tạo ra một phần bổ sung
hữu ích hoặc thậm chí thay thế cho việc tạo dữ liệu thực nghiệm, giúp sau này giảm cả thời
gian và tiền bạc. Hơn nữa, mô hình hóa QSPR cung cấp một phương pháp hiệu quả để thiết
lập và khám phá mối quan hệ giữa các mô tả cấu trúc hóa học của các phân tử và các đặc tính
của nó hướng đến việc thiết kế hợp chất mới. Những công bố liên tục trong các bài báo quốc
tế trên các tạp chí uy tín cho thấy rằng sự phát triển các mô hình dự đoán QSPR sử dụng các
phương pháp tuyến tính hoặc phi tuyến dường như là một sự lựa chọn tốt.
Mặt khác, các hợp chất thiosemicarbazone và các phức chất của nó đã được nghiên cứu
rộng rãi trên thế giới bởi vì sự ứng dụng đa dạng của nó trong thực tế. Chúng được sử dụng
làm thuốc thử trong hóa phân tích, chúng cũng được sử dụng làm chất xúc tác trong các phản
ứng hóa học. Bên cạnh đó, chúng cũng có ứng dụng trong lĩnh vực sinh học, môi trường và y
học. Đối với phức chất, hằng số bền là một thông số quan trọng, nó đánh giá về khả năng
tương tác giữa phối tử và các ion kim loại để tạo ra các phức chất. Từ hằng số bền có thể tính
nồng độ cân bằng của các thành phần trong dung dịch. Nó cũng có thể dự đoán sự thay đổi
của cấu trúc điện tử phức tạp trong dung dịch từ nồng độ ban đầu của ion trung tâm và phối
tử. Trong những năm gần đây, hằng số bền của phức được nghiên cứu nhiều trong phân tích
trắc quang.
d
Tuy nhiên, trong các công trình đã được công bố chúng tôi nhận thấy rằng chưa có một
công bố nào phát triển mô hình QSPR trên đối tượng phức chất giữa các dẫn xuất
thiosemicarbazone với các ion kim loại với đại lượng đặc trưng là hằng số bền của phức.
Trong nghiên cứu này, chúng tôi xây dựng mối quan hệ định lượng cấu trúc và tính chất
bằng cách sử dụng các mô tả cấu trúc và hằng số bền của các phức chất giữa ion kim loại và
thiosemicarbazone. Các mô tả cấu trúc được tính toán bằng cách sử dụng hóa lượng tử dựa
trên phương pháp bán thực nghiệm mới PM7 và PM7/sparkle, cơ học phân tử và tính toán các
tham số mô tả phân tửcủa các phức chất từ thực nghiệm đã được tối ưu cấu trúc. Các mô hình
QSPR được xây dựng dựa trên các kỹ thuật hồi quy như hồi quy tuyến tính đa biến thường
(OLS), hồi quy bình phương cực tiểu riêng phần (PLS), hồi quy thành phần chính (PCR). Bên
cạnh đó, chúng tôi cũng sử dụng phương pháp máy học như mạng thần kinh nhân tạo (ANN)
để xây dựng mô hình với đầu vào bao gồm các biến được chọn tốt nhất của mô hình từ phương
pháp OLS. Các giá trị hằng số bền của phức chất trong tập kiểm tra nhận kết quả từ các mô
hình QSPR được đánh giá ngoại với các dữ liệu thực nghiệm trong các tài liệu nghiên cứu.
Như vậy, bằng cách sử dụng phương pháp nghiên cứu lý thuyết đó là sự kết hợp hóa học
tính toán và khoa học máy tính sẽ hỗ trợ nghiên cứu thực nghiệm một cách nhanh chóng. Việc
mô hình hóa QSPR trong công trình này là nghiên cứu đầu tiên về hằng số của phức kim loạithiosemicarbazone trên thế giới.
2. Mục tiêu
Xây dựng các mô hình quan hệ định lượng cấu trúc – tính chất (QSPR) của phức chất
giữa dẫn xuất thiosemicarbazone với các ion kim loại. Cụ thể như sau:
Thu thập và xây dựng bộ cơ sở dữ liệu từ thực nghiệm của phức chất giữa các dẫn
xuất của ligand là thiosemicarbazone và ion kim loại;
Tính toán các thông tin cấu trúc bao gồm: tham số mô tả phân tử 2D, 3D; cấu trúc
điện tử và các tham số hóa lý;
Xây dựng các mô hình QSPR như QSPROLS, QSPRPLS, QSPRPCR và QSPRANN.
3. Phương pháp nghiên cứu
Đề tài sử dụng các phương pháp nghiên cứu sau:
Phân tích nguồn tài liệu: đây là phương pháp phân tích và tổng hợp từ các kết quả
thực nghiệm thông qua các bài báo đã được công bố trên các tạp chí quốc tế có uy
tín khoa học;
Phương pháp tính toán cơ học phân tử;
Phương pháp hóa lượng tử - bán thực nghiệm;
e
Phương pháp hồi quy đa biến (OLS, PLS, PCR);
Phương pháp mạng thần kinh nhân tạo (ANN);
4. Tổng kết về kết quả nghiên cứu
Trong phạm vi nghiên cứu, đề tài đạt được các kết quả nghiên cứu:
Bộ cơ sở dữ liệu thực nghiệm của 60 phức chất giữa thiosemicarbazone và các ion
kim loại với các giá trị thực nghiệm dùng để xây dựng và đánh giá ngoại các mô
hình QSPR;
Xây dựng cấu trúc của các dẫn xuất thiosemicarbazone và phức với các kim loại
tương ứng;
Thông tin cấu trúc, giải thuật tối ưu cấu trúc từ cơ học phân tử;
Thông tin cấu trúc điện tích, các tham số hóa lý của phức chất từ cơ học lượng tử.
Bộ tham số mô tả phân tử 2D, 3D;
Mô hình hồi quy đa biến QSPROLS, QSPRPLS và QSPRPCR;
Mô hình mạng thần kinh nhân tạo QSPRANN;
Thu nhận các mô hình tốt với các chuẩn đánh giá cho các mô hình;
5. Đánh giá các kết quả đã đạt được và kết luận
Kết quả nghiên cứu của đề tài được thực hiện của nhóm nghiên cứu bao gồm chủ nhiệm
đề tài và các cộng sự là những người làm việc đúng chuyên môn, có kinh nghiệm viết bài trên
các tạp chí khoa học uy tín trong nước và thế giới. Đồng thời, nội dung nghiên cứu của đề tài
mô hình hóa QSPR trên đối tượng hằng số bền của các phức chất với dẫn xuất
thiosemicarbazone và các ion kim loại có tính mới đối với Việt Nam và trên thế giới.
Công trình này đã xây dựng thành công các mô quan hệ định lượng giữa cấu trúc và tính
chất-hằng số bền log11 (QSPRs) của các phức chất thiosemicarbazone và ion kim loại sử
dụng các phương pháp hồi quy đa biến như hồi quy tuyến tính thường (OLS), hồi quy bình
phương tối thiểu riêng phần (PLS), hồi quy thành phần chính (PCR) và hồi quy phi tuyến với
phương pháp mạng thần kinh nhân tạo (ANN).
Đề tài cũng đã thu nhận được bộ dữ liệu của 50 phức chất với các giá trị log11 kèm theo
các điều kiện thực nghiệm (pH, lực ion, nhiệt độ, dung môi…) dùng xây dựng các mô hình
và các tham số cấu trúc được tạo ra thành công từ các tính toán lượng tử bán thực nghiệm và
cơ học phân tử. Đồng thời, cũng thu thập 10 phức chất với các giá trị thực nghiệm để đánh
giá ngoại các mô hình.
Chất lượng các mô hình được đánh giá dựa vào các đại lượng thống kê như hệ số tương
quan, sai số chuẩn trung bình, thống kê Fisher... Kết quả nhận được từ các mô hình QSPR có
khả năng dự đoán tốt và phù hợp với thực nghiệm. Các mô hình cũng được đánh giá ngoại
thành công qua các giá trị thống kê và sử dụng phương pháp ANOVA một yếu tố để đánh giá
f
sự phù hợp của các giá trị dự đoán giữa các mô hình. Các mô hình QSPROLS, QSPRPLS và
QSPRPCR và QSPRANN đều đáp ứng các yêu cầu thống kê dự đoán.
Kết quả nhận được từ công trình này cho phép dự đoán và định hướng thực nghiệm tổng
hợp các dẫn xuất thiosemicarbazone có khả năng tạo phức tốt với các ion kim loại mở ra
hướng nghiên cứu mới và có nhiều hứa hẹn trong nhiều lĩnh vực như tổng hợp hữu cơ, phân
tích, phân bón, xử lý môi trường và kỹ thuật xúc tác.
6. Tóm tắt kết quả
6.1. Tóm tắt kết quả
Dẫn xuất thiosemicarbazone và phức của nó với các ion kim loại được nghiên cứu nhiều
trên thế giới do chúng có nhiều ứng dụng trong thực tế. Trong lĩnh vực hóa học,
thiosemicarbazone được sử dụng như tác nhân phân tích, chúng cũng được ứng dụng như chất
xúc tác trong phản ứng hóa học, ứng dụng trong sinh học, môi trường và dược liệu trong y
học. Đối với phức chất, hằng số bền là một thông số quan trọng, từ hằng số bền có thể tính
nồng độ cân bằng của các thành phần trong dung dịch. Nó cũng có thể dự đoán sự thay đổi
của cấu trúc điện tử phức tạp trong dung dịch từ nồng độ ban đầu của ion trung tâm và phối
tử. Trong những năm gần đây, hằng số bền của phức được nghiên cứu nhiều trong phân tích
trắc quang đo phổ UV-VIS.
Gần đây, khoa học máy tính đã phát triển đáng kể, nó đã trở thành một công cụ hữu ích
để phát triển hóa học tính toán như mô phỏng vật liệu và khai thác dữ liệu. Thiết kế phân tử
bằng phương tiện của máy tính cũng là một cách để đẩy nhanh quá trình khám phá để thu
được kiến thức về tính chất của các chất hóa học. Đây cũng là xu hướng giảm phương pháp
tiếp cận thực nghiệm cổ điển. Trong trường hợp này, sự phát triển của các mô hình phân tử
như quan hệ định lượng cấu trúc và tính chất (QSPR) cũng đã góp phần rất lớn vào việc khám
phá và phát triển các phân tử mới. Bằng cách này, các phương pháp phân tích hồi quy đa biến
và mạng ANN đã trở thành một công cụ thuận tiện và dễ dàng để hỗ trợ các mô hình thực
nghiệm và lý thuyết.
Trong nghiên cứu này, hằng số bền của phức giữa ion kim loại và thiosemicarbazone,
log11 được xác định bằng cách sử dụng các mô hình quan hệ định lượng cấu trúc-tính chất
(QSPR). Các mô tả phân tử, mô tả hóa lý và lượng tử của các phức được tạo ra từ cấu trúc
hình học phân tử và tính toán lượng tử theo phương pháp bán thực nghiệm PM7 và
PM7/sparkle. Các mô hình QSPR được xây dựng bằng cách sử dụng phương pháp hồi qui
thường (OLS), hồi qui tối thiểu riêng phần (PLS), hồi quy thành phần chính (PCR) và mạng
thần kinh nhân tạo (ANN). Mô hình QSPROLS tuyến tính tốt nhất với 9 biến mô tả bao gồm
C5, xp9, electric energy, cosmo volume, N4, SsssN, cosmo area, xp10 và core-core repulsion.
Các mô hình QSPRPLS, QSPRPCR và QSPRANN được phát triển dựa trên 9 biến của mô hình
QSPROLS. Chất lượng của các mô hình được đánh giá qua các đại lượng thống kê như R
2
train,
g
Q2
LOO hay R
2
CV và MSE. Mô hình mạng thần kinh nhân tạo QSPRANN với cấu trúc mạng I(9)-
HL(12) -O(1) cũng được tìm thấy với các giá trị thống kê R
2
train và R
2
CV.
Phương trình hồi quy tuyến tính của mô hình QSPROLS với các giá trị thống kê như sau:
logβ11 = -64,63 - 24,58x1 + 26,71x2 – 0,02334x3 – 0,355x4 + 25,47x5 -
- 2,143x6 + 0,531 x7 – 38,16x8 – 0,02505x9
n = 50; R
2
train = 0,944; Q2
LOO = 0,903; MSE = 1,035
Phương trình hồi quy của mô hình QSPRPCR với các giá trị thống kê như sau:
logβ11 = - 64,064 – 23,655x1 + 24,918x2 – 0,022x3 – 0,400x4 + 26,040x5 -
- 1,840x6 + 0,574x7 – 36,476x8 – 0,024x9
n = 50; R
2
train = 0,934; R
2
CV = 0,9485; MSE = 1,147
Và mô hình QSPRPLS đưa ra các kết quả sau:
logβ11 = - 55,976 – 26,729x1 + 25,082x2 – 0,020x3 – 0,353x4 + 24,146x5 -
- 2.277x6 + 0,504x7 – 36,044x8 – 0,021x9
n = 50; R
2
train = 0,934; R
2
CV = 0,9658; MSE = 0,982
Các biến trong mô hình
C5 x1 SsssN x6
xp9 x2 cosmo area x7
electric energy x3 xp10 x8
cosmo volume x4 core-core repulsion x9
N4 x5 Hmax x10
Cấu trúc của mạng nơron bao gồm ba lớp I(9)-HL(12)-O(1); lớp đầu vào I(9) bao gồm
9 nơron là C5, xp9, electric energy, cosmo volume, N4, SsssN, cosmo area, xp10 và core-core
repulsion; lớp đầu ra O(1) bao gồm 1 nơron là logβ11; lớp ẩn bao gồm 12 nơron. Giải thuật
lan truyền ngược được sử dụng để luyện mạng. Hàm truyền hyperbolic tangent đặt trên mỗi
nút của lớp mạng nơron; các thông số luyện mạng bao gồm tốc độ học là 0,01; hệ số mô men
bằng 0,1. Kết quả nhận được tổng sai số bằng 0,000021 với 1.500.000 vòng lặp và hệ số hồi
quy của quá trình luyện là R
2
train = 0,9723 và R
2
CV = 0,9731.
Bên cạnh đó, khả năng dự đoán của các mô hình QSPR đều được đánh giá cẩn thận bằng
kỹ thuật đánh giá ngoại từng trường hợp. Kết quả dự đoán của các mô hình QSPR trên nhận
được đối với 10 hợp chất chọn từ các kết quả nghiên cứu thực nghiệm thông qua các giá trị
Q2
test và MARE (%). Giá trị MARE (%) của các mô hình QSPROLS, QSPRPCR, QSPRPLS và
QSPRANN I(9)-HL(12)-O(1) tương ứng là 16,212%; 14,975%; 11,945% và 8,331% cho thấy
mô hình QSPRANN cho kết quả dự đoán tốt nhất kế đến lần lượt các mô hình QSPRPLS,
QSPRPCR and QSPROLS. Kết quả từ phân tích dữ liệu cho thấy khả năng dự đoán của các mô
hình là rất tốt. Theo đó, mô hình mạng thần kinh QSPRANN thể hiện sự phù hợp và tương quan
tốt nhất giữa các giá trị dự đoán và các giá trị thực nghiệm, kế đến là mô hình QSPRPLS,
h
QSPRPCR và cuối cùng là mô hình QSPROLS với Q2
test lần lượt là 0,9334; 0,9033; 0,9058 và
0,8752. Các giá trị logβ11 từ các mô hình QSPR gần với các giá trị thử nghiệm.
Phương pháp ANOVA một yếu tố cũng được sử dụng để đánh giá sự khác biệt giữa các
giá trị logβ11 thực nghiệm và logβ11 dự đoán từ các mô hình trên. Qua đó cho thấy sự chênh
lệch giữa các giá trị thực nghiệm và tính toán các hằng số bền logβ11 cả ba mô hình không
đáng kể (F = 0,043509 < F0,05 = 2,866266). Vì vậy có thể khẳng định rằng khả năng dự báo
của các mô hình QSPR phù hợp với dữ liệu thực nghiệm.
Như vậy, công trình này đã xây dựng thành công quan hệ định lượng cấu trúc-hằng số
bền logβ11 (QSPRs) sử dụng các phương pháp hồi quy bội (QSPROLS), hồi quy riêng phần
(QSPRPLS), hồi quy thành phần chính (QSPRPCR) và mạng thần kinh nhân tạo (QSPRANN).
Các mô hình QSPR được xây dựng bằng cách sử dụng tập dữ liệu của các bộ mô tả cấu trúc
nhận kết quả từ phép tính lượng tử bán thực nghiệm và cơ học phân tử. Các mô hình QSPR
được đánh giá chéo một cách cẩn thận bằng phương pháp loại bỏ dần từng trường hợp thông
qua các giá trị thống kê R
2
train, Q2
LOO hay R
2
CV, MARE (%) và phương pháp ANOVA một yếu
tố. Các kết quả từ nghiên cứu này nhằm phục vụ cho việc thiết kế các dẫn xuất
thiosemicarbazone mới hữu ích để tìm ra các phức hợp mới trong nhiều lĩnh vực như hóa học
phân tích, dược phẩm và môi trường.
6.2. Abstract
Thiosemicarbazone compounds and its metal complexes were widely researched in the
world because of its diversified application areas in fact. In the field of chemistry,
thiosemicarbazones are used as analytical reagents, they are also used as a catalyst in chemical
reactions. Besides, they also have application in biology, environment and medicine. For
complexes, the stability constant of complexes is an important factor. This is hold to identify
the complex stability in solutions with different solvents. The stability constant of complexes
is the hinge parameter to explain phenomenon such as the mechanism of reaction and distinct
properties of the biological systems. Augmentation, it is also a measure of the power of the
interaction between the metal ions and the ligand to form complexes. We can calculate the
equilibrium concentration of substances in a solution upon the stability constant. The changes
of the complex structure in solutions can be forecasted by using the initial concentration of
the metal ion and the ligand. In recent years, the stability constant of complexes has been
studied extensively in UV-VIS spectrophotometry.
Recently, the computer science has evolved dramatically, it has been becoming a helpful
tool to develop computational chemistry such as material simulation and data mining. The
molecular design by means of a computer is also a way to accelerate the discovery process
for resulting knowledge of material properties. This is also a tendency to reduce the classical
trial-and-error approach. In this case, the development of molecular models such as the
quantitative structure and property relationship (QSPR) has also contributed greatly to the
i
discovery and development of new molecules. In this way, the multivariate analysis methods
and ANN networks have been becoming a convenient and an easy tool for supporting
empirical and theoretical models.
In this study, the stability constants of metal-thiosemicarbazone complexes, log11 were
determined by using the quantitative structure-property relationship (QSPR) models. The
molecular descriptors, physicochemical and quantum descriptors of complexes were
generated from molecular geometric structure and semi-empirical quantum calculation PM7
and PM7/sparkle. The QSPR models were built by using the ordinary least square regression
(OLS), partial least square regression (PLS), primary component regression (PCR) and
artificial neural network (ANN). The best linear model QSPROLS (with k of 9) involves
descriptors C5, xp9, electric energy, cosmo volume, N4, SsssN, cosmo area, xp10 and corecore repulsion. The QSPRPLS, QSPRPCR and QSPRANN models were developed basing on 9
variables of the QSPROLS model. The quality of the QSPR models were validated by the
statistical values such as R
2
train, Q2
LOO or R
2
CV and MSE. The neural network model QSPRANN
with architecture I(9)-HL(12)-O(1) was found also with the statistical values R
2
train and R
2
CV.
The linear regression equation of the QSPROLS model with the statistical values follows
logβ11 = -64.63 - 24.58x1 + 26.71x2 – 0.02334x3 – 0.355x4 + 25.47x5 -
- 2.143x6 + 0.531x7 – 38.16x8 – 0.02505x9
n = 50; R
2
train = 0,944; Q2
LOO = 0,903; MSE = 1.035
The regression equation of the QSPRPCR model with the statistical values follows
logβ11 = - 64.064 – 23.655x1 + 24.918x2 – 0.022x3 – 0.400x4 + 26.040x5 -
- 1.840x6 + 0.574x7 – 36.476x8 – 0.024x9
n = 50; R
2
train = 0,934; R
2
CV = 0,9485; MSE = 1.147
And the QSPRPLS model gives the following results
logβ11 = - 55.976 – 26.729x1 + 25.082x2 – 0.020x3 – 0.353x4 + 24.146x5 -
- 2.277x6 + 0.504x7 – 36.044x8 – 0.021x9
n = 50; R
2
train = 0,934; R
2
CV = 0,9658; MSE = 0.982
Notation of molecular descriptors
C5 x1 SsssN x6
xp9 x2 cosmo area x7
electric energy x3 xp10 x8
cosmo volume x4 core-core repulsion x9
N4 x5 Hmax x10
The architecture of the neural network consist of three layers I(9)-HL(12)-O(1); the
input layer I(9) includes 9 neurons that are C5, xp9, electric energy, cosmo volume, N4, SsssN,
j
cosmo area, xp10 and core-core repulsion; the output layer O(1) includes 1 neuron that is the
logβ11; the hidden layer includes 12 neurons. The error back-propagation algorithm is used to
train the network. The hyperbolic tangent transfer function sets on each node of the layer
neural network; the training network parameters include the learning rate of 0.01; the
momentum coefficient of 0.1. The results got the sum of error 0.000021 with 1,500,000 loops
and the regression coefficients of the training process are R
2
train = 0.9723 and R
2
CV = 0.9731.
Besides, the predictability of the QSPR models was carefully evaluated by means of the
phasing-each-case technique. The predicted results received for 10 randomly chosen
substances with the experimental through MARE (%) and Q2
test values. The MARE values of
models QSPROLS, QSPRPCR, QSPRPLS and QSPRANN I(9)-HL(12)-O(1) are 16.212%,
14.975%, 11.945% and 8.331%, respectively, indicating that model QSPRANN displays
highest predictability next model QSPRPLS, QSPRPCR and QSPROLS. The results of analysis
data can show that the predictability of the models is very good. Whereby, neural model
QSPRANN exhibits a best fit and correlation between the predicted values and the experimental
values, next QSPRPLS and QSPRPCR models and the last QSPROLS models with Q2
test of 0.9334,
0.9033, 0.9058 and 0.8752, respectively. The logβ11 values resulting from model QSPR are
closer to the experimental values.
The single factor ANOVA method was used to evaluate the difference between the
experimental and predictive logβ11 values from the QSPR models. Consequently, the
differences between the experimental and calculated values of stability constants logβ11
resulting from the QSPR models are insignificant (F = 0.043509 < F0.05 = 2.866266). Hence,
the predictability of all QSPR models turns out to be in a good agreement with the
experimental data.
So this work has successfully built the quantitative structure and property relationship
(QSPR) incorporating ordinary least square regression (QSPROLS), partial least square
(QSPRPLS), primary component regression (QSPRPCR) and artificial neural network
(QSPRANN). The QSPR models were constructed by using the dataset of structural descriptors
resulting from the semi-empirical quantum calculation and molecular mechanics. The QSPR
models were cross-validated carefully using the leave-one-out method upon statistical values
R
2
train, Q2
LOO or R
2
CV, MARE, %, and one-way ANOVA method. The results from this study
are in the service of designing new thiosemicarbazone derivatives that are helpful to find new
complexes in the many fields such as analytical chemistry, pharmacy, and environment.
III. Sản phẩm đề tài, công bố và kết quả đào tạo
3.1. Kết quả nghiên cứu (sản phẩm dạng 1, 2, 3)
TT Tên sản phẩm
Yêu cầu khoa học hoặc/và chỉ tiêu
kinh tế - kỹ thuật
k
Đăng ký Đạt được
1
Phương pháp nghiên
cứu
Lý thuyết về phương
pháp nghiên cứu
Lý thuyết về phương pháp
nghiên cứu
2 Cơ sở dữ liệu Bộ dữ liệu trên 50 chất Bộ dữ liệu 60 phức chất
3 Tài liệu dự báo
Các mô hình đã xây
dựng
Bốn mô hình dự báo
QSPROLS, QSPRPLS,
QSPRPCR, QSPRANN
4
Bài báo khoa học
chuyên ngành
01 bài báo tạp chí IUH 01 bài báo tạp chí IUH
3.2. Kết quả đào tạo: không đăng ký trong đề tài.
IV. Tình hình sử dụng kinh phí
TT Nội dung chi
Kinh phí
được duyệt
(triệu đồng)
Kinh phí
thực hiện
(triệu đồng)
Ghi
chú
A Chi phí trực tiếp - -
1 Thuê khoán chuyên môn 15 15
2 Nguyên, nhiên vật liệu, cây con… - -
3 Thiết bị, dụng cụ - -
4 Công tác phí - -
5 Dịch vụ thuê ngoài - -
6 Hội nghị, hội thảo, thù lao nghiệm thu
giữa kỳ
- -
7 In ấn, Văn phòng phẩm - -
8 Chi phí khác
B Chi phí gián tiếp - -
1 Quản lý phí - -
2 Chi phí điện, nước - -
Tổng số 15 15
V. Kiến nghị (về phát triển các kết quả nghiên cứu của đề tài)
Kết quả nghiên cứu của đề tài có thể định hướng thiết kế các dẫn xuất
thiosemicarbazone mới trong tổng hợp hữu cơ được sử dụng như ligand nhằm tạo phức
bền vững với các ion kim loại thông qua giá trị hằng số bền trên cơ sở đó ứng dụng
chúng trong nhiều lĩnh vực liên quan hóa học.
Bên cạnh đó, các dữ liệu từ đề tài này cũng có thể phát triển các mô hình QSAR nhằm
thăm dò hoạt tính sinh học, khả năng kháng khuẩn của các phức chất giữa
thiosemicarbazone với các ion kim loại. Qua đó, có thể định hướng thiết kế các dẫn
l
xuất thiosemicarbazone mới nhằm ứng dụng trong sản xuất dược liệu vì các dẫn xuất
này và phức của chúng cũng có khả năng kháng khuẩn cao.
Ngoài ra, dữ liệu từ đề tài cũng co thể sử dụng phát triển các hợp chất mới nhằm ứng
dụng trong các lĩnh vực khác như xúc tác, môi trường…
Cuối cùng, kết quả từ đề tài định hướng cho một phương pháp nghiên cứu sử dụng
trong giảng dạy và nghiên cứu khoa học cho sinh viên, học viên.
VI. Phụ lục (liệt kê minh chứng các sản phẩm nêu ở Phần III)
Lý thuyết về phương pháp nghiên cứu;
Bộ dữ liệu 60 phức chất;
Bốn mô hình dự báo QSPROLS, QSPRPLS, QSPRPCR, QSPRANN;
Bài báo: Nguyen Minh Quang, Tran Nguyen Minh An, Nguyen Hoang Minh, Tran
Xuan Mau, Pham Van Tat. “QSPR modelling of stability constants of metalthiosemicarbazone complexes using multivariate regression methods and artificial
neural network” (giấy xác nhận đăng bài số 01/TCKHCN, ngày 20 tháng 01 năm
2019 với mã số bài báo: 2018062701)
Tp. HCM, ngày........ tháng........ năm.......
Chủ nhiệm đề tài Phòng QLKH&HTQT Khoa Công nghệ hóa học
Trưởng khoa
(Họ tên, chữ ký)
i
MỤC LỤC
DANH MỤC CHỮ VIẾT TẮT............................................................................................iv
DANH MỤC HÌNH ẢNH, SƠ ĐỒ ....................................................................................viii
DANH MỤC BẢNG BIỂU...................................................................................................ix
LỜI MỞ ĐẦU......................................................................................................................... 1
CHƯƠNG 1. TỔNG QUAN ĐỀ TÀI................................................................................... 3
1.1. TỔNG QUAN VỀ QSPR................................................................................................ 3
1.1.1. Khái quát phương pháp mô hình hóa QSPR .......................................................... 3
1.1.2. Lịch sử phương pháp QSAR/QSPR....................................................................... 4
1.1.3. Quan điểm chiều của kỹ thuật QSAR/QSPR ......................................................... 8
1.1.4. Những nguyên lý cơ bản và lỗi khi xây dựng mô hình QSPR............................... 9
1.1.5. Những ưu điểm chính từ sự phân tích mô hình hóa QSPR.................................. 10
1.1.6. Kỹ thuật phát triển mô hình QSPR....................................................................... 10
1.1.7. Ứng dụng QSAR/QSPR ....................................................................................... 11
1.2. BỘ MÔ TẢ .................................................................................................................... 12
1.2.1. Khái quát về bộ mô tả........................................................................................... 12
1.2.2. Phân loại mô tả ..................................................................................................... 14
1.2.3. Các công cụ sử dụng để tính toán bộ mô tả phân tử ............................................ 17
1.3. TỔNG QUAN VỀ THIOSEMICARBAZONE VÀ PHỨC CHẤT.......................... 18
1.3.1. Dẫn xuất thiosemicacbazone và phức chất........................................................... 19
1.3.2. Thực trạng nghiên cứu trong nước ....................................................................... 21
1.3.3. Nghiên cứu nước ngoài ........................................................................................ 22
1.4. CƠ SỞ LÝ THUYẾT HÓA LƯỢNG TỬ................................................................... 23
1.4.1. Cơ học phân tử ..................................................................................................... 23
1.4.2. Cơ học lượng tử.................................................................................................... 27
1.5. CƠ SỞ LÝ THUYẾT CÁC MÔ HÌNH TOÁN HỌC................................................ 38
1.5.1. Hồi quy tuyến tính thường.................................................................................... 38
1.5.2. Bình phương tối thiểu riêng phần......................................................................... 38
1.5.3. Hồi quy thành phần chính .................................................................................... 39
1.5.4. Mạng thần kinh nhân tạo ...................................................................................... 40
ii
1.5.5. Đánh giá mô hình QSPR ...................................................................................... 49
1.6. NỘI DUNG NGHIÊN CỨU CỦA ĐỀ TÀI................................................................. 57
1.6.1. Đối tượng nghiên cứu........................................................................................... 57
1.6.2. Nội dung nghiên cứu ............................................................................................ 57
CHƯƠNG 2. PHƯƠNG PHÁP NGHIÊN CỨU ............................................................... 58
2.1. PHƯƠNG PHÁP MÔ HÌNH HÓA QSPR ................................................................. 58
2.1.1. Sơ đồ mô hình hóa QSPR..................................................................................... 58
2.1.2. Thuyết minh phương pháp nghiên cứu................................................................. 58
2.2. CÔNG CỤ VÀ PHẦN MỀM NGHIÊN CỨU ............................................................ 59
2.3. THU THẬP DỮ LIỆU THỰC NGHIỆM BAN ĐẦU................................................ 60
2.4. PHƯƠNG PHÁP TÍNH TOÁN THÔNG TIN CẤU TRÚC..................................... 60
2.4.1. Phương pháp chọn giải thuật trong cơ học phân tử.............................................. 60
2.4.2. Phương pháp tối ưu hóa cấu trúc.......................................................................... 61
2.4.3. Phương pháp tính toán bộ tham số mô tả phân tử................................................ 62
2.4.4. Phương pháp tính toán điện tích và các tham số hóa lý ....................................... 62
2.5. PHƯƠNG PHÁP XÂY DỰNG CÁC MÔ HÌNH QSPR........................................... 62
2.5.1. Phương pháp toán học sử dụng xây dựng các mô hình QSPR............................. 63
2.5.2. Phương pháp xây dựng các mô hình QSPR ......................................................... 63
2.5.3. Phương pháp đánh giá mô hình............................................................................ 64
CHƯƠNG 3. KẾT QUẢ VÀ THẢO LUẬN...................................................................... 65
3.1. DỮ LIỆU NGHIÊN CỨU ............................................................................................ 65
3.2. XÂY DỰNG CẤU TRÚC CỦA LIGAND VÀ PHỨC CHẤT.................................. 65
3.3. TÍNH TOÁN THÔNG TIN CẤU TRÚC.................................................................... 65
3.3.1. Tính toán cơ học phân tử và chọn giải thuật ........................................................ 65
3.3.2. Tính toán lượng tử................................................................................................ 66
3.3.3. Tính toán tham số mô tả phân tử 2D, 3D ............................................................. 67
3.4. MÔ HÌNH QSPR .......................................................................................................... 67
3.4.1. Mô hình QSPROLS ................................................................................................ 67
3.4.2. Mô hình QSPRPLS................................................................................................. 68
3.4.3. Mô hình QSPRPCR ................................................................................................ 69
3.4.4. Mô hình QSPRANN................................................................................................ 69
3.5. KẾT QUẢ ĐÁNH GIÁ MÔ HÌNH ............................................................................. 70