Siêu thị PDFTải ngay đi em, trời tối mất

Thư viện tri thức trực tuyến

Kho tài liệu với 50,000+ tài liệu học thuật

© 2023 Siêu thị PDF - Kho tài liệu học thuật hàng đầu Việt Nam

Nghiên cứu xây dựng các mô hình quan hệ cấu trúc - tinh chất (QSPR) của các phức chất giữa Thiosemicarbazone với các ion kim loại :Báo cáo Khoa học tổng kết đề tài cấp trường
PREMIUM
Số trang
176
Kích thước
4.2 MB
Định dạng
PDF
Lượt xem
1897

Nghiên cứu xây dựng các mô hình quan hệ cấu trúc - tinh chất (QSPR) của các phức chất giữa Thiosemicarbazone với các ion kim loại :Báo cáo Khoa học tổng kết đề tài cấp trường

Nội dung xem thử

Mô tả chi tiết

BỘ CÔNG THƯƠNG

ĐẠI HỌC CÔNG NGHIỆP THÀNH PHỐ HỒ CHÍ MINH

BÁO CÁO TỔNG KẾT ĐỀ TÀI KHOA HỌC

KẾT QUẢ THỰC HIỆN ĐỀ TÀI

NGHIÊN CỨU KHOA HỌC CẤP TRƯỜNG

Tên đề tài: NGHIÊN CỨU XÂY DỰNG CÁC MÔ HÌNH QUAN HỆ

CẤU TRÚC – TÍNH CHẤT (QSPR) CỦA CÁC PHỨC CHẤT GIỮA

THIOSEMICARBAZONE VỚI CÁC ION KIM LOẠI.

Mã số đề tài : 184.HH09

Chủ nhiệm đề tài : Nguyễn Minh Quang

Đơn vị thực hiện : Khoa Công nghệ Hóa học

TP Hồ Chí Minh, 2019

a

LỜI CÁM ƠN

Nhóm tác giả xin chân thành cảm ơn đến:

 Trường Đại học Công nghiệp TP. HCM đã hỗ trợ kinh phí thực hiện đề tài thuộc mã

đề tài 184.HH09 theo hợp đồng 34/HĐ-ĐHCN ngày 24 tháng 01 năm 2018;

 Ban chủ nhiệm Khoa Công nghệ hóa học – Trường Đại học Công nghiệp Thành phố

Hồ Chí Minh đã giúp đỡ trong suốt thời gian thực hiện đề tài;

 Phòng Quản lý Khoa học và Hợp tác Quốc tế – Trường Đại học Công nghiệp Thành

phố Hồ Chí Minh đã hướng dẫn và hỗ trợ các thủ tục hành chính trong quá trình

thực hiện và nghiệm thu đề tài nghiên cứu khoa học cấp trường;

 PGS. TS. Phạm Văn Tất – người đóng vai trò cố vấn nghiên cứu trong đề tài;

 Prof. James Stewart đã hỗ trợ cung cấp miễn phí phần mềm MOPAC2016 với

license đến [email protected] phiên bản Version 17.240W 64BITS.

Một lần nữa xin chân thành cảm ơn các đơn vị và cá nhân đã giúp đỡ.

Chủ nhiệm đề tài: Nguyễn Minh Quang.

b

PHẦN I. THÔNG TIN CHUNG

I. Thông tin tổng quát

1.1. Tên đề tài: “Nghiên cứu xây dựng các mô hình quan hệ cấu trúc – tính chất (QSPR)

của các phức chất giữa thiosemicarbazone với các ion kim loại”.

1.2. Mã số: 184.HH09

1.3. Danh sách chủ trì, thành viên tham gia thực hiện đề tài

TT

Họ và tên

(học hàm, học vị)

Đơn vị công tác Vai trò thực hiện đề tài

1 ThS. Nguyễn Minh Quang Khoa Công nghệ Hóa

học - IUH Chủ nhiệm đề tài

2 ThS. Nguyễn Hoàng Minh Khoa Công nghệ Hóa

học - IUH Thành viên nghiên cứu

3 TS. Trần Nguyễn Minh Ân Khoa Công nghệ Hóa

học - IUH Thành viên nghiên cứu

1.4. Đơn vị chủ trì: Khoa Công nghệ Hóa học

1.5. Thời gian thực hiện:

1.5.1. Theo hợp đồng: từ tháng 01 năm 2018 đến tháng 10 năm 2018.

1.5.2. Gia hạn (nếu có): không.

1.5.3. Thực hiện thực tế: từ tháng 01 năm 2018 đến tháng 10 năm 2018.

1.6. Những thay đổi so với thuyết minh ban đầu:

Mục Nội dung Kết quả đề xuất Kết quả thực tế Ghi chú

11.7 Xây dựng mô hình

QSPR bằng mạng

thần kinh nhân tạo

(ANN);

Mô hình:

 QSPROLS_ANN;

 QSPRPLS_ANN;

 QSPRPCR_ANN

Mô hình:

QSPRANN

 Nguyên nhân: khi xây dựng ba mô hình mạng thần kinh nhân tạo (QSPROLS_ANN,

QSPRPLS_ANN và QSPRPCR_ANN) tất cả các bộ biến đầu vào (input) đều giống nhau và đồng

thời để dễ dàng so sánh khả năng dự đoán của các mô hình nên kết quả mạng ANN chỉ là

một (QSPRANN).

 Ý kiến cơ quan chủ quản: Đồng ý với ý kiến tác giả.

1.7. Tổng kinh phí được phê duyệt của đề tài: 15 triệu đồng.

c

II. Kết quả nghiên cứu

1. Đặt vấn đề

Trong những năm qua, sự phát triển mạnh mẽ của khoa học máy tính đã cho ra đời các

công cụ tính toán lượng tử như Hyperchem, MoPac, Gaussian cùng với các phần mềm mô

phỏng trong hóa học được sử dụng rộng rãi trong nghiên cứu lý thuyết như QSARIS, Spartan,

MOE, Materials Studio, Dragon… nhằm xây dựng các mô hình dự đoán hoạt tính/tính chất

của các hợp chất hóa học dựa trên mối quan hệ định lượng cấu trúc và hoạt tính/tính chất

(QSAR/QSPR). Trong một số công trình đã công bố, các tác giả đã phát triển các mô hình

QSPR trên các đối tượng khác nhau với các tính chất khác nhau như nhiệt độ sôi, độ hòa tan,

tính kỵ nước, tính axít của các hợp chất chứa nhóm xeton, chỉ số thời gian lưu của pha đảo

trong phân tích sắc ký lỏng của các hợp chất hydrocacbon thơm đa vòng… Mặc dù, việc

nghiên cứu phát triển mô hình QSPR trên các hợp chất khác nhau với các tính chất khác nhau

nhưng điểm chung của các nghiên cứu này là sử dụng các phương pháp hồi quy đa biến và

mạng thần kinh nhân tạo để phát triển mô hình.

QSPR là một phương pháp mô hình hóa đã được áp dụng thành công trong lĩnh vực hóa

học. Nó bắt đầu với bộ dữ liệu dựa trên công cụ mô hình hóa này để tạo ra một phần bổ sung

hữu ích hoặc thậm chí thay thế cho việc tạo dữ liệu thực nghiệm, giúp sau này giảm cả thời

gian và tiền bạc. Hơn nữa, mô hình hóa QSPR cung cấp một phương pháp hiệu quả để thiết

lập và khám phá mối quan hệ giữa các mô tả cấu trúc hóa học của các phân tử và các đặc tính

của nó hướng đến việc thiết kế hợp chất mới. Những công bố liên tục trong các bài báo quốc

tế trên các tạp chí uy tín cho thấy rằng sự phát triển các mô hình dự đoán QSPR sử dụng các

phương pháp tuyến tính hoặc phi tuyến dường như là một sự lựa chọn tốt.

Mặt khác, các hợp chất thiosemicarbazone và các phức chất của nó đã được nghiên cứu

rộng rãi trên thế giới bởi vì sự ứng dụng đa dạng của nó trong thực tế. Chúng được sử dụng

làm thuốc thử trong hóa phân tích, chúng cũng được sử dụng làm chất xúc tác trong các phản

ứng hóa học. Bên cạnh đó, chúng cũng có ứng dụng trong lĩnh vực sinh học, môi trường và y

học. Đối với phức chất, hằng số bền là một thông số quan trọng, nó đánh giá về khả năng

tương tác giữa phối tử và các ion kim loại để tạo ra các phức chất. Từ hằng số bền có thể tính

nồng độ cân bằng của các thành phần trong dung dịch. Nó cũng có thể dự đoán sự thay đổi

của cấu trúc điện tử phức tạp trong dung dịch từ nồng độ ban đầu của ion trung tâm và phối

tử. Trong những năm gần đây, hằng số bền của phức được nghiên cứu nhiều trong phân tích

trắc quang.

d

Tuy nhiên, trong các công trình đã được công bố chúng tôi nhận thấy rằng chưa có một

công bố nào phát triển mô hình QSPR trên đối tượng phức chất giữa các dẫn xuất

thiosemicarbazone với các ion kim loại với đại lượng đặc trưng là hằng số bền của phức.

Trong nghiên cứu này, chúng tôi xây dựng mối quan hệ định lượng cấu trúc và tính chất

bằng cách sử dụng các mô tả cấu trúc và hằng số bền của các phức chất giữa ion kim loại và

thiosemicarbazone. Các mô tả cấu trúc được tính toán bằng cách sử dụng hóa lượng tử dựa

trên phương pháp bán thực nghiệm mới PM7 và PM7/sparkle, cơ học phân tử và tính toán các

tham số mô tả phân tửcủa các phức chất từ thực nghiệm đã được tối ưu cấu trúc. Các mô hình

QSPR được xây dựng dựa trên các kỹ thuật hồi quy như hồi quy tuyến tính đa biến thường

(OLS), hồi quy bình phương cực tiểu riêng phần (PLS), hồi quy thành phần chính (PCR). Bên

cạnh đó, chúng tôi cũng sử dụng phương pháp máy học như mạng thần kinh nhân tạo (ANN)

để xây dựng mô hình với đầu vào bao gồm các biến được chọn tốt nhất của mô hình từ phương

pháp OLS. Các giá trị hằng số bền của phức chất trong tập kiểm tra nhận kết quả từ các mô

hình QSPR được đánh giá ngoại với các dữ liệu thực nghiệm trong các tài liệu nghiên cứu.

Như vậy, bằng cách sử dụng phương pháp nghiên cứu lý thuyết đó là sự kết hợp hóa học

tính toán và khoa học máy tính sẽ hỗ trợ nghiên cứu thực nghiệm một cách nhanh chóng. Việc

mô hình hóa QSPR trong công trình này là nghiên cứu đầu tiên về hằng số của phức kim loại￾thiosemicarbazone trên thế giới.

2. Mục tiêu

Xây dựng các mô hình quan hệ định lượng cấu trúc – tính chất (QSPR) của phức chất

giữa dẫn xuất thiosemicarbazone với các ion kim loại. Cụ thể như sau:

 Thu thập và xây dựng bộ cơ sở dữ liệu từ thực nghiệm của phức chất giữa các dẫn

xuất của ligand là thiosemicarbazone và ion kim loại;

 Tính toán các thông tin cấu trúc bao gồm: tham số mô tả phân tử 2D, 3D; cấu trúc

điện tử và các tham số hóa lý;

 Xây dựng các mô hình QSPR như QSPROLS, QSPRPLS, QSPRPCR và QSPRANN.

3. Phương pháp nghiên cứu

Đề tài sử dụng các phương pháp nghiên cứu sau:

 Phân tích nguồn tài liệu: đây là phương pháp phân tích và tổng hợp từ các kết quả

thực nghiệm thông qua các bài báo đã được công bố trên các tạp chí quốc tế có uy

tín khoa học;

 Phương pháp tính toán cơ học phân tử;

 Phương pháp hóa lượng tử - bán thực nghiệm;

e

 Phương pháp hồi quy đa biến (OLS, PLS, PCR);

 Phương pháp mạng thần kinh nhân tạo (ANN);

4. Tổng kết về kết quả nghiên cứu

Trong phạm vi nghiên cứu, đề tài đạt được các kết quả nghiên cứu:

 Bộ cơ sở dữ liệu thực nghiệm của 60 phức chất giữa thiosemicarbazone và các ion

kim loại với các giá trị thực nghiệm dùng để xây dựng và đánh giá ngoại các mô

hình QSPR;

 Xây dựng cấu trúc của các dẫn xuất thiosemicarbazone và phức với các kim loại

tương ứng;

 Thông tin cấu trúc, giải thuật tối ưu cấu trúc từ cơ học phân tử;

 Thông tin cấu trúc điện tích, các tham số hóa lý của phức chất từ cơ học lượng tử.

 Bộ tham số mô tả phân tử 2D, 3D;

 Mô hình hồi quy đa biến QSPROLS, QSPRPLS và QSPRPCR;

 Mô hình mạng thần kinh nhân tạo QSPRANN;

 Thu nhận các mô hình tốt với các chuẩn đánh giá cho các mô hình;

5. Đánh giá các kết quả đã đạt được và kết luận

Kết quả nghiên cứu của đề tài được thực hiện của nhóm nghiên cứu bao gồm chủ nhiệm

đề tài và các cộng sự là những người làm việc đúng chuyên môn, có kinh nghiệm viết bài trên

các tạp chí khoa học uy tín trong nước và thế giới. Đồng thời, nội dung nghiên cứu của đề tài

mô hình hóa QSPR trên đối tượng hằng số bền của các phức chất với dẫn xuất

thiosemicarbazone và các ion kim loại có tính mới đối với Việt Nam và trên thế giới.

Công trình này đã xây dựng thành công các mô quan hệ định lượng giữa cấu trúc và tính

chất-hằng số bền log11 (QSPRs) của các phức chất thiosemicarbazone và ion kim loại sử

dụng các phương pháp hồi quy đa biến như hồi quy tuyến tính thường (OLS), hồi quy bình

phương tối thiểu riêng phần (PLS), hồi quy thành phần chính (PCR) và hồi quy phi tuyến với

phương pháp mạng thần kinh nhân tạo (ANN).

Đề tài cũng đã thu nhận được bộ dữ liệu của 50 phức chất với các giá trị log11 kèm theo

các điều kiện thực nghiệm (pH, lực ion, nhiệt độ, dung môi…) dùng xây dựng các mô hình

và các tham số cấu trúc được tạo ra thành công từ các tính toán lượng tử bán thực nghiệm và

cơ học phân tử. Đồng thời, cũng thu thập 10 phức chất với các giá trị thực nghiệm để đánh

giá ngoại các mô hình.

Chất lượng các mô hình được đánh giá dựa vào các đại lượng thống kê như hệ số tương

quan, sai số chuẩn trung bình, thống kê Fisher... Kết quả nhận được từ các mô hình QSPR có

khả năng dự đoán tốt và phù hợp với thực nghiệm. Các mô hình cũng được đánh giá ngoại

thành công qua các giá trị thống kê và sử dụng phương pháp ANOVA một yếu tố để đánh giá

f

sự phù hợp của các giá trị dự đoán giữa các mô hình. Các mô hình QSPROLS, QSPRPLS và

QSPRPCR và QSPRANN đều đáp ứng các yêu cầu thống kê dự đoán.

Kết quả nhận được từ công trình này cho phép dự đoán và định hướng thực nghiệm tổng

hợp các dẫn xuất thiosemicarbazone có khả năng tạo phức tốt với các ion kim loại mở ra

hướng nghiên cứu mới và có nhiều hứa hẹn trong nhiều lĩnh vực như tổng hợp hữu cơ, phân

tích, phân bón, xử lý môi trường và kỹ thuật xúc tác.

6. Tóm tắt kết quả

6.1. Tóm tắt kết quả

Dẫn xuất thiosemicarbazone và phức của nó với các ion kim loại được nghiên cứu nhiều

trên thế giới do chúng có nhiều ứng dụng trong thực tế. Trong lĩnh vực hóa học,

thiosemicarbazone được sử dụng như tác nhân phân tích, chúng cũng được ứng dụng như chất

xúc tác trong phản ứng hóa học, ứng dụng trong sinh học, môi trường và dược liệu trong y

học. Đối với phức chất, hằng số bền là một thông số quan trọng, từ hằng số bền có thể tính

nồng độ cân bằng của các thành phần trong dung dịch. Nó cũng có thể dự đoán sự thay đổi

của cấu trúc điện tử phức tạp trong dung dịch từ nồng độ ban đầu của ion trung tâm và phối

tử. Trong những năm gần đây, hằng số bền của phức được nghiên cứu nhiều trong phân tích

trắc quang đo phổ UV-VIS.

Gần đây, khoa học máy tính đã phát triển đáng kể, nó đã trở thành một công cụ hữu ích

để phát triển hóa học tính toán như mô phỏng vật liệu và khai thác dữ liệu. Thiết kế phân tử

bằng phương tiện của máy tính cũng là một cách để đẩy nhanh quá trình khám phá để thu

được kiến thức về tính chất của các chất hóa học. Đây cũng là xu hướng giảm phương pháp

tiếp cận thực nghiệm cổ điển. Trong trường hợp này, sự phát triển của các mô hình phân tử

như quan hệ định lượng cấu trúc và tính chất (QSPR) cũng đã góp phần rất lớn vào việc khám

phá và phát triển các phân tử mới. Bằng cách này, các phương pháp phân tích hồi quy đa biến

và mạng ANN đã trở thành một công cụ thuận tiện và dễ dàng để hỗ trợ các mô hình thực

nghiệm và lý thuyết.

Trong nghiên cứu này, hằng số bền của phức giữa ion kim loại và thiosemicarbazone,

log11 được xác định bằng cách sử dụng các mô hình quan hệ định lượng cấu trúc-tính chất

(QSPR). Các mô tả phân tử, mô tả hóa lý và lượng tử của các phức được tạo ra từ cấu trúc

hình học phân tử và tính toán lượng tử theo phương pháp bán thực nghiệm PM7 và

PM7/sparkle. Các mô hình QSPR được xây dựng bằng cách sử dụng phương pháp hồi qui

thường (OLS), hồi qui tối thiểu riêng phần (PLS), hồi quy thành phần chính (PCR) và mạng

thần kinh nhân tạo (ANN). Mô hình QSPROLS tuyến tính tốt nhất với 9 biến mô tả bao gồm

C5, xp9, electric energy, cosmo volume, N4, SsssN, cosmo area, xp10 và core-core repulsion.

Các mô hình QSPRPLS, QSPRPCR và QSPRANN được phát triển dựa trên 9 biến của mô hình

QSPROLS. Chất lượng của các mô hình được đánh giá qua các đại lượng thống kê như R

2

train,

g

Q2

LOO hay R

2

CV và MSE. Mô hình mạng thần kinh nhân tạo QSPRANN với cấu trúc mạng I(9)-

HL(12) -O(1) cũng được tìm thấy với các giá trị thống kê R

2

train và R

2

CV.

Phương trình hồi quy tuyến tính của mô hình QSPROLS với các giá trị thống kê như sau:

logβ11 = -64,63 - 24,58x1 + 26,71x2 – 0,02334x3 – 0,355x4 + 25,47x5 -

- 2,143x6 + 0,531 x7 – 38,16x8 – 0,02505x9

n = 50; R

2

train = 0,944; Q2

LOO = 0,903; MSE = 1,035

Phương trình hồi quy của mô hình QSPRPCR với các giá trị thống kê như sau:

logβ11 = - 64,064 – 23,655x1 + 24,918x2 – 0,022x3 – 0,400x4 + 26,040x5 -

- 1,840x6 + 0,574x7 – 36,476x8 – 0,024x9

n = 50; R

2

train = 0,934; R

2

CV = 0,9485; MSE = 1,147

Và mô hình QSPRPLS đưa ra các kết quả sau:

logβ11 = - 55,976 – 26,729x1 + 25,082x2 – 0,020x3 – 0,353x4 + 24,146x5 -

- 2.277x6 + 0,504x7 – 36,044x8 – 0,021x9

n = 50; R

2

train = 0,934; R

2

CV = 0,9658; MSE = 0,982

Các biến trong mô hình

C5 x1 SsssN x6

xp9 x2 cosmo area x7

electric energy x3 xp10 x8

cosmo volume x4 core-core repulsion x9

N4 x5 Hmax x10

Cấu trúc của mạng nơron bao gồm ba lớp I(9)-HL(12)-O(1); lớp đầu vào I(9) bao gồm

9 nơron là C5, xp9, electric energy, cosmo volume, N4, SsssN, cosmo area, xp10 và core-core

repulsion; lớp đầu ra O(1) bao gồm 1 nơron là logβ11; lớp ẩn bao gồm 12 nơron. Giải thuật

lan truyền ngược được sử dụng để luyện mạng. Hàm truyền hyperbolic tangent đặt trên mỗi

nút của lớp mạng nơron; các thông số luyện mạng bao gồm tốc độ học là 0,01; hệ số mô men

bằng 0,1. Kết quả nhận được tổng sai số bằng 0,000021 với 1.500.000 vòng lặp và hệ số hồi

quy của quá trình luyện là R

2

train = 0,9723 và R

2

CV = 0,9731.

Bên cạnh đó, khả năng dự đoán của các mô hình QSPR đều được đánh giá cẩn thận bằng

kỹ thuật đánh giá ngoại từng trường hợp. Kết quả dự đoán của các mô hình QSPR trên nhận

được đối với 10 hợp chất chọn từ các kết quả nghiên cứu thực nghiệm thông qua các giá trị

Q2

test và MARE (%). Giá trị MARE (%) của các mô hình QSPROLS, QSPRPCR, QSPRPLS và

QSPRANN I(9)-HL(12)-O(1) tương ứng là 16,212%; 14,975%; 11,945% và 8,331% cho thấy

mô hình QSPRANN cho kết quả dự đoán tốt nhất kế đến lần lượt các mô hình QSPRPLS,

QSPRPCR and QSPROLS. Kết quả từ phân tích dữ liệu cho thấy khả năng dự đoán của các mô

hình là rất tốt. Theo đó, mô hình mạng thần kinh QSPRANN thể hiện sự phù hợp và tương quan

tốt nhất giữa các giá trị dự đoán và các giá trị thực nghiệm, kế đến là mô hình QSPRPLS,

h

QSPRPCR và cuối cùng là mô hình QSPROLS với Q2

test lần lượt là 0,9334; 0,9033; 0,9058 và

0,8752. Các giá trị logβ11 từ các mô hình QSPR gần với các giá trị thử nghiệm.

Phương pháp ANOVA một yếu tố cũng được sử dụng để đánh giá sự khác biệt giữa các

giá trị logβ11 thực nghiệm và logβ11 dự đoán từ các mô hình trên. Qua đó cho thấy sự chênh

lệch giữa các giá trị thực nghiệm và tính toán các hằng số bền logβ11 cả ba mô hình không

đáng kể (F = 0,043509 < F0,05 = 2,866266). Vì vậy có thể khẳng định rằng khả năng dự báo

của các mô hình QSPR phù hợp với dữ liệu thực nghiệm.

Như vậy, công trình này đã xây dựng thành công quan hệ định lượng cấu trúc-hằng số

bền logβ11 (QSPRs) sử dụng các phương pháp hồi quy bội (QSPROLS), hồi quy riêng phần

(QSPRPLS), hồi quy thành phần chính (QSPRPCR) và mạng thần kinh nhân tạo (QSPRANN).

Các mô hình QSPR được xây dựng bằng cách sử dụng tập dữ liệu của các bộ mô tả cấu trúc

nhận kết quả từ phép tính lượng tử bán thực nghiệm và cơ học phân tử. Các mô hình QSPR

được đánh giá chéo một cách cẩn thận bằng phương pháp loại bỏ dần từng trường hợp thông

qua các giá trị thống kê R

2

train, Q2

LOO hay R

2

CV, MARE (%) và phương pháp ANOVA một yếu

tố. Các kết quả từ nghiên cứu này nhằm phục vụ cho việc thiết kế các dẫn xuất

thiosemicarbazone mới hữu ích để tìm ra các phức hợp mới trong nhiều lĩnh vực như hóa học

phân tích, dược phẩm và môi trường.

6.2. Abstract

Thiosemicarbazone compounds and its metal complexes were widely researched in the

world because of its diversified application areas in fact. In the field of chemistry,

thiosemicarbazones are used as analytical reagents, they are also used as a catalyst in chemical

reactions. Besides, they also have application in biology, environment and medicine. For

complexes, the stability constant of complexes is an important factor. This is hold to identify

the complex stability in solutions with different solvents. The stability constant of complexes

is the hinge parameter to explain phenomenon such as the mechanism of reaction and distinct

properties of the biological systems. Augmentation, it is also a measure of the power of the

interaction between the metal ions and the ligand to form complexes. We can calculate the

equilibrium concentration of substances in a solution upon the stability constant. The changes

of the complex structure in solutions can be forecasted by using the initial concentration of

the metal ion and the ligand. In recent years, the stability constant of complexes has been

studied extensively in UV-VIS spectrophotometry.

Recently, the computer science has evolved dramatically, it has been becoming a helpful

tool to develop computational chemistry such as material simulation and data mining. The

molecular design by means of a computer is also a way to accelerate the discovery process

for resulting knowledge of material properties. This is also a tendency to reduce the classical

trial-and-error approach. In this case, the development of molecular models such as the

quantitative structure and property relationship (QSPR) has also contributed greatly to the

i

discovery and development of new molecules. In this way, the multivariate analysis methods

and ANN networks have been becoming a convenient and an easy tool for supporting

empirical and theoretical models.

In this study, the stability constants of metal-thiosemicarbazone complexes, log11 were

determined by using the quantitative structure-property relationship (QSPR) models. The

molecular descriptors, physicochemical and quantum descriptors of complexes were

generated from molecular geometric structure and semi-empirical quantum calculation PM7

and PM7/sparkle. The QSPR models were built by using the ordinary least square regression

(OLS), partial least square regression (PLS), primary component regression (PCR) and

artificial neural network (ANN). The best linear model QSPROLS (with k of 9) involves

descriptors C5, xp9, electric energy, cosmo volume, N4, SsssN, cosmo area, xp10 and core￾core repulsion. The QSPRPLS, QSPRPCR and QSPRANN models were developed basing on 9

variables of the QSPROLS model. The quality of the QSPR models were validated by the

statistical values such as R

2

train, Q2

LOO or R

2

CV and MSE. The neural network model QSPRANN

with architecture I(9)-HL(12)-O(1) was found also with the statistical values R

2

train and R

2

CV.

The linear regression equation of the QSPROLS model with the statistical values follows

logβ11 = -64.63 - 24.58x1 + 26.71x2 – 0.02334x3 – 0.355x4 + 25.47x5 -

- 2.143x6 + 0.531x7 – 38.16x8 – 0.02505x9

n = 50; R

2

train = 0,944; Q2

LOO = 0,903; MSE = 1.035

The regression equation of the QSPRPCR model with the statistical values follows

logβ11 = - 64.064 – 23.655x1 + 24.918x2 – 0.022x3 – 0.400x4 + 26.040x5 -

- 1.840x6 + 0.574x7 – 36.476x8 – 0.024x9

n = 50; R

2

train = 0,934; R

2

CV = 0,9485; MSE = 1.147

And the QSPRPLS model gives the following results

logβ11 = - 55.976 – 26.729x1 + 25.082x2 – 0.020x3 – 0.353x4 + 24.146x5 -

- 2.277x6 + 0.504x7 – 36.044x8 – 0.021x9

n = 50; R

2

train = 0,934; R

2

CV = 0,9658; MSE = 0.982

Notation of molecular descriptors

C5 x1 SsssN x6

xp9 x2 cosmo area x7

electric energy x3 xp10 x8

cosmo volume x4 core-core repulsion x9

N4 x5 Hmax x10

The architecture of the neural network consist of three layers I(9)-HL(12)-O(1); the

input layer I(9) includes 9 neurons that are C5, xp9, electric energy, cosmo volume, N4, SsssN,

j

cosmo area, xp10 and core-core repulsion; the output layer O(1) includes 1 neuron that is the

logβ11; the hidden layer includes 12 neurons. The error back-propagation algorithm is used to

train the network. The hyperbolic tangent transfer function sets on each node of the layer

neural network; the training network parameters include the learning rate of 0.01; the

momentum coefficient of 0.1. The results got the sum of error 0.000021 with 1,500,000 loops

and the regression coefficients of the training process are R

2

train = 0.9723 and R

2

CV = 0.9731.

Besides, the predictability of the QSPR models was carefully evaluated by means of the

phasing-each-case technique. The predicted results received for 10 randomly chosen

substances with the experimental through MARE (%) and Q2

test values. The MARE values of

models QSPROLS, QSPRPCR, QSPRPLS and QSPRANN I(9)-HL(12)-O(1) are 16.212%,

14.975%, 11.945% and 8.331%, respectively, indicating that model QSPRANN displays

highest predictability next model QSPRPLS, QSPRPCR and QSPROLS. The results of analysis

data can show that the predictability of the models is very good. Whereby, neural model

QSPRANN exhibits a best fit and correlation between the predicted values and the experimental

values, next QSPRPLS and QSPRPCR models and the last QSPROLS models with Q2

test of 0.9334,

0.9033, 0.9058 and 0.8752, respectively. The logβ11 values resulting from model QSPR are

closer to the experimental values.

The single factor ANOVA method was used to evaluate the difference between the

experimental and predictive logβ11 values from the QSPR models. Consequently, the

differences between the experimental and calculated values of stability constants logβ11

resulting from the QSPR models are insignificant (F = 0.043509 < F0.05 = 2.866266). Hence,

the predictability of all QSPR models turns out to be in a good agreement with the

experimental data.

So this work has successfully built the quantitative structure and property relationship

(QSPR) incorporating ordinary least square regression (QSPROLS), partial least square

(QSPRPLS), primary component regression (QSPRPCR) and artificial neural network

(QSPRANN). The QSPR models were constructed by using the dataset of structural descriptors

resulting from the semi-empirical quantum calculation and molecular mechanics. The QSPR

models were cross-validated carefully using the leave-one-out method upon statistical values

R

2

train, Q2

LOO or R

2

CV, MARE, %, and one-way ANOVA method. The results from this study

are in the service of designing new thiosemicarbazone derivatives that are helpful to find new

complexes in the many fields such as analytical chemistry, pharmacy, and environment.

III. Sản phẩm đề tài, công bố và kết quả đào tạo

3.1. Kết quả nghiên cứu (sản phẩm dạng 1, 2, 3)

TT Tên sản phẩm

Yêu cầu khoa học hoặc/và chỉ tiêu

kinh tế - kỹ thuật

k

Đăng ký Đạt được

1

Phương pháp nghiên

cứu

Lý thuyết về phương

pháp nghiên cứu

Lý thuyết về phương pháp

nghiên cứu

2 Cơ sở dữ liệu Bộ dữ liệu trên 50 chất Bộ dữ liệu 60 phức chất

3 Tài liệu dự báo

Các mô hình đã xây

dựng

Bốn mô hình dự báo

QSPROLS, QSPRPLS,

QSPRPCR, QSPRANN

4

Bài báo khoa học

chuyên ngành

01 bài báo tạp chí IUH 01 bài báo tạp chí IUH

3.2. Kết quả đào tạo: không đăng ký trong đề tài.

IV. Tình hình sử dụng kinh phí

TT Nội dung chi

Kinh phí

được duyệt

(triệu đồng)

Kinh phí

thực hiện

(triệu đồng)

Ghi

chú

A Chi phí trực tiếp - -

1 Thuê khoán chuyên môn 15 15

2 Nguyên, nhiên vật liệu, cây con… - -

3 Thiết bị, dụng cụ - -

4 Công tác phí - -

5 Dịch vụ thuê ngoài - -

6 Hội nghị, hội thảo, thù lao nghiệm thu

giữa kỳ

- -

7 In ấn, Văn phòng phẩm - -

8 Chi phí khác

B Chi phí gián tiếp - -

1 Quản lý phí - -

2 Chi phí điện, nước - -

Tổng số 15 15

V. Kiến nghị (về phát triển các kết quả nghiên cứu của đề tài)

 Kết quả nghiên cứu của đề tài có thể định hướng thiết kế các dẫn xuất

thiosemicarbazone mới trong tổng hợp hữu cơ được sử dụng như ligand nhằm tạo phức

bền vững với các ion kim loại thông qua giá trị hằng số bền trên cơ sở đó ứng dụng

chúng trong nhiều lĩnh vực liên quan hóa học.

 Bên cạnh đó, các dữ liệu từ đề tài này cũng có thể phát triển các mô hình QSAR nhằm

thăm dò hoạt tính sinh học, khả năng kháng khuẩn của các phức chất giữa

thiosemicarbazone với các ion kim loại. Qua đó, có thể định hướng thiết kế các dẫn

l

xuất thiosemicarbazone mới nhằm ứng dụng trong sản xuất dược liệu vì các dẫn xuất

này và phức của chúng cũng có khả năng kháng khuẩn cao.

 Ngoài ra, dữ liệu từ đề tài cũng co thể sử dụng phát triển các hợp chất mới nhằm ứng

dụng trong các lĩnh vực khác như xúc tác, môi trường…

 Cuối cùng, kết quả từ đề tài định hướng cho một phương pháp nghiên cứu sử dụng

trong giảng dạy và nghiên cứu khoa học cho sinh viên, học viên.

VI. Phụ lục (liệt kê minh chứng các sản phẩm nêu ở Phần III)

 Lý thuyết về phương pháp nghiên cứu;

 Bộ dữ liệu 60 phức chất;

 Bốn mô hình dự báo QSPROLS, QSPRPLS, QSPRPCR, QSPRANN;

 Bài báo: Nguyen Minh Quang, Tran Nguyen Minh An, Nguyen Hoang Minh, Tran

Xuan Mau, Pham Van Tat. “QSPR modelling of stability constants of metal￾thiosemicarbazone complexes using multivariate regression methods and artificial

neural network” (giấy xác nhận đăng bài số 01/TCKHCN, ngày 20 tháng 01 năm

2019 với mã số bài báo: 2018062701)

Tp. HCM, ngày........ tháng........ năm.......

Chủ nhiệm đề tài Phòng QLKH&HTQT Khoa Công nghệ hóa học

Trưởng khoa

(Họ tên, chữ ký)

i

MỤC LỤC

DANH MỤC CHỮ VIẾT TẮT............................................................................................iv

DANH MỤC HÌNH ẢNH, SƠ ĐỒ ....................................................................................viii

DANH MỤC BẢNG BIỂU...................................................................................................ix

LỜI MỞ ĐẦU......................................................................................................................... 1

CHƯƠNG 1. TỔNG QUAN ĐỀ TÀI................................................................................... 3

1.1. TỔNG QUAN VỀ QSPR................................................................................................ 3

1.1.1. Khái quát phương pháp mô hình hóa QSPR .......................................................... 3

1.1.2. Lịch sử phương pháp QSAR/QSPR....................................................................... 4

1.1.3. Quan điểm chiều của kỹ thuật QSAR/QSPR ......................................................... 8

1.1.4. Những nguyên lý cơ bản và lỗi khi xây dựng mô hình QSPR............................... 9

1.1.5. Những ưu điểm chính từ sự phân tích mô hình hóa QSPR.................................. 10

1.1.6. Kỹ thuật phát triển mô hình QSPR....................................................................... 10

1.1.7. Ứng dụng QSAR/QSPR ....................................................................................... 11

1.2. BỘ MÔ TẢ .................................................................................................................... 12

1.2.1. Khái quát về bộ mô tả........................................................................................... 12

1.2.2. Phân loại mô tả ..................................................................................................... 14

1.2.3. Các công cụ sử dụng để tính toán bộ mô tả phân tử ............................................ 17

1.3. TỔNG QUAN VỀ THIOSEMICARBAZONE VÀ PHỨC CHẤT.......................... 18

1.3.1. Dẫn xuất thiosemicacbazone và phức chất........................................................... 19

1.3.2. Thực trạng nghiên cứu trong nước ....................................................................... 21

1.3.3. Nghiên cứu nước ngoài ........................................................................................ 22

1.4. CƠ SỞ LÝ THUYẾT HÓA LƯỢNG TỬ................................................................... 23

1.4.1. Cơ học phân tử ..................................................................................................... 23

1.4.2. Cơ học lượng tử.................................................................................................... 27

1.5. CƠ SỞ LÝ THUYẾT CÁC MÔ HÌNH TOÁN HỌC................................................ 38

1.5.1. Hồi quy tuyến tính thường.................................................................................... 38

1.5.2. Bình phương tối thiểu riêng phần......................................................................... 38

1.5.3. Hồi quy thành phần chính .................................................................................... 39

1.5.4. Mạng thần kinh nhân tạo ...................................................................................... 40

ii

1.5.5. Đánh giá mô hình QSPR ...................................................................................... 49

1.6. NỘI DUNG NGHIÊN CỨU CỦA ĐỀ TÀI................................................................. 57

1.6.1. Đối tượng nghiên cứu........................................................................................... 57

1.6.2. Nội dung nghiên cứu ............................................................................................ 57

CHƯƠNG 2. PHƯƠNG PHÁP NGHIÊN CỨU ............................................................... 58

2.1. PHƯƠNG PHÁP MÔ HÌNH HÓA QSPR ................................................................. 58

2.1.1. Sơ đồ mô hình hóa QSPR..................................................................................... 58

2.1.2. Thuyết minh phương pháp nghiên cứu................................................................. 58

2.2. CÔNG CỤ VÀ PHẦN MỀM NGHIÊN CỨU ............................................................ 59

2.3. THU THẬP DỮ LIỆU THỰC NGHIỆM BAN ĐẦU................................................ 60

2.4. PHƯƠNG PHÁP TÍNH TOÁN THÔNG TIN CẤU TRÚC..................................... 60

2.4.1. Phương pháp chọn giải thuật trong cơ học phân tử.............................................. 60

2.4.2. Phương pháp tối ưu hóa cấu trúc.......................................................................... 61

2.4.3. Phương pháp tính toán bộ tham số mô tả phân tử................................................ 62

2.4.4. Phương pháp tính toán điện tích và các tham số hóa lý ....................................... 62

2.5. PHƯƠNG PHÁP XÂY DỰNG CÁC MÔ HÌNH QSPR........................................... 62

2.5.1. Phương pháp toán học sử dụng xây dựng các mô hình QSPR............................. 63

2.5.2. Phương pháp xây dựng các mô hình QSPR ......................................................... 63

2.5.3. Phương pháp đánh giá mô hình............................................................................ 64

CHƯƠNG 3. KẾT QUẢ VÀ THẢO LUẬN...................................................................... 65

3.1. DỮ LIỆU NGHIÊN CỨU ............................................................................................ 65

3.2. XÂY DỰNG CẤU TRÚC CỦA LIGAND VÀ PHỨC CHẤT.................................. 65

3.3. TÍNH TOÁN THÔNG TIN CẤU TRÚC.................................................................... 65

3.3.1. Tính toán cơ học phân tử và chọn giải thuật ........................................................ 65

3.3.2. Tính toán lượng tử................................................................................................ 66

3.3.3. Tính toán tham số mô tả phân tử 2D, 3D ............................................................. 67

3.4. MÔ HÌNH QSPR .......................................................................................................... 67

3.4.1. Mô hình QSPROLS ................................................................................................ 67

3.4.2. Mô hình QSPRPLS................................................................................................. 68

3.4.3. Mô hình QSPRPCR ................................................................................................ 69

3.4.4. Mô hình QSPRANN................................................................................................ 69

3.5. KẾT QUẢ ĐÁNH GIÁ MÔ HÌNH ............................................................................. 70

Tải ngay đi em, còn do dự, trời tối mất!