您當(dāng)前的位置:檢測(cè)資訊 > 法規(guī)標(biāo)準(zhǔn)
嘉峪檢測(cè)網(wǎng) 2021-12-22 13:16
藥物研究過(guò)程中,有諸多的未知雜質(zhì);藥物包裝材料浸出后,也會(huì)有一些不確定的浸出物。自新版ISO10993-1:2018推出后,醫(yī)療器械瀝濾物的研究也變得越發(fā)的重要,法規(guī)部門(mén)在多數(shù)情況下會(huì)要求提供瀝濾物的定性及定量的研究。但是,瀝濾物并非都是已知的小分子化合物,比如有相應(yīng)的分子結(jié)構(gòu)式、CAS號(hào)等,反而常常是新的小分子化合物,這時(shí)候就無(wú)CAS號(hào)可用,只有相應(yīng)的分子結(jié)構(gòu)式。在毒理數(shù)據(jù)庫(kù)或者QSAR相應(yīng)的軟件中交互過(guò)程中,只能手繪分子結(jié)構(gòu)式,這樣就會(huì)繁瑣很多,而且浪費(fèi)時(shí)間又很容易造成手繪錯(cuò)誤。因此,毒理數(shù)據(jù)庫(kù)與QSAR軟件允許用戶以計(jì)算機(jī)的方式表示分子結(jié)構(gòu)的SMILES方式,來(lái)與數(shù)據(jù)庫(kù)/軟件進(jìn)行交互。SMILES(Simplified Molecular Input Line Entry System)是一種計(jì)算機(jī)交互語(yǔ)言,是專門(mén)設(shè)計(jì)的化學(xué)符號(hào)語(yǔ)言,它對(duì)于使用者來(lái)說(shuō)很容易獲得,且又足夠靈活,是化學(xué)符號(hào)的解釋和生成獨(dú)立于使用的特定計(jì)算機(jī)系統(tǒng)(如QSAR軟件、VEGA軟件)字符串。
①獲得SMILES的方法
1.1 有CAS號(hào)的化合物
可以從常用的搜索引擎查到化合物的相關(guān)信息,獲得SMILES(以及其它諸如InChI Key還有IUPAC名稱等信息),具體可使用以下網(wǎng)址:
PubChem:https://pubchem.ncbi.nlm.nih.gov
ChemIDplus:https://chem.nlm.nih.gov/chemidplus/
1.2 知道名稱得到SMILES
使用Chemdraw輸入名稱,隨后獲得結(jié)構(gòu)式。例:如果要得到“Phenylephrine Hydrochloride”的結(jié)構(gòu),則點(diǎn)擊“Structure”→“Convert Name to Structure”→彈出窗口的文本框中輸入“Phenylephrine Hydrochloride”→點(diǎn)擊“OK”后,即出現(xiàn)Phenylephrine Hydrochloride的結(jié)構(gòu)式;隨后得到SMILES(見(jiàn)下)
1.3 僅有分子結(jié)構(gòu)式得到SMILES
舉例說(shuō)明如何通過(guò)分子結(jié)構(gòu)式得到SMILES。在Chemdraw軟件中畫(huà)出“Phenylephrine Hydrochloride”(鹽酸去氧腎上腺素)的結(jié)構(gòu)式,選中結(jié)構(gòu)式,然后依次點(diǎn)擊“Edit”→“Copy As”→“SMILES”,復(fù)制到Word文檔中即可(同理可得到“Phenylephrine Hydrochloride”的InChI、InChI Key等)。值得一提的是,這種方法適合解析獲得結(jié)構(gòu)的全新物質(zhì),從而與毒理數(shù)據(jù)庫(kù)中進(jìn)行交互使用。
②SMILES 的基本規(guī)則
化學(xué)形式化的第一步是命名一種化合物。這需要一個(gè)明確的和從最簡(jiǎn)單的原子到最復(fù)雜的原子的可重現(xiàn)符號(hào)結(jié)構(gòu)體——SMILES符號(hào)是以空格結(jié)尾的一系列字符,同時(shí)SMILES唯一使用的字母是原子符號(hào),它們通常使用的是有機(jī)子集符號(hào)H、C、N、O、P、S、F、Cl、Br、I、(,)和數(shù)字。
基本遵循以下規(guī)則:(1)原子用原子符號(hào)表示;(2)雙鍵和三鍵分別用 = 和 # 表示;(3)支鏈用括號(hào)表示;(4)環(huán)狀化合物是由相對(duì)應(yīng)的數(shù)字匹配(開(kāi)環(huán)或閉環(huán)處)。具體要求,如下所述:
2.1 原子
每個(gè)非氫原子都由方括號(hào)內(nèi)的原子符號(hào)獨(dú)立指定,兩個(gè)字符符號(hào)的第二個(gè)字母必須用小寫(xiě)字母輸入。
普通碳原子用大寫(xiě)字母C表示,芳香環(huán)中的碳原子用小寫(xiě)字母表示;如果出現(xiàn)的原子不在上述有機(jī)子集中的,需加方括號(hào)描述。如:[Au]表示元素金。
通常情況下,默認(rèn)方括號(hào)內(nèi)的電荷數(shù)總數(shù)為零,如果有電荷數(shù)不同,電荷由符號(hào)+或-和數(shù)字表示。如:[NH4+]表示銨根離子;[Fe+2]或者是[Fe++]表示2價(jià)鐵離子。
2.2 鍵
分為單鍵、雙鍵、三鍵和芳香鍵分別用-、=、#和 : 表示,單鍵和芳香鍵通??梢允÷浴H纾阂彝闉镃C;乙烯為C=C;乙炔為C#C
2.3 線性結(jié)構(gòu)
CH2=CH-CH2-CH=CH-CH2-OH
SMILES結(jié)構(gòu)式為C=CCC=CCO或者C=C-C-C=C-C-O或者OCC=CCC=C
2.4 分支結(jié)構(gòu)
SMILES結(jié)構(gòu)式為CCN(CC)CC(括號(hào)內(nèi)為分支原子)
2.5 環(huán)狀化合物
在環(huán)結(jié)構(gòu)中的把環(huán)上的鍵打開(kāi)一個(gè)化學(xué)鍵按任意順序編號(hào),表示開(kāi)環(huán)(或環(huán)閉合)鍵,在每個(gè)環(huán)閉合處的原子符號(hào)后面緊跟著一個(gè)數(shù)字。如環(huán)己烷的SMILES為C1CCCCC1
2.6 帶有支鏈結(jié)構(gòu)
SMILES結(jié)構(gòu)式為CC1=CC(Br)CCC1或者CC1=(CCC1)Br
2.7 對(duì)于芳香型化合物
SMILES結(jié)構(gòu)式為c1ccccc1C(=O)O
③總結(jié)與討論
綜上所述,根據(jù)上面規(guī)則,幾乎所有的有機(jī)結(jié)構(gòu)都可以用符號(hào)來(lái)描述。但美中不足的是,同一個(gè)分子結(jié)構(gòu)式常常會(huì)從不同的資料中發(fā)現(xiàn)有不同SMILES——這取決于SMILES讀取的起始點(diǎn)(具體見(jiàn)2.3節(jié)和2.6節(jié)),這時(shí)我們只需要確定不同的SMILES字符串所獲得的化學(xué)結(jié)構(gòu)式是否一樣即可。
另一方面,在工作中也會(huì)遇到InChI、InChI Key來(lái)表達(dá)化學(xué)結(jié)構(gòu)式,這里也順便談?wù)?。其中InChI Key有時(shí)偶爾會(huì)表達(dá)兩個(gè)或多個(gè)的InChI字符串。它是化學(xué)物質(zhì)的文本標(biāo)識(shí)符,標(biāo)識(shí)符根據(jù)信息層來(lái)描述化學(xué)物質(zhì)——原子及其鍵連接、互變異構(gòu)信息、同位素信息、立體化學(xué)和電荷信息。與SMILES符號(hào)相比,它們可以表達(dá)更多的信息,不同之處在于每個(gè)結(jié)構(gòu)都有一個(gè)唯一的InChI字符串。
參考文獻(xiàn):
Weininger. D, SMILES, a chemical language and information system.1. Introduction to methodology and encoding rules J. Chem. Inf. Comput. Sci. 1988, 28, 1, 31-36.
在維基百科中InChl Key的說(shuō)明https://en.wikipedia.org/wiki/International_Chemical_Identifier

來(lái)源:Internet