您當(dāng)前的位置:檢測資訊 > 科研開發(fā)
嘉峪檢測網(wǎng) 2020-09-22 09:12
在材料科學(xué)中,我們對某一材料的表征(如電鏡圖、元素分布、帶隙等)會(huì)衍生出大量的數(shù)據(jù)。在“大數(shù)據(jù)”的背景下,如何有效利用這類含有豐富內(nèi)容的數(shù)據(jù)集,是基于高通量計(jì)算探索材料的主要問題和挑戰(zhàn)。目前,創(chuàng)造數(shù)據(jù)驅(qū)動(dòng)和自動(dòng)化框架用于數(shù)據(jù)的可視化和分析是許多研究人員追求的目標(biāo)。關(guān)鍵的問題是如何構(gòu)建容易理解和操作的數(shù)據(jù)低維表達(dá)方式。
原子結(jié)構(gòu)數(shù)據(jù)可視化的概念和主要方法
低維嵌入(Embedding)
一般來說,分子或者材料的幾何構(gòu)象是高于三維的。然而為了對結(jié)構(gòu)數(shù)據(jù)進(jìn)行可視化,研究人員需要對數(shù)據(jù)進(jìn)行低維化,即將結(jié)構(gòu)轉(zhuǎn)化成點(diǎn),使其能夠在紙面或者屏幕上進(jìn)行直觀體現(xiàn)。用于蛋白質(zhì)骨架結(jié)構(gòu)表征的Ramachandran圖就是一個(gè)經(jīng)典的例子,利用這種二維圖基于僅僅兩個(gè)扭轉(zhuǎn)角(torsion angles)就可以對具有66個(gè)幾何自由度的多肽分子進(jìn)行可視化。實(shí)現(xiàn)低維嵌入的關(guān)鍵是如何定義原子結(jié)構(gòu)中距離尺度。機(jī)器學(xué)習(xí)(machine learning)是目前用來描述預(yù)測原子結(jié)構(gòu)的主要方法之一。例如研究人員在晶胞里建立了基于分子動(dòng)力學(xué)構(gòu)象數(shù)據(jù)集的SOAP(smooth overlap of atomic positions)-GAP(Gaussian approximation potential)模型1?;谶@種模型,研究人員能夠準(zhǔn)確描述在寬泛的溫度和壓力范圍內(nèi),塊體和缺陷材料的性質(zhì)。如圖1所示,STM圖像表征了在重構(gòu)硅表面的二聚體具有傾斜角(tilt angle)。而基于SOAP-GAP預(yù)測,并結(jié)合密度泛函理論(DFT)發(fā)現(xiàn),這一弛豫結(jié)構(gòu)來源于Jahn-Teller變形,且傾斜角的角度經(jīng)過模型預(yù)測為19度左右。

圖1 SOAP-GAP預(yù)測硅表面結(jié)構(gòu)1
描述及比較原子環(huán)境
實(shí)現(xiàn)材料及分子結(jié)構(gòu)的自動(dòng)比較和繪圖首先需要描述原子環(huán)境(atomic environment)。而所謂的原子環(huán)境則是指以特定原子為中心,一定半徑范圍內(nèi)的原子(化學(xué)物種及位置)所構(gòu)成的。在機(jī)器學(xué)習(xí)中,一個(gè)優(yōu)秀的原子環(huán)境描述符(descriptor)應(yīng)該不隨同一物種原子的轉(zhuǎn)變、旋轉(zhuǎn)、重排等不會(huì)改變物理性質(zhì)的操作而一同改變。因?yàn)榉呛懔康拿枋龇ǔ;谠拥墓矁r(jià)鏈接,具有低維屬性,會(huì)喪失許多幾何信息。而恒量描述符則可以盡可能地保留原子環(huán)境和結(jié)構(gòu)的幾何信息,由此再通過維度還原的低維嵌入以達(dá)到繪制低維結(jié)構(gòu)圖譜的目的。例如Deringer等2人基于機(jī)器學(xué)習(xí)研究了非晶硅的原子結(jié)構(gòu)量化可行性。研究人員利用局部穩(wěn)定性量化描述了原子最近鄰和次近鄰結(jié)構(gòu),并利用一分析方式分析了不同淬滅速率下取向度不同的非晶硅網(wǎng)絡(luò)。此外,這一方法還將非晶硅的配位缺陷和穩(wěn)定區(qū)域聯(lián)系在一起,并追蹤液態(tài)硅在玻璃化過程中的能量過渡狀態(tài)(圖2)。

圖2 基于機(jī)器學(xué)習(xí)模擬非晶硅網(wǎng)絡(luò)的熔融-淬滅過程2
典型案例
非晶碳結(jié)構(gòu)繪制
憑借其優(yōu)異的力學(xué)性能,四面體非晶碳在涂層領(lǐng)域擁有廣泛的應(yīng)用;同時(shí)四面體非晶碳也能夠作為理想的電極材料用以檢測生物大分子。然而,盡管應(yīng)用范圍廣泛,四面體非晶碳表面具有復(fù)雜的原子尺度結(jié)構(gòu)和化學(xué)反應(yīng)活性,至今還未被深入理解。劍橋大學(xué)的Deringer等3人將機(jī)器學(xué)習(xí)、密度泛函緊束縛(tight binding)(DFTB)以及DFT結(jié)合起來用以研究這一長期困擾的問題。研究人員基于第一性原理建立了一系列四面體非晶碳表面的原子論模型,以局部結(jié)構(gòu)指紋作為特征,能夠在不同的系統(tǒng)尺度中提供一系列結(jié)構(gòu)。再利用蒙特卡洛算法和由DFTB得到的相互作用,可以研究四面體非晶碳的逐步氫化過程(圖3);而利用DFT-機(jī)器學(xué)習(xí)則可以研究原子級的氧化機(jī)制。這一嘗試為理解非晶材料表面提供了新的可能,還能以空前的準(zhǔn)確性來研究表面結(jié)構(gòu)的化學(xué)功能化。

圖3 基于機(jī)器學(xué)習(xí)模擬的四面體非晶碳表面的典型結(jié)構(gòu)模型3
液態(tài)中的晶體成核
在晶體形成過程中,也可以利用自動(dòng)繪圖技術(shù)來理解結(jié)構(gòu)(例如研究成核過程的結(jié)構(gòu)異質(zhì)性情況)。一般來說,材料的固化都來源于小晶體的成核。而盡管模型研究不少,但是對面心立方晶核表面是否存在體心立方取向一直具有爭議。這一爭議主要是因?yàn)轶w心立方的物理界限不好判斷,同時(shí)常用的局部鍵取向參數(shù)也無法區(qū)別體心立方和界面原子。而Cheng4等人則開發(fā)了新型策略可將宏觀理論和仿真計(jì)算有機(jī)結(jié)合在一起,以研究晶體成核。為了實(shí)現(xiàn)這一目的,研究人員基于多簇模型建立用以研究的理想原子論體系。緊接著發(fā)展了一種與多簇模型一致的熱力學(xué)框架,要求更少的假設(shè),并適用于分子動(dòng)力學(xué)或者蒙特卡洛研究。如圖4所示的主元分析(PCA)圖,是基于在冷卻液體中的固體核內(nèi)的原子環(huán)境的SOAP描述符繪制的。利用經(jīng)典的面心立方取向參數(shù),根據(jù)他們與面心立方的相似度可對環(huán)境進(jìn)行著色。由圖3可知,分別代表面心立方和類液體模塊的數(shù)據(jù)點(diǎn)揭示了核中心和液體之間存在平滑漸變的過渡狀態(tài),并且不存在明顯的代表體心立方局部取向的額外密度峰;相反,作為參比的體心立方環(huán)境則與目標(biāo)數(shù)據(jù)點(diǎn)之間存在明顯的分隔現(xiàn)象。這一方法為“成核過程中不存在體心立方取向”提供了頗具說服力的證據(jù)

圖4 對周邊存在液體的固體核環(huán)境進(jìn)行著色4
液態(tài)水結(jié)構(gòu)
計(jì)算物理化學(xué)領(lǐng)域的一個(gè)中心命題是基于量子力學(xué)的基本法則利用第一性原理來預(yù)測材料的性質(zhì)。然而,這類方法的計(jì)算成本高,阻礙了在有限的溫度里阻礙對諸如熱容、密度以及化學(xué)勢等進(jìn)行準(zhǔn)確預(yù)測。針對這一問題,Cheng5等人將先進(jìn)的自由能方法和數(shù)據(jù)驅(qū)動(dòng)的機(jī)器學(xué)習(xí)原子間勢能結(jié)合起來,用以實(shí)現(xiàn)更加嚴(yán)謹(jǐn)可靠的預(yù)測方式。研究人員基于DFT,并考慮了量子核運(yùn)動(dòng)、不和諧波動(dòng)以及質(zhì)子失序等因素,實(shí)現(xiàn)了對液態(tài)水的熱力學(xué)性質(zhì)預(yù)測。利用經(jīng)典分子動(dòng)力學(xué)模擬,研究人員收集了1000個(gè)液態(tài)水結(jié)構(gòu);而基于這些數(shù)據(jù)又進(jìn)一步提取了經(jīng)過幾何優(yōu)化的數(shù)據(jù)——基于氫核的量子力學(xué)本質(zhì)實(shí)現(xiàn)對液態(tài)水結(jié)構(gòu)的量子力學(xué)化。由圖四可知,經(jīng)典和量子的水形式分隔成了兩簇;其中經(jīng)典水構(gòu)象在能量和摩爾體積兩個(gè)方向均有寬泛的分布,揭示了核-量子擾動(dòng)在調(diào)節(jié)不同水相熱力學(xué)穩(wěn)定性中扮演的角色。

圖5 1000個(gè)經(jīng)典液態(tài)水構(gòu)象和593個(gè)量子力學(xué)液態(tài)水結(jié)構(gòu)的數(shù)據(jù)繪圖5
晶體結(jié)構(gòu)
對晶體多晶相的相穩(wěn)定性進(jìn)行研究和預(yù)測一直是計(jì)算材料科學(xué)的重要課題。然而這類研究一直極具挑戰(zhàn)。最主要的原因是這類研究首先要求勢能最小化,并執(zhí)行復(fù)雜的自由能計(jì)算以對有限溫度的熵效應(yīng)進(jìn)行解釋。而Reinhardt6等人則發(fā)展了一種框架能夠通過獲取晶體結(jié)構(gòu)來實(shí)現(xiàn)相穩(wěn)定性預(yù)測和研究。研究將隨機(jī)結(jié)構(gòu)研究(RSS)和機(jī)器學(xué)習(xí)有機(jī)結(jié)合在一起用以研究固相的自由能,并以此實(shí)現(xiàn)對未知相的熱力學(xué)相行為研究。研究人員選擇多晶相眾多的二氧化鈦?zhàn)鳛檠芯繉ο?,收集上千個(gè)截然不同的原子配位、晶胞形態(tài)等結(jié)構(gòu)數(shù)據(jù)制成數(shù)據(jù)集,如圖6所示形成了包含4690個(gè)局部穩(wěn)定結(jié)構(gòu)的結(jié)構(gòu)相似度圖譜。在這一圖中,材料的性質(zhì)如焓或者單元晶胞體積都可以一目了然,再通過映射分析已知相和未知相就可以快速識(shí)別研究中出現(xiàn)的相數(shù)據(jù)。

圖6 由隨機(jī)結(jié)構(gòu)研究得到的二氧化鈦主元分析圖6
異質(zhì)界面結(jié)構(gòu)
結(jié)構(gòu)研究也可以擴(kuò)展到界面系統(tǒng)中,用以揭示其他途徑難以獲取的穩(wěn)定構(gòu)型。由于界面的存在打破了晶體對稱性,對界面結(jié)構(gòu)進(jìn)行數(shù)據(jù)分析更加具有挑戰(zhàn)。圖7顯示了鈦酸鍶(STO)和釤摻雜二氧化鈰(110)/(110)界面結(jié)構(gòu)7。PCA圖譜能夠自動(dòng)識(shí)別界面能量,每個(gè)點(diǎn)均代表了局部能量最小值的構(gòu)型,而相對能量則被用作顏色標(biāo)尺,與橫軸具有強(qiáng)關(guān)聯(lián)關(guān)系。釤摻雜二氧化鈰具有螢石結(jié)構(gòu)的離子導(dǎo)體,而STO則是具有鈣鈦礦結(jié)構(gòu)的絕緣體。從PCA圖中可以識(shí)別兩種簇:分別是與塊體相簡單連接形成的理想界面結(jié)構(gòu)相似的結(jié)構(gòu)數(shù)據(jù),以及包含重構(gòu)結(jié)構(gòu)的數(shù)據(jù)群組。

圖7 鈦酸鍶和釤摻雜二氧化鈰(110)/(110)界面結(jié)構(gòu)的PCA圖7
草酸晶體中的多晶形態(tài)
主元分析也可以用于鑒別組分固定體系的多晶中的不同之處。以草酸為例,在圖8中8,左圖是展示了氣相中,草酸在勢能表面的七種穩(wěn)定構(gòu)象異構(gòu)體(conformer)結(jié)構(gòu),并且根據(jù)質(zhì)子取向以及縱軸將這些結(jié)構(gòu)進(jìn)行排列。而在右圖中,基于主元分析和隨機(jī)結(jié)構(gòu)研究揭示了草酸的48個(gè)塊狀晶體結(jié)構(gòu),初始的隨機(jī)結(jié)構(gòu)與相應(yīng)的弛豫構(gòu)象利用灰線進(jìn)行連接,并且隨機(jī)和優(yōu)化的晶體結(jié)構(gòu)處在不同的區(qū)域。幾乎所有的優(yōu)化結(jié)構(gòu)都是分隔清楚的,表明晶體具有許多穩(wěn)定的最小值,這與氣相截然不同。圖8的左右兩圖強(qiáng)調(diào)了分子結(jié)構(gòu)的不同層面,其中左圖基于質(zhì)子取向顯示了分子內(nèi)層面;而右圖則揭示了分子間相互作用的不同之處。因此,這兩圖的結(jié)合可以為更深入理解分子晶體形成中的結(jié)構(gòu)參數(shù)提供了新的模式和機(jī)會(huì)。

圖8 基于主元分析和機(jī)器學(xué)習(xí)揭示了草酸分子晶體結(jié)構(gòu)8
參考文獻(xiàn)
1. Machine learning unifies the modeling of materials and molecules. Sci. Adv., 2017, 3, 12, e1701816.
2. Quantifying Chemical Structure and Machine‐Learned Atomic Energies in Amorphous and Liquid Silicon. Angew. Chem. Int. Ed., 2019, 58, 7057-7061.
3. Computational Surface Chemistry of Tetrahedral Amorphous Carbon by Combining Machine Learning and Density Functional Theory. Chem. Mater., 2018, 30, 21, 7438-7445.
4. Bridging the gap between atomistic andmacroscopic models of homogeneous nucleation. J. Chem. Phys. 2017,146, 034106.
5. Abinitio thermodynamics of liquid and solid water. Proc. Natl. Acad. Sci.U. S. A. 2019, 116, 1110−1115.
6. Predicting the phase diagram of titanium dioxide with random search and pattern recognition. Phys. Chem. Chem. Phys., 2020,22, 12697-12705.
7. Determining interface structures in vertically aligned nanocomposite films. APL Materials 2019, 7, 061105.
8. Mapping Materials and Molecules. Acc. Chem. Res. DOI: 10.1021/acs.accounts.0c00403.

來源:材料人