您當(dāng)前的位置:檢測資訊 > 實(shí)驗(yàn)管理
嘉峪檢測網(wǎng) 2025-02-21 08:18
做蛋白質(zhì)功能、信號通路、疾病靶點(diǎn)與作用機(jī)制,乃至于篩選新藥物靶標(biāo)蛋白質(zhì)及其結(jié)合位點(diǎn)等課題,都有一項(xiàng)基礎(chǔ)的需求:分析比對蛋白質(zhì)序列和預(yù)測蛋白質(zhì)結(jié)構(gòu)。
因?yàn)殡逆湹陌被嵝蛄斜旧硪约暗鞍踪|(zhì)的高級結(jié)構(gòu)都會很大程度影響到它的最終功能。光做實(shí)驗(yàn)收獲數(shù)據(jù)可能會沒有處理頭緒,因此我們需要生物信息學(xué)(bioinfo)手段。
Bioinfo作為一個學(xué)科近年已越發(fā)成熟,如今擁有大量的數(shù)據(jù)分析方法和理論模型,推動蛋白質(zhì)研究的發(fā)展。在這里,小編給大家提供一個用于“分析比對蛋白質(zhì)序列和預(yù)測蛋白質(zhì)結(jié)構(gòu)”的入門新手包:
首先,在實(shí)驗(yàn)初期我們要獲取蛋白質(zhì)及其編碼基因的序列數(shù)據(jù)??梢栽谶@些網(wǎng)站獲?。?/span>
NCBI (National Center for Biotechnology Information):
https://www.ncbi.nlm.nih.gov/
NCBI包含很多子分類數(shù)據(jù)庫,覆蓋中心法則的各個步驟。我們可以使用如GenBank(核酸序列)和Protein數(shù)據(jù)庫(蛋白質(zhì)序列)。直接在搜索欄中檢索目的蛋白或基因,尤其是可以在NCBI數(shù)據(jù)庫中下載FASTA格式的序列文件,這是一種可用于序列比對的文本格式,用于表示核酸序列或蛋白質(zhì)序列,其中每個序列由單行的標(biāo)題后跟序列數(shù)據(jù)組成,是很多分析操作的基礎(chǔ)。
PDB (Protein Data Bank):
https://www.rcsb.org/
PDB存儲蛋白質(zhì)三維結(jié)構(gòu)數(shù)據(jù),是目前最主要的收集生物大分子(蛋白質(zhì)、核酸和糖)2.5維(以二維的形式表示三維的數(shù)據(jù))結(jié)構(gòu)的數(shù)據(jù)庫。我們可以在每個蛋白質(zhì)的專屬頁面獲取包括但不限于初級結(jié)構(gòu)、三維結(jié)構(gòu)、原子坐標(biāo)甚至相關(guān)參考文獻(xiàn)等各種信息。如果你要研究的蛋白質(zhì)已有研究人員匯報過結(jié)構(gòu),可以直接從PDB下載結(jié)構(gòu)文件,甚至可能獲得NMR實(shí)驗(yàn)數(shù)據(jù)等珍貴資料。
UniProt:
https://www.uniprot.org/
UniProt是現(xiàn)在最全面的綜合性蛋白質(zhì)序列和功能的數(shù)據(jù)庫,可以提供關(guān)于蛋白質(zhì)功能、分類和序列等詳細(xì)信息。除了序列與結(jié)構(gòu)這些基礎(chǔ)信息,還可以在其中獲取如亞細(xì)胞定位、翻譯后修飾、蛋白互作等實(shí)用信息。
毫無疑問,數(shù)據(jù)庫,尤其是蛋白質(zhì)數(shù)據(jù)庫,肯定遠(yuǎn)遠(yuǎn)不止此處提到的三個。根據(jù)不同的研究需要,研究人員可能需要專門針對如保守序列、激酶、磷酸化、相互作用等各種特定信息的數(shù)據(jù)庫。由于本文是帶新手入門,此處給出的是三個相對最常用、最綜合性的數(shù)據(jù)庫。
獲取了目的蛋白的信息,接下來就需要進(jìn)行實(shí)驗(yàn)操作。我們當(dāng)然不可能使用肉眼手工或者office全家桶進(jìn)行對比,這里給大家提供一些常用的基礎(chǔ)工具,在序列分析和結(jié)構(gòu)預(yù)測領(lǐng)域能輕松進(jìn)行大部分初步分析工作:
EMBOSS (European Molecular Biology Open Software Suite):
http://emboss.open-bio.org/
EMBOSS是一套開源軟件工具,用于分子生物學(xué)分析。功能繁多,包括序列比對搜索、反向翻譯、密碼子比較與統(tǒng)計(jì)分析、序列提取等。有一些工具如water(局部序列比對)或needle(全局序列比對)相對更適合新手。
BLAST (Basic Local Alignment Search Tool):
https://blast.ncbi.nlm.nih.gov/Blast.cgi
BLAST是用local alignment方式比較蛋白質(zhì)或核酸序列的工具,有本地程序??梢杂糜诎l(fā)現(xiàn)序列的相似性、同源性與差異性。
SWISS-MODEL:
https://swissmodel.expasy.org/
SWISS-MODEL是一個在線自動的蛋白質(zhì)結(jié)構(gòu)同源建模網(wǎng)站。一句話介紹就是它用同源建模的方式預(yù)測蛋白質(zhì)的三維結(jié)構(gòu)。只需提供蛋白質(zhì)序列,比如在NCBI等數(shù)據(jù)庫里下載的FASTA,SWISS-MODEL將自動尋找模板,進(jìn)行序列-結(jié)構(gòu)比對,并構(gòu)建模型。尤其是在PDB找不到結(jié)構(gòu)的情況下,可以用來預(yù)測。但注意它的方法是同源建模。
以上是為初學(xué)者準(zhǔn)備的蛋白質(zhì)序列分析與結(jié)構(gòu)預(yù)測的新手包。由于面向新手,選擇的并非最新最熱門的工具,而是比較傳統(tǒng)基礎(chǔ)不易出錯的。很簡單,來試試吧(x)!

來源:實(shí)驗(yàn)老司機(jī)