細(xì)胞由細(xì)胞膜、細(xì)胞核、內(nèi)質(zhì)網(wǎng)等被稱為“亞細(xì)胞”的各部分組成,亞細(xì)胞的功能由位于其中的蛋白質(zhì)執(zhí)行。蛋白質(zhì)的亞細(xì)胞結(jié)構(gòu)被叫做蛋白質(zhì)的“亞細(xì)胞位置”。蛋白質(zhì)必須被運(yùn)送到適當(dāng)?shù)膩喖?xì)胞位置才能正常發(fā)揮功能,否則會(huì)產(chǎn)生機(jī)體功能紊亂和疾病,因而準(zhǔn)確的了解亞細(xì)胞定位信息對(duì)于深入了解蛋白質(zhì)的功能、細(xì)胞生命活動(dòng)等具有重要意義。同時(shí),蛋白質(zhì)數(shù)據(jù)本身的海量、多模態(tài)、關(guān)聯(lián)性、不完整等特征,使蛋白質(zhì)亞細(xì)胞定位問(wèn)題成為生物信息學(xué)領(lǐng)域具有挑戰(zhàn)性的研究熱點(diǎn)。蛋白質(zhì)亞細(xì)胞定位問(wèn)題一般分為三個(gè)步驟,分別為特征提取、分類預(yù)測(cè)和算法評(píng)估。特征提取是最關(guān)鍵的一步。通過(guò)對(duì)蛋白質(zhì)序列進(jìn)行分析,提取主要特征,建立特征向量;分類預(yù)測(cè)是將特征提取的特征作為分類算法的輸入送到不同的分類器中;算法評(píng)估是評(píng)估分類結(jié)果,判定特征提取方法和分類算法的優(yōu)劣。本文圍繞蛋白質(zhì)亞細(xì)胞定位問(wèn)題,主要進(jìn)行特征提取方法和分類算法兩個(gè)方面的研究。論文工作如下:(1)針對(duì)傳統(tǒng)特征提取方法上的不足,本文提出三種新的基于重復(fù)信息測(cè)定的特征提取方法,分別為R-Dipeptide、I-PseAAC、PseAAC2。其中,R-Dipeptide通過(guò)窗口移動(dòng)測(cè)定關(guān)鍵信息,并通過(guò)...
【文章頁(yè)數(shù)】:71 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:

圖1.1細(xì)胞結(jié)構(gòu)
第一章緒論研究背景及意義胞是由溶酶體、內(nèi)質(zhì)網(wǎng)、核糖體等諸多“亞細(xì)胞結(jié)構(gòu)”構(gòu)成的生命體的基如圖1.1所示。有機(jī)體絕大多數(shù)生命活動(dòng),如生長(zhǎng)、發(fā)育、生殖、遺傳、代細(xì)胞及亞細(xì)胞水平,都由蛋白質(zhì)作為主要承擔(dān)者來(lái)完成。蛋白質(zhì)是所有細(xì)成分,參與DNA的轉(zhuǎn)錄翻譯過(guò)程、細(xì)胞的信號(hào)傳導(dǎo)過(guò)....

圖2.2系統(tǒng)化生物信息學(xué)生物信息學(xué)主要包括以下幾方面的研究?jī)?nèi)容,如生物信息學(xué)數(shù)據(jù)庫(kù)的建立與使用、同源性序列的查找與對(duì)比分析、蛋白質(zhì)結(jié)構(gòu)方面的分析、非編碼區(qū)方面的分析、系統(tǒng)發(fā)

圖4.1支持向量機(jī)結(jié)構(gòu)圖
基于重復(fù)信息測(cè)定與卷積神經(jīng)網(wǎng)絡(luò)的蛋白質(zhì)亞細(xì)胞定位研究持向量機(jī)的存在是為了解決非線性可分問(wèn)題。當(dāng)樣本A與樣本B兩類樣分時(shí),則可以通過(guò)支持向量機(jī)算法將兩類樣本的特征向量映射到高維從而征向量的方式加以處理,若樣本A與樣本B兩類樣本在映射后的高維空間即支持向量機(jī)執(zhí)行的大體....

圖4.2神經(jīng)元結(jié)構(gòu)圖
圖4.2神經(jīng)元結(jié)構(gòu)圖P神經(jīng)網(wǎng)絡(luò)為各類神經(jīng)網(wǎng)絡(luò)算法的基礎(chǔ)且由于其具備可靠的理論依據(jù)與嚴(yán),因而被廣泛使用。不過(guò)BP神經(jīng)網(wǎng)絡(luò)雖被廣泛使用卻不免存在不足之處現(xiàn)很多改進(jìn)算法,如帶有動(dòng)量項(xiàng)的改進(jìn)BP、帶有自適應(yīng)學(xué)習(xí)率的改進(jìn)BP適應(yīng)率相結(jié)合的改進(jìn)BP、L-M學(xué)習(xí)規(guī)則等等分別針....
本文編號(hào):
3996140
本文鏈接:http://m.lk138.cn/kejilunwen/zidonghuakongzhilunwen/3996140.html