中文字幕一级黄色A级片|免费特级毛片。性欧美日本|偷拍亚洲欧美1级片|成人黄色中文小说网|A级片视频在线观看|老司机网址在线观看|免费一级无码激情黄所|欧美三级片区精品网站999|日韩av超碰日本青青草成人|一区二区亚洲AV婷婷

生命科學(xué)的數(shù)據(jù)分析Data Analysis for the Life Sciences電子書(shū)(466頁(yè))

  • 生命科學(xué)的數(shù)據(jù)分析Data Analysis for the Life Sciences電子書(shū)(466頁(yè))

    Rafael A Irizarry and Michael I Love

    R語(yǔ)言進(jìn)行生物科學(xué)的數(shù)據(jù)分析教程。

     

    介紹
    20世紀(jì)下半葉,數(shù)字技術(shù)史無(wú)前例的進(jìn)步引發(fā)了一場(chǎng)測(cè)量革命,正在改變科學(xué)。在生命科學(xué)領(lǐng)域,數(shù)據(jù)分析實(shí)際上已成為每個(gè)研究項(xiàng)目的一部分。尤其是基因組學(xué)正受到新的測(cè)量技術(shù)的推動(dòng),這些技術(shù)使我們能夠首次觀察某些分子實(shí)體。
    這些發(fā)現(xiàn)導(dǎo)致了類(lèi)似于鑒定微生物的發(fā)現(xiàn)和顯微鏡發(fā)明所允許的其他突破。這些技術(shù)的最佳選擇是微陣列和下一代測(cè)序。
    傳統(tǒng)上依賴簡(jiǎn)單數(shù)據(jù)分析技術(shù)的科學(xué)領(lǐng)域已被這些技術(shù)所取代。例如,過(guò)去,研究人員會(huì)測(cè)量單個(gè)目標(biāo)基因的轉(zhuǎn)錄水平。如今,可以一次測(cè)量所有20,000多種人類(lèi)基因。諸如此類(lèi)的進(jìn)步已經(jīng)導(dǎo)致了從假設(shè)到發(fā)現(xiàn)驅(qū)動(dòng)研究的轉(zhuǎn)變。但是,解釋從這些龐大而復(fù)雜的信息中提取的信息數(shù)據(jù)集需要復(fù)雜的統(tǒng)計(jì)技能,因?yàn)榕既怀霈F(xiàn)的模式很容易使人迷惑。這極大地提高了生命科學(xué)中統(tǒng)計(jì)和數(shù)據(jù)分析的重要性
     
    這本書(shū)的封面是什么?
    本書(shū)將涵蓋成功進(jìn)行數(shù)據(jù)驅(qū)動(dòng)的生命科學(xué)研究所需的幾種統(tǒng)計(jì)概念和數(shù)據(jù)分析技能。我們從與計(jì)算p值相關(guān)的相對(duì)基本的概念出發(fā)與分析高通量數(shù)據(jù)有關(guān)的高級(jí)主題。
    我們從統(tǒng)計(jì)學(xué)和生命科學(xué)中最重要的主題之一開(kāi)始:統(tǒng)計(jì)推斷。推論是利用概率從數(shù)據(jù)中學(xué)習(xí)人口特征。一個(gè)典型的例子是解密兩組(例如,案例與對(duì)照組)的平均值是否不同。
    涵蓋的特定主題包括t檢驗(yàn),置信區(qū)間,關(guān)聯(lián)檢驗(yàn),蒙特卡洛方法,置換檢驗(yàn)和統(tǒng)計(jì)功效。我們利用可能的近似值通過(guò)數(shù)學(xué)理論(例如,中心極限定理)以及現(xiàn)代計(jì)算機(jī)技術(shù)使之成為可能。我們將學(xué)習(xí)如何計(jì)算p值和置信區(qū)間以及如何進(jìn)行基本數(shù)據(jù)分析。在整本書(shū)中,我們將以統(tǒng)計(jì)計(jì)算機(jī)語(yǔ)言R描述可視化技術(shù),這些技術(shù)對(duì)于探索新數(shù)據(jù)集很有用。例如,我們將使用它們來(lái)學(xué)習(xí)何時(shí)應(yīng)用可靠的統(tǒng)計(jì)技術(shù)。
    然后,我們將繼續(xù)介紹線性模型和矩陣代數(shù)。我們將解釋為什么使用線性模型來(lái)分析組之間的差異是有益的,以及矩陣為何有用表示并實(shí)現(xiàn)線性模型。我們將繼續(xù)回顧矩陣代數(shù),包括矩陣符號(hào)以及如何將矩陣相乘(在紙上和在R中)。然后我們將應(yīng)用我們?cè)诰仃嚧鷶?shù)上介紹了線性模型。我們將學(xué)習(xí)如何在R中擬合線性模型,如何測(cè)試差異的顯著性以及如何估算差異的標(biāo)準(zhǔn)誤差。
    此外,我們將通過(guò)擬合線性模型復(fù)習(xí)一些實(shí)際問(wèn)題,包括共線性和混淆。最后,我們將學(xué)習(xí)如何擬合復(fù)雜的模型,包括交互項(xiàng),如何對(duì)比R中的多個(gè)項(xiàng)以及R中的函數(shù)實(shí)際上用于穩(wěn)定擬合線性模型的強(qiáng)大技術(shù):QR分解。
    在本書(shū)的第三部分中,我們涵蓋了與高維數(shù)據(jù)相關(guān)的主題。具體來(lái)說(shuō),我們描述了多種測(cè)試,錯(cuò)誤率控制程序,高通量的探索性數(shù)據(jù)分析數(shù)據(jù),p值校正和錯(cuò)誤發(fā)現(xiàn)率。從這里我們繼續(xù)進(jìn)行統(tǒng)計(jì)建模。特別是,我們將討論參數(shù)分布,包括二項(xiàng)式和伽馬分布。接下來(lái),我們將介紹最大似然估計(jì)。最后,我們將討論層次模型和經(jīng)驗(yàn)貝葉斯技術(shù)以及它們?nèi)绾卧诨蚪M學(xué)中應(yīng)用。
    然后,我們討論距離和尺寸縮減的概念。我們將介紹數(shù)學(xué)定義距離,并以此來(lái)激發(fā)奇異值分解(SVD)以進(jìn)行降維和多維縮放。一旦了解了這一點(diǎn),我們將準(zhǔn)備介紹分層聚類(lèi)和k均值聚類(lèi)。接下來(lái),我們將對(duì)機(jī)器學(xué)習(xí)進(jìn)行基本介紹。
    我們首先了解批處理效果以及如何使用成分和因子分析來(lái)應(yīng)對(duì)這一挑戰(zhàn)。特別是,我們將研究混淆,顯示批處理效果的示例,與因子分析建立聯(lián)系,并描述替代變量分析。
    這本書(shū)有何不同?
    統(tǒng)計(jì)教科書(shū)側(cè)重于數(shù)學(xué),而本書(shū)則側(cè)重于使用計(jì)算機(jī)進(jìn)行數(shù)據(jù)分析。本書(shū)采用Deborah Nolan和Terry Speed所著的StatLabs¹的方法。

  • 3459.82KB
  • 科研開(kāi)發(fā)
  • 2020-04-27
  • 藥品與生物制品;醫(yī)療器械;醫(yī)學(xué)檢驗(yàn);計(jì)量與測(cè)量

下載該資料的還下載

相關(guān)資料

相關(guān)評(píng)論

您的評(píng)論: 推薦

發(fā)表評(píng)論 可以輸入500