您當(dāng)前的位置:檢測資訊 > 行業(yè)研究
嘉峪檢測網(wǎng) 2025-05-12 20:25
突破在當(dāng)今數(shù)字化時代,AI技術(shù)的快速發(fā)展對芯片的算力和能效提出了前所未有的要求。Ascend 910C作為國產(chǎn)AI芯片的代表之一,其技術(shù)突破和市場表現(xiàn)備受關(guān)注。本文將結(jié)合摩根士丹利(Morgan Stanley)的最新研報(bào)以及其他相關(guān)機(jī)構(gòu)的研究,深入解析華為昇騰910C的技術(shù)特點(diǎn)、市場前景以及投資機(jī)會。
據(jù) DeepSeek 的研究人員稱,在推理方面,它能達(dá)到英偉達(dá) H100 性能的 60%。雖然昇騰 910C 并非性能冠軍,但它能夠成功減少中國對英偉達(dá) GPU 的依賴。‘
根據(jù)Lennart Heim的分析,Ascend 910C在FP16精度下的算力約為800 TFLOPS,內(nèi)存帶寬約為3.2 TB/s,性能大約達(dá)到英偉達(dá)H100的80%。盡管存在差距,但Ascend 910C在成本和能效比方面具有顯著優(yōu)勢,單卡成本約為1800美元,僅為H100的1/5。
910C 處理器的推理性能超出預(yù)期。此外,通過對 CANN 內(nèi)核進(jìn)行手動優(yōu)化,其效率還能進(jìn)一步提高。DeepSeek's 對Ascend的原生支持及其 PyTorch 代碼庫,使得從 CUDA 到 CANN 的轉(zhuǎn)換能夠輕松無縫進(jìn)行,從而更易于將華為的硬件集成到人工智能工作流程中。

一, 910C 架構(gòu)和 升級突破
(一)簡介
Ascend 910C芯片 double 910B FP16 600TFLOPS采用了華為自研的達(dá)芬奇架構(gòu),具有強(qiáng)大的計(jì)算能力和能效比,能夠支持多種深度學(xué)習(xí)框架和算法,廣泛應(yīng)用于Cloud computing, edge computing和Aiot等領(lǐng)域。這款芯片的主要特點(diǎn)包括高性能、高能效比、多種應(yīng)用場景和開放性

Ascend910C并非AI training的最佳選擇。該領(lǐng)域,Nvdia仍保持著無可爭議的領(lǐng)先地位。
Ascend 910C 選擇了相對成熟的技術(shù):將兩顆獨(dú)立的 Ascend 910B 芯片分別放置在各自的Interposer,再通過有機(jī)基板將兩個Interposer連接起來。這種封裝方式雖然在芯片間互聯(lián)帶寬上可能低于 NVIDIA 的先進(jìn)封裝方案,但具有更低的成本、更高的良率以及更快的量產(chǎn)速度。
通過這種Dual-core interconnect架構(gòu),Ascend 910C 的運(yùn)算能力和存儲器容量達(dá)到了 Ascend 910B 的兩倍,同時增強(qiáng)了對各類 AI 工作負(fù)載數(shù)據(jù)的支持能力

下圖是封裝示意圖 (非官方)

(二)子模塊910B分析


Ascend 910B
是Ascend 910的升級版本,采用中芯國際的N+1工藝(等效7nm)
芯片尺寸為21.32 mm × 31.22 mm,面積665.61 mm²
• FP16算力:約320 TFLOPS。
• INT8算力:約640 TOPS。
• 顯存:64GB HBM2e。
• 顯存帶寬:400 GB/s。
• 功耗:310W。
在架構(gòu)和性能上進(jìn)行了優(yōu)化,以適應(yīng)更復(fù)雜的AI計(jì)算任
其Virtuvian芯片包含25個“新達(dá)芬奇”AI核心,可能是對原有達(dá)芬奇核心的改進(jìn),以適應(yīng)新的工藝和性能需求
• CANN生態(tài):華為通過CANN(Compute Architecture for Neural Networks)軟件棧和MindSpore框架支持910C,兼容TensorFlow和PyTorch,提升開發(fā)者友好性。
安裝CANN工具包(以5.1.RC2版本為例)
wget https://ascend-repo.obs.cn-east-2.myhuaweicloud.com/CANN/5.1.RC2/Ascend-cann-toolkit_5.1.RC2_linux-aarch64.run
chmod +x Ascend-cann-toolkit_5.1.RC2_linux-aarch64.run
./Ascend-cann-toolkit_5.1.RC2_linux-aarch64.run --install

達(dá)芬奇架構(gòu)(Da Vinci Core)

二、Ascend 910C:技術(shù)突破與戰(zhàn)略意義
(一)技術(shù)突破
Ascend 910C是首款基于SMIC N+2(7nm), 包含530億個晶體管. 的AI訓(xùn)練芯片。通過Chiplet package,和上一代類似,Ascend 910C將多個小芯片拼接成一個大芯片,實(shí)現(xiàn)了算力的顯著提升。其核心參數(shù)如下:
• 算力:在FP16精度下,單卡算力達(dá)到781.25TFLOPS,綜合性能對標(biāo)
英偉達(dá)H100的60%-95%。
• 能效比:功耗為310W,通過系統(tǒng)級優(yōu)化(如CloudMatrix384超節(jié)點(diǎn))實(shí)現(xiàn)萬卡集群線性度>95%,MFU達(dá)到55%。
• 成本優(yōu)勢:單卡成本約為1800美元,僅為H100的1/5,售價(jià)約2萬元人民幣,推動企業(yè)AI部署成本降至傳統(tǒng)方案的20%。世界前10AI部署至今沒有國內(nèi)芯片算力卡

(二)戰(zhàn)略意義
Ascend910C的推出不僅標(biāo)志著國產(chǎn)AI芯片在技術(shù)上的重大突破,還在戰(zhàn)略上具有深遠(yuǎn)意義:
• 打破封鎖:Ascend910C打破了對華AI芯片的技術(shù)封鎖,成為H20特供版的替代首選。
• 支撐“東數(shù)西算”工程:Ascend910C為國產(chǎn)算力的自主可控提供了核心支持,助力“東數(shù)西算”工程的順利推進(jìn)。
• 推動AI普惠化:通過大幅降低訓(xùn)練成本,Ascend910C推動了AI技術(shù)的普惠化,使更多企業(yè)能夠負(fù)擔(dān)得起高性能AI計(jì)算。
三、核心利好:量產(chǎn)加速、生態(tài)完善與政策紅利
(一)量產(chǎn)與訂單速發(fā)
Ascend910C的量產(chǎn)計(jì)劃已經(jīng)明確:
• 產(chǎn)能規(guī)劃:2025年Q2開始量產(chǎn),首批出貨量達(dá)到7萬顆,全年目標(biāo)出貨量為80萬顆。2026年將推出支持FP8的910D版本
• 客戶驗(yàn)證:阿里、騰訊、百度等頭部企業(yè)已完成測試,比亞迪、深圳龍崗區(qū)已落地AI質(zhì)檢與城市中樞項(xiàng)目。還中標(biāo)了深圳政務(wù)AI系統(tǒng)32億元訂單,進(jìn)一步鞏固了其在市場中的地位。
(二)技術(shù)迭代與生態(tài)協(xié)同
Ascend910C在軟件和生態(tài)方面也取得了顯著進(jìn)展:
• 軟件適配:AscendMindSpore 2.6支持類DeepSeek V3/R1 Moe架構(gòu)模型,系統(tǒng)吞吐率提升2.8倍。
• 產(chǎn)業(yè)鏈合作:與80家伙伴聯(lián)合開發(fā)大模型一體機(jī),適配160+第三方模型,覆蓋金融、智能制造等場景。

(三)政策與成本驅(qū)動
在政策和成本方面,Ascend910C也具有顯著優(yōu)勢:
• 國產(chǎn)替代:在美制裁下,Ascend910C成為國內(nèi)智算中心的核心算力底座,訂單量突破7萬片(價(jià)值20億美元)。
• 成本優(yōu)勢:訓(xùn)練成本僅為行業(yè)巨頭的3%-5%,推動AI普惠化。
四、產(chǎn)業(yè)鏈核心供方:從芯片制造到場景落地
(一)上游:芯片制造與封裝
• SMIC(688981):Ascend910C的代工方,N+2工藝良率提升至50%,2025年相關(guān)收入或超50億元。
(二)中游:核心零部件
• 華豐科技(688629):高速背板連接器市占率70%,單臺Ascend服務(wù)器需8-12個連接器,2025年?duì)I收增量或達(dá)24億元。
• 泰嘉股份(002843):Ascend服務(wù)器電源獨(dú)家代工,單卡電源價(jià)值量超5000元,出口美國業(yè)務(wù)占比不足2%,關(guān)稅影響有限。
(三)下游:服務(wù)器與行業(yè)應(yīng)用
• 拓維信息(002261):推出Atlas800服務(wù)器,參與多地智算中心建設(shè),2025年訂單預(yù)計(jì)翻倍。
• 神州數(shù)碼(000034):Ascend服務(wù)器代工龍頭,2024年市占率超30%,中標(biāo)深圳政務(wù)AI系統(tǒng)32億元訂單。
(四)配套技術(shù):液冷與散熱
• 申菱環(huán)境(301018):Ascend液冷一供,單千瓦解決方案價(jià)值4000元,2025年市場規(guī)?;虺賰|。
• 網(wǎng)宿科技(300017):浸沒式液冷方案進(jìn)入商用階段,PUE均值低至1.049,技術(shù)溢價(jià)空間顯著。
五、風(fēng)險(xiǎn)與挑戰(zhàn)
盡管Ascend910C在技術(shù)、市場和政策方面都取得了顯著進(jìn)展,但仍面臨一些挑戰(zhàn):
• 技術(shù)瓶頸:7nm能效比落后于英偉達(dá)4nm產(chǎn)品,HBM內(nèi)存與先進(jìn)封裝仍依賴海外技術(shù)。
• 產(chǎn)能壓力:SMIC擴(kuò)產(chǎn)進(jìn)度及封裝廠商產(chǎn)能能力制約出貨量。

• 生態(tài)短板:CUDA生態(tài)成熟度遠(yuǎn)超Ascend,開發(fā)者遷移需長期投入。正如英偉達(dá)CEO黃仁勛所言:“大多數(shù)的AI新創(chuàng)都奠基于英偉達(dá)的CUDA平臺,英偉達(dá)的策略就是讓平臺衍生出龐大的軟件生態(tài),讓后者難以突破。
五、市場表現(xiàn)與未來展望
(一)市場表現(xiàn)
根據(jù)摩根士丹利的最新研報(bào),中國在GPU領(lǐng)域的自給率正在快速提升。2024年中國人工智能GPU的自給率為34%,預(yù)計(jì)到2027年將提升至82%。這一增長主要得益于Ascend系列和寒武紀(jì)等本土供應(yīng)商的努力。華為Ascend910C作為其中的代表,其性能和市場表現(xiàn)尤為突出。
(二)未來展望
摩根士丹利預(yù)測,到2027年,中國云人工智能市場規(guī)模將達(dá)到480億美元,占全球總量的20%。Ascend910C及其后續(xù)產(chǎn)品將在這一市場中扮演重要角色。此外,SMIC的產(chǎn)能擴(kuò)張和良率提升也將為Ascend910C的量產(chǎn)提供有力支持。

(三)量化數(shù)據(jù)

• 自給率:2024年34%,2027年預(yù)計(jì)提升至82%。小米利用自己出色的整合能力把暴力都會做成白菜價(jià),
• 市場規(guī)模:2027年全球云人工智能市場規(guī)模預(yù)計(jì)達(dá)到2390億美元,中國占20%。
• 產(chǎn)能:SMIC預(yù)計(jì)為Ascend910C分配2.6萬片晶圓/月的產(chǎn)能,假設(shè)良率為30%-50%。
六、供應(yīng)鏈
從短期來看,Ascend910C的量產(chǎn)與訂單放量將直接拉動上游硬件(連接器、電源)的需求。中長期來看,需要關(guān)注軟件生態(tài)突破與國產(chǎn)替代政策的落地。建議關(guān)注以下核心標(biāo)的:
• 華豐科技:高速背板連接器市場領(lǐng)導(dǎo)者,受益于Ascend服務(wù)器的快速出貨。
• 泰嘉股份:Ascend服務(wù)器電源獨(dú)家代工,市場地位穩(wěn)固。
• SMIC:作為Ascend910C的代工方,受益于工藝良率提升和訂單增長。
• 申菱環(huán)境:液冷技術(shù)領(lǐng)先,為Ascend910C的提供散熱需求。
同時,建議投資者關(guān)注液冷、封裝等配套環(huán)節(jié)的技術(shù)迭代,這些領(lǐng)域也將迎來新的發(fā)展機(jī)遇。
七、總結(jié)
Ascend910C作為國產(chǎn)AI芯片的代表,不僅在技術(shù)上取得了重大突破,還在市場和政策方面展現(xiàn)了強(qiáng)大的競爭力。盡管面臨技術(shù)瓶頸和生態(tài)短板等挑戰(zhàn),但隨著技術(shù)的不斷進(jìn)步和政策的支持,Ascend910C有望在AI芯片市場中占據(jù)重要地位。對于投資者來說,Ascend910C及其產(chǎn)業(yè)鏈的核心標(biāo)的提供了豐富的投資機(jī)會,值得長期關(guān)注。

來源:芯芯有我