云天勵飛“算力積木”架構(gòu):引領(lǐng)邊緣AI芯片新變革徹底告別3999元!小米15入網(wǎng) 支持90W快充FF發(fā)布第二品牌Faraday X:對標(biāo)豐田 專注增程式混動車型黑神話悟空總收入超67億:銷量已超2000萬份通快成立激光業(yè)務(wù)區(qū)域中心(中國),強(qiáng)勢布局中國市場Sandalwood Advisors受邀參加第31屆中信里昂投資者論壇淘寶倒逼新風(fēng)向:一場電商減負(fù)運(yùn)動博浪AI時代,阿里、華為“硬碰硬”Youtube將推出人工智能工具 可生成創(chuàng)意、標(biāo)題甚至完整視頻申通、圓通、韻達(dá)發(fā)布 8 月簡報:快遞業(yè)務(wù)量、收入均同比增長,單票收入均下降蘋果iPhone 16系列開啟發(fā)售,Max最高加2500元TECNO 全球發(fā)布二代折疊屏旗艦—PHANTOM V Fold2 5G及PHANTOM V Flip2 5G科大訊飛還是AI“小甜甜”嗎?消息稱美團(tuán)外賣調(diào)整經(jīng)營目標(biāo),從追求 GMV 變?yōu)樽非笥唵瘟?/a>消息稱淘寶“大服飾全球包郵計劃”升級,品類“擴(kuò)容”至全行業(yè)Brightband獲1000萬美元融資,可用AI預(yù)測極端天氣菊樂股份再次申報IPO:四度闖關(guān)未果,超七成收入來自四川傳AI芯片設(shè)計公司Ampere尋求出售,或放棄IPO引領(lǐng)通用具身新時代:普渡發(fā)布首款類人形機(jī)器人PUDU D7辦公軟件的超級英雄?金山WPS AI會員人數(shù)破百萬,鴻蒙版全面開跑
  • 首頁 > 云計算頻道 > 云計算

    騰訊云,盯上了芯片設(shè)計賽道

    2023年01月13日 11:32:16   來源:數(shù)智前線

      除了芯片設(shè)計產(chǎn)業(yè),騰訊也將重點(diǎn)布局云渲染、生命科學(xué)等多個高性能計算賽道。

      隨著上云和用云的需求逐漸深化,云廠商在積極往行業(yè)滲透,打造最佳客戶實(shí)踐。

      不久前,騰訊云聯(lián)合速石科技為芯片設(shè)計企業(yè)燧原科技,打造了一個面向HPC(高性能計算)場景的行業(yè)解決方案。該方案基于騰訊和速石科技共建的一站式芯片設(shè)計研發(fā)云平臺,快速自動地調(diào)用騰訊云IaaS資源構(gòu)建仿真環(huán)境,滿足了燧原科技的業(yè)務(wù)彈性需求,提升了整體的項(xiàng)目研發(fā)效率。

      “它是一個可見的有巨大潛力的藍(lán)海”,騰訊云高性能計算行業(yè)高級經(jīng)理Kevin說,騰訊云會在這方面加大投入。據(jù)數(shù)智前線獲悉,除了芯片設(shè)計產(chǎn)業(yè),騰訊也將重點(diǎn)布局云渲染、生命科學(xué)等多個高性能計算賽道。

      01

      芯片設(shè)計產(chǎn)業(yè)上云正在成為趨勢

      燧原科技作為國內(nèi)領(lǐng)先的AI芯片設(shè)計企業(yè),當(dāng)初創(chuàng)造過僅用18個月就將技術(shù)門檻很高的AI訓(xùn)練芯片一次性流片成功的紀(jì)錄。

      但隨著工藝制程越來越先進(jìn),燧原也面臨著IT資源和效率無法滿足業(yè)務(wù)需要的矛盾。

      芯片的研發(fā)周期通常都比較緊張,尤其是大芯片,中后期經(jīng)常是按天來做任務(wù)排期。而行業(yè)內(nèi)普遍采用的是自建IDC(數(shù)據(jù)中心),Kevin告訴數(shù)智前線,這么做主要是當(dāng)時的芯片工藝沒那么先進(jìn),對算力的需求也沒那么大。

      而且,燧原科技IT負(fù)責(zé)人Vincent透露,芯片項(xiàng)目在前期會做大量論證和規(guī)劃,包括需要多少算力和存儲。但問題在于,在項(xiàng)目推進(jìn)過程中經(jīng)常會有變更,包括制程的改進(jìn)、功能變化及性能指標(biāo)調(diào)整。這種變更會造成大量突發(fā)的算力需求。如果要通過采買服務(wù)器或者是租借服務(wù)器的方式來滿足需求,從部署、上線測試,需要相當(dāng)長的一段時間業(yè)務(wù)團(tuán)隊(duì)才能用上這些算力,影響研發(fā)進(jìn)度。

      這樣的效率顯然是無法接受的。尤其是這幾年的疫情導(dǎo)致采買硬件的周期不可控,但芯片項(xiàng)目周期是明確的,這就意味著,芯片設(shè)計企業(yè)要面臨一個不確定的IT資產(chǎn)的風(fēng)險。比如一天之內(nèi)要準(zhǔn)備一兩百臺服務(wù)器,只有上云才能夠做到,如果是原有的IT流程,從確認(rèn)服務(wù)器型號到采購,從安裝服務(wù)器上機(jī)柜到機(jī)房運(yùn)維,最快要8到12周,而且IT資金占用成本太高。

      “這是我們上云的一個契機(jī)吧。”Vincent提到。

      大芯片設(shè)計周期超過12個月,包括產(chǎn)品定義、前端設(shè)計、IP驗(yàn)證、SOC驗(yàn)證、綜合、布局布線等多個階段,不同階段對算力的需求不相同。驗(yàn)證環(huán)節(jié)是算力使用的高峰期。所以,燧原也選擇將部分仿真驗(yàn)證搬到云上,“前端IP驗(yàn)證的過程基本都上云了,后續(xù)我們肯定是希望把整個彈性的部分盡量都上云。”燧原科技項(xiàng)目負(fù)責(zé)人Eli說。

      燧原有大量彈性作業(yè)的需求,比如需要在同一個時間配置數(shù)百臺的服務(wù)器,對穩(wěn)定性和實(shí)時響應(yīng)的要求非常高。目前,騰訊云聯(lián)合速石可以做到讓客戶在1小時內(nèi)快速把仿真作業(yè)跑起來,讓客戶在有限時間更頻繁地去跑仿真和驗(yàn)證任務(wù),提高流片前的成功率。同時基于速石對業(yè)務(wù)場景優(yōu)化和CAD方面的能力,幫助燧原整體Job運(yùn)行時間降低了50%,加快了整個項(xiàng)目的研發(fā)進(jìn)度。

      而且,芯片設(shè)計行業(yè)如今已經(jīng)進(jìn)入到7nm甚至3nm時代,一顆芯片上會有幾百億級的晶體管,它對算力的需求會大大增加。這就意味著,芯片企業(yè)在高峰期的算力需求非常明顯,燧原等芯片設(shè)計企業(yè)開始向云廠商尋求彈性的算力解決方案。

      “上云是一個行業(yè)趨勢。”Vincent說,“都在嘗試,但全部都上云還需要一些時間。”

      02

      安全、效率和成本的鐵三角

      芯片設(shè)計企業(yè)最核心的是各種芯片代碼和知識產(chǎn)權(quán),相比于很多行業(yè),這個賽道對數(shù)據(jù)安全有著更高的要求。

      燧原科技在上云的態(tài)度是,所有的數(shù)據(jù)要放在本地,只有彈性的部分在云上,中間不做數(shù)據(jù)存儲。所以,騰訊云和速石在燧原的建議和啟發(fā)下,大家探索出了“存算分離”的混合云計算架構(gòu),并且花了五六個月時間去驗(yàn)證。

      它能夠在保障核心數(shù)據(jù)、代碼存儲在本地的前提下,通過速石的調(diào)度平臺與本地計算集群打通,使得計算任務(wù)能夠靈活選取本地或云端算力隊(duì)列。

      速石科技技術(shù)總監(jiān)陳琳濤透露,此次采用的存算分離方案本質(zhì)上是一個混合云方案,在燧原的項(xiàng)目中,該方案面臨進(jìn)一步的技術(shù)挑戰(zhàn),例如在整個混合云建設(shè)架構(gòu)上,對網(wǎng)絡(luò)的時延、帶寬的吞吐率和效率的要求都非常高,這就要求三方共同在這個項(xiàng)目里尋求最優(yōu)的架構(gòu)布置方式。

      Vincent坦言,因?yàn)樽隽舜嫠惴蛛x的架構(gòu),數(shù)據(jù)在本地,所以企業(yè)對安全的擔(dān)憂會有降低。

      以前的存算分離,是在同一自治域內(nèi),比如都在騰訊云上實(shí)現(xiàn)。但現(xiàn)在燧原的方案是在兩個自治域內(nèi),混合云部署,這增加了物理距離,而且各種接口的調(diào)度變得更加復(fù)雜,更加考驗(yàn)云廠商和合作伙伴的能力。而速石平臺不改變用戶的使用習(xí)慣,讓使用者無感地調(diào)用云資源,對資源的調(diào)用更加便捷,減少上云的學(xué)習(xí)成本。

      這也是云廠商在深入行業(yè)時經(jīng)常遇到的難題。騰訊云和速石之前考慮的是直接把客戶的數(shù)據(jù)上云,方便高效。但溝通之后發(fā)現(xiàn),芯片客戶對數(shù)據(jù)安全的要求,還是采用混合云存算分離的架構(gòu)最為合適。騰訊云目前僅做算力的支撐,速石平臺提供自動化高效的環(huán)境構(gòu)建,燧原的知識代碼等企業(yè)核心數(shù)據(jù)都是放在線下。不過,在Kevin看來,有些不敏感的數(shù)據(jù)理論上可以上云,通過緩存技術(shù)來提高仿真效率。

      Kevin告訴數(shù)智前線,早期初創(chuàng)企業(yè),存量數(shù)據(jù)和存量資產(chǎn)少,對安全沒那么大顧慮,使用全云方案是首選,但規(guī)模大了之后,很多企業(yè)則傾向采用混合云架構(gòu)。

      而且,很多芯片設(shè)計企業(yè)以前就有很多IDC資產(chǎn),如何把原有的資源利用起來,也是企業(yè)的訴求,可以比較好的平衡既有資產(chǎn)的投資投入,同時又兼顧云的彈性、靈活、快捷、便捷。“所以從這個角度上來說,混合云是目前來看一個比較好的選擇。”

      像燧原并沒有將全部業(yè)務(wù)搬到云上,其中一部分依然用到了本地的算力,比如項(xiàng)目前期運(yùn)行還是更適合本地已有的算力。事實(shí)上,很多芯片設(shè)計企業(yè)還是以本地為主,云上做彈性的部分。

      混合云的部署方式,對IT成本的節(jié)約也在逐漸成為共識。

      燧原算過一筆賬,如果自己采買服務(wù)器、自建機(jī)房,按照三五年的周期財務(wù)進(jìn)行對比,每個月均攤的成本會比每個月上云均攤的成本更低。但如果從節(jié)省時間和人力、提升效率以及整體的綜合成本考慮,上云的優(yōu)勢還是非常明顯。因?yàn)樵撇恍枰,也不需要自己運(yùn)維,這部分都是省下來的,而且快速部署和彈性擴(kuò)容的能力,能讓昂貴的研發(fā)人員提高效率,縮短研發(fā)周期。

      除了采用存算分離的架構(gòu),騰訊云聯(lián)合速石也為燧原等芯片設(shè)計客戶打造了從終端到云端的完整安全方案:在終端,騰訊云的零信任安全的iOA方案,可以保障燧原全國各地的研發(fā)人員,能無縫體驗(yàn)一致的仿真環(huán)境,同時確保終端安全、信息保護(hù)以及一些漏洞的保護(hù)。

      在云端,使用了騰訊的主機(jī)安全,保障整個計算環(huán)境是安全授信的,通過這個部分確保整個計算過程不會有入侵、數(shù)據(jù)泄露、勒索病毒等等的問題。甚至是傳輸層面,騰訊云與燧原之間有一條超大帶寬的網(wǎng)絡(luò)保障,確保了整個傳輸?shù)耐ǖ腊踩尚拧?/p>

      不難發(fā)現(xiàn),通過存算分離的架構(gòu)和混合云的部署方案,既滿足了對彈性算力和效率的需要,又能滿足節(jié)約成本和數(shù)據(jù)安全的需要。而這些都是企業(yè)在上云和用云過程中最在意的東西,也是云廠商需要重視和解決的方面。

      目前,“存算分離”的混合云架構(gòu)已經(jīng)幫助燧原節(jié)省了可觀的IT投入,任務(wù)并發(fā)量可以通過云端彈性同步提高,同時部分仿真周期縮短30%-50%。

      當(dāng)然,Eli也提到,現(xiàn)階段使用這一套三方共創(chuàng)的存算分離方案滿足了部分業(yè)務(wù)在彈性算力使用量上的需求去做的各種定義。而下一步我們還要進(jìn)一步優(yōu)化,提升使用效率,“如何更高效的利用云上機(jī)器,如何契合業(yè)務(wù)使用進(jìn)行高效優(yōu)化,并遷移更多的業(yè)務(wù),這個是我們接下來要做的事情。”

      不難發(fā)現(xiàn),通過存算分離的架構(gòu)和混合云的部署方案,既滿足了對彈性算力和效率的需要,又能滿足節(jié)約成本和數(shù)據(jù)安全的需要。

      未來,GPU加速芯片仿真及提供智能芯片設(shè)計優(yōu)化是行業(yè)的新方向,騰訊云也將與國內(nèi)外EDA軟件合作共建加速仿真生態(tài),為芯片仿真作業(yè)帶來數(shù)倍的加速并提供AI智能PPA優(yōu)化能力。同時騰訊云也在嘗試探討云端開發(fā),把芯片設(shè)計前流程部署云上,基于全云構(gòu)建芯片設(shè)計流程,進(jìn)一步提升大芯片研發(fā)設(shè)計效率。在高并發(fā)場景下,騰訊云通過遨馳云原生操作系統(tǒng)的海量大規(guī)模調(diào)度能力,及豐富多元的裸金屬實(shí)例、 GPU 實(shí)例,在芯片的仿真驗(yàn)證和性能對比測試環(huán)節(jié),可一站式完成多代次,多卡型的驗(yàn)證工作,節(jié)省自建購買費(fèi)用,極大提升部署效率和測試效率。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。

    即時

    TCL實(shí)業(yè)榮獲IFA2024多項(xiàng)大獎,展示全球科技創(chuàng)新力量

    近日,德國柏林國際電子消費(fèi)品展覽會(IFA2024)隆重舉辦。憑借在核心技術(shù)、產(chǎn)品設(shè)計及應(yīng)用方面的創(chuàng)新變革,全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)成功斬獲兩項(xiàng)“IFA全球產(chǎn)品設(shè)計創(chuàng)新大獎”金獎,有力證明了其在全球市場的強(qiáng)大影響力。

    新聞

    敢闖技術(shù)無人區(qū) TCL實(shí)業(yè)斬獲多項(xiàng)AWE 2024艾普蘭獎

    近日,中國家電及消費(fèi)電子博覽會(AWE 2024)隆重開幕。全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)攜多款創(chuàng)新技術(shù)和新品亮相,以敢為精神勇闖技術(shù)無人區(qū),斬獲四項(xiàng)AWE 2024艾普蘭大獎。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。

    研究

    2024全球開發(fā)者先鋒大會即將開幕

    由世界人工智能大會組委會、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會共同指導(dǎo),由上海市人工智能行業(yè)協(xié)會聯(lián)合上海人工智能實(shí)驗(yàn)室、上海臨港經(jīng)濟(jì)發(fā)展(集團(tuán))有限公司、開放原子開源基金會主辦的“2024全球開發(fā)者先鋒大會”,將于2024年3月23日至24日舉辦。