人工智能計算初創(chuàng)公司Cerebras Systems Inc.正式推出其號稱"世界上最快的人工智能推理服務(wù)",這一舉措無疑是對行業(yè)巨頭Nvidia Corp.的直接挑戰(zhàn)。Cerebras首席執(zhí)行官安德魯·費爾德曼表示,新服務(wù)旨在以更快的速度和更低的成本完成AI推理任務(wù),回應(yīng)了市場對高效推理解決方案日益增長的需求。
Cerebras的"高速推理"服務(wù)建立在其強大的WSE-3處理器之上。這款處理器擁有超過900,000個計算核心和44GB板載內(nèi)存,其核心數(shù)量是單個Nvidia ***圖形處理單元的52倍。Cerebras聲稱,其推理服務(wù)速度可達每秒1,000個令牌,比使用Nvidia最強大GPU的同類云服務(wù)快20倍。更引人注目的是,該服務(wù)的起價僅為每百萬個代幣10美分,據(jù)稱比現(xiàn)有AI推理工作負載的性價比高100倍。
Cerebras推理服務(wù)提供三個訪問層級,包括免費服務(wù)、開發(fā)者層和企業(yè)級。開發(fā)者層通過API端點訪問,為Llama3.18B模型提供每百萬代幣10美分的價格,而Llama3.170B模型則為60美分。企業(yè)級則提供更多定制選項和專門支持,適合持續(xù)性工作負載。
多家知名機構(gòu)已成為Cerebras的早期客戶,包括葛蘭素史克公司、Perplexity AI Inc.和Meter Inc.等。DeepLearning AI Inc.的創(chuàng)始人Andrew Ng博士對Cerebras的快速推理能力給予高度評價,認為其對于需要反復(fù)提示大語言模型的代理AI工作流程特別有幫助。
除了推理服務(wù),Cerebras還宣布了多項戰(zhàn)略合作伙伴關(guān)系,旨在為客戶提供全方位的AI開發(fā)工具。合作伙伴包括LangChain、LlamaIndex、Docker Inc.、Weights & Biases Inc.和AgentOps Inc.等。此外,Cerebras的推理API與OpenAI的聊天完成API完全兼容,這意味著現(xiàn)有應(yīng)用程序可以輕松遷移到其平臺。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。
京東11.11采銷直播探廠為消費者揭開答案。近日,京東3C數(shù)碼采銷走進武漢攀升工廠、合肥聯(lián)想工廠和科大訊飛展廳,通過直播帶貨廠商爆款產(chǎn)品,并為消費者帶來超值低價與福利。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標識解析專題論壇在沈陽成功舉辦。