近日,由云天勵飛首席科學(xué)家王孝宇博士等多位國際AI科學(xué)家共同發(fā)起的AI基礎(chǔ)軟件平臺YMIR正式發(fā)布。
什么是 YMIR?
YMIR(挖米匠),是一個數(shù)據(jù)驅(qū)動的開源算法訓(xùn)練平臺,能夠做到以無代碼開發(fā)的方式,實現(xiàn)數(shù)據(jù)管理、數(shù)據(jù)挖掘、模型訓(xùn)練、模型驗證等功能。YMIR遵從Apache 2.0 許可協(xié)議,商用及個人使用均免費。
YMIR是由國際AI科學(xué)家共同發(fā)起的AI基礎(chǔ)軟件平臺。發(fā)起成員包括:前Snap計算機視覺主席,云天勵飛首席科學(xué)家王孝宇;美國硅谷NEC 實驗室媒體分析部主管、UCSD教授,印裔科學(xué)家Manmohan Chandraker;前谷歌、亞馬遜、Snap機器學(xué)習(xí)研究員,硅谷初創(chuàng)公司Heali聯(lián)合創(chuàng)始人、首席AI官,法裔科學(xué)家William Brendel等。
云天勵飛首席科學(xué)家 王孝宇
美國硅谷NEC 實驗室媒體分析部主管、UCSD教授 Manmohan Chandraker
前谷歌、亞馬遜、Snap機器學(xué)習(xí)研究員,硅谷初創(chuàng)公司Heali聯(lián)合創(chuàng)始人、首席AI官 William Brendel
YMIR 的五大特點?
YMIR是一個高度自動化的AI模型開發(fā)產(chǎn)品。其將模型開發(fā)行為抽象為數(shù)據(jù)收集、模型訓(xùn)練、數(shù)據(jù)挖掘、數(shù)據(jù)標(biāo)注等基本操作,并形成標(biāo)準(zhǔn)流程,提供一站式服務(wù)。實際使用時以圖形化的交互界面完成數(shù)據(jù)與模型不斷更新迭代的完整流程。由此,YMIR極大降低了AI模型研發(fā)的技能要求,不再要求從業(yè)者具備專業(yè)的AI技能。只要對系統(tǒng)操作員加以數(shù)據(jù)集、模型訓(xùn)練、模型迭代等概念知識的少量培訓(xùn),其便具備模型開發(fā)的能力,因而對人工智能向各行各業(yè)的普及具備重大意義。
針對具備一定專業(yè)能力的算法開發(fā)人員,YMIR平臺提供開放API,使用者可籍此將自己開發(fā)的模型訓(xùn)練、數(shù)據(jù)挖掘、數(shù)據(jù)標(biāo)注、模型診斷等工具對接YMIR開放接口實現(xiàn)端到端的一站式模型開發(fā)。
YMIR 主要以數(shù)據(jù)為中心,集成了數(shù)據(jù)和模型版本控制,同時引入工作空間等概念,實現(xiàn)多個模型開發(fā)任務(wù)的并行快速迭代,為模型的大規(guī)模批量生產(chǎn)提供平臺性支持。
YMIRV1.0新增模型生產(chǎn)項目管理
1、傻瓜式迭代操作流程(保姆式模型開發(fā)流程指引)
YMIR 新版本與上一版本相比,引入項目管理式的工作流程,使AI模型的生產(chǎn)進(jìn)一步標(biāo)準(zhǔn)化。與老版本相比,模型生產(chǎn)操作員上手時間大幅縮短,并通過標(biāo)準(zhǔn)化的生產(chǎn)方式實現(xiàn)AI模型品控。
在以項目管理為理念的研發(fā)制式下,模型研發(fā)項目被切分為幾個關(guān)鍵模塊。每個模塊對應(yīng)一個任務(wù),這些任務(wù)具備前后依賴關(guān)系形成研發(fā)流程。只有流程前方任務(wù)完成后,流程后方任務(wù)才能被啟動。如下圖所示,當(dāng)一個模型研發(fā)項目被創(chuàng)建后,即能看到頁面上方的任務(wù)迭代流程指引,清晰說明當(dāng)前步驟與下一步驟,僅需按照指引點擊鼠標(biāo)操作即可,操作對小白用戶十分友好、非常銀杏化。
賬號登錄后即可見項目創(chuàng)建頁面
項目創(chuàng)建成功后的頁面
項目創(chuàng)建后的任務(wù)流程指引頁面
2、數(shù)據(jù)集自動整理
在AI模型開發(fā)的周期里,模型迭代占據(jù)90%以上的時間。而數(shù)據(jù)的迭代是模型迭代的關(guān)鍵部分,數(shù)據(jù)也是AI研發(fā)過程中最為重要的資產(chǎn),因此數(shù)據(jù)更新的追蹤和管理顯得尤為重要。能重現(xiàn)數(shù)據(jù)的更新過程,便能重復(fù)模型生產(chǎn)過程。
YMIR新增數(shù)據(jù)集版本管理功能,能自動生成數(shù)據(jù)集版本并記錄每次對數(shù)據(jù)集的操作。一方面,與上一版本相比,使用者無需通過手動命名數(shù)據(jù)集對不同功能數(shù)據(jù)集進(jìn)行區(qū)分,系統(tǒng)會自動進(jìn)行數(shù)據(jù)整理,歸入訓(xùn)練集、挖掘集、測試集等,并對這些數(shù)據(jù)集的更新進(jìn)行版本控制。數(shù)據(jù)集和模型的一一對應(yīng)關(guān)系亦被記錄下來。此功能對有大量數(shù)據(jù)挖掘的模型研發(fā)十分友好,減少數(shù)據(jù)集版本的冗余,提高數(shù)據(jù)集管理效率。YMIR用戶再也不用對著上百個雷同的數(shù)據(jù)集無從下手。另一方面,模型的研發(fā)過程被完整的記錄下來,可輕易重新生產(chǎn)模型。傳統(tǒng)的算法研發(fā)人員工作交接涉及,數(shù)據(jù)集、模型、訓(xùn)練流程等多個復(fù)雜環(huán)節(jié)的交接,很難重復(fù)之前的工作。而在YMIR平臺上產(chǎn)生的研發(fā)過程,尤其是數(shù)據(jù)集的迭代均有完整追蹤,基本不需要交接流程,企業(yè)再也不用擔(dān)心員工突然的離職。
數(shù)據(jù)集版本管理頁面(1)
數(shù)據(jù)集版本管理頁面(2)
模型迭代版本管理頁面
YMIRV1.0無縫對接開放免費的標(biāo)注工具LabelFree
數(shù)據(jù)標(biāo)注的質(zhì)量與效率直接影響模型訓(xùn)練的質(zhì)量與效率,一個好的標(biāo)注工具可以讓模型訓(xùn)練事半功倍。LabelFree是一個開放的、可私有化部署的高性能數(shù)據(jù)標(biāo)注系統(tǒng)。其操作簡單、數(shù)據(jù)可靠,為算法服務(wù)提供可靠的底層數(shù)據(jù)支撐。
LabelFree項目管理頁面
1.大幅提升標(biāo)注質(zhì)量
LabelFree支持在數(shù)據(jù)標(biāo)注的早期階段對標(biāo)注質(zhì)量進(jìn)行嚴(yán)格把控。其支持多角色用戶管理功能,當(dāng)角色為質(zhì)檢員時,可對標(biāo)注結(jié)果進(jìn)行檢查與復(fù)核。
2.大幅提升標(biāo)注效率
LabelFree可大幅提升個人標(biāo)注效率。其支持大量標(biāo)注步驟快捷鍵操作,通過人機交互的優(yōu)化顯著提升標(biāo)注效率。
快捷鍵使用說明
LabelFree亦支持團(tuán)隊標(biāo)注。其支持多人協(xié)作完成同一標(biāo)注任務(wù),并實現(xiàn)任務(wù)自動分發(fā)。
同時,LabelFree提供一鍵標(biāo)注服務(wù),幫助需要的個人及企業(yè)用戶在最短的時間內(nèi)獲取質(zhì)量可靠的標(biāo)注數(shù)據(jù)。
3、可靠的數(shù)據(jù)安全管理
數(shù)據(jù)的完全私有化管理,最大程度的保護(hù)數(shù)據(jù)安全。數(shù)據(jù)集管理服務(wù)依托具有彈性伸縮能力的原生對象存儲,為機器學(xué)習(xí)、大數(shù)據(jù)分析平臺提供高性能、高可用的數(shù)據(jù)基座。
4、完全的免費開放平臺
LabelFree平臺對數(shù)據(jù)集大小、用戶數(shù)量、項目數(shù)量等功能均無限制,用戶可在平臺上進(jìn)行各種自定義的數(shù)據(jù)標(biāo)注任務(wù)并獲得良好的體驗。
重磅!挖米匠要開直播啦!手把手教大家使用 YMIR,小白也能成為算法工程師!
歡迎大家試用新版本,接受所有吐槽哦~部署或試用過程中有任何問題都?xì)g迎聯(lián)系小助手“挖米匠”(微信ID:itsymir)。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。
2024年的Adobe MAX 2024發(fā)布會上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標(biāo)識解析專題論壇在沈陽成功舉辦。