加拿大的Klick科研人員在頂級健康雜志《梅奧診所文集:數(shù)字健康》上發(fā)布了一個AI大模型,只需要聽一段6—10秒的語音,就能診斷是否患有2型糖尿病(T2DM)。
目前糖尿病的主要檢測方式依賴于血糖測量,但這種方法需要獲取血液樣本對患者會造成創(chuàng)傷,同時還需要專業(yè)設(shè)備成本非常高。為了解決這一檢測痛點(diǎn),加拿大知名健康科技公司Klick科研人員提出了AI模型檢測方法。
研究人員收集了267名志愿者的語音樣本,然后通過AI模型了進(jìn)行了詳細(xì)檢測,結(jié)果顯示,AI準(zhǔn)確地識別出了2型糖尿病,其中,女性準(zhǔn)確率89%,男性準(zhǔn)確率86%。還發(fā)現(xiàn),“音調(diào)”和“音調(diào)標(biāo)準(zhǔn)差”是診斷2型糖尿病的主要特征之一。
這個研究與前段時間Meta提出的使用MEG(腦磁圖)重構(gòu)人類大腦成像過程類似,都是借助人類的生物體特征,來觀察其抖動數(shù)據(jù)變化確定結(jié)果。
論文地址:https://www.mcpdigitalhealth.org/article/S2949-7612(23)00073-1/fulltext
構(gòu)建數(shù)據(jù)集
研究人員共招募了267名自愿者,其中79名女性和113名男性是非糖尿病患者,18名女性和57名男性被診斷為2型糖尿病患者。
參與者的糖尿病診斷是基于美國糖尿病學(xué)會的診斷標(biāo)準(zhǔn),由醫(yī)生確認(rèn)。同時沒有神經(jīng)系統(tǒng)或語言障礙史,也沒有吸煙歷史。
參與者使用智能手機(jī)應(yīng)用程序錄制固定語句“你好,你好嗎?我現(xiàn)在的血糖水平是多少”,錄制時間為2周,每天最多6次,總共收集了18,465段語音樣本。
數(shù)據(jù)分割,提取特征
由于年齡和體重指數(shù)等因素會對語音數(shù)據(jù)產(chǎn)生影響,研究人員根據(jù)參與者ID將數(shù)據(jù)分割成年齡和體重指數(shù)匹配的數(shù)據(jù)集,用于模型訓(xùn)練和統(tǒng)計分析,這有助于AI模型能夠?qū)W習(xí)到糖尿病語音的真實變化。
訓(xùn)練集占所有2型糖尿病患者的50%男性和61%女性。剩余數(shù)據(jù)作為測試集,用于測試訓(xùn)練好的AI模型。
接著研究人員從每個語音樣本中提取了14個聲學(xué)特征,包括音高、音強(qiáng)、諧波噪聲比、聲響、聲抖等。特徵提取使用的是Parselmouth,這是Praat語音分析軟件的Python接口。
可從原始語音信號中提取能反映語音變化的數(shù)值特征,為后續(xù)的模型訓(xùn)練和預(yù)測提供輸入。
選擇模型
考慮到相關(guān)工作中使用的模型,研究人員選擇了邏輯回歸、樸素貝葉斯和支持向量機(jī)等模型。通過5折交叉驗證在訓(xùn)練集上評估了這些模型的性能,從而找到最佳模型。
對女性而言,含3個特征的邏輯回歸模型效果最好;男性,含2個特征的樸素貝葉斯模型效果最好。
邏輯回歸模型可以估計不同特征對結(jié)果的貢獻(xiàn)程度;樸素貝葉斯模型在小樣本場景下效果較好。然后使用最佳模型,在構(gòu)建的訓(xùn)練集上進(jìn)行預(yù)訓(xùn)練。
模型測試數(shù)據(jù)
使用訓(xùn)練好的AI模型對測試集的數(shù)據(jù)進(jìn)行預(yù)測,得到每個樣本屬于2型糖尿病的概率。根據(jù)預(yù)先確定的概率閾值,將樣本預(yù)測為2型糖尿病或非糖尿病。
同時使用測試集的數(shù)據(jù)計算模型的精確度、敏感度和特異度等評價指標(biāo),還可以繪制ROC曲線等來全面的評估模型的預(yù)測性能。
此外,研究人員還將年齡、體重指數(shù)等信息融合到預(yù)測結(jié)果中,可以提高模型的準(zhǔn)確度。
例如,對女性平均語音預(yù)測結(jié)果和體重指數(shù)患病率,對男性平均語音結(jié)果與年齡、體重指數(shù)患病率。這種集成模塊通過組合多個信息源,可以彌補(bǔ)單一模型的缺陷,增強(qiáng)模型的預(yù)測能力。
測試結(jié)果顯示,對女性,語音結(jié)果與體重指數(shù)的2型糖尿病患病率相結(jié)合,在測試集上達(dá)到了0.89的準(zhǔn)確率、0.91的特異度和0.71的敏感度。
對男性,語音結(jié)果與年齡和體重指數(shù)的2型糖尿病患病率相結(jié)合,在測試集上達(dá)到了0.86的準(zhǔn)確率、0.89的特異度和0.75的敏感度。
研究負(fù)責(zé)人Jaycee Kaufman表示,我們在研究過程中確定了2型糖尿病患者語音的變化, 這對于AI大模型檢測、篩選2型糖尿病有非常高的應(yīng)用價值。
語音評估的方法有助于2型糖尿病的早期干預(yù)和管理,同時減輕疾病的負(fù)擔(dān)改善醫(yī)療效果。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。
近日,德國柏林國際電子消費(fèi)品展覽會(IFA2024)隆重舉辦。憑借在核心技術(shù)、產(chǎn)品設(shè)計及應(yīng)用方面的創(chuàng)新變革,全球領(lǐng)先的智能終端企業(yè)TCL實業(yè)成功斬獲兩項“IFA全球產(chǎn)品設(shè)計創(chuàng)新大獎”金獎,有力證明了其在全球市場的強(qiáng)大影響力。
近日,中國家電及消費(fèi)電子博覽會(AWE 2024)隆重開幕。全球領(lǐng)先的智能終端企業(yè)TCL實業(yè)攜多款創(chuàng)新技術(shù)和新品亮相,以敢為精神勇闖技術(shù)無人區(qū),斬獲四項AWE 2024艾普蘭大獎。
“以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。
由世界人工智能大會組委會、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會共同指導(dǎo),由上海市人工智能行業(yè)協(xié)會聯(lián)合上海人工智能實驗室、上海臨港經(jīng)濟(jì)發(fā)展(集團(tuán))有限公司、開放原子開源基金會主辦的“2024全球開發(fā)者先鋒大會”,將于2024年3月23日至24日舉辦。