本文來自于微信公眾號GenAI新世界(ID:gh_e06235300f0d),作者:李禾子。
不知道有多少人還記得Google Nose。
這個(gè)谷歌在 2013 年愚人節(jié)上線的搞怪項(xiàng)目聲稱有一個(gè)包含 1500 萬種味道的氣味資料庫,用戶只需要在谷歌搜索框輸入關(guān)鍵詞,點(diǎn)擊“聞一聞”,就能直接在電腦旁聞到該物體的味道,比如新車的味道,篝火的味道,以及埃及古墓的味道(?)等等。
就是這個(gè)十年前離譜但腦洞大開的玩笑,正在被它的發(fā)明者部分變成現(xiàn)實(shí)。
今年 9 月初的《科學(xué)》雜志刊登了一篇由初創(chuàng)公司Osmo(從谷歌分拆)和莫奈爾化學(xué)感官中心(Monell Chemical Senses Center)等多個(gè)研究團(tuán)隊(duì)共同發(fā)布的論文,其中稱,AI模型可以讓機(jī)器擁有比人類更好的“嗅覺”。
乍一聽這簡直太不可思議了,畢竟對大眾來說,嗅覺是比視覺和聽覺抽象得多的存在。RGB顏色圖譜可以描述人眼看到的色彩,人耳聽到的聲音也可以轉(zhuǎn)化為不同頻率的波長,甚至讓人感受到震動(dòng),但唯獨(dú)嗅覺,看不見摸不著,更難以用量化的指標(biāo)描述。
換句話說,把氣味數(shù)字化聽起來就是件不可能的事。
而這篇論文的研究人員核心要做的,正是去試圖創(chuàng)建一個(gè)能夠如實(shí)反映氣味特征的人類嗅覺高維圖譜,即POM(Principle Odor Map)。
那么具體是怎么做的呢?
我們知道,氣味是人類嗅覺系統(tǒng)對散布于空氣中的某些特定分子的感應(yīng)。氣味分子進(jìn)入鼻孔后,會(huì)與鼻腔上方的嗅覺細(xì)胞產(chǎn)生(受體)反應(yīng),產(chǎn)生的生物電波再通過神經(jīng)傳到大腦,繼而識(shí)別味道。
而氣味的構(gòu)成實(shí)際要比色彩、聲音復(fù)雜得多,有數(shù)以百萬計(jì)的不同種類,每種氣味又都由數(shù)百個(gè)化學(xué)分子組成,其性質(zhì)各不相同。與之相應(yīng)地,人類的功能性嗅覺受體有大約 400 個(gè),遠(yuǎn)遠(yuǎn)超過了我們用于視覺的 4 個(gè),以及用于味覺的約 40 個(gè)。
所以面對如此復(fù)雜的嗅覺機(jī)制,研究人員首先做的事情就是創(chuàng)建了一個(gè)機(jī)器學(xué)習(xí)模型——消息傳遞神經(jīng)網(wǎng)絡(luò)(MPNN)。
這是一種特定的圖神經(jīng)網(wǎng)絡(luò)(GNN),因?yàn)閳D神經(jīng)網(wǎng)絡(luò)是一種基于圖結(jié)構(gòu)的深度學(xué)習(xí)方法,將傳統(tǒng)的圖分析引入,提供了對非規(guī)則數(shù)據(jù)提取特征的方法,因而也非常適合用來學(xué)習(xí)復(fù)雜的氣味特征。
模型搭好之后,接下來就要喂給它學(xué)習(xí)材料。
研究人員結(jié)合了Good Scents and Leffingwell & Associates(GS-LF)香精香料數(shù)據(jù)庫,建立了一個(gè)包含約 5000 個(gè)分子的參考數(shù)據(jù)集作為訓(xùn)練基礎(chǔ)素材,每個(gè)分子可以有多個(gè)氣味標(biāo)簽,比如果味、花香、芝士味和薄荷味等等。
通過將分子的形狀結(jié)構(gòu)作為數(shù)據(jù)輸入,模型得以輸出最能描述某種氣味的對應(yīng)氣味詞。
為了使訓(xùn)練結(jié)果更準(zhǔn)確,研究者同樣用到了各種方法來優(yōu)化模型參數(shù)。比如將GS-LF香精香料數(shù)據(jù)庫按照8: 2 的比例劃分為訓(xùn)練集和測試集,訓(xùn)練集被進(jìn)一步劃分為五個(gè)交叉驗(yàn)證的子集;以及使用貝葉斯優(yōu)化算法對數(shù)據(jù)進(jìn)行交叉驗(yàn)證,并對GNN模型的超參數(shù)進(jìn)行優(yōu)化等。
這張圖直觀表示了每種氣味的感知距離,比如花香(floral)、肉味(meaty)和酒香(ethereal)幾個(gè)大類彼此間是存在較大感知距離的;但每個(gè)大類下包括的更具體的氣味,比如花香下的百合花香(muguet)、薰衣草香(lavender)和茉莉花香(jasmine),感知距離則較為接近。
論文將POM和此前有過研究先例的基于摩根指紋的氣味空間圖(Morgan fingerprint-based maps)進(jìn)行了對比,發(fā)現(xiàn)后者尚無法體現(xiàn)上述感知距離:
為了進(jìn)一步驗(yàn)證模型訓(xùn)練效果,研究者接著找來了 15 位氣味專家,來和模型比拼誰識(shí)別氣味更準(zhǔn)確。
15 位專家每人需要聞 400 種氣味,研究者會(huì)給出 55 個(gè)氣味形容詞,讓他們就每種氣味對這 55 個(gè)選項(xiàng)用1- 5 分來打分,評定每個(gè)氣味形容詞在多大程度上適合于這個(gè)氣味。
結(jié)果發(fā)現(xiàn),對于其中53%的測試分子,模型的表現(xiàn)都優(yōu)于小組成員的平均值。
研究者還將模型的預(yù)測結(jié)果按氣味描述詞進(jìn)行了分類,發(fā)現(xiàn)除麝香外,模型對分子氣味的預(yù)測結(jié)果均在人類組的誤差分布中,且在 30 個(gè)氣味描述詞的預(yù)測結(jié)果中優(yōu)于人類組中位數(shù):
后續(xù),研究者還對模型的性能進(jìn)行了反復(fù)驗(yàn)證,獲得了較為穩(wěn)定的分子結(jié)構(gòu)-氣味關(guān)系。
下面就進(jìn)入到了最激動(dòng)人心的氣味圖譜大規(guī)模繪制環(huán)節(jié),并最終得到了下面這張圖:
你可以把上文那個(gè)表示氣味感知距離的坐標(biāo)圖理解成是這張圖的無限放大版。論文提到,這張圖中包含了約 50 萬種氣味分子,當(dāng)中甚至有許多還沒有被發(fā)現(xiàn)或合成出來(但確實(shí)能計(jì)算出來)。
做個(gè)更直觀的比較,如果讓一名訓(xùn)練有素的人類評價(jià)員尋找這些氣味,大概需要連續(xù)工作 70 年才可以全部收集到。
看起來,這篇論文著實(shí)是完成了一件大事。
這時(shí)就有網(wǎng)友發(fā)問了,機(jī)器為什么需要聞氣味呢?
其他人也紛紛給出了自己的見解,比如認(rèn)為可以用于工廠污水處理的質(zhì)量控制,進(jìn)行爆炸物、毒品或是尸體的嗅探等等:
這樣一來警犬和搜救犬可能要下班了
有人希望可以據(jù)此研發(fā)出一款好的除臭劑,因?yàn)槿嗽谶M(jìn)行大量有氧運(yùn)動(dòng)比如跑步或舉重后會(huì)散發(fā)出不好的氣味:
也有人對這一研究成果在醫(yī)療方面的應(yīng)用很感興趣,比如可以用來開發(fā)嗅覺喪失癥的新療法,或者通過氣味檢測疾病等等:
還有香水行業(yè)的從業(yè)者覺得這幫了自己大忙,“讓它告訴我的同事什么時(shí)候他們噴了太多古龍水”:
這些預(yù)測事實(shí)上都不無道理。首先機(jī)器確實(shí)可以幫人類解決有時(shí)對氣味辨別不準(zhǔn)確的問題——研究表明,每個(gè)人對氣味的感知程度都各不相同,會(huì)根據(jù)感覺和生理信號引發(fā)不同反應(yīng),其中也受到經(jīng)驗(yàn)、期望、個(gè)性或情境因素的影響。
而氣味某些時(shí)候?qū)θ藖碚f又十分重要。
不好的氣味就不用說了,某些有害氣體還可能會(huì)危害健康,這時(shí)如果可以有機(jī)器代替某些特定職業(yè)幫助人類或動(dòng)物作業(yè)就再好不過。
而對另一些氣味可以為之帶來好處的職業(yè),比如調(diào)香師、廚師、設(shè)計(jì)師、藝術(shù)家和建筑師等等,也有調(diào)配出更具功能性的氣味的需要。一些場合會(huì)將氣味應(yīng)用在環(huán)境中,比如紐約Sloan-Kettering癌癥中心會(huì)在空氣中散布香草油,以降低患者對于磁共振成像(MRI)測試的幽閉恐懼癥;芝加哥期貨交易也會(huì)散布特定的香味以降低交易大廳的噪音分貝。
還有研究表明,人類大多數(shù)與氣味有關(guān)的記憶都來自嬰兒及幼兒時(shí)期的最初十年,而語言和視覺所產(chǎn)生的記憶通常在10- 30 歲之間產(chǎn)生。這部分解釋了氣味可以喚起人遙遠(yuǎn)的回憶,而且透過氣味所引起的回憶,經(jīng)常比視覺或聽覺所引起的回憶,更加情緒傾向。
所以氣味和人類的聯(lián)系還是非常緊密的,只是我們在很多時(shí)候并不容易察覺。
網(wǎng)友們的猜想也在論文的作者之一、來自O(shè)smo公司的Alex Wiltschko那里得到了驗(yàn)證。他在發(fā)布在Osmo官網(wǎng)的一篇文章中寫道,
“氣味圖譜是我們實(shí)現(xiàn)更遠(yuǎn)大目標(biāo)的基礎(chǔ)。如果可以開發(fā)出能夠復(fù)制我們鼻子或狗的鼻子的功能系統(tǒng),我們就可以盡早發(fā)現(xiàn)疾病;人工智能也將幫助醫(yī)生找到更有可能在臨床上取得成功的藥物,更好地幫助合成化學(xué)家和調(diào)香大師進(jìn)行工作……我們未來的工作目標(biāo)是,為改善人類健康和幸福奠定堅(jiān)實(shí)的科學(xué)和商業(yè)基礎(chǔ)。”
不過他也表示,論文依然存在諸多不足。
比如,無法體現(xiàn)分子氣味的濃淡,只能預(yù)測它聞起來是什么樣;只對單個(gè)分子氣味進(jìn)行了預(yù)測,現(xiàn)實(shí)生活中更多卻是混合氣味;而即便是所有的能力都達(dá)到了,對氣味的復(fù)制和還原也將是很大的挑戰(zhàn)等等。
最后,說了這么多,有一個(gè)網(wǎng)友的評論倒是很樸實(shí),“我覺得這會(huì)讓品酒失去樂趣”:
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。
2024年的Adobe MAX 2024發(fā)布會(huì)上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個(gè)月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實(shí)質(zhì)性的幫助,雙十一期間低至2799元,性價(jià)比很高,簡直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會(huì)——工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析專題論壇在沈陽成功舉辦。