本文來自于微信公眾號GenAI新世界(ID:gh_e06235300f0d),作者:李禾子。
不知道有多少人還記得Google Nose。
這個谷歌在 2013 年愚人節(jié)上線的搞怪項目聲稱有一個包含 1500 萬種味道的氣味資料庫,用戶只需要在谷歌搜索框輸入關(guān)鍵詞,點擊“聞一聞”,就能直接在電腦旁聞到該物體的味道,比如新車的味道,篝火的味道,以及埃及古墓的味道(?)等等。
就是這個十年前離譜但腦洞大開的玩笑,正在被它的發(fā)明者部分變成現(xiàn)實。
今年 9 月初的《科學(xué)》雜志刊登了一篇由初創(chuàng)公司Osmo(從谷歌分拆)和莫奈爾化學(xué)感官中心(Monell Chemical Senses Center)等多個研究團隊共同發(fā)布的論文,其中稱,AI模型可以讓機器擁有比人類更好的“嗅覺”。
乍一聽這簡直太不可思議了,畢竟對大眾來說,嗅覺是比視覺和聽覺抽象得多的存在。RGB顏色圖譜可以描述人眼看到的色彩,人耳聽到的聲音也可以轉(zhuǎn)化為不同頻率的波長,甚至讓人感受到震動,但唯獨嗅覺,看不見摸不著,更難以用量化的指標描述。
換句話說,把氣味數(shù)字化聽起來就是件不可能的事。
而這篇論文的研究人員核心要做的,正是去試圖創(chuàng)建一個能夠如實反映氣味特征的人類嗅覺高維圖譜,即POM(Principle Odor Map)。
那么具體是怎么做的呢?
我們知道,氣味是人類嗅覺系統(tǒng)對散布于空氣中的某些特定分子的感應(yīng)。氣味分子進入鼻孔后,會與鼻腔上方的嗅覺細胞產(chǎn)生(受體)反應(yīng),產(chǎn)生的生物電波再通過神經(jīng)傳到大腦,繼而識別味道。
而氣味的構(gòu)成實際要比色彩、聲音復(fù)雜得多,有數(shù)以百萬計的不同種類,每種氣味又都由數(shù)百個化學(xué)分子組成,其性質(zhì)各不相同。與之相應(yīng)地,人類的功能性嗅覺受體有大約 400 個,遠遠超過了我們用于視覺的 4 個,以及用于味覺的約 40 個。
所以面對如此復(fù)雜的嗅覺機制,研究人員首先做的事情就是創(chuàng)建了一個機器學(xué)習(xí)模型——消息傳遞神經(jīng)網(wǎng)絡(luò)(MPNN)。
這是一種特定的圖神經(jīng)網(wǎng)絡(luò)(GNN),因為圖神經(jīng)網(wǎng)絡(luò)是一種基于圖結(jié)構(gòu)的深度學(xué)習(xí)方法,將傳統(tǒng)的圖分析引入,提供了對非規(guī)則數(shù)據(jù)提取特征的方法,因而也非常適合用來學(xué)習(xí)復(fù)雜的氣味特征。
模型搭好之后,接下來就要喂給它學(xué)習(xí)材料。
研究人員結(jié)合了Good Scents and Leffingwell & Associates(GS-LF)香精香料數(shù)據(jù)庫,建立了一個包含約 5000 個分子的參考數(shù)據(jù)集作為訓(xùn)練基礎(chǔ)素材,每個分子可以有多個氣味標簽,比如果味、花香、芝士味和薄荷味等等。
通過將分子的形狀結(jié)構(gòu)作為數(shù)據(jù)輸入,模型得以輸出最能描述某種氣味的對應(yīng)氣味詞。
為了使訓(xùn)練結(jié)果更準確,研究者同樣用到了各種方法來優(yōu)化模型參數(shù)。比如將GS-LF香精香料數(shù)據(jù)庫按照8: 2 的比例劃分為訓(xùn)練集和測試集,訓(xùn)練集被進一步劃分為五個交叉驗證的子集;以及使用貝葉斯優(yōu)化算法對數(shù)據(jù)進行交叉驗證,并對GNN模型的超參數(shù)進行優(yōu)化等。
這張圖直觀表示了每種氣味的感知距離,比如花香(floral)、肉味(meaty)和酒香(ethereal)幾個大類彼此間是存在較大感知距離的;但每個大類下包括的更具體的氣味,比如花香下的百合花香(muguet)、薰衣草香(lavender)和茉莉花香(jasmine),感知距離則較為接近。
論文將POM和此前有過研究先例的基于摩根指紋的氣味空間圖(Morgan fingerprint-based maps)進行了對比,發(fā)現(xiàn)后者尚無法體現(xiàn)上述感知距離:
為了進一步驗證模型訓(xùn)練效果,研究者接著找來了 15 位氣味專家,來和模型比拼誰識別氣味更準確。
15 位專家每人需要聞 400 種氣味,研究者會給出 55 個氣味形容詞,讓他們就每種氣味對這 55 個選項用1- 5 分來打分,評定每個氣味形容詞在多大程度上適合于這個氣味。
結(jié)果發(fā)現(xiàn),對于其中53%的測試分子,模型的表現(xiàn)都優(yōu)于小組成員的平均值。
研究者還將模型的預(yù)測結(jié)果按氣味描述詞進行了分類,發(fā)現(xiàn)除麝香外,模型對分子氣味的預(yù)測結(jié)果均在人類組的誤差分布中,且在 30 個氣味描述詞的預(yù)測結(jié)果中優(yōu)于人類組中位數(shù):
后續(xù),研究者還對模型的性能進行了反復(fù)驗證,獲得了較為穩(wěn)定的分子結(jié)構(gòu)-氣味關(guān)系。
下面就進入到了最激動人心的氣味圖譜大規(guī)模繪制環(huán)節(jié),并最終得到了下面這張圖:
你可以把上文那個表示氣味感知距離的坐標圖理解成是這張圖的無限放大版。論文提到,這張圖中包含了約 50 萬種氣味分子,當中甚至有許多還沒有被發(fā)現(xiàn)或合成出來(但確實能計算出來)。
做個更直觀的比較,如果讓一名訓(xùn)練有素的人類評價員尋找這些氣味,大概需要連續(xù)工作 70 年才可以全部收集到。
看起來,這篇論文著實是完成了一件大事。
這時就有網(wǎng)友發(fā)問了,機器為什么需要聞氣味呢?
其他人也紛紛給出了自己的見解,比如認為可以用于工廠污水處理的質(zhì)量控制,進行爆炸物、毒品或是尸體的嗅探等等:
這樣一來警犬和搜救犬可能要下班了
有人希望可以據(jù)此研發(fā)出一款好的除臭劑,因為人在進行大量有氧運動比如跑步或舉重后會散發(fā)出不好的氣味:
也有人對這一研究成果在醫(yī)療方面的應(yīng)用很感興趣,比如可以用來開發(fā)嗅覺喪失癥的新療法,或者通過氣味檢測疾病等等:
還有香水行業(yè)的從業(yè)者覺得這幫了自己大忙,“讓它告訴我的同事什么時候他們噴了太多古龍水”:
這些預(yù)測事實上都不無道理。首先機器確實可以幫人類解決有時對氣味辨別不準確的問題——研究表明,每個人對氣味的感知程度都各不相同,會根據(jù)感覺和生理信號引發(fā)不同反應(yīng),其中也受到經(jīng)驗、期望、個性或情境因素的影響。
而氣味某些時候?qū)θ藖碚f又十分重要。
不好的氣味就不用說了,某些有害氣體還可能會危害健康,這時如果可以有機器代替某些特定職業(yè)幫助人類或動物作業(yè)就再好不過。
而對另一些氣味可以為之帶來好處的職業(yè),比如調(diào)香師、廚師、設(shè)計師、藝術(shù)家和建筑師等等,也有調(diào)配出更具功能性的氣味的需要。一些場合會將氣味應(yīng)用在環(huán)境中,比如紐約Sloan-Kettering癌癥中心會在空氣中散布香草油,以降低患者對于磁共振成像(MRI)測試的幽閉恐懼癥;芝加哥期貨交易也會散布特定的香味以降低交易大廳的噪音分貝。
還有研究表明,人類大多數(shù)與氣味有關(guān)的記憶都來自嬰兒及幼兒時期的最初十年,而語言和視覺所產(chǎn)生的記憶通常在10- 30 歲之間產(chǎn)生。這部分解釋了氣味可以喚起人遙遠的回憶,而且透過氣味所引起的回憶,經(jīng)常比視覺或聽覺所引起的回憶,更加情緒傾向。
所以氣味和人類的聯(lián)系還是非常緊密的,只是我們在很多時候并不容易察覺。
網(wǎng)友們的猜想也在論文的作者之一、來自O(shè)smo公司的Alex Wiltschko那里得到了驗證。他在發(fā)布在Osmo官網(wǎng)的一篇文章中寫道,
“氣味圖譜是我們實現(xiàn)更遠大目標的基礎(chǔ)。如果可以開發(fā)出能夠復(fù)制我們鼻子或狗的鼻子的功能系統(tǒng),我們就可以盡早發(fā)現(xiàn)疾病;人工智能也將幫助醫(yī)生找到更有可能在臨床上取得成功的藥物,更好地幫助合成化學(xué)家和調(diào)香大師進行工作……我們未來的工作目標是,為改善人類健康和幸福奠定堅實的科學(xué)和商業(yè)基礎(chǔ)。”
不過他也表示,論文依然存在諸多不足。
比如,無法體現(xiàn)分子氣味的濃淡,只能預(yù)測它聞起來是什么樣;只對單個分子氣味進行了預(yù)測,現(xiàn)實生活中更多卻是混合氣味;而即便是所有的能力都達到了,對氣味的復(fù)制和還原也將是很大的挑戰(zhàn)等等。
最后,說了這么多,有一個網(wǎng)友的評論倒是很樸實,“我覺得這會讓品酒失去樂趣”:
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。
近日,德國柏林國際電子消費品展覽會(IFA2024)隆重舉辦。憑借在核心技術(shù)、產(chǎn)品設(shè)計及應(yīng)用方面的創(chuàng)新變革,全球領(lǐng)先的智能終端企業(yè)TCL實業(yè)成功斬獲兩項“IFA全球產(chǎn)品設(shè)計創(chuàng)新大獎”金獎,有力證明了其在全球市場的強大影響力。
近日,中國家電及消費電子博覽會(AWE 2024)隆重開幕。全球領(lǐng)先的智能終端企業(yè)TCL實業(yè)攜多款創(chuàng)新技術(shù)和新品亮相,以敢為精神勇闖技術(shù)無人區(qū),斬獲四項AWE 2024艾普蘭大獎。
“以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。
由世界人工智能大會組委會、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會共同指導(dǎo),由上海市人工智能行業(yè)協(xié)會聯(lián)合上海人工智能實驗室、上海臨港經(jīng)濟發(fā)展(集團)有限公司、開放原子開源基金會主辦的“2024全球開發(fā)者先鋒大會”,將于2024年3月23日至24日舉辦。