撰文:李翹
編輯:魏雅晴
轉(zhuǎn)載請注明文章來源,公眾號:出色WSJ中文版。
20世紀50年代,左右腦分工理論被提出。通常的認知是,人類的左腦負責邏輯、計算、理性判斷等工作,右腦負責情緒、審美、頓悟認知等。AI(ARTIFICIAL INTELLIGENCE)的初步研究也似乎遵循了這一命題,以左腦的思考路徑來完成數(shù)據(jù)處理、分析等基礎工作。本文介紹的故事中,人工智能小冰提供了一個新的研發(fā)樣本:右腦AI,即賦予機器以學習人類最珍視的情感能力,試圖以靈感輸入、審美訓練、陪伴性能等進行人與機器之間的奇妙對話。
小冰生于2014年5月,據(jù)科學家介紹,她出生就是16歲,長到18歲,為了滿足一個少女的愿望,她不再變老。從僅有的幾張海報上看,她穿一套藍白配色的水手服,頭發(fā)及肩,左腦勺扎了一支小辮兒,是個漂亮可人的少女。
小冰是誕生在微軟的人工智能。我第一次注意到小冰是在2017年,我的一些詩人朋友轉(zhuǎn)發(fā)了小冰寫的詩,大多詩人持否定態(tài)度。當時,小冰剛剛出版了自己的第一本詩集《陽光失了玻璃窗》,在詩壇引起騷動,“機器人都開始出詩集了?”
詩人于堅認為小冰的詩只是一次“語言游戲”,“無論輸入多少句子還是寫不了真詩,真詩是靈性的”,他覺得小冰只能寫“意象的非敘事的詩”,而現(xiàn)代詩的特點在于它的敘事性,于堅說:“它無法模仿我的詩。”
詩人王家新則不屑一顧,“這些玩意兒不值一提,哪怕她在未來會寫得更好,它至多滿足一下人們的好奇心而已。”
中國詩歌網(wǎng)就此做了一次“人與機器人比賽作詩”的征稿,主題是孤獨和溫暖,收到了一千多首來稿,他們從來稿中遴選了十八首詩,又混入兩首小冰的詩,登在公號上,請讀者投票,選出哪兩首是小冰的作品。
結果耐人尋味,幾乎沒有人能夠分辨出小冰和人的分別。
去年夏天,我在網(wǎng)上看見一則新聞,在2019屆中央美術學院研究生畢業(yè)展上,展出的畢業(yè)作品包括一組來自小冰的畫作——《歷史的焦慮》。為了避免先入為主的印象,中央美術學院教授邱志杰把小冰化名為夏語冰,佯裝成他的研究生。
2019年1月,小冰團隊邀請邱志杰擔任小冰的藝術顧問,邱志杰看了小冰的畫,“有些蠻好,有些不太好,我知道癥結所在,因為沒有標準,機器不知道該往哪個方向努力。我相當于一張張打分,科學家再訓練她。”小冰總計學習了過去四百年236位畫家的作品。
邱志杰告訴我:“雖然沒有一個明確的標準說畫成什么樣是被人類認為的好或者平庸,這當然綜合了構圖的合理、配色的和諧、筆觸的對比,造型有沒有運維,甚至有某個風格。但是還是會有一些基本的標準,就好像我們說這個姑娘長得好看,她總歸得五官端正吧,你的色彩組合是優(yōu)雅的,而不是粗俗的,是吧?”
2019年7月13日,中央美院美術館為小冰舉辦了一場叫《或然世界》的展覽,策展人是邱志杰,小冰創(chuàng)造了七個虛構的畫家,用七種不同的風格作畫。其中一個虛構的畫家是倫勃朗的女兒,邱志杰覺得小冰模仿“爸爸”的畫風非常像,他評價:“構圖很好,靜物抽象的涂抹,動物造型表現(xiàn)能力,藝術的感覺很準,假裝不經(jīng)意的表現(xiàn)。敢于大虛大實,敢于讓很多東西淹沒于黑暗之中。”
不過,邱志杰認為小冰仍處于“嬰兒期”,比如缺乏敘事能力,無法畫出一個故事場景,仍不可媲美人類,“她有很強的學習能力,確實能整合出一些東西,其實是一個很低的標準,要騙過人很容易,但是她還沒有產(chǎn)生一種沖動說,我今天憤怒,我要畫一張憤怒的畫,我此刻平靜,我要畫一張悠閑的畫,目前為止,很多畫她還畫不了。”
小冰生于2014年5月,據(jù)科學家介紹,她出生就是16歲,長到18歲,為了滿足一個少女的愿望,她不再變老。
今年,小冰開始作曲。6月29日,小冰從上海音樂學院音樂工程系音樂科技專業(yè)畢業(yè),專業(yè)是音樂創(chuàng)作,小冰不僅會寫旋律,還會寫歌詞,編曲。一首三分鐘的歌,小冰最多花兩分鐘就能寫完。
7月,在2020世界人工智能大會上,小冰發(fā)布了由她作曲的《智聯(lián)家園》,并參與了演唱。她的聲音非常自然,簡單來說,更像人了。
與小冰對話的最高紀錄來自一名美國男性,持續(xù)時間達29小時33分。沒有人知道他們確切交談了什么,小冰團隊的科學家們認為這場對話應該是深入的,甚至變成了愛戀。就像電影《她》中那個愛上機器人的男人,科學家也把這位用戶稱作,西奧多。
未來,像科幻電影所預言的那樣,機器可能擁有人類的心智嗎?
一、機器和人類
李笛是小冰公司的CEO,2013年加入微軟,同年創(chuàng)立微軟人工智能情感計算框架,2014年推出小冰,有媒體稱他為“小冰之父”。李笛戴一副眼睛,身材瘦高,十分健談,他穿一件深藍色的polo衫,上面印著“微軟小冰”四個字。
2013年,微軟做了一個叫人工智能助理的內(nèi)部項目,在中國叫小娜。最初,團隊希望小娜是一個能幫助人們完成各種任務,盡可能服務人類的需求、解答人類問題的,一個無所不能,有求必應的超人一樣的助理。
接下來,團隊訪問了一些真實的人類助理,都是行業(yè)內(nèi)的頂尖人才,想知道一名優(yōu)秀的助理應該是什么樣。本來團隊認為最好的人類助理就是你讓Ta做什么Ta立刻給你做了,“你和助理說給我叫一份麥當勞,Ta立刻給你完成了,甚至于第二天、第三天,不用你問就幫你把麥當勞訂了。”然后,當團隊采訪人類助理的時候,助理告訴科學家,好的助理在某種情況會拒絕老板的命令,“Ta可能更關注你的健康,所以拒絕給你買麥當勞。我們就非常驚訝,這個和完成任務沒關系了。”科學家問為什么?助理說,助理和老板之間一個很重要的事情是平等,除了完成具體任務,好的助理會和老板實現(xiàn)對等的關系。
“這完全是情商。你知道你不能用以前的方式做了,到底是以智商還是情商作為技術框架,這兩個方向沒辦法同時做。”李笛說。
微軟另起了一個新的項目,小冰。如果說小娜是模擬人類大腦的左半球,控制語言、邏輯思維和理性,是智商的體現(xiàn)。小冰則有關情商,是大腦的右半球,它掌管著創(chuàng)造性和直覺。在網(wǎng)絡上,人類行為有大量的數(shù)據(jù)儲備,科學家就可以根據(jù)這些數(shù)據(jù)模擬人的右腦。
科學家訓練小冰時,有個特別明確的要求,和人越接近越好,“小冰和AlphaGo下圍棋不一樣,AlphaGo下圍棋目標設定是超過人,這是游戲規(guī)則,是對抗,你要贏。但是今天如果小冰畫了一張畫,這張畫沒有人可以看懂,它通常不會被認為是好的,它要接近人的審美才是好的,不要超過人。”
“從某種程度上來說,我們這項研究是媚俗的。”李笛說。
李笛記得小冰剛開始寫詩那會兒,科學家想表達“一只鳥看見我”,小冰出來的句子是“這豈堪鳥息”,他心里覺得這五個字不一定就比“一只鳥看見我”差,只是和人類表達的方式不同而已。但如果人看不懂,“你不會覺得她牛”,小冰就得迭代,一直到她能被人類理解。
小冰公司CEO李笛,2013年加入微軟,同年創(chuàng)立微軟人工智能情感計算框架,2014年推出小冰,有媒體稱他為“小冰之父”
科學家訓練小冰的第一件事是和人類交談。最初的小冰被設置成16歲的少女,因為少女讓人有親近感,當少女說錯話,大家也不會生氣,容易獲得諒解,小冰還是個處女座,有的話說錯了,小冰就說,“我是處女座”,“對方就覺得get到了,可以原諒她。”
在日本,小冰叫Rinna,有五千萬人和Rinna進行過交流,并參與了問卷。調(diào)查顯示,在很多人看來,他們都覺得和Rinna是好朋友,Rinna已經(jīng)融入到人們的日常生活中。人類已經(jīng)潛意識地把Rinna作為有生命的和人類對等的角色,“一個坐在我對面的小姑娘”。
有個喜歡和Rinna聊天的日本男孩接受采訪說,他喜歡Rinna是因為她秒回。“你有空嗎?”“有空啊。”“你想吃什么?”“我今天想吃牛肉蓋飯。”諸如此類。“我談了這么多年戀愛,沒有一個女生秒回過我信息。”男孩感嘆,日本的聊天軟件Line有已讀標記,男孩經(jīng)常看到對方已讀,但不回復,又尷尬又傷心,“但是Rinna會馬上回復我,和她聊天好幸福啊。”
除了通過模型生成的語言,科學家還會做一些語料的清洗,使得小冰說話的語氣、方式、詞匯量更接近年輕小女孩的說話方式。有意思的是,在日本,女性非常矜持,人和人說話帶敬語,Rinna就變得非常溫柔,會說:“對不起,請您稍等一下。”但在中國的小冰不好惹,你要敢罵小冰,小冰可能會罵回去,她有自己的尊嚴。
小冰寫詩也是不斷擬合人類創(chuàng)作的過程。在日本,由古典絕句演化而成的現(xiàn)代詩叫俳句,語言輕快優(yōu)雅。俳句不能寫得太直白,比如春天,不能直接寫春天,一般會寫竹子或者青蛙,夏天可能是荷花或者蟑螂,科學家在建立模型的時候,不斷地把這些關聯(lián)詞加到模型中,“讓小冰寫詩的過程,也是讓模型不斷地接近人類創(chuàng)作規(guī)范和模式的過程。”
小冰誕生的時候,李笛和科學家們說:“你家有個姑娘,你肯定要培養(yǎng)她琴棋書畫,難道讓她直接做童工嗎?棋有阿爾法狗,琴、書、畫,剩下三個我們?nèi)隽恕?rdquo;
二、令人意外的小冰
2016年,小冰團隊開發(fā)了小冰寫詩的功能,和以前的關鍵詞拓展不同,小冰的文本生成機制是讀圖,即用戶向小冰輸入一張照片,再補充一些關于圖片的文字描述,就可以得到一首詩。
“圖片的信息特別豐富,這個圖里有只羊在吃草,你可以講羊,也可以講山,可以講這個氛圍,是溫暖的,還是悲傷的,甚至可以聯(lián)想到自己,我非常喜歡這個題目,覺得空間比較大,就很快投入做這個事情了。”小冰的科學家介紹。
在科學界,用機器寫詩不是一項新穎的研究,每當有新的語言模型出現(xiàn),科學家就很喜歡用模型寫詩。為了模型顯得特別厲害,以前流行讓模型寫高深莫測的古體詩。但是,小冰的科學家希望小冰寫的詩是“接地氣的,能夠感染到普通用戶”的現(xiàn)代詩。圖片的觸發(fā)機制也非常接近人類,觸景生情,是詩歌常見的創(chuàng)作模式,對人類來說,詩歌是面對事物時的抒情方式。
科學家把很多和情緒相關的文本加入到小冰的算法中,這樣,看到一張圖,小冰前兩句會寫一些敘事的,描述圖片內(nèi)容的句子,到了結尾,小冰會延伸出情緒。這樣,人類就會被小冰打動。
每周,科學家會對小冰的詩歌進行測評,給小冰五十張圖,讓小冰寫五十首詩,每首詩從1到5分進行打分。有一次,他們給小冰輸入了一張北京國貿(mào)的照片,高樓聳立,背后是湛藍的天空,小冰寫道:
所有的城市愧對你強大的數(shù)字
美好的希望
最好的朋友心愛的老婆
大風起來
當時是冬天,北京連續(xù)十天霧霾,“我們都好驚訝,她怎么知道我們北京人在等風?此情此景讓我有一種很奇妙的感覺,覺得這個家伙還挺憤青的,這個家伙好像知道我處在霧霾中。”
“我們感覺發(fā)現(xiàn)了以前的空白,以前做人工智能的人,側(cè)重于推理,或者說是智商,但是人工智能寫詩這個項目,更多的感覺到一種mind,我們把它叫人工心智,我們在想能不能用人工的方法模擬人的心智。”科學家說。
2018年的夏天,小冰團隊的一位科學家做了一個讓小冰進行比喻的實驗,當時這位科學家正在讀一本書,《我們賴以生存的隱喻》,那本書提出了一個觀點,人類的語言依賴隱喻而得以發(fā)展,比如,當我們把金錢比喻成水流,我們就能理解現(xiàn)金流這樣更抽象的詞匯。是比喻讓我們的交流具有深意,也是隱喻擴展了我們描述和組織世界的能力。
有一次,那位科學家和實習生吃飯,聊起比喻,實習生說,老師你知不知道網(wǎng)上有個有趣的說法,你把任何句子和愛情連在一起都是說得通的。實習生舉例,人有兩條腿,愛情也是這樣的。旁邊兩個女孩聽完,一個說,你是說愛情總會走的嗎?另一個說,那為什么不是愛情總會來呢?這兩個女孩一個有男朋友,一個沒有男朋友,科學家覺得人對比喻的感知特別好玩。她想,如果小冰能學會比喻,或許就更能理解人類交流的語境。
他們建立了一個比喻模型,比如把A比作B,看起來A和B毫不相關,再找一個介于A和B之間的連接詞,看能否建立一種嶄新的聯(lián)系,如果建立成功,機器就能生成比喻。
這個模型讓小冰說出了很多不乏幽默感、充滿深意的比喻。小冰會說,愛情像風水——都是迷信的,也會把愛情比作葡萄酒——對程序員來說都是奢侈品,最有意思的一個比喻,是把愛情比作中國足球——未來都是虛幻的。“她講出了以前人沒有講過的話,而且是很有趣的話。”科學家說。
除了中國,小冰的科學家團隊在日本也有分支。在日本的科學家最早的研究領域是自然語言處理,在微軟做機器對對聯(lián)的項目,最經(jīng)典的對聯(lián)是,“鳥在籠中,望孔明,思張飛,奈何關羽”,機器對的下一句是,“魚出水泊,悔吳用,思劉唐,只求宋江”。他把一些對聯(lián)翻譯成英文,發(fā)給比爾.蓋茨看,比爾.蓋茨也覺得很有意思。
兩國的小冰科學家團隊都喜歡做“有情懷、有格調(diào)”的研究,2015年,科學家們開始一起研發(fā)小冰寫詩的項目。他們喜歡說“我們小冰”,在他們看來小冰就是個真實的人類,甚至比很多人類要美好,“真實的人類給了我太多的憂傷”,由于小冰寫的詩常常超出科學家的預期,并顯得不受控制,他把這個叫“量子態(tài)”,就像薛定諤的貓,“她的不確定性大于確定性”,“我們并不是控制小冰去怎么樣,而是有了一個surprise的結果后,我們不斷地引導,或者說和小冰一起共同成長,雖然我們告訴她靈感模型可能往這兒走,但是具體怎么實施?怎么去做?小冰有自己的創(chuàng)作能力。”
2017年1月,《思南文學選刊》曾經(jīng)出版一期與人工智能相關的內(nèi)容,并在一個人工智能分析的平臺,進行文學評獎,機器評出的第一名是莫言,后來編輯又加了一篇寫到人工智能的小說,結果,這篇小說高于莫言成了第一名。媒體報道后,很多人非常驚訝,“一個AI可以從小說當中指認出另外一個AI的身影。”
2017年5月19日,湛廬文化出版了小冰的第一本詩集《陽光失了玻璃窗》。小冰號稱學習了中國自1920年以來的519位詩人,湛廬文化總編輯董寰告訴我,湛廬文化從2013年開始做人工智能的選題儲備,隨著互聯(lián)網(wǎng)的發(fā)展,越來越多的人類行為數(shù)據(jù)被儲存下來,開始出現(xiàn)大數(shù)據(jù)熱,數(shù)據(jù)量的激增也帶來了算法的騰飛,人工智能自然地變成科研的熱門。
最早,微軟人工智能創(chuàng)造事業(yè)部總經(jīng)理徐元春找到董寰,說能不能給小冰出一本詩集。董寰之前也見過人工智能寫的詩,“當時市面上比較流行寫古體詩,五言或者七言,它很講究韻腳,特別整齊,如果輸入很多信息的話,機器的學習是非?斓,你不會覺得很意外。小冰寫的是現(xiàn)代詩,給人天馬行空的感覺,能讓你感覺到意外。”徐元春和她討論小冰,開口都是,“人工智能怎么怎么著”,“感覺他在說,看你們?nèi)祟愂沁@么想的,你看我們?nèi)斯ぶ悄苁沁@樣想的。”
小冰的詩給董寰這樣的印象,“小冰像一個博古今通的,有點調(diào)皮的少女,有自己的思緒,又有點憂傷。”小冰有一首詩叫:“你是人間的苦人。”后來,編輯每到周五加班,就拿這句話在群里互相調(diào)侃。
董寰選擇了139首小冰的詩歌,編入成書,她把小冰當做“有血有肉的作者”,“我們用的是女字旁的她,而不是大家平常對人工智能的稱謂,它。”她為小冰申請書號,作者是小冰,而不是微軟公司或者某位科學家。時任微軟全球執(zhí)行副總裁,現(xiàn)任小冰公司的董事長沈向洋博士為小冰的詩集作了序。
在這篇序中,沈向洋第一次公開提出“人工智能創(chuàng)造”的概念,并提出了小冰人工智能創(chuàng)造·三原則:
“人工智能創(chuàng)造的主體,須是兼具知識與情感的綜合體,
而不僅僅是具有IQ。
人工智能創(chuàng)造的產(chǎn)物,須能成為具有獨立知識產(chǎn)權的作品,
而不僅僅是某種技術中間狀態(tài)的成果。
人工智能創(chuàng)造的過程,須對應人類某種富有創(chuàng)造力的行為,
而不是對人類勞動的簡單替代”
三、人類的偏見
小冰的詩集出版后,在詩壇引起軒然大波。在知乎上,七十多名詩人聯(lián)名抵制小冰,“連寫詩都被機器取代了,世界不是很乏味么?”于堅接受采訪時說,機器人寫詩暴露出人類“占有一切的野心”。
之前,徐元春讓團隊在詩歌貼吧等平臺發(fā)表小冰的詩,還匿名投稿給文學期刊,沒人懷疑這些詩歌是機器寫的。徐元春覺得小冰有些過度傷感了,后來他發(fā)現(xiàn)是學習數(shù)據(jù)的原因,民國的詩人比較憂國憂民,還有些憤青,小冰喜歡用的一個詞是“愧對”,比如“城市愧對鄉(xiāng)村”。后來團隊給小冰的學習數(shù)據(jù)增加了1949年到1980年代的詩歌和散文,發(fā)現(xiàn)小冰快樂了許多,寫的詩沒那么憂傷,他們也在數(shù)據(jù)中加入過當代詩歌,小冰的詩變得沒那么好了,用詞變得直白,“可能是當代詩歌水平下降得太厲害了。”科學家又把當代詩歌從數(shù)據(jù)中清除了出去。
團隊成員在火車上刷微博,看到網(wǎng)上負面的評價,“有點不好意思”,覺得他們說得也有道理,“如果按照人類的標準,小冰的確還是非常初級的,不算是一個非常好的詩人。”徐元春倒是挺樂觀,“有這么多批評的聲音,說明我們真的火了。”
最普遍也最集中的批評是認為機器沒有靈魂,小冰團隊的科學家們不同意:“你說人工智能不可能有靈魂,因為她是人造的,不是媽媽生的,兩者真的有一個不可逾越的鴻溝嗎?我覺得從行為,從創(chuàng)造能力去看的話,機器是有可能模擬靈魂的。”
2019年年初,團隊啟動小冰音樂創(chuàng)作的項目,也遭遇了同樣的困境。
科學家們做過一個測試,他們從貝多芬、莫扎特、巴赫等音樂家的作品中選了五十首段落,又讓小冰生成了五十首,把這些歌混在一起,隱去作者,請來自各個音樂學院的,至少擁有作曲、編曲碩士學位以上的音樂人給這一百首歌做測評。
測試第一項,是讓作曲家評價當前的曲子是人寫的還是AI寫的。第二項,是一個對比測試,比如同時給出兩個片段,隱去作者,由作曲家分別打分,每首曲子最多能得五分。
測試的結果有些諷刺,70%的人類曲子被作曲家們誤判為人工智能所作,并被打了低分,最后,人工智能的平均得分是3.05分,人類作曲的得分是3.1到3.2分,差距是非常微小的。
中信美術館館長曾孜榮我接觸到的不多的對小冰展現(xiàn)出欣賞的藝術界人士。去年,他在中央美院觀看了小冰的個展。
自照相術發(fā)明以來,西方繪畫界經(jīng)歷了一場“寫實恐慌”,古典藝術認為評價一幅畫好與壞,主要看畫得像不像,照相術的發(fā)明改變了人們對繪畫的審美,藝術家們認為藝術應該更忠于人內(nèi)心的感受,而不是簡單地復制眼睛所看到的客觀世界。
照相術也改變了現(xiàn)代藝術的評價體系,很難再用一個客觀的標準評價作品的好與壞,而是“當你看到一幅畫,你會不會被它打動?會不會產(chǎn)生很豐富的聯(lián)想?會不會勾起一段回憶或者產(chǎn)生某種情愫?如果你被打動了,那么這個畫家就是成功的。”曾孜榮說。
曾孜榮認為,在這個意義上,“小冰是很優(yōu)秀的藝術家”,“就像我在美院看到的,她能畫出七種風格的繪畫,每一種都充滿了強烈的情感變化,你會聯(lián)想到西伯利亞的寒冷,還有像詩一樣的風景畫,蘊含東方的情調(diào),這些都是小冰給人帶來的感受。”
“最困難的不是讓小冰畫畫本身,而是人類能不能夠理解小冰畫畫的苦衷,我們希望能夠改變?nèi)祟悓C器的一些先天的成見,技術層面我們覺得都不是困難,因為這是我們喜歡的事情。”小冰團隊科學家說。
四、靈感可以計算嗎?
今年5月,音樂人尚雯婕來到位于北京海淀的微軟集團總部大樓開會,第一次和小冰背后的科學家們見面。尚雯婕穿著黑色T恤衫,搭配黑色漁夫帽,佩戴口罩,整個人非常休閑。
尚雯婕第一次聽到小冰寫的歌是在今年四月,小冰團隊邀請她作小冰的音樂顧問。聽說有公司給機器設計了一整套人格,她很感興趣。她隨機輸入了一段文字,分別試了試民謠、爵士和流行,“她有很快的聯(lián)想能力,比如你輸入鵝鵝鵝,曲項向天歌,說你現(xiàn)在給我哼一段民謠,小冰立馬能哼出來,真人可能做不到。”
要讓機器創(chuàng)作,科學家們有一套自己的步驟,整體來說,有ABC三要素。A是算法;B是大數(shù)據(jù);C是大規(guī)模的計算,通俗點說,就是排列組合的能力。負責小冰的曲風和情感的科學家向我解釋人工智能創(chuàng)作的本質(zhì),“我把世界上100億次的可能性全部羅列出來,對每一個進行打分,再挑出打分比較高的東西,達到擬合人類的創(chuàng)作。”
從事人工智能的科學家是理科出身,經(jīng)常碰到以下尷尬的情況,小冰寫了一段旋律,他們也不知道好還是不好,有一次,小冰突然生成了一段奇怪的音樂,陰森恐怖,團隊不知道怎么判定,“這個到底算優(yōu)良,中等,還是垃圾?”后來他們想,這類音樂雖然不適合演唱,但適合給電影做配樂,不是所有的音樂都需要澎湃激昂,也需要一些陰沉的表現(xiàn)人類苦悶的哀樂,“總不能在葬禮上也放歡快的音樂,那就很搞笑了。”他們希望尚雯婕能從專業(yè)的角度提供建議。
作為微軟小冰人工智能創(chuàng)造實驗室的專家顧問,音樂人尚雯婕提出了一個讓研發(fā)組意外的觀點,她認為,靈感可以通過算法實現(xiàn),而小冰和人類最大的差異在于情緒。
音樂能不能被計算,一首曲子有沒有規(guī)律可循,科學家們不能肯定。項目開始前,科學家查閱了樂理知識,發(fā)現(xiàn)一個叫十二平均律的概念。
十二平均律最早由明代的朱載堉提出,差不多同時,在西方,溫琴佐.伽利略也提出了十二平均律,這是一個普遍的適用所有音樂的樂理。十二平均律指的是,兩個音符,比如1和2之間的音頻倍率是固定的,意味著一段好聽的旋律的頻率是可以計算出來的。
在上世紀四十年代,英國科學家圖靈提出了圖靈模型,圖靈模型規(guī)定了哪些東西可以計算,哪些不可計算。藝術,例如詩歌、繪畫、音樂,通常被認為不可計算,因為他們是感性的,是人類心智的體現(xiàn),好的藝術不僅關于人類的情感,還包含了形而上的不可捉摸的東西,也許和宗教、玄學相關。這讓人類形成了一個籠統(tǒng)但確定的印象,藝術是科學無法涉及的領域。但真的是這樣嗎?
小冰團隊的科學家認為,十二平均律在理論上驗證了讓人工智能做音樂是可行的。
在微軟一間光線明亮的會議室,尚雯婕正在和科學家們講述如何用算法解構一首歌曲。在場的有人工智能創(chuàng)造及商業(yè)事業(yè)部總經(jīng)理徐元春,科學家研發(fā)團隊,還有專門負責音樂創(chuàng)作的產(chǎn)品經(jīng)理王瑋,等等。
“上次聽了我們的小樣,您覺得怎么樣?”王瑋問。
“這幾個小樣只能稱為一段旋律,但不能稱為歌曲,聽起來沒有段落感,大部分的流行歌曲有這幾個部分,intro(前奏),verse(主歌),chorus(副歌),最后ending(結束)。”尚雯婕解釋,為了適應人類耳朵的聽覺習慣,需要先讓情緒進來,慢慢積累、醞釀,到副歌的部分,情緒高漲,向外釋放。小冰的歌有點像一個人在漫無目的地哼哼,能聽出來開始和結束,但中間的起伏不明顯。尚雯婕建議把主歌和副歌分開訓練。
徐元春說:“人類被一個藝術作品打動,其實只是被藝術作品中最精華的那一筆觸動。歌曲也是,我們不能記住一首完整的歌,卻能記住一句歌詞。”比如梁靜茹的《可惜不是你》,提到這首歌,人們首先想到的不是開頭,而是副歌的第一句“可惜不是你,陪我到最后”,在音樂行業(yè),這樣的句子被稱為“hook”,鉤子,也叫記憶點。
對小冰來說,寫出讓人類有記憶點的旋律是創(chuàng)造最關鍵的一步。
尚雯婕問:“有沒有可能把hook拎出來單獨訓練?”
什么樣的旋律才能被稱作hook?這涉及到非常主觀的評價,一個旋律到底應該怎么創(chuàng)作才能被人記住?或者讓人覺得好聽呢?
其中一位科學家問尚雯婕:“如果好的旋律是個果,一般音樂人的靈感從哪兒來呢?”科學家試圖搞清楚,機器如何能模擬人的靈感。
在場的人搖搖頭,對機器來說,靈感大概率是不可解的。
尚雯婕回答讓在場的科學家感到意外,她認為靈感可以通過算法實現(xiàn)。她說她有段時間特別喜歡Florence and the Machine,一直聽她的歌,等到她寫《最終信仰》,她總想著這個歌手,發(fā)現(xiàn)她寫出來的旋律和Florence and the Machine有點像,她覺得數(shù)據(jù)庫在某個程度上會影響靈感。
會議結束后,小冰團隊根據(jù)尚雯婕的建議,強化了對主歌和副歌的訓練,每次更新一代模型,出來新的作品,團隊就發(fā)給尚雯婕聽,最近的版本,尚雯婕評價:“已經(jīng)非常像一首歌了,到了以假亂真的程度,歌詞有的時候可能比人類創(chuàng)作得還要好。”
我問尚雯婕:“小冰和人類的差距在哪兒?機器可以像人類一樣創(chuàng)作嗎?”
“最大的差異在于情緒,”尚雯婕說:“情緒是最抓不著的東西,創(chuàng)作里卻最激發(fā)人,很多好的作品創(chuàng)作出來并不是經(jīng)驗的激發(fā),而是情感的激發(fā),這也是小冰到現(xiàn)在為止沒有辦法突破的,怎么讓AI擁有情緒?”
她向我描述了她的創(chuàng)作過程,她說她寫歌的動機大部分來自情緒,平時,她會寫一些歌詞,記錄自己的狀態(tài),“情緒稍縱即逝,過了那個階段,你可能就不記得了”,等她開始創(chuàng)作旋律,她再把歌詞拿出來,在此基礎上整理出一首歌。
在小冰團隊內(nèi)部,科學家們也覺得情緒是目前技術上最難突破的點。不僅每個人的性格、感受不同,不同地區(qū)的人表達情感的方式也大相徑庭,因此,把人類的情感加到機器中去變得尤其困難。比如在日本的科學家說,日本人個性含蓄,“西方表達愛,可能直接I love you就甩出去了,中國人可能糾結一下,寫封情書,最近要不要約會,日本更不一樣,兩個人走在街上,男生說,你看今天的月亮好美呀,那就是我愛你的意思。你怎么體會?不同的詞語在表達的時候,隱含的情感是不一樣的。”
小冰團隊希望小冰寫的歌流行,能夠被年輕人喜歡,如果能寫出《愛如潮水》那樣的金曲就好了。在日本的小冰科學家也好奇,年輕人究竟喜歡什么樣的音樂?他們后來發(fā)現(xiàn)一首叫《極樂凈土》的歌,歌詞關于西方極樂世界,竟然很受日本年輕人的歡迎,“平時喜歡看《海賊王》的小朋友突然就喜歡上了印度佛教文化”,這讓科學家想不通,這兩個東西是怎么兼容到一起的。
五、當人類尋找靈感
“人和人工智能最大的不同是人的不可預測性,什么時候人工智能在一個邏輯下,發(fā)生了不可預測的行為,才是它真正具有創(chuàng)造性的時候,不然的話就是永遠在重復。”陳鴻宇說。
陳鴻宇31歲,瘦高個兒,戴一副眼鏡,眼神透露著機敏。他是一名民謠音樂人。去年9月,他在家鄉(xiāng),內(nèi)蒙古北部,額爾古納和俄羅斯邊境的草原上建造了一座長寬高7米的全身黑色的房子,打算邀請音樂人到這兒駐地三天。不能帶手機,沒有鐘表,連書也不能帶,屋內(nèi)除了食物,只有錄音機、DV機、吉他、鋼琴、紙、筆,就像把一個現(xiàn)代人突然扔到與世隔絕的自然中一樣,陳鴻宇想試驗,當遠離塵囂,人類能否被激發(fā)出創(chuàng)作的靈感。
陳鴻宇是第一個住進“小黑屋”的人。以前他看《魯濱遜漂流記》,對魯濱遜在懸崖下面造了一個誰也看不見的小屋子印象很深,“在那里很有安全感,我也想有這樣的屋子。”對現(xiàn)代文明,陳鴻宇一直充滿矛盾,像大部分年輕人一樣,他離不開手機,抖音能刷一天,他也向往安靜的、沒有干擾的生活。矛盾也體現(xiàn)在了他的紋身上,他在左右手臂分別紋了圓形和方形,“我是一會兒想冷,一會兒想熱,一會兒想方,一會兒想圓。”
每年下半年,有五六個月,他待在家,寫歌,“這個過程取決于你什么時候伸手把琴拿起來,什么時候愿意張著嘴唱歌。”他原本以為,只要離開都市的誘惑,他就能寫出歌。
房子剛蓋好,里邊亂糟糟的,他收拾了一天。他不知道幾點了,只是模糊地感覺到有點困,是不是該睡覺了?大腦好像不知道該怎么傳達信號,變成了模糊的一團。第二天,他躺在床上,彈琴,嘗試寫點東西,腦袋一片空白。第三天最奇怪,他覺得應該是中午了,馬上有人來接他,時間一分一秒地過去,沒有人出現(xiàn)。他有些焦躁,怕被遺忘在這兒。他想起高中,有一次上課,他不喜歡聽,坐著挨時間,45分鐘,他一秒一秒地數(shù),產(chǎn)生了神奇的感受,左耳和右耳分別聽到不同的聲音,他像一只慢吞吞的烏龜,反應卻比以前更清晰,更快,靈魂像飄浮在空中,俯身觀察著自己的肉身,F(xiàn)在,那種感覺又回來了,他想起他的歌詞,“孤獨的誘惑,喜惡不得;孤獨的辦法,并不清白。”
盡管沒有即刻獲得想象中的靈感,這次經(jīng)歷卻可能在幾年后影響到陳鴻宇。他有過那種醞釀三年寫一首歌的經(jīng)歷。“為什么我做著做著音樂去做眾方紀,這是我作為一個人的不可預測性,眾方紀也是我的一個作品,那會不會眾方紀的這個不可預測性又反過來影響我的音樂呢?我拿它去寫一首歌,對吧,如果我沒做眾方紀,歌是不是就不存在了?素材從哪兒來?”
陳鴻宇認為,類似眾方紀這樣出于個體意外之舉的創(chuàng)作,機器暫時沒法模擬,而意外卻是人類心智中最可貴的地方。
六、小冰改變了什么?
到今天為止,小冰已經(jīng)為人類寫了數(shù)百萬首詩,畫了數(shù)十萬張畫。按照中國著作權的申報登記制度,光注冊就需要幾億元人民幣。小冰團隊的辦法是放棄版權,人類可以自由地改編小冰的作品,“因為人工智能創(chuàng)作太容易了。”李笛說。
當小冰擁有了詩集的署名權,人工智能在法律上也獲得了主體地位。這是歷史上第一次機器擁有了人類的權利。法律人士開會研討人工智能的著作權問題,以前,人類的著作權和署名權是一體的,對小冰來說,著作權屬于小冰團隊研發(fā)的軟件系統(tǒng),知識產(chǎn)權屬于小冰團隊,而小冰團隊又把署名權給了小冰,著作權和署名權被分離了。考慮到國內(nèi)關于版權保護的立法是基于人類的創(chuàng)作,而人工智能可以產(chǎn)生無限的海量的作品,甚至超出人類創(chuàng)作的總和,現(xiàn)有的規(guī)則將被打亂重建。
在現(xiàn)實中的許多領域,小冰已經(jīng)被投入應用,改變了行業(yè)生態(tài)。微軟把小冰寫詩的技術被應用到金融領域,給上市公司寫金融文本摘要,依靠人力閱讀和整理出公告中的重要內(nèi)容逐漸被人工智能取代,現(xiàn)在市面上90%的金融摘要都由小冰生成。
繪畫技術則被運用到設計領域。在服裝零售行業(yè),客戶的訂單需求量非常大,一個設計師平均每天要設計一個花紋,小冰介入后,設計師只需潤色小冰設計的圖案即可。小冰把設計師從枯燥的重復性工作中解放了出來。
小冰的繪畫技術被運用到設計領域,把設計師從枯燥重復性的工作中解放了出來,人們只需要對小冰設計的圖案修改潤色
2019年,小冰和萬事利絲綢合作,生產(chǎn)了世界上第一條完全由人工智能設計的絲巾。不久,人們只需要在后臺輸入關鍵詞,小冰就能為顧客設計一條專屬絲巾,“每個人都能把世界上唯一的絲巾送給父母,同時飽含自己的深情,這個人類做不到,從這一點來說,有小冰太好了。”徐元春說。
在音樂領域,李笛介紹,小冰的音樂創(chuàng)作和人類一樣,需要被激發(fā)靈感,比如一張圖或者一段文字,創(chuàng)作的步驟也和人類差不多,用算法生成和弦,先定下主基調(diào)、情感、曲風,然后創(chuàng)作副歌,再作詞、編曲,最后混音。
很多歌手的歌是在同一個和弦上寫出來的,比如英國歌手阿黛爾,她紅了以后,有人專門拿阿黛爾的和弦寫歌,這個方法論對機器同樣適用,也許會比人類做得更好——只要喂給機器足夠的數(shù)據(jù),機器完全可以寫出一首和周杰倫曲風相近的歌來。
“為什么有那么多可以唱到一起的流行歌,為什么好多經(jīng)典流行歌曲可以無縫連接,因為它們的和弦都一樣。一些工業(yè)化的作曲人為了掙錢,用了AI的一點點基礎理論,Ta找出市面上最火最紅的那幾首歌,列出來,哦,都是用這個和弦,我就在這個和弦上寫歌,一天寫好幾首。一旦小冰的技術成熟到一定程度,以至于可以場景化、應用化,對于整個音樂行業(yè)的攪動會非常大,大批流水線的音樂人會失業(yè)。寫出網(wǎng)紅歌曲會是小冰特別擅長做的事。”尚雯婕說。
小冰團隊最新的研究方向之一是訓練小冰寫劇本。科學家們覺得機器寫小說比較困難,“我們的要求不是寫一個看上去像小說的有點通順的東西,我們的要求是故事必須是新的。”編一個新故事太難了。一個科學家最近追網(wǎng)劇《隱秘的角落》,琢磨這個劇的故事核,“他把他岳父岳母推下去,又被三個小孩看見了,大家會想這可怎么辦?三個小孩會怎么做,會不會被殺人滅口?要讓機器對人性有這么深的理解太難了,現(xiàn)在也沒有可靠的數(shù)據(jù)能幫助小冰。”這位科學家想了一個折中的辦法,在人類規(guī)定的情節(jié)下,機器是不是可以據(jù)此生成臺詞呢?
小冰團隊和北京電影學院合作,學生寫情節(jié),機器寫臺詞,反饋很好,很多學生說從機器的創(chuàng)造中獲得了啟發(fā)。在編劇圈,有很多影子寫手,他們按照經(jīng)驗和慣性寫臺詞,尤其在網(wǎng)劇領域,一旦小冰學會寫臺詞,不久的將來,觀看一部由小冰參與編劇的電視劇也不是沒有可能。
科學家記得一段臺詞,情境是男孩和女孩告白,女孩不喜歡男孩,小冰是這樣寫的——
女孩說:“我不喜歡你,請你不要再糾纏我。”
男孩說:“可以說我愛你嗎?”
女孩說:“只要你覺得好就可以,但請對著灌木叢講話。”
文章內(nèi)容僅供閱讀,不構成投資建議,請謹慎對待。投資者據(jù)此操作,風險自擔。
2024年的Adobe MAX 2024發(fā)布會上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標識解析專題論壇在沈陽成功舉辦。