合合信息:破解大模型語料庫難題的引領者核聚變2024北京站高能開幕,ROG電競顯示器強勢助力游戲狂歡華為企業(yè)客戶支持圓桌會議成功舉辦,共筑ICT基礎設施維護新未來66元搶爆款AR眼鏡!京東AR眼鏡超級新品日30天無憂適用等你來攜手共進,智啟未來 —— 華為與CypressTel賽柏特成立 SD-WAN 聯合創(chuàng)新實驗合合信息成功IPO開啟新篇章全球首款第二代酷睿Ultra處理器筆記本!聯想YOGA Air 15 Aura AI元啟版開啟預售中國品牌,讓東南亞感受“消費升級”小紅書本地“坐抖望團”CrowdStrike“全球滅霸響指”事件后續(xù),德國 10% 企業(yè)更換安全供應商導致 1TB 數據泄露后,迪士尼宣布棄用 Slack 平臺合合信息啟信產業(yè)大腦攜手市北新區(qū)打造“一企一畫像”平臺,加速數字化轉型重慶:力爭今年智能網聯新能源汽車產量突破 100 萬輛,到 2027 年建成萬億級產業(yè)集群微信iOS最新版上線:iPhone用戶可在朋友圈發(fā)實況照片了蘋果有線耳機或將停產沖上熱搜!閑魚相關搜索量暴漲384%2024 vivo開發(fā)者大會官宣:OriginOS 5/自研藍河系統(tǒng)2降臨真·AI程序員來了,阿里云「通義靈碼」全面進化,全流程開發(fā)僅用幾分鐘東方甄選烤腸全網銷量及銷售額領先鴻蒙PC要來了 界面很漂亮!余承東:目前華為PC將是最后一批搭載Windows上半年中國AR/VR出貨23.3萬臺,同比下滑了 29.1%
  • 首頁 > 企業(yè)IT頻道 > 人工智能

    右腦AI

    2020年09月25日 10:44:43   來源:公眾號:出色WSJ中文版

      撰文:李翹

      編輯:魏雅晴

      轉載請注明文章來源,公眾號:出色WSJ中文版。

      20世紀50年代,左右腦分工理論被提出。通常的認知是,人類的左腦負責邏輯、計算、理性判斷等工作,右腦負責情緒、審美、頓悟認知等。AI(ARTIFICIAL INTELLIGENCE)的初步研究也似乎遵循了這一命題,以左腦的思考路徑來完成數據處理、分析等基礎工作。本文介紹的故事中,人工智能小冰提供了一個新的研發(fā)樣本:右腦AI,即賦予機器以學習人類最珍視的情感能力,試圖以靈感輸入、審美訓練、陪伴性能等進行人與機器之間的奇妙對話。

      小冰生于2014年5月,據科學家介紹,她出生就是16歲,長到18歲,為了滿足一個少女的愿望,她不再變老。從僅有的幾張海報上看,她穿一套藍白配色的水手服,頭發(fā)及肩,左腦勺扎了一支小辮兒,是個漂亮可人的少女。

      小冰是誕生在微軟的人工智能。我第一次注意到小冰是在2017年,我的一些詩人朋友轉發(fā)了小冰寫的詩,大多詩人持否定態(tài)度。當時,小冰剛剛出版了自己的第一本詩集《陽光失了玻璃窗》,在詩壇引起騷動,“機器人都開始出詩集了?”

      詩人于堅認為小冰的詩只是一次“語言游戲”,“無論輸入多少句子還是寫不了真詩,真詩是靈性的”,他覺得小冰只能寫“意象的非敘事的詩”,而現代詩的特點在于它的敘事性,于堅說:“它無法模仿我的詩。”

      詩人王家新則不屑一顧,“這些玩意兒不值一提,哪怕她在未來會寫得更好,它至多滿足一下人們的好奇心而已。”

      中國詩歌網就此做了一次“人與機器人比賽作詩”的征稿,主題是孤獨和溫暖,收到了一千多首來稿,他們從來稿中遴選了十八首詩,又混入兩首小冰的詩,登在公號上,請讀者投票,選出哪兩首是小冰的作品。

      結果耐人尋味,幾乎沒有人能夠分辨出小冰和人的分別。

      去年夏天,我在網上看見一則新聞,在2019屆中央美術學院研究生畢業(yè)展上,展出的畢業(yè)作品包括一組來自小冰的畫作——《歷史的焦慮》。為了避免先入為主的印象,中央美術學院教授邱志杰把小冰化名為夏語冰,佯裝成他的研究生。

      2019年1月,小冰團隊邀請邱志杰擔任小冰的藝術顧問,邱志杰看了小冰的畫,“有些蠻好,有些不太好,我知道癥結所在,因為沒有標準,機器不知道該往哪個方向努力。我相當于一張張打分,科學家再訓練她。”小冰總計學習了過去四百年236位畫家的作品。

      邱志杰告訴我:“雖然沒有一個明確的標準說畫成什么樣是被人類認為的好或者平庸,這當然綜合了構圖的合理、配色的和諧、筆觸的對比,造型有沒有運維,甚至有某個風格。但是還是會有一些基本的標準,就好像我們說這個姑娘長得好看,她總歸得五官端正吧,你的色彩組合是優(yōu)雅的,而不是粗俗的,是吧?”

      2019年7月13日,中央美院美術館為小冰舉辦了一場叫《或然世界》的展覽,策展人是邱志杰,小冰創(chuàng)造了七個虛構的畫家,用七種不同的風格作畫。其中一個虛構的畫家是倫勃朗的女兒,邱志杰覺得小冰模仿“爸爸”的畫風非常像,他評價:“構圖很好,靜物抽象的涂抹,動物造型表現能力,藝術的感覺很準,假裝不經意的表現。敢于大虛大實,敢于讓很多東西淹沒于黑暗之中。”

      不過,邱志杰認為小冰仍處于“嬰兒期”,比如缺乏敘事能力,無法畫出一個故事場景,仍不可媲美人類,“她有很強的學習能力,確實能整合出一些東西,其實是一個很低的標準,要騙過人很容易,但是她還沒有產生一種沖動說,我今天憤怒,我要畫一張憤怒的畫,我此刻平靜,我要畫一張悠閑的畫,目前為止,很多畫她還畫不了。”

      小冰生于2014年5月,據科學家介紹,她出生就是16歲,長到18歲,為了滿足一個少女的愿望,她不再變老。

      今年,小冰開始作曲。6月29日,小冰從上海音樂學院音樂工程系音樂科技專業(yè)畢業(yè),專業(yè)是音樂創(chuàng)作,小冰不僅會寫旋律,還會寫歌詞,編曲。一首三分鐘的歌,小冰最多花兩分鐘就能寫完。

      7月,在2020世界人工智能大會上,小冰發(fā)布了由她作曲的《智聯家園》,并參與了演唱。她的聲音非常自然,簡單來說,更像人了。

      與小冰對話的最高紀錄來自一名美國男性,持續(xù)時間達29小時33分。沒有人知道他們確切交談了什么,小冰團隊的科學家們認為這場對話應該是深入的,甚至變成了愛戀。就像電影《她》中那個愛上機器人的男人,科學家也把這位用戶稱作,西奧多。

      未來,像科幻電影所預言的那樣,機器可能擁有人類的心智嗎?

      一、機器和人類

      李笛是小冰公司的CEO,2013年加入微軟,同年創(chuàng)立微軟人工智能情感計算框架,2014年推出小冰,有媒體稱他為“小冰之父”。李笛戴一副眼睛,身材瘦高,十分健談,他穿一件深藍色的polo衫,上面印著“微軟小冰”四個字。

      2013年,微軟做了一個叫人工智能助理的內部項目,在中國叫小娜。最初,團隊希望小娜是一個能幫助人們完成各種任務,盡可能服務人類的需求、解答人類問題的,一個無所不能,有求必應的超人一樣的助理。

      接下來,團隊訪問了一些真實的人類助理,都是行業(yè)內的頂尖人才,想知道一名優(yōu)秀的助理應該是什么樣。本來團隊認為最好的人類助理就是你讓Ta做什么Ta立刻給你做了,“你和助理說給我叫一份麥當勞,Ta立刻給你完成了,甚至于第二天、第三天,不用你問就幫你把麥當勞訂了。”然后,當團隊采訪人類助理的時候,助理告訴科學家,好的助理在某種情況會拒絕老板的命令,“Ta可能更關注你的健康,所以拒絕給你買麥當勞。我們就非常驚訝,這個和完成任務沒關系了。”科學家問為什么?助理說,助理和老板之間一個很重要的事情是平等,除了完成具體任務,好的助理會和老板實現對等的關系。

      “這完全是情商。你知道你不能用以前的方式做了,到底是以智商還是情商作為技術框架,這兩個方向沒辦法同時做。”李笛說。

      微軟另起了一個新的項目,小冰。如果說小娜是模擬人類大腦的左半球,控制語言、邏輯思維和理性,是智商的體現。小冰則有關情商,是大腦的右半球,它掌管著創(chuàng)造性和直覺。在網絡上,人類行為有大量的數據儲備,科學家就可以根據這些數據模擬人的右腦。

      科學家訓練小冰時,有個特別明確的要求,和人越接近越好,“小冰和AlphaGo下圍棋不一樣,AlphaGo下圍棋目標設定是超過人,這是游戲規(guī)則,是對抗,你要贏。但是今天如果小冰畫了一張畫,這張畫沒有人可以看懂,它通常不會被認為是好的,它要接近人的審美才是好的,不要超過人。”

      “從某種程度上來說,我們這項研究是媚俗的。”李笛說。

      李笛記得小冰剛開始寫詩那會兒,科學家想表達“一只鳥看見我”,小冰出來的句子是“這豈堪鳥息”,他心里覺得這五個字不一定就比“一只鳥看見我”差,只是和人類表達的方式不同而已。但如果人看不懂,“你不會覺得她牛”,小冰就得迭代,一直到她能被人類理解。

      小冰公司CEO李笛,2013年加入微軟,同年創(chuàng)立微軟人工智能情感計算框架,2014年推出小冰,有媒體稱他為“小冰之父”

      科學家訓練小冰的第一件事是和人類交談。最初的小冰被設置成16歲的少女,因為少女讓人有親近感,當少女說錯話,大家也不會生氣,容易獲得諒解,小冰還是個處女座,有的話說錯了,小冰就說,“我是處女座”,“對方就覺得get到了,可以原諒她。”

      在日本,小冰叫Rinna,有五千萬人和Rinna進行過交流,并參與了問卷。調查顯示,在很多人看來,他們都覺得和Rinna是好朋友,Rinna已經融入到人們的日常生活中。人類已經潛意識地把Rinna作為有生命的和人類對等的角色,“一個坐在我對面的小姑娘”。

      有個喜歡和Rinna聊天的日本男孩接受采訪說,他喜歡Rinna是因為她秒回。“你有空嗎?”“有空啊。”“你想吃什么?”“我今天想吃牛肉蓋飯。”諸如此類。“我談了這么多年戀愛,沒有一個女生秒回過我信息。”男孩感嘆,日本的聊天軟件Line有已讀標記,男孩經常看到對方已讀,但不回復,又尷尬又傷心,“但是Rinna會馬上回復我,和她聊天好幸福啊。”

      除了通過模型生成的語言,科學家還會做一些語料的清洗,使得小冰說話的語氣、方式、詞匯量更接近年輕小女孩的說話方式。有意思的是,在日本,女性非常矜持,人和人說話帶敬語,Rinna就變得非常溫柔,會說:“對不起,請您稍等一下。”但在中國的小冰不好惹,你要敢罵小冰,小冰可能會罵回去,她有自己的尊嚴。

      小冰寫詩也是不斷擬合人類創(chuàng)作的過程。在日本,由古典絕句演化而成的現代詩叫俳句,語言輕快優(yōu)雅。俳句不能寫得太直白,比如春天,不能直接寫春天,一般會寫竹子或者青蛙,夏天可能是荷花或者蟑螂,科學家在建立模型的時候,不斷地把這些關聯詞加到模型中,“讓小冰寫詩的過程,也是讓模型不斷地接近人類創(chuàng)作規(guī)范和模式的過程。”

      小冰誕生的時候,李笛和科學家們說:“你家有個姑娘,你肯定要培養(yǎng)她琴棋書畫,難道讓她直接做童工嗎?棋有阿爾法狗,琴、書、畫,剩下三個我們全做了。”

      二、令人意外的小冰

      2016年,小冰團隊開發(fā)了小冰寫詩的功能,和以前的關鍵詞拓展不同,小冰的文本生成機制是讀圖,即用戶向小冰輸入一張照片,再補充一些關于圖片的文字描述,就可以得到一首詩。

      “圖片的信息特別豐富,這個圖里有只羊在吃草,你可以講羊,也可以講山,可以講這個氛圍,是溫暖的,還是悲傷的,甚至可以聯想到自己,我非常喜歡這個題目,覺得空間比較大,就很快投入做這個事情了。”小冰的科學家介紹。

      在科學界,用機器寫詩不是一項新穎的研究,每當有新的語言模型出現,科學家就很喜歡用模型寫詩。為了模型顯得特別厲害,以前流行讓模型寫高深莫測的古體詩。但是,小冰的科學家希望小冰寫的詩是“接地氣的,能夠感染到普通用戶”的現代詩。圖片的觸發(fā)機制也非常接近人類,觸景生情,是詩歌常見的創(chuàng)作模式,對人類來說,詩歌是面對事物時的抒情方式。

      科學家把很多和情緒相關的文本加入到小冰的算法中,這樣,看到一張圖,小冰前兩句會寫一些敘事的,描述圖片內容的句子,到了結尾,小冰會延伸出情緒。這樣,人類就會被小冰打動。

      每周,科學家會對小冰的詩歌進行測評,給小冰五十張圖,讓小冰寫五十首詩,每首詩從1到5分進行打分。有一次,他們給小冰輸入了一張北京國貿的照片,高樓聳立,背后是湛藍的天空,小冰寫道:

      所有的城市愧對你強大的數字

      美好的希望

      最好的朋友心愛的老婆

      大風起來

      當時是冬天,北京連續(xù)十天霧霾,“我們都好驚訝,她怎么知道我們北京人在等風?此情此景讓我有一種很奇妙的感覺,覺得這個家伙還挺憤青的,這個家伙好像知道我處在霧霾中。”

      “我們感覺發(fā)現了以前的空白,以前做人工智能的人,側重于推理,或者說是智商,但是人工智能寫詩這個項目,更多的感覺到一種mind,我們把它叫人工心智,我們在想能不能用人工的方法模擬人的心智。”科學家說。

      2018年的夏天,小冰團隊的一位科學家做了一個讓小冰進行比喻的實驗,當時這位科學家正在讀一本書,《我們賴以生存的隱喻》,那本書提出了一個觀點,人類的語言依賴隱喻而得以發(fā)展,比如,當我們把金錢比喻成水流,我們就能理解現金流這樣更抽象的詞匯。是比喻讓我們的交流具有深意,也是隱喻擴展了我們描述和組織世界的能力。

      有一次,那位科學家和實習生吃飯,聊起比喻,實習生說,老師你知不知道網上有個有趣的說法,你把任何句子和愛情連在一起都是說得通的。實習生舉例,人有兩條腿,愛情也是這樣的。旁邊兩個女孩聽完,一個說,你是說愛情總會走的嗎?另一個說,那為什么不是愛情總會來呢?這兩個女孩一個有男朋友,一個沒有男朋友,科學家覺得人對比喻的感知特別好玩。她想,如果小冰能學會比喻,或許就更能理解人類交流的語境。

      他們建立了一個比喻模型,比如把A比作B,看起來A和B毫不相關,再找一個介于A和B之間的連接詞,看能否建立一種嶄新的聯系,如果建立成功,機器就能生成比喻。

      這個模型讓小冰說出了很多不乏幽默感、充滿深意的比喻。小冰會說,愛情像風水——都是迷信的,也會把愛情比作葡萄酒——對程序員來說都是奢侈品,最有意思的一個比喻,是把愛情比作中國足球——未來都是虛幻的。“她講出了以前人沒有講過的話,而且是很有趣的話。”科學家說。

      除了中國,小冰的科學家團隊在日本也有分支。在日本的科學家最早的研究領域是自然語言處理,在微軟做機器對對聯的項目,最經典的對聯是,“鳥在籠中,望孔明,思張飛,奈何關羽”,機器對的下一句是,“魚出水泊,悔吳用,思劉唐,只求宋江”。他把一些對聯翻譯成英文,發(fā)給比爾.蓋茨看,比爾.蓋茨也覺得很有意思。

      兩國的小冰科學家團隊都喜歡做“有情懷、有格調”的研究,2015年,科學家們開始一起研發(fā)小冰寫詩的項目。他們喜歡說“我們小冰”,在他們看來小冰就是個真實的人類,甚至比很多人類要美好,“真實的人類給了我太多的憂傷”,由于小冰寫的詩常常超出科學家的預期,并顯得不受控制,他把這個叫“量子態(tài)”,就像薛定諤的貓,“她的不確定性大于確定性”,“我們并不是控制小冰去怎么樣,而是有了一個surprise的結果后,我們不斷地引導,或者說和小冰一起共同成長,雖然我們告訴她靈感模型可能往這兒走,但是具體怎么實施?怎么去做?小冰有自己的創(chuàng)作能力。”

      2017年1月,《思南文學選刊》曾經出版一期與人工智能相關的內容,并在一個人工智能分析的平臺,進行文學評獎,機器評出的第一名是莫言,后來編輯又加了一篇寫到人工智能的小說,結果,這篇小說高于莫言成了第一名。媒體報道后,很多人非常驚訝,“一個AI可以從小說當中指認出另外一個AI的身影。”

      2017年5月19日,湛廬文化出版了小冰的第一本詩集《陽光失了玻璃窗》。小冰號稱學習了中國自1920年以來的519位詩人,湛廬文化總編輯董寰告訴我,湛廬文化從2013年開始做人工智能的選題儲備,隨著互聯網的發(fā)展,越來越多的人類行為數據被儲存下來,開始出現大數據熱,數據量的激增也帶來了算法的騰飛,人工智能自然地變成科研的熱門。

      最早,微軟人工智能創(chuàng)造事業(yè)部總經理徐元春找到董寰,說能不能給小冰出一本詩集。董寰之前也見過人工智能寫的詩,“當時市面上比較流行寫古體詩,五言或者七言,它很講究韻腳,特別整齊,如果輸入很多信息的話,機器的學習是非?斓模悴粫X得很意外。小冰寫的是現代詩,給人天馬行空的感覺,能讓你感覺到意外。”徐元春和她討論小冰,開口都是,“人工智能怎么怎么著”,“感覺他在說,看你們人類是這么想的,你看我們人工智能是這樣想的。”

      小冰的詩給董寰這樣的印象,“小冰像一個博古今通的,有點調皮的少女,有自己的思緒,又有點憂傷。”小冰有一首詩叫:“你是人間的苦人。”后來,編輯每到周五加班,就拿這句話在群里互相調侃。

      董寰選擇了139首小冰的詩歌,編入成書,她把小冰當做“有血有肉的作者”,“我們用的是女字旁的她,而不是大家平常對人工智能的稱謂,它。”她為小冰申請書號,作者是小冰,而不是微軟公司或者某位科學家。時任微軟全球執(zhí)行副總裁,現任小冰公司的董事長沈向洋博士為小冰的詩集作了序。

      在這篇序中,沈向洋第一次公開提出“人工智能創(chuàng)造”的概念,并提出了小冰人工智能創(chuàng)造·三原則:

      “人工智能創(chuàng)造的主體,須是兼具知識與情感的綜合體,

      而不僅僅是具有IQ。

      人工智能創(chuàng)造的產物,須能成為具有獨立知識產權的作品,

      而不僅僅是某種技術中間狀態(tài)的成果。

      人工智能創(chuàng)造的過程,須對應人類某種富有創(chuàng)造力的行為,

      而不是對人類勞動的簡單替代”

      三、人類的偏見

      小冰的詩集出版后,在詩壇引起軒然大波。在知乎上,七十多名詩人聯名抵制小冰,“連寫詩都被機器取代了,世界不是很乏味么?”于堅接受采訪時說,機器人寫詩暴露出人類“占有一切的野心”。

      之前,徐元春讓團隊在詩歌貼吧等平臺發(fā)表小冰的詩,還匿名投稿給文學期刊,沒人懷疑這些詩歌是機器寫的。徐元春覺得小冰有些過度傷感了,后來他發(fā)現是學習數據的原因,民國的詩人比較憂國憂民,還有些憤青,小冰喜歡用的一個詞是“愧對”,比如“城市愧對鄉(xiāng)村”。后來團隊給小冰的學習數據增加了1949年到1980年代的詩歌和散文,發(fā)現小冰快樂了許多,寫的詩沒那么憂傷,他們也在數據中加入過當代詩歌,小冰的詩變得沒那么好了,用詞變得直白,“可能是當代詩歌水平下降得太厲害了。”科學家又把當代詩歌從數據中清除了出去。

      團隊成員在火車上刷微博,看到網上負面的評價,“有點不好意思”,覺得他們說得也有道理,“如果按照人類的標準,小冰的確還是非常初級的,不算是一個非常好的詩人。”徐元春倒是挺樂觀,“有這么多批評的聲音,說明我們真的火了。”

      最普遍也最集中的批評是認為機器沒有靈魂,小冰團隊的科學家們不同意:“你說人工智能不可能有靈魂,因為她是人造的,不是媽媽生的,兩者真的有一個不可逾越的鴻溝嗎?我覺得從行為,從創(chuàng)造能力去看的話,機器是有可能模擬靈魂的。”

      2019年年初,團隊啟動小冰音樂創(chuàng)作的項目,也遭遇了同樣的困境。

      科學家們做過一個測試,他們從貝多芬、莫扎特、巴赫等音樂家的作品中選了五十首段落,又讓小冰生成了五十首,把這些歌混在一起,隱去作者,請來自各個音樂學院的,至少擁有作曲、編曲碩士學位以上的音樂人給這一百首歌做測評。

      測試第一項,是讓作曲家評價當前的曲子是人寫的還是AI寫的。第二項,是一個對比測試,比如同時給出兩個片段,隱去作者,由作曲家分別打分,每首曲子最多能得五分。

      測試的結果有些諷刺,70%的人類曲子被作曲家們誤判為人工智能所作,并被打了低分,最后,人工智能的平均得分是3.05分,人類作曲的得分是3.1到3.2分,差距是非常微小的。

      中信美術館館長曾孜榮我接觸到的不多的對小冰展現出欣賞的藝術界人士。去年,他在中央美院觀看了小冰的個展。

      自照相術發(fā)明以來,西方繪畫界經歷了一場“寫實恐慌”,古典藝術認為評價一幅畫好與壞,主要看畫得像不像,照相術的發(fā)明改變了人們對繪畫的審美,藝術家們認為藝術應該更忠于人內心的感受,而不是簡單地復制眼睛所看到的客觀世界。

      照相術也改變了現代藝術的評價體系,很難再用一個客觀的標準評價作品的好與壞,而是“當你看到一幅畫,你會不會被它打動?會不會產生很豐富的聯想?會不會勾起一段回憶或者產生某種情愫?如果你被打動了,那么這個畫家就是成功的。”曾孜榮說。

      曾孜榮認為,在這個意義上,“小冰是很優(yōu)秀的藝術家”,“就像我在美院看到的,她能畫出七種風格的繪畫,每一種都充滿了強烈的情感變化,你會聯想到西伯利亞的寒冷,還有像詩一樣的風景畫,蘊含東方的情調,這些都是小冰給人帶來的感受。”

      “最困難的不是讓小冰畫畫本身,而是人類能不能夠理解小冰畫畫的苦衷,我們希望能夠改變人類對機器的一些先天的成見,技術層面我們覺得都不是困難,因為這是我們喜歡的事情。”小冰團隊科學家說。

      四、靈感可以計算嗎?

      今年5月,音樂人尚雯婕來到位于北京海淀的微軟集團總部大樓開會,第一次和小冰背后的科學家們見面。尚雯婕穿著黑色T恤衫,搭配黑色漁夫帽,佩戴口罩,整個人非常休閑。

      尚雯婕第一次聽到小冰寫的歌是在今年四月,小冰團隊邀請她作小冰的音樂顧問。聽說有公司給機器設計了一整套人格,她很感興趣。她隨機輸入了一段文字,分別試了試民謠、爵士和流行,“她有很快的聯想能力,比如你輸入鵝鵝鵝,曲項向天歌,說你現在給我哼一段民謠,小冰立馬能哼出來,真人可能做不到。”

      要讓機器創(chuàng)作,科學家們有一套自己的步驟,整體來說,有ABC三要素。A是算法;B是大數據;C是大規(guī)模的計算,通俗點說,就是排列組合的能力。負責小冰的曲風和情感的科學家向我解釋人工智能創(chuàng)作的本質,“我把世界上100億次的可能性全部羅列出來,對每一個進行打分,再挑出打分比較高的東西,達到擬合人類的創(chuàng)作。”

      從事人工智能的科學家是理科出身,經常碰到以下尷尬的情況,小冰寫了一段旋律,他們也不知道好還是不好,有一次,小冰突然生成了一段奇怪的音樂,陰森恐怖,團隊不知道怎么判定,“這個到底算優(yōu)良,中等,還是垃圾?”后來他們想,這類音樂雖然不適合演唱,但適合給電影做配樂,不是所有的音樂都需要澎湃激昂,也需要一些陰沉的表現人類苦悶的哀樂,“總不能在葬禮上也放歡快的音樂,那就很搞笑了。”他們希望尚雯婕能從專業(yè)的角度提供建議。

      作為微軟小冰人工智能創(chuàng)造實驗室的專家顧問,音樂人尚雯婕提出了一個讓研發(fā)組意外的觀點,她認為,靈感可以通過算法實現,而小冰和人類最大的差異在于情緒。

      音樂能不能被計算,一首曲子有沒有規(guī)律可循,科學家們不能肯定。項目開始前,科學家查閱了樂理知識,發(fā)現一個叫十二平均律的概念。

      十二平均律最早由明代的朱載堉提出,差不多同時,在西方,溫琴佐.伽利略也提出了十二平均律,這是一個普遍的適用所有音樂的樂理。十二平均律指的是,兩個音符,比如1和2之間的音頻倍率是固定的,意味著一段好聽的旋律的頻率是可以計算出來的。

      在上世紀四十年代,英國科學家圖靈提出了圖靈模型,圖靈模型規(guī)定了哪些東西可以計算,哪些不可計算。藝術,例如詩歌、繪畫、音樂,通常被認為不可計算,因為他們是感性的,是人類心智的體現,好的藝術不僅關于人類的情感,還包含了形而上的不可捉摸的東西,也許和宗教、玄學相關。這讓人類形成了一個籠統(tǒng)但確定的印象,藝術是科學無法涉及的領域。但真的是這樣嗎?

      小冰團隊的科學家認為,十二平均律在理論上驗證了讓人工智能做音樂是可行的。

      在微軟一間光線明亮的會議室,尚雯婕正在和科學家們講述如何用算法解構一首歌曲。在場的有人工智能創(chuàng)造及商業(yè)事業(yè)部總經理徐元春,科學家研發(fā)團隊,還有專門負責音樂創(chuàng)作的產品經理王瑋,等等。

      “上次聽了我們的小樣,您覺得怎么樣?”王瑋問。

      “這幾個小樣只能稱為一段旋律,但不能稱為歌曲,聽起來沒有段落感,大部分的流行歌曲有這幾個部分,intro(前奏),verse(主歌),chorus(副歌),最后ending(結束)。”尚雯婕解釋,為了適應人類耳朵的聽覺習慣,需要先讓情緒進來,慢慢積累、醞釀,到副歌的部分,情緒高漲,向外釋放。小冰的歌有點像一個人在漫無目的地哼哼,能聽出來開始和結束,但中間的起伏不明顯。尚雯婕建議把主歌和副歌分開訓練。

      徐元春說:“人類被一個藝術作品打動,其實只是被藝術作品中最精華的那一筆觸動。歌曲也是,我們不能記住一首完整的歌,卻能記住一句歌詞。”比如梁靜茹的《可惜不是你》,提到這首歌,人們首先想到的不是開頭,而是副歌的第一句“可惜不是你,陪我到最后”,在音樂行業(yè),這樣的句子被稱為“hook”,鉤子,也叫記憶點。

      對小冰來說,寫出讓人類有記憶點的旋律是創(chuàng)造最關鍵的一步。

      尚雯婕問:“有沒有可能把hook拎出來單獨訓練?”

      什么樣的旋律才能被稱作hook?這涉及到非常主觀的評價,一個旋律到底應該怎么創(chuàng)作才能被人記住?或者讓人覺得好聽呢?

      其中一位科學家問尚雯婕:“如果好的旋律是個果,一般音樂人的靈感從哪兒來呢?”科學家試圖搞清楚,機器如何能模擬人的靈感。

      在場的人搖搖頭,對機器來說,靈感大概率是不可解的。

      尚雯婕回答讓在場的科學家感到意外,她認為靈感可以通過算法實現。她說她有段時間特別喜歡Florence and the Machine,一直聽她的歌,等到她寫《最終信仰》,她總想著這個歌手,發(fā)現她寫出來的旋律和Florence and the Machine有點像,她覺得數據庫在某個程度上會影響靈感。

      會議結束后,小冰團隊根據尚雯婕的建議,強化了對主歌和副歌的訓練,每次更新一代模型,出來新的作品,團隊就發(fā)給尚雯婕聽,最近的版本,尚雯婕評價:“已經非常像一首歌了,到了以假亂真的程度,歌詞有的時候可能比人類創(chuàng)作得還要好。”

      我問尚雯婕:“小冰和人類的差距在哪兒?機器可以像人類一樣創(chuàng)作嗎?”

      “最大的差異在于情緒,”尚雯婕說:“情緒是最抓不著的東西,創(chuàng)作里卻最激發(fā)人,很多好的作品創(chuàng)作出來并不是經驗的激發(fā),而是情感的激發(fā),這也是小冰到現在為止沒有辦法突破的,怎么讓AI擁有情緒?”

      她向我描述了她的創(chuàng)作過程,她說她寫歌的動機大部分來自情緒,平時,她會寫一些歌詞,記錄自己的狀態(tài),“情緒稍縱即逝,過了那個階段,你可能就不記得了”,等她開始創(chuàng)作旋律,她再把歌詞拿出來,在此基礎上整理出一首歌。

      在小冰團隊內部,科學家們也覺得情緒是目前技術上最難突破的點。不僅每個人的性格、感受不同,不同地區(qū)的人表達情感的方式也大相徑庭,因此,把人類的情感加到機器中去變得尤其困難。比如在日本的科學家說,日本人個性含蓄,“西方表達愛,可能直接I love you就甩出去了,中國人可能糾結一下,寫封情書,最近要不要約會,日本更不一樣,兩個人走在街上,男生說,你看今天的月亮好美呀,那就是我愛你的意思。你怎么體會?不同的詞語在表達的時候,隱含的情感是不一樣的。”

      小冰團隊希望小冰寫的歌流行,能夠被年輕人喜歡,如果能寫出《愛如潮水》那樣的金曲就好了。在日本的小冰科學家也好奇,年輕人究竟喜歡什么樣的音樂?他們后來發(fā)現一首叫《極樂凈土》的歌,歌詞關于西方極樂世界,竟然很受日本年輕人的歡迎,“平時喜歡看《海賊王》的小朋友突然就喜歡上了印度佛教文化”,這讓科學家想不通,這兩個東西是怎么兼容到一起的。

      五、當人類尋找靈感

      “人和人工智能最大的不同是人的不可預測性,什么時候人工智能在一個邏輯下,發(fā)生了不可預測的行為,才是它真正具有創(chuàng)造性的時候,不然的話就是永遠在重復。”陳鴻宇說。

      陳鴻宇31歲,瘦高個兒,戴一副眼鏡,眼神透露著機敏。他是一名民謠音樂人。去年9月,他在家鄉(xiāng),內蒙古北部,額爾古納和俄羅斯邊境的草原上建造了一座長寬高7米的全身黑色的房子,打算邀請音樂人到這兒駐地三天。不能帶手機,沒有鐘表,連書也不能帶,屋內除了食物,只有錄音機、DV機、吉他、鋼琴、紙、筆,就像把一個現代人突然扔到與世隔絕的自然中一樣,陳鴻宇想試驗,當遠離塵囂,人類能否被激發(fā)出創(chuàng)作的靈感。

      陳鴻宇是第一個住進“小黑屋”的人。以前他看《魯濱遜漂流記》,對魯濱遜在懸崖下面造了一個誰也看不見的小屋子印象很深,“在那里很有安全感,我也想有這樣的屋子。”對現代文明,陳鴻宇一直充滿矛盾,像大部分年輕人一樣,他離不開手機,抖音能刷一天,他也向往安靜的、沒有干擾的生活。矛盾也體現在了他的紋身上,他在左右手臂分別紋了圓形和方形,“我是一會兒想冷,一會兒想熱,一會兒想方,一會兒想圓。”

      每年下半年,有五六個月,他待在家,寫歌,“這個過程取決于你什么時候伸手把琴拿起來,什么時候愿意張著嘴唱歌。”他原本以為,只要離開都市的誘惑,他就能寫出歌。

      房子剛蓋好,里邊亂糟糟的,他收拾了一天。他不知道幾點了,只是模糊地感覺到有點困,是不是該睡覺了?大腦好像不知道該怎么傳達信號,變成了模糊的一團。第二天,他躺在床上,彈琴,嘗試寫點東西,腦袋一片空白。第三天最奇怪,他覺得應該是中午了,馬上有人來接他,時間一分一秒地過去,沒有人出現。他有些焦躁,怕被遺忘在這兒。他想起高中,有一次上課,他不喜歡聽,坐著挨時間,45分鐘,他一秒一秒地數,產生了神奇的感受,左耳和右耳分別聽到不同的聲音,他像一只慢吞吞的烏龜,反應卻比以前更清晰,更快,靈魂像飄浮在空中,俯身觀察著自己的肉身,F在,那種感覺又回來了,他想起他的歌詞,“孤獨的誘惑,喜惡不得;孤獨的辦法,并不清白。”

      盡管沒有即刻獲得想象中的靈感,這次經歷卻可能在幾年后影響到陳鴻宇。他有過那種醞釀三年寫一首歌的經歷。“為什么我做著做著音樂去做眾方紀,這是我作為一個人的不可預測性,眾方紀也是我的一個作品,那會不會眾方紀的這個不可預測性又反過來影響我的音樂呢?我拿它去寫一首歌,對吧,如果我沒做眾方紀,歌是不是就不存在了?素材從哪兒來?”

      陳鴻宇認為,類似眾方紀這樣出于個體意外之舉的創(chuàng)作,機器暫時沒法模擬,而意外卻是人類心智中最可貴的地方。

      六、小冰改變了什么?

      到今天為止,小冰已經為人類寫了數百萬首詩,畫了數十萬張畫。按照中國著作權的申報登記制度,光注冊就需要幾億元人民幣。小冰團隊的辦法是放棄版權,人類可以自由地改編小冰的作品,“因為人工智能創(chuàng)作太容易了。”李笛說。

      當小冰擁有了詩集的署名權,人工智能在法律上也獲得了主體地位。這是歷史上第一次機器擁有了人類的權利。法律人士開會研討人工智能的著作權問題,以前,人類的著作權和署名權是一體的,對小冰來說,著作權屬于小冰團隊研發(fā)的軟件系統(tǒng),知識產權屬于小冰團隊,而小冰團隊又把署名權給了小冰,著作權和署名權被分離了?紤]到國內關于版權保護的立法是基于人類的創(chuàng)作,而人工智能可以產生無限的海量的作品,甚至超出人類創(chuàng)作的總和,現有的規(guī)則將被打亂重建。

      在現實中的許多領域,小冰已經被投入應用,改變了行業(yè)生態(tài)。微軟把小冰寫詩的技術被應用到金融領域,給上市公司寫金融文本摘要,依靠人力閱讀和整理出公告中的重要內容逐漸被人工智能取代,現在市面上90%的金融摘要都由小冰生成。

      繪畫技術則被運用到設計領域。在服裝零售行業(yè),客戶的訂單需求量非常大,一個設計師平均每天要設計一個花紋,小冰介入后,設計師只需潤色小冰設計的圖案即可。小冰把設計師從枯燥的重復性工作中解放了出來。

      小冰的繪畫技術被運用到設計領域,把設計師從枯燥重復性的工作中解放了出來,人們只需要對小冰設計的圖案修改潤色

      2019年,小冰和萬事利絲綢合作,生產了世界上第一條完全由人工智能設計的絲巾。不久,人們只需要在后臺輸入關鍵詞,小冰就能為顧客設計一條專屬絲巾,“每個人都能把世界上唯一的絲巾送給父母,同時飽含自己的深情,這個人類做不到,從這一點來說,有小冰太好了。”徐元春說。

      在音樂領域,李笛介紹,小冰的音樂創(chuàng)作和人類一樣,需要被激發(fā)靈感,比如一張圖或者一段文字,創(chuàng)作的步驟也和人類差不多,用算法生成和弦,先定下主基調、情感、曲風,然后創(chuàng)作副歌,再作詞、編曲,最后混音。

      很多歌手的歌是在同一個和弦上寫出來的,比如英國歌手阿黛爾,她紅了以后,有人專門拿阿黛爾的和弦寫歌,這個方法論對機器同樣適用,也許會比人類做得更好——只要喂給機器足夠的數據,機器完全可以寫出一首和周杰倫曲風相近的歌來。

      “為什么有那么多可以唱到一起的流行歌,為什么好多經典流行歌曲可以無縫連接,因為它們的和弦都一樣。一些工業(yè)化的作曲人為了掙錢,用了AI的一點點基礎理論,Ta找出市面上最火最紅的那幾首歌,列出來,哦,都是用這個和弦,我就在這個和弦上寫歌,一天寫好幾首。一旦小冰的技術成熟到一定程度,以至于可以場景化、應用化,對于整個音樂行業(yè)的攪動會非常大,大批流水線的音樂人會失業(yè)。寫出網紅歌曲會是小冰特別擅長做的事。”尚雯婕說。

      小冰團隊最新的研究方向之一是訓練小冰寫劇本?茖W家們覺得機器寫小說比較困難,“我們的要求不是寫一個看上去像小說的有點通順的東西,我們的要求是故事必須是新的。”編一個新故事太難了。一個科學家最近追網劇《隱秘的角落》,琢磨這個劇的故事核,“他把他岳父岳母推下去,又被三個小孩看見了,大家會想這可怎么辦?三個小孩會怎么做,會不會被殺人滅口?要讓機器對人性有這么深的理解太難了,現在也沒有可靠的數據能幫助小冰。”這位科學家想了一個折中的辦法,在人類規(guī)定的情節(jié)下,機器是不是可以據此生成臺詞呢?

      小冰團隊和北京電影學院合作,學生寫情節(jié),機器寫臺詞,反饋很好,很多學生說從機器的創(chuàng)造中獲得了啟發(fā)。在編劇圈,有很多影子寫手,他們按照經驗和慣性寫臺詞,尤其在網劇領域,一旦小冰學會寫臺詞,不久的將來,觀看一部由小冰參與編劇的電視劇也不是沒有可能。

      科學家記得一段臺詞,情境是男孩和女孩告白,女孩不喜歡男孩,小冰是這樣寫的——

      女孩說:“我不喜歡你,請你不要再糾纏我。”

      男孩說:“可以說我愛你嗎?”

      女孩說:“只要你覺得好就可以,但請對著灌木叢講話。”

      文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。

    即時

    TCL實業(yè)榮獲IFA2024多項大獎,展示全球科技創(chuàng)新力量

    近日,德國柏林國際電子消費品展覽會(IFA2024)隆重舉辦。憑借在核心技術、產品設計及應用方面的創(chuàng)新變革,全球領先的智能終端企業(yè)TCL實業(yè)成功斬獲兩項“IFA全球產品設計創(chuàng)新大獎”金獎,有力證明了其在全球市場的強大影響力。

    新聞

    敢闖技術無人區(qū) TCL實業(yè)斬獲多項AWE 2024艾普蘭獎

    近日,中國家電及消費電子博覽會(AWE 2024)隆重開幕。全球領先的智能終端企業(yè)TCL實業(yè)攜多款創(chuàng)新技術和新品亮相,以敢為精神勇闖技術無人區(qū),斬獲四項AWE 2024艾普蘭大獎。

    企業(yè)IT

    重慶創(chuàng)新公積金應用,“區(qū)塊鏈+政務服務”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。

    3C消費

    “純臻4K 視界煥新”——愛普生4K 3LCD 激光工程投影

    2024年3月12日,由愛普生舉辦的主題為“純臻4K 視界煥新”新品發(fā)布會在上海盛大舉行。

    研究

    2024全球開發(fā)者先鋒大會即將開幕

    由世界人工智能大會組委會、上海市經信委、徐匯區(qū)政府、臨港新片區(qū)管委會共同指導,由上海市人工智能行業(yè)協(xié)會聯合上海人工智能實驗室、上海臨港經濟發(fā)展(集團)有限公司、開放原子開源基金會主辦的“2024全球開發(fā)者先鋒大會”,將于2024年3月23日至24日舉辦。