數(shù)據(jù)時(shí)代,數(shù)據(jù)比人類更了解人類,而信息數(shù)據(jù)又反過來影響我們?nèi)祟悾驗(yàn)閭鞑ブ械男畔⒂绊懼祟悓?duì)事物的認(rèn)知和決策。大量的傳播數(shù)據(jù)通過重新聚類關(guān)聯(lián),再經(jīng)過一些分析方法,就可以得出很多未知或者已知而過去無法驗(yàn)證的結(jié)果。
比如,早在2008年的時(shí)候,Google推出一款預(yù)測(cè)流感的產(chǎn)品,他們認(rèn)為,某些搜索詞有助于了解流感的情況,而這些搜索數(shù)據(jù)可以近乎實(shí)地的對(duì)流感情況做出預(yù)測(cè)。
而這樣的產(chǎn)品,正是應(yīng)用了關(guān)鍵詞之間的傳播關(guān)聯(lián)關(guān)系。其實(shí)除了搜索詞,同樣在網(wǎng)絡(luò)中傳播的信息也一樣可以通過信息顆;,做更多的研判預(yù)測(cè)以及洞察到更多未知信息。
最近整理了一些科技網(wǎng)站上的新聞信息,通過技術(shù)切詞和我們的研判模型做了個(gè)小實(shí)驗(yàn)。
實(shí)驗(yàn)要解決的問題是,究竟哪家公司更能成為人工智能的公司。在數(shù)據(jù)分析結(jié)果出來之前,以我個(gè)人淺薄的互聯(lián)網(wǎng)認(rèn)知,預(yù)感Google未來會(huì)是一家人工智能的公司。然而結(jié)果卻出乎我的意料,甚至是與預(yù)料大相徑庭,我們一起來看下這個(gè)實(shí)驗(yàn)過程:
【數(shù)據(jù)治理方法】
我們將整理的所有新聞信息中含有人工智能相關(guān)詞的信息標(biāo)注出“人工智能”標(biāo)簽,同時(shí)將每條信息中包含的科技公司主體提取出來。當(dāng)然這中間要涉及外文詞匯的翻譯和整理,同時(shí)提取與專利、新品、機(jī)器人等相關(guān)的信息,做另一個(gè)結(jié)論分析用。最后幾組數(shù)據(jù)交叉比對(duì)。可以得出很多結(jié)果。
【分析過程及結(jié)果】
1,提出問題,在眾多的科技公司中,誰會(huì)成為人工智能的公司?將所有信息中含有人工智能標(biāo)簽的數(shù)據(jù)做提取并統(tǒng)計(jì)。
2,得出上述問題的結(jié)論需要兩個(gè)條件,新聞報(bào)道中含有人工智能及這家公司。當(dāng)然人工智能判定詞與主體的距離也要計(jì)算,以便確保數(shù)據(jù)的精準(zhǔn)。
3,開始數(shù)據(jù)可視化,我們將統(tǒng)計(jì)的數(shù)據(jù)結(jié)果,按照信息量做排序。則所有含有人工智能標(biāo)簽的信息中,人工智能判定詞與主體詞(科技公司主體)同時(shí)出現(xiàn)的數(shù)據(jù)做排序。
4,得出結(jié)果:我們按照這兩組數(shù)據(jù)同時(shí)出現(xiàn)的信息量做主體量的排序。得出結(jié)論如下:
下表中,與含有人工智能同頻出現(xiàn)最多的科技公司有:華為、微軟、騰訊、蘋果、小米、特斯拉、谷歌……這個(gè)結(jié)果跟我起初預(yù)判的結(jié)果還是相差很遠(yuǎn)。(圖1 )
【可以延伸的問題】
用同樣的方法,我們又做了與專利相關(guān)的信息數(shù)據(jù)排行,這個(gè)數(shù)據(jù)可以表明,誰是擁有專利最多,或者更在意專利,或者說與專利更有關(guān)系的科技公司。如圖2所示,在專利相關(guān)信息中,最多的交叉信息是院校合作相關(guān)的信息,另外就是芯片(這里可以更深度的分析芯片與專利之間的細(xì)化數(shù)據(jù),此處不做贅述)
而同時(shí)提及的科技主體有:蘋果、華為、特斯拉、微軟、騰訊、阿里、京東、小米、谷歌……
同理,所有提及機(jī)器人的信息中,則微軟、華為、特斯拉、蘋果、小米、騰訊、京東的信息數(shù)據(jù)會(huì)更多。
以上是我們的實(shí)驗(yàn)室團(tuán)隊(duì)前不久做的一個(gè)小課題,跟同行交流的時(shí)候提起,就想把研究方法跟大家分享一下,希望致力于此的同行朋友可以有所啟發(fā)。
所有數(shù)據(jù)樣本均為近一年來的新聞報(bào)道數(shù)據(jù),數(shù)據(jù)總量大概幾十萬條,覆蓋海內(nèi)外科技媒體30多家。
鑒于數(shù)據(jù)樣本本身不夠還不夠全面,以及翻譯水平、數(shù)據(jù)顆粒細(xì)化算法的粗糙等問題,本文中的結(jié)論數(shù)據(jù)僅供參考。我們主要是想將研究方法與大家共享,為未來科技信息深度洞察提供一些參考。(公子段 勝泰信息合伙人,熵音科技傳播數(shù)據(jù)實(shí)驗(yàn)室首席研究員)
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。
京東11.11采銷直播探廠為消費(fèi)者揭開答案。近日,京東3C數(shù)碼采銷走進(jìn)武漢攀升工廠、合肥聯(lián)想工廠和科大訊飛展廳,通過直播帶貨廠商爆款產(chǎn)品,并為消費(fèi)者帶來超值低價(jià)與福利。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個(gè)月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實(shí)質(zhì)性的幫助,雙十一期間低至2799元,性價(jià)比很高,簡(jiǎn)直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會(huì)——工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析專題論壇在沈陽成功舉辦。