全球首款第二代酷睿Ultra處理器筆記本!聯(lián)想YOGA Air 15 Aura AI元啟版開啟預(yù)售中國品牌,讓東南亞感受“消費(fèi)升級”小紅書本地“坐抖望團(tuán)”CrowdStrike“全球滅霸響指”事件后續(xù),德國 10% 企業(yè)更換安全供應(yīng)商導(dǎo)致 1TB 數(shù)據(jù)泄露后,迪士尼宣布棄用 Slack 平臺合合信息啟信產(chǎn)業(yè)大腦攜手市北新區(qū)打造“一企一畫像”平臺,加速數(shù)字化轉(zhuǎn)型重慶:力爭今年智能網(wǎng)聯(lián)新能源汽車產(chǎn)量突破 100 萬輛,到 2027 年建成萬億級產(chǎn)業(yè)集群微信iOS最新版上線:iPhone用戶可在朋友圈發(fā)實(shí)況照片了蘋果有線耳機(jī)或?qū)⑼.a(chǎn)沖上熱搜!閑魚相關(guān)搜索量暴漲384%2024 vivo開發(fā)者大會官宣:OriginOS 5/自研藍(lán)河系統(tǒng)2降臨真·AI程序員來了,阿里云「通義靈碼」全面進(jìn)化,全流程開發(fā)僅用幾分鐘東方甄選烤腸全網(wǎng)銷量及銷售額領(lǐng)先鴻蒙PC要來了 界面很漂亮!余承東:目前華為PC將是最后一批搭載Windows上半年中國AR/VR出貨23.3萬臺,同比下滑了 29.1%IDC:2024 上半年中國 AR / VR 頭顯出貨 23.3 萬臺,同比下滑 29.1%英特爾AI加速器Gaudi3下周發(fā)布,挑戰(zhàn)NVIDIA統(tǒng)治地位!大屏技術(shù)邂逅千年色彩美學(xué)!海信激光電視成為電影《只此青綠》官方合作伙伴OpenAI將最新AI模型o1擴(kuò)展到企業(yè)和教育領(lǐng)域三星新專利探索AR技術(shù)新應(yīng)用:檢測屏幕指紋殘留,提高手機(jī)安全性猛瑪傳奇C1:直播圖傳技術(shù)的革新者
  • 首頁 > 企業(yè)IT頻道 > 大數(shù)據(jù)

    解鎖暗數(shù)據(jù)潛在業(yè)務(wù)價值的關(guān)鍵方法

    2022年08月19日 10:36:36   來源:企業(yè)網(wǎng)D1Net

      尋求從公司所收集的數(shù)據(jù)中獲得業(yè)務(wù)價值的IT領(lǐng)導(dǎo)者一直面臨著無數(shù)挑戰(zhàn)。也許最難以理解的是失去了對那些被創(chuàng)建的、經(jīng)常存儲的、但很少與之交互的數(shù)據(jù)進(jìn)行利用的機(jī)會。

      這種以物理學(xué)中的暗物質(zhì)命名的所謂“暗數(shù)據(jù)”,是在經(jīng)營流程中例行收集的信息:它是由員工、客戶和業(yè)務(wù)流程所產(chǎn)生的。它可能是由計算機(jī)、應(yīng)用程序和安全系統(tǒng)所生成的日志文件。也可能是出于遵從性的目的而必須保存的文檔,以及永遠(yuǎn)不應(yīng)該保存但仍然保存了的敏感數(shù)據(jù)。

      根據(jù)Gartner的說法,你的企業(yè)信息世界中的大多數(shù)數(shù)據(jù)都是由“暗數(shù)據(jù)”組成的,許多公司甚至都不知道他們擁有多少此類數(shù)據(jù)。存儲數(shù)據(jù)會增加合規(guī)性和網(wǎng)絡(luò)安全風(fēng)險,當(dāng)然,也會增加成本。

      弄清楚你擁有哪些暗數(shù)據(jù)、它們保存在哪里以及其中包含哪些信息是確保這些暗數(shù)據(jù)中有價值的部分是安全的,而不應(yīng)該保存的部分則會被刪除的關(guān)鍵步驟。但是,發(fā)掘這些隱藏數(shù)據(jù)的真正優(yōu)勢可能在于將其用于實(shí)際的業(yè)務(wù)。

      但想要挖掘暗數(shù)據(jù)并非易事。它有各種各樣的格式,可以完全非格式化,例如,可能是被鎖在了掃描文檔或音頻和視頻文件當(dāng)中。

      以下是一些企業(yè)將暗數(shù)據(jù)轉(zhuǎn)化為商業(yè)機(jī)會的方法,以及業(yè)內(nèi)人士對希望利用暗數(shù)據(jù)的IT領(lǐng)導(dǎo)者的一些建議。

      來自賽車手的編碼音頻

      五年來,Envision Racing一直在收集100多場E級方程式賽車的錄音,每場比賽都會有20多名車手參加。

      “廣播流在開放頻率上可供任何人收聽,”Genpact全球分析主管Amaresh Tripathy說。Genpact是一家咨詢公司,正在幫助Envision Racing利用這些數(shù)據(jù)。

      此前,英國賽車隊(duì)的賽車工程師試圖在比賽期間實(shí)時使用這些音頻傳輸,但車手所使用的代號和首字母縮寫詞使其難以被理解和利用,但是,了解其他車手所說的內(nèi)容有助于幫助設(shè)想賽車手的賽車策略,Tripathy說。

      “例如何時使用進(jìn)攻模式。何時進(jìn)行超車。何時該剎車。”他說。

      Envision Racing還從自己的汽車上收集了傳感器數(shù)據(jù),如輪胎、電池和剎車,并從供應(yīng)商處購買了外部數(shù)據(jù),如風(fēng)速和降水量。

      Genpact和Envision Racing合作,解鎖了這些數(shù)據(jù)流的價值,并利用自然語言處理所構(gòu)建的深度學(xué)習(xí)模型對它們進(jìn)行了分析。這個流程花了六個月的時間,從準(zhǔn)備數(shù)據(jù)管道,到接收數(shù)據(jù),到過濾噪音,再到產(chǎn)生有意義的對話。

      Tripathy說,人類需要5到10秒才能弄清楚自己在聽什么,這種延遲使得無線電通信變得無關(guān)緊要了。而現(xiàn)在,由于人工智能模型的預(yù)測和洞察,他們現(xiàn)在可以在一到兩秒鐘內(nèi)就做出反應(yīng)了。

      今年7月,在紐約舉行的ABB國際汽聯(lián)電動方程式世界錦標(biāo)賽上,Envision Racing的車隊(duì)獲得了第一名和第三名,Tripathy將這一結(jié)果歸功于利用了以前的暗數(shù)據(jù)。

      暗數(shù)據(jù)掘金:人工生成的數(shù)據(jù)

      Envision Racing的音頻文件是人類生成暗數(shù)據(jù)的一個例子,它旨在供其他人使用,而不是供機(jī)器使用。數(shù)據(jù)存檔平臺提供商ZL Technologies的聯(lián)合創(chuàng)始人兼首席執(zhí)行官Kon Leong表示,這種暗數(shù)據(jù)對企業(yè)來說是非常有用的。

      “它對于理解企業(yè)人性化方面的每一個要素,包括文化、績效、影響力、專業(yè)知識和參與度,都具有難以置信的強(qiáng)大功能。”他說。“員工每天都在分享絕對海量的數(shù)字信息和知識,但到目前為止,這些信息和知識在很大程度上都尚未得到開發(fā)。”

      電子郵件、消息和文件中所包含的信息都可以幫助企業(yè)獲得洞見,例如企業(yè)中最有影響力的人是誰。“公司80%的時間都花在了溝通上。然而,分析所處理的數(shù)據(jù)往往只反映了我們所花費(fèi)的1%的時間。”

      處理人類生成的非結(jié)構(gòu)化數(shù)據(jù)具有獨(dú)特的挑戰(zhàn)性。例如,數(shù)據(jù)倉庫通常就不是用來處理這些通信的。此外,收集這些通信也可能會給公司帶來新的問題,涉及合規(guī)性、隱私和法律發(fā)現(xiàn)。

      “這些治理能力在今天的數(shù)據(jù)湖概念中并不存在,事實(shí)上,通過將數(shù)據(jù)收集到數(shù)據(jù)湖中,你可能又創(chuàng)造了另一個豎井,增加了隱私和合規(guī)性風(fēng)險。”Leong說。

      相反的,公司也可以將這些數(shù)據(jù)留在當(dāng)前所在的位置,只需添加一層索引和可搜索的元數(shù)據(jù)。保留這些數(shù)據(jù)還將使其保持在現(xiàn)有的合規(guī)性結(jié)構(gòu)之內(nèi),他表示。

      有效治理是關(guān)鍵

      處理價值和來源有問題的暗數(shù)據(jù)的另一種方法是從可追溯性開始。

      《數(shù)據(jù)可觀測性基礎(chǔ)》一書的作者Andy Petrella說:“暗數(shù)據(jù)現(xiàn)在被認(rèn)為是一種可以利用的未開發(fā)資源,這是行業(yè)的一個積極發(fā)展。”該書目前在O'Reilly以預(yù)發(fā)布的形式提供。Petrella還是數(shù)據(jù)可觀測性提供商Kensu的創(chuàng)始人。

      “利用暗數(shù)據(jù)的挑戰(zhàn)在于,人們對它的信心很低。”特別是關(guān)于數(shù)據(jù)收集的地點(diǎn)和方式,他說。“可觀察性可以使數(shù)據(jù)譜系透明,因此是可追溯的?勺匪菪詫(shí)現(xiàn)了數(shù)據(jù)質(zhì)量檢查,從而使得人們對使用這些數(shù)據(jù)來訓(xùn)練AI模型或根據(jù)其帶來的智能來采取行動也充滿了信心。”

      專注于監(jiān)管、風(fēng)險和合規(guī)性問題的全球咨詢公司StoneTurn的董事總經(jīng)理Chuck Soha也認(rèn)為,處理暗數(shù)據(jù)的通用方法——把所有東西都扔進(jìn)數(shù)據(jù)湖里——會帶來巨大的風(fēng)險。

      這在金融服務(wù)行業(yè)尤其如此,該行業(yè)的企業(yè)多年來一直在向數(shù)據(jù)湖發(fā)送數(shù)據(jù),他表示。“在一個典型的企業(yè)中,IT部門會將所有可用數(shù)據(jù)與一些基本元數(shù)據(jù)一起轉(zhuǎn)儲到一個地方,并創(chuàng)建與業(yè)務(wù)團(tuán)隊(duì)共享的流程。”他說。

      這適用于內(nèi)部擁有必要分析人才或?yàn)樘囟ㄓ美刚埩送獠款檰柕臉I(yè)務(wù)團(tuán)隊(duì)。但在大多數(shù)情況下,這些舉措只是取得了部分成功,Soha說。

      “首席信息官們從‘不知道自己不知道’轉(zhuǎn)變?yōu)榱?lsquo;知道自己不知道’,”他說。

      相反,公司應(yīng)該從數(shù)據(jù)治理開始,了解存在什么數(shù)據(jù),它可能會有什么問題,而其中的數(shù)據(jù)質(zhì)量會是首要問題。

      “利益相關(guān)者可以決定是清理和標(biāo)準(zhǔn)化它,還是從更好的信息管理實(shí)踐開始。”Soha說,而致力于從包含不一致或沖突信息的數(shù)據(jù)中提取見解將是一個錯誤。

      Soha還建議將各個業(yè)務(wù)部門已有的良好運(yùn)營數(shù)據(jù)聯(lián)系起來。弄清楚這些關(guān)系可以產(chǎn)生快速而有用的見解,并可能不需要立即查看任何暗數(shù)據(jù),他說。“它還可能識別出可以優(yōu)先考慮的空白,然后在暗數(shù)據(jù)中開始尋找填補(bǔ)這些空白的地方。”

      最后,他說,人工智能在幫助理解剩余的非結(jié)構(gòu)化數(shù)據(jù)方面也非常有用。“通過使用機(jī)器學(xué)習(xí)和AI技術(shù),人類可以只查看1%的暗數(shù)據(jù),并對其相關(guān)性進(jìn)行分類。”他說。“然后,強(qiáng)化學(xué)習(xí)模型就可以快速生成剩余數(shù)據(jù)的相關(guān)度分?jǐn)?shù),進(jìn)而更仔細(xì)的觀察數(shù)據(jù)的優(yōu)先級了。”

      利用AI來提取價值

      用于處理暗數(shù)據(jù)的常見人工智能解決方案包括了亞馬遜的Textract、微軟的Azure Cognitive Services、IBM的Datacap,以及谷歌的Cloud Vision、Document、AutoML和NLP API。

      在Genpact與Envision Racing的合作中,Genpact在內(nèi)部編寫了機(jī)器學(xué)習(xí)算法,Tripathy說。他說,這需要Docker、Kubernetes、Java和Python的知識,以及NLP、深度學(xué)習(xí)和機(jī)器學(xué)習(xí)算法開發(fā),以及需要MLOps架構(gòu)師來管理整個流程。

      不幸的是,這些技能都很難獲得。Splunk去年秋天發(fā)布的一份報告顯示,在接受調(diào)查的1300多名IT和商業(yè)決策者中,只有10%到15%的人表示,他們的企業(yè)正在使用人工智能來解決暗數(shù)據(jù)問題。缺乏必要的技能是利用暗數(shù)據(jù)的主要障礙,僅次于數(shù)據(jù)本身的數(shù)量。

      風(fēng)險與機(jī)遇并存

      與此同時,暗數(shù)據(jù)仍然是一個越來越多的風(fēng)險和機(jī)遇的寶庫。根據(jù)行業(yè)的不同,對企業(yè)數(shù)據(jù)中黑暗部分的估計會從40%到90%不等。

      根據(jù)由Quest贊助的Enterprise Strategy Group 7月份的一份報告,平均而言,有47%的數(shù)據(jù)是暗數(shù)據(jù),而20%的受訪者表示,他們的數(shù)據(jù)中有超過70%是暗數(shù)據(jù)。Splunk的調(diào)查也顯示了類似的結(jié)果,平均55%的企業(yè)數(shù)據(jù)是暗數(shù)據(jù),三分之一的受訪者表示,他們的企業(yè)數(shù)據(jù)中有75%或更多的是暗數(shù)據(jù)。

      在情況好轉(zhuǎn)之前,還可能會變得更糟,因?yàn)?0%的受訪者表示,他們的企業(yè)中有一半以上的數(shù)據(jù)還根本沒有被捕獲,其中的大部分甚至都沒有被理解為是存在的。隨著這些數(shù)據(jù)被逐漸發(fā)現(xiàn)并存儲,暗數(shù)據(jù)的數(shù)量還將繼續(xù)上升。

      首席信息官們是時候制定一個應(yīng)對這種情況的計劃了,并著眼于充分利用任何有望為企業(yè)創(chuàng)造新價值的暗數(shù)據(jù)。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。

    即時

    TCL實(shí)業(yè)榮獲IFA2024多項(xiàng)大獎,展示全球科技創(chuàng)新力量

    近日,德國柏林國際電子消費(fèi)品展覽會(IFA2024)隆重舉辦。憑借在核心技術(shù)、產(chǎn)品設(shè)計及應(yīng)用方面的創(chuàng)新變革,全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)成功斬獲兩項(xiàng)“IFA全球產(chǎn)品設(shè)計創(chuàng)新大獎”金獎,有力證明了其在全球市場的強(qiáng)大影響力。

    新聞

    敢闖技術(shù)無人區(qū) TCL實(shí)業(yè)斬獲多項(xiàng)AWE 2024艾普蘭獎

    近日,中國家電及消費(fèi)電子博覽會(AWE 2024)隆重開幕。全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)攜多款創(chuàng)新技術(shù)和新品亮相,以敢為精神勇闖技術(shù)無人區(qū),斬獲四項(xiàng)AWE 2024艾普蘭大獎。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。

    3C消費(fèi)

    “純臻4K 視界煥新”——愛普生4K 3LCD 激光工程投影

    2024年3月12日,由愛普生舉辦的主題為“純臻4K 視界煥新”新品發(fā)布會在上海盛大舉行。

    研究

    2024全球開發(fā)者先鋒大會即將開幕

    由世界人工智能大會組委會、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會共同指導(dǎo),由上海市人工智能行業(yè)協(xié)會聯(lián)合上海人工智能實(shí)驗(yàn)室、上海臨港經(jīng)濟(jì)發(fā)展(集團(tuán))有限公司、開放原子開源基金會主辦的“2024全球開發(fā)者先鋒大會”,將于2024年3月23日至24日舉辦。