下單前先比價不花冤枉錢 同款圖書京東價低于抖音6折日媒感慨中國電動汽車/智駕遙遙領(lǐng)先:本田、日產(chǎn)、三菱合并也沒戲消委會吹風機品質(zhì)檢測結(jié)果揭曉 徠芬獨占鰲頭 共話新質(zhì)營銷力,2024梅花數(shù)據(jù)峰會圓滿落幕索尼影像專業(yè)服務(wù) PRO Support 升級,成為會員至少需注冊 2 臺 α 全畫幅相機、3 支 G 大師鏡頭消息稱vivo加碼電池軍備競賽:6500mAh 旗艦機+7500mAh中端機寶馬M8雙門轎跑車明年年初將停產(chǎn),后續(xù)無2026款車型比亞迪:2025 款漢家族車型城市領(lǐng)航智駕功能開啟內(nèi)測雷神預告2025年首次出席CES 將發(fā)布三款不同技術(shù)原理智能眼鏡realme真我全球首發(fā)聯(lián)發(fā)科天璣 8400 耐玩戰(zhàn)神共創(chuàng)計劃iQOO Z9 Turbo長續(xù)航版手機被曝電池加大到6400mAh,搭驍龍 8s Gen 3處理器普及放緩 銷量大跌:曝保時捷將重新評估電動汽車計劃來京東參與榮耀Magic7 RSR 保時捷設(shè)計預售 享365天只換不修國補期間電視迎來換機潮,最暢銷MiniLED品牌花落誰家?美團旗下微信社群團購業(yè)務(wù)“團買買”宣布年底停運消息稱微軟正與第三方廠商洽談,試圖合作推出Xbox游戲掌機設(shè)備在海外,要再造一個京東物流?消息稱蘋果正為AirPods開發(fā)多項健康功能,包括心率監(jiān)測和溫度感應一加 Ace 5系列將搭載全新游戲助手:大幅提升游戲體驗東芝全部業(yè)務(wù)實現(xiàn)盈利,退市裁員重組后終于賺錢
  • 首頁 > 即時新聞

    CDA數(shù)據(jù)分析師編譯:如何評估機器學習模型的商業(yè)價值

    2021年09月22日 11:59:04   來源:中文科技資訊

      概述

      對于任何評估來說,CDA數(shù)據(jù)分析師認為最難的是保持簡單易操作,在數(shù)據(jù)科學中也是如此。在任何數(shù)據(jù)科學項目中,細化數(shù)據(jù)、微調(diào)模型、部署它們的迭代過程都是一個持續(xù)的過程。隨著工具、算法的進步,以及隨著 MLOps 的出現(xiàn),事情變得容易了很多,而且未來也會繼續(xù)發(fā)展——技術(shù)會優(yōu)化自己。

      業(yè)務(wù)方面呢?說服客戶相信使用先進工具和技術(shù)構(gòu)建的復雜模型的預測能力有多容易?客戶是否愿意為項目提供資金并信任我們模型的建議?好吧,不妨試著解釋模型的 ROC 曲線,試著用特異性和敏感性指標來說服客戶——你會看到的只是眼球在滾動。

      但是,如果我們能夠在沒有復雜指標和技術(shù)術(shù)語的情況下回答業(yè)務(wù)問題呢?那么,我們就可能有機會從業(yè)務(wù)部門那里獲得支持。在本文中,我們將看到一個用例,在該用例中,我們?nèi)詫?gòu)建我們的模型,但以不同的方式對其進行解釋——業(yè)務(wù)方式。

      使用 ML 模型提取商業(yè)價值的方法

      在今天CDA數(shù)據(jù)分析師編譯的這篇博客中,我們將探索十分位數(shù)的使用,了解各種評估圖,如累積增益圖和提升圖等,以評估 ML 模型的商業(yè)價值。該方法將幫助我們解釋 ML 模型的預測能力,并使解釋模型結(jié)果變得很簡單。這些圖表和指標將使企業(yè)能夠更有信心地做出明智的決策。

      我們將在本文中探索以下主題。

      數(shù)據(jù)探索

      數(shù)據(jù)處理

      建立模型

      生成十分位數(shù)和報告

      模型對比

      業(yè)務(wù)場景

      結(jié)論

      入門

      我們將使用來自 UCI 機器學習存儲庫的公開可用的銀行數(shù)據(jù) 集, zip 文件中有四個數(shù)據(jù)集,但我們感興趣的是*bank-additional-full.csv。*所有的屬性信息都可以在上面的 URL 中找到。數(shù)據(jù)來自直接營銷電話聯(lián)系客戶,以評估客戶是否有興趣訂閱銀行定期存款。如果訂閱,則為 Yes,否則為 No。本文討論的是如何評估 ML 模型的商業(yè)價值。

      數(shù)據(jù)加載和處理:

      讓我們加載數(shù)據(jù)并查看一下以便更好的理解數(shù)據(jù)。

      我們可以進行完整的EDA/特征工程/選擇重要變量然后構(gòu)建模型,但為了簡單起見,我們將選擇很少的變量進行模型構(gòu)建。

      此外,還需要更進一步地探索數(shù)據(jù),將目標變量轉(zhuǎn)換為分類變量并對其進行編碼。

      輸出:

      模型構(gòu)建以提取商業(yè)價值

      邏輯回歸

      Step1:定義自變量和目標變量

      Step2:將數(shù)據(jù)集拆分為訓練集和測試集,其中測試大小為整個數(shù)據(jù)集的 20%

      Step3:建立邏輯回歸模型

      至此,我們已經(jīng)建立了模型,并在測試數(shù)據(jù)上對其進行了評分(預測),這為我們提供了每個觀察結(jié)果的預測概率。

      生成十分位數(shù)

      簡單地說,十分位數(shù)把數(shù)據(jù)進行分箱。所以,我們將所有預測的概率分成十組,并對它們進行排名,這意味著最高的預測概率將在十分之一,最低的設(shè)置將在十分之一。我們將使用pandas的 cut() 函數(shù)拆分數(shù)據(jù)。

      下面的代碼行創(chuàng)建一個名為Decile_rank_glm的新列, 它保存每個預測記錄的排名。

      注: 0.99 的概率為 1,0.93 為 2,0.85 為 4,0.59 為 9。我們將在后面的部分中看到此結(jié)果的可視化。

      模型評估以提取商業(yè)價值

      我們構(gòu)建的任何模型都必須與基線模型進行比較,以評估模型的性能。請跟CDA數(shù)據(jù)分析師一起在下面進一步探討這一點。

      隨機模型:基線模型將是一個隨機模型,這意味著它與拋硬幣一樣好,這意味著有 50% 的概率客戶的電話是正確的或者客戶購買我們的產(chǎn)品。我們的邏輯回歸模型的性能顯然應該比這更好。

      向?qū)P停哼@是另一個極端模型,它的預測是完美的,這意味著它幾乎以 100% 的準確度進行預測。此模型不應用于生產(chǎn)或任何業(yè)務(wù)決策,因為很可能會過度擬合。

      邏輯回歸:我們的模型應該介于這兩個極端模型之間,這使我們有足夠的信心做出業(yè)務(wù)決策。

      我們將在累積增益圖中可視化上述模型。展現(xiàn)邏輯回歸的性能。

      到目前為止看起來不錯,圖在預期線上,邏輯回歸模型介于我們討論的兩個極端模型之間。

      累積增益圖的見解:

      如果我們只能選擇前 20%(十分位數(shù) 1 和十分位數(shù) 2),那么我們就可以覆蓋**近 80%**的目標類別。

      由于這是一個累積圖,我們看到**曲線在十分位數(shù) 5 之后變平,**這意味著十分位數(shù) 6 到 10 要么有最少的記錄,要么沒有。

      向?qū)P驮谑治粩?shù) 2 的位置達到了100% 標記——我們已經(jīng)知道這是一個理想模型,僅供參考。如果我們的模型開始接近或者類似于這兩個極端模型中的任何一個,那么需要檢查我們的模型。

      到目前為止,CDA數(shù)據(jù)分析師已經(jīng)與你一起討論了模型、十分位數(shù)及其性能比較。讓我們在十分位數(shù)級別上進一步探討這一點,以更清楚地了解發(fā)生了什么以及我們?nèi)绾胃玫亟忉屵@個過程。我們將在視覺效果的幫助下進行分析,這使它變得更加容易。kds 包有一個非常好的功能,可以在一行代碼中生成所有指標報告。

      讓我們了解這些情節(jié)中的每一個。需要注意的是,所有圖的 x 軸都是十分位數(shù)。

      提升圖(Lift Plot):這個圖向我們展示了邏輯回歸模型與隨機模型相比到底有多好。例如:十分位數(shù) 2 給了我們幾乎 4 倍的提升,這意味著我們可以比隨機模型方法做得好 4 倍。當我們進入更高的十分位數(shù)時,升力下降并最終滿足隨機模型線,這是因為所有更高的概率分數(shù)值都在我們已經(jīng)在累積增益圖中看到的最高十分位數(shù)(1 到 3)中。因此,底部十分位數(shù)的概率較低且?guī)缀跖c隨機模型相同。

      十分位數(shù)提升圖(Decile-wise Lift Plot):該圖向我們展示了每個十分位數(shù)中目標類觀察的百分比,我們觀察到十分位數(shù) 1 具有最大值,隨著x軸數(shù)值的延伸,十分位數(shù)百分比下降,在某個點之后它甚至低于隨機模型線。這是因為隨機模型具有隨機設(shè)置的均勻分布的觀測值,而我們的模型在較高的十分位數(shù)中預測的觀測值較少。

      累積增益圖(Cumulative Gain Plot):在以前的部分中討論過這個問題,還研究了對圖的解釋。

      KS 統(tǒng)計圖(KS Statistic Plot):KS 圖評估不同的分布,即事件和非事件,KS 值是分布之間差異最大的點。簡而言之,它有助于我們理解 ML 模型區(qū)分兩個事件的能力。KS 分數(shù)大于 40,如果它恰好在前 3 個十分位數(shù)中,那么它被認為是好的。在我們的例子中,我們從圖中得到了 68.932 和十分位數(shù) 3 的分數(shù)。

      讓我們用隨機森林再構(gòu)建一個模型,看看結(jié)果如何。

      觀察:

      隨機森林模型略好于邏輯回歸模型。

      十分位數(shù) 2 的提升略高,KS 統(tǒng)計數(shù)據(jù)為 72.18,而logistic統(tǒng)計數(shù)據(jù)為 68.93

      業(yè)務(wù)場景

      建議控制:在某些情況下,客戶有業(yè)務(wù)需求,即應始終生成最少 X 條建議。在這種情況下,我們可以通過考慮前 3 個十分位數(shù)而不是 2 個十分位數(shù)來獲得更大的建議,并且還可以對其他記錄進行精細控制。

      衡量市場反應:推薦后分析和市場反應很容易衡量。例如,從前一點,我們可以單獨跟蹤來自十分位數(shù) 3 的所有額外推薦的表現(xiàn)。來自十分位數(shù) 3 的額外推送是否產(chǎn)生了任何影響(正面或負面)?

      優(yōu)化營銷支出:通過關(guān)注前 20-30% 的人群,企業(yè)可以節(jié)省時間、資源和金錢。以避免這些時間、資源和金錢會花費在無響應者或定位錯誤客戶上。

      結(jié)語

      CDA數(shù)據(jù)分析師認為技術(shù)有其一席之地,企業(yè)也有發(fā)言權(quán)。歸根結(jié)底,這一切都與技術(shù)帶來的商業(yè)價值有關(guān)。當這些收益用商業(yè)術(shù)語來解釋時,它總是會更有效。它不僅有助于從業(yè)務(wù)中獲得信心,而且還開辟了新的探索機會。

      請注意,我們構(gòu)建了兩個分類模型,但沒有研究我們通常為此類模型所做的 ROC 曲線、混淆矩陣、精度、召回率和其他標準指標。強烈建議跟蹤和測量這些指標以評估模型的性能,然后遵循此文中的十分位數(shù)方法。根據(jù)目標受眾和目標,使用最適合目標的方法。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹慎對待。投資者據(jù)此操作,風險自擔。

    [No. H001]
    分享到微信

    即時

    新聞

    明火炊具市場:三季度健康屬性貫穿全類目

    奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。

    企業(yè)IT

    重慶創(chuàng)新公積金應用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。

    3C消費

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,高能實力,創(chuàng)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。

    研究

    中國信通院羅松:深度解讀《工業(yè)互聯(lián)網(wǎng)標識解析體系

    9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標識解析專題論壇在沈陽成功舉辦。