<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          麥肯錫教我的數(shù)據(jù)科學(xué)家的五大黃金法則

          共 4435字,需瀏覽 9分鐘

           ·

          2021-09-16 06:37


          圖來源于Dan Dimmock在Unsplash上的拍攝


          近些年來,數(shù)據(jù)科學(xué)家這一崗位已經(jīng)變得越來越炙手可熱,也吸引了大批年輕人涌入渴望在激烈的競爭中搶占一席之位。各個網(wǎng)絡(luò)平臺上都已經(jīng)有無數(shù)干貨數(shù)據(jù)科學(xué)行業(yè)的簡歷、求職、面試教程,但是很顯然成為一位優(yōu)秀數(shù)據(jù)科學(xué)家的旅途不會因?yàn)榍舐毘晒徒Y(jié)束。收到offer僅僅只是第一步。

          我在麥肯錫咨詢公司的那些年,很榮幸能跟許多厲害的數(shù)據(jù)科學(xué)家以及各行各業(yè)的頂尖公司合作。我從中也受益匪淺,并從長期實(shí)踐和觀察中總結(jié)出來許多數(shù)據(jù)科學(xué)界的經(jīng)驗(yàn)和體會。你可能會覺得震驚的一個事實(shí)就是:最優(yōu)秀的數(shù)據(jù)科學(xué)家不是那些會用各種新奇模型或者代碼寫得很好的,事實(shí)上,真正優(yōu)秀的數(shù)據(jù)科學(xué)家是掌握了豐富理論知識的同時還擁有各種 “軟知識”的人。因此,這篇文章總結(jié)了我在麥肯錫的學(xué)到的成為優(yōu)秀數(shù)據(jù)科學(xué)家的五大關(guān)鍵準(zhǔn)則。


          1. 使用金字塔原則溝通是成功的鑰匙


           
          巴巴拉·明托的金字塔原則是一項(xiàng)層次性、結(jié)構(gòu)化的思考、溝通技術(shù)。這項(xiàng)原理被視為最有效率的信息溝通方式,并且被廣泛運(yùn)用于公司、企業(yè)、甚至個人生活中。金字塔原則背后的原理很簡單:當(dāng)你想要交流某個觀念或想法的時候,最高效的方法:1. 結(jié)論先行 2. 以上統(tǒng)下 3. 邏輯遞進(jìn)

          使用金字塔原則進(jìn)行溝通有以下兩個優(yōu)點(diǎn):

          1. 不管你的實(shí)際內(nèi)容有多深奧,使用金字塔原則可以幫助你的聽眾更好理解你的觀點(diǎn)。通常學(xué)術(shù)論文、或企業(yè)報告的開頭都會有個摘要,總結(jié)整篇文章或材料的中心思想。這樣的作法可以確保讀者在沒辦法理解、記住所有文章細(xì)節(jié)的情況下,也能理解其核心思想。


          2. 金字塔原則可以幫你適當(dāng)節(jié)省下為不同觀眾群體準(zhǔn)備不同材料(比如演講ppt)的時間。你可以運(yùn)用金字塔原則做一份你所要展示的問題的核心思想的演講材料,針對不同受眾群體適當(dāng)補(bǔ)充他們所感興趣的細(xì)節(jié)和論點(diǎn)。

          對于大部分?jǐn)?shù)據(jù)科學(xué)家而言,由于他們本身的工作大部分時間都在關(guān)注細(xì)節(jié)、深挖可分析的點(diǎn),金字塔原則可能看上去并不那么適用。事實(shí)上,我也經(jīng)??匆娫S多數(shù)據(jù)科學(xué)家在演講中并未采取金字塔原則,先從細(xì)節(jié)開始講起,而這些演講的效果也并不好,觀眾們很難快速理解到他們的核心思想和問題所在。

          如何練習(xí)/提升:最簡單的方法就是在一切最開始前先根據(jù)金字塔原則寫下自己的結(jié)論、論點(diǎn)、和邏輯遞進(jìn),并在溝通過程中參照自己最開始前寫下的內(nèi)容確保自己沒有跑題。時不時地反問自己一些問題(類似于中心結(jié)論和問題到底是什么,問題真的被解決了嗎)也可以確保你走在正確的道路上。

          2. 你是數(shù)據(jù)的“翻譯官”


          如果你看麥肯錫的企業(yè)藍(lán)圖
          https://www.mckinsey.com/industries/financial-services/our-insights/building-an-effective-analytics-organization,你會發(fā)現(xiàn)上面強(qiáng)調(diào)了數(shù)據(jù)的”翻譯官“這個角色的重要性。數(shù)據(jù)的“翻譯官”的也可以理解為企業(yè)與數(shù)據(jù)中心之間的溝通橋梁,需要把一個個數(shù)據(jù)分析的結(jié)論和觀點(diǎn)翻譯成實(shí)際可行性方案。我相信一個數(shù)據(jù)科學(xué)家肯定被問過以下問題:可以請你用大白話或清晰易懂且非專業(yè)性的語言解釋一下你的觀點(diǎn)和結(jié)論嗎?因此,一個數(shù)據(jù)科學(xué)家應(yīng)該具備把專業(yè)性極強(qiáng)的機(jī)器學(xué)習(xí)模型用清晰易懂的語言解釋給CEO或者任何非專業(yè)背景的聽眾的能力,并且同時也應(yīng)該具備把自己的結(jié)論觀點(diǎn)翻譯成企業(yè)實(shí)際可行性方案的能力。

          具備這些能力有以下優(yōu)點(diǎn):

          1. 不具備專業(yè)背景的人很難成為數(shù)據(jù)的“翻譯官”。麥肯錫曾經(jīng)嘗試過很多方法去培訓(xùn)戰(zhàn)略顧問成為“翻譯官”,但是在我看來,從未成功過。失敗的原因很簡單:一個人必須具備足夠的專業(yè)背景和分析能力才能精準(zhǔn)地解釋那些復(fù)雜的數(shù)據(jù)分析背后隱藏的意義,而豐富的專業(yè)背景和杰出的分析能力都不是短期的培訓(xùn)就能培養(yǎng)出的能力。舉個例子,如果你并不理解k均值聚類背后的數(shù)學(xué)邏輯和原理,你沒辦法清晰解釋為何要這么選這個數(shù)字作為你的k值而不是其他數(shù)字。而作為一個數(shù)據(jù)科學(xué)家,與其花費(fèi)時間向那些非專業(yè)人士解答他們難以理解的專業(yè)術(shù)語和原理,不如想辦法用清晰易懂的話語“翻譯”給他們。
          2. 如果數(shù)據(jù)科學(xué)家可以自己解釋自己的工作成果,可以大幅度避免信息在傳播過程中導(dǎo)致的扭曲和失真。我相信大部分人都玩過傳話游戲,傳播過程越長,涉及的人數(shù)越多,信息越容易在傳播過程中被扭曲、誤傳。這種情況也同樣適用于數(shù)據(jù)科學(xué)家的日常工作中,如果你通過別人來“翻譯”你的工作成果,你很難保證當(dāng)信息傳播到終端用戶的時候跟你最開始想要傳達(dá)的沒有一點(diǎn)偏差。

          如何練習(xí)/提升:找一位身邊的朋友(最好是非專業(yè)人士),向他解釋你的模型和數(shù)據(jù)分析結(jié)果。在解釋的過程中,如果你發(fā)現(xiàn)你不知道如何把一個概念用清晰易懂的方式表達(dá)出來,大部分情況下是因?yàn)槟悴]有完全掌握這個概念。因此,這個練習(xí)也是一個很好的查漏補(bǔ)缺的機(jī)會。 

          3. 時刻把解決實(shí)際問題放在第一位


          這一黃金準(zhǔn)則并不只限于數(shù)據(jù)科學(xué)家,事實(shí)上,“時刻把解決實(shí)際問題放在第一位”適用于任何行業(yè)中的任何職位。發(fā)現(xiàn)問題并提出問題的能力尤為重要,而更重要的是有解決問題的能力。如果沒有時刻把解決問題放在第一位,開會討論的時候經(jīng)常會陷入一個怪圈:過度關(guān)注于問題本身而不是想辦法去解決問題。

          在我看來,大部分頂尖咨詢公司都奉行“時刻把解決實(shí)際問題放在第一位”的準(zhǔn)則。作為一個數(shù)據(jù)科學(xué)家,你可能經(jīng)常會因?yàn)椴痪邆鋵I(yè)背景的同事提出一些在你看來很可笑的稀奇古怪的問題或需求而感到懊惱。我見過許多數(shù)據(jù)科學(xué)家們在這種情況下束手無策,直接拒絕他們的需求。比起直接拒絕,更好的做法是運(yùn)用自己的分析能力和專業(yè)背景幫助他們重新定義問題所在并想辦法切實(shí)地解決他們的問題。

          “時刻把解決實(shí)際問題放在第一位”并不意味著你不能在工作中拒絕任何需求。事實(shí)上他意味著每當(dāng)你拒絕后,你可以緊跟著提出“或許……做可以解決你的問題嗎?”

          如何練習(xí)/提升:當(dāng)你遇到問題時,在跟同事溝通討論前,先自己花時間想一想如果是你的話你會如何解決。面對問題時,多運(yùn)用你的創(chuàng)造性思維發(fā)掘新的解決方案,不要害怕做那個提出新的解決方案的人。有時候換位思考的能力也很重要,嘗試著以整個公司或者其他業(yè)務(wù)部門的角度去思考他們會如何解決這個問題。從大局出發(fā)思考,有時候也會帶來意想不到的解決問題的方案。
           

          4. 有時候可以為了模型的可解釋性而適當(dāng)犧牲模型的準(zhǔn)確率。


          沒有人真的想精準(zhǔn)預(yù)測出結(jié)果,所有人都只是在嘗試分析、理解結(jié)果。
           
          當(dāng)一個企業(yè)想要建立模型去預(yù)測出未來客戶流失數(shù)時,大部分情況下,人們都忘了在第一時間問為什么我們需要預(yù)測客戶流失數(shù)。企業(yè)想要預(yù)測出某些結(jié)果是因?yàn)樗麄兛梢蕴崆安扇〈胧?yīng)對以避免損失。所以當(dāng)你的模型告訴CEO “在預(yù)測客戶流失數(shù)里網(wǎng)站訪問量的立方根是最顯著的特征”意味著什么呢?很可能在他看來毫無意義。

          作為一個數(shù)據(jù)科學(xué)家,我以前也經(jīng)常過度追求模型的準(zhǔn)確性。但是我逐漸意識到了通過添加一些無法解釋、沒有意義的變量;或者調(diào)參僅僅只是為了把準(zhǔn)確率從96%提高至98%對整個公司來說并沒有太大的意義(當(dāng)然,這個觀念僅僅只適用于業(yè)務(wù)導(dǎo)向的數(shù)據(jù)科學(xué)家們,對于其他領(lǐng)域的機(jī)器學(xué)習(xí)工程師而言,模型準(zhǔn)確率可能極其重要)。

          對于大部分高管和業(yè)務(wù)部門來說,如果你無法解釋你的模型和模型的結(jié)果,那你的模型可能在他們眼里看來并沒有那么可靠。模型只是為了輔助他們?nèi)ジ玫刈龀錾虡I(yè)決策,所以模型更大的意義是可解釋性而不是準(zhǔn)確率。
           
          如何練習(xí)/提升:當(dāng)你在建?;蜃鰯?shù)據(jù)分析時,時刻反問自己“這會如何影響公司呢”。建模過程中,盡量避免放一些隨機(jī)、意義不大的交互特征。當(dāng)你的模型或分析有結(jié)果后,可以根據(jù)結(jié)果具有針對性地寫下對公司的建設(shè)性意見,這樣的作法也會幫助你更好的評估自己的模型是否適用。
           

          5. 在開始前,確保自己有個假設(shè)場景,但是不要僅局限于一個假設(shè)。


          在開始任何分析工作之前,設(shè)立好自己將要分析的假設(shè)場景尤為重要。如果不設(shè)立好分析背景,你可能在前期數(shù)據(jù)處理、EDA 或者是如何選擇特征時一頭霧水。如果沒有任何假設(shè),AB測試也沒辦法進(jìn)行。盡管提前設(shè)立好自己的假設(shè)如此重要,我也見過沒有提前設(shè)立好假設(shè)就開始處理問題的數(shù)據(jù)科學(xué)家。在這種情況下,數(shù)據(jù)科學(xué)家們往往把設(shè)立假設(shè)這個關(guān)鍵任務(wù)丟給了缺乏專業(yè)背景的業(yè)務(wù)部門,而他們往往會因?yàn)槿狈σ恍I(yè)背景和對數(shù)據(jù)的熟悉設(shè)立一些實(shí)際工作場景中無法檢驗(yàn)的假設(shè)。因此,在我看來最好的做法是數(shù)據(jù)科學(xué)家們在一開始就應(yīng)該參與到設(shè)定假設(shè)的過程中去指引他們哪些是可嘗試的而哪些是無法嘗試的。

          設(shè)立假設(shè)尤為重要,因?yàn)樗且磺械钠瘘c(diǎn),但是這并不代表設(shè)立好一個假設(shè)后就萬事大吉了。我經(jīng)??匆娫S多數(shù)據(jù)集科學(xué)家們過于執(zhí)著于一個假設(shè),盡管這個假設(shè)帶來了自相矛盾的結(jié)果。太過于執(zhí)著于一個假設(shè)可能會導(dǎo)致為了滿足這個假設(shè)而去人為的更改一些數(shù)據(jù)或進(jìn)行一些影響準(zhǔn)確率的操作。如果你聽過辛普森悖論,那你一定很清楚數(shù)據(jù)是具備撒謊的能力的。一個好的數(shù)據(jù)科學(xué)家應(yīng)該把數(shù)據(jù)可靠性放在第一位,因此不要僅僅只局限于一個假設(shè)。
           
          如何練習(xí)/提升:設(shè)立假設(shè)是具備業(yè)務(wù)思維和敏銳度尤為重要。有了假設(shè)之后跟著你的假設(shè)去進(jìn)行數(shù)據(jù)探索,但是當(dāng)數(shù)據(jù)呈現(xiàn)出與你的假設(shè)相反的結(jié)果時,也不要過度執(zhí)著于自己一開始的假設(shè)。
           
          人們通常把人才分為兩種:戰(zhàn)略性人才和分析性人才,這樣的分法就好像在暗示一個人無法同時擁有這兩種能力。但是事實(shí)上,一般最好的分析性人才恰恰是那些能理解公司戰(zhàn)略性政策和想法,并且懂得如何和業(yè)務(wù)部門溝通的人。而最好的戰(zhàn)略性人才也恰恰是那些具備足夠數(shù)據(jù)分析能力的人。
           

          原文標(biāo)題:

          5 Lessons McKinsey Taught Me That Will Make You A Better Data Scientist

          原文鏈接:

          https://towardsdatascience.com/5-lessons-mckinsey-taught-me-that-will-make-you-a-better-data-scientist-66cd9cc16aba?gi=2242e432865c

           
          作者:Tessa Xie
          編輯:于騰凱
          校對:汪雨晴
          譯者簡介
          苗雨,美國加州大學(xué)洛杉磯分校應(yīng)用統(tǒng)計(jì)學(xué)碩士在讀,畢業(yè)后準(zhǔn)備繼續(xù)在統(tǒng)計(jì)學(xué)領(lǐng)域讀博深造。對機(jī)器學(xué)習(xí),因果推斷很感興趣,希望能和大家一起成長。

           覺得好看,點(diǎn)擊【好看】關(guān)注↓↓ 

          瀏覽 36
          點(diǎn)贊
          評論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報
          評論
          圖片
          表情
          推薦
          點(diǎn)贊
          評論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  国产公妇乱婬XXXX看一本毛片 | 无码视频免费在线观看 | 艳舞乱伦小说 | 在线看片黄色免费Z | 男人天堂热 |