<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          麥肯錫:優(yōu)秀數(shù)據(jù)科學(xué)家的5個(gè)特征!

          共 4338字,需瀏覽 9分鐘

           ·

          2022-03-03 00:39

          作者:Tessa Xie ? ???
          本文約3700字,建議閱讀5分鐘
          本文總結(jié)了成為優(yōu)秀數(shù)據(jù)科學(xué)家的五大關(guān)鍵準(zhǔn)則。
          近些年來(lái),數(shù)據(jù)科學(xué)家這一崗位已經(jīng)變得越來(lái)越炙手可熱,也吸引了大批年輕人涌入渴望在激烈的競(jìng)爭(zhēng)中搶占一席之位。各個(gè)網(wǎng)絡(luò)平臺(tái)上都已經(jīng)有無(wú)數(shù)干貨數(shù)據(jù)科學(xué)行業(yè)的簡(jiǎn)歷、求職、面試教程,但是很顯然成為一位優(yōu)秀數(shù)據(jù)科學(xué)家的旅途不會(huì)因?yàn)榍舐毘晒徒Y(jié)束。收到offer僅僅只是第一步。

          我在麥肯錫咨詢公司的那些年,很榮幸能跟許多厲害的數(shù)據(jù)科學(xué)家以及各行各業(yè)的頂尖公司合作。我從中也受益匪淺,并從長(zhǎng)期實(shí)踐和觀察中總結(jié)出來(lái)許多數(shù)據(jù)科學(xué)界的經(jīng)驗(yàn)和體會(huì)。你可能會(huì)覺(jué)得震驚的一個(gè)事實(shí)就是:最優(yōu)秀的數(shù)據(jù)科學(xué)家不是那些會(huì)用各種新奇模型或者代碼寫(xiě)得很好的,事實(shí)上,真正優(yōu)秀的數(shù)據(jù)科學(xué)家是掌握了豐富理論知識(shí)的同時(shí)還擁有各種 “軟知識(shí)”的人。因此,這篇文章總結(jié)了我在麥肯錫的學(xué)到的成為優(yōu)秀數(shù)據(jù)科學(xué)家的五大關(guān)鍵準(zhǔn)則。

          1. 使用金字塔原則溝通是成功的鑰匙


          ?
          巴巴拉·明托的金字塔原則是一項(xiàng)層次性、結(jié)構(gòu)化的思考、溝通技術(shù)。這項(xiàng)原理被視為最有效率的信息溝通方式,并且被廣泛運(yùn)用于公司、企業(yè)、甚至個(gè)人生活中。金字塔原則背后的原理很簡(jiǎn)單:當(dāng)你想要交流某個(gè)觀念或想法的時(shí)候,最高效的方法:1. 結(jié)論先行 2. 以上統(tǒng)下 3. 邏輯遞進(jìn)

          使用金字塔原則進(jìn)行溝通有以下兩個(gè)優(yōu)點(diǎn):

          1. 不管你的實(shí)際內(nèi)容有多深?yuàn)W,使用金字塔原則可以幫助你的聽(tīng)眾更好理解你的觀點(diǎn)。通常學(xué)術(shù)論文、或企業(yè)報(bào)告的開(kāi)頭都會(huì)有個(gè)摘要,總結(jié)整篇文章或材料的中心思想。這樣的作法可以確保讀者在沒(méi)辦法理解、記住所有文章細(xì)節(jié)的情況下,也能理解其核心思想。


          2. 金字塔原則可以幫你適當(dāng)節(jié)省下為不同觀眾群體準(zhǔn)備不同材料(比如演講ppt)的時(shí)間。你可以運(yùn)用金字塔原則做一份你所要展示的問(wèn)題的核心思想的演講材料,針對(duì)不同受眾群體適當(dāng)補(bǔ)充他們所感興趣的細(xì)節(jié)和論點(diǎn)。

          對(duì)于大部分?jǐn)?shù)據(jù)科學(xué)家而言,由于他們本身的工作大部分時(shí)間都在關(guān)注細(xì)節(jié)、深挖可分析的點(diǎn),金字塔原則可能看上去并不那么適用。事實(shí)上,我也經(jīng)常看見(jiàn)許多數(shù)據(jù)科學(xué)家在演講中并未采取金字塔原則,先從細(xì)節(jié)開(kāi)始講起,而這些演講的效果也并不好,觀眾們很難快速理解到他們的核心思想和問(wèn)題所在。

          如何練習(xí)/提升:最簡(jiǎn)單的方法就是在一切最開(kāi)始前先根據(jù)金字塔原則寫(xiě)下自己的結(jié)論、論點(diǎn)、和邏輯遞進(jìn),并在溝通過(guò)程中參照自己最開(kāi)始前寫(xiě)下的內(nèi)容確保自己沒(méi)有跑題。時(shí)不時(shí)地反問(wèn)自己一些問(wèn)題(類(lèi)似于中心結(jié)論和問(wèn)題到底是什么,問(wèn)題真的被解決了嗎)也可以確保你走在正確的道路上。

          2.?你是數(shù)據(jù)的“翻譯官”


          如果你看麥肯錫的企業(yè)藍(lán)圖
          https://www.mckinsey.com/industries/financial-services/our-insights/building-an-effective-analytics-organization,你會(huì)發(fā)現(xiàn)上面強(qiáng)調(diào)了數(shù)據(jù)的”翻譯官“這個(gè)角色的重要性。數(shù)據(jù)的“翻譯官”的也可以理解為企業(yè)與數(shù)據(jù)中心之間的溝通橋梁,需要把一個(gè)個(gè)數(shù)據(jù)分析的結(jié)論和觀點(diǎn)翻譯成實(shí)際可行性方案。我相信一個(gè)數(shù)據(jù)科學(xué)家肯定被問(wèn)過(guò)以下問(wèn)題:可以請(qǐng)你用大白話或清晰易懂且非專業(yè)性的語(yǔ)言解釋一下你的觀點(diǎn)和結(jié)論嗎?因此,一個(gè)數(shù)據(jù)科學(xué)家應(yīng)該具備把專業(yè)性極強(qiáng)的機(jī)器學(xué)習(xí)模型用清晰易懂的語(yǔ)言解釋給CEO或者任何非專業(yè)背景的聽(tīng)眾的能力,并且同時(shí)也應(yīng)該具備把自己的結(jié)論觀點(diǎn)翻譯成企業(yè)實(shí)際可行性方案的能力。

          具備這些能力有以下優(yōu)點(diǎn):

          1. 不具備專業(yè)背景的人很難成為數(shù)據(jù)的“翻譯官”。麥肯錫曾經(jīng)嘗試過(guò)很多方法去培訓(xùn)戰(zhàn)略顧問(wèn)成為“翻譯官”,但是在我看來(lái),從未成功過(guò)。失敗的原因很簡(jiǎn)單:一個(gè)人必須具備足夠的專業(yè)背景和分析能力才能精準(zhǔn)地解釋那些復(fù)雜的數(shù)據(jù)分析背后隱藏的意義,而豐富的專業(yè)背景和杰出的分析能力都不是短期的培訓(xùn)就能培養(yǎng)出的能力。舉個(gè)例子,如果你并不理解k均值聚類(lèi)背后的數(shù)學(xué)邏輯和原理,你沒(méi)辦法清晰解釋為何要這么選這個(gè)數(shù)字作為你的k值而不是其他數(shù)字。而作為一個(gè)數(shù)據(jù)科學(xué)家,與其花費(fèi)時(shí)間向那些非專業(yè)人士解答他們難以理解的專業(yè)術(shù)語(yǔ)和原理,不如想辦法用清晰易懂的話語(yǔ)“翻譯”給他們。
          2. 如果數(shù)據(jù)科學(xué)家可以自己解釋自己的工作成果,可以大幅度避免信息在傳播過(guò)程中導(dǎo)致的扭曲和失真。我相信大部分人都玩過(guò)傳話游戲,傳播過(guò)程越長(zhǎng),涉及的人數(shù)越多,信息越容易在傳播過(guò)程中被扭曲、誤傳。這種情況也同樣適用于數(shù)據(jù)科學(xué)家的日常工作中,如果你通過(guò)別人來(lái)“翻譯”你的工作成果,你很難保證當(dāng)信息傳播到終端用戶的時(shí)候跟你最開(kāi)始想要傳達(dá)的沒(méi)有一點(diǎn)偏差。

          如何練習(xí)/提升:找一位身邊的朋友(最好是非專業(yè)人士),向他解釋你的模型和數(shù)據(jù)分析結(jié)果。在解釋的過(guò)程中,如果你發(fā)現(xiàn)你不知道如何把一個(gè)概念用清晰易懂的方式表達(dá)出來(lái),大部分情況下是因?yàn)槟悴](méi)有完全掌握這個(gè)概念。因此,這個(gè)練習(xí)也是一個(gè)很好的查漏補(bǔ)缺的機(jī)會(huì)。?

          3.?時(shí)刻把解決實(shí)際問(wèn)題放在第一位


          這一黃金準(zhǔn)則并不只限于數(shù)據(jù)科學(xué)家,事實(shí)上,“時(shí)刻把解決實(shí)際問(wèn)題放在第一位”適用于任何行業(yè)中的任何職位。發(fā)現(xiàn)問(wèn)題并提出問(wèn)題的能力尤為重要,而更重要的是有解決問(wèn)題的能力。如果沒(méi)有時(shí)刻把解決問(wèn)題放在第一位,開(kāi)會(huì)討論的時(shí)候經(jīng)常會(huì)陷入一個(gè)怪圈:過(guò)度關(guān)注于問(wèn)題本身而不是想辦法去解決問(wèn)題。

          在我看來(lái),大部分頂尖咨詢公司都奉行“時(shí)刻把解決實(shí)際問(wèn)題放在第一位”的準(zhǔn)則。作為一個(gè)數(shù)據(jù)科學(xué)家,你可能經(jīng)常會(huì)因?yàn)椴痪邆鋵I(yè)背景的同事提出一些在你看來(lái)很可笑的稀奇古怪的問(wèn)題或需求而感到懊惱。我見(jiàn)過(guò)許多數(shù)據(jù)科學(xué)家們?cè)谶@種情況下束手無(wú)策,直接拒絕他們的需求。比起直接拒絕,更好的做法是運(yùn)用自己的分析能力和專業(yè)背景幫助他們重新定義問(wèn)題所在并想辦法切實(shí)地解決他們的問(wèn)題。

          “時(shí)刻把解決實(shí)際問(wèn)題放在第一位”并不意味著你不能在工作中拒絕任何需求。事實(shí)上他意味著每當(dāng)你拒絕后,你可以緊跟著提出“或許……做可以解決你的問(wèn)題嗎?”

          如何練習(xí)/提升:當(dāng)你遇到問(wèn)題時(shí),在跟同事溝通討論前,先自己花時(shí)間想一想如果是你的話你會(huì)如何解決。面對(duì)問(wèn)題時(shí),多運(yùn)用你的創(chuàng)造性思維發(fā)掘新的解決方案,不要害怕做那個(gè)提出新的解決方案的人。有時(shí)候換位思考的能力也很重要,嘗試著以整個(gè)公司或者其他業(yè)務(wù)部門(mén)的角度去思考他們會(huì)如何解決這個(gè)問(wèn)題。從大局出發(fā)思考,有時(shí)候也會(huì)帶來(lái)意想不到的解決問(wèn)題的方案。
          ?

          4. 有時(shí)候可以為了模型的可解釋性而適當(dāng)犧牲模型的準(zhǔn)確率。


          沒(méi)有人真的想精準(zhǔn)預(yù)測(cè)出結(jié)果,所有人都只是在嘗試分析、理解結(jié)果。
          ?
          當(dāng)一個(gè)企業(yè)想要建立模型去預(yù)測(cè)出未來(lái)客戶流失數(shù)時(shí),大部分情況下,人們都忘了在第一時(shí)間問(wèn)為什么我們需要預(yù)測(cè)客戶流失數(shù)。企業(yè)想要預(yù)測(cè)出某些結(jié)果是因?yàn)樗麄兛梢蕴崆安扇〈胧?yīng)對(duì)以避免損失。所以當(dāng)你的模型告訴CEO “在預(yù)測(cè)客戶流失數(shù)里網(wǎng)站訪問(wèn)量的立方根是最顯著的特征”意味著什么呢?很可能在他看來(lái)毫無(wú)意義。

          作為一個(gè)數(shù)據(jù)科學(xué)家,我以前也經(jīng)常過(guò)度追求模型的準(zhǔn)確性。但是我逐漸意識(shí)到了通過(guò)添加一些無(wú)法解釋、沒(méi)有意義的變量;或者調(diào)參僅僅只是為了把準(zhǔn)確率從96%提高至98%對(duì)整個(gè)公司來(lái)說(shuō)并沒(méi)有太大的意義(當(dāng)然,這個(gè)觀念僅僅只適用于業(yè)務(wù)導(dǎo)向的數(shù)據(jù)科學(xué)家們,對(duì)于其他領(lǐng)域的機(jī)器學(xué)習(xí)工程師而言,模型準(zhǔn)確率可能極其重要)。

          對(duì)于大部分高管和業(yè)務(wù)部門(mén)來(lái)說(shuō),如果你無(wú)法解釋你的模型和模型的結(jié)果,那你的模型可能在他們眼里看來(lái)并沒(méi)有那么可靠。模型只是為了輔助他們?nèi)ジ玫刈龀錾虡I(yè)決策,所以模型更大的意義是可解釋性而不是準(zhǔn)確率。
          ?
          如何練習(xí)/提升:當(dāng)你在建?;蜃鰯?shù)據(jù)分析時(shí),時(shí)刻反問(wèn)自己“這會(huì)如何影響公司呢”。建模過(guò)程中,盡量避免放一些隨機(jī)、意義不大的交互特征。當(dāng)你的模型或分析有結(jié)果后,可以根據(jù)結(jié)果具有針對(duì)性地寫(xiě)下對(duì)公司的建設(shè)性意見(jiàn),這樣的作法也會(huì)幫助你更好的評(píng)估自己的模型是否適用。
          ?

          5. 在開(kāi)始前,確保自己有個(gè)假設(shè)場(chǎng)景,但是不要僅局限于一個(gè)假設(shè)。


          在開(kāi)始任何分析工作之前,設(shè)立好自己將要分析的假設(shè)場(chǎng)景尤為重要。如果不設(shè)立好分析背景,你可能在前期數(shù)據(jù)處理、EDA 或者是如何選擇特征時(shí)一頭霧水。如果沒(méi)有任何假設(shè),AB測(cè)試也沒(méi)辦法進(jìn)行。盡管提前設(shè)立好自己的假設(shè)如此重要,我也見(jiàn)過(guò)沒(méi)有提前設(shè)立好假設(shè)就開(kāi)始處理問(wèn)題的數(shù)據(jù)科學(xué)家。在這種情況下,數(shù)據(jù)科學(xué)家們往往把設(shè)立假設(shè)這個(gè)關(guān)鍵任務(wù)丟給了缺乏專業(yè)背景的業(yè)務(wù)部門(mén),而他們往往會(huì)因?yàn)槿狈σ恍I(yè)背景和對(duì)數(shù)據(jù)的熟悉設(shè)立一些實(shí)際工作場(chǎng)景中無(wú)法檢驗(yàn)的假設(shè)。因此,在我看來(lái)最好的做法是數(shù)據(jù)科學(xué)家們?cè)谝婚_(kāi)始就應(yīng)該參與到設(shè)定假設(shè)的過(guò)程中去指引他們哪些是可嘗試的而哪些是無(wú)法嘗試的。

          設(shè)立假設(shè)尤為重要,因?yàn)樗且磺械钠瘘c(diǎn),但是這并不代表設(shè)立好一個(gè)假設(shè)后就萬(wàn)事大吉了。我經(jīng)??匆?jiàn)許多數(shù)據(jù)集科學(xué)家們過(guò)于執(zhí)著于一個(gè)假設(shè),盡管這個(gè)假設(shè)帶來(lái)了自相矛盾的結(jié)果。太過(guò)于執(zhí)著于一個(gè)假設(shè)可能會(huì)導(dǎo)致為了滿足這個(gè)假設(shè)而去人為的更改一些數(shù)據(jù)或進(jìn)行一些影響準(zhǔn)確率的操作。如果你聽(tīng)過(guò)辛普森悖論,那你一定很清楚數(shù)據(jù)是具備撒謊的能力的。一個(gè)好的數(shù)據(jù)科學(xué)家應(yīng)該把數(shù)據(jù)可靠性放在第一位,因此不要僅僅只局限于一個(gè)假設(shè)。
          ?
          如何練習(xí)/提升:設(shè)立假設(shè)是具備業(yè)務(wù)思維和敏銳度尤為重要。有了假設(shè)之后跟著你的假設(shè)去進(jìn)行數(shù)據(jù)探索,但是當(dāng)數(shù)據(jù)呈現(xiàn)出與你的假設(shè)相反的結(jié)果時(shí),也不要過(guò)度執(zhí)著于自己一開(kāi)始的假設(shè)。
          ?
          人們通常把人才分為兩種:戰(zhàn)略性人才和分析性人才,這樣的分法就好像在暗示一個(gè)人無(wú)法同時(shí)擁有這兩種能力。但是事實(shí)上,一般最好的分析性人才恰恰是那些能理解公司戰(zhàn)略性政策和想法,并且懂得如何和業(yè)務(wù)部門(mén)溝通的人。而最好的戰(zhàn)略性人才也恰恰是那些具備足夠數(shù)據(jù)分析能力的人。
          ?

          原文標(biāo)題:5 Lessons McKinsey Taught Me That Will Make You A Better Data Scientist

          原文鏈接:https://towardsdatascience.com/5-lessons-mckinsey-taught-me-that-will-make-you-a-better-data-scientist-66cd9cc16aba?gi=2242e432865c

          譯者簡(jiǎn)介:苗雨,美國(guó)加州大學(xué)洛杉磯分校應(yīng)用統(tǒng)計(jì)學(xué)碩士在讀,畢業(yè)后準(zhǔn)備繼續(xù)在統(tǒng)計(jì)學(xué)領(lǐng)域讀博深造。對(duì)機(jī)器學(xué)習(xí),因果推斷很感興趣,希望能和大家一起成長(zhǎng)。

          轉(zhuǎn)自:數(shù)據(jù)派THU 公眾號(hào);

          AI學(xué)習(xí)路線和優(yōu)質(zhì)資源,在后臺(tái)回復(fù)"培養(yǎng)方案"獲取

          整理不易,點(diǎn)三連

          瀏覽 57
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          評(píng)論
          圖片
          表情
          推薦
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  日本A V免费观看电影大全 | 香蕉操妣| 97骚女在线 | 国产AV无码专区亚洲A∨毛片 | 97国产在线视频 |