<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          胡曉曼:MindSpore 開源運營與治理 | DEV. Together 2021 中國開發(fā)者生態(tài)峰會

          共 11627字,需瀏覽 24分鐘

           ·

          2021-07-19 17:12

          內(nèi)容來源:2021 年 6 月 5 日,由 SegmentFault 思否主辦的 2021 中國開發(fā)者生態(tài)峰會圓滿落幕。會上,華為 MindSpore 運營總監(jiān)胡曉曼發(fā)表了主題為《MindSpore 開源運營與治理》的演講。

          分享嘉賓:胡曉曼,華為 MindSpore 運營總監(jiān)

          速記整理及發(fā)布:SegmentFault 思否編輯部
                     
           
          今天跟大家分享一下 MindSpore 的開源運營與治理。在講之前,先跟大家做個自我介紹。我叫胡曉曼,15年畢業(yè),畢業(yè)之后一直在做算法工程師,做了四年的算法工程師寫了四年代碼,19年去了百度,做深度學習布道師,去年加入華為,負責 MindSpore 整個社區(qū)的開源運營。其實在接到大會邀請的時候,我非常地詫異,也非常開心,因為從算法轉到運營的時候,我特別擔心會不會失業(yè)(笑)。因為圈子太小了,很多人不會特別關注開發(fā)者運營這個事情。其實開源運營可以算是新的工種,它不像研發(fā)或算法工程師去做圖像、做 NLP,有非常明確的目的,也有非常明確的職業(yè)規(guī)劃,在市面上找任何這樣的工作都非常方便。所以今天跟大家分享到底什么是開源運營與治理,我們這一年到底在做什么事情?
           

          什么是開源運營與治理?

           
          開源運營到底是什么?我總結了幾個點。
           
           
          我們認為開源運營的核心點用技術把圈內(nèi)人連接起來,用創(chuàng)新的方式把圈層的影響力不斷擴大,讓圈外人也能知道你的技術產(chǎn)品是什么。很多人只注重前者,做的內(nèi)容只針對圈內(nèi)技術人群,但是如果要火,一定要讓不想看你內(nèi)容的人也能看完,我們叫「出圈」。但難點在于,現(xiàn)在很多運營的方式非常趨于同質(zhì)化,大家對于運營很常見的誤解是他們是做新媒體的,或者是不是在朋友圈發(fā)廣告的,以為他們是小編,這其實是一種誤區(qū)。我們發(fā)現(xiàn)市面上有技術背景的運營同學非常少見,也非常非常難招。我們要運營的是技術框架,那么有技術背景對于我們來說是必不可缺的。我們目前整個團隊基本上都是有技術背景的。
           
          整體的開源運營的內(nèi)容,我把它分為四塊:第一塊是產(chǎn)品運營,包含我們常見的內(nèi)容、渠道、社區(qū)、KOL 以及品牌;第二塊是社區(qū)治理,包括TSC、SIG、WG等;第三塊是開源合作,包括功能型合作和應用型合作等等;后一塊是我們最常見的基礎設施,包括 CI 系統(tǒng),也有數(shù)字化運營看板,幫助你更好地了解運營效果到底怎么樣。
           
          總結而言,我們目前對于開源運營有幾個原則。第一,我們認為開源運營的核心人員必須要懂技術。我待過的一些運營團隊中,很多人是不懂技術的。那么在正常的工作中,你很難跟他進行深入的交流,對于框架或者對技術本體,我們到底應該采取哪種合適的方式,讓開發(fā)者更好地了解它。來到華為之后,我們要求我們組所有人必須懂技術,如果你不會,那就去學。有的同學是學文科的,我們要他也必須去學Shell腳本去學Python,再慢慢去學習 MindSpore。
           
          第二,營銷和商業(yè)的氛圍不要過于濃厚。很多人會把運營、市場和商務BD分不清楚。他們會說,這三個好像可以互相轉換,運營不也是用推銷嗎?營銷市場marketing不也是做廣告嗎?好像會讓人感覺沒有區(qū)別。但其實運營和marketing和營銷人員是有本質(zhì)區(qū)別的,我們不是純粹的PR,不是純粹地打廣告。
           
          第三塊是我們總結出來的經(jīng)驗,在所有的運營塊,我們認為應該要敢于試錯。我們現(xiàn)在沒有特別完整或者說特別規(guī)范的一條路讓大家去遵循。對于很多方式,我們都是在去嘗試。嘗試之后,再去看它的效果,如果覺得效果可以,就把比較好的經(jīng)驗總結下來,如果覺得不太好,我們再繼續(xù)去迭代。不斷迭代,反復復盤再總結經(jīng)驗,實踐多了,路就出來了。
           
          先簡單講一下MindSpore是什么,它是去年3月28號華為開源的一個全場景AI計算框架。有人會覺得很疑惑,現(xiàn)在市面上已經(jīng)有TensorFlow、PyTorch,為什么我們還要去做深度學習框架?它的核心優(yōu)勢在哪里?你憑什么讓開發(fā)者選擇你的框架,把原來的框架給替換掉?
           
           
          其實MindSpore有幾個非常核心的點。大家可以看到右邊“自動并行”、“二階優(yōu)化”,這兩點讓大家能夠非常高效地訓練模型。比如說你原來需要一周或一天的時間來訓練模型,那么在其他條件不變的情況下,使用MindSpore,你可以極大地縮短模型訓練時間,這對于很多企業(yè)實際生產(chǎn)落地是非常大的優(yōu)勢。第二是動靜態(tài)圖的轉化非常方便,適合開發(fā)者切換。第三是全場景部署協(xié)同,對于開發(fā)者而言簡化了部署流程,具有非常好的易用性。后面的幾點就不詳細講了,今天主要是講開源運營,這里只是給大家介紹一下我們MindSpore到底是什么。
           
          我們做了一年的開源社區(qū)運營,整體來說,截止到2020年5月底,MindSpore累計下載量有35萬多,整體的PR數(shù)是2.6萬,目前社區(qū)一共上線了120多個模型、2000多個上線應用。沒有用過不要緊,大家如果用的是華為手機,華為手機就有用MindSpore Lite訓練的模型應用,日均調(diào)用量3億多次。
           

          開源運營與治理核心內(nèi)容

           
          接下來進入正題。今天想跟大家分享的是用模型的思維做開源運營。
           
           
          我以前是做算法的,我們每天要去訓練各種各樣的模型,現(xiàn)在發(fā)現(xiàn)這個思路完完全全可以用到運營上面。大家想一下,我們做算法的時候,拿到一個項目,首先關注的是項目的需求應該怎么樣去分析,怎樣滿足業(yè)務方。那么在分析完需求之后,我們要去對數(shù)據(jù)做大量地清洗,獲取高質(zhì)量的數(shù)據(jù),再去進行模型訓練、模型評估,看模型效果再進行調(diào)優(yōu)。如果達到指標了,我們就可以進行模型的上線和部署。
           
          把這個思路放到運營這塊也是一樣的,運營也是需要先了解現(xiàn)在要做的項目,要達到怎樣的目標,再來分解任務。比如說我們要做MindSpore的開源運營,那么我們首年的目標是什么,第二年的目標是什么,第三年之后我們要做成什么樣都需要先想清楚。所以頭三年的目標我們要先要確定,尤其是首年的。首年的目標確定了之后,我們要對目標進行分解,比如 MindSpore 第一年我們要達到的總體下載量是10萬。這個數(shù)字是怎么出來的呢?其實10萬這個數(shù)字并不是非常明確的目標,不是說其他家首年下載是10萬,我們也得是10萬。我們只是認為要達到這個數(shù)字,就能證明我們有向上的趨勢,我們才有值得繼續(xù)向前去做的基礎,兩者之間是相關性,不是因果性。
           
          那么分解指標之后,我們在做的所有運營活動都得滿足最小MVP原則,什么意思呢?就是我們做任何活動都會滿足最小可用產(chǎn)品原則。比如我們團隊開發(fā)的一個技術項目TinyMS,它是基于MindSpore做的高級API工具,這個小工具是為了讓大家,尤其是小白更輕松地上手,非常簡單地去學習MindSpore,入門AI。當時我們做這個工具的時候,我們團隊雖然大家都有技術背景,但有些同學不是純算法,那我們一定要想好這個產(chǎn)品的最小可用的產(chǎn)品形態(tài)是怎么養(yǎng)的,需要設計一個解決用戶痛點,同時功能不能過于復雜的技術架構。于是我設計了整體的技術架構,帶著組里的研發(fā)把核心功能做出來,三個月先出一個版本,做出來上線之后看開發(fā)者的反應,再不斷地去調(diào)整,在下一個階段第二個版本迭代的時候,去做相應的調(diào)整。所以,最小MVP上線之后,我們要對它的效果做一些評估。不管是我們做的技術項目也好,還是說做任何課程,都會去看活動帶來哪些核心指標的轉化,評估之后進行優(yōu)化,再不停地反復迭代,知道我們總結出一個可復用成經(jīng)驗的方法論,后續(xù)再做新產(chǎn)品/任務的時候可以按照流程化去做,大量節(jié)省人力,并且保證產(chǎn)品質(zhì)量的穩(wěn)定性。
           
          我們可以看到,算法模型和運營模型有非常多的相同點。第一個相同點是都可以作為項目制,都要滿足最小MVP原則把項目盡快上線,而不是說花一兩個月的時間去做一節(jié)課,這非常浪費時間,市場并不會等你。第二個是都需要反復迭代。你就反復地去迭代,去發(fā)現(xiàn)問題所在,不斷地去優(yōu)化它,你的效果才能不斷地進步。第三個是不管是算法還是做運營,都需要做到差異化競爭。比如說做推薦算法,淘寶的推薦、京東的推薦、拼多多的推薦一定是有機制上的差異的。如果說三個都一樣,那對于用戶來說在選擇上會有一定的份額流失。尤其是對運營來說,你如果沒有差異化的推薦,今天用戶看到其他廠商做了課程,可以選他們的課程,隔天又看到我們做的課程,那用戶為什么要選擇我們?我們跟他們的差異化在什么地方?是我們老師更強,課程設計更有趣?還是我們運營的服務體驗更好,能夠讓所有的用戶在上課之后還能有些答疑,能夠得到完整的學習反饋?這是我們在做項目的時候需要經(jīng)常思考的點。
           
          但是它們還有幾個不同的地方。第一個是在公司里做算法模型需要更多地關注大量的數(shù)據(jù)。因為不管網(wǎng)絡結構優(yōu)化到什么地步,根據(jù)經(jīng)驗,更多的時候還不如把數(shù)據(jù)做到足夠好,增加到足夠多的高質(zhì)量數(shù)據(jù)去訓練模型。但是運營更關注的是實際的數(shù)據(jù)。要警惕數(shù)據(jù)指標的虛假繁榮,它雖然能在一定程度上體現(xiàn)工作成果,但也會蒙蔽你需要改進和提升的點。當然會有人持反對意見,認為數(shù)據(jù)能夠反映一切。我們不爭論這個論點,我想表達的是開源運營這個類別比較新,你沒有辦法找到非常符合你現(xiàn)在運營需求的數(shù)據(jù),去幫你做前期的調(diào)研,再給你們一些指導建議,再去做項目。別人的調(diào)研數(shù)據(jù)和你現(xiàn)有的繁榮數(shù)據(jù)的統(tǒng)計指標不一定能給你真實的正確的指標。第二個點是算法模型經(jīng)常做反復地優(yōu)化和迭代,達到一定的閾值之后再上線,但運營不是,運營最需要的是快速地產(chǎn)出你所期望的內(nèi)容。要給自己設置一個baseline,即設置一個基線的版本,而不是說我把產(chǎn)品的功能全部做完了,才能上線。做完再上線,別的競品可能早就已經(jīng)出來了,壓根不會等你。第三個是算法模型對于異常值,或者對于個體的關注會非常小,尤其是我們對于這種離異點的關注并不會特別的大(大部分場景)。但我覺得運營一塊對于個體的關注還是會非常重要,因為你只有知道開發(fā)者,尤其是一對一或者跟足夠多的開發(fā)者去聊,知道他們內(nèi)心真正關注的產(chǎn)品核心痛點是什么。你跟他聊了之后,才能做一些精細化的運營,找到他們最核心的訴求。不斷的假設自己是用戶,以及真正到用戶場景下體驗,和真正的用戶聊,才能挖掘需求的本質(zhì)。這不僅是做運營很重要的一點,做產(chǎn)品也是一樣。
           
          開源運營的整個體系化結構可以分為這幾塊。
           
           
          第一塊是品牌營銷。品牌營銷這塊,我們會做一些大型活動?;顒拥哪康木椭皇菫榱颂嵘放频挠绊懥?,不對關鍵的指標做直接轉化。很多人會問你們做這種大型活動到底帶來了哪些收益,做市場的人也可能會解釋不清楚到底帶來怎樣的收益。你可以說這個會議或是全網(wǎng)的關注量、播放量有多少,但老板會問你,它到底帶來了什么收益?我們最后得出來結論,對于品牌營銷,我們不對關鍵的直接指標做轉化。你看,我們做大型的會議、大型的活動,最后真的能像播放量的數(shù)字一樣,提升我們的核心指標嗎?未必,但讓更多的用戶感知也是非常重要的一環(huán)。
           
          第二塊是開源運營的核心內(nèi)容。這塊內(nèi)容非常多,我們有各種各樣不同的形式,包括文章、圖文、視頻、播客等等。形式非常多樣,我們要做到高頻的產(chǎn)出,對于每類活動或者內(nèi)容,我們都會設定特定的指標去做提升。比如課程,我們?yōu)榱颂嵘诵牡拈_發(fā)者,那么核心的開發(fā)者,我們就不會把它放在你去做播客或者是做一些對于開發(fā)者比較好的短視頻來去作為他的指標來去提升。
           
          第三塊是高校拓展。高校拓展是為了解決用戶的源頭問題,做高校拓展是為了發(fā)展開發(fā)者的基數(shù),收集學生的建議,提升整體框架或者整體產(chǎn)品的應用性。
           
          最后一塊是企業(yè)落地。今年我們會聯(lián)合華為AI計算中心昇騰創(chuàng)新中心,做核心區(qū)域的企業(yè)行活動,給企業(yè)提供算力并賦能,拓展一些企業(yè)的落地項目,提升市場份額。
           

          品牌營銷

           
          先給大家講一下我們做的哪些品牌營銷。比如今年五月初,在央視CCTV-2《經(jīng)濟半小時》里,給大家介紹了MindSpore這一年來做出的成績。第二塊是MindSpore周年慶。因為MindSpore是在去年3月28號開源的,所以我們在今年的3月28號做了周年慶活動,邀請了TSC委員會的成員、全球40多位技術專家和核心開發(fā)者以及企業(yè)落地用戶錄制祝福視頻和技術分享。最后是MindSpore吐槽大會。吐槽大會大家看過吧,我們?yōu)槭裁匆鐾虏鄞髸??因為很多開發(fā)者對我們的產(chǎn)品有一些建議,但是他沒有辦法或者沒有渠道做一些非常直觀的吐槽,基本就是提issue,或者去QQ群/論壇提問,所以我們就給開發(fā)者提供這么一個渠道,讓大家集中地去吐槽。這樣既可以拉近開發(fā)者和我們之間的距離,也可以讓我們的核心開發(fā)人員知道產(chǎn)品哪些地方容易讓開發(fā)者產(chǎn)生不好的體驗,實際做下來,效果非常好。此外,左邊是一些高端活動,右邊是今年剛剛通過的可信開源社區(qū)評估體系認證,MindSpore是首批并且是唯一一個通過可信開源評估的AI框架。它的評估不僅包括技術,也包括社區(qū)的運營、社區(qū)的規(guī)范、社區(qū)的治理等等,對每個方面都會有評分,還是非常不容易的。
           

          核心內(nèi)容

           
          接下來看核心內(nèi)容這一塊。先給大家說下產(chǎn)品內(nèi)容,我們這塊不僅包括自產(chǎn)內(nèi)容,也包括開發(fā)者的內(nèi)容。我們?nèi)绻亲约寒a(chǎn),那相當于我們自己關著門自己玩。我們一定要鼓勵開發(fā)者,尤其是核心開發(fā)者去給我們貢獻內(nèi)容。開發(fā)者內(nèi)容不僅包括普通的開發(fā)者、社區(qū)的開發(fā)者給我們?nèi)懳恼拢蛘咚麉⒓恿嘶顒又髮懥艘恍┘夹g文章,我們還會聯(lián)系一些核心的KOL給我們做一些核心技術亮點的視頻。

           
          這個是我們團隊做的技術項目,剛剛給大家講過。其實很多人對運營團隊有刻板印象——運營團隊也能做技術項目嗎?包括我們公司內(nèi)部也會覺得很奇怪:哎,這個項目你們是不是找的研發(fā)去做的?其實完全沒有必要。我們當時想一個小白新用戶去接觸MindSpore框架,對他來說上手是有一定難度的,得熟悉它的API、整體架構,這對于純小白開發(fā)者來說是有門檻的。TinyMS的目的是降低門檻,讓純小白開發(fā)者學習AI沒有門檻,從零就能夠去學習上手AI類的項目。TinyMS的整體架構非常簡單,數(shù)據(jù)類的模塊內(nèi)置了很多數(shù)據(jù)集,在Model類里內(nèi)置了不少常用的深度學習模型,對于開發(fā)者來說,你只需寫一行代碼就可以做數(shù)據(jù)集的調(diào)用、模型訓練以及模型部署。
           
          除了技術項目,我們所有的課程基本上都會錄制一個系列。左上角的是21天集訓營,是我們?nèi)ツ晔路葑龅娜の秾崙?zhàn)類課程;右上角是每一次迭代發(fā)布新版本發(fā)布之后做的兩日集訓營,讓開發(fā)者能夠最快速地了解我們迭代的新特性;下面是TinyMS配套的保姆級教程;右邊是SIG meeting,以及TSC meeting等等。同一系列的視頻,我們都是用相同的封面,風格非常統(tǒng)一,重點也非常突出,方便開發(fā)者尋找視頻。公眾號這一塊比較常規(guī),就不仔細講了。整體的要求是希望我們的運營團隊在做公眾號的時候能夠保持主KV色調(diào)一致,因為我們的主logo是漸變藍,然后在高峰時段統(tǒng)一發(fā)布。
           
          MindSpore B站運營的話,剛剛已經(jīng)給大家講了我們B站目前是哪些內(nèi)容,投放的話也會在高峰的時間段去做。所有現(xiàn)在這些視頻都已經(jīng)上傳到了CCF的電子圖書館,大家不僅可以在B站上看,也可以在CCF數(shù)字圖書館看。目前,我們是唯一一個在CCF圖書館上有完整視頻學習課件的AI計算框架。
           
          說到抖音,其實很多人會很好奇我們?yōu)槭裁匆プ龆兑?。因為常?guī)理解來說抖音并不是技術人員愛逛的社區(qū),很多程序員手機里都沒有抖音。但是我們當時想現(xiàn)在開發(fā)者越來越年輕。而MindSpore剛剛出來,很多人并不知道MindSpore到底是什么,到底有哪些亮點,它和其他框架的特性對比提升點到底在哪個地方。按照慣例,我們發(fā)布新版本都是有release note對吧?會有一系列具體的更新,這些更新對于作為新用戶的開發(fā)者來說太長了,并不知道重點是哪一條。所以我就想能不能夠用一分鐘的視頻給大家講解我們版本發(fā)布的亮點。重點:不要超過一分鐘,用貼近開發(fā)者生活的故事去講我們版本迭代更新的技術特性。

           
          比如左下角這個視頻,這個是0.6-beta的版本。該版本當時發(fā)布的核心點之一Wide&Deep,Wide&Deep當時訓練用昇騰的16pcs,23.6分鐘就可以訓練完成,在目前所有框架里是性能最高的。如果我直接說這樣一句話,內(nèi)行的會懂,但是你不做推薦方向的人不會懂,外行就更不懂了。所以當時我們就套了這么一個故事,女主角想要了解他有哪些喜好,可以用MindSpore的Wide&Deep模型,只需要23.6分鐘就可以訓練完成,做一個“猜你喜歡”的系統(tǒng)。然后打上了“愛情”的標簽,把這個故事拍成一個短視頻上線了之后,24小時內(nèi)播放量達到10萬+。我沒有做任何投放,因為抖音投放太貴了,而且我們不知道效果怎么樣,我們只是靠內(nèi)容去吸引大家關注我們的產(chǎn)品亮點。
           
          除了抖音之外,我們還運營了視頻號和播客號。視頻號以開發(fā)者內(nèi)容為主,主題比較多變,形式非常有趣。但播客號不一樣,播客號的內(nèi)容集中在和AI技術專家的訪談為主,我們會分享AI產(chǎn)業(yè)實踐落地的東西,跟視頻號會有差異化。
           
          整體的社區(qū)之間的體系,我們設置得也是跟常規(guī)的體系設置不一樣的。
           
           
          大家可以看到右下角這個圖,我們分為SI、ST、GI、GT等等。它是MindSpore單詞的拆分,中間加了Gradient和Jacobi的單詞,每個等級的開發(fā)者都會有編號,且編號唯一。比如你今天參加了我們活動的認證,那么我們會給你認證的編號。你在社區(qū)的代號是唯一的,這個代號不同于GitHub賬號或者其他的賬號是你的個人標識,這個賬號代表你在社區(qū)的標識。我們把這個推出來之后,更多的開發(fā)者愿意參與或者走進我們的社區(qū),就是為了得到社區(qū)的認證編號,讓他覺得有一種歸屬感和存在感。在KOL運營這塊,在B站我們找了科普類KOL李永樂老師,來給我們用非常簡單的方式講解MindSpore到底能做什么。
           
          直播這塊其實非常常見,大家也都會做。但直播這塊我們其實也是有區(qū)分的,我們會在抖音和B站上做直播,B站上的比較常規(guī),分享技術內(nèi)容,是純分享式的直播,不會和觀眾面對面或者時刻關注彈幕去交流,一般都是先講完了再看看有沒有彈幕問題再去回答。抖音直播,和另外的人連線需要點PK模式,這對于開發(fā)者來說,它是非常新、而且沉浸式的互動。我可以邀請MindSpore技術專家共同聊聊技術特性到底是怎么產(chǎn)出的、開發(fā)過程中遇到哪些問題,會讓開發(fā)者對這個技術特性有更深刻的興趣或理解。除了找技術專家做直播以外,我們同樣也會邀請開發(fā)者做直播。我們所有的優(yōu)秀開發(fā)者都需要在抖音上做直播的答辯,去分享他們與MindSpore的故事。同樣,MSG組織者也需要經(jīng)過答辯,如果成為MSG組織者需要做哪些內(nèi)容、有哪些經(jīng)驗等,并且所有直播我們都會公開放在B站上面。
           
          課程這塊,21天集訓營是面向初中級開發(fā)者的趣味性課程。很多課程,尤其深度學習課程,第一堂課大多數(shù)是手寫數(shù)字識別,對于很多開發(fā)者來說會有“審美疲勞”。如果我要學習MindSpore,第一課也是要學手寫數(shù)字識別,就會覺得很沒勁。我們當時就想第一課能不能用一種比較新的課程實踐。當時微博有個熱搜,一個云南的小伙子誤食了毒蘑菇,出現(xiàn)了幻覺。于是我們就想,能不能夠用MindSpore去做毒蘑菇識別,幫開發(fā)者或者日常生活中的人們檢測蘑菇到底有沒有毒。我們馬上就研發(fā)了模型,找了蘑菇的數(shù)據(jù)集,去做了案例。沒想到反響還挺好,大家最后做出來之后會拿各種各樣的蘑菇圖片,包括超級瑪麗的那種蘑菇去測試。這非常能夠拉近開發(fā)者對于框架技術本身的聯(lián)系。此外還有兩日集訓營,從去年開始,我們每個月月末會做一次迭代并發(fā)布新版本,新版本會有新的特性。除了剛剛講到的用技術視頻讓圈外的人了解新特性以外,圈內(nèi)的人或開發(fā)者更希望知道這些特性能不能夠運用在實際生產(chǎn)過程當中。所以我們做了兩日集訓營,專門讓這些特性研發(fā)的技術專家來講特性到底做了什么內(nèi)容,做一些技術直播的干貨分享。
           
          下面是MindCon 極客周。MindCon 極客周是去年底做的活動,活動成本非常低,幾乎沒有花什么成本,但最后的效果非常好。我們最后整體收獲了我1萬多名D0級開發(fā)者參與貢獻,合入了20多條bugfix。我們怎么做的呢?當時我們創(chuàng)建了一個組織MSG,MSG是MindSpore Study Group的簡稱,即MindSpore學習小組,我們?nèi)ツ曜龅氖菂^(qū)域性的組織,在各個城市,包括上海、北京、深圳以及蘇州、杭州、天津等都會做這么一些區(qū)域型的組織。讓所有城市組織者來做比拼:哪個城市的人解決的bug越多,積分就會越高。最后得到積分最高的,我們會有一個物質(zhì)激勵。雖然激勵不多,但是會非常激發(fā)開發(fā)者的興趣,到最后他們來解bugfix的時候,他們已經(jīng)被解bugfix、參與開源的過程給吸引住了,而不是僅僅說為了得到這個獎勵才參加活動。所以即使沒有獲得第一,那也參與到開源貢獻中了,從0成為開源轉化的貢獻者。
           
          剛剛提到了一個詞:MSG。其實大家看到TensorFlow、PyTorch都會有各自的區(qū)域型組織,TensorFlow的組織叫TFUG。我們完全可以做自己的城市化組織,MSG就是各個不同的區(qū)域組織一些線下活動。去年我們主要做的是區(qū)域型的組織,年底的時候做了一些高校型的,今年我們把它更為系統(tǒng)地梳理了一下,包括區(qū)域型、高校型和企業(yè)型。從去年七月份到現(xiàn)在,不到一年的時間,我們國內(nèi)做了13個城市,海外做了七個城市(當然海外都是線上的),做了五場校園行,最后是做企業(yè)是一個嘗試,我們聯(lián)合白玉蘭開源、云啟資本、Julia社區(qū)、Graviti等一些初創(chuàng)公司,做了一個初創(chuàng)企業(yè)MSG,去了解他們公司,尤其是做開源的初創(chuàng)公司,到底有哪些是我們這邊可以提供的。企業(yè)行對投資方來說是非常有收益的,因為它們在當中可以發(fā)現(xiàn)一些優(yōu)秀的初創(chuàng)開源企業(yè);對于我們來說也很有幫助,可以了解到現(xiàn)在市場上對于開源社區(qū)到底是怎么樣的衡量標準,從而指導我們的工作,更好的去理解工作;對于參與的企業(yè)來說,他們也可以學習到優(yōu)秀的開源社區(qū)到底應該怎么去做。所以是一個三方互贏的一件事兒,未來我們會做更大更多的探索,在下半年會圍繞昇騰創(chuàng)新中心,做核心區(qū)域的企業(yè)行活動,給企業(yè)提供算力并賦能,持續(xù)拓展。
           
          在技術比賽這塊,我們面向?qū)W生、面向開發(fā)者、面向高校都有不同的活動。舉例來說,面向?qū)W生的比賽是暑期2021開源軟件供應鏈點亮計劃,讓大家參與社區(qū)做一些具體的任務;面向開發(fā)者做一些TinyMS模型復現(xiàn)賽。當時我們做的時候,TinyMS 0.1版本是3月31號發(fā)布的,我們發(fā)布了四個模型,讓大家去復現(xiàn)。就是你用其他的框架做的模型,能不能用TinyMS再去復現(xiàn)一下。大家知道第一個提交復現(xiàn)的是多少時間嗎?17小時內(nèi)就有開發(fā)者基于TinyMS做出了第一個模型的復現(xiàn)。非常意外和驚喜!到現(xiàn)在,我們發(fā)布了一個月之后,四個模型都已經(jīng)提交完成了。我們比賽設置的是三個月,開發(fā)者的積極性和對于產(chǎn)品的認可度已經(jīng)遠超我們當時的預期。
           
          社群運營這塊就不細說了,我們包括QQ群、微信群、Slack群,整體社群人數(shù)目前已經(jīng)達到了2萬+。很多群剛開始的時候比較火熱,但是做一段時間就死了或者大家不說話了,這其實是很有問題的。如果大家不說話,我們會持續(xù)地丟一些技術問題,或者一些亮點的東西,激發(fā)開發(fā)者的興趣,讓大家持續(xù)在群里面進行討論。還可以把活躍的開發(fā)者分散在各個不同的群里,這樣就不用全部都是由官方的工作人員去運營。

           
          這個是我們?nèi)ツ陣L試的新的運營活動,朋友圈的話題運營。朋友圈有個新的功能:加上#號,帶上話題,點擊進去可以看到你的朋友圈里面用這個話題的有哪些朋友圈。我們給開發(fā)者提供MindSpore Lite的apk,這個apk安裝到安卓手機上之后,你可以用它直接來拍照,去檢測你現(xiàn)在拍到的物體是什么東西。于是我們策劃了「MindSpore搞笑嘉年華」——找到最鬼畜的東西,帶上這個話題發(fā)朋友圈。這對于很多開發(fā)者來說并沒有任何難度,只是為了讓大家能夠更快地接觸到這款產(chǎn)品,體驗它的檢測速度、準確率。整體來看,我們收獲了非常多的搞笑的圖片。并且有的開發(fā)者不滿足于只用官方提供的apk做掃描,還基于自己的數(shù)據(jù)重新訓練了模型來檢測街上各種不同的人等等。
           

          高校拓展

           
          第三塊是高校拓展。今年我們和教育部聯(lián)合做了智能基座的項目,簽了72所高校,會在學校里開課,以及MSG高校行的活動。學生是用戶源,希望同學們能在學校里就養(yǎng)成在開源社區(qū)貢獻的習慣、多接觸到優(yōu)質(zhì)項目,持續(xù)提升技術能力。
           

          企業(yè)落地

           
          最后一塊是企業(yè)。企業(yè)這塊對于很多開源社區(qū)來說其實不太好做,尤其是對新的開源社區(qū)。我們采取的策略是先打頭部用戶,除了我在PPT上展示的,今年在HTC(4月23號)我們和鵬程實驗室合作出了中文版的GPT-3模型——盤古大模型,它也是國內(nèi)發(fā)布的首個最大中文GPT-3模型。還有深圳灣實驗室,深圳灣實驗室其實是來自于社區(qū)的線索。我們?nèi)ツ?月20號做的第一場深圳MSG,當時深圳灣實驗室的張老師過來跟我們分享分子動力學的內(nèi)容,聽了MindSpore的分享后,在想是不是可以用MindSpore來做他們的訓練框架,因為分子動力學模擬有非常多的高階導數(shù)需要計算。他們嘗試著用TensorFlow,當時用的是一點幾的版本,對于分布式訓練以及高階導數(shù)的計算支持得并不是那么好。后來又轉到PyTorch,發(fā)現(xiàn)很好用,但是性能卻沒有TensorFlow好,這兩個就很矛盾。后來來到我們MindSpore社區(qū)之后,發(fā)現(xiàn)MindSpore在性能方面是有足夠優(yōu)勢的,于是就用MindSpore去做,目前進展順利。此外還有和京東聯(lián)合創(chuàng)立了NLP標桿算法,在智能客服場景里去應用等等。
           

          社區(qū)治理

           
          最后是開源社區(qū)的治理。我們采取的態(tài)度是完全開源開放的態(tài)度。目前的技術委員會TSC成員都來自于各個不同的高?;蛘咂髽I(yè)。除了專家委員會以外,我們還有一些SIG組,可以讓對某個模塊比較感興趣的同學加入到SIG組里具體地做一些參與開發(fā)的工作。

           
          大家可以看左邊這張圖,目前有包括akg圖算融合的、data數(shù)據(jù)增長與處理的,以及scurity安全的等等。其實還有很多SIG組。我們今年和上海交大的曹老師新增了一個用戶體驗DX-SIG組,收集用戶使用產(chǎn)品的問題和建議,再去改進。SIG組的開發(fā)方式,大家可以看一下,就不細講了。提交issue之后,我們會有committer進行任務指派,開發(fā)完成就可以提交PR直到合入閉環(huán)。

           
          我們整個基礎設施包括CI系統(tǒng)、CI-CLA機器人與同步機器人。大家可以在Gitee上開發(fā),也可以去GitHub上去貢獻。
           
          最后是數(shù)字化的運營看板。它包括很多,包括目前的star、fork、watch,以及你的每個層級的開發(fā)者。MindSpore的核心指標的變化趨勢,以及下載量的組成,用戶的留存,項目的健康度等等,所有這些都會集中在數(shù)字化運營看板里面。數(shù)字化運營看板可以及時幫我們復盤每一次活動帶來的收益,即除了我們自己會統(tǒng)計,我們也需要有第三方平臺幫我們統(tǒng)計,這樣的話,雙方驗證就能知道你的活動到底實際帶來的增量是多少,用戶的拉新和留存的情況,再進一步分析。這些都可以幫助你來去反思,讓你明白你的社區(qū)現(xiàn)在應該采取什么樣的策略才能更好成長。
           

          開源合作

           
          開源合作這塊,我們與Apache TVM、CNCF基金會、LFAI&Data基金會等均有合作,同時在AIIA開源開放推進組也有一些具體的開源合作內(nèi)容,未來會一一跟大家見面。
           
          這就是今天給大家分享的MindSpore開源運營和治理的相關內(nèi)容,希望未來有更多的人加入到開源社區(qū)運營,推動開源生態(tài),謝謝。

          關注【開發(fā)者生態(tài)】公眾號回復:hxm 下載演講 PPT
          點擊【閱讀原文】觀看胡曉曼演講視頻,重溫精彩時刻
          瀏覽 22
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          評論
          圖片
          表情
          推薦
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  国产精品久久免费视频 | 二区在线999 | 中文字幕AⅤ在线 | 97自拍 | 人妻夜夜爽天天爽三区麻豆AV网站 |