<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          在北京多少積分可以落戶?用Python 幫你分析6019位落戶人員信息

          共 2463字,需瀏覽 5分鐘

           ·

          2020-01-08 23:24

          作者 |?MINUS大大
          來源 |?凹凸玩數(shù)據(jù)


          北京積分落戶制度已經(jīng)實行兩年了,2018年申報積分落戶的124657名申請人中6019位落戶人員取得落戶資格。


          而去年2019年,申報積分落戶人數(shù)為106403名,實際公示名單共6007人。


          準備打開官方網(wǎng)站下載數(shù)據(jù)分析一下,結(jié)果發(fā)現(xiàn)過了公示期網(wǎng)頁就打不開了。


          經(jīng)過一番努力,在網(wǎng)上收集到了2018年的6019位落戶人員名單和信息(均為公開展示信息)。



          01

          數(shù)據(jù)分析


          我們本次用到的分析工具包有:pandas 、seaborn 和Matplotlib。


          落戶數(shù)據(jù)是csv文檔(文末可下載),內(nèi)部記錄了6019條落戶信息。


          所以先利用pandas讀取數(shù)據(jù)csv文檔,并看看有哪些列,可以看到這個表有4列構(gòu)成,人名、生日、公司、積分


          luohu_data?=?pd.read_csv('./bj_luohu.csv',?index_col?=?'id')
          luohu_data.head(5)


          e102ffc793bde092dfbc79c8789e1bee.webp


          此時有一個疑問這些人來自哪些公司呢?公司有沒有重復的? 這些公司都是哪些行業(yè)的?


          所以按照公司分組查看一下:


          company_data?=?luohu_data.groupby('company',?as_index=False).count()[['company',?'name']]
          company_data.rename(columns={'name':'人數(shù)'},?inplace=True)??????#?替換?1
          company_data.rename(columns={'company':'公司名'},inplace=True)??#?替換?2
          company_data.head(20)


          b1df02bad0e233844959177476ee2956.webp


          這么直接看的話人數(shù)沒有順序的,所以我們再對人數(shù)進行降序排列,看看落戶最多的哪幾家!


          company_sorted_data?=?company_data.sort_values('人數(shù)',?ascending=False)
          company_sorted_data.head(15)???#?前15


          c0941cdf849c8014615288efc6c684f6.webp


          emmmm。。。。滿眼科技公司,華為、百度、聯(lián)想、愛立信、騰訊均在前15名,其次是一些國企央之類的。



          2

          數(shù)據(jù)可視化


          積分數(shù)socre是連續(xù)數(shù)值,因此這里進行分段分析,經(jīng)過describe初步了解,得分最小90,最大122.6 所以這么劃分:90-130分,5分一段


          cut_bins?=?np.arange(90,?130,?5)???#分段設(shè)置
          bins?=?pd.cut(luohu_data['score'],?cut_bins)??#?將落戶數(shù)據(jù),按照cutbins來切一下
          bin_counts?=?luohu_data['score'].groupby(bins).count()
          bin_counts.head(10)


          bf8e7aba952aabc4e80726093f987c3f.webp


          直接出來的話是數(shù)據(jù),那么我在直接畫個圖更直觀的看一下


          plt.figure(figsize=(15,8))
          plt.rcParams['font.family']='Arial?Unicode?MS'
          plt.rcParams['axes.unicode_minus']=False
          plt.rcParams['font.size']=12

          x_name=['90-95','95-100','100-105','105-110','110-115','115-120','120-125']
          sns.barplot(x_name,bin_counts)
          plt.ylabel('人數(shù)')
          plt.xlabel('分數(shù)區(qū)間')

          for?x,?y?in?zip(range(7),?bin_counts):
          ????plt.text(x,?y+20?,?y,?ha='center',?va='bottom')

          plt.show()


          cd6c6889caec94b007451188196df39b.webp


          可以看到,落戶人數(shù)主要集中在90-100分之間,合計5101人,如果想落戶,達到95分就沒什么問題了。


          那么現(xiàn)在又有個問題,比如達到90分以上我都60了也沒啥意義了,那么這些落戶的主要集中在什么年齡段呢?年齡與積分有相關(guān)性嗎?來看看。


          首先需要根據(jù)生日算一下落戶年齡


          luohu_data['age']?=?(pd.to_datetime('2018-07')?-?pd.to_datetime(luohu_data['birthday']))?/?pd.Timedelta('365?days')
          luohu_data.describe()


          7751975703738a39e45f3a86350aa885.webp


          mean=luohu_data['age'].mean()
          std?=luohu_data['age'].std()

          #?得到上下限
          lower?,?upper?=mean?-3*std?,?mean+3*std

          print('均值',mean)?
          print('標準差',std)?
          print('下限',lower)?
          print('上限',upper)


          得到:


          037bf81292f731f7199362e742c23815.webp



          作圖看一下分布


          #fig.set_size_inches(15,5)???#?設(shè)置畫布大小
          sns.distplot(luohu_data['age'])??


          9acb15d2f6e48b6b17a288727b72705c.webp


          可以看到,最小的年齡也32歲了最大年齡60歲,75%分位數(shù)在43歲左右。年齡均值42歲。



          3

          總結(jié)


          根據(jù)本篇簡單的數(shù)據(jù)分析我們發(fā)現(xiàn):


          通過積分獲得北京戶口的年齡段集中在35歲到46歲之間,主要為42±2歲之間;積分集中在90分左右,行業(yè)集中在IT和國企央企及金融行業(yè)


          據(jù)有關(guān)媒體統(tǒng)計,在北京當前的積分落戶政策下,本科生需要15左右年才能拿到100分,研究生也需要12年以上才能拿到100分。


          大家想一下:雖然現(xiàn)在100分可以落戶,但12/15年后跟你同批的畢業(yè)生就全都100分了......


          而其他城市的落戶政策是上海七年,香港七年,深圳一年,北京落戶還真是真是不容易啊。



          相關(guān)分析源碼和北京積分落戶數(shù)據(jù)已上傳github:https://github.com/zpw1995/aotodata/tree/master/bj_luohu




          ---?長按下圖 關(guān)注豬哥---

          瀏覽 50
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          評論
          圖片
          表情
          推薦
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  女人天堂中文字幕 | 成人黄色视频在线观看网站 | 日韩无码精品国免 | 日本丁香婷婷五月天色电 | 日韩一级中文 |