金融科技:建模工作環(huán)境
我們做數(shù)據(jù)建模工作,需要一個建模工作環(huán)境。
我基于公司申請的Ubuntu20.10系統(tǒng)的服務(wù)器搭建過可供多人使用Jupyter Hub建模平臺,支持Python工作、R工作和Linux工作三種方式,同時,也可以做賬戶管理、權(quán)限管理、共享管理等。我也基于自己的本地機器,在Win系統(tǒng)上面搭建建模工作環(huán)境,支持Python工作和R工作。順便說一下,我在金融科技行業(yè)做數(shù)據(jù)科學工作,Python語言和R語言,我都會使用。我從不做語言的好壞選擇,只看語言是否有利于我解決問題。(年后在看機會,有相關(guān)崗位的,請引薦,先謝謝了)
在這里,我分享下如何快速而高效地在本地機構(gòu)建建模環(huán)境?
01
1 軟件下載和安裝
1.1 安裝Anaconda軟件
軟件下載鏈接:
https://www.anaconda.com/products/individual
下載到本地后,逐步安裝即可。
1.2 安裝R軟件
軟件下載鏈接:
https://cran.r-project.org/bin/windows/base/old/
選擇一個版本安裝就可以了,你可以安裝R4.0.0
下載到本地后,逐步安裝即可。
1.3 安裝PyCharm軟件
軟件下載鏈接:
https://www.jetbrains.com/zh-cn/pycharm/download/#section=windows
你可以下載一個提供30天試用期的專業(yè)版軟件。
我這邊有一個他人分享的試用期重置的補丁,可以讓試用期無限長。
你可以添加我微信,我發(fā)給你。
02
2 Jupyter Lab作為建模環(huán)境
2.1 添加R核
首先,啟動Anaconda Prompt,進入R的安裝路徑下的bin文件夾,輸入R,進入到R控制臺
其次,執(zhí)行如下安裝命令
install.packages(c('repr', 'IRdisplay', 'evaluate', 'crayon', 'pbdZMQ', 'devtools',
'uuid', 'digest'))
devtools::install_github('IRkernel/IRkernel')
最后,配置R核
IRkernel::installspec(user = FALSE)
2.2 使用PyCharm創(chuàng)建數(shù)據(jù)項目
第一步:打開PyCharm軟件
第二步:進入File-New Project可以創(chuàng)建數(shù)據(jù)項目,命名建議以任務(wù)為導向,例如Prod_App_Credit_Score_Model,如下圖所示:

Python解釋器的配置,你可以在上圖中第2個紅色方框里面完成,找到你已經(jīng)安裝的Anaconda軟件下的python.exe解釋器。
2.3 啟動Jupyter Lab
在數(shù)據(jù)項目Prod_App_Credit_Score_Model,啟動Jupyter Lab
啟動方式,如下圖所示。

執(zhí)行命令
jupyter-lab
成功啟動后,如下圖所示。

這個時候,就可以使用Python工作方式或者R工作方式,針對數(shù)據(jù)項目開展數(shù)據(jù)建模工作了。
如何高效做數(shù)據(jù)建模,我推薦你看下這篇文章《金融科技:數(shù)據(jù)建模框架》。
03
3 一些測試用例
3.1 Python工作環(huán)境測試用例
在Jupyter Lab下,打開Python的notebook,做如下測試用例。
1 查看已經(jīng)安裝的Python庫
執(zhí)行如下命令
!pip list
部分結(jié)果如下圖所示:

2 評分模型的Python庫
寫入如下代碼
import toad as td
import scorecardpy as sc
print(td.__version__)
print(sc.__version__)
結(jié)果如下圖所示:

3.2 R工作環(huán)境測試用例
在Jupyter Lab下,打開R的notebook,做如下測試用例。
1 查看已經(jīng)安裝的R包
寫入如下代碼
library(tidyverse)
installed.packages() %>%
as.data.frame() %>%
dplyr::select(Package, Version)
部分結(jié)果如下圖所示:

3 評分模型的R包
寫入如下代碼
if(!require(scorecard)){
install.packages("scorecard")
require(scorecard)
}
# 查看R包的幫助信息
help(package="scorecard")
結(jié)果如下圖所示:


俗話說,“工欲善其事,必先利其器”。
搭建一個高效建模工作環(huán)境,有利于我們開展數(shù)據(jù)建模工作。
關(guān)于建模工作環(huán)境搭建,你有什么問題,可以添加微信,一起討論。
伙伴們所在公司若有金融科技行業(yè)數(shù)據(jù)科學崗位的招聘,請引薦給我,謝謝。
我是陸勤,在金融科技行業(yè)從事數(shù)據(jù)科學工作,也是一名終身學習者。我工作過的內(nèi)容主要包括數(shù)據(jù)清洗和準備、風控評分模型、數(shù)字營銷模型、風控策略分析、數(shù)據(jù)建模環(huán)境構(gòu)建和維護等。我可以提供智能風控和數(shù)字營銷的咨詢與服務(wù)。歡迎你添加我微信,一起討論金融科技的數(shù)據(jù)科學和數(shù)據(jù)人才。
金融科技專輯:
