Github 30000 Star 的免費 BI 工具:Superset
閱讀本文大概需要 3 分鐘。
BI 工具是數(shù)據(jù)分析的得力武器,目前市場上有很多 BI 軟件,眾所周知的有 Tableau、PowerBI、Qlikview、帆軟等,其中大部分是收費軟件或者部分功能收費。這些工具一通百通,用好一個就夠了,重要的是分析思維。
我一直用的 Tableau,不過實在太貴,一年小一萬。之前在github接觸到一個基于瀏覽器的開源 BI 應(yīng)用,名叫「Superset」,是 Airbnb 團隊開發(fā)的。閑來無事就愛折騰,在安裝 Superset 配置階段用了一些時間,有點心累,不過實際用起來卻是非常 nice。
先看下面板效果:
它還可以和 deck.gl 集成,做高難度的地圖展示:
Superset 后端是基于 python 開發(fā)的,所以也算是 python 生態(tài)的一員。它的三大特點是:開源、輕量級、圖表豐富。相比較集成好的軟件,Superset 是有些使用門檻的,對新手沒那么友好,不過它免費呀,免費真香。
官方對 Superset 的介紹是:
通過 NVD3/D3 預(yù)定義了多種可視化圖表,滿足大部分的數(shù)據(jù)展示功能。; 易于使用的界面,用于瀏覽和可視化數(shù)據(jù); 創(chuàng)建和共享儀表板; 一個輕量級的語義層,允許通過定義維度和度量來控制數(shù)據(jù)源如何向用戶公開; 一個可擴展的、高粒度的安全模型,允許復(fù)雜的規(guī)則對誰可以訪問哪些產(chǎn)品特征和數(shù)據(jù)集。與主要身份驗證后端集成(數(shù)據(jù)庫、OpenID、LDAP、OAuth、REMOTE_USER、…); 通過 SQLAlchemy 與大多數(shù)基于 SQL 語言的 RDBMS 集成; 與 Druid.io 的深度集成;
有一個亮點,Superset 支持 sql 查詢,這太方便了,Tableau 似乎不可以。使用 SQL Lab 查詢和可視化數(shù)據(jù):
你可以導(dǎo)入 csv 等文本文件,并連接數(shù)據(jù)庫。Superset 支持的數(shù)據(jù)庫:
MySQL
Oracle
PostgreSQL
Presto
Snowflake
SQLite
SQL?Server
Teradata
Vertica
Hana
Amazon?Athena
Amazon?Redshift
Apache?Drill
Apache?Druid
Apache?Hive
Apache?Impala
Apache?Kylin
Apache?Pinot
Apache?Spark?SQL
BigQuery
ClickHouse
CockroachDB
Dremio
Elasticsearch
Exasol
Google?Sheets
Greenplum
IBM?Db2
不過要連接這些數(shù)據(jù)庫,需要安裝相應(yīng)的連接包:
自由選擇多種圖表類型:
更加豐富的案例:
Superset 的 python 依賴庫比較多,建議先安裝 Anaconda,避免不必要的麻煩。
具體安裝使用步驟見下:
#?Install?superset
pip?install?apache-superset
#?Initialize?the?database
superset?db?upgrade
#?Create?an?admin?user?(you?will?be?prompted?to?set?a?username,?first?and?last?name?before?setting?a?password)
$?export?FLASK_APP=superset
superset?fab?create-admin
#?Load?some?data?to?play?with
superset?load_examples
#?Create?default?roles?and?permissions
superset?init
#?To?start?a?development?web?server?on?port?8088,?use?-p?to?bind?to?another?port
superset?run?-p?8088?--with-threads?--reload?--debugger
在實際安裝使用過程可能會遇到各種各樣的麻煩,所以多問問 Google 吧,或者 stackoverflow。
后面我們會用專題來介紹 superset 的安裝、配置、使用、可視化展示。如果你也感興趣,那就點個再看吧!
項目地址:https://github.com/apache/incubator-superset
推薦閱讀
1
2
3
4
崔慶才
靜覓博客博主,《Python3網(wǎng)絡(luò)爬蟲開發(fā)實戰(zhàn)》作者
隱形字
個人公眾號:進擊的Coder
長按識別二維碼關(guān)注


