SFrame數(shù)據(jù)分析處理組件
Scalable 表格 (SFrame, SArray) 和圖形 (SGraph) 數(shù)據(jù)結(jié)構(gòu)用于數(shù)據(jù)分析。SFrame 提供下列結(jié)構(gòu)的完整實(shí)現(xiàn):
SFrame
SArray
SGraph
C++ SDK surface area (gl_sframe, gl_sarray, gl_sgraph)
SFrame 包含來自 Dato 的開源組件 GraphLab Create 。
SFrame 關(guān)鍵特性:
一個(gè)可伸縮的列壓縮,基于磁盤后端存儲(chǔ)的數(shù)據(jù)幀,為機(jī)器學(xué)習(xí)和數(shù)據(jù)科學(xué)研究優(yōu)化.
主要為表格和圖形數(shù)據(jù)而設(shè)計(jì)
支持強(qiáng)類型化的數(shù)據(jù)列和弱類型列
統(tǒng)一支持?jǐn)?shù)據(jù)丟失處理
查詢優(yōu)化以及延遲仿真
A C++ API (gl_sarray, gl_sframe, gl_sgraph) with direct native access via the C++ SDK.
A Python API (SArray, SFrame, SGraph) with an indirect access via an interprocess layer.
環(huán)境要求:
SFrame 要求 64 位操作系統(tǒng)
操作系統(tǒng)
Mac OS X: 10.8+
Linux: Any distribution with GLIBC >= 2.11
Ubuntu >= 11.04
Debian >= 6
RHEL >= 6
SLES >= 11
Windows (7, 8, 10, Server 2012 R2)
Python
Python 2.7.x
Note: Unfortunately, Python 3.x is currently not supported.
