DataVecETL 機器學(xué)習(xí)庫
DataVec 是基于 Apache 2.0 許可的 ETL 機器學(xué)習(xí)(Extract,Transform,Load)操作庫。 DataVec 的目的是將原始數(shù)據(jù)轉(zhuǎn)換成可以饋送到機器學(xué)習(xí)算法的可用向量格式。
當(dāng)前輸入數(shù)據(jù)類型支持開箱即用:
CSV Data
Raw Text Data (Tweets, Text Documents, etc)
Image Data
LibSVM
SVMLight
MatLab (MAT) format
JSON, XML, YAML, XML
評論
圖片
表情
