chDB嵌入式 SQL OLAP 引擎
chDB 是一個(gè)由 ClickHouse 驅(qū)動(dòng)的嵌入式 SQL OLAP 引擎。
特點(diǎn)
- 嵌入在 Python 中的 SQL OLAP 引擎,由 ClickHouse 驅(qū)動(dòng)
- 不需要安裝 ClickHouse
- 支持 Parquet、CSV、JSON、Arrow、ORC 和其他 60 多種格式的輸入輸出,示例。
目前,chDB 只支持在 macOS(x86_64 和 ARM64)和 Linux 上的 Python 3.7+。
pip install chdb
用法
在命令行中運(yùn)行
python3 -m chdb SQL [OutputFormat]
python3 -m chdb "SELECT 1,'abc'" Pretty
目前,chDB 僅支持 query 函數(shù),用于執(zhí)行 SQL 并返回所需格式的數(shù)據(jù)。
import chdb res = chdb.query('select version()', 'Pretty'); print(res.data())
使用 Parquet 或 CSV
# 查看更多數(shù)據(jù)類型格式,請(qǐng)參見(jiàn) tests/format_output.py res = chdb.query('select * from file("data.parquet", Parquet)', 'JSON'); print(res.data()) # 對(duì)于大型數(shù)據(jù)結(jié)果,get_memview() 更快,因?yàn)樗恍枰~外的數(shù)據(jù)復(fù)制。 res = chdb.query('select * from file("data.csv", CSV)', 'CSV'); print(str(res.get_memview().tobytes()))
Pandas DataFrame 輸出
# 更多內(nèi)容請(qǐng)參見(jiàn) https://clickhouse.com/docs/en/interfaces/formats chdb.query('select * from file("data.parquet", Parquet)', 'Dataframe')
評(píng)論
圖片
表情
