轉(zhuǎn)自 | OSC開(kāi)源社區(qū)
本文是 InfoWorld 2021 年公布的《最佳開(kāi)源軟件榜單》翻譯稿。??????????????????????????????InfoWorld 是一家信息技術(shù)媒體公司,成立于 1978 年目前隸屬于 IDG。每年 InfoWorld 都會(huì)根據(jù)軟件對(duì)開(kāi)源界的貢獻(xiàn),以及在業(yè)界的影響力評(píng)選出當(dāng)年的“最佳開(kāi)源軟件” (BOSSIE),該獎(jiǎng)項(xiàng)評(píng)選已經(jīng)延續(xù)了十多年。本次獲獎(jiǎng)的 29 個(gè)開(kāi)源項(xiàng)目包括:軟件開(kāi)發(fā)、開(kāi)發(fā)、云原生計(jì)算、機(jī)器學(xué)習(xí)等類(lèi)型,下面我們一起來(lái)看看,有沒(méi)有熟悉的面孔!1、Svelte 和 SvelteKit
在眾多創(chuàng)新的、開(kāi)源的、前端的 JavaScript 框架中,Svelte 及其全棧對(duì)應(yīng)的 SvelteKit 可能是最有野心和遠(yuǎn)見(jiàn)的。Svelte 一開(kāi)始就通過(guò)采用編譯時(shí)策略來(lái)顛覆現(xiàn)狀,并以出色的性能、持續(xù)的發(fā)展和卓越的開(kāi)發(fā)者體驗(yàn)向前邁進(jìn)。SvelteKit 現(xiàn)已進(jìn)入公測(cè)階段,它延續(xù)了 Svelte 的傳統(tǒng),通過(guò)采用最新的工具,并將部署到無(wú)服務(wù)器環(huán)境作為一項(xiàng)內(nèi)置功能來(lái)實(shí)現(xiàn)飛躍。地址:https://github.com/sveltejs/svelte
2、Minikube
Minikube 是一個(gè)易于在本地運(yùn)行 Kubernetes 的工具,可在你的筆記本電腦上的虛擬機(jī)內(nèi)輕松創(chuàng)建單機(jī)版 Kubernetes 集群。便于嘗試 Kubernetes 或使用 Kubernetes 日常開(kāi)發(fā)。地址:https://github.com/kubernetes/minikube
3、Pixie
Pixie 是 Kubernetes 應(yīng)用的可觀(guān)察性工具,它可以查看集群的高級(jí)狀態(tài),如服務(wù)地圖、集群資源和應(yīng)用流量;還可以深入到更詳細(xì)的視圖,如 pod 狀態(tài)、火焰圖和單個(gè) full-body 應(yīng)用請(qǐng)求。Pixie 使用 eBPF 自動(dòng)收集遙測(cè)數(shù)據(jù),它在集群本地收集、存儲(chǔ)和查詢(xún)所有的遙測(cè)數(shù)據(jù),使用不到 5% 的集群 CPU。Pixie的用例包括集群內(nèi)的網(wǎng)絡(luò)監(jiān)控、基礎(chǔ)設(shè)施健康、服務(wù)性能和數(shù)據(jù)庫(kù)查詢(xún)剖析。地址:https://github.com/pixie-io/pixie
4、FastAPI
FastAPI 是一個(gè)高性能 Web 框架,用于構(gòu)建 API。主要特性:快速:非常高的性能,與 NodeJS 和 Go 相當(dāng)
快速編碼:將功能開(kāi)發(fā)速度提高約 200% 至 300%
更少的錯(cuò)誤:減少約 40% 的人為錯(cuò)誤
直觀(guān):強(qiáng)大的編輯器支持,自動(dòng)補(bǔ)全無(wú)處不在,調(diào)試時(shí)間更少
簡(jiǎn)易:旨在易于使用和學(xué)習(xí),減少閱讀文檔的時(shí)間。
簡(jiǎn)短:減少代碼重復(fù)。
穩(wěn)健:獲取可用于生產(chǎn)環(huán)境的代碼,具有自動(dòng)交互式文檔
基于標(biāo)準(zhǔn):基于并完全兼容 API 的開(kāi)放標(biāo)準(zhǔn) OpenAPI 和 JSON Schema
地址:https://github.com/tiangolo/fastapi
5、Crystal
作為一個(gè)提供具有 C 語(yǔ)言的速度和 Ruby 語(yǔ)言的表現(xiàn)力的編程語(yǔ)言的項(xiàng)目,Crystal 已經(jīng)開(kāi)發(fā)了好幾年了。隨著今年年初 Crystal 1.0 的發(fā)布,該語(yǔ)言現(xiàn)在已經(jīng)足夠穩(wěn)定到可以用于一般工作負(fù)載。Crystal 使用靜態(tài)類(lèi)型和 LLVM 編譯器來(lái)實(shí)現(xiàn)高速度,并避免在運(yùn)行時(shí)出現(xiàn)空引用等常見(jiàn)問(wèn)題。Crystal 可以與現(xiàn)有的 C 代碼接口,以進(jìn)一步提高速度和便利性,它還可以使用編譯時(shí)宏來(lái)擴(kuò)展基礎(chǔ)語(yǔ)言的語(yǔ)法。地址:https://github.com/crystal-lang/crystal
6、Windows Terminal
Windows Terminal 是一個(gè)全新的、流行的、功能強(qiáng)大的命令行終端工具。包含很多來(lái)社區(qū)呼聲很高的特性,例如:多 Tab 支持、富文本、多語(yǔ)言支持、可配置、主題和樣式,支持 emoji 和基于 GPU 運(yùn)算的文本渲染等等。同時(shí)該終端依然符合我們的目標(biāo)和要求,以確保它保持快速、高效,并且不會(huì)消耗大量?jī)?nèi)存和電源。地址:https://github.com/Microsoft/Terminal
7、OBS Studio
OBS Studio 是一款用于實(shí)時(shí)流媒體和屏幕錄制的軟件,為高效捕獲,合成,編碼,記錄和流傳輸視頻內(nèi)容而設(shè)計(jì),支持所有流媒體平臺(tái)。- 高性能實(shí)時(shí)視頻/音頻捕獲和混合。創(chuàng)建由多種來(lái)源組成的場(chǎng)景,包括窗口捕獲、圖像、文本、瀏覽器窗口、網(wǎng)絡(luò)攝像頭、捕獲卡等。
- 設(shè)置無(wú)限數(shù)量的場(chǎng)景,用戶(hù)可以通過(guò)自定義過(guò)渡無(wú)縫切換。
- 帶有每個(gè)源濾波器的直觀(guān)音頻混合器,例如噪聲門(mén),噪聲抑制和增益。全面控制VST插件支持。
- 強(qiáng)大且易于使用的配置選項(xiàng)。添加新源,復(fù)制現(xiàn)有源,并輕松調(diào)整其屬性。
- 精簡(jiǎn)的設(shè)置面板使用戶(hù)可以訪(fǎng)問(wèn)各種配置選項(xiàng),以調(diào)整廣播或錄制的各個(gè)方面。
- 模塊化的“Dock” UI允許用戶(hù)完全根據(jù)需要重新排列布局。用戶(hù)甚至可以將每個(gè)單獨(dú)的 Dock 彈出到自己的窗口中。
地址:https://github.com/obsproject/obs-studio
8、Shotcut
Shotcut 是一款跨平臺(tái)的視頻編輯工具,允許人們?cè)趹?yīng)用效果和分層的同時(shí),對(duì)音頻和視頻軌道進(jìn)行所有的標(biāo)準(zhǔn)修正。Shotcut 有一個(gè)非常活躍的社區(qū),并提供大量的操作視頻和指導(dǎo),以幫助新手和高級(jí)攝像師。它可以在 Mac、Linux、BSD 和 Windows 上運(yùn)行--盡管是跨平臺(tái)的,但與同類(lèi)工具相比,它的界面很敏捷,使用起來(lái)也相對(duì)簡(jiǎn)單。地址:https://github.com/mltframework/shotcut
9、Weave GitOps Core
Weave GitOps 支持有效的 GitOps 工作流,以將應(yīng)用程序持續(xù)交付到 Kubernetes 集群中。它基于領(lǐng)先的 GitOps 引擎 CNCF Flux。地址:https://github.com/weaveworks/weave-gitops
10、Apache Solr
Apache Solr 是基于 Lucene 的全文搜索服務(wù)器,也是最流行的企業(yè)級(jí)搜索引擎。Apache Lucene 是你所使用的大部分軟件的搜索功能背后的基礎(chǔ)搜索技術(shù)--包括其他搜索引擎,如 Elasticsearch。與 Elasticsearch 不同的是,Solr 放棄了它的開(kāi)源許可,不過(guò)它仍然是免費(fèi)的。Solr 是可集群的、可在云端部署的,并且強(qiáng)大到足以建立云端級(jí)的搜索服務(wù)。它甚至包括 LTR 算法,以幫助自動(dòng)調(diào)整和加權(quán)結(jié)果。地址:https://github.com/apache/solr
11、MLflow
MLflow 由 Databricks 創(chuàng)建,并由 Linux 基金會(huì)托管,是一個(gè) MLOps 平臺(tái),可以讓人跟蹤、管理和維護(hù)各種機(jī)器學(xué)習(xí)模型、實(shí)驗(yàn)及其部署。它為你提供了記錄和查詢(xún)實(shí)驗(yàn)(代碼、數(shù)據(jù)、配置、結(jié)果)的工具,將數(shù)據(jù)科學(xué)代碼打包成項(xiàng)目,并將這些項(xiàng)目鏈入工作流程。地址:https://github.com/mlflow/mlflow
12、Orange
Orange 旨在使將數(shù)據(jù)挖掘"富有成效且有趣"。Orange 允許用戶(hù)創(chuàng)建一個(gè)數(shù)據(jù)分析工作流程,執(zhí)行各種機(jī)器學(xué)習(xí)和分析功能以及可視化。與 R Studio 和 Jupyter等程序化或文本工具相比,Orange 是非常直觀(guān)的。你可以將小部件拖到畫(huà)布上以加載文件,用模型分析數(shù)據(jù)并將結(jié)果可視化。地址:https://github.com/biolab/orange3
13、Flutter
Flutter 由 Google 的工程師團(tuán)隊(duì)打造,用于創(chuàng)建高性能、跨平臺(tái)的移動(dòng)應(yīng)用。Flutter 針對(duì)當(dāng)下以及未來(lái)的移動(dòng)設(shè)備進(jìn)行優(yōu)化,專(zhuān)注于 Android and iOS 低延遲的輸入和高幀率。它可以給開(kāi)發(fā)者提供簡(jiǎn)單、高效的方式來(lái)構(gòu)建和部署跨平臺(tái)、高性能移動(dòng)應(yīng)用;給用戶(hù)提供漂亮、快速、jitter-free 的 app 體驗(yàn)。地址:https://github.com/flutter
14、Apache Superset
Apache Superset 是 Airbnb (知名在線(xiàn)房屋短租公司)開(kāi)源的數(shù)據(jù)探查與可視化平臺(tái)(曾用名 Panoramix、Caravel ),該工具在可視化、易用性和交互性上非常有特色,用戶(hù)可以輕松對(duì)數(shù)據(jù)進(jìn)行可視化分析。Apache Superset 也是一款企業(yè)級(jí)商業(yè)智能 Web 應(yīng)用程序。地址:https://github.com/apache/superset
15、Presto
Presto 是一個(gè)開(kāi)源的分布式 SQL 引擎,用于在線(xiàn)分析處理,在集群中運(yùn)行。Presto 可以查詢(xún)各種各樣的數(shù)據(jù)源,從文件到數(shù)據(jù)庫(kù),并將結(jié)果返回到許多商業(yè)智能和分析環(huán)境。更重要的是,Presto 允許查詢(xún)數(shù)據(jù)所在的地方,包括 Hive、Cassandra、關(guān)系型數(shù)據(jù)庫(kù)和專(zhuān)有數(shù)據(jù)存儲(chǔ)。一個(gè) Presto 查詢(xún)可以結(jié)合多個(gè)來(lái)源的數(shù)據(jù)。Facebook 使用 Presto 對(duì)幾個(gè)內(nèi)部數(shù)據(jù)存儲(chǔ)進(jìn)行互動(dòng)查詢(xún),包括他們的 300PB 數(shù)據(jù)倉(cāng)庫(kù)。地址:https://github.com/prestodb/presto
16、Apache Arrow
Apache Arrow 為平面和分層數(shù)據(jù)定義了一種獨(dú)立于語(yǔ)言的柱狀內(nèi)存格式,為現(xiàn)代 CPU 和 GPU 上的高效分析操作而組織。Arrow 內(nèi)存格式還支持零拷貝讀取,以便在沒(méi)有序列化開(kāi)銷(xiāo)的情況下進(jìn)行閃電式的數(shù)據(jù)訪(fǎng)問(wèn)。Arrow 庫(kù)可用于 C、C++、C#、Go、Java、JavaScript、Julia、MATLAB、Python、R、Ruby 和 Rust。
地址:https://github.com/apache/arrow
17、InterpretML
InterpretML 是一個(gè)開(kāi)源的 Explainable AI(XAI)包,其中包含了幾個(gè)最先進(jìn)的機(jī)器學(xué)習(xí)可解釋性技術(shù)。InterpretML 讓你訓(xùn)練可解釋的 glassbox 模型并解釋黑盒系統(tǒng)。InterpretML 可幫助你了解模型的全局行為,或了解個(gè)別預(yù)測(cè)背后的原因。在它的許多功能中,InterpretML 有一個(gè)來(lái)自 Microsoft Research 的"glass box"模型,稱(chēng)為 Explainable Boosting Machine,它支持用黑盒模型的近似值進(jìn)行 post-hoc 解釋的 Lime。地址:https://github.com/interpretml/interpret
18、Lime
Lime(local interpretable model-agnostic explanations 的簡(jiǎn)稱(chēng))是一種 post-hoc 技術(shù),通過(guò)擾動(dòng)輸入的特征并檢查預(yù)測(cè)結(jié)果來(lái)解釋任何機(jī)器學(xué)習(xí)分類(lèi)器的預(yù)測(cè)。Lime 能夠解釋任何具有兩個(gè)或更多類(lèi)的黑盒分類(lèi)器,其同時(shí)適用于文本和圖像領(lǐng)域。Lime 也被包含在 InterpretML 中。地址:https://github.com/marcotcr/lime
19、Dask
Dask 是一個(gè)用于并行計(jì)算的開(kāi)源庫(kù),可以將 Python 包擴(kuò)展到多臺(tái)機(jī)器上。Dask 可以將數(shù)據(jù)和計(jì)算分布在多個(gè) GPU 上,無(wú)論是在同一個(gè)系統(tǒng)中還是在一個(gè)多節(jié)點(diǎn)集群中。Dask 與 Rapids cuDF、XGBoost 和 Rapids cuML 集成,用于 GPU 加速的數(shù)據(jù)分析和機(jī)器學(xué)習(xí)。它還與 NumPy、Pandas 和 Scikit-learn 集成,以并行化其工作流程
地址:https://github.com/dask/dask
20、BlazingSQL
BlazingSQL 是一個(gè)基于 RAPIDS 生態(tài)系統(tǒng)構(gòu)建的 GPU 加速 SQL 引擎。RAPIDS 基于 Apache Arrow 柱狀內(nèi)存格式,cuDF 是一個(gè) GPU DataFrame 庫(kù),用于加載、連接、聚合、過(guò)濾和操作數(shù)據(jù)。它是 cuDF 的 SQL 接口,具有支持大規(guī)模數(shù)據(jù)科學(xué)工作流和企業(yè)數(shù)據(jù)集的各種功能。地址:https://github.com/BlazingDB/blazingsql
21、Rapids
Nvidia 的 Rapids 開(kāi)源軟件庫(kù)和 API 套件讓你有能力完全在 GPU 上執(zhí)行端到端的數(shù)據(jù)科學(xué)和分析管道。Rapids 使用 Nvidia CUDA 基元進(jìn)行底層計(jì)算優(yōu)化,并通過(guò)用戶(hù)友好的 Python 接口暴露了 GPU 的并行性和高帶寬內(nèi)存速度。Rapids 依賴(lài)于 Apache Arrow 柱狀內(nèi)存格式,包括 cuDF,一個(gè)類(lèi)似 Pandas 的 DataFrame 庫(kù);cuML,一個(gè)機(jī)器學(xué)習(xí)庫(kù)集合,提供 Scikit-learn 中大多數(shù)算法的 GPU 版本;以及 cuGraph,一個(gè)類(lèi)似 NetworkX 的加速圖分析庫(kù)
地址:https://github.com/rapidsai/cudf
22、PostHog
PostHog 是一個(gè)為開(kāi)發(fā)人員構(gòu)建的開(kāi)源產(chǎn)品分析平臺(tái)。自動(dòng)收集你網(wǎng)站或應(yīng)用程序上的每個(gè)事件,無(wú)需向第三方發(fā)送數(shù)據(jù)。它在用戶(hù)級(jí)別提供基于事件的分析,捕獲你產(chǎn)品的使用數(shù)據(jù)以查看哪些用戶(hù)在你的應(yīng)用程序中執(zhí)行了哪些操作。它會(huì)自動(dòng)捕獲點(diǎn)擊次數(shù)和綜合瀏覽量,以分析你的用戶(hù)在做什么,而無(wú)需手動(dòng)推送事件。地址:https://github.com/PostHog/posthog
23、LakeFS
LakeFS 提供了一種"以管理代碼的方式管理你的數(shù)據(jù)湖"的方法,為對(duì)象存儲(chǔ)增加了一層類(lèi)似于 Git 的版本控制。這種對(duì) Git 語(yǔ)義的應(yīng)用讓用戶(hù)可以創(chuàng)建自己的隔離的、零拷貝的數(shù)據(jù)分支,在上面工作、實(shí)驗(yàn)和建模分析,而沒(méi)有破壞共享對(duì)象的風(fēng)險(xiǎn)。LakeFS 為你的數(shù)據(jù)帶來(lái)了有用的 commit notes、元數(shù)據(jù)字段和 rollback 選項(xiàng),同時(shí)也帶來(lái)了維護(hù)數(shù)據(jù)完整性和質(zhì)量的驗(yàn)證 hooks--在一個(gè)未提交的分支被意外地合并回生產(chǎn)中之前,運(yùn)行格式和模式檢查。通過(guò) LakeFS,管理和保護(hù)代碼庫(kù)的熟悉技術(shù)可以擴(kuò)展到現(xiàn)代數(shù)據(jù)庫(kù),如 Amazon S3 和 Azure Blob 存儲(chǔ)。地址:https://github.com/treeverse/lakeFS
24、Meltano
Meltano 是今年從 GitLab 中分離出來(lái)的,一個(gè)免費(fèi)的開(kāi)源 DataOps 替代傳統(tǒng) ELT(提取、加載、轉(zhuǎn)換)的工具鏈。Meltano 的數(shù)據(jù)倉(cāng)庫(kù)框架使得為你的項(xiàng)目建模、提取和轉(zhuǎn)換數(shù)據(jù)變得容易,并通過(guò)內(nèi)置的分析工具和簡(jiǎn)化報(bào)告的儀表盤(pán)來(lái)補(bǔ)充集成和轉(zhuǎn)換管道。Meltano提供了一個(gè)可靠的提取器和加載器庫(kù),以及對(duì) Singer 標(biāo)準(zhǔn)的 data extracting taps 和 data loading targets 的支持,Meltano 已經(jīng)是一個(gè)數(shù)據(jù)編排的動(dòng)力源。25、Trino
Trino(原名 PrestoSQL)是一個(gè)分布式 SQL 分析引擎,能夠?qū)Υ笮头植际綌?shù)據(jù)源運(yùn)行極快的查詢(xún)。Trino 允許你同時(shí)對(duì)數(shù)據(jù)湖、關(guān)系型存儲(chǔ)或多個(gè)不同來(lái)源執(zhí)行查詢(xún),而不需要復(fù)制或移動(dòng)數(shù)據(jù)進(jìn)行處理。而且 Trino 與你的數(shù)據(jù)科學(xué)家可能使用的任何商業(yè)智能和分析工具配合得很好,無(wú)論是交互式的還是臨時(shí)性的,最大限度地減少了學(xué)習(xí)曲線(xiàn)。隨著數(shù)據(jù)工程師努力支持越來(lái)越多的數(shù)據(jù)源的復(fù)雜分析,Trino 提供了一種優(yōu)化查詢(xún)執(zhí)行和加速不同來(lái)源的結(jié)果的方法。地址:https://github.com/trinodb/trino
26、StreamNative
StreamNative 是一個(gè)高度可擴(kuò)展的消息和事件流平臺(tái),大大簡(jiǎn)化了實(shí)時(shí)報(bào)告和分析工具以及企業(yè)應(yīng)用流的數(shù)據(jù)管道鋪設(shè)。StreamNative 將 Apache Pulsar 強(qiáng)大的分布式流處理架構(gòu)與 Kubernetes 和混合云支持等企業(yè)額外功能、大型數(shù)據(jù)連接器庫(kù)、簡(jiǎn)易認(rèn)證和授權(quán)以及用于健康和性能監(jiān)控的專(zhuān)用工具相結(jié)合,既簡(jiǎn)化了基于 Pulsar 的實(shí)時(shí)應(yīng)用程序的開(kāi)發(fā),又簡(jiǎn)化了大規(guī)模消息傳遞背板的部署和管理。地址:https://github.com/streamnative
27、Hugging Face
Hugging Face 提供了最重要的開(kāi)源深度學(xué)習(xí)資源庫(kù),它本身并不是一個(gè)深度學(xué)習(xí)框架。Hugging Face 的目標(biāo)是擴(kuò)展到文本之外,支持圖像、音頻、視頻、物體檢測(cè)等。Infoworld 指出,深度學(xué)習(xí)從業(yè)者應(yīng)在未來(lái)幾年內(nèi)密切關(guān)注這個(gè) repo。地址:https://github.com/huggingface/transformers
28、EleutherAI
EleutherAI 是一個(gè)由機(jī)器學(xué)習(xí)研究人員組成的分布式小組,旨在將 GPT-3 帶給所有人。2021 年伊始,EleutherAI 發(fā)布了 The Pile,是一個(gè) 825 GB 的用于訓(xùn)練的多樣化文本數(shù)據(jù)集;并在 6 月公布了 GPT-J,一個(gè) 60 億參數(shù)的模型,大致相當(dāng)于 OpenAI 的 GPT-3 的 Curie variant。隨著 GPT-NeoX 的出現(xiàn),EleutherAI計(jì)劃將參數(shù)一直提高到 1750 億,以與目前最廣泛的 GPT-3 模型競(jìng)爭(zhēng)。地址:https://github.com/EleutherAI/gpt-neo
29、Colab notebooks for generative art

首先是 OpenAI 的 CLIP(對(duì)比語(yǔ)言-圖像預(yù)訓(xùn)練)模型,一個(gè)用于生成文本和圖像矢量嵌入的多模態(tài)模型。雖然 CLIP 是完全開(kāi)源的,但 OpenAI 的生成性神經(jīng)網(wǎng)絡(luò) DALL-E 卻不是。為了填補(bǔ)這一空白,Ryan Murdoch 和 Katherine Crowson 開(kāi)發(fā)了 Colab notebooks, CLIP 與其他開(kāi)源模型(如 BigGAN 和 VQGAN)結(jié)合起來(lái),制作 prompt-based 生成性藝術(shù)作品。這些 notebooks 基于 MIT 許可,于過(guò)去幾十年間在互聯(lián)網(wǎng)上進(jìn)行了廣泛傳播,被重新混合、改變、翻譯,并被用來(lái)生成了驚人的藝術(shù)作品。
地址:https://github.com/openai/CLIP
以上就是 2021 年度 InfoWorld Bossie Awards 項(xiàng)目。其中很多項(xiàng)目我是第一次見(jiàn),我的開(kāi)源項(xiàng)目庫(kù)又多了一些高端、大氣、上檔次的項(xiàng)目。??左手Python,右手Java學(xué)起來(lái)