出品|開源中國
作者|白開水不加糖
InfoWorld 公布了 2021 年最佳開源軟件榜單。
InfoWorld 是致力于引領(lǐng) IT 決策者走在科技前沿的國際科技媒體品牌,每年 InfoWorld 都會(huì)根據(jù)軟件對開源界的貢獻(xiàn),以及在業(yè)界的影響力評(píng)選出當(dāng)年的“最佳開源軟件” (InfoWorld's Best of Open Source Software Awards, Bossies),該獎(jiǎng)項(xiàng)評(píng)選已經(jīng)延續(xù)了十多年。
InfoWorld 稱,此次獲獎(jiǎng)的 28 個(gè)開源項(xiàng)目代表了當(dāng)今開源軟件所能提供的最好和最具創(chuàng)新性的軟件--軟件開發(fā)、開發(fā)、云原生計(jì)算、機(jī)器學(xué)習(xí)等等。
接下來具體看看每一個(gè)項(xiàng)目(點(diǎn)擊每個(gè)項(xiàng)目名可跳轉(zhuǎn)進(jìn)入項(xiàng)目介紹頁面)。
Svelte 和 SvelteKit
InfoWorld 評(píng)價(jià)道,在眾多創(chuàng)新的、開源的、前端的 JavaScript 框架中,Svelte 及其全棧對應(yīng)的 SvelteKit 可能是最有野心和遠(yuǎn)見的。Svelte 一開始就通過采用編譯時(shí)策略來顛覆現(xiàn)狀,并以出色的性能、持續(xù)的發(fā)展和卓越的開發(fā)者體驗(yàn)向前邁進(jìn)。SvelteKit 現(xiàn)已進(jìn)入公測階段,它延續(xù)了 Svelte 的傳統(tǒng),通過采用最新的工具,并將部署到無服務(wù)器環(huán)境作為一項(xiàng)內(nèi)置功能來實(shí)現(xiàn)飛躍。
Minikube
InfoWorld 認(rèn)為,可以考慮將 Minikube 當(dāng)做 Docker Desktop 的替代品。Minikube 是一個(gè)易于在本地運(yùn)行 Kubernetes 的工具,可在你的筆記本電腦上的虛擬機(jī)內(nèi)輕松創(chuàng)建單機(jī)版 Kubernetes 集群。便于嘗試 Kubernetes 或使用 Kubernetes 日常開發(fā)。
Pixie
Pixie 是 Kubernetes 應(yīng)用的可觀察性工具,它可以查看集群的高級(jí)狀態(tài),如服務(wù)地圖、集群資源和應(yīng)用流量;還可以深入到更詳細(xì)的視圖,如 pod 狀態(tài)、火焰圖和單個(gè) full-body 應(yīng)用請求。Pixie 使用 eBPF 自動(dòng)收集遙測數(shù)據(jù),它在集群本地收集、存儲(chǔ)和查詢所有的遙測數(shù)據(jù),使用不到 5% 的集群 CPU。Pixie的用例包括集群內(nèi)的網(wǎng)絡(luò)監(jiān)控、基礎(chǔ)設(shè)施健康、服務(wù)性能和數(shù)據(jù)庫查詢剖析。
FastAPI
FastAPI 是一個(gè)高性能 Web 框架,用于構(gòu)建 API。主要特性:
快速:非常高的性能,與 NodeJS 和 Go 相當(dāng)
快速編碼:將功能開發(fā)速度提高約 200% 至 300%
更少的錯(cuò)誤:減少約 40% 的人為錯(cuò)誤
直觀:強(qiáng)大的編輯器支持,自動(dòng)補(bǔ)全無處不在,調(diào)試時(shí)間更少
簡易:旨在易于使用和學(xué)習(xí),減少閱讀文檔的時(shí)間。
簡短:減少代碼重復(fù)。
穩(wěn)?。韩@取可用于生產(chǎn)環(huán)境的代碼,具有自動(dòng)交互式文檔
基于標(biāo)準(zhǔn):基于并完全兼容 API 的開放標(biāo)準(zhǔn) OpenAPI 和 JSON Schema
Crystal
作為一個(gè)提供具有 C 語言的速度和 Ruby 語言的表現(xiàn)力的編程語言的項(xiàng)目,Crystal 已經(jīng)開發(fā)了好幾年了。隨著今年年初 Crystal 1.0 的發(fā)布,該語言現(xiàn)在已經(jīng)足夠穩(wěn)定到可以用于一般工作負(fù)載。Crystal 使用靜態(tài)類型和 LLVM 編譯器來實(shí)現(xiàn)高速度,并避免在運(yùn)行時(shí)出現(xiàn)空引用等常見問題。Crystal 可以與現(xiàn)有的 C 代碼接口,以進(jìn)一步提高速度和便利性,它還可以使用編譯時(shí)宏來擴(kuò)展基礎(chǔ)語言的語法。
Windows Terminal
Windows Terminal 是一個(gè)全新的、流行的、功能強(qiáng)大的命令行終端工具。包含很多來社區(qū)呼聲很高的特性,例如:多 Tab 支持、富文本、多語言支持、可配置、主題和樣式,支持 emoji 和基于 GPU 運(yùn)算的文本渲染等等。同時(shí)該終端依然符合我們的目標(biāo)和要求,以確保它保持快速、高效,并且不會(huì)消耗大量內(nèi)存和電源。
InfoWorld 稱,只要給它時(shí)間,Windows Terminal 終有一天會(huì)取代 Windows 中的老式控制臺(tái)主機(jī)。
OBS Studio
OBS Studio 是一款用于實(shí)時(shí)流媒體和屏幕錄制的軟件,為高效捕獲,合成,編碼,記錄和流傳輸視頻內(nèi)容而設(shè)計(jì),支持所有流媒體平臺(tái)。
特性:
高性能實(shí)時(shí)視頻/音頻捕獲和混合。創(chuàng)建由多種來源組成的場景,包括窗口捕獲、圖像、文本、瀏覽器窗口、網(wǎng)絡(luò)攝像頭、捕獲卡等。
設(shè)置無限數(shù)量的場景,用戶可以通過自定義過渡無縫切換。
帶有每個(gè)源濾波器的直觀音頻混合器,例如噪聲門,噪聲抑制和增益。全面控制VST插件支持。
強(qiáng)大且易于使用的配置選項(xiàng)。添加新源,復(fù)制現(xiàn)有源,并輕松調(diào)整其屬性。
精簡的設(shè)置面板使用戶可以訪問各種配置選項(xiàng),以調(diào)整廣播或錄制的各個(gè)方面。
模塊化的“Dock” UI允許用戶完全根據(jù)需要重新排列布局。用戶甚至可以將每個(gè)單獨(dú)的 Dock 彈出到自己的窗口中。
Shotcut
Shotcut 是一款跨平臺(tái)的視頻編輯工具,允許人們在應(yīng)用效果和分層的同時(shí),對音頻和視頻軌道進(jìn)行所有的標(biāo)準(zhǔn)修正。Shotcut 有一個(gè)非?;钴S的社區(qū),并提供大量的操作視頻和指導(dǎo),以幫助新手和高級(jí)攝像師。它可以在 Mac、Linux、BSD 和 Windows 上運(yùn)行--盡管是跨平臺(tái)的,但與同類工具相比,它的界面很敏捷,使用起來也相對簡單。
Weave GitOps Core
Weave GitOps 支持有效的 GitOps 工作流,以將應(yīng)用程序持續(xù)交付到 Kubernetes 集群中。它基于領(lǐng)先的 GitOps 引擎 CNCF Flux。
Apache Solr
Apache Solr 是基于 Lucene 的全文搜索服務(wù)器,也是最流行的企業(yè)級(jí)搜索引擎。Apache Lucene 是你所使用的大部分軟件的搜索功能背后的基礎(chǔ)搜索技術(shù)--包括其他搜索引擎,如 Elasticsearch。與 Elasticsearch 不同的是,Solr 放棄了它的開源許可,不過它仍然是免費(fèi)的。Solr 是可集群的、可在云端部署的,并且強(qiáng)大到足以建立云端級(jí)的搜索服務(wù)。它甚至包括 LTR 算法,以幫助自動(dòng)調(diào)整和加權(quán)結(jié)果。
MLflow
MLflow 由 Databricks 創(chuàng)建,并由 Linux 基金會(huì)托管,是一個(gè) MLOps 平臺(tái),可以讓人跟蹤、管理和維護(hù)各種機(jī)器學(xué)習(xí)模型、實(shí)驗(yàn)及其部署。它為你提供了記錄和查詢實(shí)驗(yàn)(代碼、數(shù)據(jù)、配置、結(jié)果)的工具,將數(shù)據(jù)科學(xué)代碼打包成項(xiàng)目,并將這些項(xiàng)目鏈入工作流程。
Orange
Orange 旨在使將數(shù)據(jù)挖掘"富有成效且有趣"。Orange 允許用戶創(chuàng)建一個(gè)數(shù)據(jù)分析工作流程,執(zhí)行各種機(jī)器學(xué)習(xí)和分析功能以及可視化。與 R Studio 和 Jupyter等程序化或文本工具相比,Orange 是非常直觀的。你可以將小部件拖到畫布上以加載文件,用模型分析數(shù)據(jù)并將結(jié)果可視化。
Flutter
Flutter 由 Google 的工程師團(tuán)隊(duì)打造,用于創(chuàng)建高性能、跨平臺(tái)的移動(dòng)應(yīng)用。Flutter 針對當(dāng)下以及未來的移動(dòng)設(shè)備進(jìn)行優(yōu)化,專注于 Android and iOS 低延遲的輸入和高幀率。
Flutter 可以給開發(fā)者提供簡單、高效的方式來構(gòu)建和部署跨平臺(tái)、高性能移動(dòng)應(yīng)用;給用戶提供漂亮、快速、jitter-free 的 app 體驗(yàn)。
Apache Superset
Apache Superset 是 Airbnb (知名在線房屋短租公司)開源的數(shù)據(jù)探查與可視化平臺(tái)(曾用名 Panoramix、Caravel ),該工具在可視化、易用性和交互性上非常有特色,用戶可以輕松對數(shù)據(jù)進(jìn)行可視化分析。Apache Superset 也是一款企業(yè)級(jí)商業(yè)智能 Web 應(yīng)用程序。
Presto
Presto 是一個(gè)開源的分布式 SQL 引擎,用于在線分析處理,在集群中運(yùn)行。Presto 可以查詢各種各樣的數(shù)據(jù)源,從文件到數(shù)據(jù)庫,并將結(jié)果返回到許多商業(yè)智能和分析環(huán)境。更重要的是,Presto 允許查詢數(shù)據(jù)所在的地方,包括 Hive、Cassandra、關(guān)系型數(shù)據(jù)庫和專有數(shù)據(jù)存儲(chǔ)。一個(gè) Presto 查詢可以結(jié)合多個(gè)來源的數(shù)據(jù)。Facebook 使用 Presto 對幾個(gè)內(nèi)部數(shù)據(jù)存儲(chǔ)進(jìn)行互動(dòng)查詢,包括他們的 300PB 數(shù)據(jù)倉庫。
Facebook、Uber、Twitter 和阿里巴巴創(chuàng)立了 Presto 基金會(huì)。其他成員現(xiàn)在包括 Alluxio、Ahana、Upsolver 和英特爾。
Apache Arrow
Apache Arrow 為平面和分層數(shù)據(jù)定義了一種獨(dú)立于語言的柱狀內(nèi)存格式,為現(xiàn)代 CPU 和 GPU 上的高效分析操作而組織。Arrow 內(nèi)存格式還支持零拷貝讀取,以便在沒有序列化開銷的情況下進(jìn)行閃電式的數(shù)據(jù)訪問。Arrow 庫可用于 C、C++、C#、Go、Java、JavaScript、Julia、MATLAB、Python、R、Ruby 和 Rust。
InterpretML
InterpretML 是一個(gè)開源的 Explainable AI(XAI)包,其中包含了幾個(gè)最先進(jìn)的機(jī)器學(xué)習(xí)可解釋性技術(shù)。InterpretML 讓你訓(xùn)練可解釋的 glassbox 模型并解釋黑盒系統(tǒng)。InterpretML 可幫助你了解模型的全局行為,或了解個(gè)別預(yù)測背后的原因。在它的許多功能中,InterpretML 有一個(gè)來自 Microsoft Research 的"glass box"模型,稱為 Explainable Boosting Machine,它支持用黑盒模型的近似值進(jìn)行 post-hoc 解釋的 Lime。
Lime
Lime(local interpretable model-agnostic explanations 的簡稱)是一種 post-hoc 技術(shù),通過擾動(dòng)輸入的特征并檢查預(yù)測結(jié)果來解釋任何機(jī)器學(xué)習(xí)分類器的預(yù)測。Lime 能夠解釋任何具有兩個(gè)或更多類的黑盒分類器,其同時(shí)適用于文本和圖像領(lǐng)域。Lime 也被包含在 InterpretML 中。
Dask
Dask 是一個(gè)用于并行計(jì)算的開源庫,可以將 Python 包擴(kuò)展到多臺(tái)機(jī)器上。Dask 可以將數(shù)據(jù)和計(jì)算分布在多個(gè) GPU 上,無論是在同一個(gè)系統(tǒng)中還是在一個(gè)多節(jié)點(diǎn)集群中。Dask 與 Rapids cuDF、XGBoost 和 Rapids cuML 集成,用于 GPU 加速的數(shù)據(jù)分析和機(jī)器學(xué)習(xí)。它還與 NumPy、Pandas 和 Scikit-learn 集成,以并行化其工作流程。
BlazingSQL
BlazingSQL 是一個(gè)基于 RAPIDS 生態(tài)系統(tǒng)構(gòu)建的 GPU 加速 SQL 引擎。 RAPIDS 基于 Apache Arrow 柱狀內(nèi)存格式,cuDF 是一個(gè) GPU DataFrame 庫,用于加載、連接、聚合、過濾和操作數(shù)據(jù)。
BlazingSQL 是 cuDF 的 SQL 接口,具有支持大規(guī)模數(shù)據(jù)科學(xué)工作流和企業(yè)數(shù)據(jù)集的各種功能。
Rapids
Nvidia 的 Rapids 開源軟件庫和 API 套件讓你有能力完全在 GPU 上執(zhí)行端到端的數(shù)據(jù)科學(xué)和分析管道。Rapids 使用 Nvidia CUDA 基元進(jìn)行底層計(jì)算優(yōu)化,并通過用戶友好的 Python 接口暴露了 GPU 的并行性和高帶寬內(nèi)存速度。Rapids 依賴于 Apache Arrow 柱狀內(nèi)存格式,包括 cuDF,一個(gè)類似 Pandas 的 DataFrame 庫;cuML,一個(gè)機(jī)器學(xué)習(xí)庫集合,提供 Scikit-learn 中大多數(shù)算法的 GPU 版本;以及 cuGraph,一個(gè)類似 NetworkX 的加速圖分析庫。
PostHog
PostHog 是一個(gè)為開發(fā)人員構(gòu)建的開源產(chǎn)品分析平臺(tái)。自動(dòng)收集你網(wǎng)站或應(yīng)用程序上的每個(gè)事件,無需向第三方發(fā)送數(shù)據(jù)。它在用戶級(jí)別提供基于事件的分析,捕獲你產(chǎn)品的使用數(shù)據(jù)以查看哪些用戶在你的應(yīng)用程序中執(zhí)行了哪些操作。它會(huì)自動(dòng)捕獲點(diǎn)擊次數(shù)和綜合瀏覽量,以分析你的用戶在做什么,而無需手動(dòng)推送事件。
LakeFS
LakeFS 提供了一種"以管理代碼的方式管理你的數(shù)據(jù)湖"的方法,為對象存儲(chǔ)增加了一層類似于 Git 的版本控制。這種對 Git 語義的應(yīng)用讓用戶可以創(chuàng)建自己的隔離的、零拷貝的數(shù)據(jù)分支,在上面工作、實(shí)驗(yàn)和建模分析,而沒有破壞共享對象的風(fēng)險(xiǎn)。LakeFS 為你的數(shù)據(jù)帶來了有用的 commit notes、元數(shù)據(jù)字段和 rollback 選項(xiàng),同時(shí)也帶來了維護(hù)數(shù)據(jù)完整性和質(zhì)量的驗(yàn)證 hooks--在一個(gè)未提交的分支被意外地合并回生產(chǎn)中之前,運(yùn)行格式和模式檢查。通過 LakeFS,管理和保護(hù)代碼庫的熟悉技術(shù)可以擴(kuò)展到現(xiàn)代數(shù)據(jù)庫,如 Amazon S3 和 Azure Blob 存儲(chǔ)。
Meltano
Meltano 是今年從 GitLab 中分離出來的,一個(gè)免費(fèi)的開源 DataOps 替代傳統(tǒng) ELT(提取、加載、轉(zhuǎn)換)的工具鏈。Meltano 的數(shù)據(jù)倉庫框架使得為你的項(xiàng)目建模、提取和轉(zhuǎn)換數(shù)據(jù)變得容易,并通過內(nèi)置的分析工具和簡化報(bào)告的儀表盤來補(bǔ)充集成和轉(zhuǎn)換管道。Meltano提供了一個(gè)可靠的提取器和加載器庫,以及對 Singer 標(biāo)準(zhǔn)的 data extracting taps 和 data loading targets 的支持,Meltano 已經(jīng)是一個(gè)數(shù)據(jù)編排的動(dòng)力源。
Trino
Trino(原名 PrestoSQL)是一個(gè)分布式 SQL 分析引擎,能夠?qū)Υ笮头植际綌?shù)據(jù)源運(yùn)行極快的查詢。Trino 允許你同時(shí)對數(shù)據(jù)湖、關(guān)系型存儲(chǔ)或多個(gè)不同來源執(zhí)行查詢,而不需要復(fù)制或移動(dòng)數(shù)據(jù)進(jìn)行處理。而且 Trino 與你的數(shù)據(jù)科學(xué)家可能使用的任何商業(yè)智能和分析工具配合得很好,無論是交互式的還是臨時(shí)性的,最大限度地減少了學(xué)習(xí)曲線。隨著數(shù)據(jù)工程師努力支持越來越多的數(shù)據(jù)源的復(fù)雜分析,Trino 提供了一種優(yōu)化查詢執(zhí)行和加速不同來源的結(jié)果的方法。
StreamNative
StreamNative 是一個(gè)高度可擴(kuò)展的消息和事件流平臺(tái),大大簡化了實(shí)時(shí)報(bào)告和分析工具以及企業(yè)應(yīng)用流的數(shù)據(jù)管道鋪設(shè)。StreamNative 將 Apache Pulsar 強(qiáng)大的分布式流處理架構(gòu)與 Kubernetes 和混合云支持等企業(yè)額外功能、大型數(shù)據(jù)連接器庫、簡易認(rèn)證和授權(quán)以及用于健康和性能監(jiān)控的專用工具相結(jié)合,既簡化了基于 Pulsar 的實(shí)時(shí)應(yīng)用程序的開發(fā),又簡化了大規(guī)模消息傳遞背板的部署和管理。
Hugging Face
Hugging Face 提供了最重要的開源深度學(xué)習(xí)資源庫,它本身并不是一個(gè)深度學(xué)習(xí)框架。Hugging Face 的目標(biāo)是擴(kuò)展到文本之外,支持圖像、音頻、視頻、物體檢測等。Infoworld 指出,深度學(xué)習(xí)從業(yè)者應(yīng)在未來幾年內(nèi)密切關(guān)注這個(gè) repo。
EleutherAI
EleutherAI 是一個(gè)由機(jī)器學(xué)習(xí)研究人員組成的分布式小組,旨在將 GPT-3 帶給所有人。2021 年伊始,EleutherAI 發(fā)布了 The Pile,是一個(gè) 825 GB 的用于訓(xùn)練的多樣化文本數(shù)據(jù)集;并在 6 月公布了 GPT-J,一個(gè) 60 億參數(shù)的模型,大致相當(dāng)于 OpenAI 的 GPT-3 的 Curie variant。隨著 GPT-NeoX 的出現(xiàn),EleutherAI計(jì)劃將參數(shù)一直提高到 1750 億,以與目前最廣泛的 GPT-3 模型競爭。
對此,Infoworld 評(píng)價(jià)稱,“黑客對陣世界上最大的公司?這就是開源的力量?!?/p>
Colab notebooks for generative art
Infoworld 表示,一般來說 Bossies 的贏家都是庫、框架、平臺(tái)和操作系統(tǒng)等開源骨干力量。然而他們今年認(rèn)為,一些卓越的開源組件也應(yīng)該得到認(rèn)可。
首先是 OpenAI 的 CLIP(對比語言-圖像預(yù)訓(xùn)練)模型,一個(gè)用于生成文本和圖像矢量嵌入的多模態(tài)模型。雖然 CLIP 是完全開源的,但 OpenAI 的生成性神經(jīng)網(wǎng)絡(luò) DALL-E 卻不是。為了填補(bǔ)這一空白,Ryan Murdoch 和 Katherine Crowson 開發(fā)了 Colab notebooks,將 CLIP 與其他開源模型(如 BigGAN 和 VQGAN)結(jié)合起來,制作 prompt-based 生成性藝術(shù)作品。這些 notebooks 基于 MIT 許可,于過去幾十年間在互聯(lián)網(wǎng)上進(jìn)行了廣泛傳播,被重新混合、改變、翻譯,并被用來生成了驚人的藝術(shù)作品。詳情可查看 ai_curio。
以上就是 2021 年度 InfoWorld Bossie Awards 項(xiàng)目,關(guān)于每個(gè)項(xiàng)目具體的入選評(píng)語等詳細(xì)信息,可查看網(wǎng)站原文。
相關(guān)鏈接:https://xintu.infoworld.com/article/3637038/the-best-open-source-software-of-2021.html#slide1
掃描二維碼推送至手機(jī)訪問。
版權(quán)聲明:本文由信途科技轉(zhuǎn)載于網(wǎng)絡(luò),如有侵權(quán)聯(lián)系站長刪除。
轉(zhuǎn)載請注明出處http://macbookprostickers.com/xintu/22698.html