<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          盤點2021年Python十佳機器學習庫

          共 3017字,需瀏覽 7分鐘

           ·

          2022-02-17 15:20

          函擎 發(fā)自 凹非寺
          來源:量子位(QbitAI)

          原文:

          https://mp.weixin.qq.com/s/glJozUddD8FgEtVueDJS-g

          參考鏈接:

          https://tryolabs.com/blog/2021/12/21/top-python-libraries-2021


          大家好,歡迎來到 Crossin的編程教室 !

          2021年里AI飛速發(fā)展,優(yōu)秀算法層出不窮,令我們大開眼界。

          而真正要將這些算法實現(xiàn),一定少不了Python這個主流機器學習語言的加持。

          今年各大公司和研究小組都推出了一系列方便使用的高性能開源庫,其中還不乏一些國產的優(yōu)秀作品。

          在這里將盤點出最佳的10名,致力于幫你解決各種問題。

          如果你還在為模型訓練中的“雜務”頭疼,那就快來看看吧。

          1. Awkward Array

          根據(jù)官方介紹,Awkward Array用于嵌套的、大小不一的數(shù)據(jù),包括任意長度的列表、記錄、混合的類型和缺失數(shù)據(jù),使用起來類似NumPy

          看起來像是升級版的NumPy呀。

          果然,不同長度的數(shù)組可以直接放在一起運算。

          并且,官方表示Awkward Array不僅使用起來更簡便,在速度內存上也有量級的優(yōu)勢。

          看看是不是可以安排上了~

          https://pypi.org/project/awkward/

          2. Jupytext

          相信大家對Jupyter Notebook都不陌生。

          當你有了Jupytext這個小插件就可以將Jupyter Notebook和IDE完美結合,聽起來是不是很棒!

          從此Jupyter Notebook可以被存儲為Markdown文件或多種語言的腳本文件。

          Jupytext可以做的事主要有:

          • Jupyter Notebook的版本控制

          • 在你喜歡的文本編輯器中編輯、合并或重構Notebook

          • 在Notebook上使用Q&A檢查

          在Python中使用的樣子:

          此項目在Github上已有5k+star。

          https://github.com/mwouts/jupytext

          3. Gradio

          比Streamlit還輕量UI設計庫Gradio讓你輕松在瀏覽器中“玩轉”你的模型,可以直接在瀏覽器中拖放圖片,粘貼文字,錄制聲音,等等。

          只要將launch()函數(shù)中的參數(shù)設置為share=True,還能得到一個可分享網(wǎng)址,拿到鏈接的朋友在電腦和手機端都能打開,活脫脫就是一個小程序

          時常需要做Demo的小伙伴快看起來吧,此項目在Github上已有4.5k+star。

          https://github.com/gradio-app/gradio

          4. Hub

          這個Hub在數(shù)據(jù)管理和數(shù)據(jù)預處理上可是一把好手。

          它可以處理任何類型任何大小的數(shù)據(jù),并且因為數(shù)據(jù)儲存在云端上,所以可以無縫在任何機器上訪問。

          被壓縮為二進制字節(jié)的數(shù)據(jù)可以被存儲在任何地方,并且只有在需要的時候才會被獲取,所以沒有TB級硬盤也可以處理TB級數(shù)據(jù)

          Hub貼心地提供了重要API,支持數(shù)據(jù)在常用工具(PyTorch等)上的使用,數(shù)據(jù)版本控制,數(shù)據(jù)轉換等功能。

          此項目在github上已有4.1k+star。

          https://github.com/activeloopai/Hub

          5. AugLy

          AugLy是facebook最新推出的數(shù)據(jù)增強庫,同時支持語音文本圖像視頻類型的數(shù)據(jù),包含了100多種增強方式。

          數(shù)據(jù)對于模型訓練至關重要,而標注大規(guī)模數(shù)據(jù)十分困難。由于人力資源,和模型特性的限制,數(shù)據(jù)增強的應用越來越廣泛。

          AugLy的優(yōu)點

          • 處理類型更為全面。其他的數(shù)據(jù)增強庫,例如Albumentations和NVIDIA DALI,主要負責圖像相關數(shù)據(jù)的處理,文字數(shù)據(jù)不支持。

          • 處理方式十分人性化。AugLy可以將一張圖片做成備忘錄,在圖片/視頻上疊加文字/Emojis,轉發(fā)社交媒體上的截圖,還可以幫助你處理諸如拷貝檢測、仇恨言論檢測或版權侵權等問題。

          此項目在Github上已有4.1k+star。

          https://github.com/facebookresearch/AugLy

          6. Evidently

          Evidently是用來監(jiān)測模型效果的工具,可從Pandas DataFrame或csv文件中生成交互式可視化報告JSON格式效果簡介。在Jupyter Notebook中可以使用。

          目前可以提供6種報告:數(shù)據(jù)漂移、數(shù)值目標漂移、分類目標漂移、回歸模型性能、分類模型性能和概率分類模型性能。

          此項目在Github上已有1.8k+star。

          https://github.com/evidentlyai/evidently

          7. YOLOX

          如果你熟悉YOLO的話,那你或許會對曠視今年推出的YOLOX感興趣。

          YOLO就是那個目標檢測算法,可以被使用在汽車自動駕駛等前沿技術中。

          YOLOX是YOLO的無錨版本,設計更簡單,但性能更好!它的目標是在研究界和工業(yè)界之間架起一座橋梁,同時彌合兩方之間的差距。


          這個Github上的開源項目在短短半年內已獲得5.2k+star。

          https://github.com/Megvii-BaseDetection/YOLOX

          8. LightSeq

          正如它的名字一樣,LightSeq是一款由字節(jié)跳動開發(fā)的支持BERT、GPT、Transformer等眾多模型的超快推理引擎。

          可以看到它的表現(xiàn),比FasterTransformer還要Fast

          LightSeq支持的模型也是非常全面

          總之就是兩個字“好用”。此項目在Github上已有1.9k+star。

          https://github.com/bytedance/lightseq

          9. Greykite

          想預測COVID-19的恢復速度嗎?那就來看看LinkedIn為了自家時間序列預測需求開發(fā)的Greykite吧。

          功能全面(多種時間趨勢),界面直觀,預測速度快和可擴展性強是它最大的亮點。

          被應用在上面的三大算法:

          • Silverkite (Greykite’s flagship algorithm)

          • Facebook Prophet

          • Auto Arima

          感興趣的話就去研究看看吧,此項目在Github上已有1.4k+star。

          https://github.com/linkedin/greykite

          10. Jina and Finetuner

          如今,在搜索引擎等應用上,語義識別的地位越來越高,因為它可以有效避免字詞匹配的局限。

          不過語義識別涉及的神經(jīng)網(wǎng)絡可能會讓很多人感到頭大,JinaFinetuner可以幫你解決這些問題。

          Jina是一個神經(jīng)搜索框架,使任何人都能在幾分鐘內建立可擴展的深度學習搜索應用程序。

          Finetuner配合Jina幫助你對神經(jīng)網(wǎng)絡進行調參,以獲得神經(jīng)搜索任務的最佳結果。

          Jina和Finetuner適合沒什么經(jīng)驗,又想嘗試的朋友。

          https://github.com/jina-ai/finetuner


          感謝轉發(fā)和點贊的各位~



          _往期文章推薦_

          盤點2021最佳數(shù)據(jù)可視化作品




          如需了解付費精品課程教學答疑服務
          請在Crossin的編程教室內回復: 666

          瀏覽 128
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          評論
          圖片
          表情
          推薦
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  国产精品国产毛片 | 国产黄色电影网站 | 青青草免费在线视频观看免费 | 天天干天天谢天天插 | 夜夜嗨AⅤ一区二区三区 |