精選項(xiàng)目論文:高性能視覺庫、文本生成序列模型的有效實(shí)現(xiàn)

Caer 是一個(gè)輕量級、高性能的視覺庫,用于高性能 AI 研究。通過抽象出不必要的樣板代碼來簡化計(jì)算機(jī)視覺方法,能夠靈活地快速構(gòu)建深度學(xué)習(xí)模型和研究想法的原型。最終結(jié)果是一個(gè)設(shè)計(jì)完全不同的庫,它易于理解,與其他人一起,使用起來很有趣。優(yōu)雅的,經(jīng)過類型檢查的 API 和設(shè)計(jì)理念使 Caer 成為學(xué)生、研究人員和愛好者的理想選擇甚至是深度學(xué)習(xí)和計(jì)算機(jī)視覺領(lǐng)域的專家。
Caer 是一個(gè) Python 庫,由以下組件組成:


項(xiàng)目地址:
https://github.com/jasmcaus/caer
解決方案的途徑:
我們使用一個(gè)簡單的級聯(lián)框架來分割結(jié)節(jié),它可以很容易地?cái)U(kuò)展到其他單目標(biāo)分割任務(wù)。
我們在解決方案中所做的是:
預(yù)處理去除不相干的區(qū)域
實(shí)驗(yàn)級聯(lián)框架 -五折交叉驗(yàn)證(CV)策略,平衡結(jié)節(jié)大小和種類分布
使用TTA(Test time augmentation)
模型整體:由于我們在五折CV中分別訓(xùn)練了兩個(gè)網(wǎng)絡(luò),我們將任意一個(gè)第一個(gè)網(wǎng)絡(luò)和一個(gè)第二個(gè)網(wǎng)絡(luò)組合成一對,最后我們得到25對(或推理結(jié)果)我們用step4_Merge.py 通過像素投票將25個(gè)推斷結(jié)果合并成最終的集合結(jié)果
在2020TN-SCUI訓(xùn)練集上測試了我們的方法3644張圖像或結(jié)節(jié),惡性2003:良性1641)。基于“DeeplabV3+ with efficientnet-B6 encoder”的五折CV分割結(jié)果如下:

已經(jīng)在以下環(huán)境中測試了代碼:
segmentation_models_pytorch == 0.1.0
ttach == 0.0.3
torch >=1.0.0
torchvision
imgaug
項(xiàng)目地址:
https://github.com/WAMAWAMA/TNSCUI2020-Seg-Rank1st
03 mfastseq 用于文本生成、摘要和翻譯任務(wù)的流行序列模型的有效實(shí)現(xiàn)
FastSeq 為文本生成、摘要、翻譯任務(wù)等提供了流行序列模型(例如 Bart、ProphetNet)的高效實(shí)現(xiàn)。它基于流行的 NLP 工具包(例如 FairSeq 和 HuggingFace-Transformers)自動優(yōu)化推理速度,而不會損失準(zhǔn)確性。所有這些都可以輕松完成(如果使用我們的命令行工具,則無需更改任何代碼/模型/數(shù)據(jù),如果使用源代碼,則只需添加一行代碼 import fastseq)。
特性:
EL-Attention:用于生成的內(nèi)存高效無損注意力
基于 GPU 的塊 N-Gram 重復(fù)
用于后處理的異步管道
下面顯示了使用 FastSeq 的生成速度增益:

FastSeq 開發(fā)了多種加速技術(shù),包括注意力緩存優(yōu)化、檢測重復(fù) n-gram 的有效算法以及具有并行 I/O 的異步生成管道。這些優(yōu)化支持各種基于 Transformer 的模型架構(gòu),例如編碼器-解碼器架構(gòu)、僅解碼器架構(gòu)和僅編碼器架構(gòu)。 FastSeq 中更高效的實(shí)現(xiàn)將自動修補(bǔ)以替換現(xiàn)有 NLP 工具包(例如 HuggingFace-Transformers 和 FairSeq)中的實(shí)現(xiàn),因此無需大的代碼更改即可將 FastSeq 與這些工具包集成。
環(huán)境配置:
Python version >= 3.6
torch >= 1.4.0
fairseq == 0.9.0
transformers == 3.0.2
requests >= 2.24.0
absl-py >= 0.9.0
rouge-score >= 0.0.4
項(xiàng)目地址:
https://github.com/microsoft/fastseq
04 Rath 基于增強(qiáng)分析技術(shù)的可視化分析工具
Rath是新一代的基于增強(qiáng)分析技術(shù)的可視化分析工具,它提供了自動化的數(shù)據(jù)探索分析能力與自動可視化設(shè)計(jì)能力。Rath既可以在你對數(shù)據(jù)無從下手時(shí)提供分析入口的建議,也可以在你的分析過程中提供實(shí)時(shí)的分析輔助和建議。Rath會幫你完成大部分?jǐn)?shù)據(jù)探索分析的工作,使得你可以專注于領(lǐng)域問題本身。當(dāng)數(shù)據(jù)越復(fù)雜時(shí),Rath的自動化能力帶來的優(yōu)勢就越加顯著。
Rath 可能幫助你快速完成對一個(gè)數(shù)據(jù)集的自動化可視化分析。它既可以幫助你在自助分析時(shí)提供實(shí)時(shí)的建議,也可以直接根據(jù)數(shù)據(jù)實(shí)時(shí)的特征生成數(shù)據(jù)報(bào)表。與其他的一些自動化數(shù)據(jù)探索分析工具只能推薦簡單的低維統(tǒng)計(jì)特征不同,Rath可以推薦包含一些深層規(guī)律的高維可視化,這使得你可以深度的探索數(shù)據(jù)。
Rath 可以根據(jù)人眼的視覺感知的準(zhǔn)確度進(jìn)行可視化設(shè)計(jì),這使得Rath設(shè)計(jì)的可視化可以被更準(zhǔn)確的理解。這是基于感知學(xué)領(lǐng)域的實(shí)驗(yàn)數(shù)據(jù)設(shè)計(jì)的最優(yōu)化算法,而不是一些不可量化的設(shè)計(jì)經(jīng)驗(yàn)。
相比于tableau、Congos Analytics等可視化分析工具,Rath可以大幅降低數(shù)據(jù)分析的門檻,使用戶可以關(guān)注于實(shí)際的問題。
相比于PowerBI、帆軟等報(bào)表搭建工具,Rath可以制作動態(tài)的可視化報(bào)表。使得你的報(bào)表可以針對數(shù)據(jù)的特性實(shí)時(shí)變化,始終把重要的問題暴露出來。
與其他大多數(shù)增強(qiáng)分析或自動化可視化工具不同,Rath提供高維的復(fù)雜洞察發(fā)現(xiàn)能力與針對高維數(shù)據(jù)的可視化推薦技術(shù)。這使得Rath可以發(fā)現(xiàn)更深層次的洞察和線索,而不是局限在簡單的低維可視化所展示的基礎(chǔ)統(tǒng)計(jì)特征上。
項(xiàng)目地址:
https://github.com/Kanaries/Rath
— 推薦閱讀 — NLP ( 自然語言處理 )
CV(計(jì)算機(jī)視覺)
推薦
最新大廠面試題
AI開源項(xiàng)目論文
yolov4 火災(zāi)檢測,煙霧檢測等5大開源項(xiàng)目...
戳↓↓“閱讀原文”領(lǐng)取《名企AI面試100題》PDF!

