综合人人网婷婷精品,天堂a√8蜜桃,污视频在线免费观看一区,成人免费视频国产免费麻豆。,韩国啪啪免费视频,堆女郎松果浴室自慰正在播放,日本五十路熟,a在线免费播放

機器之心報道

編輯：維度

近日，有用戶在自己的項目中發(fā)現(xiàn)了一個微小的 bug，在 PyTorch 同時使用 NumPy 的隨機數(shù)生成器和多進程數(shù)據(jù)加載會導(dǎo)致相同的擴充數(shù)據(jù)，只有專門設(shè)置 seed 才可以解決這個 bug，否則會降低模型的準(zhǔn)確率。不過，有人認(rèn)為這并不是一個 bug，而是預(yù)期功能，是「按預(yù)期工作的」。

行內(nèi)人都知道，機器學(xué)習(xí)（ML）代碼中的 bug 很難修復(fù)，并且它們不會造成編譯錯誤，而是悄悄地降低準(zhǔn)確率。這些 bug 簡直防不勝防。最近，一位專注于機器學(xué)習(xí)的用戶遇到了一個非常熟悉的 bug，修復(fù)了之后性能有了大幅度提升。這是一個什么樣的 bug 呢？

根據(jù)用戶的描述，bug 是這樣的：除非你在 DataLoader 中使用 worker_init_fn 選項專門設(shè)置 seed，否則在 PyTorch 同時使用 NumPy 的隨機數(shù)生成器和多進程數(shù)據(jù)加載會導(dǎo)致相同的擴充數(shù)據(jù)。用戶沒有這樣做，因而這個 bug 悄悄地降低了模型的準(zhǔn)確率。

該 bug 非常小并且很容易出現(xiàn)。所以，這位用戶很好奇會不會也對其他項目造成損害呢？ta 從 GitHub 上下載了 10 萬個導(dǎo)入 PyTorch 的庫，并分析了這些庫的源代碼。之后，ta 保留了那些具有自定義數(shù)據(jù)集、同時使用 NumPy 的隨機數(shù)生成器和多進程數(shù)據(jù)加載以及或多或少使用抽象語法樹進行分析的項目。

結(jié)果顯示，95% 以上的庫存在著這個 bug，如 PyTorch 的官方教程、OpenAI 的代碼以及 NVIDIA 的項目。甚至特斯拉 AI 負(fù)責(zé)人 Andrej Karpathy 也曾遭受過該 bug 的困擾。

OpenAI 的 ebm_code_release 項目。

這個 bug 究竟怎樣影響模型的準(zhǔn)確率？這位用戶從以下兩個示例中進行了簡要描述。

bug 描述

在 PyTorch 中加載、預(yù)處理和擴充數(shù)據(jù)的標(biāo)準(zhǔn)方法是子類化 torch.utils.data.Dataset 并重寫 __getitem__方法。要應(yīng)用擴充方法（如隨機裁剪、圖像翻轉(zhuǎn)），__getitem__方法經(jīng)常使用 NumPy 來生成隨機數(shù)，然后將 map-styled 數(shù)據(jù)集傳遞給 DataLoader 來創(chuàng)建 batch。這種訓(xùn)練 pipeline 可能會受到數(shù)據(jù)預(yù)處理的阻礙，因此并行加載數(shù)據(jù)是有意義的。可以通過增加 DataLoader 對象中的 num_workers 參數(shù)來實現(xiàn)。

問題是，這個工作流導(dǎo)致了相同的數(shù)據(jù)擴充。

PyTorch 使用多進程并行加載數(shù)據(jù)，worker 進程是使用 fork start 方法創(chuàng)建的。這意味著每個工作進程繼承父進程的所有資源，包括 NumPy 的隨機數(shù)生成器的狀態(tài)。

示例 1

為了更加形象地描述問題，用戶從以下兩個示例中進行了簡要概述。

示例 1 為一個示例數(shù)據(jù)集，它返回三個元素的隨機向量。示例使用兩個和四個工作進程的 batch 大小。

代碼返回如下結(jié)果：每個進程返回的隨機數(shù)都是相同的。

示例 2

示例 2 演示了如何在 face-landmarks 數(shù)據(jù)集上使用 Dataset 和 DataLoader 類。此外，還提到了數(shù)據(jù)擴充的重要性，并提供了一個隨機裁剪擴充的例子。這是使用 NumPy 的隨機數(shù)生成器實現(xiàn)的。

通過增加 num_workers 來加速數(shù)據(jù)加載，可以得到相同的裁剪結(jié)果：

batch 大小為 8， num_workers 為 2，random crop augmentation（隨機裁剪擴充）

這個 bug 很容易產(chǎn)生。在某些情況下，它對最終性能的影響很小。在另一些情況下，相同的擴充會導(dǎo)致嚴(yán)重的退化。

基于對開放源碼 PyTorch 項目的分析，發(fā)現(xiàn) bug 的這位用戶擔(dān)心這個問題在許多支持真實產(chǎn)品的代碼庫中都存在。

究竟是 bug，還是預(yù)期功能或特征？

這位用戶描述的 bug 也引起了眾多網(wǎng)友的熱議，其中一些人并不認(rèn)為這是 bug。

用戶「amasterblaster」認(rèn)為，這不是一個 bug，而是所有種子隨機函數(shù)的預(yù)期功能。這是因為即使在隨機實驗中，有時你想要對比靜態(tài)參數(shù)的變化，并得到相同的隨機數(shù)。只有當(dāng)你被讀為真隨機（true random）時，才會根據(jù) OS time 設(shè)置 seed。

用戶「xicor7017」表示自己也遇到了相同的問題，也認(rèn)為它并不是一個 bug，而是一個可能不為人所知的特征。如果忽略它的話，調(diào)試問題時會很麻煩。

與此同時，另一些人表達出了不同的觀點，認(rèn)為既然「如果事情朝著人們不希望的方向發(fā)展，那么它就不應(yīng)該這樣，也就構(gòu)成了 bug。」

用戶「IntelArtiGen」稱自己意識到了這個 bug，認(rèn)為它是不正常的，并且對自己的項目造成了一些小問題。用戶「gwern」贊同這種觀點，認(rèn)為如果 95% 以上的用戶使用時出現(xiàn)錯誤，則代碼就是錯的。

用戶「synonymous1964」進一步解讀了這個 bug。ta 認(rèn)為，人們可能誤解了這個問題，問題不在于設(shè)置特定的隨機種子會導(dǎo)致每次訓(xùn)練過程中生成相同序列的隨機數(shù)，這顯然是按預(yù)期工作的。相反，問題在于多個數(shù)據(jù)下載進程中（由 PyTorch 中的 num_workers 設(shè)置）的每個進程都會在某個特定的訓(xùn)練過程中輸出相同序列的隨機數(shù)。毫無疑問，這當(dāng)然會對項目造成影響，具體取決于你如何進行數(shù)據(jù)加載和擴充。所以，即使這個 bug 是「按預(yù)期工作的」，但向更多其他用戶指出來也挺好的。

不知道機器之心的讀者，有沒有遇到過類似的 bug 呢？如果有，可以在評論中發(fā)表自己對該 bug 的觀點。

參考鏈接：

https://tanelp.github.io/posts/a-bug-that-plagues-thousands-of-open-source-ml-projects/

https://www.reddit.com/r/MachineLearning/comments/mocpgj/p_using_pytorch_numpy_a_bug_that_plagues/

亞馬遜云科技線上黑客松2021

這是一場志同道合的磨練，這是一場高手云集的組團競技。秀腦洞、玩創(chuàng)意，3月26日至5月31日，實戰(zhàn)的舞臺為你開啟，「亞馬遜云科技線上黑客松2021」等你來戰(zhàn)！

為了鼓勵開發(fā)者的參與和創(chuàng)新，本次大賽為參賽者準(zhǔn)備了豐厚的獎品，在一、二、三等獎之外，還特設(shè)prActIcal獎、creAtIve獎、錦鯉極客獎、陽光普照獎，成功提交作品的團隊均可獲贈獎品。

識別二維碼，立即報名參賽。

? THE END

轉(zhuǎn)載請聯(lián)系本公眾號獲得授權(quán)

投稿或?qū)で髨蟮溃篶[email protected]

PyTorch里這個bug，你知道嗎？