<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          Python處理垃圾的小妙招

          共 4634字,需瀏覽 10分鐘

           ·

          2021-08-08 22:35


          對象的內(nèi)存使用



          賦值語句是語言最常見的功能了。但即使是最簡單的賦值語句,也可以很有內(nèi)涵。Python的賦值語句就很值得研究。



          a = 1



          整數(shù)1為一個對象。而a是一個引用。利用賦值語句,引用a指向?qū)ο?。Python是動態(tài)類型的語言(參考動態(tài)類型),對象與引用分離。Python像使用“筷子”那樣,通過引用來接觸和翻動真正的食物——對象。整數(shù)1為一個對象。而a是一個引用。利用賦值語句,引用a指向?qū)ο?。Python是動態(tài)類型的語言(參考動態(tài)類型),對象與引用分離。Python像使用“筷子”那樣,通過引用來接觸和翻動真正的食物——對象。


          引用和對象

          為了探索對象在內(nèi)存的存儲,我們可以求助于Python的內(nèi)置函數(shù)id()。它用于返回對象的身份(identity)。其實(shí),這里所謂的身份,就是該對象的內(nèi)存地址。



          a = 1


          print(id(a))
          print(hex(id(a)))

          在我的計算機(jī)上,它們返回的是:


          11246696
          '0xab9c68'



          分別為內(nèi)存地址的十進(jìn)制和十六進(jìn)制表示。


          在Python中,整數(shù)和短小的字符,Python都會緩存這些對象,以便重復(fù)使用。當(dāng)我們創(chuàng)建多個等于1的引用時,實(shí)際上是讓所有這些引用指向同一個對象。



          a = 1


          b = 1


          print(id(a))

          print(id(b))


          上面程序返回


          11246696
          11246696



          可見a和b實(shí)際上是指向同一個對象的兩個引用。


          為了檢驗(yàn)兩個引用指向同一個對象,我們可以用is關(guān)鍵字。is用于判斷兩個引用所指的對象是否相同。



          # True


          a = 1


          b = 1


          print(a is b)


          # True


          a = "good"


          b = "good"


          print(a is b)


          # False


          a = "very good morning"


          b = "very good morning"


          print(a is b)


          # False


          a = []

          b = []

          print(a is b)



          上面的注釋為相應(yīng)的運(yùn)行結(jié)果。可以看到,由于Python緩存了整數(shù)和短字符串,因此每個對象只存有一份。比如,所有整數(shù)1的引用都指向同一對象。即使使用賦值語句,也只是創(chuàng)造了新的引用,而不是對象本身。長的字符串和其它對象可以有多個相同的對象,可以使用賦值語句創(chuàng)建出新的對象。


          在Python中,每個對象都有存有指向該對象的引用總數(shù),即引用計數(shù)(reference count)。


          我們可以使用sys包中的getrefcount(),來查看某個對象的引用計數(shù)。需要注意的是,當(dāng)使用某個引用作為參數(shù),傳遞給getrefcount()時,參數(shù)實(shí)際上創(chuàng)建了一個臨時的引用。因此,getrefcount()所得到的結(jié)果,會比期望的多1。



          from sys import getrefcount

          a = [1, 2, 3]
          print(getrefcount(a))

          b = a
          print(getrefcount(b))



          由于上述原因,兩個getrefcount將返回2和3,而不是期望的1和2。

          對象引用對象



          Python的一個容器對象(container),比如表、詞典等,可以包含多個對象。實(shí)際上,容器對象中包含的并不是元素對象本身,是指向各個元素對象的引用。

          我們也可以自定義一個對象,并引用其它對象:



          class from_obj(object):
          def __init__(self, to_obj):
          self.to_obj = to_obj

          b = [1,2,3]
          a = from_obj(b)
          print(id(a.to_obj))
          print(id(b))

          可以看到,a引用了對象b。


          對象引用對象,是Python最基本的構(gòu)成方式。即使是a = 1這一賦值方式,實(shí)際上是讓詞典的一個鍵值"a"的元素引用整數(shù)對象1。該詞典對象用于記錄所有的全局引用。該詞典引用了整數(shù)對象1。我們可以通過內(nèi)置函數(shù)globals()來查看該詞典。


          當(dāng)一個對象A被另一個對象B引用時,A的引用計數(shù)將增加1。



          from sys import getrefcount

          a = [1, 2, 3]
          print(getrefcount(a))

          b = [a, a]
          print(getrefcount(a))

          由于對象b引用了兩次a,a的引用計數(shù)增加了2。

          容器對象的引用可能構(gòu)成很復(fù)雜的拓?fù)浣Y(jié)構(gòu)。我們可以用objgraph包來繪制其引用關(guān)系,比如


          x = [1, 2, 3]


          y = [x, dict(key1=x)]

          z = [y, (x, y)]

          import objgraph

          objgraph.show_refs([z], filename='ref_topo.png')



          objgraph是Python的一個第三方包。安裝之前需要安裝xdot。


          sudo apt-get install xdot

          sudo pip install objgraph



          objgraph官網(wǎng):http://mg.pov.lt/objgraph/


          兩個對象可能相互引用,從而構(gòu)成所謂的引用環(huán)(reference cycle)。



          a = []

          b = [a]

          a.append(b)

          即使是一個對象,只需要自己引用自己,也能構(gòu)成引用環(huán)。


          a = []

          a.append(a)

          print(getrefcount(a))



          引用環(huán)會給垃圾回收機(jī)制帶來很大的麻煩,我將在后面詳細(xì)敘述這一點(diǎn)。

          引用減少


          某個對象的引用計數(shù)可能減少。比如,可以使用del關(guān)鍵字刪除某個引用:


          from sys import getrefcount

          a = [1, 2, 3]
          b = a
          print(getrefcount(b))

          del a
          print(getrefcount(b))

          del也可以用于刪除容器元素中的元素,比如:


          a = [1,2,3]

          del a[0]

          print(a)

          如果某個引用指向?qū)ο驛,當(dāng)這個引用被重新定向到某個其他對象B時,對象A的引用計數(shù)減少:


          from sys import getrefcount

          a = [1, 2, 3]
          b = a
          print(getrefcount(b))

          a = 1
          print(getrefcount(b))



          垃圾回收


          吃太多,總會變胖,Python也是這樣。當(dāng)Python中的對象越來越多,它們將占據(jù)越來越大的內(nèi)存。不過你不用太擔(dān)心Python的體形,它會乖巧的在適當(dāng)?shù)臅r候“減肥”,啟動垃圾回收(garbage collection),將沒用的對象清除。在許多語言中都有垃圾回收機(jī)制,比如Java和Ruby。盡管最終目的都是塑造苗條的提醒,但不同語言的減肥方案有很大的差異 。


          從基本原理上,當(dāng)Python的某個對象的引用計數(shù)降為0時,說明沒有任何引用指向該對象,該對象就成為要被回收的垃圾了。比如某個新建對象,它被分配給某個引用,對象的引用計數(shù)變?yōu)?。如果引用被刪除,對象的引用計數(shù)為0,那么該對象就可以被垃圾回收。比如下面的表:




          a = [1, 2, 3]

          del a

          del a后,已經(jīng)沒有任何引用指向之前建立的[1, 2, 3]這個表。用戶不可能通過任何方式接觸或者動用這個對象。這個對象如果繼續(xù)待在內(nèi)存里,就成了不健康的脂肪。當(dāng)垃圾回收啟動時,Python掃描到這個引用計數(shù)為0的對象,就將它所占據(jù)的內(nèi)存清空。


          然而,減肥是個昂貴而費(fèi)力的事情。垃圾回收時,Python不能進(jìn)行其它的任務(wù)。頻繁的垃圾回收將大大降低Python的工作效率。如果內(nèi)存中的對象不多,就沒有必要總啟動垃圾回收。所以,Python只會在特定條件下,自動啟動垃圾回收。當(dāng)Python運(yùn)行時,會記錄其中分配對象(object allocation)和取消分配對象(object deallocation)的次數(shù)。當(dāng)兩者的差值高于某個閾值時,垃圾回收才會啟動。


          我們可以通過gc模塊的get_threshold()方法,查看該閾值:




          import gc

          print(gc.get_threshold())

          返回(700, 10, 10),后面的兩個10是與分代回收相關(guān)的閾值,后面可以看到。700即是垃圾回收啟動的閾值。可以通過gc中的set_threshold()方法重新設(shè)置。


          我們也可以手動啟動垃圾回收,即使用gc.collect()。

          分代回收


          Python同時采用了分代(generation)回收的策略。這一策略的基本假設(shè)是,存活時間越久的對象,越不可能在后面的程序中變成垃圾。我們的程序往往會產(chǎn)生大量的對象,許多對象很快產(chǎn)生和消失,但也有一些對象長期被使用。出于信任和效率,對于這樣一些“長壽”對象,我們相信它們的用處,所以減少在垃圾回收中掃描它們的頻率。



          小家伙要多檢查

          Python將所有的對象分為0,1,2三代。所有的新建對象都是0代對象。當(dāng)某一代對象經(jīng)歷過垃圾回收,依然存活,那么它就被歸入下一代對象。垃圾回收啟動時,一定會掃描所有的0代對象。如果0代經(jīng)過一定次數(shù)垃圾回收,那么就啟動對0代和1代的掃描清理。當(dāng)1代也經(jīng)歷了一定次數(shù)的垃圾回收后,那么會啟動對0,1,2,即對所有對象進(jìn)行掃描。


          這兩個次數(shù)即上面get_threshold()返回的(700, 10, 10)返回的兩個10。也就是說,每10次0代垃圾回收,會配合1次1代的垃圾回收;而每10次1代的垃圾回收,才會有1次的2代垃圾回收。


          同樣可以用set_threshold()來調(diào)整,比如對2代對象進(jìn)行更頻繁的掃描。




          import gc

          gc.set_threshold(700, 10, 5)


          孤立的引用環(huán)


          引用環(huán)的存在會給上面的垃圾回收機(jī)制帶來很大的困難。這些引用環(huán)可能構(gòu)成無法使用,但引用計數(shù)不為0的一些對象。



          a = []

          b = [a]

          a.append(b)


          del a

          del b

          上面我們先創(chuàng)建了兩個表對象,并引用對方,構(gòu)成一個引用環(huán)。刪除了a,b引用之后,這兩個對象不可能再從程序中調(diào)用,就沒有什么用處了。但是由于引用環(huán)的存在,這兩個對象的引用計數(shù)都沒有降到0,不會被垃圾回收。



          孤立的引用環(huán)

          為了回收這樣的引用環(huán),Python復(fù)制每個對象的引用計數(shù),可以記為gc_ref。假設(shè),每個對象i,該計數(shù)為gc_ref_i。Python會遍歷所有的對象i。對于每個對象i引用的對象j,將相應(yīng)的gc_ref_j減1。



          遍歷后的結(jié)果

          在結(jié)束遍歷后,gc_ref不為0的對象,和這些對象引用的對象,以及繼續(xù)更下游引用的對象,需要被保留。而其它的對象則被垃圾回收。


          總結(jié)


          Python作為一種動態(tài)類型的語言,其對象和引用分離。這與曾經(jīng)的面向過程語言有很大的區(qū)別。為了有效的釋放內(nèi)存,Python內(nèi)置了垃圾回收的支持。Python采取了一種相對簡單的垃圾回收機(jī)制,即引用計數(shù),并因此需要解決孤立引用環(huán)的問題。Python與其它語言既有共通性,又有特別的地方。對該內(nèi)存管理機(jī)制的理解,是提高Python性能的重要一步。


          掃碼關(guān)注我們

          一鍵三連~~

          關(guān)注小編喲~




          python里面的self,是誰啊?


          通過“四不要”,掌握 Python 的 Lambda 函數(shù)


          python工程師學(xué)習(xí)路線,教你如何循序漸進(jìn)學(xué)習(xí)python

          瀏覽 35
          點(diǎn)贊
          評論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報
          評論
          圖片
          表情
          推薦
          點(diǎn)贊
          評論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  操逼网大香蕉 | 天天狠狠干 | 蜜芽成人av | 国产精品粉嫩福利在线 | 欧美在线中文字幕 |