30 個 Python 的最佳實踐、小貼士和技巧
英文:Erik-Jan van Baaren,翻譯:CSDN ?|?彎月
元旦過完了,我們都紛紛回到了各自的工作崗位。新的一年新氣象,我想借本文為大家獻(xiàn)上 Python 語言的30個最佳實踐、小貼士和技巧,希望能對各位勤勞的程序員有所幫助,并希望大家工作順利!?
1. Python 版本
在此想提醒各位:自2020年1月1日起,Python 官方不再支持 Python 2。本文中的很多示例只能在 Python 3 中運行。如果你仍在使用 Python 2.7,請立即升級。
2. 檢查 Python 的最低版本
你可以在代碼中檢查 Python 的版本,以確保你的用戶沒有在不兼容的版本中運行腳本。檢查方式如下:
if?not?sys.version_info?>?(2,?7):
???#?berate?your?user?for?running?a?10?year
???#?python?version
elif?not?sys.version_info?>=?(3,?5):
???#?Kindly?tell?your?user?(s)he?needs?to?upgrade
???#?because?you're?using?3.5?features3. IPython

IPython 本質(zhì)上就是一個增強版的shell。就沖著自動補齊就值得一試,而且它的功能還不止于此,它還有很多令我愛不釋手的命令,例如:
%cd:改變當(dāng)前的工作目錄
%edit:打開編輯器,并關(guān)閉編輯器后執(zhí)行鍵入的代碼
%env:顯示當(dāng)前環(huán)境變量
%pip install [pkgs]:無需離開交互式shell,就可以安裝軟件包
%time 和 %timeit:測量執(zhí)行Python代碼的時間
完整的命令列表,請點擊此處查看(https://ipython.readthedocs.io/en/stable/interactive/magics.html)。
還有一個非常實用的功能:引用上一個命令的輸出。In 和 Out 是實際的對象。你可以通過 Out[3] 的形式使用第三個命令的輸出。
IPython 的安裝命令如下:
pip3?install?ipython4. 列表推導(dǎo)式
你可以利用列表推導(dǎo)式,避免使用循環(huán)填充列表時的繁瑣。列表推導(dǎo)式的基本語法如下:
[?expression?for?item?in?list?if?conditional?]舉一個基本的例子:用一組有序數(shù)字填充一個列表:
mylist?=?[i?for?i?in?range(10)]
print(mylist)
#?[0,?1,?2,?3,?4,?5,?6,?7,?8,?9]由于可以使用表達(dá)式,所以你也可以做一些算術(shù)運算:
squares?=?[x**2?for?x?in?range(10)]
print(squares)
#?[0,?1,?4,?9,?16,?25,?36,?49,?64,?81]甚至可以調(diào)用外部函數(shù):
def?some_function(a):
????return?(a?+?5)?/?2
my_formula?=?[some_function(i)?for?i?in?range(10)]
print(my_formula)
#?[2,?3,?3,?4,?4,?5,?5,?6,?6,?7]最后,你還可以使用 ‘if’ 來過濾列表。在如下示例中,我們只保留能被2整除的數(shù)字:
filtered?=?[i?for?i?in?range(20)?if?i%2==0]
print(filtered)
#?[0,?2,?4,?6,?8,?10,?12,?14,?16,?18]5. 檢查對象使用內(nèi)存的狀況
你可以利用 sys.getsizeof() 來檢查對象使用內(nèi)存的狀況:
import?sys
mylist?=?range(0,?10000)
print(sys.getsizeof(mylist))
#?48等等,為什么這個巨大的列表僅包含48個字節(jié)?
因為這里的 range 函數(shù)返回了一個類,只不過它的行為就像一個列表。在使用內(nèi)存方面,range 遠(yuǎn)比實際的數(shù)字列表更加高效。
你可以試試看使用列表推導(dǎo)式創(chuàng)建一個范圍相同的數(shù)字列表:?
import?sys
myreallist?=?[x?for?x?in?range(0,?10000)]
print(sys.getsizeof(myreallist))
#?876326. 返回多個值
Python 中的函數(shù)可以返回一個以上的變量,而且還無需使用字典、列表或類。如下所示:
def?get_user(id):
????#?fetch?user?from?database
????#?....
????return?name,?birthdate
name,?birthdate?=?get_user(4)如果返回值的數(shù)量有限當(dāng)然沒問題。但是,如果返回值的數(shù)量超過3個,那么你就應(yīng)該將返回值放入一個(數(shù)據(jù))類中。
7. 使用數(shù)據(jù)類
Python從版本3.7開始提供數(shù)據(jù)類。與常規(guī)類或其他方法(比如返回多個值或字典)相比,數(shù)據(jù)類有幾個明顯的優(yōu)勢:
數(shù)據(jù)類的代碼量較少
你可以比較數(shù)據(jù)類,因為數(shù)據(jù)類提供了 __eq__ 方法
調(diào)試的時候,你可以輕松地輸出數(shù)據(jù)類,因為數(shù)據(jù)類還提供了 __repr__ 方法
數(shù)據(jù)類需要類型提示,因此可以減少Bug的發(fā)生幾率?
數(shù)據(jù)類的示例如下:
from?dataclasses?import?dataclass
@dataclass
class?Card:
????rank:?str
????suit:?str
card?=?Card("Q",?"hearts")
print(card?==?card)
#?True
print(card.rank)
#?'Q'
print(card)
Card(rank='Q',?suit='hearts')詳細(xì)的使用指南請點擊這里(https://realpython.com/python-data-classes/)。
8. 交換變量
如下的小技巧很巧妙,可以為你節(jié)省多行代碼:
a?=?1
b?=?2
a,?b?=?b,?a
print?(a)
#?2
print?(b)
#?19. 合并字典(Python 3.5以上的版本)
從Python 3.5開始,合并字典的操作更加簡單了:
dict1?=?{?'a':?1,?'b':?2?}
dict2?=?{?'b':?3,?'c':?4?}
merged?=?{?**dict1,?**dict2?}
print?(merged)
#?{'a':?1,?'b':?3,?'c':?4}如果 key 重復(fù),那么第一個字典中的 key 會被覆蓋。
10. 字符串的首字母大寫
如下技巧真是一個小可愛:
mystring?=?"10?awesome?python?tricks"
print(mystring.title())
'10?Awesome?Python?Tricks'11. 將字符串分割成列表
你可以將字符串分割成一個字符串列表。在如下示例中,我們利用空格分割各個單詞:
mystring?=?"The?quick?brown?fox"
mylist?=?mystring.split('?')
print(mylist)
#?['The',?'quick',?'brown',?'fox']12. 根據(jù)字符串列表創(chuàng)建字符串
與上述技巧相反,我們可以根據(jù)字符串列表創(chuàng)建字符串,然后在各個單詞之間加入空格:
mylist?=?['The',?'quick',?'brown',?'fox']
mystring?=?"?".join(mylist)
print(mystring)
#?'The?quick?brown?fox'你可能會問為什么不是 mylist.join(" "),這是個好問題!
根本原因在于,函數(shù) String.join() 不僅可以聯(lián)接列表,而且還可以聯(lián)接任何可迭代對象。將其放在String中是為了避免在多個地方重復(fù)實現(xiàn)同一個功能。
13. 表情符

有些人非常喜歡表情符,而有些人則深惡痛絕。我在此鄭重聲明:在分析社交媒體數(shù)據(jù)時,表情符可以派上大用場。
首先,我們來安裝表情符模塊:
pip3?install?emoji安裝完成后,你可以按照如下方式使用:
import?emoji
result?=?emoji.emojize('Python?is?:thumbs_up:')
print(result)
#?'Python?is??'
#?You?can?also?reverse?this:
result?=?emoji.demojize('Python?is??')
print(result)
#?'Python?is?:thumbs_up:'更多有關(guān)表情符的示例和文檔,請點擊此處(https://pypi.org/project/emoji/)。
14. 列表切片
列表切片的基本語法如下:
a[start:stop:step]start、stop 和 step 都是可選項。如果不指定,則會使用如下默認(rèn)值:
start:0
end:字符串的結(jié)尾
step:1
示例如下:
#?We?can?easily?create?a?new?list?from?
#?the?first?two?elements?of?a?list:
first_two?=?[1,?2,?3,?4,?5][0:2]
print(first_two)
#?[1,?2]
#?And?if?we?use?a?step?value?of?2,?
#?we?can?skip?over?every?second?number
#?like?this:
steps?=?[1,?2,?3,?4,?5][0:5:2]
print(steps)
#?[1,?3,?5]
#?This?works?on?strings?too.?In?Python,
#?you?can?treat?a?string?like?a?list?of
#?letters:
mystring?=?"abcdefdn?nimt"[::2]
print(mystring)
#?'aced?it'15. 反轉(zhuǎn)字符串和列表
你可以利用如上切片的方法來反轉(zhuǎn)字符串或列表。只需指定 step 為 -1,就可以反轉(zhuǎn)其中的元素:
revstring?=?"abcdefg"[::-1]
print(revstring)
#?'gfedcba'
revarray?=?[1,?2,?3,?4,?5][::-1]
print(revarray)
#?[5,?4,?3,?2,?1]16. 顯示貓貓
我終于找到了一個充分的借口可以在我的文章中顯示貓貓了,哈哈!當(dāng)然,你也可以利用它來顯示圖片。首先你需要安裝 Pillow,這是一個 Python 圖片庫的分支:
pip3?install?Pillow接下來,你可以將如下圖片下載到一個名叫 kittens.jpg 的文件中:

然后,你就可以通過如下 Python 代碼顯示上面的圖片:
from?PIL?import?Image
im?=?Image.open("kittens.jpg")
im.show()
print(im.format,?im.size,?im.mode)
#?JPEG?(1920,?1357)?RGBPillow 還有很多顯示該圖片之外的功能。它可以分析、調(diào)整大小、過濾、增強、變形等等。完整的文檔,請點擊這里(https://pillow.readthedocs.io/en/stable/)。
17. map()
Python 有一個自帶的函數(shù)叫做 map(),語法如下:
map(function,?something_iterable)所以,你需要指定一個函數(shù)來執(zhí)行,或者一些東西來執(zhí)行。任何可迭代對象都可以。在如下示例中,我指定了一個列表:
def?upper(s):
????return?s.upper()
mylist?=?list(map(upper,?['sentence',?'fragment']))
print(mylist)
#?['SENTENCE',?'FRAGMENT']
#?Convert?a?string?representation?of
#?a?number?into?a?list?of?ints.
list_of_ints?=?list(map(int,?"1234567")))
print(list_of_ints)
#?[1,?2,?3,?4,?5,?6,?7]你可以仔細(xì)看看自己的代碼,看看能不能用 map() 替代某處的循環(huán)。
18. 獲取列表或字符串中的唯一元素
如果你利用函數(shù) set() 創(chuàng)建一個集合,就可以獲取某個列表或類似于列表的對象的唯一元素:
mylist?=?[1,?1,?2,?3,?4,?5,?5,?5,?6,?6]
print?(set(mylist))
#?{1,?2,?3,?4,?5,?6}
#?And?since?a?string?can?be?treated?like?a?
#?list?of?letters,?you?can?also?get?the?
#?unique?letters?from?a?string?this?way:
print?(set("aaabbbcccdddeeefff"))
#?{'a',?'b',?'c',?'d',?'e',?'f'}19. 查找出現(xiàn)頻率最高的值
你可以通過如下方法查找出現(xiàn)頻率最高的值:
test?=?[1,?2,?3,?4,?2,?2,?3,?1,?4,?4,?4]
print(max(set(test),?key?=?test.count))
#?4你能看懂上述代碼嗎?想法搞明白上述代碼再往下讀。
沒看懂?我來告訴你吧:
max() 會返回列表的最大值。參數(shù) key 會接受一個參數(shù)函數(shù)來自定義排序,在本例中為 test.count。該函數(shù)會應(yīng)用于迭代對象的每一項。
test.count 是 list 的內(nèi)置函數(shù)。它接受一個參數(shù),而且還會計算該參數(shù)的出現(xiàn)次數(shù)。因此,test.count(1) 將返回2,而 test.count(4) 將返回4。
set(test) 將返回 test 中所有的唯一值,也就是 {1, 2, 3, 4}。
因此,這一行代碼完成的操作是:首先獲取 test 所有的唯一值,即{1, 2, 3, 4};然后,max 會針對每一個值執(zhí)行 list.count,并返回最大值。
這一行代碼可不是我個人的發(fā)明。
20. 創(chuàng)建一個進(jìn)度條
你可以創(chuàng)建自己的進(jìn)度條,聽起來很有意思。但是,更簡單的方法是使用 progress 包:
pip3?install?progress接下來,你就可以輕松地創(chuàng)建進(jìn)度條了:
from?progress.bar?import?Bar
bar?=?Bar('Processing',?max=20)
for?i?in?range(20):
????#?Do?some?work
????bar.next()
bar.finish()21. 在交互式shell中使用_(下劃線運算符)
你可以通過下劃線運算符獲取上一個表達(dá)式的結(jié)果,例如在 IPython 中,你可以這樣操作:
In?[1]:?3?*?3
Out[1]:?9In?[2]:?_?+?3
Out[2]:?12Python Shell 中也可以這樣使用。另外,在 IPython shell 中,你還可以通過 Out[n] 獲取表達(dá)式 In[n] 的值。例如,在如上示例中,Out[1] 將返回數(shù)字9。
22. 快速創(chuàng)建Web服務(wù)器
你可以快速啟動一個Web服務(wù),并提供當(dāng)前目錄的內(nèi)容:
python3?-m?http.server當(dāng)你想與同事共享某個文件,或測試某個簡單的HTML網(wǎng)站時,就可以考慮這個方法。
23. 多行字符串
雖然你可以用三重引號將代碼中的多行字符串括起來,但是這種做法并不理想。所有放在三重引號之間的內(nèi)容都會成為字符串,包括代碼的格式,如下所示。
我更喜歡另一種方法,這種方法不僅可以將多行字符串連接在一起,而且還可以保證代碼的整潔。唯一的缺點是你需要明確指定換行符。
s1?=?"""Multi?line?strings?can?be?put
????????between?triple?quotes.?It's?not?ideal
????????when?formatting?your?code?though"""
print?(s1)
#?Multi?line?strings?can?be?put
#?????????between?triple?quotes.?It's?not?ideal
#?????????when?formatting?your?code?though
s2?=?("You?can?also?concatenate?multiple\n"?+
????????"strings?this?way,?but?you'll?have?to\n"
????????"explicitly?put?in?the?newlines")
print(s2)
#?You?can?also?concatenate?multiple
#?strings?this?way,?but?you'll?have?to
#?explicitly?put?in?the?newlines24. 條件賦值中的三元運算符
這種方法可以讓代碼更簡潔,同時又可以保證代碼的可讀性:
[on_true]?if?[expression]?else?[on_false]示例如下:
x?=?"Success!"?if?(y?==?2)?else?"Failed!"25. 統(tǒng)計元素的出現(xiàn)次數(shù)
你可以使用集合庫中的 Counter 來獲取列表中所有唯一元素的出現(xiàn)次數(shù),Counter 會返回一個字典:
from?collections?import?Counter
mylist?=?[1,?1,?2,?3,?4,?5,?5,?5,?6,?6]
c?=?Counter(mylist)
print(c)
#?Counter({1:?2,?2:?1,?3:?1,?4:?1,?5:?3,?6:?2})
#?And?it?works?on?strings?too:
print(Counter("aaaaabbbbbccccc"))
#?Counter({'a':?5,?'b':?5,?'c':?5})26. 比較運算符的鏈接
你可以在 Python 中將多個比較運算符鏈接到一起,如此就可以創(chuàng)建更易讀、更簡潔的代碼:
x?=?10
#?Instead?of:
if?x?>?5?and?x?15:
????print("Yes")
#?yes
#?You?can?also?write:
if?5?15:
????print("Yes")
#?Yes27. 添加顏色

你可以通過 Colorama,設(shè)置終端的顯示顏色:
from?colorama?import?Fore,?Back,?Style
print(Fore.RED?+?'some?red?text')
print(Back.GREEN?+?'and?with?a?green?background')
print(Style.DIM?+?'and?in?dim?text')
print(Style.RESET_ALL)
print('back?to?normal?now')28. 日期的處理
python-dateutil 模塊作為標(biāo)準(zhǔn)日期模塊的補充,提供了非常強大的擴展,你可以通過如下命令安裝:?
pip3?install?python-dateutil?你可以利用該庫完成很多神奇的操作。在此我只舉一個例子:模糊分析日志文件中的日期:
from?dateutil.parser?import?parse
logline?=?'INFO?2020-01-01T00:00:01?Happy?new?year,?human.'
timestamp?=?parse(log_line,?fuzzy=True)
print(timestamp)
#?2020-01-01?00:00:01你只需記住:當(dāng)遇到常規(guī) Python 日期時間功能無法解決的問題時,就可以考慮 python-dateutil !
29.整數(shù)除法

在 Python 2 中,除法運算符(/)默認(rèn)為整數(shù)除法,除非其中一個操作數(shù)是浮點數(shù)。因此,你可以這么寫:
#?Python?2
5?/?2?=?2
5?/?2.0?=?2.5在 Python 3 中,除法運算符(/)默認(rèn)為浮點除法,而整數(shù)除法的運算符為 //。因此,你需要這么寫:
Python?3
5?/?2?=?2.5
5?//?2?=?2這項變更背后的動機,請參閱 PEP-0238(https://www.python.org/dev/peps/pep-0238/)。
30. 通過chardet 來檢測字符集
你可以使用 chardet 模塊來檢測文件的字符集。在分析大量隨機文本時,這個模塊十分實用。安裝方法如下:
pip?install?chardet安裝完成后,你就可以使用命令行工具 chardetect 了,使用方法如下:
chardetect?somefile.txt
somefile.txt:?ascii?with?confidence?1.0你也可以在編程中使用該庫,完整的文檔請點擊這里(https://chardet.readthedocs.io/en/latest/usage.html)。
如上就是我為各位奉上的新年禮物,希望各位喜歡!如果你有其他的技巧、貼士和實踐,請在下方留言!
原文:
https://towardsdatascience.com/30-python-best-practices-tips-and-tricks-caefb9f8c5f5
