<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          吐血整理!140種Python標(biāo)準(zhǔn)庫、第三方庫和外部工具都有了

          共 12469字,需瀏覽 25分鐘

           ·

          2021-04-29 14:03

          導(dǎo)讀:Python數(shù)據(jù)工具箱涵蓋從數(shù)據(jù)源到數(shù)據(jù)可視化的完整流程中涉及到的常用庫、函數(shù)和外部工具。其中既有Python內(nèi)置函數(shù)和標(biāo)準(zhǔn)庫,又有第三方庫和工具。


          這些庫可用于文件讀寫、網(wǎng)絡(luò)抓取和解析、數(shù)據(jù)連接、數(shù)清洗轉(zhuǎn)換、數(shù)據(jù)計算和統(tǒng)計分析、圖像和視頻處理、音頻處理、數(shù)據(jù)挖掘/機器學(xué)習(xí)/深度學(xué)習(xí)、數(shù)據(jù)可視化、交互學(xué)習(xí)和集成開發(fā)以及其他Python協(xié)同數(shù)據(jù)工作工具。


          作者:宋天龍

          如需轉(zhuǎn)載請聯(lián)系大數(shù)據(jù)(ID:hzdashuju)



          為了區(qū)分不同對象的來源和類型,本文將在描述中通過以下方法進(jìn)行標(biāo)識:


          • Python內(nèi)置函數(shù):Python自帶的內(nèi)置函數(shù)。函數(shù)無需導(dǎo)入,直接使用。例如要計算-3.2的絕對值,直接使用abs函數(shù),方法是


          abs(-3.2) 


          • Python標(biāo)準(zhǔn)庫:Python自帶的標(biāo)準(zhǔn)庫。Python標(biāo)準(zhǔn)庫無需安裝,只需要先通過import方法導(dǎo)入便可使用其中的方法。例如導(dǎo)入string模塊,然后使用其中的find方法:



          import stringstring.find('abcde','b')


          • 第三方庫:Python的第三方庫。這些庫需要先進(jìn)行安裝(部分可能需要配置)。


          • 外部工具:非Python寫成的庫或包,用于Python數(shù)據(jù)工作的相關(guān)工具。


          推薦度」3星最高,1星最低。



          01 文件讀寫


          文件的讀寫包括常見的txt、Excel、xml、二進(jìn)制文件以及其他格式的數(shù)據(jù)文本,主要用于本地數(shù)據(jù)的讀寫。



          1. open(name[, mode[, buffering]])


          • 類型:Python內(nèi)置函數(shù)

          • 描述:Python默認(rèn)的文件讀寫方法

          • 推薦度:★★★


          2. numpy.loadtxt、numpy.load和numpy.fromfile


          • 類型:第三方庫

          • 描述:Numpy自帶的讀寫函數(shù),包括loadtxt、load和fromfile,用于文本、二進(jìn)制文件讀寫

          • 推薦度:★★★


          3. pandas.read_*


          • 類型:第三方庫

          • 描述:Pandas自帶的read文件方法,例如ead_csv、read_fwf、read_table等,用于文本、Excel、二進(jìn)制文件、HDF5、表格、SAS文件、SQL數(shù)據(jù)庫、Stata文件等的讀寫

          • 推薦度:★★★


          4. xlrd


          • 類型:第三方庫

          • 描述:用于Excel文件讀取

          • 推薦度:★★


          5. xlwt


          • 類型:第三方庫

          • 描述:用于Excel文件寫入

          • 推薦度:★★


          6. pyexcel-xl


          • 類型:第三方庫

          • 描述:用于Excel文件讀寫

          • 推薦度:★★


          7. xluntils


          • 類型:第三方庫

          • 描述:用于Excel文件讀寫

          • 推薦度:★★


          8. pyExcelerator


          • 類型:第三方庫

          • 描述:用于Excel文件讀寫

          • 推薦度:


          9. openpyxl


          • 類型:第三方庫

          • 描述:用于Excel文件讀寫

          • 推薦度:


          10. lxml


          • 類型:第三方庫

          • 描述:xml和HTML讀取和解析

          • 推薦度:★★★


          11. xml


          • 類型:Python標(biāo)準(zhǔn)庫

          • 描述:xml對象解析和格式化處理

          • 推薦度:★★★


          12. libxml2


          • 類型:第三方庫

          • 描述:xml對象解析和格式化處理

          • 推薦度:


          13. xpath


          • 類型:第三方庫

          • 描述:xml對象解析和格式化處理

          • 推薦度:★★


          14. win32com


          • 類型:第三方庫

          • 描述:有關(guān)Windows系統(tǒng)操作、Office(Word、Excel等)文件讀寫等的綜合應(yīng)用庫

          • 推薦度:



          02 網(wǎng)絡(luò)抓取和解析


          網(wǎng)絡(luò)抓取和解析用于從互聯(lián)網(wǎng)中抓取信息,并對HTML對象進(jìn)行處理,有關(guān)xml對象的解析和處理的庫在“01 文件讀寫”中找到。



          15. requests


          • 類型:第三方庫

          • 描述:網(wǎng)絡(luò)請求庫,提供多種網(wǎng)絡(luò)請求方法并可定義復(fù)雜的發(fā)送信息

          • 推薦度:★★★


          16. urllib


          • 類型:Python標(biāo)準(zhǔn)庫

          • 描述:Python自帶的庫,簡單的讀取特定URL并獲得返回的信息

          • 推薦度:★★


          17. urllib2


          • 類型:Python標(biāo)準(zhǔn)庫

          • 描述:Python自帶的庫,讀取特定URL并獲得返回的信息,相對于urllib可處理更多HTTP信息,例如cookie、身份驗證、重定向等

          • 推薦度:★★


          18. urlparse


          • 類型:Python標(biāo)準(zhǔn)庫

          • 描述:Python自帶的URL解析庫,可自動解析URL不同的域、參數(shù)、路徑等

          • 推薦度:★★★


          19. HTMLParser


          • 類型:Python標(biāo)準(zhǔn)庫

          • 描述:Python自帶的HTML解析模塊,能夠很容易的實現(xiàn)HTML文件的分析

          • 推薦度:★★★


          20. Scapy


          • 類型:第三方庫

          • 描述:分布式爬蟲框架,可用于模擬用戶發(fā)送、偵聽和解析并偽裝網(wǎng)絡(luò)報文,常用于大型網(wǎng)絡(luò)數(shù)據(jù)爬取

          • 推薦度:★★★


          21. Beautiful Soup


          • 類型:第三方庫

          • 描述:Beautiful Soup是網(wǎng)頁數(shù)據(jù)解析和格式化處理工具,通常配合Python的urllib、urllib2等庫一起使用

          • 推薦度:★★★



          03 數(shù)據(jù)庫連接


          數(shù)據(jù)庫連接可用于連接眾多數(shù)據(jù)庫以及訪問通用數(shù)據(jù)庫接口,可用于數(shù)據(jù)庫維護(hù)、管理和增、刪、改、查等日常操作。



          22. mysql-connector-python


          • 類型:第三方庫

          • 描述:MySQL官方驅(qū)動連接程序

          • 推薦度:★★★


          23. pymysql


          • 類型:第三方庫

          • 描述:MySQL連接庫,支持Python3

          • 推薦度:★★★


          24. MySQL-python


          • 類型:第三方庫

          • 描述:MySQL連接庫

          • 推薦度:★★


          25. cx_Oracle


          • 類型:第三方庫

          • 描述:Oracle連接庫

          • 推薦度:★★★


          26. psycopg2


          • 類型:第三方庫

          • 描述:Python編程語言中非常受歡迎的PostgreSQL適配器

          • 推薦度:★★★


          27. redis


          • 類型:Python標(biāo)準(zhǔn)庫

          • 描述:Redis連接庫

          • 推薦度:★★★


          28. pymongo


          • 類型:第三方庫

          • 描述:MongoDB官方驅(qū)動連接程序

          • 推薦度:★★★


          29. HappyBase


          • 類型:第三方庫

          • 描述:HBase連接庫

          • 推薦度:★★★


          30. py2neo


          • 類型:第三方庫

          • 描述:Neo4j連接庫

          • 推薦度:★★★


          31. cassandra-driver


          • 類型:第三方庫

          • 描述:Cassandra(1.2+)和DataStax Enterprise(3.1+)連接庫

          • 推薦度:★★★


          32. sqlite3


          • 類型:Python標(biāo)準(zhǔn)庫

          • 描述:Python自帶的模塊,用于操作SQLite數(shù)據(jù)庫

          • 推薦度:★★★


          33. pysqlite2


          • 類型:第三方庫

          • 描述:SQLite 3.x連接庫

          • 推薦度:★★


          34. bsddb3


          • 類型:第三方庫

          • 描述:Berkeley DB連接庫


          35. bsddb


          • 類型:Python標(biāo)準(zhǔn)庫

          • 描述:Python自帶的模塊,提供了一個到Berkeley DB庫的接口

          • 推薦度:★★


          36. dbhash


          • 類型:Python標(biāo)準(zhǔn)庫

          • 描述:Python自帶的模塊,dbhash模塊提供了使用BSD數(shù)據(jù)庫庫打開數(shù)據(jù)庫的功能。該模塊鏡像了提供對DBM樣式數(shù)據(jù)庫訪問的其他Python數(shù)據(jù)庫模塊的接口。bsddb模塊需要使用dbhash

          • 推薦度:★★


          37. adodb


          • 類型:第三方庫

          • 描述:ADOdb是一個數(shù)據(jù)庫抽象庫,支持常見的數(shù)據(jù)和數(shù)據(jù)庫接口并可自行進(jìn)行數(shù)據(jù)庫擴展,該庫可以對不同數(shù)據(jù)庫中的語法進(jìn)行解析和差異化處理,具有很高的通用性

          • 推薦度:★★★


          38. SQLObject


          • 類型:第三方庫

          • 描述:SQLObject是一種流行的對象關(guān)系管理器,用于向數(shù)據(jù)庫提供對象接口,其中表為類、行為實例、列為屬性

          • 推薦度:★★


          39. SQLAlchemy


          • 類型:第三方庫

          • 描述:SQLAlchemy是Python SQL工具包和對象關(guān)系映射器,為應(yīng)用程序開發(fā)人員提供了SQL的全部功能和靈活性控制

          • 推薦度:★★


          40. ctypes


          • 類型:第三方庫

          • 描述:ctypes是Python的一個外部庫,提供和C語言兼容的數(shù)據(jù)類型,可以很方便地調(diào)用C DLL中的函數(shù)

          • 推薦度:★★★


          41. pyodbc


          • 類型:第三方庫

          • 描述:Python通過ODBC訪問數(shù)據(jù)庫的接口庫

          • 推薦度:★★★


          42. Jython


          • 類型:第三方庫

          • 描述:Python通過JDBC訪問數(shù)據(jù)庫的接口庫

          • 推薦度:★★★



          04 數(shù)據(jù)清洗轉(zhuǎn)換


          數(shù)據(jù)清洗轉(zhuǎn)換主用于數(shù)據(jù)正式應(yīng)用之前的預(yù)處理工作。



          43. frozenset([iterable])


          • 類型:Python內(nèi)置函數(shù)

          • 描述:返回一個新的frozenset對象,可選擇從iterable取得的元素

          • 推薦度:★★★


          44. int(x)


          • 類型:Python內(nèi)置函數(shù)

          • 描述:返回x的整數(shù)部分

          • 推薦度:★★★


          45. isinstance(object, classinfo)


          • 類型:Python內(nèi)置函數(shù)

          • 描述:返回object是否是指定的classinfo實例信息

          • 推薦度:★★★


          46. len(s)


          • 類型:Python內(nèi)置函數(shù)

          • 描述:返回對象的長度或項目數(shù)量

          • 推薦度:★★★


          47. long(x)


          • 類型:Python內(nèi)置函數(shù)

          • 描述:返回由字符串或數(shù)字x構(gòu)造的長整型對象

          • 推薦度:★★★


          48. max(iterable[, key])


          • 類型:Python內(nèi)置函數(shù)

          • 描述:返回一個可迭代或最大的兩個或多個參數(shù)中的最大項

          • 推薦度:★★★


          49. min(iterable[, key])


          • 類型:Python內(nèi)置函數(shù)

          • 描述:返回一個可迭代或最大的兩個或多個參數(shù)中的最小項

          • 推薦度:★★★


          50. range(start, stop[, step])


          • 類型:Python內(nèi)置函數(shù)

          • 描述:用于與for循環(huán)一起創(chuàng)建循環(huán)列表,通過指定start(開始)、stop(結(jié)束)和step(步長)控制迭代次數(shù)并獲取循環(huán)值

          • 推薦度:★★★


          51. raw_input(prompt)


          • 類型:Python內(nèi)置函數(shù)

          • 描述:捕獲用戶輸入并作為字符串返回(不推薦使用input作為用戶輸入的捕獲函數(shù))

          • 推薦度:★★★


          52. round(number[, ndigits])


          • 類型:Python內(nèi)置函數(shù)

          • 描述:返回number小數(shù)點后ndigits位的四舍五入的浮點數(shù)

          • 推薦度:★★★


          53. set([iterable])


          • 類型:Python內(nèi)置函數(shù)

          • 描述:返回一個新的集合對象,可選擇從iterable獲取的元素

          • 推薦度:★★★


          54. slice(start, stop[, step])


          • 類型:Python內(nèi)置函數(shù)

          • 描述:返回表示由范圍(start、stop、step)指定的索引集的切片對象

          • 推薦度:★★


          55. sorted(iterable[, cmp[, key[, reverse]]])


          • 類型:Python內(nèi)置函數(shù)

          • 描述:從iterable的項中返回一個新的排序列表

          • 推薦度:★★★


          56. xrange(start, stop[, step])


          • 類型:Python內(nèi)置函數(shù)

          • 描述:此函數(shù)與range()非常相似,但返回一個xrange對象而不是列表

          • 推薦度:★★★


          57. string


          • 類型:Python標(biāo)準(zhǔn)庫

          • 描述:字符串處理庫,可實現(xiàn)字符串查找、分割、組合、替換、去重、大小寫轉(zhuǎn)換及其他格式化處理

          • 推薦度:★★★


          58. re


          • 類型:Python標(biāo)準(zhǔn)庫

          • 描述:正則表達(dá)式模塊,在文本和字符串處理中經(jīng)常使用

          • 推薦度:★★★


          59. random


          • 類型:Python標(biāo)準(zhǔn)庫

          • 描述:該模塊為各種分布實現(xiàn)偽隨機數(shù)生成器,支持?jǐn)?shù)據(jù)均勻分布、正態(tài)(高斯)分布、對數(shù)正態(tài)分布、負(fù)指數(shù)分布、伽馬和β分布等

          • 推薦度:★★★


          60. os


          • 類型:Python標(biāo)準(zhǔn)庫

          • 描述:用于新建、刪除、權(quán)限修改、切換路徑等目錄操作,以及調(diào)用執(zhí)行系統(tǒng)命令

          • 推薦度:★★★


          61. os.path


          • 類型:Python標(biāo)準(zhǔn)庫

          • 描述:針對目錄的遍歷、組合、分割、判斷等操作,常用于數(shù)據(jù)文件的判斷、查找、合并

          • 推薦度:★★★


          62. prettytable


          • 類型:Python標(biāo)準(zhǔn)庫

          • 描述:格式化表格輸出模塊

          • 推薦度:★★


          63. json


          • 類型:Python標(biāo)準(zhǔn)庫

          • 描述:Python對象與json對象的轉(zhuǎn)換

          • 推薦度:★★★


          64. base64


          • 類型:Python標(biāo)準(zhǔn)庫

          • 描述:將任意二進(jìn)制字符串編碼和解碼為文本字符串的Base16,Base32和Base64

          • 推薦度:★★★



          05 數(shù)據(jù)計算和統(tǒng)計分析


          數(shù)據(jù)計算和統(tǒng)計分析主要用于數(shù)據(jù)探查、計算和初步數(shù)據(jù)分析等工作。



          65. numpy


          • 類型:第三方庫

          • 描述:NumPy是Python科學(xué)計算的基礎(chǔ)工具包,很多Python數(shù)據(jù)計算工作庫都依賴它

          • 推薦度:★★★


          66. scipy


          • 類型:第三方庫

          • 描述:Scipy是一組專門解決科學(xué)和工程計算不同場景的主題工具包

          • 推薦度:★★★


          67. pandas


          • 類型:第三方庫

          • 描述:Pandas是一個用于Python數(shù)據(jù)分析的庫,它的主要作用是進(jìn)行數(shù)據(jù)分析。Pandas提供用于進(jìn)行結(jié)構(gòu)化數(shù)據(jù)分析的二維的表格型數(shù)據(jù)結(jié)構(gòu)DataFrame,類似于R中的數(shù)據(jù)框,能提供類似于數(shù)據(jù)庫中的切片、切塊、聚合、選擇子集等精細(xì)化操作,為數(shù)據(jù)分析提供了便捷

          • 推薦度:★★★


          68. statsmodels


          • 類型:第三方庫

          • 描述:Statsmodels是Python的統(tǒng)計建模和計量經(jīng)濟(jì)學(xué)工具包,包括一些描述性統(tǒng)計、統(tǒng)計模型估計和統(tǒng)計測試,集成了多種線性回歸模型、廣義線性回歸模型、離散數(shù)據(jù)分布模型、時間序列分析模型、非參數(shù)估計、生存分析、主成分分析、核密度估計以及廣泛的統(tǒng)計測試和繪圖等功能

          • 推薦度:★★★


          69. abs(x)


          • 類型:Python內(nèi)置函數(shù)

          • 描述:返回x的絕對值

          • 推薦度:★★★


          70. cmp(x, y)


          • 類型:Python內(nèi)置函數(shù)

          • 描述:比較兩個對象x和y,并根據(jù)結(jié)果返回一個整數(shù)。如果x <y,則返回值為負(fù)數(shù),如果x == y則為零,如果x> y則返回值為正

          • 推薦度:★★


          71. float(x)


          • 類型:Python內(nèi)置函數(shù)

          • 描述:返回從數(shù)字或字符串x構(gòu)造的浮點數(shù)

          • 推薦度:★★★


          72. pow(x, y[, z])


          • 類型:Python內(nèi)置函數(shù)

          • 描述:返回x的y次冪。如果z存在,則返回x的y次冪,模z

          • 推薦度:★★★


          73. sum(iterable[, start])


          • 類型:Python內(nèi)置函數(shù)

          • 描述:從左到右依次迭代,返回總和

          • 推薦度:★★★


          74. math


          • 類型:Python標(biāo)準(zhǔn)庫

          • 描述:數(shù)學(xué)函數(shù)庫,包括正弦、余弦、正切、余切、弧度轉(zhuǎn)換、對數(shù)運算、圓周率、絕對值、取整等數(shù)學(xué)計算方法

          • 推薦度:★★★


          75. cmath


          • 類型:Python標(biāo)準(zhǔn)庫

          • 描述:與math基本一致,區(qū)別是cmath運算的是復(fù)數(shù)

          • 推薦度:★★


          76. decimal


          • 類型:Python標(biāo)準(zhǔn)庫

          • 描述:10進(jìn)制浮點運算

          • 推薦度:★★


          77. fractions


          • 類型:Python標(biāo)準(zhǔn)庫

          • 描述:分?jǐn)?shù)模塊提供對有理數(shù)算術(shù)的支持

          • 推薦度:★★



          06 自然語言處理和文本挖掘


          自然語言處理和文本挖掘庫主要用于以自然語言文本為對象的數(shù)據(jù)處理和建模。



          78. nltk


          • 類型:第三方庫

          • 描述:NLTK是一個Python自然語言處理工具,它用于對自然語言進(jìn)行分類、解析和語義理解。目前已經(jīng)有超過50種語料庫和詞匯資源

          • 推薦度:★★★


          79. pattern


          • 類型:第三方庫

          • 描述:Pattern是一個網(wǎng)絡(luò)數(shù)據(jù)挖掘Python工具包,提供了用于網(wǎng)絡(luò)挖掘(如網(wǎng)絡(luò)服務(wù)、網(wǎng)絡(luò)爬蟲等)、自然語言處理(如詞性標(biāo)注、情感分析等)、機器學(xué)習(xí)(如向量空間模型、分類模型等)、圖形化的網(wǎng)絡(luò)分析模型

          • 推薦度:★★★


          80. gensim


          • 類型:第三方庫

          • 描述:Gensim是一個專業(yè)的主題模型(發(fā)掘文字中隱含主題的一種統(tǒng)計建模方法)Python工具包,用來提供可擴展統(tǒng)計語義、分析純文本語義結(jié)構(gòu)以及檢索語義上相似的文檔

          • 推薦度:★★★


          81. 結(jié)巴分詞


          • 類型:第三方庫

          • 描述:結(jié)巴分詞是國內(nèi)流行的Python文本處理工具包,分詞模式分為三種模式:精確模式、全模式和搜索引擎模式,支持繁體分詞、自定義詞典等,是非常好的Python中文分詞解決方案,可以實現(xiàn)分詞、詞典管理、關(guān)鍵字抽取、詞性標(biāo)注等

          • 推薦度:★★★


          82. SnowNLP


          • 類型:第三方庫

          • 描述:SnowNLP是一個Python寫的類庫,可以方便的處理中文文本內(nèi)容。該庫是受到了TextBlob的啟發(fā)而針對中文處理寫的類庫,和TextBlob不同的是這里沒有用NLTK,所有的算法都是自己實現(xiàn)的,并且自帶了一些訓(xùn)練好的字典

          • 推薦度:★★


          83. smallseg


          • 類型:第三方庫

          • 描述:Smallseg是一個開源的、基于DFA的輕量級的中文分詞工具包。可自定義詞典、切割后返回登錄詞列表和未登錄詞列表、有一定的新詞識別能力

          • 推薦度:★★


          84. spaCy


          • 類型:第三方庫

          • 描述:spaCy是一個Python自然語言處理工具包,它結(jié)合Python和Cython使得自然語言處理能力達(dá)到了工業(yè)強度

          • 推薦度:★★★


          85. TextBlob


          • 類型:第三方庫

          • 描述:TextBlob 是一個處理文本數(shù)據(jù)的Python庫,可用來做詞性標(biāo)注、情感分析、文本翻譯、名詞短語抽取、文本分類等

          • 推薦度:★★


          86. PyNLPI


          • 類型:第三方庫

          • 描述:PyNLPI是一個適合各種自然語言處理任務(wù)的集合庫,可用于中文文本分詞、關(guān)鍵字分析等,尤其重要的是其支持中英文映射,支持UTF-8和GBK編碼的字符串等

          • 推薦度:★★★


          87. synonyms


          • 類型:第三方庫

          • 描述:中文近義詞工具包,可用于自然語言理解的很多任務(wù):文本對齊,推薦算法,相似度計算,語義偏移,關(guān)鍵字提取,概念提取,自動摘要,搜索引擎等。

          • 推薦度:★★★



          07 圖像和視頻處理


          圖像處理和視頻處理主要適用于基于圖像的操作、處理、分析和挖掘,如人臉識別、圖像識別、目標(biāo)跟蹤、圖像理解等。



          88. PIL/Pillow


          • 類型:第三方庫

          • 描述:PIL是一個常用的圖像讀取、處理和分析的庫,提供了多種數(shù)據(jù)處理、變換的操作方法和屬性。PIL僅支持到2.7版本且已經(jīng)很久沒有更新,一群志愿者基于PIL發(fā)布了新的分支Pillow。Pillow同時支持Python2和Python3并且加入很多新的功能

          • 推薦度:★★


          89. OpenCV


          • 類型:第三方庫

          • 描述:OpenCV是一個強大的圖像和視頻工作庫。它提供了多種程序接口,支持跨平臺(包括移動端)應(yīng)用。OpenCV的設(shè)計效率很高,它以優(yōu)化的C / C ++編寫,庫可以利用多核處理。除了對圖像進(jìn)行基本處理外,還支持圖像數(shù)據(jù)建模,并預(yù)制了多種圖像識別引擎,如人臉識別

          • 推薦度:★★★


          90. scikit-image


          • 類型:第三方庫

          • 描述:scikit-image(也稱skimage)是一個圖像處理庫,支持顏色模式轉(zhuǎn)換、濾鏡、繪圖、圖像處理、特征檢測等多種功能

          • 推薦度:★★


          91. imageop


          • 類型:Python標(biāo)準(zhǔn)庫

          • 描述:Python自帶的函數(shù),對圖像基本操作,包括裁剪、縮放、模式轉(zhuǎn)換

          • 推薦度:


          92. colorsys


          • 類型:Python標(biāo)準(zhǔn)庫

          • 描述:Python自帶的函數(shù),實現(xiàn)不同圖像色彩模式的轉(zhuǎn)換

          • 推薦度:


          93. imghdr


          • 類型:Python標(biāo)準(zhǔn)庫

          • 描述:Python自帶的函數(shù),返回圖像文件的類型

          • 推薦度:



          08 音頻處理


          音頻處理主要適用于基于聲音的處理、分析和建模,主要應(yīng)用于語音識別、語音合成、語義理解等。



          94. TimeSide


          • 類型:第三方庫

          • 描述:TimeSide是一個能夠進(jìn)行音頻分析、成像、轉(zhuǎn)碼、流媒體和標(biāo)簽處理的Python框架,可以對任何音頻或視頻內(nèi)容非常大的數(shù)據(jù)集進(jìn)行復(fù)雜的處理

          • 推薦度:★★★


          95. audiolazy


          • 類型:第三方庫

          • 描述:audiolazy是一個用于實時聲音數(shù)據(jù)流處理的庫,支持實時數(shù)據(jù)應(yīng)用處理、無限數(shù)據(jù)序列表示、數(shù)據(jù)流表示等

          • 推薦度:★★


          96. pydub


          • 類型:第三方庫

          • 描述:pydub支持多種格式聲音文件,可進(jìn)行多種信號處理(例如壓縮、均衡、歸一化)、信號生成(例如正弦、方波、鋸齒等)、音效注冊、靜音處理等

          • 推薦度:★★★


          97. audioop


          • 類型:Python標(biāo)準(zhǔn)庫

          • 描述:Python自帶的函數(shù),可實現(xiàn)對聲音片段的一些常用操作

          • 推薦度:★★


          98. tinytag


          • 類型:第三方庫

          • 描述:tinytag用于讀取多種聲音文件的元數(shù)據(jù),涵蓋MP3、OGG、OPUS、MP4、M4A、FLAC、WMA、Wave等格式

          • 推薦度:★★


          99. aifc


          • 類型:Python標(biāo)準(zhǔn)庫

          • 描述:Python自帶的函數(shù),讀寫AIFF和AIFC文件

          • 推薦度:


          100. sunau


          • 類型:Python標(biāo)準(zhǔn)庫

          • 描述:Python自帶的函數(shù),讀寫Sun AU文件

          • 推薦度:


          101. wave


          • 類型:Python標(biāo)準(zhǔn)庫

          • 描述:Python自帶的函數(shù),讀寫WAV文件

          • 推薦度:★★


          102. chunk


          • 類型:Python標(biāo)準(zhǔn)庫

          • 描述:Python自帶的函數(shù),讀取EA IFF 85塊格式的文件

          • 推薦度:


          103. sndhdr


          • 類型:Python標(biāo)準(zhǔn)庫

          • 描述:Python自帶的函數(shù),返回聲音文件的類型

          • 推薦度:


          104. ossaudiodev


          • 類型:Python標(biāo)準(zhǔn)庫

          • 描述:該模塊支持訪問OSS(開放聲音系統(tǒng))音頻接口

          • 推薦度:★★★



          09 數(shù)據(jù)挖掘/機器學(xué)習(xí)/深度學(xué)習(xí)


          數(shù)據(jù)挖掘、機器學(xué)習(xí)和深度學(xué)習(xí)等是Python進(jìn)行數(shù)據(jù)建模和挖掘?qū)W習(xí)的核心模塊。



          105. Scikit-Learn


          • 類型:第三方庫

          • 描述:scikit-learn(也稱SKlearn)是一個基于Python的機器學(xué)習(xí)綜合庫,內(nèi)置監(jiān)督式學(xué)習(xí)和非監(jiān)督式學(xué)習(xí)機器學(xué)習(xí)方法,包括各種回歸、聚類、分類、流式學(xué)習(xí)、異常檢測、神經(jīng)網(wǎng)絡(luò)、集成方法等主流算法類別,同時支持預(yù)置數(shù)據(jù)集、數(shù)據(jù)預(yù)處理、模型選擇和評估等方法,是一個非常完整、流行的機器學(xué)習(xí)工具庫

          • 推薦度:★★★


          106. TensorFlow


          • 類型:第三方庫

          • 描述:TensorFlow 是谷歌的第二代機器學(xué)習(xí)系統(tǒng),內(nèi)建深度學(xué)習(xí)的擴展支持,任何能夠用計算流圖形來表達(dá)的計算,都可以使用 TensorFlow

          • 推薦度:★★★


          107. NuPIC


          • 類型:第三方庫

          • 描述:NuPIC是一個以HTM(分層時間記憶)學(xué)習(xí)算法為工具的機器智能平臺。NuPIC適合于各種各樣的問題,尤其適用于檢測異常和預(yù)測應(yīng)用

          • 推薦度:★★★


          108. PyTorch


          • 類型:第三方庫

          • 描述:PyTorch是FaceBook推出的深度學(xué)習(xí)框架,它基于Python(而非lua)產(chǎn)生,它提供的動態(tài)計算圖是顯著區(qū)別于Tensorflow等其他學(xué)習(xí)框架的地方。

          • 推薦度:★★


          109. Orange


          • 類型:第三方庫

          • 描述:Orange通過圖形化操作界面,提供交互式數(shù)據(jù)分析功能,尤其適用于分類、聚類、回歸、特征選擇和交叉驗證工作

          • 推薦度:★★★


          110. theano


          • 類型:第三方庫

          • 描述:Theano是非常成熟的深度學(xué)習(xí)庫。它與Numpy緊密集成,支持GPU計算、單元測試和自我驗證

          • 推薦度:★★★


          111. keras


          • 類型:第三方庫

          • 描述:Keras是一個用Python編寫的高級神經(jīng)網(wǎng)絡(luò)API,能夠運行在TensorFlow或者Theano之上,它的開發(fā)重點是實現(xiàn)快速實驗

          • 推薦度:★★


          112. neurolab


          • 類型:第三方庫

          • 描述:Neurolab是具有靈活網(wǎng)絡(luò)配置和Python學(xué)習(xí)算法的基本神經(jīng)網(wǎng)絡(luò)算法庫。它包含通過遞歸神經(jīng)網(wǎng)絡(luò)(RNN)實現(xiàn)的不同變體,該庫是同類RNN API中最好的選擇之一

          • 推薦度:★★


          113. PyLearn2


          • 類型:第三方庫

          • 描述:PyLearn2是基于Theano的深度學(xué)習(xí)庫,它旨在提供極大的靈活性,并使研究人員可以進(jìn)行自由可控制,參數(shù)和屬性的靈活、開放配置是亮點

          • 推薦度:★★★


          114. OverFeat


          • 類型:第三方庫

          • 描述:OverFeat是一個深度學(xué)習(xí)庫,主要用于圖片分類、定位物體檢測

          • 推薦度:★★


          115. Pyevolve


          • 類型:第三方庫

          • 描述:Pyevolve是一個完整的遺傳算法框架,也支持遺傳編程

          • 推薦度:★★


          116. Caffe2


          • 類型:第三方庫

          • 描述:Cafffe2也是FaceBook推出的深度學(xué)習(xí)框架,相比于PyTorch 更適合于研究,Caffe2 適合大規(guī)模部署,主要用于計算機視覺,它對圖像識別的分類具有很好的應(yīng)用效果

          • 推薦度:★★



          10 數(shù)據(jù)可視化


          數(shù)據(jù)可視化主要用于做數(shù)據(jù)結(jié)果展示、數(shù)據(jù)模型驗證、圖形交互和探查等方面。



          117. Matplotlib


          • 類型:第三方庫

          • 描述:Matplotlib是Python的2D繪圖庫,它以各種硬拷貝格式和跨平臺的交互式環(huán)境生成出版質(zhì)量級別的圖形,開發(fā)者可以僅需要幾行代碼,便可以生成多種高質(zhì)量圖形

          • 推薦度:★★★


          118. pyecharts


          • 類型:第三方庫

          • 描述:基于百度Echarts的強大的可視化工具庫,其提供的圖形功能眾多,尤其對于復(fù)雜關(guān)系的展示能力較強

          • 推薦度:★★★


          119. seaborn


          • 類型:第三方庫

          • 描述:Seaborn是在Matplotlib的基礎(chǔ)上進(jìn)行了更高級的API封裝,它可以作為Matplotlib的補充

          • 推薦度:★★★


          120. bokeh


          • 類型:第三方庫

          • 描述:Bokeh是一種交互式可視化庫,可以在WEB瀏覽器中實現(xiàn)美觀的視覺效果

          • 推薦度:★★★


          121. Plotly


          • 類型:第三方庫

          • 描述:Plotly提供的圖形庫可以進(jìn)行在線WEB交互,并提供具有出版品質(zhì)的圖形,支持線圖、散點圖、區(qū)域圖、條形圖、誤差條、框圖、直方圖、熱圖、子圖、多軸、極坐標(biāo)圖、氣泡圖、玫瑰圖、熱力圖、漏斗圖等眾多圖形

          • 推薦度:★★★


          122. VisPy


          • 類型:第三方庫

          • 描述:VisPy是用于交互式科學(xué)可視化的Python庫,旨在實現(xiàn)快速,可擴展和易于使用

          • 推薦度:★★


          123. PyQtGraph


          • 類型:第三方庫

          • 描述:PyQtGraph是一個建立在PyQt4 / PySide和numpy之上的純Python圖形和GUI庫,主要用于數(shù)學(xué)/科學(xué)/工程應(yīng)用

          • 推薦度:★★


          124. ggplot


          • 類型:第三方庫

          • 描述:ggplot是用Python實現(xiàn)的圖形輸出庫,類似于 R中的圖形展示版本

          • 推薦度:★★★



          11 交互學(xué)習(xí)和集成開發(fā)


          交互學(xué)習(xí)和集成開發(fā)主要用來做Python開發(fā)、調(diào)試和集成之用,包括Python集成開發(fā)環(huán)境和IDE。



          125. IPython/ Jupyter


          • 類型:第三方庫

          • 描述:IPython 是一個基于Python 的交互式shell,比默認(rèn)的Python shell 好用得多,支持變量自動補全、自動縮進(jìn)、交互式幫助、魔法命令、系統(tǒng)命令等,內(nèi)置了許多很有用的功能和函數(shù)。從IPython4.0開始,IPython衍生出了IPython和Jupyter兩個分支。在該分支正式出現(xiàn)之前,IPython其實已經(jīng)擁有了ipython notebook功能,因此,Jupyter更像是一個ipython notebook的升級版。

          • 推薦度:★★★


          126. Elpy


          • 類型:第三方庫

          • 描述:Elpy是Emacs用于Python的開發(fā)環(huán)境,它結(jié)合并配置了許多其他軟件包,它們都是用Emacs Lisp和Python編寫的

          • 推薦度:★★


          127. PTVS


          • 類型:第三方庫

          • 描述:Visual Studio 的 Python 工具

          • 推薦度:★★


          128. PyCharm


          • 類型:外部工具

          • 描述:PyCharm帶有一整套可以幫助用戶在使用Python語言開發(fā)時提高其效率的工具,比如調(diào)試、語法高亮、項目管理、代碼跳轉(zhuǎn)、智能提示、自動完成、單元測試、版本控制并可集成IPython、系統(tǒng)終端命令行等,在PyCharm里幾乎就可以實現(xiàn)所有有關(guān)Python工作的全部過程

          • 推薦度:★★★


          129. LiClipse


          • 類型:外部工具

          • 描述:LiClipse是基于Eclipse的免費多語言 IDE,通過其中的PyDev可支持 Python開發(fā)應(yīng)用

          • 推薦度:★★


          130. Spyder


          • 類型:外部工具

          • 描述:Spyder是一個開源的Python IDE,由IPython和眾多流行的Python庫的支持,是一個具備高級編輯、交互式測試、調(diào)試以及數(shù)字計算環(huán)境的交互式開發(fā)環(huán)境

          • 推薦度:★★



          12 其他Python協(xié)同數(shù)據(jù)工作工具


          其他Python協(xié)同數(shù)據(jù)工作工具指除了上述主題以外,其他在數(shù)據(jù)工作中常用的工具或庫。


          131. tesseract-ocr


          • 類型:外部工具

          • 描述:這是一個Google支持的開源OCR圖文識別項目,支持超過200種語言(包括中文),并支持自定義訓(xùn)練字符集,支持跨Windows、Linux、Mac OSX 多平臺使用

          • 推薦度:★★★


          132. RPython


          • 類型:第三方庫

          • 描述:R集成庫

          • 推薦度:★★★


          133. Rpy2


          • 類型:第三方庫

          • 描述:Python連接R的庫


          134. matpython


          • 類型:第三方庫

          • 描述:MATLAB集成庫

          • 推薦度:★★★


          135. Lunatic Python


          • 類型:第三方庫

          • 描述:Lua集成庫

          • 推薦度:★★


          136. PyCall.jl


          • 類型:第三方庫

          • 描述:Julia集成庫

          • 推薦度:★★


          137. PySpark


          • 類型:第三方庫

          • 描述:Spark提供的Python API

          • 推薦度:★★★


          138. dumbo


          • 類型:第三方庫

          • 描述:這個模塊可以讓Pythoner輕松的編寫和運行 Hadoop 程序,程序版本比較早,可以作為參考

          • 推薦度:★★


          139. dpark


          • 類型:第三方庫

          • 描述:Python對Spark的克隆版本,類MapReduce框架

          • 推薦度:★★


          140. streamparse


          • 類型:第三方庫

          • 描述:Streamparse允許通過Storm對實時數(shù)據(jù)流運行Python代碼

          • 推薦度:★★★


          關(guān)于作者:宋天龍,大數(shù)據(jù)技術(shù)專家,觸脈咨詢合伙人兼副總裁,前Webtrekk中國區(qū)技術(shù)和咨詢負(fù)責(zé)人(Webtrekk,德國的在線數(shù)據(jù)分析服務(wù)提供商)。擅長數(shù)據(jù)挖掘、建模、分析與運營,精通端到端數(shù)據(jù)價值場景設(shè)計、業(yè)務(wù)需求轉(zhuǎn)換、數(shù)據(jù)結(jié)構(gòu)梳理、數(shù)據(jù)建模與學(xué)習(xí)以及數(shù)據(jù)工程交付。


          本文摘編自Python數(shù)據(jù)分析與數(shù)據(jù)化運營》(第2版),經(jīng)出版方授權(quán)發(fā)布。


          延伸閱讀《Python數(shù)據(jù)分析與數(shù)據(jù)化運營

          (第2版)

          點擊上圖了解及購買

          轉(zhuǎn)載請聯(lián)系微信:DoctorData


          推薦語:這是一本將數(shù)據(jù)分析技術(shù)與數(shù)據(jù)使用場景深度結(jié)合的著作,從實戰(zhàn)角度講解了如何利用Python進(jìn)行數(shù)據(jù)分析和數(shù)據(jù)化運營。本書與同類書大的不同在于,并不只有純粹的關(guān)于數(shù)據(jù)分析技術(shù)和工具的講解,而且還與數(shù)據(jù)使用場景深度結(jié)合,在業(yè)務(wù)上真正可指導(dǎo)落地。


          送書規(guī)則:

          截至本周日(4月25日)早9點,公眾號后臺查看最近閱讀和分享最多前3名中,各抽1人作為幸運讀者,包郵贈送1本!




          相關(guān)閱讀:


          瀏覽 49
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          評論
          圖片
          表情
          推薦
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  三区四区欧美视频 | 18日本xxxxx | 日韩骚| 人人摸人人爱人人操 | 午夜理伦无码理论片国产 |