<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          吐血整理!140種Python標(biāo)準(zhǔn)庫(kù)、第三方庫(kù)和外部工具都有了

          共 12032字,需瀏覽 25分鐘

           ·

          2021-08-31 09:13


          導(dǎo)讀:大家好,我是濤哥。Python數(shù)據(jù)工具箱涵蓋從數(shù)據(jù)源到數(shù)據(jù)可視化的完整流程中涉及到的常用庫(kù)、函數(shù)和外部工具。其中既有Python內(nèi)置函數(shù)和標(biāo)準(zhǔn)庫(kù),又有第三方庫(kù)和工具。


          這些庫(kù)可用于文件讀寫、網(wǎng)絡(luò)抓取和解析、數(shù)據(jù)連接、數(shù)清洗轉(zhuǎn)換、數(shù)據(jù)計(jì)算和統(tǒng)計(jì)分析、圖像和視頻處理、音頻處理、數(shù)據(jù)挖掘/機(jī)器學(xué)習(xí)/深度學(xué)習(xí)、數(shù)據(jù)可視化、交互學(xué)習(xí)和集成開(kāi)發(fā)以及其他Python協(xié)同數(shù)據(jù)工作工具。




          7ed2ebbafcac0631e48bca4ca7f23606.webp


          為了區(qū)分不同對(duì)象的來(lái)源和類型,本文將在描述中通過(guò)以下方法進(jìn)行標(biāo)識(shí):


          • Python內(nèi)置函數(shù):Python自帶的內(nèi)置函數(shù)。函數(shù)無(wú)需導(dǎo)入,直接使用。例如要計(jì)算-3.2的絕對(duì)值,直接使用abs函數(shù),方法是


          abs(-3.2) 


          • Python標(biāo)準(zhǔn)庫(kù):Python自帶的標(biāo)準(zhǔn)庫(kù)。Python標(biāo)準(zhǔn)庫(kù)無(wú)需安裝,只需要先通過(guò)import方法導(dǎo)入便可使用其中的方法。例如導(dǎo)入string模塊,然后使用其中的find方法:


          import stringstring.find('abcde','b')


          • 第三方庫(kù):Python的第三方庫(kù)。這些庫(kù)需要先進(jìn)行安裝(部分可能需要配置)。


          • 外部工具:非Python寫成的庫(kù)或包,用于Python數(shù)據(jù)工作的相關(guān)工具。


          推薦度」3星最高,1星最低。



          01 文件讀寫


          文件的讀寫包括常見(jiàn)的txt、Excel、xml、二進(jìn)制文件以及其他格式的數(shù)據(jù)文本,主要用于本地?cái)?shù)據(jù)的讀寫。


          a9de43d2ec1eab0e0e842fc8a4b69e94.webp


          1. open(name[, mode[, buffering]])


          • 類型:Python內(nèi)置函數(shù)

          • 描述:Python默認(rèn)的文件讀寫方法

          • 推薦度:★★★


          2. numpy.loadtxt、numpy.load和numpy.fromfile


          • 類型:第三方庫(kù)

          • 描述:Numpy自帶的讀寫函數(shù),包括loadtxt、load和fromfile,用于文本、二進(jìn)制文件讀寫

          • 推薦度:★★★


          3. pandas.read_*


          • 類型:第三方庫(kù)

          • 描述:Pandas自帶的read文件方法,例如ead_csv、read_fwf、read_table等,用于文本、Excel、二進(jìn)制文件、HDF5、表格、SAS文件、SQL數(shù)據(jù)庫(kù)、Stata文件等的讀寫

          • 推薦度:★★★


          4. xlrd


          • 類型:第三方庫(kù)

          • 描述:用于Excel文件讀取

          • 推薦度:★★


          5. xlwt


          • 類型:第三方庫(kù)

          • 描述:用于Excel文件寫入

          • 推薦度:★★


          6. pyexcel-xl


          • 類型:第三方庫(kù)

          • 描述:用于Excel文件讀寫

          • 推薦度:★★


          7. xluntils


          • 類型:第三方庫(kù)

          • 描述:用于Excel文件讀寫

          • 推薦度:★★


          8. pyExcelerator


          • 類型:第三方庫(kù)

          • 描述:用于Excel文件讀寫

          • 推薦度:


          9. openpyxl


          • 類型:第三方庫(kù)

          • 描述:用于Excel文件讀寫

          • 推薦度:


          10. lxml


          • 類型:第三方庫(kù)

          • 描述:xml和HTML讀取和解析

          • 推薦度:★★★


          11. xml


          • 類型:Python標(biāo)準(zhǔn)庫(kù)

          • 描述:xml對(duì)象解析和格式化處理

          • 推薦度:★★★


          12. libxml2


          • 類型:第三方庫(kù)

          • 描述:xml對(duì)象解析和格式化處理

          • 推薦度:


          13. xpath


          • 類型:第三方庫(kù)

          • 描述:xml對(duì)象解析和格式化處理

          • 推薦度:★★


          14. win32com


          • 類型:第三方庫(kù)

          • 描述:有關(guān)Windows系統(tǒng)操作、Office(Word、Excel等)文件讀寫等的綜合應(yīng)用庫(kù)

          • 推薦度:



          02 網(wǎng)絡(luò)抓取和解析


          網(wǎng)絡(luò)抓取和解析用于從互聯(lián)網(wǎng)中抓取信息,并對(duì)HTML對(duì)象進(jìn)行處理,有關(guān)xml對(duì)象的解析和處理的庫(kù)在“01 文件讀寫”中找到。


          6e8de41483b4744967ebc0c771133e98.webp


          15. requests


          • 類型:第三方庫(kù)

          • 描述:網(wǎng)絡(luò)請(qǐng)求庫(kù),提供多種網(wǎng)絡(luò)請(qǐng)求方法并可定義復(fù)雜的發(fā)送信息

          • 推薦度:★★★


          16. urllib


          • 類型:Python標(biāo)準(zhǔn)庫(kù)

          • 描述:Python自帶的庫(kù),簡(jiǎn)單的讀取特定URL并獲得返回的信息

          • 推薦度:★★


          17. urllib2


          • 類型:Python標(biāo)準(zhǔn)庫(kù)

          • 描述:Python自帶的庫(kù),讀取特定URL并獲得返回的信息,相對(duì)于urllib可處理更多HTTP信息,例如cookie、身份驗(yàn)證、重定向等

          • 推薦度:★★


          18. urlparse


          • 類型:Python標(biāo)準(zhǔn)庫(kù)

          • 描述:Python自帶的URL解析庫(kù),可自動(dòng)解析URL不同的域、參數(shù)、路徑等

          • 推薦度:★★★


          19. HTMLParser


          • 類型:Python標(biāo)準(zhǔn)庫(kù)

          • 描述:Python自帶的HTML解析模塊,能夠很容易的實(shí)現(xiàn)HTML文件的分析

          • 推薦度:★★★


          20. Scapy


          • 類型:第三方庫(kù)

          • 描述:分布式爬蟲框架,可用于模擬用戶發(fā)送、偵聽(tīng)和解析并偽裝網(wǎng)絡(luò)報(bào)文,常用于大型網(wǎng)絡(luò)數(shù)據(jù)爬取

          • 推薦度:★★★


          21. Beautiful Soup


          • 類型:第三方庫(kù)

          • 描述:Beautiful Soup是網(wǎng)頁(yè)數(shù)據(jù)解析和格式化處理工具,通常配合Python的urllib、urllib2等庫(kù)一起使用

          • 推薦度:★★★



          03 數(shù)據(jù)庫(kù)連接


          數(shù)據(jù)庫(kù)連接可用于連接眾多數(shù)據(jù)庫(kù)以及訪問(wèn)通用數(shù)據(jù)庫(kù)接口,可用于數(shù)據(jù)庫(kù)維護(hù)、管理和增、刪、改、查等日常操作。


          b717debab46c91ef182a74b942aa0d4b.webp


          22. mysql-connector-python


          • 類型:第三方庫(kù)

          • 描述:MySQL官方驅(qū)動(dòng)連接程序

          • 推薦度:★★★


          23. pymysql


          • 類型:第三方庫(kù)

          • 描述:MySQL連接庫(kù),支持Python3

          • 推薦度:★★★


          24. MySQL-python


          • 類型:第三方庫(kù)

          • 描述:MySQL連接庫(kù)

          • 推薦度:★★


          25. cx_Oracle


          • 類型:第三方庫(kù)

          • 描述:Oracle連接庫(kù)

          • 推薦度:★★★


          26. psycopg2


          • 類型:第三方庫(kù)

          • 描述:Python編程語(yǔ)言中非常受歡迎的PostgreSQL適配器

          • 推薦度:★★★


          27. redis


          • 類型:Python標(biāo)準(zhǔn)庫(kù)

          • 描述:Redis連接庫(kù)

          • 推薦度:★★★


          28. pymongo


          • 類型:第三方庫(kù)

          • 描述:MongoDB官方驅(qū)動(dòng)連接程序

          • 推薦度:★★★


          29. HappyBase


          • 類型:第三方庫(kù)

          • 描述:HBase連接庫(kù)

          • 推薦度:★★★


          30. py2neo


          • 類型:第三方庫(kù)

          • 描述:Neo4j連接庫(kù)

          • 推薦度:★★★


          31. cassandra-driver


          • 類型:第三方庫(kù)

          • 描述:Cassandra(1.2+)和DataStax Enterprise(3.1+)連接庫(kù)

          • 推薦度:★★★


          32. sqlite3


          • 類型:Python標(biāo)準(zhǔn)庫(kù)

          • 描述:Python自帶的模塊,用于操作SQLite數(shù)據(jù)庫(kù)

          • 推薦度:★★★


          33. pysqlite2


          • 類型:第三方庫(kù)

          • 描述:SQLite 3.x連接庫(kù)

          • 推薦度:★★


          34. bsddb3


          • 類型:第三方庫(kù)

          • 描述:Berkeley DB連接庫(kù)


          35. bsddb


          • 類型:Python標(biāo)準(zhǔn)庫(kù)

          • 描述:Python自帶的模塊,提供了一個(gè)到Berkeley DB庫(kù)的接口

          • 推薦度:★★


          36. dbhash


          • 類型:Python標(biāo)準(zhǔn)庫(kù)

          • 描述:Python自帶的模塊,dbhash模塊提供了使用BSD數(shù)據(jù)庫(kù)庫(kù)打開(kāi)數(shù)據(jù)庫(kù)的功能。該模塊鏡像了提供對(duì)DBM樣式數(shù)據(jù)庫(kù)訪問(wèn)的其他Python數(shù)據(jù)庫(kù)模塊的接口。bsddb模塊需要使用dbhash

          • 推薦度:★★


          37. adodb


          • 類型:第三方庫(kù)

          • 描述:ADOdb是一個(gè)數(shù)據(jù)庫(kù)抽象庫(kù),支持常見(jiàn)的數(shù)據(jù)和數(shù)據(jù)庫(kù)接口并可自行進(jìn)行數(shù)據(jù)庫(kù)擴(kuò)展,該庫(kù)可以對(duì)不同數(shù)據(jù)庫(kù)中的語(yǔ)法進(jìn)行解析和差異化處理,具有很高的通用性

          • 推薦度:★★★


          38. SQLObject


          • 類型:第三方庫(kù)

          • 描述:SQLObject是一種流行的對(duì)象關(guān)系管理器,用于向數(shù)據(jù)庫(kù)提供對(duì)象接口,其中表為類、行為實(shí)例、列為屬性

          • 推薦度:★★


          39. SQLAlchemy


          • 類型:第三方庫(kù)

          • 描述:SQLAlchemy是Python SQL工具包和對(duì)象關(guān)系映射器,為應(yīng)用程序開(kāi)發(fā)人員提供了SQL的全部功能和靈活性控制

          • 推薦度:★★


          40. ctypes


          • 類型:第三方庫(kù)

          • 描述:ctypes是Python的一個(gè)外部庫(kù),提供和C語(yǔ)言兼容的數(shù)據(jù)類型,可以很方便地調(diào)用C DLL中的函數(shù)

          • 推薦度:★★★


          41. pyodbc


          • 類型:第三方庫(kù)

          • 描述:Python通過(guò)ODBC訪問(wèn)數(shù)據(jù)庫(kù)的接口庫(kù)

          • 推薦度:★★★


          42. Jython


          • 類型:第三方庫(kù)

          • 描述:Python通過(guò)JDBC訪問(wèn)數(shù)據(jù)庫(kù)的接口庫(kù)

          • 推薦度:★★★



          04 數(shù)據(jù)清洗轉(zhuǎn)換


          數(shù)據(jù)清洗轉(zhuǎn)換主用于數(shù)據(jù)正式應(yīng)用之前的預(yù)處理工作。


          ab6041357bee631df676c9a5ad1c72d8.webp


          43. frozenset([iterable])


          • 類型:Python內(nèi)置函數(shù)

          • 描述:返回一個(gè)新的frozenset對(duì)象,可選擇從iterable取得的元素

          • 推薦度:★★★


          44. int(x)


          • 類型:Python內(nèi)置函數(shù)

          • 描述:返回x的整數(shù)部分

          • 推薦度:★★★


          45. isinstance(object, classinfo)


          • 類型:Python內(nèi)置函數(shù)

          • 描述:返回object是否是指定的classinfo實(shí)例信息

          • 推薦度:★★★


          46. len(s)


          • 類型:Python內(nèi)置函數(shù)

          • 描述:返回對(duì)象的長(zhǎng)度或項(xiàng)目數(shù)量

          • 推薦度:★★★


          47. long(x)


          • 類型:Python內(nèi)置函數(shù)

          • 描述:返回由字符串或數(shù)字x構(gòu)造的長(zhǎng)整型對(duì)象

          • 推薦度:★★★


          48. max(iterable[, key])


          • 類型:Python內(nèi)置函數(shù)

          • 描述:返回一個(gè)可迭代或最大的兩個(gè)或多個(gè)參數(shù)中的最大項(xiàng)

          • 推薦度:★★★


          49. min(iterable[, key])


          • 類型:Python內(nèi)置函數(shù)

          • 描述:返回一個(gè)可迭代或最大的兩個(gè)或多個(gè)參數(shù)中的最小項(xiàng)

          • 推薦度:★★★


          50. range(start, stop[, step])


          • 類型:Python內(nèi)置函數(shù)

          • 描述:用于與for循環(huán)一起創(chuàng)建循環(huán)列表,通過(guò)指定start(開(kāi)始)、stop(結(jié)束)和step(步長(zhǎng))控制迭代次數(shù)并獲取循環(huán)值

          • 推薦度:★★★


          51. raw_input(prompt)


          • 類型:Python內(nèi)置函數(shù)

          • 描述:捕獲用戶輸入并作為字符串返回(不推薦使用input作為用戶輸入的捕獲函數(shù))

          • 推薦度:★★★


          52. round(number[, ndigits])


          • 類型:Python內(nèi)置函數(shù)

          • 描述:返回number小數(shù)點(diǎn)后ndigits位的四舍五入的浮點(diǎn)數(shù)

          • 推薦度:★★★


          53. set([iterable])


          • 類型:Python內(nèi)置函數(shù)

          • 描述:返回一個(gè)新的集合對(duì)象,可選擇從iterable獲取的元素

          • 推薦度:★★★


          54. slice(start, stop[, step])


          • 類型:Python內(nèi)置函數(shù)

          • 描述:返回表示由范圍(start、stop、step)指定的索引集的切片對(duì)象

          • 推薦度:★★


          55. sorted(iterable[, cmp[, key[, reverse]]])


          • 類型:Python內(nèi)置函數(shù)

          • 描述:從iterable的項(xiàng)中返回一個(gè)新的排序列表

          • 推薦度:★★★


          56. xrange(start, stop[, step])


          • 類型:Python內(nèi)置函數(shù)

          • 描述:此函數(shù)與range()非常相似,但返回一個(gè)xrange對(duì)象而不是列表

          • 推薦度:★★★


          57. string


          • 類型:Python標(biāo)準(zhǔn)庫(kù)

          • 描述:字符串處理庫(kù),可實(shí)現(xiàn)字符串查找、分割、組合、替換、去重、大小寫轉(zhuǎn)換及其他格式化處理

          • 推薦度:★★★


          58. re


          • 類型:Python標(biāo)準(zhǔn)庫(kù)

          • 描述:正則表達(dá)式模塊,在文本和字符串處理中經(jīng)常使用

          • 推薦度:★★★


          59. random


          • 類型:Python標(biāo)準(zhǔn)庫(kù)

          • 描述:該模塊為各種分布實(shí)現(xiàn)偽隨機(jī)數(shù)生成器,支持?jǐn)?shù)據(jù)均勻分布、正態(tài)(高斯)分布、對(duì)數(shù)正態(tài)分布、負(fù)指數(shù)分布、伽馬和β分布等

          • 推薦度:★★★


          60. os


          • 類型:Python標(biāo)準(zhǔn)庫(kù)

          • 描述:用于新建、刪除、權(quán)限修改、切換路徑等目錄操作,以及調(diào)用執(zhí)行系統(tǒng)命令

          • 推薦度:★★★


          61. os.path


          • 類型:Python標(biāo)準(zhǔn)庫(kù)

          • 描述:針對(duì)目錄的遍歷、組合、分割、判斷等操作,常用于數(shù)據(jù)文件的判斷、查找、合并

          • 推薦度:★★★


          62. prettytable


          • 類型:Python標(biāo)準(zhǔn)庫(kù)

          • 描述:格式化表格輸出模塊

          • 推薦度:★★


          63. json


          • 類型:Python標(biāo)準(zhǔn)庫(kù)

          • 描述:Python對(duì)象與json對(duì)象的轉(zhuǎn)換

          • 推薦度:★★★


          64. base64


          • 類型:Python標(biāo)準(zhǔn)庫(kù)

          • 描述:將任意二進(jìn)制字符串編碼和解碼為文本字符串的Base16,Base32和Base64

          • 推薦度:★★★



          05 數(shù)據(jù)計(jì)算和統(tǒng)計(jì)分析


          數(shù)據(jù)計(jì)算和統(tǒng)計(jì)分析主要用于數(shù)據(jù)探查、計(jì)算和初步數(shù)據(jù)分析等工作。


          174f637702678665c2356a209635dcf3.webp


          65. numpy


          • 類型:第三方庫(kù)

          • 描述:NumPy是Python科學(xué)計(jì)算的基礎(chǔ)工具包,很多Python數(shù)據(jù)計(jì)算工作庫(kù)都依賴它

          • 推薦度:★★★


          66. scipy


          • 類型:第三方庫(kù)

          • 描述:Scipy是一組專門解決科學(xué)和工程計(jì)算不同場(chǎng)景的主題工具包

          • 推薦度:★★★


          67. pandas


          • 類型:第三方庫(kù)

          • 描述:Pandas是一個(gè)用于Python數(shù)據(jù)分析的庫(kù),它的主要作用是進(jìn)行數(shù)據(jù)分析。Pandas提供用于進(jìn)行結(jié)構(gòu)化數(shù)據(jù)分析的二維的表格型數(shù)據(jù)結(jié)構(gòu)DataFrame,類似于R中的數(shù)據(jù)框,能提供類似于數(shù)據(jù)庫(kù)中的切片、切塊、聚合、選擇子集等精細(xì)化操作,為數(shù)據(jù)分析提供了便捷

          • 推薦度:★★★


          68. statsmodels


          • 類型:第三方庫(kù)

          • 描述:Statsmodels是Python的統(tǒng)計(jì)建模和計(jì)量經(jīng)濟(jì)學(xué)工具包,包括一些描述性統(tǒng)計(jì)、統(tǒng)計(jì)模型估計(jì)和統(tǒng)計(jì)測(cè)試,集成了多種線性回歸模型、廣義線性回歸模型、離散數(shù)據(jù)分布模型、時(shí)間序列分析模型、非參數(shù)估計(jì)、生存分析、主成分分析、核密度估計(jì)以及廣泛的統(tǒng)計(jì)測(cè)試和繪圖等功能

          • 推薦度:★★★


          69. abs(x)


          • 類型:Python內(nèi)置函數(shù)

          • 描述:返回x的絕對(duì)值

          • 推薦度:★★★


          70. cmp(x, y)


          • 類型:Python內(nèi)置函數(shù)

          • 描述:比較兩個(gè)對(duì)象x和y,并根據(jù)結(jié)果返回一個(gè)整數(shù)。如果x <y,則返回值為負(fù)數(shù),如果x == y則為零,如果x> y則返回值為正

          • 推薦度:★★


          71. float(x)


          • 類型:Python內(nèi)置函數(shù)

          • 描述:返回從數(shù)字或字符串x構(gòu)造的浮點(diǎn)數(shù)

          • 推薦度:★★★


          72. pow(x, y[, z])


          • 類型:Python內(nèi)置函數(shù)

          • 描述:返回x的y次冪。如果z存在,則返回x的y次冪,模z

          • 推薦度:★★★


          73. sum(iterable[, start])


          • 類型:Python內(nèi)置函數(shù)

          • 描述:從左到右依次迭代,返回總和

          • 推薦度:★★★


          74. math


          • 類型:Python標(biāo)準(zhǔn)庫(kù)

          • 描述:數(shù)學(xué)函數(shù)庫(kù),包括正弦、余弦、正切、余切、弧度轉(zhuǎn)換、對(duì)數(shù)運(yùn)算、圓周率、絕對(duì)值、取整等數(shù)學(xué)計(jì)算方法

          • 推薦度:★★★


          75. cmath


          • 類型:Python標(biāo)準(zhǔn)庫(kù)

          • 描述:與math基本一致,區(qū)別是cmath運(yùn)算的是復(fù)數(shù)

          • 推薦度:★★


          76. decimal


          • 類型:Python標(biāo)準(zhǔn)庫(kù)

          • 描述:10進(jìn)制浮點(diǎn)運(yùn)算

          • 推薦度:★★


          77. fractions


          • 類型:Python標(biāo)準(zhǔn)庫(kù)

          • 描述:分?jǐn)?shù)模塊提供對(duì)有理數(shù)算術(shù)的支持

          • 推薦度:★★



          06 自然語(yǔ)言處理和文本挖掘


          自然語(yǔ)言處理和文本挖掘庫(kù)主要用于以自然語(yǔ)言文本為對(duì)象的數(shù)據(jù)處理和建模。


          279ebc6cd39779ab761c0f16924784e2.webp


          78. nltk


          • 類型:第三方庫(kù)

          • 描述:NLTK是一個(gè)Python自然語(yǔ)言處理工具,它用于對(duì)自然語(yǔ)言進(jìn)行分類、解析和語(yǔ)義理解。目前已經(jīng)有超過(guò)50種語(yǔ)料庫(kù)和詞匯資源

          • 推薦度:★★★


          79. pattern


          • 類型:第三方庫(kù)

          • 描述:Pattern是一個(gè)網(wǎng)絡(luò)數(shù)據(jù)挖掘Python工具包,提供了用于網(wǎng)絡(luò)挖掘(如網(wǎng)絡(luò)服務(wù)、網(wǎng)絡(luò)爬蟲等)、自然語(yǔ)言處理(如詞性標(biāo)注、情感分析等)、機(jī)器學(xué)習(xí)(如向量空間模型、分類模型等)、圖形化的網(wǎng)絡(luò)分析模型

          • 推薦度:★★★


          80. gensim


          • 類型:第三方庫(kù)

          • 描述:Gensim是一個(gè)專業(yè)的主題模型(發(fā)掘文字中隱含主題的一種統(tǒng)計(jì)建模方法)Python工具包,用來(lái)提供可擴(kuò)展統(tǒng)計(jì)語(yǔ)義、分析純文本語(yǔ)義結(jié)構(gòu)以及檢索語(yǔ)義上相似的文檔

          • 推薦度:★★★


          81. 結(jié)巴分詞


          • 類型:第三方庫(kù)

          • 描述:結(jié)巴分詞是國(guó)內(nèi)流行的Python文本處理工具包,分詞模式分為三種模式:精確模式、全模式和搜索引擎模式,支持繁體分詞、自定義詞典等,是非常好的Python中文分詞解決方案,可以實(shí)現(xiàn)分詞、詞典管理、關(guān)鍵字抽取、詞性標(biāo)注等

          • 推薦度:★★★


          82. SnowNLP


          • 類型:第三方庫(kù)

          • 描述:SnowNLP是一個(gè)Python寫的類庫(kù),可以方便的處理中文文本內(nèi)容。該庫(kù)是受到了TextBlob的啟發(fā)而針對(duì)中文處理寫的類庫(kù),和TextBlob不同的是這里沒(méi)有用NLTK,所有的算法都是自己實(shí)現(xiàn)的,并且自帶了一些訓(xùn)練好的字典

          • 推薦度:★★


          83. smallseg


          • 類型:第三方庫(kù)

          • 描述:Smallseg是一個(gè)開(kāi)源的、基于DFA的輕量級(jí)的中文分詞工具包。可自定義詞典、切割后返回登錄詞列表和未登錄詞列表、有一定的新詞識(shí)別能力

          • 推薦度:★★


          84. spaCy


          • 類型:第三方庫(kù)

          • 描述:spaCy是一個(gè)Python自然語(yǔ)言處理工具包,它結(jié)合Python和Cython使得自然語(yǔ)言處理能力達(dá)到了工業(yè)強(qiáng)度

          • 推薦度:★★★


          85. TextBlob


          • 類型:第三方庫(kù)

          • 描述:TextBlob 是一個(gè)處理文本數(shù)據(jù)的Python庫(kù),可用來(lái)做詞性標(biāo)注、情感分析、文本翻譯、名詞短語(yǔ)抽取、文本分類等

          • 推薦度:★★


          86. PyNLPI


          • 類型:第三方庫(kù)

          • 描述:PyNLPI是一個(gè)適合各種自然語(yǔ)言處理任務(wù)的集合庫(kù),可用于中文文本分詞、關(guān)鍵字分析等,尤其重要的是其支持中英文映射,支持UTF-8和GBK編碼的字符串等

          • 推薦度:★★★


          87. synonyms


          • 類型:第三方庫(kù)

          • 描述:中文近義詞工具包,可用于自然語(yǔ)言理解的很多任務(wù):文本對(duì)齊,推薦算法,相似度計(jì)算,語(yǔ)義偏移,關(guān)鍵字提取,概念提取,自動(dòng)摘要,搜索引擎等。

          • 推薦度:★★★



          07 圖像和視頻處理


          圖像處理和視頻處理主要適用于基于圖像的操作、處理、分析和挖掘,如人臉識(shí)別、圖像識(shí)別、目標(biāo)跟蹤、圖像理解等。


          848ae1a9dc904fe061a16c4b8ae45b50.webp


          88. PIL/Pillow


          • 類型:第三方庫(kù)

          • 描述:PIL是一個(gè)常用的圖像讀取、處理和分析的庫(kù),提供了多種數(shù)據(jù)處理、變換的操作方法和屬性。PIL僅支持到2.7版本且已經(jīng)很久沒(méi)有更新,一群志愿者基于PIL發(fā)布了新的分支Pillow。Pillow同時(shí)支持Python2和Python3并且加入很多新的功能

          • 推薦度:★★


          89. OpenCV


          • 類型:第三方庫(kù)

          • 描述:OpenCV是一個(gè)強(qiáng)大的圖像和視頻工作庫(kù)。它提供了多種程序接口,支持跨平臺(tái)(包括移動(dòng)端)應(yīng)用。OpenCV的設(shè)計(jì)效率很高,它以優(yōu)化的C / C ++編寫,庫(kù)可以利用多核處理。除了對(duì)圖像進(jìn)行基本處理外,還支持圖像數(shù)據(jù)建模,并預(yù)制了多種圖像識(shí)別引擎,如人臉識(shí)別

          • 推薦度:★★★


          90. scikit-image


          • 類型:第三方庫(kù)

          • 描述:scikit-image(也稱skimage)是一個(gè)圖像處理庫(kù),支持顏色模式轉(zhuǎn)換、濾鏡、繪圖、圖像處理、特征檢測(cè)等多種功能

          • 推薦度:★★


          91. imageop


          • 類型:Python標(biāo)準(zhǔn)庫(kù)

          • 描述:Python自帶的函數(shù),對(duì)圖像基本操作,包括裁剪、縮放、模式轉(zhuǎn)換

          • 推薦度:


          92. colorsys


          • 類型:Python標(biāo)準(zhǔn)庫(kù)

          • 描述:Python自帶的函數(shù),實(shí)現(xiàn)不同圖像色彩模式的轉(zhuǎn)換

          • 推薦度:


          93. imghdr


          • 類型:Python標(biāo)準(zhǔn)庫(kù)

          • 描述:Python自帶的函數(shù),返回圖像文件的類型

          • 推薦度:



          08 音頻處理


          音頻處理主要適用于基于聲音的處理、分析和建模,主要應(yīng)用于語(yǔ)音識(shí)別、語(yǔ)音合成、語(yǔ)義理解等。


          087aabf070dad06f172bca96f31d0969.webp


          94. TimeSide


          • 類型:第三方庫(kù)

          • 描述:TimeSide是一個(gè)能夠進(jìn)行音頻分析、成像、轉(zhuǎn)碼、流媒體和標(biāo)簽處理的Python框架,可以對(duì)任何音頻或視頻內(nèi)容非常大的數(shù)據(jù)集進(jìn)行復(fù)雜的處理

          • 推薦度:★★★


          95. audiolazy


          • 類型:第三方庫(kù)

          • 描述:audiolazy是一個(gè)用于實(shí)時(shí)聲音數(shù)據(jù)流處理的庫(kù),支持實(shí)時(shí)數(shù)據(jù)應(yīng)用處理、無(wú)限數(shù)據(jù)序列表示、數(shù)據(jù)流表示等

          • 推薦度:★★


          96. pydub


          • 類型:第三方庫(kù)

          • 描述:pydub支持多種格式聲音文件,可進(jìn)行多種信號(hào)處理(例如壓縮、均衡、歸一化)、信號(hào)生成(例如正弦、方波、鋸齒等)、音效注冊(cè)、靜音處理等

          • 推薦度:★★★


          97. audioop


          • 類型:Python標(biāo)準(zhǔn)庫(kù)

          • 描述:Python自帶的函數(shù),可實(shí)現(xiàn)對(duì)聲音片段的一些常用操作

          • 推薦度:★★


          98. tinytag


          • 類型:第三方庫(kù)

          • 描述:tinytag用于讀取多種聲音文件的元數(shù)據(jù),涵蓋MP3、OGG、OPUS、MP4、M4A、FLAC、WMA、Wave等格式

          • 推薦度:★★


          99. aifc


          • 類型:Python標(biāo)準(zhǔn)庫(kù)

          • 描述:Python自帶的函數(shù),讀寫AIFF和AIFC文件

          • 推薦度:


          100. sunau


          • 類型:Python標(biāo)準(zhǔn)庫(kù)

          • 描述:Python自帶的函數(shù),讀寫Sun AU文件

          • 推薦度:


          101. wave


          • 類型:Python標(biāo)準(zhǔn)庫(kù)

          • 描述:Python自帶的函數(shù),讀寫WAV文件

          • 推薦度:★★


          102. chunk


          • 類型:Python標(biāo)準(zhǔn)庫(kù)

          • 描述:Python自帶的函數(shù),讀取EA IFF 85塊格式的文件

          • 推薦度:


          103. sndhdr


          • 類型:Python標(biāo)準(zhǔn)庫(kù)

          • 描述:Python自帶的函數(shù),返回聲音文件的類型

          • 推薦度:


          104. ossaudiodev


          • 類型:Python標(biāo)準(zhǔn)庫(kù)

          • 描述:該模塊支持訪問(wèn)OSS(開(kāi)放聲音系統(tǒng))音頻接口

          • 推薦度:★★★



          09 數(shù)據(jù)挖掘/機(jī)器學(xué)習(xí)/深度學(xué)習(xí)


          數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)等是Python進(jìn)行數(shù)據(jù)建模和挖掘?qū)W習(xí)的核心模塊。


          c0f92451ba0348b784633faa3140f147.webp


          105. Scikit-Learn


          • 類型:第三方庫(kù)

          • 描述:scikit-learn(也稱SKlearn)是一個(gè)基于Python的機(jī)器學(xué)習(xí)綜合庫(kù),內(nèi)置監(jiān)督式學(xué)習(xí)和非監(jiān)督式學(xué)習(xí)機(jī)器學(xué)習(xí)方法,包括各種回歸、聚類、分類、流式學(xué)習(xí)、異常檢測(cè)、神經(jīng)網(wǎng)絡(luò)、集成方法等主流算法類別,同時(shí)支持預(yù)置數(shù)據(jù)集、數(shù)據(jù)預(yù)處理、模型選擇和評(píng)估等方法,是一個(gè)非常完整、流行的機(jī)器學(xué)習(xí)工具庫(kù)

          • 推薦度:★★★


          106. TensorFlow


          • 類型:第三方庫(kù)

          • 描述:TensorFlow 是谷歌的第二代機(jī)器學(xué)習(xí)系統(tǒng),內(nèi)建深度學(xué)習(xí)的擴(kuò)展支持,任何能夠用計(jì)算流圖形來(lái)表達(dá)的計(jì)算,都可以使用 TensorFlow

          • 推薦度:★★★


          107. NuPIC


          • 類型:第三方庫(kù)

          • 描述:NuPIC是一個(gè)以HTM(分層時(shí)間記憶)學(xué)習(xí)算法為工具的機(jī)器智能平臺(tái)。NuPIC適合于各種各樣的問(wèn)題,尤其適用于檢測(cè)異常和預(yù)測(cè)應(yīng)用

          • 推薦度:★★★


          108. PyTorch


          • 類型:第三方庫(kù)

          • 描述:PyTorch是FaceBook推出的深度學(xué)習(xí)框架,它基于Python(而非lua)產(chǎn)生,它提供的動(dòng)態(tài)計(jì)算圖是顯著區(qū)別于Tensorflow等其他學(xué)習(xí)框架的地方。

          • 推薦度:★★


          109. Orange


          • 類型:第三方庫(kù)

          • 描述:Orange通過(guò)圖形化操作界面,提供交互式數(shù)據(jù)分析功能,尤其適用于分類、聚類、回歸、特征選擇和交叉驗(yàn)證工作

          • 推薦度:★★★


          110. theano


          • 類型:第三方庫(kù)

          • 描述:Theano是非常成熟的深度學(xué)習(xí)庫(kù)。它與Numpy緊密集成,支持GPU計(jì)算、單元測(cè)試和自我驗(yàn)證

          • 推薦度:★★★


          111. keras


          • 類型:第三方庫(kù)

          • 描述:Keras是一個(gè)用Python編寫的高級(jí)神經(jīng)網(wǎng)絡(luò)API,能夠運(yùn)行在TensorFlow或者Theano之上,它的開(kāi)發(fā)重點(diǎn)是實(shí)現(xiàn)快速實(shí)驗(yàn)

          • 推薦度:★★


          112. neurolab


          • 類型:第三方庫(kù)

          • 描述:Neurolab是具有靈活網(wǎng)絡(luò)配置和Python學(xué)習(xí)算法的基本神經(jīng)網(wǎng)絡(luò)算法庫(kù)。它包含通過(guò)遞歸神經(jīng)網(wǎng)絡(luò)(RNN)實(shí)現(xiàn)的不同變體,該庫(kù)是同類RNN API中最好的選擇之一

          • 推薦度:★★


          113. PyLearn2


          • 類型:第三方庫(kù)

          • 描述:PyLearn2是基于Theano的深度學(xué)習(xí)庫(kù),它旨在提供極大的靈活性,并使研究人員可以進(jìn)行自由可控制,參數(shù)和屬性的靈活、開(kāi)放配置是亮點(diǎn)

          • 推薦度:★★★


          114. OverFeat


          • 類型:第三方庫(kù)

          • 描述:OverFeat是一個(gè)深度學(xué)習(xí)庫(kù),主要用于圖片分類、定位物體檢測(cè)

          • 推薦度:★★


          115. Pyevolve


          • 類型:第三方庫(kù)

          • 描述:Pyevolve是一個(gè)完整的遺傳算法框架,也支持遺傳編程

          • 推薦度:★★


          116. Caffe2


          • 類型:第三方庫(kù)

          • 描述:Cafffe2也是FaceBook推出的深度學(xué)習(xí)框架,相比于PyTorch 更適合于研究,Caffe2 適合大規(guī)模部署,主要用于計(jì)算機(jī)視覺(jué),它對(duì)圖像識(shí)別的分類具有很好的應(yīng)用效果

          • 推薦度:★★



          10?數(shù)據(jù)可視化


          數(shù)據(jù)可視化主要用于做數(shù)據(jù)結(jié)果展示、數(shù)據(jù)模型驗(yàn)證、圖形交互和探查等方面。


          bcc307c7cf1a1a970844c7e8bb43f1b1.webp


          117. Matplotlib


          • 類型:第三方庫(kù)

          • 描述:Matplotlib是Python的2D繪圖庫(kù),它以各種硬拷貝格式和跨平臺(tái)的交互式環(huán)境生成出版質(zhì)量級(jí)別的圖形,開(kāi)發(fā)者可以僅需要幾行代碼,便可以生成多種高質(zhì)量圖形

          • 推薦度:★★★


          118. pyecharts


          • 類型:第三方庫(kù)

          • 描述:基于百度Echarts的強(qiáng)大的可視化工具庫(kù),其提供的圖形功能眾多,尤其對(duì)于復(fù)雜關(guān)系的展示能力較強(qiáng)

          • 推薦度:★★★


          119. seaborn


          • 類型:第三方庫(kù)

          • 描述:Seaborn是在Matplotlib的基礎(chǔ)上進(jìn)行了更高級(jí)的API封裝,它可以作為Matplotlib的補(bǔ)充

          • 推薦度:★★★


          120. bokeh


          • 類型:第三方庫(kù)

          • 描述:Bokeh是一種交互式可視化庫(kù),可以在WEB瀏覽器中實(shí)現(xiàn)美觀的視覺(jué)效果

          • 推薦度:★★★


          121. Plotly


          • 類型:第三方庫(kù)

          • 描述:Plotly提供的圖形庫(kù)可以進(jìn)行在線WEB交互,并提供具有出版品質(zhì)的圖形,支持線圖、散點(diǎn)圖、區(qū)域圖、條形圖、誤差條、框圖、直方圖、熱圖、子圖、多軸、極坐標(biāo)圖、氣泡圖、玫瑰圖、熱力圖、漏斗圖等眾多圖形

          • 推薦度:★★★


          122. VisPy


          • 類型:第三方庫(kù)

          • 描述:VisPy是用于交互式科學(xué)可視化的Python庫(kù),旨在實(shí)現(xiàn)快速,可擴(kuò)展和易于使用

          • 推薦度:★★


          123. PyQtGraph


          • 類型:第三方庫(kù)

          • 描述:PyQtGraph是一個(gè)建立在PyQt4 / PySide和numpy之上的純Python圖形和GUI庫(kù),主要用于數(shù)學(xué)/科學(xué)/工程應(yīng)用

          • 推薦度:★★


          124. ggplot


          • 類型:第三方庫(kù)

          • 描述:ggplot是用Python實(shí)現(xiàn)的圖形輸出庫(kù),類似于 R中的圖形展示版本

          • 推薦度:★★★



          11?交互學(xué)習(xí)和集成開(kāi)發(fā)


          交互學(xué)習(xí)和集成開(kāi)發(fā)主要用來(lái)做Python開(kāi)發(fā)、調(diào)試和集成之用,包括Python集成開(kāi)發(fā)環(huán)境和IDE。


          efcefcf69360d00a69639bef3f141188.webp


          125. IPython/ Jupyter


          • 類型:第三方庫(kù)

          • 描述:IPython 是一個(gè)基于Python 的交互式shell,比默認(rèn)的Python shell 好用得多,支持變量自動(dòng)補(bǔ)全、自動(dòng)縮進(jìn)、交互式幫助、魔法命令、系統(tǒng)命令等,內(nèi)置了許多很有用的功能和函數(shù)。從IPython4.0開(kāi)始,IPython衍生出了IPython和Jupyter兩個(gè)分支。在該分支正式出現(xiàn)之前,IPython其實(shí)已經(jīng)擁有了ipython notebook功能,因此,Jupyter更像是一個(gè)ipython notebook的升級(jí)版。

          • 推薦度:★★★


          126. Elpy


          • 類型:第三方庫(kù)

          • 描述:Elpy是Emacs用于Python的開(kāi)發(fā)環(huán)境,它結(jié)合并配置了許多其他軟件包,它們都是用Emacs Lisp和Python編寫的

          • 推薦度:★★


          127. PTVS


          • 類型:第三方庫(kù)

          • 描述:Visual Studio 的 Python 工具

          • 推薦度:★★


          128. PyCharm


          • 類型:外部工具

          • 描述:PyCharm帶有一整套可以幫助用戶在使用Python語(yǔ)言開(kāi)發(fā)時(shí)提高其效率的工具,比如調(diào)試、語(yǔ)法高亮、項(xiàng)目管理、代碼跳轉(zhuǎn)、智能提示、自動(dòng)完成、單元測(cè)試、版本控制并可集成IPython、系統(tǒng)終端命令行等,在PyCharm里幾乎就可以實(shí)現(xiàn)所有有關(guān)Python工作的全部過(guò)程

          • 推薦度:★★★


          129. LiClipse


          • 類型:外部工具

          • 描述:LiClipse是基于Eclipse的免費(fèi)多語(yǔ)言 IDE,通過(guò)其中的PyDev可支持 Python開(kāi)發(fā)應(yīng)用

          • 推薦度:★★


          130. Spyder


          • 類型:外部工具

          • 描述:Spyder是一個(gè)開(kāi)源的Python IDE,由IPython和眾多流行的Python庫(kù)的支持,是一個(gè)具備高級(jí)編輯、交互式測(cè)試、調(diào)試以及數(shù)字計(jì)算環(huán)境的交互式開(kāi)發(fā)環(huán)境

          • 推薦度:★★



          12?其他Python協(xié)同數(shù)據(jù)工作工具


          其他Python協(xié)同數(shù)據(jù)工作工具指除了上述主題以外,其他在數(shù)據(jù)工作中常用的工具或庫(kù)。


          131. tesseract-ocr


          • 類型:外部工具

          • 描述:這是一個(gè)Google支持的開(kāi)源OCR圖文識(shí)別項(xiàng)目,支持超過(guò)200種語(yǔ)言(包括中文),并支持自定義訓(xùn)練字符集,支持跨Windows、Linux、Mac OSX 多平臺(tái)使用

          • 推薦度:★★★


          132. RPython


          • 類型:第三方庫(kù)

          • 描述:R集成庫(kù)

          • 推薦度:★★★


          133. Rpy2


          • 類型:第三方庫(kù)

          • 描述:Python連接R的庫(kù)


          134. matpython


          • 類型:第三方庫(kù)

          • 描述:MATLAB集成庫(kù)

          • 推薦度:★★★


          135. Lunatic Python


          • 類型:第三方庫(kù)

          • 描述:Lua集成庫(kù)

          • 推薦度:★★


          136. PyCall.jl


          • 類型:第三方庫(kù)

          • 描述:Julia集成庫(kù)

          • 推薦度:★★


          137. PySpark


          • 類型:第三方庫(kù)

          • 描述:Spark提供的Python API

          • 推薦度:★★★


          138. dumbo


          • 類型:第三方庫(kù)

          • 描述:這個(gè)模塊可以讓Pythoner輕松的編寫和運(yùn)行 Hadoop 程序,程序版本比較早,可以作為參考

          • 推薦度:★★


          139. dpark


          • 類型:第三方庫(kù)

          • 描述:Python對(duì)Spark的克隆版本,類MapReduce框架

          • 推薦度:★★


          140. streamparse


          • 類型:第三方庫(kù)

          • 描述:Streamparse允許通過(guò)Storm對(duì)實(shí)時(shí)數(shù)據(jù)流運(yùn)行Python代碼

          • 推薦度:★★★

          學(xué)習(xí)學(xué)習(xí)900學(xué)學(xué)習(xí)業(yè)Python
          94cf082399fd1dbf93228b3e82ec582a.webp

          最好用的 Python 虛擬環(huán)境,沒(méi)有之一介紹10個(gè)常用的Python內(nèi)置函數(shù),99.99%的人都在用!Python轉(zhuǎn)?
          日常學(xué)python搞活動(dòng)啦累計(jì)留言超30天即可獲得濤哥贈(zèng)送的技術(shù)類書籍一本

          ? 快來(lái)給濤哥留言吧,讓我知道你在看~



          瀏覽 87
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          評(píng)論
          圖片
          表情
          推薦
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  欧美小黄片 | 理论片在线午夜视频 | 大鸡巴操小穴高潮视频 | 热久久免费在线视频 | 国产高清一区 |