<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          改變 Python 對象規(guī)則的黑魔法 Metaclass

          共 10429字,需瀏覽 21分鐘

           ·

          2022-04-14 03:25

          新年新氣象,今天你學習了嗎?

          今天小明哥要分享的主題是:改變類定義的神器-metaclass

          看到標題,你可能會想改變類的定義有什么用呢?什么時候才需要使用metaclass呢?

          今天我將帶大家設計一個簡單的orm框架,并簡單剖析一下YAML這個序列化工具的原理。

          Python類的上帝-type

          說到metaclass,我們首先必須清楚一個最基礎的概念就是對象是類的實例,而類是type的實例,重復一遍:

          1. 對象是類的實例
          2. 類是type的實例

          在面向對象的編程模型中,類就相當于一個房子的設計圖紙,而對象則是根據(jù)這個設計圖紙建出來的房子。

          下圖中,玩具模型就可以代表一個類,而具體生產(chǎn)出來的玩具就可以代表一個對象:

          總之,類就是創(chuàng)建對象的模板。

          而type又是創(chuàng)建類的模板,那么我們就可以通過type創(chuàng)建自己想要的類。

          比如定義一個 Hello 的 class:

          class?Hello(object):
          ????def?hello(self,?name='world'):
          ?????print('Hello,?%s.'?%?name)

          當 Python 解釋器載入 hello 模塊時,就會依次執(zhí)行該模塊的所有語句,執(zhí)行結果就是動態(tài)創(chuàng)建出一個 Hello 的 class對象。

          type()函數(shù)既可以查看一個類型或變量的類型,也可以根據(jù)參數(shù)創(chuàng)建出新的類型,比如上面那段類的定義本質上就是:

          def?hello(self,?name='world'):
          ????print('Hello,?%s.'?%?name)
          Hello?=?type('Hello',?(object,),?dict(hello=hello))

          type()函數(shù)創(chuàng)建class 對象,依次傳入 3 個參數(shù):

          • class 類的名稱;

          • 繼承的父類集合,注意 Python 支持多重繼承,如果只有一個父類,別忘了 tuple 的單元素寫法;

          • class 的方法名稱與函數(shù)綁定以及字段名稱與對應的值,這里我們把函數(shù) fn 綁定到方法名 hello 上。

          通過 type() 函數(shù)創(chuàng)建的類和直接寫 class 是完全一樣的,因為 Python 解釋器遇到 class 定義時,僅僅是掃描一下class 定義的語法,然后調(diào)用 type() 函數(shù)創(chuàng)建出 class。

          正常情況下,我們肯定都是用 class Xxx... 來定義類,但是type() 函數(shù)允許我們動態(tài)創(chuàng)建出類來,這意味著Python這門動態(tài)語言支持運行期動態(tài)創(chuàng)建類。你可能感受不到這有多強大,要知道想在靜態(tài)語言運行期創(chuàng)建類,必須構造源代碼字符串再調(diào)用編譯器,或者借助一些工具生成字節(jié)碼實現(xiàn),本質上都是動態(tài)編譯,會非常復雜。

          metaclass到底是什么

          那type和metaclass有什么關系呢?metaclass到底是什么呢?

          我認為metaclass 其實就是type或type的子類,通過繼承type,重載__call__運算符,便可以在class類對象創(chuàng)建時作出一些修改。

          對于類 MyClass:

          class?MyClass():
          ?pass

          其實相當于:

          class?MyClass(metaclass?=?type):
          ?pass

          一旦我們把它的 metaclass 設置成 MyMeta:

          class?MyClass(metaclass?=?MyMeta):
          ?pass

          MyClass 就不再由原生的 type 創(chuàng)建,而是會調(diào)用 MyMeta 的__call__運算符重載。

          class?=?type(classname,?superclasses,?attributedict)?
          ##?變?yōu)榱?br>class?=?MyMeta(classname,?superclasses,?attributedict)

          對于具有繼承關系的類:

          class?Foo(Bar):
          ?pass

          Python做了如下的操作:

          • Foo中有__metaclass__這個屬性嗎?如果是,Python會通過__metaclass__創(chuàng)建一個名字為Foo的類(對象)
          • 如果Python沒有找到__metaclass__,它會繼續(xù)在Bar(父類)中尋找__metaclass__屬性,并嘗試做和前面同樣的操作。
          • 如果Python在任何父類中都找不到__metaclass__,它就會在模塊層次中去尋找__metaclass__,并嘗試做同樣的操作。
          • 如果還是找不到__metaclass__,Python就會用內(nèi)置的type來創(chuàng)建這個類對象。

          假想一個很傻的例子,你決定在你的模塊里所有的類的屬性都應該是大寫形式。有好幾種方法可以辦到,但其中一種就是通過在模塊級別設定__metaclass__:

          class?UpperAttrMetaClass(type):
          ????##?__new__?是在__init__之前被調(diào)用的特殊方法
          ????##?__new__是用來創(chuàng)建對象并返回之的方法
          ????##?而__init__只是用來將傳入的參數(shù)初始化給對象
          ????##?你很少用到__new__,除非你希望能夠控制對象的創(chuàng)建
          ????##?這里,創(chuàng)建的對象是類,我們希望能夠自定義它,所以我們這里改寫__new__
          ????##?如果你希望的話,你也可以在__init__中做些事情
          ????##?還有一些高級的用法會涉及到改寫__call__特殊方法,但是我們這里不用
          ????def?__new__(cls,?future_class_name,?future_class_parents,?future_class_attr):
          ????????##遍歷屬性字典,把不是__開頭的屬性名字變?yōu)榇髮?/span>
          ????????newAttr?=?{}
          ????????for?name,value?in?future_class_attr.items():
          ????????????if?not?name.startswith("__"):
          ????????????????newAttr[name.upper()]?=?value

          ????????##?方法1:通過'type'來做類對象的創(chuàng)建
          ????????##?return?type(future_class_name,?future_class_parents,?newAttr)

          ????????##?方法2:復用type.__new__方法,這就是基本的OOP編程
          ????????##?return?type.__new__(cls,?future_class_name,?future_class_parents,?newAttr)

          ????????##?方法3:使用super方法
          ????????return?super(UpperAttrMetaClass,?cls).__new__(cls,?future_class_name,?future_class_parents,?newAttr)


          class?Foo(object,?metaclass?=?UpperAttrMetaClass):
          ????bar?=?'bip'

          print(hasattr(Foo,?'bar'))
          ##?輸出:?False
          print(hasattr(Foo,?'BAR'))
          ##?輸出:True

          f?=?Foo()
          print(f.BAR)
          ##?輸出:'bip'

          簡易ORM框架的設計

          ORM全稱“Object Relational Mapping”,即對象-關系映射,就是把關系數(shù)據(jù)庫的一行映射為一個對象,也就是一個類對應一個表,這樣,寫代碼更簡單,不用直接操作SQL語句。

          現(xiàn)在設計一下ORM框架的調(diào)用接口,比如用戶想通過User類來操作對應的數(shù)據(jù)庫表User,我們期待他寫出這樣的代碼:

          class?User(Model):
          ????##?定義類的屬性到列的映射:
          ????id?=?IntegerField('id')
          ????name?=?StringField('username')
          ????email?=?StringField('email')
          ????password?=?StringField('password')

          ##?創(chuàng)建一個實例:
          u?=?User(id=12345,?name='xiaoxiaoming',?email='[email protected]',?password='my-pwd')
          ##?保存到數(shù)據(jù)庫:
          u.save()

          上面的接口通過常規(guī)方法很難或幾乎很難實現(xiàn),但通過metaclass就會相對比較簡單。核心思想就是通過metaclass修改類的定義,將類的所有Field類型的屬性,用一個額外的字典去保存,然后從原定義中刪除。對于User創(chuàng)建對象時傳入的參數(shù)(id=12345, name='xiaoxiaoming'等)可以模仿字典的實現(xiàn)或直接繼承dict類保存起來。

          其中,父類Model和屬性類型StringField、IntegerField是由ORM框架提供的,剩下的魔術方法比如save()全部由metaclass自動完成。雖然metaclass的編寫會比較復雜,但ORM的使用者用起來卻異常簡單。

          首先定義Field類,它負責保存數(shù)據(jù)庫表的字段名和字段類型:

          class?Field(object):

          ????def?__init__(self,?name,?column_type):
          ????????self.name?=?name
          ????????self.column_type?=?column_type

          ????def?__str__(self):
          ????????return?'<%s:%s>'?%?(self.__class__.__name__,?self.name)

          在Field的基礎上,進一步定義各種類型的Field,比如StringField,IntegerField等等:

          class?StringField(Field):

          ????def?__init__(self,?name):
          ????????super(StringField,?self).__init__(name,?'varchar(100)')

          class?IntegerField(Field):

          ????def?__init__(self,?name):
          ????????super(IntegerField,?self).__init__(name,?'bigint')

          下一步,編寫ModelMetaclass:

          class?ModelMetaclass(type):

          ????def?__new__(cls,?name,?bases,?attrs):
          ????????if?name?==?'Model':
          ????????????return?type.__new__(cls,?name,?bases,?attrs)
          ????????print('Found?model:?%s'?%?name)
          ????????mappings?=?dict()
          ????????for?k,?v?in?attrs.items():
          ????????????if?isinstance(v,?Field):
          ????????????????print('Found?mapping:?%s?==>?%s'?%?(k,?v))
          ????????????????mappings[k]?=?v
          ????????for?k?in?mappings.keys():
          ????????????attrs.pop(k)
          ????????attrs['__mappings__']?=?mappings??##?保存屬性和列的映射關系
          ????????attrs.setdefault('__table__',?name)?##?當未定義__table__屬性時,表名直接使用類名
          ????????return?type.__new__(cls,?name,?bases,?attrs)

          以及基類Model:

          class?Model(dict,?metaclass=ModelMetaclass):

          ????def?__init__(self,?**kw):
          ????????super(Model,?self).__init__(**kw)

          ????def?__getattr__(self,?key):
          ????????try:
          ????????????return?self[key]
          ????????except?KeyError:
          ????????????raise?AttributeError(r"'Model'?object?has?no?attribute?'%s'"?%?key)

          ????def?__setattr__(self,?key,?value):
          ????????self[key]?=?value

          ????def?save(self):
          ????????fields?=?[]
          ????????params?=?[]
          ????????args?=?[]
          ????????for?k,?v?in?self.__mappings__.items():
          ????????????fields.append(v.name)
          ????????????params.append('?')
          ????????????args.append(getattr(self,?k,?None))
          ????????sql?=?'insert?into?%s?(%s)?values?(%s)'?%?(self.__table__,?','.join(fields),?','.join(params))
          ????????print('SQL:?%s'?%?sql)
          ????????print('ARGS:?%s'?%?str(args))

          ModelMetaclass中,一共做了幾件事情:

          1. 在當前類(比如User)中查找定義的類的所有屬性,如果找到一個Field屬性,就把它保存到一個__mappings__的dict中,同時從類屬性中刪除該Field屬性(避免實例的屬性遮蓋類的同名屬性);
          2. 當類中未定義__table__字段時,直接將類名保存到__table__字段中作為表名。

          Model類中,就可以定義各種操作數(shù)據(jù)庫的方法,比如save()delete(),find(),update等等。

          我們實現(xiàn)了save()方法,把一個實例保存到數(shù)據(jù)庫中。因為有表名,屬性到字段的映射和屬性值的集合,就可以構造出INSERT語句。

          測試:

          u?=?User(id=12345,?name='xiaoxiaoming',?email='[email protected]',?password='my-pwd')
          u.save()

          輸出如下:

          Found?model:?User
          Found?mapping:?id?==>?
          Found?mapping:?name?==>?
          Found?mapping:?email?==>?
          Found?mapping:?password?==>?
          SQL:?insert?into?User?(id,username,email,password)?values?(?,?,?,?)
          ARGS:?[12345,?'xiaoxiaoming',?'[email protected]',?'my-pwd']

          測試2:

          class?Blog(Model):
          ????__table__?=?'blogs'
          ????id?=?IntegerField('id')
          ????user_id?=?StringField('user_id')
          ????user_name?=?StringField('user_name')
          ????name?=?StringField('user_name')
          ????summary?=?StringField('summary')
          ????content?=?StringField('content')


          b?=?Blog(id=12345,?user_id='user_id1',?user_name='xxm',?name='orm框架的基本運行機制',?summary="簡單講述一下orm框架的基本運行機制",
          ?????????content="此處省略一萬字...")
          b.save()

          輸出:

          Found?model:?Blog
          Found?mapping:?id?==>?
          Found?mapping:?user_id?==>?
          Found?mapping:?user_name?==>?
          Found?mapping:?name?==>?
          Found?mapping:?summary?==>?
          Found?mapping:?content?==>?
          SQL:?insert?into?blogs?(id,user_id,user_name,user_name,summary,content)?values?(?,?,?,?,?,?)
          ARGS:?[12345,?'user_id1',?'xxm',?'orm框架的基本運行機制',?'簡單講述一下orm框架的基本運行機制',?'此處省略一萬字...']

          可以看到,save()方法已經(jīng)打印出了可執(zhí)行的SQL語句,以及參數(shù)列表,只需要真正連接到數(shù)據(jù)庫,執(zhí)行該SQL語句,就可以完成真正的功能。

          YAML序列化工具的實現(xiàn)原理淺析

          YAML是一個家喻戶曉的 Python 工具,可以方便地序列化 / 逆序列化結構數(shù)據(jù)。

          官方文檔:https://pyyaml.org/wiki/PyYAMLDocumentation

          安裝:

          pip?install?pyyaml

          YAMLObject 的任意子類支持序列化和反序列化(serialization & deserialization)。比如說下面這段代碼:

          import?yaml


          class?Monster(yaml.YAMLObject):
          ????yaml_tag?=?'!Monster'

          ????def?__init__(self,?name,?hp,?ac,?attacks):
          ????????self.name?=?name
          ????????self.hp?=?hp
          ????????self.ac?=?ac
          ????????self.attacks?=?attacks

          ????def?__repr__(self):
          ????????return?f"{self.__class__.__name__}(name={self.name},?hp={self.hp},?ac={self.ac},?attacks={self.attacks})"


          monster1?=?yaml.load("""
          ---?!Monster
          name:?Cave?spider
          hp:?[2,6]
          ac:?16
          attacks:?[BITE,?HURT]
          """
          )
          print(monster1,?type(monster1))

          monster2?=?Monster(name='Cave?lizard',?hp=[3,?6],?ac=16,?attacks=['BITE',?'HURT'])
          print(yaml.dump(monster2))

          運行結果:

          Monster(name=Cave?spider,?hp=[2,?6],?ac=16,?attacks=['BITE',?'HURT'])?'__main__.Monster'>
          !Monster
          ac:?16
          attacks:?[BITE,?HURT]
          hp:?[3,?6]
          name:?Cave?lizard

          這里面調(diào)用統(tǒng)一的 yaml.load(),就能把任意一個 yaml 序列載入成一個 Python Object;而調(diào)用統(tǒng)一的 yaml.dump(),就能把一個 YAMLObject 子類序列化。

          對于 load() 和 dump() 的使用者來說,他們完全不需要提前知道任何類型信息,這讓超動態(tài)配置編程成了可能。比方說,在一個智能語音助手的大型項目中,我們有 1 萬個語音對話場景,每一個場景都是不同團隊開發(fā)的。作為智能語音助手的核心團隊成員,我不可能去了解每個子場景的實現(xiàn)細節(jié)。

          在動態(tài)配置實驗不同場景時,經(jīng)常是今天我要實驗場景 A 和 B 的配置,明天實驗 B 和 C 的配置,光配置文件就有幾萬行量級,工作量不可謂不小。而應用這樣的動態(tài)配置理念,就可以讓引擎根據(jù)配置文件,動態(tài)加載所需要的 Python 類。

          對于 YAML 的使用者也很方便,只要簡單地繼承 yaml.YAMLObject,就能讓你的 Python Object 具有序列化和逆序列化能力。

          據(jù)說即使是在大廠 Google 的 Python 開發(fā)者,發(fā)現(xiàn)能深入解釋 YAML 這種設計模式優(yōu)點的人,大概只有 10%。而能知道類似 YAML 的這種動態(tài)序列化 / 逆序列化功能正是用 metaclass 實現(xiàn)的人,可能只有 1% 了。而能夠將YAML 怎樣用 metaclass 實現(xiàn)動態(tài)序列化 / 逆序列化功能講出一二的可能只有 0.1%了。

          對于YAMLObject 的 load和dump() 功能,簡單來說,我們需要一個全局的注冊器,讓 YAML 知道,序列化文本中的!Monster需要載入成 Monster 這個 Python 類型,Monster 這個 Python 類型需要被序列化為!Monster標簽開頭的字符串。

          一個很自然的想法就是,那我們建立一個全局變量叫 registry,把所有需要逆序列化的 YAMLObject,都注冊進去。比如下面這樣:

          registry?=?{}
          ?
          def?add_constructor(target_class):
          ????registry[target_class.yaml_tag]?=?target_class

          然后,在 Monster 類定義后面加上下面這行代碼:

          add_constructor(Monster)

          這樣的缺點很明顯,對于 YAML 的使用者來說,每一個 YAML 的可逆序列化的類 Foo 定義后,都需要加上一句話add_constructor(Foo)。這無疑給開發(fā)者增加了麻煩,也更容易出錯,畢竟開發(fā)者很容易忘了這一點。

          更優(yōu)雅的實現(xiàn)方式自然是通過metaclass 解決了這個問題,YAML 的源碼正是這樣實現(xiàn)的:

          class?YAMLObjectMetaclass(type):
          ????def?__init__(cls,?name,?bases,?kwds):
          ????????super(YAMLObjectMetaclass,?cls).__init__(name,?bases,?kwds)
          ????????if?'yaml_tag'?in?kwds?and?kwds['yaml_tag']?is?not?None:
          ????????????cls.yaml_loader.add_constructor(cls.yaml_tag,?cls.from_yaml)
          ????????????cls.yaml_dumper.add_representer(cls,?cls.to_yaml)
          ????##?省略其余定義
          ?
          class?YAMLObject(metaclass=YAMLObjectMetaclass):
          ????yaml_loader?=?Loader
          ????yaml_dumper?=?Dumper
          ????##?省略其余定義

          可以看到,YAMLObject 把 metaclass 聲明成了 YAMLObjectMetaclass,YAMLObjectMetaclass則會改變YAMLObject類和其子類的定義,就是下面這行代碼將YAMLObject 的子類加入到了yaml的兩個全局注冊表中:

          cls.yaml_loader.add_constructor(cls.yaml_tag,?cls.from_yaml)
          cls.yaml_dumper.add_representer(cls,?cls.to_yaml)

          YAML 應用 metaclass,攔截了所有 YAMLObject 子類的定義。也就是說,在你定義任何 YAMLObject 子類時,Python 會強行插入運行上面這段代碼,把我們之前想要的add_constructor(Foo)add_representer(Foo)給自動加上。所以 YAML 的使用者,無需自己去手寫add_constructor(Foo)add_representer(Foo)。

          總結

          這次分享主要是簡單的淺析了 metaclass 的實現(xiàn)機制。通過實現(xiàn)一個orm框架并解讀 YAML 的源碼,相信你已經(jīng)對metaclass 有了不錯的理解。

          metaclass 是 Python 黑魔法級別的語言特性,它可以改變類創(chuàng)建時的行為,這種強大的功能使用起來務必小心。

          看完本文,你覺得裝飾器和 metaclass 有什么區(qū)別呢?歡迎下方留言和我討論。記得一鍵三連呦,筆芯!

          我們的文章到此就結束啦,如果你喜歡今天的Python 實戰(zhàn)教程,請持續(xù)關注Python實用寶典。

          有任何問題,可以在公眾號后臺回復:加群,回答相應紅字驗證信息,進入互助群詢問。

          原創(chuàng)不易,希望你能在下面點個贊和在看支持我繼續(xù)創(chuàng)作,謝謝!

          點擊下方閱讀原文可獲得更好的閱讀體驗

          Python實用寶典?(pythondict.com)
          不只是一個寶典
          歡迎關注公眾號:Python實用寶典

          瀏覽 67
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          評論
          圖片
          表情
          推薦
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  国内精品综合 | 国产九九九九 | 国产精品卡_卡2卡3卡4一商战-信息网 | 蜜桃视频日韩 | av手机在线观看 AV天堂免费观看 av天堂手机在线 |