<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          數(shù)據(jù)倉庫研發(fā)規(guī)范(附錄)

          共 2016字,需瀏覽 5分鐘

           ·

          2021-10-17 00:38

          來源于公眾號:?數(shù)據(jù)倉庫與Python大數(shù)據(jù)


          數(shù)據(jù)倉庫研發(fā)規(guī)范整體流程

          下圖為根據(jù)階段規(guī)劃與角色職責(zé)的內(nèi)容,整理出的數(shù)據(jù)倉庫研發(fā)規(guī)范的整體流程。



          附錄


          • 數(shù)據(jù)倉庫需求模板

          • 數(shù)據(jù)探查報告

          • ETL文檔

          • 調(diào)度設(shè)計文檔

          • 單元測試報告

          • 發(fā)布操作文檔

          • 代碼評審報告

          • 測試分析方案報告

          • 交付測試報告

          • 質(zhì)量評估報告模板

          • 驗(yàn)收報告模板



          一、數(shù)據(jù)倉庫需求模板


          本章節(jié)將為您介紹數(shù)據(jù)倉庫需求模板、常規(guī)需求申請單和迭代需求申請單。

          填寫說明:

          • *為必填項(xiàng)目,其它可以選擇性進(jìn)行填寫。

          • 指標(biāo)邏輯可以引用指標(biāo)和術(shù)語(或指標(biāo)庫)中的定義。

          • 如果數(shù)據(jù)范圍、更新頻率、時間窗口、數(shù)據(jù)提供形式和表頭信息不一致,可以針對指標(biāo)項(xiàng)單獨(dú)說明。

          • 如果涉及到數(shù)據(jù)提供或數(shù)據(jù)交互,數(shù)據(jù)驗(yàn)收人、待驗(yàn)收數(shù)據(jù)樣本和數(shù)據(jù)驗(yàn)收方式為必填項(xiàng),其它項(xiàng)并非強(qiáng)制需求。


          數(shù)據(jù)倉庫業(yè)務(wù)需求模板


          數(shù)據(jù)倉庫業(yè)務(wù)需求模板
          需求申請需求申請人*
          需求使用方*
          期望完成日期*
          需求類型*
          需求目的需求背景*
          期望目標(biāo)*
          應(yīng)用系統(tǒng)名
          應(yīng)用系統(tǒng)聯(lián)系人
          需求內(nèi)容需求概覽需求范圍*描述此次需求涉及的范圍(可以從人群特征,業(yè)務(wù)場景等維度定義數(shù)據(jù)范圍、改造哪些表等)。
          包含的指標(biāo)多個指標(biāo)以逗號分隔。如果指標(biāo)較多,可以在日常業(yè)務(wù)需求附表中的指標(biāo)名稱一欄填寫。
          數(shù)據(jù)交互方式涉及到數(shù)據(jù)輸出的,需要描述數(shù)據(jù)的交互方式、格式等。
          附件說明如果有附件需要補(bǔ)充的,請?jiān)诖苏f明,并同步附加附件。
          項(xiàng)目涉眾數(shù)據(jù)產(chǎn)品經(jīng)理
          設(shè)計人員
          開發(fā)人員
          測試人員
          數(shù)據(jù)安全與合規(guī)人員
          需求版本變更歷史
          版本號版本確認(rèn)日期版本變更點(diǎn)提交人




          常規(guī)需求申請單

          指標(biāo)需求中通常會涉及到下表中的約定項(xiàng),如果需要自定義約定項(xiàng),可以在自定義格式列進(jìn)行填寫。


          約定項(xiàng)默認(rèn)格式自定義格式
          日期yyyymmdd
          比率值4位小數(shù)點(diǎn)
          時間戳yyyy-mm-dd hh24:mi:ss,格林尼治時間。
          金額單位為分。
          時間粒度日:T-1日的00:00~24:00。
          周:周一到周日,對應(yīng)指標(biāo)僅周日有值。
          月:自然月,對應(yīng)指標(biāo)僅月末最后一天有值。
          年累計:自然年,1月1日到T-1。
          財年累計:財年4月1日到T-1。

          約定項(xiàng)填寫內(nèi)容約定項(xiàng)填寫內(nèi)容
          時間窗口(歷史數(shù)據(jù)要求)*
          存儲周期*
          更新頻率(日、周、月、小時、分鐘、其它)*
          期望數(shù)據(jù)更新時間*
          數(shù)據(jù)驗(yàn)收人
          待驗(yàn)收數(shù)據(jù)樣本
          數(shù)據(jù)驗(yàn)收方式
          數(shù)據(jù)提供形式
          • 物理表

          • 數(shù)據(jù)文件

          • 數(shù)據(jù)查詢服務(wù)或接口

          備注













          ?NO.

          粒度

          目錄

          接口表

          指標(biāo)名稱*

          指標(biāo)邏輯*

          空值/異常值處理*

          監(jiān)控項(xiàng)

          值是否唯一*

          數(shù)據(jù)來源*

          安全等級*

          備注





































          1


          迭代需求申請單


          數(shù)據(jù)倉庫需求變更申請單
          需求變更申請原始需求ID*
          需求申請人*
          需求使用方*
          期望完成日期*
          需求變更原因需求變更背景*
          是否可以在需求評審前預(yù)知*
          如何避免此類變更發(fā)生*
          需求變更內(nèi)容原始需求(對于新增的需求,填無)*變更內(nèi)容*變更類型*





          二、代碼評審報告


          代碼評審要求


          用例小類測試要點(diǎn)說明是否已檢查
          數(shù)據(jù)一致性測試主鍵唯一性產(chǎn)出表必須有物理主鍵或邏輯主鍵,且在數(shù)據(jù)上主鍵成立。
          主鍵和外鍵邏輯關(guān)系檢查設(shè)計文檔里關(guān)于主外鍵的設(shè)計是否在開發(fā)階段得以實(shí)現(xiàn),且在數(shù)據(jù)上成立,例如是否存在外鍵丟失。
          系統(tǒng)/業(yè)務(wù)間格式和類型一致性檢查檢查設(shè)計文檔描述的字段定義是否與實(shí)際值一致。例如日期是否包含時分秒,金額字段是否為Double,單位為元/分,保留小數(shù)位數(shù)。
          業(yè)務(wù)來源一致性檢查從同樣業(yè)務(wù)來源的指標(biāo)是否在數(shù)據(jù)上一致。例如同樣是余額指標(biāo),數(shù)據(jù)來源是否一致或來自同一加工鏈路,如果不是,則結(jié)果是否一致。
          同名邏輯定義檢查字段或邏輯定義相同,是否存在值不一樣的情況。例如同樣是貸款發(fā)放額,不同的表之間數(shù)據(jù)是否一致。
          數(shù)據(jù)完整性數(shù)據(jù)獲取是否完整代碼中的數(shù)據(jù)獲取邏輯是否完整。例如累計客戶數(shù),是否完整包含了歷史上有效存在,但當(dāng)前不存在的客戶。
          邊界值檢查代碼中對于邊界值的處理是否正確。例如最近30天包含今天但不包含第前30天的。例如日期篩選是否為雙閉區(qū)間。
          過濾條件完整性過濾條件是否完整。例如篩選當(dāng)前有效會員需要加上會員狀態(tài)的限制。
          指標(biāo)間邏輯檢查同表字段間邏輯檢查同表不同字段間在業(yè)務(wù)上存在的邏輯是否在數(shù)據(jù)上成立。例如貸款為結(jié)清狀態(tài),則結(jié)清日期一定非空;狀態(tài)為逾期,則逾期金額一定大于0。
          跨表/跨系統(tǒng)邏輯檢查跨表/跨系統(tǒng)間在業(yè)務(wù)上存在的邏輯是否在數(shù)據(jù)上成立。例如不良貸款余額>0,則該賬戶三級分類應(yīng)為次級、可疑和損失。

          代碼評審測試用例記錄


          備注測試結(jié)果測試結(jié)果備注是否轉(zhuǎn)化監(jiān)控監(jiān)控閾值創(chuàng)建日期創(chuàng)建人所屬項(xiàng)目名稱
          檢查主鍵的唯一性通過
          <12019/3/16XXX訂單主題分析



          三、驗(yàn)收報告模板


          測試驗(yàn)收點(diǎn)


          序號測試驗(yàn)證點(diǎn)(按實(shí)際情況增減)是否通過
          1數(shù)據(jù)主鍵是否重復(fù)。
          2結(jié)果數(shù)據(jù)的明細(xì)分布,包括數(shù)據(jù)量、空值、均值及其他相關(guān)業(yè)務(wù)指標(biāo)的分布。
          3抽樣檢查:與需求設(shè)定時的抽樣樣本進(jìn)行對比,查看是否存在差異。
          4如果是迭代需求,需要與一期的結(jié)果進(jìn)行對比,查看數(shù)據(jù)量差異、明細(xì)差異等。
          5某些數(shù)值型結(jié)果機(jī)型同比、環(huán)比,獲得大概增長率和變化范圍,判斷數(shù)據(jù)的正確性。

          需求實(shí)現(xiàn)情況

          • 已實(shí)現(xiàn)內(nèi)容。

          • 未實(shí)現(xiàn)內(nèi)容:需要說明未實(shí)現(xiàn)的原因。

          發(fā)現(xiàn)問題列表


          序號問題描述風(fēng)險影響分析風(fēng)險等級建議跟進(jìn)負(fù)責(zé)人
          Delay_1由于XX API回參格式限制,XX字段返回結(jié)果無法適配計算引擎字段類型。接口改造需花費(fèi)X天,導(dǎo)致項(xiàng)目整體進(jìn)度Delay X天。張三

          驗(yàn)收評估結(jié)果

          業(yè)務(wù)方(數(shù)據(jù)產(chǎn)品經(jīng)理):通過/不通過。

          驗(yàn)收通過。遺留的問題在本項(xiàng)目中可以接受,但Delay_1缺陷必須在xxxx年x月x日之前啟動升級包修復(fù)。



          四、交付測試報告


          代碼交付情況

          關(guān)鍵指標(biāo)包括BUG(每輪測試發(fā)現(xiàn)的缺陷總數(shù))、執(zhí)行率和通過率。


          文檔交付情況



          文檔測試準(zhǔn)入條件



          交付測試遺留問題

          記錄交付測試通過后,遺留在功能測試階段未解決的問題。



          五、單元測試報告

          單元測試要求


          用例小類測試要點(diǎn)說明是否已檢查(Y/N)
          規(guī)范性命名規(guī)范檢查(表、視圖、工作流、字段)是否符合MaxCompute數(shù)倉建設(shè)規(guī)范管理指南中命名規(guī)范的表命名規(guī)范。
          代碼格式和注釋規(guī)范性是否符合MaxCompute數(shù)倉建設(shè)規(guī)范管理指南中的編碼規(guī)范。
          表引用規(guī)范性數(shù)據(jù)不允許跨層引用。
          表更新策略規(guī)范建議臨時表均為非分區(qū)表,正式表均為分區(qū)表。
          是否支持重跑代碼必須支持重跑。
          源數(shù)據(jù)質(zhì)量非空值檢查檢查所用字段是否存在空值,以及代碼對空值處理的策略是否正確。
          字段枚舉值檢查字段的枚舉值是否都在代碼考慮范圍內(nèi),是否有可能會出現(xiàn)新值。
          主鍵檢查物理主鍵或邏輯主鍵是否成立。
          數(shù)據(jù)完整性檢查代碼中引用的數(shù)據(jù)能否支撐實(shí)際需求。
          字段間邏輯檢查字段間的業(yè)務(wù)邏輯關(guān)系是否在數(shù)據(jù)上成立,例如余額=總的發(fā)放-總的回收。
          代碼質(zhì)量/BUG檢查歷史拉鏈表檢查斷鏈/交叉鏈使用標(biāo)準(zhǔn)SQL進(jìn)行檢驗(yàn)。
          數(shù)據(jù)傾斜檢查是否存在傾斜的情況,是否有大表join小表未用mapjoin等。
          表分區(qū)選擇檢查代碼對表分區(qū)的選擇是否正確。
          關(guān)聯(lián)條件檢查關(guān)聯(lián)條件是否正確,是否會產(chǎn)生意料外的結(jié)果,例如多對多關(guān)聯(lián)、笛卡爾積。
          字段類型檢查字段類型是否正確,例如:金額字段必須為X數(shù)據(jù)類型,編號字段必須為X數(shù)據(jù)類型。
          執(zhí)行效率檢查單條SQL執(zhí)行時間不超過30分鐘,單個腳本執(zhí)行時間不超過60分鐘。
          數(shù)倉特殊需求臟數(shù)據(jù)檢查檢查是否有臟數(shù)據(jù)。
          增量/全量數(shù)據(jù)抽取規(guī)范抽取時間大于X分鐘的,則考慮更改為增量抽取。
          數(shù)倉抽取時間點(diǎn)檢查數(shù)倉抽取時業(yè)務(wù)系統(tǒng)是否ready,抽取的數(shù)據(jù)是否完整。
          指標(biāo)特性檢查細(xì)分指標(biāo)趨勢檢查例如會員拉鏈表記錄數(shù)相比前一天必須是正增長、當(dāng)日累計值-上日累計值必須大于0。
          不同粒度數(shù)據(jù)轉(zhuǎn)換正確性例如細(xì)粒度向粗粒度匯總,通常使用最大/最高/最小/最低等過濾條件,如:支用層逾期天數(shù)轉(zhuǎn)換到客戶層指標(biāo)(最高逾期天數(shù))。最高逾期天數(shù) = Max(支用層逾期天數(shù))。
          值域范圍檢查檢查字段值的范圍是否正確,如:金額>=0,比率<=1,天數(shù)<=業(yè)務(wù)起始日期至今,還款日期>=放款日期。
          代碼值分布檢查從業(yè)務(wù)邏輯考量字段值的分布情況是否合理。
          可累加值與不可累加值檢查檢查可累加值和不可累加值的處理邏輯正確性,如:計算客戶數(shù)總計時需要做去重處理,金額則可以累加。

          單元測試用例記錄


          序號用例大類測試要點(diǎn)字段自定義表達(dá)式備注
          1規(guī)范性命名規(guī)范檢查(表、視圖、工作流、字段)jrcdm_agt_ovd_ins_detail_fact_dd


          2規(guī)范性是否支持重跑jrcdm_agt_ovd_ins_detail_fact_dd


          3源數(shù)據(jù)質(zhì)量主鍵檢查afclms_clms_loan_contractcontract_no

          4指標(biāo)特性檢查值域范圍檢查jrcdm_cust_drawndn_fact_dsprin_max_ovd_days, inte_max_ovd_daysprin_max_ovd_days>=inte_max_ovd_days檢驗(yàn)逾期天數(shù)的業(yè)務(wù)邏輯。
          5指標(biāo)特性檢查值域范圍檢查x_jredw_da_drawndn_ovd_date_infoPrin_Ovd_Start_DtPrin_Ovd_Start_Dt<=Prin_Ovd_End_Dt, Inte_Ovd_Start_Dt <=Inte_Ovd_End_Dt檢查業(yè)務(wù)邏輯正確性。

          測試結(jié)果測試結(jié)果備注是否轉(zhuǎn)化監(jiān)控監(jiān)控閾值創(chuàng)建日期創(chuàng)建人所屬項(xiàng)目名稱
          通過


          2013/7/16XXX某項(xiàng)目
          通過


          2013/7/16XXX某項(xiàng)目
          通過


          2013/7/16XXX某項(xiàng)目
          通過
          <12013/7/16XXX某項(xiàng)目
          未通過開發(fā)代碼中存在以下兩個問題:
          • 未對期次還款日大于當(dāng)前日期的記錄進(jìn)行過濾,這部分為未到期記錄,需要排除。

          • 未對記錄中創(chuàng)建時間小于期次還款日的、未結(jié)清的期次記錄的逾期結(jié)束時間,賦予與逾期開始時間一致的處理。

          <12013/7/16XXX某項(xiàng)目



          六、發(fā)布操作文檔



          序號節(jié)點(diǎn)ID文件名發(fā)布次序是否需要生產(chǎn)冒煙是否需要重跑歷史數(shù)據(jù)重跑歷史時間段發(fā)布驗(yàn)證是否通過
          1xxxxxdw_user_log_info_d.sql1YY20190326-20190426Y



          七、數(shù)據(jù)探查報告


          數(shù)據(jù)探查報告模板,如下表所示。


          字段順序字段名字段注釋字段類型總行數(shù)空值個數(shù)



















          空值比例唯一個數(shù)均值(number)::TOP1(string)最小值::TOP21%分位數(shù)::TOP35%分位數(shù)::TOP4



















          25%分位數(shù)::TOP5中位數(shù)::BOT575%分位數(shù)::BOT495%分位數(shù)::BOT399%分位數(shù)::BOT2最大值::BOT1




















          八、質(zhì)量評估報告模板


          測試情況說明

          • 測試用例執(zhí)行通過率:0%~100%。

          • 每日發(fā)現(xiàn)故障趨勢圖。

          • 線下缺陷嚴(yán)重程度分類。

          需求實(shí)現(xiàn)說明

          • 需求覆蓋率(在測分文檔中,需求與功能對應(yīng)列表為準(zhǔn)):0%~100%。

          • 需求變更情況:包括已走正式流程的需求變更,郵件通告的需求變更,以及當(dāng)前功能改動了原有需求的說明。


            階段說明分類
            測分階段增加老會員模式下添加銀行卡的出錯情況提示。需求變更
            老會員添加卡的流程中,增加生僻字用戶的判斷。需求變更
            增加推薦規(guī)則模板:推薦規(guī)則為空時的展示方式。需求變更
          • 未實(shí)現(xiàn)需求:請說明需求未實(shí)現(xiàn)的原因。

          遺留問題列表


          序號問題描述風(fēng)險影響分析風(fēng)險等級建議跟進(jìn)負(fù)責(zé)人
          Delay_1由于XX API回參格式限制,XX字段返回結(jié)果無法適配計算引擎字段類型。接口改造需花費(fèi)X天,導(dǎo)致項(xiàng)目整體進(jìn)度Delay X天。XXX

          質(zhì)量評估結(jié)果

          • 測試是否通過

          • 保留建議

            遺留的問題在本項(xiàng)目中可以接受,但Delay_1缺陷必須在XXX年X月X日之前啟動升級包修復(fù)。




          免責(zé)聲明:

          本公眾號所有分享的軟件和資料來自網(wǎng)絡(luò)收集和整理,所有文字和圖片版權(quán)歸屬于原作者所有,且僅代表作者個人觀點(diǎn),與數(shù)據(jù)工匠俱樂部無關(guān),文章僅供讀者學(xué)習(xí)交流使用,并請自行核實(shí)相關(guān)內(nèi)容,文章內(nèi)容涉及侵權(quán),請聯(lián)系后臺管理員刪除


          (歡迎大家加入數(shù)據(jù)工匠知識星球獲取更多資訊。)

          聯(lián)系我們

          掃描二維碼關(guān)注我們

          微信:SZH9543
          郵箱:[email protected]
          QQ:2286075659

          熱門文章


          云智一體在滬啟航,百度智能云助力企業(yè)發(fā)揮大數(shù)據(jù)核心價值


          終于有人把DevOps講明白了


          終于有人把AI、BI、大數(shù)據(jù)、數(shù)據(jù)科學(xué)講明白了


          工信部:將推動建立數(shù)據(jù)產(chǎn)權(quán)制度、完善數(shù)據(jù)競爭規(guī)則


          數(shù)字化和數(shù)據(jù)平臺——企業(yè)數(shù)字化轉(zhuǎn)型的技術(shù)架構(gòu)升級


          構(gòu)建大數(shù)據(jù)知識管理體系,向世界一流企業(yè)邁進(jìn)


          數(shù)字化轉(zhuǎn)型規(guī)劃的體系化思考


          IT建設(shè)目標(biāo)及IT規(guī)劃初步方案(內(nèi)附下載鏈接)

          我們的使命:發(fā)展數(shù)據(jù)治理行業(yè)、普及數(shù)據(jù)治理知識、改變企業(yè)數(shù)據(jù)管理現(xiàn)狀、提高企業(yè)數(shù)據(jù)質(zhì)量、推動企業(yè)走進(jìn)大數(shù)據(jù)時代。

          我們的愿景:打造數(shù)據(jù)治理專家、數(shù)據(jù)治理平臺、數(shù)據(jù)治理生態(tài)圈。

          我們的價值觀:凝聚行業(yè)力量、打造數(shù)據(jù)治理全鏈條平臺、改變數(shù)據(jù)治理生態(tài)圈。

          了解更多精彩內(nèi)容


          長按,識別二維碼,關(guān)注我們吧!

          數(shù)據(jù)工匠俱樂部

          微信號:zgsjgjjlb

          專注數(shù)據(jù)治理,推動大數(shù)據(jù)發(fā)展。

          瀏覽 80
          點(diǎn)贊
          評論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報
          評論
          圖片
          表情
          推薦
          點(diǎn)贊
          評論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  国产真人无码 | 精品人伦一区二区三区蜜桃免费 | sm在线 | 一區二區三區色 | 大屌在线无玛 |