你應(yīng)該知道的大數(shù)據(jù)名詞術(shù)語(yǔ)產(chǎn)品與體驗(yàn)關(guān)注共 2696字,需瀏覽 6分鐘 ·2021-08-07 08:03 1. 上卷下鉆下鉆,是指將特定分組的數(shù)據(jù)按第二維度繼續(xù)向下細(xì)分顯示。上卷,是下鉆的逆過(guò)程,即收起細(xì)節(jié)數(shù)據(jù),顯示上一層級(jí)的匯總數(shù)據(jù)。2. 顆粒度顆粒度是指具體的詳細(xì)和清晰程度;顆粒度越細(xì),表示細(xì)節(jié)越詳盡,越有助于了解事情的全貌;顆粒度越粗,表示細(xì)節(jié)越少,更多的是抽象概括。3. 維度(字段)與度量維度,包含定量值(例如名稱(chēng)、日期或地理數(shù)據(jù))。您可以使用維度進(jìn)行分類(lèi)、分段以及揭示數(shù)據(jù)中的詳細(xì)信息。維度影響視圖中的詳細(xì)級(jí)別。度量,包含可以測(cè)量的數(shù)字定量值。度量可以聚合。將度量拖到視圖中時(shí),Tableau(默認(rèn)情況下)會(huì)向該度量應(yīng)用一個(gè)聚合。4. 聚合搜索、合并、顯示數(shù)據(jù)的過(guò)程5. 算法可以完成某種數(shù)據(jù)分析的數(shù)學(xué)公式6. 儀表板使用算法分析數(shù)據(jù),并將結(jié)果用圖表方式顯示于儀表板中7. 數(shù)據(jù)庫(kù)一個(gè)以某種特定的技術(shù)來(lái)存儲(chǔ)數(shù)據(jù)集合的倉(cāng)庫(kù)8. 數(shù)據(jù)清洗對(duì)數(shù)據(jù)進(jìn)行重新審查和校驗(yàn)的過(guò)程,目的在于刪除重復(fù)信息、糾正存在的錯(cuò)誤,并提供數(shù)據(jù)一致性9. 數(shù)據(jù)挖掘從數(shù)據(jù)集中發(fā)掘特定模式或信息的過(guò)程10. 數(shù)據(jù)建模使用數(shù)據(jù)建模技術(shù)來(lái)分析數(shù)據(jù)對(duì)象,以此洞悉數(shù)據(jù)的內(nèi)在涵義11. 提取-轉(zhuǎn)換-加載 (ETL)(ETL: Extract, Transform and Load) – 是一種用于數(shù)據(jù)庫(kù)或者數(shù)據(jù)倉(cāng)庫(kù)的處理過(guò)程,即從各種不同的數(shù)據(jù)源提取(E)數(shù)據(jù),并轉(zhuǎn)換(T)成能滿(mǎn)足業(yè)務(wù)需要的數(shù)據(jù),最后將其加載(L)到數(shù)據(jù)庫(kù)12. 元數(shù)據(jù)被稱(chēng)為描述數(shù)據(jù)的數(shù)據(jù),即描述數(shù)據(jù)數(shù)據(jù)屬性(數(shù)據(jù)是什么)的信息。13. MongoDB一個(gè)介于關(guān)系數(shù)據(jù)庫(kù)和非關(guān)系數(shù)據(jù)庫(kù)之間的產(chǎn)品,是非關(guān)系數(shù)據(jù)庫(kù)當(dāng)中功能最豐富,最像關(guān)系數(shù)據(jù)庫(kù)的。它支持的數(shù)據(jù)結(jié)構(gòu)非常松散,是類(lèi)似json的bson格式,因此可以存儲(chǔ)比較復(fù)雜的數(shù)據(jù)類(lèi)型。Mongo最大的特點(diǎn)是它支持的查詢(xún)語(yǔ)言非常強(qiáng)大,其語(yǔ)法有點(diǎn)類(lèi)似于面向?qū)ο蟮牟樵?xún)語(yǔ)言,幾乎可以實(shí)現(xiàn)類(lèi)似關(guān)系數(shù)據(jù)庫(kù)單表查詢(xún)的絕大部分功能,而且還支持對(duì)數(shù)據(jù)建立索引。14. 多維數(shù)據(jù)庫(kù)用于優(yōu)化數(shù)據(jù)聯(lián)機(jī)分析處理(OLAP)程序,優(yōu)化數(shù)據(jù)倉(cāng)庫(kù)的一種數(shù)據(jù)庫(kù)。15. 多值數(shù)據(jù)庫(kù)是一種非關(guān)系型數(shù)據(jù)庫(kù)(NoSQL), 一種特殊的多維數(shù)據(jù)庫(kù):能處理3個(gè)維度的數(shù)據(jù)。主要針對(duì)非常長(zhǎng)的字符串,能夠完美地處理HTML和XML中的字串。16. 預(yù)測(cè)分析大數(shù)據(jù)分析方法中最有價(jià)值的一種分析方法,這種方法有助于預(yù)測(cè)個(gè)人未來(lái)(近期)的行為,例如某人很可能會(huì)買(mǎi)某些商品,可能會(huì)訪問(wèn)某些網(wǎng)站,做某些事情或者產(chǎn)生某種行為。通過(guò)使用各種不同的數(shù)據(jù)集,例如歷史數(shù)據(jù),事務(wù)數(shù)據(jù),社交數(shù)據(jù),或者客戶(hù)的個(gè)人信息數(shù)據(jù),來(lái)識(shí)別風(fēng)險(xiǎn)和機(jī)遇。17. 抽樣抽樣是總體中的一組數(shù)據(jù),帶有指定的信息。理想情況下,需要經(jīng)常分析較大的樣本以獲取最精確的估計(jì)和最新的信息。樣本越大,就能越輕松地檢測(cè)到較小的變化,并使控制圖在檢測(cè)變動(dòng)時(shí)能夠更敏感,同時(shí)不會(huì)增大誤報(bào)率。18. 中位數(shù)將一組數(shù)從小到大排列,若個(gè)數(shù)為奇數(shù),則中位數(shù)就是中間那個(gè)數(shù);若個(gè)數(shù)為偶數(shù),則中間兩個(gè)數(shù)的平均數(shù)就是中位數(shù)。19. 云計(jì)算云計(jì)算是必不可少的大數(shù)據(jù)術(shù)語(yǔ)之一。它是一個(gè)新的范式計(jì)算系統(tǒng),它提供可視化的計(jì)算資源,以運(yùn)行在用于存儲(chǔ)數(shù)據(jù)的標(biāo)準(zhǔn)遠(yuǎn)程服務(wù)器上,并提供IaaS,PaaS和SaaS。云計(jì)算提供IT資源,例如基礎(chǔ)架構(gòu),軟件,平臺(tái),數(shù)據(jù)庫(kù),存儲(chǔ)等作為服務(wù)。它的一些服務(wù)包括靈活的擴(kuò)展,快速的彈性,資源池,按需自助服務(wù)。20. IaaSIaaS(Infrastructure as a Service),即基礎(chǔ)設(shè)施即服務(wù)。指把IT基礎(chǔ)設(shè)施作為一種服務(wù)通過(guò)網(wǎng)絡(luò)對(duì)外提供,并根據(jù)用戶(hù)對(duì)資源的實(shí)際使用量或占用量進(jìn)行計(jì)費(fèi)的一種服務(wù)模式。 在這種服務(wù)模型中,普通用戶(hù)不用自己構(gòu)建一個(gè)數(shù)據(jù)中心等硬件設(shè)施,而是通過(guò)租用的方式,利用 Internet從IaaS服務(wù)提供商獲得計(jì)算機(jī)基礎(chǔ)設(shè)施服務(wù),包括服務(wù)器、存儲(chǔ)和網(wǎng)絡(luò)等服務(wù)。21. PaaSPaaS是(Platform as a Service)的縮寫(xiě),是指平臺(tái)即服務(wù)。把服務(wù)器平臺(tái)作為一種服務(wù)提供的商業(yè)模式,通過(guò)網(wǎng)絡(luò)進(jìn)行程序提供的服務(wù)稱(chēng)之為SaaS(Software as a Service),是云計(jì)算三種服務(wù)模式之一,而云計(jì)算時(shí)代相應(yīng)的服務(wù)器平臺(tái)或者開(kāi)發(fā)環(huán)境作為服務(wù)進(jìn)行提供就成為了PaaS(Platform as a Service)。所謂PaaS實(shí)際上是指將軟件研發(fā)的平臺(tái)作為一種服務(wù),以SaaS的模式提交給用戶(hù)。因此,PaaS也是SaaS模式的一種應(yīng)用。但是,PaaS的出現(xiàn)可以加快SaaS的發(fā)展,尤其是加快SaaS應(yīng)用的開(kāi)發(fā)速度。在2007年國(guó)內(nèi)外SaaS廠商先后推出自己的PAAS平臺(tái)。22. SaaSSaaS,是Software-as-a-Service的縮寫(xiě)名稱(chēng),意思為軟件即服務(wù),即通過(guò)網(wǎng)絡(luò)提供軟件服務(wù)。SaaS平臺(tái)供應(yīng)商將應(yīng)用軟件統(tǒng)一部署在自己的服務(wù)器上,客戶(hù)可以根據(jù)工作實(shí)際需求,通過(guò)互聯(lián)網(wǎng)向廠商定購(gòu)所需的應(yīng)用軟件服務(wù),按定購(gòu)的服務(wù)多少和時(shí)間長(zhǎng)短向廠商支付費(fèi)用,并通過(guò)互聯(lián)網(wǎng)獲得Saas平臺(tái)供應(yīng)商提供的服務(wù)。SaaS 應(yīng)用軟件有免費(fèi)、付費(fèi)和增值三種模式。付費(fèi)通常為“全包”費(fèi)用,囊括了通常的應(yīng)用軟件許可證費(fèi)、軟件維護(hù)費(fèi)以及技術(shù)支持費(fèi),將其統(tǒng)一為每個(gè)用戶(hù)的月度租用費(fèi)。23. 數(shù)據(jù)架構(gòu)與設(shè)計(jì)在IT行業(yè)中,數(shù)據(jù)體系結(jié)構(gòu)由模型,策略標(biāo)準(zhǔn)或規(guī)則組成,這些模型,策略標(biāo)準(zhǔn)或規(guī)則控制聚合哪些數(shù)據(jù)以及如何在數(shù)據(jù)系統(tǒng)中安排,存儲(chǔ),集成和使用這些數(shù)據(jù)。它分為三個(gè)階段:業(yè)務(wù)實(shí)體的概念表示業(yè)務(wù)實(shí)體之間關(guān)系的邏輯表示功能支持系統(tǒng)的物理構(gòu)建24. 在線分析處理(OLAP)在此過(guò)程中,使用三個(gè)運(yùn)算符(向下鉆取,合并以及切片和切塊)對(duì)多維數(shù)據(jù)進(jìn)行分析。向下鉆取是提供給用戶(hù)查看底層詳細(xì)信息的功能合并是可用的匯總切片和切塊是為用戶(hù)提供的選擇子集并從各種上下文中查看它們的功能25. 實(shí)時(shí)數(shù)據(jù)可以立即(即以毫秒為單位)創(chuàng)建,存儲(chǔ),處理,分析和可視化的數(shù)據(jù)稱(chēng)為實(shí)時(shí)數(shù)據(jù)。26. 非結(jié)構(gòu)化數(shù)據(jù)無(wú)法定義結(jié)構(gòu)的數(shù)據(jù)稱(chēng)為非結(jié)構(gòu)化數(shù)據(jù)。處理和管理非結(jié)構(gòu)化數(shù)據(jù)變得困難。非結(jié)構(gòu)化數(shù)據(jù)的常見(jiàn)示例是在電子郵件消息中輸入的文本以及帶有文本,圖像和視頻的數(shù)據(jù)源。 瀏覽 42點(diǎn)贊 評(píng)論 收藏 分享 手機(jī)掃一掃分享分享 舉報(bào) 評(píng)論圖片表情視頻評(píng)價(jià)全部評(píng)論推薦 你應(yīng)該知道的高效學(xué)習(xí)法人生不止有技術(shù)0你最應(yīng)該知道的古典詩(shī)詞打開(kāi)歷史的卷軸,撲面而來(lái)的是散發(fā)著淡淡清香的古典詩(shī)詞。它熱情但不矯情,委婉但不忸怩,奔放但不夸張,它你應(yīng)該知道的十大常見(jiàn)黑客技術(shù)程序員面試吧0NPM 組件你應(yīng)該知道的事腦洞前端0萬(wàn)能 Transformer,你應(yīng)該知道的一切極市平臺(tái)0你應(yīng)該知道的LightGBM各種操作!AI入門(mén)學(xué)習(xí)02020你應(yīng)該知道的Node配置前端微服務(wù)0你應(yīng)該知道的200件紫檀家具《你應(yīng)該知道的200件紫檀家具》所介紹的紫檀這種木材大體反映了這一時(shí)段風(fēng)格。從明代末期至清代康熙時(shí)期你應(yīng)該知道的200件紫檀家具你應(yīng)該知道的200件紫檀家具0你最應(yīng)該知道的古典詩(shī)詞你最應(yīng)該知道的古典詩(shī)詞0點(diǎn)贊 評(píng)論 收藏 分享 手機(jī)掃一掃分享分享 舉報(bào)