<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          數據挖掘之關聯規(guī)則算法

          共 1441字,需瀏覽 3分鐘

           ·

          2021-08-01 19:46

          你好,我是林驥。

          曾經有一段時間,「數據挖掘」這個概念很火,其中「啤酒與尿布」的故事廣為流傳。

          據說,沃爾瑪為了準確了解客戶的購買習慣,對其客戶的購物行為進行購物籃分析,想知道客戶經常一起購買的商品有哪些。

          在沃爾瑪的數據倉庫里,有非常詳細的原始訂單數據,數據分析師利用算法,對這些原始訂單數據進行分析和挖掘,發(fā)現「跟尿布一起購買最多的商品竟然是啤酒」。

          經過大量的調查和分析,發(fā)現客戶的一種行為模式:一些年輕的父親下班后,經常要到超市去買尿布,而他們中有 30%~40% 的人,同時也為自己買一些啤酒。

          后來「大數據」和「人工智能」的概念興起,我感覺說「數據挖掘」的人已經不多了。但是,這些不同概念的背后,一些算法的原理其實是相同的。

          比如說,關聯規(guī)則算法,就是從一件事情的發(fā)生,來推測另外一件事情發(fā)生的概率,從而幫助我們更好地了解和掌握事物的發(fā)展規(guī)律。

          關聯規(guī)則算法的應用非常廣泛,例如:交叉銷售、商品擺放、流失分析、價格分析、習慣分析等。

          應用關聯規(guī)則算法時,通常會涉及幾個重要的參數,分別是:項目集、支持度、置信度、重要性

          舉一個簡單的例子,假設有 3 筆訂單,對應的產品明細如下:

          訂單號產品明細
          10001啤酒,尿布
          10002啤酒,尿布
          10003尿布

          1. 項目集

          每個項目集都有一個大小,該大小表示項目集中包含的項的數目。

          比如說,在上面的例子中,包含 3 個項目集,分別是:{啤酒}、{尿布}、{啤酒,尿布}。項目集 {啤酒} 的大小是 1,項目集 {啤酒,尿布} 的大小是 2。

          頻繁項目集,就是在數據集中出現頻率高的那些項目集。

          2. 支持度

          支持度表示一個項目集出現的次數。

          比如說,項目集 {啤酒,尿布} 的支持度,是同時包含啤酒和尿布的訂單總個數是 2 個。

          在處理關聯規(guī)則之前,先指定一個最小的支持度,用于對項目集進行限制,表示用戶只對某些項目集感興趣。

          3. 置信度

          置信度是一個表示概率的屬性。

          比如說,在上面的例子中,對于購買啤酒的客戶,同時購買尿布的置信度是 100%。

          在處理關聯規(guī)則之前,先指定一個最小的置信度,用于對規(guī)則進行限制,表示用戶只對某些規(guī)則感興趣,這些規(guī)則要大于或等于最小的概率。

          4. 重要性

          實際挖掘出來的一些關聯規(guī)則,并非都是有用的,有時候甚至是有一定的誤導性,所以重要性這個指標就顯得非常重要。

          關聯規(guī)則的重要性,是指在已知規(guī)則左側的情況下,求規(guī)則右側的對數可能性。

          如果重要性分數為 0,那么表示沒有關聯;正的重要性分數表示正相關;負的重要性分數表示負相關。

          最后的話

          在數據分析中,面對不同的場景,運用適當的思維、算法或模型,可以幫助你更好地觀察事物和看待世界,形成正確的認知,從而做出科學的決策。

          這篇文章介紹的關聯規(guī)則算法,相對比較專業(yè),你不需要死記硬背,只需要有個大致的了解。

          當你以后遇到類似的場景時,如果能夠想起來有這么一種算法,然后就可以借助相關的軟件,把它應用到實際業(yè)務中去,想方設法為業(yè)務賦能,從而創(chuàng)造更大的價值。

          相關文章:決策樹算法應用及結果解讀




          關注林驥,更多干貨早知道。

          ▲ 點擊上方卡片...設為星標

          點擊↓「閱讀原文」,免費知識星球。
          和 3800+ 位驥友一起,用數據賦能自己
          瀏覽 60
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          評論
          圖片
          表情
          推薦
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  一区二区韩国在线 | 2024无码在线 | 国产一级一级欧美 | 天天肏在线视频 | 亚洲韩日中文 |