<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          千萬級(jí)內(nèi)容類產(chǎn)品的中臺(tái)是怎樣的?

          共 1605字,需瀏覽 4分鐘

           ·

          2021-04-07 01:58

          說到內(nèi)容,可以把它想象為一塊牛肉。它首先是一頭牛,然后這頭牛被送進(jìn)了加工廠,在一系列加工之后,通過物流送到超市,最后,你通過消費(fèi)獲得這塊牛肉。內(nèi)容也是一樣,需要經(jīng)過生產(chǎn)、加工、審核、分發(fā)等工序最后展示在用戶面前。本文說的內(nèi)容中臺(tái)便是如此。


                 一頭牛(內(nèi)容原料/內(nèi)容生產(chǎn))      


          和通常說的UGC/PGC的分類不一樣,此處的說的中臺(tái)將內(nèi)容來源分為外部創(chuàng)作和內(nèi)部創(chuàng)作。


          外部創(chuàng)作指的是爬蟲采集、人工摘錄、渠道合作以及用戶創(chuàng)作內(nèi)容(UGC)。


          • 爬蟲采集:是指對(duì)特定信息源進(jìn)行機(jī)器爬蟲采集、內(nèi)容入庫(kù)。此處說的特定的信息來源通常是公開信息網(wǎng)站,比如gov類的。


            爬蟲采集要求全、快、準(zhǔn)、穩(wěn)。

            全,爬取的內(nèi)容要全,不能把信息源的文章少爬了幾篇。

            快,采集要快、入庫(kù)要快,最好是能在幾秒鐘內(nèi)就出現(xiàn)在內(nèi)部文章池,然而現(xiàn)在一般是在五分鐘左右。

            準(zhǔn),內(nèi)容要素要準(zhǔn)、內(nèi)容定位準(zhǔn)確,比如說不能把作者當(dāng)成媒體來源。

            穩(wěn),采集程序穩(wěn)定,而且要有及時(shí)的監(jiān)控報(bào)警機(jī)制。


          • 人工摘錄:主要是針對(duì)那些及時(shí)性要求比較高的內(nèi)容,比如突發(fā)性重大新聞。這也側(cè)面反映出爬蟲采集存在一定缺陷,比如時(shí)效性低,很難做到秒級(jí)反應(yīng)。此外部分來源也設(shè)有反爬蟲機(jī)制,會(huì)使得內(nèi)容有所缺失。這時(shí)候就需要人工摘錄進(jìn)行補(bǔ)充。


          • 渠道合作:是指由合作商提供接口,除了常規(guī)的內(nèi)容要素,還應(yīng)該包含增刪改信息,最好是有合適的日志以及信息同步機(jī)制。


          內(nèi)部創(chuàng)作說的是企業(yè)原創(chuàng),這類又分為兩種:一種是純?nèi)斯?chuàng)作,另一種是智能寫稿。


          • 純?nèi)斯?chuàng)作:也就是原創(chuàng)內(nèi)容,由強(qiáng)大的編輯團(tuán)隊(duì)一手創(chuàng)作

          • 智能寫稿:這個(gè)有點(diǎn)像文字填充。產(chǎn)品經(jīng)理在經(jīng)過一系列的分析以后篩選出能夠滿足用戶需求并且能被技術(shù)支持的文章類型,再對(duì)每一類文章編寫模板并規(guī)定由機(jī)器填寫的字段。此后機(jī)器就能自動(dòng)產(chǎn)出符合要求的內(nèi)容了。


                加工廠(內(nèi)容加工)      


          加工廠主要有兩種“機(jī)器”,一類是標(biāo)簽體系(內(nèi)容分類),一類是內(nèi)容加工。


          標(biāo)簽體系主要服務(wù)于構(gòu)建文章池并以此作為個(gè)性化推薦的基礎(chǔ)。比如說某篇文章的標(biāo)簽是{A,B},某用戶的標(biāo)簽也是{A,B},那么這篇文章便可能有很大的概率被推送到這個(gè)用戶面前。而此處的標(biāo)簽體系便是通過對(duì)內(nèi)容的分析給它們打上各種標(biāo)簽以便于后續(xù)的分發(fā)和推送。值得注意的是,標(biāo)簽并不是越多越好,而是要遵循一定的規(guī)則,這樣才能盡可能地提高匹配程度,從而提高文章的消費(fèi)率。


          內(nèi)容加工主要有以下幾步:

          首先是格式的優(yōu)化,對(duì)于采集過來的文章我們需要把不合適的內(nèi)容去掉,比如說超鏈、廣告等。


          然后是內(nèi)容轉(zhuǎn)存,將文章的圖片和視頻轉(zhuǎn)到自己的服務(wù)器上(這需要取得對(duì)方許可)。


          其次還有一些附加模塊,這塊主要作用于各前臺(tái)的特色功能或者個(gè)性化需求,比如在文章中添加圖片、表格、投票、附件、運(yùn)營(yíng)模塊(主要是banner)等。


          最后是蓋戳環(huán)節(jié),就像加工廠給牛肉蓋戳一樣,我們需要對(duì)內(nèi)容的合規(guī)性、與原文的一致性等進(jìn)行復(fù)核,主要是違規(guī)詞屏蔽(也就是你們?cè)谕跽咿r(nóng)藥里顯示不出來的芬芳)、關(guān)鍵詞替換、原文比對(duì)等。


                物流分發(fā)(內(nèi)容分發(fā))      


          物流分發(fā)輸出的就是成品牛肉——文章池,它最重要的元素有:標(biāo)題、摘要、正文、時(shí)間、排序、內(nèi)容標(biāo)簽、個(gè)性化模塊。分發(fā)的邏輯比較復(fù)雜,而且也需要配合前臺(tái)具體需求,這里就不展開論述了。


          最后附上邏輯圖


          本次分享到此結(jié)束,更多內(nèi)容和免費(fèi)資料請(qǐng)到公眾號(hào)內(nèi)查看哦~

          瀏覽 40
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          評(píng)論
          圖片
          表情
          推薦
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  日韩无码 国产精品 | www.精品一区 | 大鸡巴操逼免费视频 | 人人草,人人摸 | 亚洲视频二 |