<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          GNE-JS新聞網頁正文通用抽取器

          聯(lián)合創(chuàng)作 · 2023-09-29 13:48

          GNE-JS 是基于論文《基于文本及符號密度的網頁正文提取方法》實現(xiàn)的新聞網頁正文通用抽取器。

          在論文中描述的正文提取基礎上,還增加了標題、發(fā)布時間和文章作者的自動化探測與提取功能。

          該項目啟發(fā)自 GNE,由 Python 遷移到 Node.js,并做了一些改動,提高提取準確度。

          demo:

          https://general-news-extractor-demo.stayin.cn

          瀏覽 30
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          編輯 分享
          舉報
          評論
          圖片
          表情
          推薦
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          編輯 分享
          舉報
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  日韩黄色激情 | 色五月乱伦 | 年轻人在线毛片免费看视频在线 | 亚洲乱码国产乱码精品天美传媒 | 操B在线免费视频 |