簡介
.NET平臺(tái)下,一個(gè)高效的從Html中提取正文的工具。正文提取采用了基于文本密度的提取算法,支持從壓縮的Html文檔中提取正文,每個(gè)頁面平均提取時(shí)間為30ms,正確率到95%以上。Html2Article有如下特點(diǎn):標(biāo)簽無關(guān),提取正文不依賴標(biāo)簽。支持從壓縮的html文檔中提取正文內(nèi)容。支持帶標(biāo)簽輸出... 更多
技術(shù)信息
開源協(xié)議
Apache
開發(fā)語言
C#
操作系統(tǒng)
Windows
軟件類型
開源軟件
所屬分類
Web應(yīng)用開發(fā)、 HTML解析器
開源組織
無
地區(qū)
國產(chǎn)
適用人群
未知
評價(jià)
0.0(滿分 10 分)0 個(gè)評分
什么是點(diǎn)評分
圖片
表情
全部評價(jià)(
0)
推薦率
100%

