簡(jiǎn)介
HtmlSucker 是一個(gè)用來(lái)從一個(gè)網(wǎng)頁(yè)中提取文章信息的小工具包,例如從網(wǎng)頁(yè)中提取文章標(biāo)題、作者、發(fā)布時(shí)間、 封面圖以及文章正文內(nèi)容。基于?jsoup?庫(kù)進(jìn)行 HTML 解析。HtmlSucker 提取文章正文的原理:分析整個(gè) HTML 文檔的所有節(jié)點(diǎn),提取其中包含最多文字的的連續(xù)節(jié)點(diǎn)。本項(xiàng)目部分... 更多
技術(shù)信息
開源協(xié)議
WTFPL
開發(fā)語(yǔ)言
Java
操作系統(tǒng)
跨平臺(tái)
軟件類型
開源軟件
所屬分類
Web應(yīng)用開發(fā)、 HTML解析器
開源組織
無(wú)
地區(qū)
國(guó)產(chǎn)
適用人群
未知
評(píng)價(jià)
0.0(滿分 10 分)0 個(gè)評(píng)分
什么是點(diǎn)評(píng)分
圖片
表情
全部評(píng)價(jià)(
0)
推薦率
100%

