jieba-analysis結(jié)巴分詞(java版)
首先感謝jieba分詞原作者fxsjy,沒有他的無私貢獻(xiàn),我們也不會(huì)結(jié)識(shí)到結(jié)巴 分詞,更不會(huì)有現(xiàn)在的java版本。
結(jié)巴分詞的原始版本為python編寫,目前該項(xiàng)目在github上的關(guān)注量為170, 打星727次(最新的數(shù)據(jù)以原倉庫為準(zhǔn)),F(xiàn)ork238次,可以說已經(jīng)有一定的用戶群。
結(jié)巴分詞(java版)只保留的原項(xiàng)目針對搜索引擎分詞的功能(cut_for_index、cut_for_search),詞性標(biāo)注,關(guān)鍵詞提取沒有實(shí)現(xiàn)(今后如用到,可以考慮實(shí)現(xiàn))。
簡介
支持分詞模式
- Search模式,用于對用戶查詢詞分詞
- Index模式,用于對索引文檔分詞
如何獲取
- git clone https://github.com/huaban/jieba-analysis.git
- cd jieba-analysis
- mvn package install ,安裝到本地倉庫
- 在你的 pom.xml 文件中添加以下依賴。
評論
圖片
表情
