rmmseg-cppRuby中文分詞器
rmmseg的主要問題是性能和內(nèi)存消耗。用純r(jià)uby編寫的rmmseg分詞的速度非常慢,而且內(nèi)存消耗非常驚人,當(dāng)使用復(fù)雜分詞算法的時(shí)候,內(nèi)存呈線性上升的現(xiàn)象。為此rmmseg的作者pluskid再接再厲用C++重寫了一遍rmmseg項(xiàng)目,這就是rmmseg-cpp。根據(jù)作者自己的簡單測試表明:rmmseg-cpp的性能是rmmseg的400倍之多。
安裝方法:gem install pluskid-rmmseg-cpp --source=http://gems.github.com
rmmseg-cpp和libmmseg目前都可以作為比較好的ruby中文分詞程序來使用,他們的性能和內(nèi)存管理都相當(dāng)不錯(cuò),經(jīng)過我們測試和使用的情況來看,都可以放心在生產(chǎn)環(huán)境當(dāng)中使用。
評論
圖片
表情
