hadoop小學生
圣騎士
圣騎士
  • 注冊日期2018-09-13
  • 發帖數145
  • QQ3234520070
  • 火幣330枚
  • 粉絲0
  • 關注0
閱讀:18496回復:0

自然語言處理工具hanlp定制用戶詞條

樓主#
更多 發布于:2019-05-20 10:12
關于hanlp的文章已經分享過很多,似乎好像大部分以理論性的居多。最近有在整理一些hanlp應用項目中的文章,待整理完成后會陸續分享出來。本篇分享的依然是由baiziyu 分享的一篇文章,感興趣的可以在知乎上關注下他的專欄,寫的還是挺好的!

以下為文章的主要內容:
自定義詞表的修改
自定義詞表在pyhanlp\static\data\dictionary\custom”路徑下的“CustomDictionary.txt”文件中,HanLP.segment支持自定義此詞表。如果需要修改自定義詞表,則直接編輯文件“CustomDictionary.txt”,之后刪除路徑下的“CustomDictionary.txt.bin”,運行分詞代碼后即可自動生效。
驗證修改是否生效

圖片:圖1.jpg


圖片:圖2.jpg





驗證代碼
from pyhanlp import *
term_list = HanLP.segment(text)

喜歡0 評分0
DKHadoop用著還不錯!
游客

返回頂部
广东体彩26选5