当前位置: 首页 > >

python的jieba词库的简单使用

发布时间:

    jieba.cut(s)精确模式,返回一个可迭代的数据类型jieba.cut(s,cut_all=True)全模式,输出文本s中所有可能的词组jieba.cut_for_search(s)搜索引擎模式,适合搜索引擎建立索引的分词结果“分隔符”.join(word)将word中的词用分隔符分隔

import jieba
str="中华人民共和国万岁"
print(" ".join(jieba.cut(str))) #分隔符为空格
print(" ".join(jieba.cut(str,cut_all=True)))
print(" ".join(jieba.cut_for_search(str)))


5. jieba.lcut(s)精确模式,返回一个列表类型,建议使用
6. jieba.lcut(s,cut_all=True)全模式,返回一个列表类型,建议使用
7. jieba.lcut_for_search(s)搜索引擎模式,返回一个列表类型,建议使用


import jieba
str="中华人民共和国万岁"
print(jieba.lcut(str))
print(jieba.lcut(str,cut_all=True))
print(jieba.lcut_for_search(str))


    jieba.add_word(w)向分词词典中增加新词w

import jieba
str="我们一起盘他"
jieba.add_word("盘他")
#不填加“盘他”,就会将“盘他”分为“盘”“他”两部分输出
print(jieba.lcut(str))



友情链接: