IT博客汇
  • 首页
  • 精华
  • 技术
  • 设计
  • 资讯
  • 扯淡
  • 权利声明
  • 登录 注册

    [原]数学之路(机器学习实践指南)-文本挖掘与NLP(5)

    u010255642发表于 2016-02-02 12:22:17
    love 0
    #条件频率,每个词条在不同分类中出现的频率
    print "------------------"
    cfd=nltk.ConditionalFreqDist(samplewords)   
    fdist=cfd[u'财经']
    for word in fdist:
        print word
    print "---------流动性出现次数-----------"
    print cfd[u'财经'][u'流动性']
    print "----------条件:分类----------"
    for cnd in cfd.conditions():
        print cnd
    print "---------------------------"
    print cfd[u'财经'].max()
    #条件频率分布表
    print "----------条件频率分布表----------"
    cfd.tabulate(title=u'条件频率分布表',conditions=[u'科技',u'财经'])
    cfd.plot(title=u'条件频率分布图',conditions=[u'科技',u'财经'])


    本博客所有内容是原创,如果转载请注明来源

    http://blog.csdn.net/myhaspl/





沪ICP备19023445号-2号
友情链接