温馨提示×

温馨提示×

您好,登录后才能下订单哦!

密码登录×
登录注册×
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》

python如何统计文章中单词出现次数

发布时间:2021-08-03 10:38:58 来源:亿速云 阅读:1694 作者:小新 栏目:开发技术

这篇文章主要介绍了python如何统计文章中单词出现次数,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。

python统计单词出现次数

做单词词频统计,用字典无疑是最合适的数据类型,单词作为字典的key, 单词出现的次数作为字典的 value,很方便地就记录好了每个单词的频率,字典很像我们的电话本,每个名字关联一个电话号码。

下面是具体的实现代码,实现了从importthis.txt文件读取单词,并统计出现次数最多的5个单词。

# -*- coding:utf-8 -*- import io import re   class Counter:   def __init__(self, path):     """     :param path: 文件路径     """     self.mapping = dict()     with io.open(path, encoding="utf-8") as f:       data = f.read()       words = [s.lower() for s in re.findall("\w+", data)]       for word in words:         self.mapping[word] = self.mapping.get(word, 0) + 1     def most_common(self, n):     assert n > 0, "n should be large than 0"     return sorted(self.mapping.items(), key=lambda item: item[1], reverse=True)[:n]   if __name__ == '__main__':   most_common_5 = Counter("importthis.txt").most_common(5)   for item in most_common_5:     print(item)

执行效果:

('is', 10) ('better', 8) ('than', 8) ('the', 6) ('to', 5)

知识点补充:

1、如何正确读写文件

2、如何对数据进行排序

3、字典数据类型的运用

4、正则表达式的运用

感谢你能够认真阅读完这篇文章,希望小编分享的“python如何统计文章中单词出现次数”这篇文章对大家有帮助,同时也希望大家多多支持亿速云,关注亿速云行业资讯频道,更多相关知识等着你来学习!

向AI问一下细节

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

AI