博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
python字频统计软件_python统计文本中字频的方法
阅读量:6690 次
发布时间:2019-06-25

本文共 1540 字,大约阅读时间需要 5 分钟。

python统计文本中字频的方法

发布时间:2020-09-22 15:07:51

来源:亿速云

阅读:76

作者:小新

python统计文本中字频的方法?这个问题可能是我们日常学习或工作经常见到的。希望通过这个问题能让你收获颇深。下面是小编给大家带来的参考内容,让我们一起来看看吧!

思路:

是先把每个字符提出来放在列表里;

再过滤掉其中的标点符号;

最后用字典对某个字出现的频率进行累加。

下面以芳华这本小说为例:#coding:utf-8

word_lst = []

word_dict = {}

exclude_str = ",。!?、()<>《》=:+-*—“”…"

with open("芳华.txt","r") as fileIn ,open("芳华字频.txt",'w') as fileOut:

# 添加每一个字到列表中

for line in fileIn:

for char in line:

word_lst.append(char)

# 用字典统计每个字出现的个数

for char in word_lst:

if char not in exclude_str:

if char.strip() not in word_dict: # strip去除各种空白

word_dict[char] = 1

else :

word_dict[char] += 1

# 排序

# x[1]是按字频排序,x[0]则是按字排序

lstWords = sorted(word_dict.items(), key=lambda x:x[1], reverse=True)

# 输出结果 (前100)

print ('字符\t字频')

print ('=============')

for e in lstWords[:100]:

print ('%s\t%d' % e)

fileOut.write('%s, %d\n' % e)

输出结果字符 字频

=============

的 3641

一 1834

了 1748

是 1506

不 1267

我 1229

她 1156

他 985

小 962

个 921

人 866

在 853

刘 745

丁 728

那 723

上 705

来 698

峰 691

们 684

就 667

说 577

有 572

到 564

这 562

里 537

儿 520

嫚 499

子 494

都 492

着 491

大 482

么 462

出 460

看 441

也 415

得 404

下 383

时 367

还 366

女 349

地 340

头 331

好 327

没 326

去 321

过 320

老 317

跟 311

你 309

把 307

对 303

年 301

会 300

生 291

为 289

发 289

要 281

何 280

亲 273

后 272

给 267

和 266

天 265

家 259

手 251

长 251

想 249

多 242

自 241

开 240

当 236

兵 235

样 232

郝 230

可 228

起 225

被 224

成 216

十 215

什 215

以 209

事 209

从 209

点 208

能 203

两 203

回 202

门 201

所 195

淑 188

雯 188

只 188

心 184

身 184

让 179

道 179

母 174

做 173

话 173

最 172

>>>

感谢各位的阅读!看完上述内容,你们对python统计文本中字频的方法大概了解了吗?希望文章内容对大家有所帮助。如果想了解更多相关文章内容,欢迎关注亿速云行业资讯频道。

转载地址:http://vvdoo.baihongyu.com/

你可能感兴趣的文章
[Hibernate] - EAGER and LAZY
查看>>
python 异常类型
查看>>
CentOS进入图形界面
查看>>
C#--web services之wsdl文件生成cs
查看>>
配置Apache+Tomcat实现SSO(单点登录)
查看>>
《Pro ASP.NET MVC 3 Framework》学习笔记之十五【示例项目SportsStore】
查看>>
Ext右键菜单完整版
查看>>
2012年1月凯立德地图普高清全分辨率懒人包P1750-D5616-2721J09(完美破解,已上路实测,永久下载地址)...
查看>>
SwipeBackActivity 的使用
查看>>
不停止MySQL服务增加从库的两种方式
查看>>
点击div折叠
查看>>
Sqli-LABS通关笔录-2
查看>>
hessian 在spring中的使用 (bean 如 Dao无法注入的问题)
查看>>
ccbpm工作流引擎是怎样支持多种流程模式的
查看>>
Unity打包android的apk与数据包.obb分离和apk签名
查看>>
hive 运行sqlclient异常
查看>>
Failed to execute goal org.apache.maven.plugins:maven-compiler-plugin:3.1:compile 解决办法
查看>>
maven中pom文件配置解决资源文件的编码问题
查看>>
Generative Adversarial Nets[LSGAN]
查看>>
Apache Nifi在Windows环境下搭建伪群集及证书登录
查看>>