📜  计算文件中单词的频率 - Python (1)

📅  最后修改于: 2023-12-03 15:12:03.010000             🧑  作者: Mango

计算文件中单词的频率 - Python

本文介绍如何使用Python计算文件中单词的频率。主要思路是读取文件内容,分割成单个单词,计算每个单词的出现次数,最后输出结果。

读取文件内容

使用Python内置的open()函数可以打开文件并读取文件内容。以下是打开文件并读取文件内容的示例代码:

with open('file.txt') as f:
    content = f.read()

其中,file.txt是你要读取的文件路径,可以自己设置。with语句可以自动关闭文件,避免文件资源泄漏。

分割单词

读取了文件内容之后,需要将文件内容分割成单个单词。使用Python内置的split()函数可以按照空格将文件内容分割成单个单词。以下是将文件内容分割成单个单词的示例代码:

words = content.split()
计算单词频率

将文件内容分割成单个单词之后,需要计算每个单词的出现次数。使用Python内置的collections模块下的Counter()函数可以快速计算出每个单词的出现次数。以下是计算单词频率的示例代码:

from collections import Counter

word_counts = Counter(words)
输出结果

最后,我们需要将结果输出。可以使用Python内置的print()函数将结果输出到控制台。以下是将结果输出到控制台的示例代码:

for word, count in word_counts.items():
    print(f'{word}: {count}')

输出的结果将会是每个单词和它的出现次数。

完整代码示例
from collections import Counter

with open('file.txt') as f:
    content = f.read()

words = content.split()
word_counts = Counter(words)

for word, count in word_counts.items():
    print(f'{word}: {count}')

以上是计算文件中单词频率的Python示例代码。使用这个代码,你可以快速计算任何文本文件中的单词出现频率。