计算文件中单词的频率 - Python (1)

📌 相关文章

📜 计算文件中单词的频率 - Python (1)

📅 最后修改于: 2023-12-03 15:12:03.010000 🧑 作者: Mango

计算文件中单词的频率 - Python

本文介绍如何使用Python计算文件中单词的频率。主要思路是读取文件内容，分割成单个单词，计算每个单词的出现次数，最后输出结果。

读取文件内容

使用Python内置的open()函数可以打开文件并读取文件内容。以下是打开文件并读取文件内容的示例代码：

with open('file.txt') as f:
    content = f.read()

其中，file.txt是你要读取的文件路径，可以自己设置。with语句可以自动关闭文件，避免文件资源泄漏。

分割单词

读取了文件内容之后，需要将文件内容分割成单个单词。使用Python内置的split()函数可以按照空格将文件内容分割成单个单词。以下是将文件内容分割成单个单词的示例代码：

words = content.split()

计算单词频率

将文件内容分割成单个单词之后，需要计算每个单词的出现次数。使用Python内置的collections模块下的Counter()函数可以快速计算出每个单词的出现次数。以下是计算单词频率的示例代码：

from collections import Counter

word_counts = Counter(words)

输出结果

最后，我们需要将结果输出。可以使用Python内置的print()函数将结果输出到控制台。以下是将结果输出到控制台的示例代码：

for word, count in word_counts.items():
    print(f'{word}: {count}')

输出的结果将会是每个单词和它的出现次数。

完整代码示例

from collections import Counter

with open('file.txt') as f:
    content = f.read()

words = content.split()
word_counts = Counter(words)

for word, count in word_counts.items():
    print(f'{word}: {count}')

以上是计算文件中单词频率的Python示例代码。使用这个代码，你可以快速计算任何文本文件中的单词出现频率。