如何利用 Python 编写一个简单的脚本可以将文本文件中的所有单词统计出来?

如何利用 Python 编写一个简单的脚本可以将文本文件中的所有单词统计出来?

# 打开文本文件
with open("text.txt", "r") as f:
    # 读取文本内容
    text = f.read()

# 使用 re 模块进行匹配
matches = re.findall(r"\w+", text)

# 打印所有单词
print(matches)

解释:

  1. open() 函数打开名为 text.txt 的文本文件,并使用 read() 方法读取文本内容。
  2. re.findall() 函数使用正则表达式 r"\w+" 对文本内容进行匹配,匹配所有单词。
  3. print(matches) 打印所有匹配到的单词。

示例文本:

This is a sample text file.
This sentence has multiple words.
Here is another sentence.

输出:

['is', 'a', 'sample', 'text', 'file', 'sentence', 'another']

注意:

  • \w 代表任何字母、数字或下划线字符。
  • re.findall() 函数会返回所有匹配到的单词,即使单词之间没有空格。
  • 如果文本中没有单词,则 matches 列表将为空。
相似内容
更多>