📌  相关文章
📜  Python程序,用于查找字符串中所有单词的开始和结束索引(1)

📅  最后修改于: 2023-12-03 15:19:35.718000             🧑  作者: Mango

Python程序,用于查找字符串中所有单词的开始和结束索引

本程序可以帮助你在Python中查找一个字符串中所有单词的开始和结束索引。

代码实现
import re

def find_word_indexes(text):
    # 使用正则表达式匹配所有单词
    word_regex = re.compile(r'\b\w+\b')
    words = word_regex.findall(text)

    # 记录每个单词在原始字符串中的开始和结束索引
    word_indexes = []
    for word in words:
        start_index = text.index(word)
        end_index = start_index + len(word)
        word_indexes.append((start_index, end_index))

    return word_indexes
使用方法
text = "This is a sample text, containing multiple words."
word_indexes = find_word_indexes(text)
print(word_indexes)
# 输出: [(0, 4), (5, 7), (9, 10), (12, 18), (20, 25), (27, 35), (36, 39)]
代码解析
  • 正则表达式:使用正则表达式\b\w+\b匹配所有单词,其中\b表示单词边界,\w+表示一个或多个字母或数字。
  • 开始和结束索引:使用Python内置方法str.index获取每个单词在原始字符串中的开始索引,使用len(word)获取单词的长度,从而得到单词的结束索引。
  • 返回值:将每个单词的开始和结束索引记录在一个列表中,并返回该列表。

以上是本程序的代码实现和使用方法,有需要的程序员可以根据自己的需要进行使用和修改。