📜  使用 GetOldTweets3 提取推文(1)

📅  最后修改于: 2023-12-03 15:22:11.632000             🧑  作者: Mango

使用 GetOldTweets3 提取推文

GetOldTweets3 是一个用 Python 编写的开源库,用于从 Twitter 抓取历史推文。它提供了一个易于使用的接口和丰富的配置选项,可以让我们快速、简便地获取所需的推文数据。

安装

在开始使用 GetOldTweets3 之前,需要先安装它。可以在命令行中使用以下命令安装 GetOldTweets3:

pip install GetOldTweets3
示例

下面是一个使用 GetOldTweets3 获取推文的示例。假设我们要获取 @realDonaldTrump 在 2021 年 1 月 1 日至 2021 年 1 月 10 日发布的推文数据,代码如下:

import GetOldTweets3 as got
from datetime import datetime, timedelta

# 定义时间段
start_date = datetime(2021, 1, 1)
end_date = datetime(2021, 1, 10)

# 配置并执行查询
tweetCriteria = got.manager.TweetCriteria().setUsername('realDonaldTrump')\
                                           .setSince(start_date.strftime('%Y-%m-%d'))\
                                           .setUntil(end_date.strftime('%Y-%m-%d'))\
                                           .setMaxTweets(100)
tweets = got.manager.TweetManager.getTweets(tweetCriteria)

# 输出结果
for tweet in tweets:
    print(tweet.text)
    print('---')

在上面的示例中,我们首先定义了要查询的时间段(1 月 1 日至 1 月 10 日),然后使用 setUsernamesetSincesetUntilsetMaxTweets 方法来设置查询条件。getTweets 方法会执行查询,并返回符合条件的推文数据。最后,我们使用一个简单的循环来显示所获取的推文内容。

配置选项

除了上述示例中使用的查询条件,GetOldTweets3 还提供了许多其他的配置选项,可以让我们更精确地获取所需的推文数据。以下列出了一些常用的选项:

  • setUsername:指定要查询的 Twitter 用户名;
  • setQuerySearch:指定要查询的关键词;
  • setSince:指定要查询的起始日期;
  • setUntil:指定要查询的结束日期;
  • setMaxTweets:指定要获取的最大推文数;
  • setLang:指定要查询的语言;
  • setTopTweets:仅获取热门推文而非所有推文;
  • setEmoji:保留或过滤 Emoji 表情符号;
  • setEmojiUnicode:保留或过滤 Emoji Unicode 码。

完整的配置选项列表可以参考 GetOldTweets3 的官方文档。

总结

本文介绍了如何使用 GetOldTweets3 提取推文数据,并列举了一些常用的配置选项,希望对你有所帮助。如果你需要获取 Twitter 的历史数据,可以尝试使用 GetOldTweets3 这个强大的工具。