Reddit Archive

下载并归档来自指定用户或子版块的Reddit帖子(含图片、GIF和视频),支持筛选与排序。

安装

概览

Reddit Archive 是一个专为内容归档设计的自动化工具,能够高效抓取并保存来自 Reddit 平台指定用户或子版块的帖子内容。该脚本支持下载包括图片、GIF 和视频在内的多种媒体类型,适用于需要长期保存网络社区内容的个人或研究者。通过调用 Reddit 原生 JSON API,它可绕过复杂的前端交互,直接获取结构化数据,确保信息提取的完整性与一致性。工具内置智能依赖管理,首次运行时会自动检测并安装所需 Python 库(如 requests 和 yt-dlp),用户无需手动配置环境即可快速上手。其输出结构清晰,按媒体类型分类存储,便于后续检索与管理。整体设计兼顾易用性与功能性,是数字存档爱好者的实用选择。

核心功能特点

  1. 支持从特定用户(u/username)或子版块(r/subname)批量下载 Reddit 帖子
  2. 可下载图片(JPG/PNG/WebP)、GIF 及视频内容,涵盖 gfycat、redgifs、imgur 等平台
  3. 提供灵活的排序与筛选机制:支持 hot、new、rising、top、controversial 等多种排序方式,并可按时间范围过滤内容
  4. 具备日期范围控制功能,允许设置起始与结束日期(YYYY-MM-DD格式)进行精准归档
  5. 自动跳过已下载文件,避免重复工作,提升效率;同时支持自定义输出目录与并行下载线程数优化速度

适用场景

Reddit Archive 特别适合需要系统性保存网络文化资产的用户群体。例如,研究人员在进行社交媒体行为分析时,可通过该工具批量采集某活跃用户在特定时间段内发布的内容,用于追踪兴趣演变或情绪趋势。创作者或社群管理者也可利用此脚本定期备份热门子版块的动态,防止因平台政策变动导致历史内容丢失。此外,对于收藏爱好者而言,它能一键归档喜爱的 GIF 动图或高质量摄影作品,构建个人数字素材库。无论是出于学术目的、内容策展还是纯粹的数据留存,该工具都提供了可靠且低门槛的技术路径,让用户摆脱手动浏览和截图的繁琐流程。