wechat_articles 公众号文章收集器

搜索和读取微信公众号文章的完整工具,支持关键词搜索与全文提取。 **只要用户提到以下任何场景,必须使用此 skill:** (1) 搜索公众号文章、按关键词查找微信内容 (2) 读取、摘要、分析、翻译 mp.weixin.qq.com 链接的内容 (3) 用户说"帮我找公众号文章"、"读这篇微信文章"、"搜索公众...

安装

概览

wechat_articles 是一款专为开发者设计的微信公众号文章搜索与读取工具,旨在高效获取和解析微信公众平台上的公开内容。该工具支持通过关键词快速检索相关文章,并能够完整提取文章的标题、作者、发布时间及正文段落等关键信息。无论是需要批量抓取行业动态,还是即时分析单篇深度文章,它都能提供稳定可靠的支持。其核心优势在于双模式运行机制,兼顾速度与稳定性,满足不同场景下的使用需求。 该工具采用 Python 编写,提供了命令行接口和简洁的 Python API 两种调用方式,方便集成到自动化流程或数据分析项目中。对于普通用户而言,只需输入关键词即可获取匹配结果;而对于技术用户,则可通过编程方式灵活控制搜索数量、读取模式及错误处理逻辑。此外,工具内置智能切换机制,在简单页面优先使用轻量级方案,复杂情况自动启用浏览器级渲染,确保高成功率。 目前版本为 v1.0,已在多个实际项目中验证可用性。虽然搜索结果链接具有一定时效性,建议尽快读取以避免失效,但整体设计已充分考虑反爬防护与异常恢复能力。项目开源托管于 GitHub,欢迎社区贡献与反馈优化。

核心功能特点

  1. 支持按关键词搜索微信公众号文章,返回标题、摘要、链接及作者信息
  2. 可读取指定 URL 的完整文章内容,包括标题、公众号名称、发布时间和分段正文
  3. 提供 simple(快速)、playwright(稳定)和 auto(自动切换)三种读取模式
  4. Python API 设计简洁,易于集成到脚本或自动化工作流中
  5. 自动降级机制:simple 模式失败时无缝切换至 playwright 模式提升成功率
  6. 首次使用 playwright 需安装 Chromium,后续运行更加流畅

适用场景

该工具特别适合需要持续监控特定领域公众号内容的运营人员或研究人员。例如,新能源行业从业者可通过定期搜索“绿电直连政策”等关键词,快速收集最新政策解读与市场资讯,辅助决策制定。对于内容分析师而言,批量读取多篇文章并进行摘要、翻译或情感分析也极为便利。 在学术研究中,若需追踪某类主题的舆论演变趋势,wechat_articles 能高效抓取历史文章,构建时间序列语料库,为文本挖掘提供数据基础。此外,企业内训或知识管理场景中,也可用于沉淀外部优质公众号内容,形成内部参考资料库。 对于个人用户,当遇到一篇感兴趣的微信文章却无法直接复制粘贴全文时,只需粘贴链接即可一键提取核心内容,极大提升阅读效率。同时,其轻量化的 simple 模式适合高频次、低延迟的请求场景,而 playwright 模式则为复杂排版或依赖 JavaScript 渲染的页面提供保障,确保信息完整无误。