使用 Github Actions 自动抓取英文杂志,提供 PDF 与 EPUB 两种格式。抓取结果保存在 magzines 分支中。
如果你想拥有自己的抓取副本,请先 Fork 本仓库。
- Fork 本仓库到你的个人账号。
- 进入你 Fork 后的仓库,点击 Actions 并点击 I understand my workflows, go ahead and enable them 以启用工作流。
- 确保你的仓库中存在
magzines分支(Fork 时默认会包含,该分支用于存放生成的电子书)。
- 进入仓库的 Actions 选项卡。
- 在左侧选择对应的杂志工作流(如
The Economist)。 - 点击右侧的 Run workflow 下拉按钮。
- 在弹出框中输入 Issue Date (格式:
YYYY-MM-DD)。- 注:TIME 杂志输入的是 URL。
- 提示:经济学人(对齐到周六)和纽约客(对齐到周一)会自动将你输入的日期对齐到最近的出版日。
- 点击 Run workflow 开始运行。
2. 本地命令行触发 (需要安装 act)
如果你想在本地机器上运行抓取任务(结果会同步到 magzines 分支),可以使用提供的脚本:
# 赋予执行权限
chmod +x run_local.sh
# 抓取最新一期 (需要配置 .secrets 或传 Token)
./run_local.sh te
# 抓取指定日期
./run_local.sh te 你的GITHUB_TOKEN 2024-05-04提示:建议在本地创建
.secrets文件并填写GITHUB_TOKEN=你的Token,这样运行脚本时无需重复输入 Token。
本项目基于以下技术构建:
- 核心引擎:Calibre - 强大的电子书管理与转换工具,利用其内置的 Recipe 系统进行网页抓取。
- 自动化:GitHub Actions - 实现每日定时自动抓取与推送。
- 网络优化:集成 Cloudflare WARP 以优化抓取时的网络环境。