全球主机交流论坛
标题:
强烈推荐网站镜像离线工具 httrack
[打印本页]
作者:
layui
时间:
2025-3-21 20:17
标题:
强烈推荐网站镜像离线工具 httrack
macOS brew 快速安装:brew install httrack
命令:
httrack "https://anime-86.com" -O ~/Downloads/anime-86-site -c8 \
--user-agent "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/18.4 Safari/605.1.15"
复制代码
目标网站:https://anime-86.com
缓存本地目录:~/Downloads/anime-86-site
下载线程数8:-c8
以前使用wget下载工具,部份动态网页会出问题。比如:
https://anime-86.com/news/
https://anime-86.com/story/
复制代码
wget 本地文件:
index.html
story?id=01
story?id=02
story?id=03
...
复制代码
httrack 本地网页:
index.html
index0b48.html
index1ffe.html
index2e5f.html
...
复制代码
ChatGPT:
httrack 常用参数说明
基本参数
-O <目录>
- 指定存储目录
-c<N>
- 设置并发连接数(默认 3,建议 4-8)
--user-agent "<字符串>"
- 伪装浏览器标识(User-Agent)
--mirror
- 仅下载网站,不解析本地文件
--get-files
- 仅下载单个文件,而不是整个网站
--update
- 增量更新已下载的网站
--continue
- 继续中断的下载
网络相关
--proxy <proxy:port>
- 使用代理服务器下载
--disable-security-limits
- 解除速度限制
--sockets=N
- 设置最大同时连接数
-D
- 只下载与主域匹配的链接(避免外链)
-%v
- 强制重新下载所有文件(忽略缓存)
过滤规则
+*.jpg +*.png +*.gif
- 仅下载指定格式的文件
-ad.doubleclick.net/*
- 排除特定域名的资源
--depth=N
- 限制下载深度
--max-size=N
- 限制最大文件大小
--near
- 尝试下载所有 HTML 引用的图片等资源
示例命令
httrack "https://www.example.com" -O ~/Downloads/example-site -c8 --user-agent "Mozilla/5.0"
复制代码
作者:
layui
时间:
2025-3-21 20:19
检索论坛信息,原来早在2018年就有人推荐过了
https://www.iloc.eu.org/thread-433819-1-1.html
欢迎光临 全球主机交流论坛 (https://www.iloc.eu.org/)
Powered by Discuz! X3.4