Web Fetch

web_fetch 用来抓取网页内容并返回可读文本。它更像“页面抓取工具”，不是“通用 API 客户端”。

功能说明

仅接受 http:// 或 https://
默认会跟随重定向
默认会把 HTML 提取成正文文本
会返回状态码、headers、最终 URL 和正文
默认阻止私有网段和 loopback 地址

参数

除了必填的 url，实现里还支持这些常用参数：

参数	说明
`method`	默认 `GET`，也支持 `POST`、`PUT`、`PATCH`、`DELETE`、`HEAD`
`headers`	JSON 对象形式的请求头
`params`	JSON 对象形式的 query 参数
`body`	请求体
`timeout`	超时秒数
`max_bytes`	最大返回字节数
`follow_redirects`	是否跟随跳转
`extract_text`	对 HTML 是否提取正文文本
`user_agent`	自定义 User-Agent

配置

tools:
  web_fetch:
    enabled: true
    timeout: 20
    max_bytes: 200000
    follow_redirects: true
    user_agent: "MushroomAgent web_fetch/1.0"
    allow_private_networks: false

使用场景

抓公开网页正文
拉取文档、公告、静态 HTML 页面
不需要复杂认证和 API 语义时

如果你要访问结构化 HTTP 接口、内网服务、或者需要精确控制 API path，优先看 API Request。

功能说明​

参数​

配置​

使用场景​

功能说明

参数

配置

使用场景