网页搜索
Web Search 组件把 Web Search、News Search 和 RSS Reader 三个组件整合成了一个多模式组件。 你可以通过同一个组件执行网页搜索(DuckDuckGo)、Google News 新闻搜索,或者读取 RSS 源。
如需使用其他搜索 API,请参阅 业务组件。
Web Search 组件依赖网页抓取,因此可能受到速率限制。
如果你要在生产环境中使用,建议考虑改用 API 支持更稳定的搜索组件,例如特定提供商的业务组件。
在流程中使用 Web Search
下面是一种将 Web Search 用在流程中的常见方式:
-
基于 Basic Prompting 模板创建 一个流程。
-
添加一个 Web Search 组件,选择你需要的 Search Mode(Web、News 或 RSS),然后填写搜索关键词或 RSS 源地址。
-
添加一个 Type Convert 组件,将 Output Type 设为 Message,再把 Web Search 的输出连接到 Type Convert 的输入。
默认情况下,Web Search 输出的是
DataFrame。 由于 Prompt Template 只能接收Message,因此这里必须先做一次转换,才能把搜索结果传给 Prompt Template。 更多说明请参阅 Web Search 输出。 -
在 Prompt Template 的 Template 字段中加入一个变量,例如
{searchresults}或{context}。这样会在 Prompt Template 组件上生成一个对应字段,用于接收转换后的搜索结果。 更多说明请参阅在 Prompt 中定义变量。
-
将 Type Convert 的输出连接到 Prompt Template 上新生成的变量字段。

-
在 Language Model 组件中填入 OpenAI API Key,或切换到其他提供商和模型。
-
打开 Playground,输入你的查询问题。
LLM 会结合 Prompt Template 传入的搜索上下文,一并处理请求,然后在 Playground 聊天界面中输出结果。
结果
下方只是一个可能的示例结果。 实际输出会受网页当前内容、你的查询、所选模型等因素影响。
_10Here are some of the latest news articles related to the environment:_10Ozone Pollution and Global Warming: A recent study highlights that ozone pollution is a significant global environmental concern, threatening human health and crop production while exacerbating global warming. Read more_10...
参数
有些参数在可视化编辑器中默认处于隐藏状态。 你可以通过组件标题栏菜单中的 控件 来修改全部参数。
- Web Search 模式
- News Search 模式
- RSS Reader 模式
| Name | Display Name | Info |
|---|---|---|
| search_mode | Search Mode | 输入参数。选择搜索模式:Web(DuckDuckGo)、News(Google News)或 RSS(Feed Reader)。默认:Web。 |
| query | Search Query | 输入参数。搜索关键词。 |
| timeout | Timeout | 输入参数。网页搜索请求超时时间(秒)。默认:5。 |
| results | Results | 输出参数。返回一个 DataFrame,其中包含 title、link、snippet 和 content。更多说明请参阅 Web Search 输出。 |
| Name | Display Name | Info |
|---|---|---|
| search_mode | Search Mode | 输入参数。选择搜索模式:Web(DuckDuckGo)、News(Google News)或 RSS(Feed Reader)。默认:Web。 |
| query | Search Query | 输入参数。新闻搜索关键词。 |
| hl | Language (hl) | 输入参数。语言代码,例如 en-US、fr、de。默认:en-US。 |
| gl | Country (gl) | 输入参数。国家代码,例如 US、FR、DE。默认:US。 |
| ceid | Country:Language (ceid) | 输入参数。国家与语言组合,例如 US:en、FR:fr。默认:US:en。 |
| topic | Topic | 输入参数。可选值包括:WORLD、NATION、BUSINESS、TECHNOLOGY、ENTERTAINMENT、SCIENCE、SPORTS、HEALTH。 |
| location | Location (Geo) | 输入参数。用于地理位置相关新闻的城市、州或国家;留空时按关键词搜索。 |
| timeout | Timeout | 输入参数。请求超时时间(秒)。默认:5。 |
| results | Results | 输出参数。返回一个 DataFrame,关键列包括 title、link、published 和 summary。更多说明请参阅 Web Search 输出。 |
| Name | Display Name | Info |
|---|---|---|
| search_mode | Search Mode | 输入参数。选择搜索模式:Web(DuckDuckGo)、News(Google News)或 RSS(Feed Reader)。默认:Web。 |
| query | RSS Feed URL | 输入参数。要解析的 RSS 源地址,例如 https://rss.nytimes.com/services/xml/rss/nyt/HomePage.xml。 |
| timeout | Timeout | 输入参数。RSS 请求超时时间(秒)。默认:5。 |
| results | Results | 输出参数。返回一个 DataFrame,关键 列包括 title、link、published 和 summary。更多说明请参阅 Web Search 输出。 |
Web Search 输出
Web Search 组件会根据不同搜索模式输出不同列结构的 DataFrame。
- Web Search 模式
- News Search 模式
- RSS Reader 模式
在 Web 模式下,组件返回的 DataFrame 包含:
title:搜索结果标题link:搜索结果 URLsnippet:搜索结果摘要content:页面全文内容(若成功抓取)
在 News 模式下,组件返回的 DataFrame 包含:
title:新闻标题link:新闻链接published:发布时间summary:新闻摘要或描述
在 RSS 模式下,组件返回的 DataFrame 包含:
title:RSS 条目标题link:RSS 条目链接published:条目发布时间summary:条目摘要或描述