跳到主要内容

网页搜索

Web Search 组件把 Web SearchNews SearchRSS Reader 三个组件整合成了一个多模式组件。 你可以通过同一个组件执行网页搜索(DuckDuckGo)、Google News 新闻搜索,或者读取 RSS 源。

如需使用其他搜索 API,请参阅 业务组件

信息

Web Search 组件依赖网页抓取,因此可能受到速率限制。

如果你要在生产环境中使用,建议考虑改用 API 支持更稳定的搜索组件,例如特定提供商的业务组件。

下面是一种将 Web Search 用在流程中的常见方式:

  1. 基于 Basic Prompting 模板创建一个流程。

  2. 添加一个 Web Search 组件,选择你需要的 Search Mode(Web、News 或 RSS),然后填写搜索关键词或 RSS 源地址。

  3. 添加一个 Type Convert 组件,将 Output Type 设为 Message,再把 Web Search 的输出连接到 Type Convert 的输入。

    默认情况下,Web Search 输出的是 DataFrame。 由于 Prompt Template 只能接收 Message,因此这里必须先做一次转换,才能把搜索结果传给 Prompt Template。 更多说明请参阅 Web Search 输出

  4. Prompt TemplateTemplate 字段中加入一个变量,例如 {searchresults}{context}

    这样会在 Prompt Template 组件上生成一个对应字段,用于接收转换后的搜索结果。 更多说明请参阅在 Prompt 中定义变量

  5. Type Convert 的输出连接到 Prompt Template 上新生成的变量字段。

    Type convert web search output to chat

  6. Language Model 组件中填入 OpenAI API Key,或切换到其他提供商和模型。

  7. 打开 Playground,输入你的查询问题。

    LLM 会结合 Prompt Template 传入的搜索上下文,一并处理请求,然后在 Playground 聊天界面中输出结果。

    结果

    下方只是一个可能的示例结果。 实际输出会受网页当前内容、你的查询、所选模型等因素影响。


    _10
    Here are some of the latest news articles related to the environment:
    _10
    Ozone Pollution and Global Warming: A recent study highlights that ozone pollution is a significant global environmental concern, threatening human health and crop production while exacerbating global warming. Read more
    _10
    ...

参数

有些参数在可视化编辑器中默认处于隐藏状态。 你可以通过组件标题栏菜单中的 控件 来修改全部参数。

NameDisplay NameInfo
search_modeSearch Mode输入参数。选择搜索模式:Web(DuckDuckGo)、News(Google News)或 RSS(Feed Reader)。默认:Web
querySearch Query输入参数。搜索关键词。
timeoutTimeout输入参数。网页搜索请求超时时间(秒)。默认:5
resultsResults输出参数。返回一个 DataFrame,其中包含 titlelinksnippetcontent。更多说明请参阅 Web Search 输出

Web Search 输出

Web Search 组件会根据不同搜索模式输出不同列结构的 DataFrame

Web 模式下,组件返回的 DataFrame 包含:

  • title:搜索结果标题
  • link:搜索结果 URL
  • snippet:搜索结果摘要
  • content:页面全文内容(若成功抓取)