跳到主要内容

Apify 组件

Apify 是一个网页抓取与数据提取平台,提供超过 3,000 个可直接使用的云端工具,称为 Actors

你的流程可以使用 Apify Actors 组件来运行 Actors,完成数据提取、内容分析、SQL 操作等任务。

在流程中使用 Apify Actors 组件

  1. Apify Actors 组件添加到你的流程中,然后按如下方式进行配置:

    • Apify Token:输入你的 Apify API token
    • Actor:输入你要运行的 Apify Actor Store 中 Actor 的 ID。例如,Website Content Crawler 的 Actor ID 是 apify/website-content-crawler
    • Run Input:输入用于配置 Actor 运行的 JSON input
    • 根据你选择的 Actor 和具体用例,配置其他附加参数与命令。
  2. 将该组件与流程中的其他组件连接起来。 该组件既可以作为流程中的独立步骤执行任务,也可以作为 agent 的工具使用。

    若要为该组件启用 Tool Mode,请将组件的输出类型从 Output 改为 Tool,然后把它连接到 Agent 组件的 Tools 端口。

    Apify Actors 组件会将 Actor 运行结果作为 JSON 对象,以 SkillFlaw 的 Data 类型 输出。

Apify Actors 流程示例

以下场景展示了你可以在 SkillFlaw 中使用 Apify Actors 组件的一些方式:

  • 以 Markdown 提取网站文本内容:使用 Website Content Crawler Actor 从网站提取 Markdown 格式的文本内容,然后将 Output 连接到 Parser 组件的输入,以便进一步处理。

    Apify Flow - Website Content Crawler

  • 使用 agent 处理网页内容:将 Website Content Crawler Actor 作为工具连接到 Agent 组件,让 agent 根据聊天输入自行决定是否提取网站内容。agent 可以使用提取的数据生成摘要、洞察或结构化响应,使信息更易于使用。

    Apify Agent Flow - Simple

  • 通过多个 actors 分析社交媒体资料:借助多个 Apify Actors 执行更全面的社交媒体研究:

    • 使用 Google Search Results Scraper Actor 查找相关社交媒体资料。
    • 使用 TikTok Data Extractor Actor 收集数据和视频。
    • 将这两个 actor 都作为 Agent 组件的工具使用,让 agent 收集来自 Google 的链接和来自 TikTok 的内容,然后分析数据并提供关于某个人、品牌或主题的洞察。

    Apify Agent Flow