Apify 组件
Apify 是一个网页抓取与数据提取平台,提供超过 3,000 个可直接使用的云端工具,称为 Actors。
你的流程可以使用 Apify Actors 组件来运行 Actors,完成数据提取、内容分析、SQL 操作等任务。
在流程中使用 Apify Actors 组件
-
将 Apify Actors 组件添加到你的流程中,然后按如下方式进行配置:
- Apify Token:输入你的 Apify API token。
- Actor:输入你要运行的 Apify Actor Store 中 Actor 的 ID。例如,Website Content Crawler 的 Actor ID 是
apify/website-content-crawler。 - Run Input:输入用于配置 Actor 运行的 JSON input。
- 根据你选择的 Actor 和具体用例,配置其他附加参数与命令。
-
将该组件与流程中的其他组件连接起来。 该组件既可以作为流程中的独立步骤执行任务,也可以作为 agent 的工具使用。
若要为该组件启用 Tool Mode,请将组件的输出类型从 Output 改为 Tool,然后把它连接到 Agent 组件的 Tools 端口。
Apify Actors 组件会将 Actor 运行结果作为 JSON 对象,以 SkillFlaw 的
Data类型 输出。
Apify Actors 流程示例
以下场景展示了你可以在 SkillFlaw 中使用 Apify Actors 组件的一些方式:
-
以 Markdown 提取网站文本内容:使用 Website Content Crawler Actor 从网站提取 Markdown 格式的文本内容,然后将 Output 连接到 Parser 组件的输入,以便进一步处理。

-
使用 agent 处理网页内容:将 Website Content Crawler Actor 作为工具连接到 Agent 组件,让 agent 根据聊天输入自行决定是否提取网站内容。agent 可以使用提取的数据生成摘要、洞察或结构化响应,使信息更易于使用。

-
通过多个 actors 分析社交媒体资料:借助多个 Apify Actors 执行更全面的社交媒体研究:
- 使用 Google Search Results Scraper Actor 查找相关社交媒体资料。
- 使用 TikTok Data Extractor Actor 收集数据和视频。
- 将这两个 actor 都作为 Agent 组件的工具使用,让 agent 收集来自 Google 的链接和来自 TikTok 的内容,然后分析数据并提供关于某个人、品牌或主题的洞 察。
