跳到主要内容

FAISS

Bundles 按提供方对组件进行分组,这些组件可将第三方服务与 SkillFlaw 集成。

本页介绍 FAISS bundle 中可用的组件。

FAISS 向量存储

FAISS 组件通过 FAISS 向量存储实例提供对 Facebook AI Similarity Search(FAISS)库的访问。

关于向量存储实例

由于 SkillFlaw 基于 LangChain,向量存储组件会使用一个 LangChain 向量存储 实例来驱动底层的读写功能。 这些实例具有提供商特定性,并根据组件参数进行配置,例如连接字符串、索引名称和 schema。

在组件代码中,这通常会被实例化为 vector_store,但某些向量存储组件会使用其他名称,例如提供商名称。

有些 LangChain 类不会将所有可选项都暴露为组件参数。 根据提供商不同,这些选项可能使用默认值,或者在 SkillFlaw 支持的情况下通过环境变量进行修改。 有关具体选项,请参阅 LangChain API 参考和向量存储提供商文档。

如果你使用向量存储组件查询向量数据库,它会生成搜索结果,你可以将这些结果作为 Data 对象列表或表格形式的 DataFrame 传递给流程中的下游组件。 如果同时支持这两种类型,你可以在可视化编辑器中、向量存储组件输出端口附近设置输出格式。

FAISS 向量存储参数

你可以查看向量存储组件的参数,以了解它可接受的输入、支持的功能以及配置方式。

有些参数在可视化编辑器中默认处于隐藏状态。 你可以通过组件标题栏菜单中的 控件 来修改全部参数。

有些参数是条件参数,只有在你设置了其他参数,或为其他参数选择了特定选项之后才会显示。 在满足所需依赖之前,条件参数可能不会出现在 控件 面板中。

有关可接受值和功能的信息,请参见 FAISS documentation 或查看组件代码

NameTypeDescription
index_nameString输入参数。FAISS index 的名称。默认值:组件内置的 index 名称。
persist_directoryString输入参数。保存 FAISS index 的路径。该路径相对于 SkillFlaw 的运行位置。
search_queryString输入参数。要在向量存储中搜索的查询。
ingest_dataData输入参数。要导入向量存储的数据列表。
allow_dangerous_deserializationBoolean输入参数。设置为 True 以允许从不受信任的来源加载 pickle 文件。默认值:True
embeddingEmbeddings输入参数。向量存储要使用的 embedding 函数。
number_of_resultsInteger输入参数。搜索返回的结果数。默认值:4。