MongoDB
业务组件 用于按提供商归类那些将第三方服务接入 SkillFlaw 的组件。
本页介绍 MongoDB 业务组件中的可用组件。
MongoDB Atlas
MongoDB Atlas 组件使用 MongoDBAtlasVectorSearch 实例对 MongoDB Atlas vector store 执行读写操作。
关于向量存储实例
由于 SkillFlaw 基于 LangChain,向量存储组件会使用一个 LangChain 向量存储 实例来驱动底层的读写功能。 这些实例具有提供商特定性,并根据组件参数进行配置,例如连接字符串、索引名称和 schema。
在组件代码中,这通常会被实例化为 vector_store,但某些向量存储组件会使用其他名称,例如提供商名称。
有些 LangChain 类不会将所有可选项都暴露为组件参数。 根据提供商不同,这些选项可能使用默认值,或者在 SkillFlaw 支持的情况下通过环境变量进行修改。 有关具体选项,请参阅 LangChain API 参考和向量存储提供商文档。
如果你使用向量存储组件查询向量数据库,它会生成搜索结果,你可以将这些结果作为 Data 对象列表或表格形式的 DataFrame 传递给流程中的下游组件。
如果同时支持这两种类型,你可以在可视化编辑器中、向量存储组件输出端口附近设置输出格式。
MongoDB Atlas 参数
你可以查看向量存储组件的参数,以了解它接受哪些输入、支持哪些能力,以及应如何进行配置。
有些参数在可视化编辑器中默认处于隐藏状态。 你可以通过组件标题栏菜单中的 控件 来修改全部参数。
有些参数是条件参数,只有在你设置了其他参数,或为其他参数选择了特定选项之后才会显示。 在满足所需依赖之前,条件参数可能不会出现在 控件 面板中。
关于可接受的取值和具体功能,请参阅 MongoDB Atlas documentation 或查看组件代码。
| Name | Type | Description |
|---|---|---|
| mongodb_atlas_cluster_uri | SecretString | 输入参数。你的 MongoDB Atlas cluster 的连接 URI。必填。 |
| enable_mtls | Boolean | 输入参数。是否启用双向 TLS 认证。默认:false。 |
| mongodb_atlas_client_cert | SecretString | 输入参数。用 于 mTLS 认证的客户端证书与私钥组合内容。启用 mTLS 时必填。 |
| db_name | String | 输入参数。要使用的数据库名称。必填。 |
| collection_name | String | 输入参数。要使用的 collection 名称。必填。 |
| index_name | String | 输入参数。Atlas Search 索引名称,应为 Vector Search 索引。必填。 |
| insert_mode | String | 输入参数。向 collection 中插入新文档的方式。可选值为 "append" 或 "overwrite"。默认:"append"。 |
| embedding | Embeddings | 输入参数。要使用的 embedding model。 |
| number_of_results | Integer | 输入参数。相似度搜索返回结果的数量。默认:4。 |
| index_field | String | 输入参数。要建立索引的字段。默认:"embedding"。 |
| filter_field | String | 输入参数。用于过滤索引的字段。 |
| number_dimensions | Integer | 输入参数。embedding 向量维度数量。默认:1536。 |
| similarity | String | 输入参数。衡量向量相似度的方法。可选值为 "cosine"、"euclidean" 或 "dotProduct"。默认:"cosine"。 |
| quantization | String | 输入参数。Quantization 通过将 32 位浮点数转换为更小的数据类型来降低内存成本。可选值为 "scalar" 或 "binary"。 |