Cassandra 组件
业务组件 用于按提供商归类那些将第三方服务接入 SkillFlaw 的组件。
本页介绍 Cassandra 业务组件中的可用组件,其中包括可对 Apache Cassandra 集群(例如 OSS Cassandra 和 Astra DB 数据库)进行读写的组件。
Cassandra vector store
你可以使用 Cassandra 组件通过 CassandraVectorStore 实例对基于 Cassandra 的向量存储进行读写。
About vector store instances
由于 SkillFlaw 基于 LangChain,向量存储组件会使用一个 LangChain 向量存储 实例来驱动底层的读写功能。 这些实例具有提供商特定性,并根据组件参数进行配置,例如连接字符串、索引名称和 schema。
在组件代码中,这通常会被实例化为 vector_store,但某些向量存储组件会使用其他名称,例如提供商名称。
有些 LangChain 类不会将所有可选项都暴露为组件参数。 根据提供商不同,这些选项可能使用默认值,或者在 SkillFlaw 支持的情况下通过环境变量进行修改。 有关具体选项,请参阅 LangChain API 参考和向量存储提供商文档。
如果你使用向量存储组件查询向量数据库,它会生成搜索结果,你可以将这些结果作为 Data 对象列表或表格形式的 DataFrame 传递给流程中的下游组件。
如果同时支持这两种类型,你可以在可视化编辑器中、向量存储组件输出端口附近设置输出格式。
如需了解在流程中使用向量数据库的教程,请参阅 Create a vector RAG chatbot。
Cassandra 参数
你可以查看向量存储组件的参数,以了解它接受哪些输入、支持哪些能力以及如何进行配置。
有些参数在可视化编辑器中默认处于隐藏状态。 你可以通过组件标题栏菜单中的 控件 来修改全部参数。
有些参数是条件参数,只有在你设置了其他参数,或为其他参数选择 了特定选项之后才会显示。 在满足所需依赖之前,条件参数可能不会出现在 控件 面板中。
关于可接受的取值和功能说明,请参阅 Vector search in Cassandra 或查看组件代码。
| Name | Type | Description |
|---|---|---|
| database_ref | String | 输入参数。数据库的 contact points,或 Astra 数据库 ID。 |
| username | String | 输入参数。数据库用户名。使用 Astra DB 时可留空。 |
| token | SecretString | 输入参数。数据库用户密码,或 Astra application token。 |
| keyspace | String | 输入参数。包含向量存储的 keyspace 名称,该向量存储由 Table Name (table_name) 指定。 |
| table_name | String | 输入参数。作为向量存储的表或 collection 名称。 |
| ttl_seconds | Integer | 输入参数。新增文本的生存时间(TTL),前提是集群支持。仅在写入时相关。 |
| batch_size | Integer | 输入参数。单个批次处理的记录数。 |
| setup_mode | String | 输入参数。用于设置 Cassandra 表的配置模式。 |
| cluster_kwargs | Dict | 输入参数。Cassandra 集群的其他关键字参数。 |
| search_query | String | 输入参数。相似度搜索的查询字符串。仅在读取时相关。 |
| ingest_data | Data | 输入参数。要作为原始分块和 embeddings 加载到向量存储中的数据。仅在写入时相关。 |
| embedding | Embeddings | 输入参数。要使 用的 embedding function。 |
| number_of_results | Integer | 输入参数。搜索返回的结果数量。仅在读取时相关。 |
| search_type | String | 输入参数。要执行的搜索类型。仅在读取时相关。 |
| search_score_threshold | Float | 输入参数。搜索结果的最小相似度分数。仅在读取时相关。 |
| search_filter | Dict | 输入参数。可选的元数据搜索过滤字典,会在向量搜索之外一并应用。仅在读取时相关。 |
| body_search | String | 输入参数。文档文本搜索词。仅在读取时相关。 |
| enable_body_search | Boolean | 输入参数。是否启用正文搜索。仅在读取时相关。 |
Cassandra Chat Memory
Cassandra Chat Memory 组件使用基于 Apache Cassandra 的数据库来检索和存储聊天消息。
聊天记忆会通过 Memory 数据类型在记忆存储组件之间传递。
具体来说,该组件会创建 CassandraChatMessageHistory 实例,这是一个使用 Cassandra 数据库存储消息的 LangChain 聊天消息历史类。
有关在流程中使用外部聊天记忆的更多信息,请参阅 Message History 组件。