跳到主要内容

Cassandra 组件

业务组件 用于按提供商归类那些将第三方服务接入 SkillFlaw 的组件。

本页介绍 Cassandra 业务组件中的可用组件,其中包括可对 Apache Cassandra 集群(例如 OSS Cassandra 和 Astra DB 数据库)进行读写的组件。

Cassandra vector store

你可以使用 Cassandra 组件通过 CassandraVectorStore 实例对基于 Cassandra 的向量存储进行读写。

About vector store instances

由于 SkillFlaw 基于 LangChain,向量存储组件会使用一个 LangChain 向量存储 实例来驱动底层的读写功能。 这些实例具有提供商特定性,并根据组件参数进行配置,例如连接字符串、索引名称和 schema。

在组件代码中,这通常会被实例化为 vector_store,但某些向量存储组件会使用其他名称,例如提供商名称。

有些 LangChain 类不会将所有可选项都暴露为组件参数。 根据提供商不同,这些选项可能使用默认值,或者在 SkillFlaw 支持的情况下通过环境变量进行修改。 有关具体选项,请参阅 LangChain API 参考和向量存储提供商文档。

如果你使用向量存储组件查询向量数据库,它会生成搜索结果,你可以将这些结果作为 Data 对象列表或表格形式的 DataFrame 传递给流程中的下游组件。 如果同时支持这两种类型,你可以在可视化编辑器中、向量存储组件输出端口附近设置输出格式。

提示

如需了解在流程中使用向量数据库的教程,请参阅 Create a vector RAG chatbot

Cassandra 参数

你可以查看向量存储组件的参数,以了解它接受哪些输入、支持哪些能力以及如何进行配置。

有些参数在可视化编辑器中默认处于隐藏状态。 你可以通过组件标题栏菜单中的 控件 来修改全部参数。

有些参数是条件参数,只有在你设置了其他参数,或为其他参数选择了特定选项之后才会显示。 在满足所需依赖之前,条件参数可能不会出现在 控件 面板中。

关于可接受的取值和功能说明,请参阅 Vector search in Cassandra 或查看组件代码

NameTypeDescription
database_refString输入参数。数据库的 contact points,或 Astra 数据库 ID。
usernameString输入参数。数据库用户名。使用 Astra DB 时可留空。
tokenSecretString输入参数。数据库用户密码,或 Astra application token。
keyspaceString输入参数。包含向量存储的 keyspace 名称,该向量存储由 Table Name (table_name) 指定。
table_nameString输入参数。作为向量存储的表或 collection 名称。
ttl_secondsInteger输入参数。新增文本的生存时间(TTL),前提是集群支持。仅在写入时相关。
batch_sizeInteger输入参数。单个批次处理的记录数。
setup_modeString输入参数。用于设置 Cassandra 表的配置模式。
cluster_kwargsDict输入参数。Cassandra 集群的其他关键字参数。
search_queryString输入参数。相似度搜索的查询字符串。仅在读取时相关。
ingest_dataData输入参数。要作为原始分块和 embeddings 加载到向量存储中的数据。仅在写入时相关。
embeddingEmbeddings输入参数。要使用的 embedding function。
number_of_resultsInteger输入参数。搜索返回的结果数量。仅在读取时相关。
search_typeString输入参数。要执行的搜索类型。仅在读取时相关。
search_score_thresholdFloat输入参数。搜索结果的最小相似度分数。仅在读取时相关。
search_filterDict输入参数。可选的元数据搜索过滤字典,会在向量搜索之外一并应用。仅在读取时相关。
body_searchString输入参数。文档文本搜索词。仅在读取时相关。
enable_body_searchBoolean输入参数。是否启用正文搜索。仅在读取时相关。

Cassandra Chat Memory

Cassandra Chat Memory 组件使用基于 Apache Cassandra 的数据库来检索和存储聊天消息。

聊天记忆会通过 Memory 数据类型在记忆存储组件之间传递。 具体来说,该组件会创建 CassandraChatMessageHistory 实例,这是一个使用 Cassandra 数据库存储消息的 LangChain 聊天消息历史类。

有关在流程中使用外部聊天记忆的更多信息,请参阅 Message History 组件

Cassandra Chat Memory 参数

有些参数在可视化编辑器中默认处于隐藏状态。 你可以通过组件标题栏菜单中的 控件 来修改全部参数。

NameTypeDescription
database_refMessageText输入参数。Cassandra 数据库的 contact points,或 Astra DB 数据库 ID。必填。
usernameMessageText输入参数。Cassandra 用户名。使用 Astra DB 时可留空。
tokenSecretString输入参数。Cassandra 的密码,或 Astra DB 的 token。必填。
keyspaceMessageText输入参数。Cassandra 中的 keyspace,或 Astra DB 中的 namespace。必填。
table_nameMessageText输入参数。用于存储消息的表或 collection 名称。必填。
session_idMessageText输入参数。聊天会话的唯一标识符。可选。
cluster_kwargsDictionary输入参数。Cassandra 集群配置的附加关键字参数。可选。

Cassandra Graph

Cassandra Graph 组件使用 CassandraGraphVectorStore——一个 LangChain graph vector store 实例——在兼容的基于 Cassandra 的集群中执行图遍历和基于图的文档检索。 它也支持向向量存储写入数据。

如果你使用向量存储组件查询向量数据库,它会生成搜索结果,你可以将这些结果作为 Data 对象列表或表格形式的 DataFrame 传递给流程中的下游组件。 如果同时支持这两种类型,你可以在可视化编辑器中、向量存储组件输出端口附近设置输出格式。

Cassandra Graph 参数

有些参数在可视化编辑器中默认处于隐藏状态。 你可以通过组件标题栏菜单中的 控件 来修改全部参数。

NameDisplay NameInfo
database_refContact Points / Astra Database ID输入参数。数据库的 contact points,或 Astra 数据库 ID。必填。
usernameUsername输入参数。数据库用户名。使用 Astra DB 时可留空。
tokenPassword / Astra DB Token输入参数。数据库用户密码,或 Astra application token。必填。
keyspaceKeyspace输入参数。包含向量存储的 keyspace 名称,该向量存储由 Table Name (table_name) 指定。必填。
table_nameTable Name输入参数。作为向量存储的表或 collection 名称。必填。
setup_modeSetup Mode输入参数。设置 Cassandra 表的配置模式。可选项为 Sync(默认)或 Off
cluster_kwargsCluster arguments输入参数。可选的 Cassandra 集群附加关键字参数字典。
search_querySearch Query输入参数。相似度搜索的查询字符串。仅在读取时相关。
ingest_dataIngest Data输入参数。要作为原始分块和 embeddings 加载到向量存储中的数据。仅在写入时相关。
embeddingEmbedding输入参数。要使用的 embedding 模型。
number_of_resultsNumber of Results输入参数。相似度搜索返回的结果数量。仅在读取时相关。默认:4。
search_typeSearch Type输入参数。要使用的搜索类型。可选项为 Traversal(默认)、MMR TraversalSimilaritySimilarity with score thresholdMMR (Max Marginal Relevance)
depthDepth of traversal输入参数。边遍历的最大深度。仅当 Search Type (search_type) 为 TraversalMMR Traversal 时相关。默认:1。
search_score_thresholdSearch Score Threshold输入参数。搜索结果的最小相似度分数阈值。仅在使用 Similarity with score threshold 进行读取时相关。
search_filterSearch Metadata Filter输入参数。可选的元数据搜索过滤字典,会在图遍历和相似度搜索之外一并应用。

另请参阅