MyScale
本页面介绍如何在 LangChain 中使用 MyScale 向量数据库。 它分为两部分:安装和设置,以及特定 MyScale 包装器的参考。
使用 MyScale,您可以管理结构化和非结构化(向量化)数据,并使用 SQL 对两种类型的数据执行联合查询和分析。此外,MyScale 的云原生 OLAP 架构基于 ClickHouse 构建,即使在大型数据集上也能实现闪电般快速的数据处理。
介绍
您现在可以在我们的 SaaS 上注册并 立即启动集群!
如果您还对我们如何将 SQL 和向量集成感兴趣,请参阅 此文档 以获取更多语法参考。
我们还提供了基于 huggingface 的实时演示!请查看我们的 huggingface 空间!他们可以在瞬间内搜索数百万个向量!
安装和设置
- 使用
pip install clickhouse-connect
安装 Python SDK
设置环境
有两种方法可以设置 myscale 索引的参数。
环境变量
在运行应用程序之前,请使用
export
设置环境变量:export MYSCALE_URL='<your-endpoints-url>' MYSCALE_PORT=<your-endpoints-port> MYSCALE_USERNAME=<your-username> MYSCALE_PASSWORD=<your-password> ...
您可以在我们的 SaaS 上轻松找到您的帐户、密码和其他信息。有关详细信息,请参阅 此文档
MyScaleSettings
下的每个属性都可以使用前缀MYSCALE_
进行设置,不区分大小写。使用参数创建
MyScaleSettings
对象
```python
from langchain.vectorstores import MyScale, MyScaleSettings
config = MyScaleSetting(host="<your-backend-url>", port=8443, ...)
index = MyScale(embedding_function, config)
index.add_documents(...)
```
包装器
支持的函数:
add_texts
add_documents
from_texts
from_documents
similarity_search
asimilarity_search
similarity_search_by_vector
asimilarity_search_by_vector
similarity_search_with_relevance_scores
VectorStore
存在一个围绕 MyScale 数据库的包装器,允许您将其用作向量存储, 无论是用于语义搜索还是类似示例检索。
要导入此向量存储:
from langchain.vectorstores import MyScale
有关 MyScale 包装器的更详细演示,请参阅 此笔记本