深湖
本页面介绍如何在 LangChain 中使用深湖(Deep Lake)生态系统。
为什么选择深湖?
- 不仅仅是一个(多模态)向量存储库。您还可以使用数据集来微调自己的 LLM 模型。
- 不仅存储嵌入向量,还具备自动版本控制的原始数据。
- 真正的无服务器。不需要另一个服务,可与主要的云提供商(AWS S3、GCS 等)一起使用。
更多资源
- LangChain 和深湖终极指南:构建 ChatGPT 以回答关于您的金融数据的问题
- 使用深湖进行 Twitter 算法代码分析
- 这是 白皮书 和 学术论文 关于深湖的。
- 这是一套额外的资源可供查阅:深湖,开始 和 Tutorials
安装和设置
- 使用
pip install deeplake
安装 Python 包
封装
向量存储库
存在一个围绕深湖的封装,它是用于深度学习应用的数据湖,您可以将其用作向量存储库(目前),无论是用于语义搜索还是示例选择。
要导入此向量存储库:
from langchain.vectorstores import DeepLake
有关深湖封装的更详细演练,请参阅 此笔记本