rag-aws-bedrock
这个模板旨在连接AWS Bedrock服务,这是一个提供一组基础模型的托管服务器。
它主要使用Anthropic Claude
进行文本生成和Amazon Titan
进行文本嵌入,并利用FAISS作为向量存储。
有关RAG流水线的更多上下文,请参阅此笔记本。
环境设置
在使用此包之前,请确保已配置boto3
以与您的AWS帐户配合使用。
有关如何设置和配置boto3
的详细信息,请访问此页面。
此外,您需要安装faiss-cpu
包以与FAISS向量存储一起使用:
pip install faiss-cpu
您还应设置以下环境变量以反映您的AWS配置文件和区域(如果您未使用default
AWS配置文件和us-east-1
区域):
AWS_DEFAULT_REGION
AWS_PROFILE
用法
首先,安装LangChain CLI:
pip install -U langchain-cli
要创建一个新的LangChain项目并将其安装为唯一的包:
langchain app new my-app --package rag-aws-bedrock
要将此包添加到现有项目中:
langchain app add rag-aws-bedrock
然后将以下代码添加到您的server.py
文件中:
from rag_aws_bedrock import chain as rag_aws_bedrock_chain
add_routes(app, rag_aws_bedrock_chain, path="/rag-aws-bedrock")
(可选)如果您可以访问LangSmith,您可以配置它以跟踪、监视和调试LangChain应用程序。如果您没有访问权限,可以跳过此部分。
export LANGCHAIN_TRACING_V2=true
export LANGCHAIN_API_KEY=<your-api-key>
export LANGCHAIN_PROJECT=<your-project> # 如果未指定,默认为"default"
如果您在此目录中,可以直接启动LangServe实例:
langchain serve
这将在本地启动一个运行在http://localhost:8000的FastAPI应用程序的服务器
您可以在http://127.0.0.1:8000/docs上查看所有模板,并在http://127.0.0.1:8000/rag-aws-bedrock/playground上访问playground。
您可以通过以下代码访问模板:
from langserve.client import RemoteRunnable
runnable = RemoteRunnable("http://localhost:8000/rag-aws-bedrock")