Skip to main content

SageMaker 终端

Amazon SageMaker 是一个可以使用完全托管的基础架构、工具和工作流程构建、训练和部署机器学习(ML)模型的系统。 我们使用 SageMaker 来托管我们的模型并将其作为 SageMaker终端 进行暴露。

安装和设置

pip install boto3

有关如何将模型暴露为 SageMaker终端 的说明,请参阅 此处注意:为了处理批量请求,我们需要在自定义的 inference.py 脚本中调整 predict_fn() 函数的返回行: 从

return {"vectors": sentence_embeddings[0].tolist()}

到:

return {"vectors": sentence_embeddings.tolist()}

我们必须设置 SagemakerEndpoint 调用的以下必填参数:- endpoint_name:已部署 Sagemaker 模型的终端名称。 在 AWS 区域内必须是唯一的。- credentials_profile_name~/.aws/credentials~/.aws/config 文件中的配置文件名称, 其中指定了访问密钥或角色信息。 如果未指定,将使用默认的凭证配置文件,或者如果在 EC2 实例上,将使用 IMDS 中的凭证。 请参阅 此指南。## LLM 请参阅 使用示例

文本嵌入模型

from langchain import SagemakerEndpoint
from langchain.llms.sagemaker_endpoint import LLMContentHandler

请参阅 使用示例。 See a usage example.

from langchain.embeddings import SagemakerEndpointEmbeddings
from langchain.llms.sagemaker_endpoint import ContentHandlerBase