Apify
本页面介绍如何在 LangChain 中使用 Apify。
概述
Apify 是一个用于网页抓取和数据提取的云平台, 它提供了一个 生态系统,包含了一千多个 预制的应用程序,称为 Actors,用于各种抓取、爬行和提取场景。
此集成使您能够在 Apify 平台上运行 Actors,并将它们的结果加载到 LangChain 中,以用于向量的生成 索引,使用来自网络的文档和数据,例如从带有文档的网站生成答案, 博客或知识库。
安装和设置
- 使用
pip install apify-client
安装 Python 的 Apify API 客户端 - 获取您的 Apify API 令牌,并将其设置为
环境变量(
APIFY_API_TOKEN
)或在构造函数中将其传递给ApifyWrapper
作为apify_api_token
。
包装器
实用工具
您可以使用 ApifyWrapper
在 Apify 平台上运行 Actors。
from langchain.utilities import ApifyWrapper
有关此包装器的更详细步骤,请参阅 此笔记本。
加载器
您还可以使用我们的 ApifyDatasetLoader
从 Apify 数据集中获取数据。
from langchain.document_loaders import ApifyDatasetLoader
有关此加载器的更详细步骤,请参阅 此笔记本。