Skip to main content

Apify

本页面介绍如何在 LangChain 中使用 Apify

概述

Apify 是一个用于网页抓取和数据提取的云平台, 它提供了一个 生态系统,包含了一千多个 预制的应用程序,称为 Actors,用于各种抓取、爬行和提取场景。

Apify Actors

此集成使您能够在 Apify 平台上运行 Actors,并将它们的结果加载到 LangChain 中,以用于向量的生成 索引,使用来自网络的文档和数据,例如从带有文档的网站生成答案, 博客或知识库。

安装和设置

  • 使用 pip install apify-client 安装 Python 的 Apify API 客户端
  • 获取您的 Apify API 令牌,并将其设置为 环境变量(APIFY_API_TOKEN)或在构造函数中将其传递给 ApifyWrapper 作为 apify_api_token

包装器

实用工具

您可以使用 ApifyWrapper 在 Apify 平台上运行 Actors。

from langchain.utilities import ApifyWrapper

有关此包装器的更详细步骤,请参阅 此笔记本

加载器

您还可以使用我们的 ApifyDatasetLoader 从 Apify 数据集中获取数据。

from langchain.document_loaders import ApifyDatasetLoader

有关此加载器的更详细步骤,请参阅 此笔记本