Skip to main content

SearxNG 搜索 API

本页面介绍如何在 LangChain 中使用 SearxNG 搜索 API。 它分为两个部分:安装和设置,以及特定的 SearxNG API 包装器的参考。

安装和设置

虽然可以与 公共 searx 实例 一起使用该包装器,但这些实例经常不允许 API 访问(有关输出格式的注意事项,请参见下面的说明)并且对请求的频率有限制。 建议选择自托管的实例。

自托管实例:

请参阅 此页面 获取安装说明。

当您安装 SearxNG 时,默认情况下只有 HTML 格式是活动的输出格式。 您需要激活 json 格式以使用 API。可以通过将以下行添加到 settings.yml 文件中完成:

search:
formats:
- html
- json

您可以通过向 API 端点发出 curl 请求来确保 API 正常工作:

curl -kLX GET --data-urlencode q='langchain' -d format=json http://localhost:8888

这应该返回一个带有结果的 JSON 对象。

包装器

Utility

要使用包装器,我们需要将 SearxNG 实例的主机传递给包装器,使用以下方式之一:

1. 创建实例时使用命名参数 `searx_host`。
2. 导出环境变量 `SEARXNG_HOST`。

您可以使用包装器从 SearxNG 实例获取结果。

from langchain.utilities import SearxSearchWrapper
s = SearxSearchWrapper(searx_host="http://localhost:8888")
s.run("what is a large language model?")

Tool

您还可以将此包装器作为工具加载(与代理一起使用)。

可以使用以下方式实现:

from langchain.agents import load_tools
tools = load_tools(["searx-search"],
searx_host="http://localhost:8888",
engines=["github"])

请注意,我们可以 可选地 传递自定义引擎以供使用。

如果您想以 json 格式获取带有元数据的结果,可以使用以下方式:

tools = load_tools(["searx-search-results-json"],
searx_host="http://localhost:8888",
num_results=5)

快速创建工具

此示例展示了一种从相同的 包装器创建多个工具的快速方法。

from langchain.tools.searx_search.tool import SearxSearchResults

wrapper = SearxSearchWrapper(searx_host="**")
github_tool = SearxSearchResults(name="Github", wrapper=wrapper,
kwargs = {
"engines": ["github"],
})

arxiv_tool = SearxSearchResults(name="Arxiv", wrapper=wrapper,
kwargs = {
"engines": ["arxiv"]
})

有关工具的更多信息,请参阅 此页面