Arxiv( Arxiv )
arXiv(arXiv) 是一个开放获取的学术论文存档,涵盖物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程、系统科学和经济学等领域。
安装和设置
首先,您需要安装 arxiv
Python 包。
pip install arxiv
其次,您需要安装 PyMuPDF
Python 包,该包将从 arxiv.org
网站下载的 PDF 文件转换为文本格式。
pip install pymupdf
文档加载器
请参阅 用法示例。
from langchain.document_loaders import ArxivLoader
检索器
请参阅 用法示例。
from langchain.retrievers import ArxivRetriever