langchain UnstructuredPDFLoader读取pdf仅生成单篇Document解决办法
fromlangchain.document_loadersimportUnstructuredPDFLoaderloader=UnstructuredPDFLoader("test.pdf")pages=loader.load_and_split()langchain的UnstructuredPDFLoader默认采用的是fast解析,如果是比较长的pdf,会发现没有分割文档,把整篇文章都放到一