如何使用chatgpt 读取pdf LangChain+ChatGPT三分钟实现基于pdf等文档问答应用

AI资讯2年前 (2023)发布 fengdao

166 0 0

什么是

是一个用于开发由语言模型驱动的应用程序的框架。它不仅可以通过API调用语言模型，还可以连接语言模型到其他数据源（数据感知），并允许语言模型与其环境进行交互（具有代理性）。提供了模块化的抽象组件，用于与语言模型一起工作，并为所有这些抽象提供了实现集合。此外，还提供了特定用例的链（），可以将这些组件以特定方式组装在一起，以最好地完成特定用例。

也许这么讲，你可能一脸懵逼，这到底是个啥玩意，不急，下面就代理领略一下的风采。

安装开发环境

要安装，您可以使用以下命令：

pip install langchain

复制

或者

conda install langchain -c conda-forge

复制

安装完成后，您可能需要集成一个或多个模型提供商、数据存储、API等。例如，如果您要使用的API，您需要先安装它们的SDK：

pip install openai

复制

然后，您需要在终端中设置环境变量：

export OPENAI_API_KEY="..."

复制

或者，您可以在笔记本（或脚本）中执行此操作：

import os
os.environ["OPENAI_API_KEY"] = "..."

复制

但是，我更加建议你下载这个仓库：

如何使用chatgpt 读取pdf_如何使用chatgpt 读取pdf_如何使用chatgpt 读取pdf

玩了之后，你可以在这个仓库中找到 .env文件，然后再里面配置你的，是一样的道理。

在上可以使用交互式的方式来一行一行的执行代码，快捷键shift+enter ，非常方便，当执行

# Load environment variables
load_dotenv(find_dotenv())

复制

就代表环境变量已经加载好了。

如何使用构建语言模型应用程序？

写一首诗试试，看起来很轻松，和调用的api没啥区别呀，没看到神奇的地方啊，别着急，继续往下看。

我们可以使用来管理LLM的提示。例如，您可以定义一个模板，然后使用.方法对其进行格式化：

from langchain.prompts import PromptTemplate
prompt = PromptTemplate(
    input_variables=["product"],
    template="What is a good name for a company that makes {product}?",
)
print(prompt.format(product="colorful socks"))

复制

此外，我们还可以使用链（）将多个组件组合在一起，创建一个单一或者连贯的应用程序。例如，创建一个简单的链，它将用户输入格式化为，然后将其发送到LLM：

from langchain.chains import LLMChain
chain = LLMChain(llm=llm, prompt=prompt)
chain.run("colorful socks")

复制

早学早致富，是几分钟搭建一个基

这样，一个取名器就完成了，这就是一个小应用，你可以把他封装为一个微服务，提供给其他模块调用。

更好玩的，使用Agent

在中，我们可以创建一个链，它接受用户输入，使用它格式化提示，然后将其发送到LLM。例如，可以使用，它结合了和LLM。可用于通过获取用户输入并构造提示来管理LLM的提示。

如何使用chatgpt 读取pdf_如何使用chatgpt 读取pdf_如何使用chatgpt 读取pdf

# --------------------------------------------------------------
# Agents: Dynamically Call Chains Based on User Input
# --------------------------------------------------------------
llm = OpenAI()
get_all_tool_names()
tools = load_tools(["wikipedia", "llm-math"], llm=llm)
# Finally, let's initialize an agent with the tools, the language model, and the type of agent we want to use.
agent = initialize_agent(
    tools, llm, agent=AgentType.ZERO_SHOT_REACT_DESCRIPTION, verbose=True
)
# Now let's test it out!
result = agent.run(
    "中国有多少所大学，数量乘以 3"
)
print(result)

复制

找到感觉了吗，是不是有点的味道了，提供额很多tools，不仅仅可以从维基百科查找，还可以通过搜索，必应，都可以，这意味着，不限于他训练的知识，你可能很好奇，这个是如何实现的，其是实现原理也很简单。

1、通过你的来调用，分解出执行你这个目标所需要的步骤。

2、推理出那些目标需要调用哪个tool，例如，我们demo中的“中国有多少所大学”这个需要分配到维基百科这个tool，而拿到的数据进行计算就交给llm-math这个tool。

3、链式执行的结果输出。

如果你理解了这个例子，下面基于文档，视频的内容问答，基本上也是这个原理，注意看：

实现基于文档、视频、哔哩哔哩视频的内容问答

from langchain.document_loaders import YoutubeLoader
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain.embeddings.openai import OpenAIEmbeddings
from langchain.vectorstores import FAISS
from langchain.llms import OpenAI
from langchain import PromptTemplate
from langchain.chains import LLMChain
from dotenv import find_dotenv, load_dotenv
import textwrap
load_dotenv(find_dotenv())
embeddings = OpenAIEmbeddings()
def create_db_from_youtube_video_url(video_url: str) -> FAISS:
    loader = YoutubeLoader.from_youtube_url(video_url)
    transcript = loader.load()
    text_splitter = RecursiveCharacterTextSplitter(
        chunk_size=1000, chunk_overlap=100)
    docs = text_splitter.split_documents(transcript)
    db = FAISS.from_documents(docs, embeddings)
    return db
def get_response_from_query(db, query, k=4):
    """
    text-davinci-003 can handle up to 4097 tokens. Setting the chunksize to 1000 and k to 4 maximizes
    the number of tokens to analyze.
    """
    docs = db.similarity_search(query, k=k)
    docs_page_content = " ".join([d.page_content for d in docs])
    llm = OpenAI(model_name="text-davinci-003")
    prompt = PromptTemplate(
        input_variables=["question", "docs"],
        template="""
        You are a helpful assistant that that can answer questions about youtube videos
        based on the video's transcript.
        Answer the following question: {question}
        By searching the following video transcript: {docs}
        Only use the factual information from the transcript to answer the question.
        If you feel like you don't have enough information to answer the question, say "I don't know".
        Your answers should be verbose and detailed.
        """,
    )
    chain = LLMChain(llm=llm, prompt=prompt)
    response = chain.run(question=query, docs=docs_page_content)
    response = response.replace("n", "")
    return response, docs
# Example usage:
video_url = "https://www.youtube.com/watch?v=L_Guz73e6fw"
db = create_db_from_youtube_video_url(video_url)
query = "What are they saying about Microsoft?"
response, docs = get_response_from_query(db, query)
print(textwrap.fill(response, width=85))

复制

这里只给出一个基于视频的问答的demo，实际上基于文档的问答原理类似：

1、流里面解析出文本字幕，内容，保存为doc

2、使用进行分割，因为模型有token数限制，所以要分割

3、使用进行操作。

4、基于用户的输入进行一个db.，找到最接近的4个小docs，应该在token范围内（3.5是4096）。

5、然后通过chain = (llm=llm, =) 这个chain来调用，chain.run(=query, docs=)，这里威力体现出来了，这样，我们就可以基于每个query调出最相似的内容，然后在一起交给提问了。

还有的版本

这个可以说是前端开发的福音，但是有能力，建议还是版本的，工具链会齐全不少。

基于文档的问答视频推荐