阿里云云栖号

LangChain+通义千问+AnalyticDB 向量引擎保姆级教程

本文以构建AIGC落地应用ChatBot和构建AI Agent为例，从代码级别详细分享AI框架LangChain、阿里云通义大模型和AnalyticDB提供引擎的开发经验和最佳实践，给大家快速搭建AIGC应用提供参考。

前言

9月13日，通义千问大模型已通过录制方式招募，并正式向公众开放。通义模型具备的能力包括：1.创作文字，如写故事、写公文、写邮件、写剧本、写诗歌等；2.编写代码；3.提供各类语言的翻译服务，如英语、日语、法语、西班牙语等；4.进行文本润色和文本摘要等工作；5.扮演角色进行对话；6.制作我们在可以登录通义千问官网体验的同时，也可以充分发挥想象力，通过调用通义千问API的方式来构建属于自己的AI应用了。

如果直接使用通义千问API从0到1来构建应用，技术成本还是相对比较高的。幸运的是，目前已经有非常优秀的框架LangChain来串联AIGC相关的各类组件，让我们轻松构建自己由于业务上对客户支持的需要，我在几个月前就已经在LangChain模块中添加了调用通义千问API的模块代码。在这个时间点，恰好可以直接拿来使用。

在过去的一段时间里，已经有很多同学分享了LangChain的框架和原理，本文则从实际开发角度出发，以构建应用流程中遇到的问题，以及我们实际遇到的客户案例出发，来详细讲解LangChain的代码，希望能给大家在基于通义API构建应用入门时提供一些启示和思路。本文主要包括几个部分：

1）LangChain的简单介绍。

2）LangChain的源码解读，以通义千问API调用为例。

3.）学习和构建一些基于不同链的小应用演示，比如基于通义和提供数据库的ChatBot；构建每日金融资讯收集和分析的AI代理。

4）如何提高大模型的问答准确率，比如如何更好地处理现有数据，如何利用思维链能力提升Agent的实际思考能力等。

浪链是什么

LangChain是一个基于语言模型开发应用程序的框架。其通过中央开发应用程序所需的各个模块和组件，简化和加速了程序的构建和开发。

LangChain模块

LLM模块 提供统一的大语言模型调用接口，增强各种大语言模型调用方式和实现细节的不同带来的开发复杂度。比如OpenAI和统一模块。实现一个LLM模块需要实现LLM基类的调用和生成接口。

class LLM(BaseLLM):
    def _call(
        self,
        prompt: str,
        stop: Optional[List[str]] = None,
        run_manager: Optional[CallbackManagerForLLMRun] = None,
        **kwargs: Any,
    ) -> str:
        """Run the LLM on the given prompt and input."""

  def _generate(
        self,
        prompts: List[str],
        stop: Optional[List[str]] = None,
        run_manager: Optional[CallbackManagerForLLMRun] = None,
        **kwargs: Any,
    ) -> LLMResult:
        """Run the LLM on the given prompt and input."""

Embedding模块 提供统一的嵌入能力接口，与LLM一样，也提供不同的厂商实现，比如OpenAIEmbeddings,DashScopeEmbeddings。同样需要集成和实现Embeddings基类的两个方法embed_documents和embed_query。

class Embeddings(ABC):
    """Interface for embedding models."""

    @abstractmethod
    def embed_documents(self, texts: List[str]) -> List[List[float]]:
        """Embed search docs."""

    @abstractmethod
    def embed_query(self, text: str) -> List[float]:

VectorStore模块 支持存储模块，用于存储由Embedding模块生成的数据支持和生产支持，主要作为记忆和检索模块向LLM提供服务。比如AnalytiDB VectorStore模块。实现VectorStore模块主要需要实现几个读取和查询接口。

class VectorStore(ABC):
    """Interface for vector store."""

    @abstractmethod
    def add_texts(
        self,
        texts: Iterable[str],
        metadatas: Optional[List[dict]] = None,
        **kwargs: Any,
    ) -> List[str]:


    def search(self, query: str, search_type: str, **kwargs: Any) -> List[Document]:

链模块 用于架构上面的这些模块，使得调用更加简单，让用户不需要关心繁琐的调用仓库，在LangChain中已经集成了很多链，对接的就是LLMChain，在其内部根据不同的场景定义和使用不同的PromptTemplate来达到目标。

代理模块 和链类似，提供了丰富的代理模块版本，对于实现不同的代理，后面会详细介绍。

还有模块比如索引，检索器等都是上面这些模块的变种，以及提供一些可调用的工具类，比如工具等。这里就不再详细展开。我们会在后面的案例中讲解如何使用这些模块来构建自己的应用程序。

应用案例

构建聊天机器人

ChatBot是LLM应用的一个比较典型的场景，这个场景又可以解读为问答助手(知识库)，智能客服，副驾驶等。比较典型的案例是LangChain-chatchat。构建ChatBot主要需要以下模块：

TextSplitter一篇文档的内容往往长达几十篇幅，由于LLM和Embedding token的限制，无法将其全部传给LLM，因此需要存储的文档按照一定的规则切分内聚的小块进行存储。

LLM模块 用于总结问题和回答问题。

嵌入模块 用于生产知识和问题的表示。

VectorStore模块 用于存储和搜索匹配本地知识内容。

比较语音的调用流程图如下（比较经典语音，老图借用）：

例子

基于通义API和ADB-PG提供数据库的ChatBot

首先我们从Google拉取一些问答数据，然后调用Dashscope上的Embedding模型进行支撑化，并写入AnalyticDB PostgreSQL。

import os
import json
import wget
from langchain.vectorstores.analyticdb import AnalyticDB

CONNECTION_STRING = AnalyticDB.connection_string_from_db_params(
    driver=os.environ.get("PG_DRIVER", "psycopg2cffi"),
    host=os.environ.get("PG_HOST", "localhost"),
    port=int(os.environ.get("PG_PORT", "5432")),
    database=os.environ.get("PG_DATABASE", "postgres"),
    user=os.environ.get("PG_USER", "postgres"),
    password=os.environ.get("PG_PASSWORD", "postgres"),
)

# All the examples come from https://ai.google.com/research/NaturalQuestions
# This is a sample of the training set that we download and extract for some
# further processing.
wget.download("https://storage.googleapis.com/dataset-natural-questions/questions.json")
wget.download("https://storage.googleapis.com/dataset-natural-questions/answers.json")

# 导入数据
with open("questions.json", "r") as fp:
    questions = json.load(fp)

with open("answers.json", "r") as fp:
    answers = json.load(fp)


from langchain.vectorstores import AnalyticDB
from langchain.embeddings import DashScopeEmbeddings
from langchain import VectorDBQA, OpenAI

embeddings = DashScopeEmbeddings(
    model="text-embedding-v1", dashscope_api_key="your-dashscope-api-key"
)

doc_store = AnalyticDB.from_texts(
    texts=answers, embedding=embeddings, connection_string=CONNECTION_STRING,
    pre_delete_collection=True,
)

然后创建LangChain内集成的tongyi模块。

from langchain.chains import RetrievalQA
from langchain.llms import Tongyi

os.environ["DASHSCOPE_API_KEY"] = "your-dashscope-api-key"
llm = Tongyi()

查询和搜索数据，然后回答问题。

from langchain.prompts import PromptTemplate
custom_prompt = """
Use the following pieces of context to answer the question at the end. Please provide
a short single-sentence summary answer only. If you don't know the answer or if it's
not present in given context, don't try to make up an answer, but suggest me a random
unrelated song title I could listen to.
Context: {context}
Question: {question}
Helpful Answer:
"""

custom_prompt_template = PromptTemplate(
    template=custom_prompt, input_variables=["context", "question"]

custom_qa = VectorDBQA.from_chain_type(
    llm=llm,
    chain_type="stuff",
    vectorstore=doc_store,
    return_source_documents=False,
    chain_type_kwargs={"prompt": custom_prompt_template},
)

random.seed(41)
for question in random.choices(questions, k=5):
    print(">", question)
    print(custom_qa.run(question), end="\n\n")

> what was uncle jesse's original last name on full house
Uncle Jesse's original last name on Full House was Cochran.

> when did the volcano erupt in indonesia 2018
No information about a volcano erupting in Indonesia in 2018 is present in the given context. Suggested song title: "Volcano" by U2.

> what does a dualist way of thinking mean
A dualist way of thinking means believing that humans possess a non-physical mind or soul which is distinct from their physical body.

> the first civil service commission in india was set up on the basis of recommendation of
The first Civil Service Commission in India was not set up on the basis of a recommendation.

> how old do you have to be to get a tattoo in utah
In Utah, you must be at least 18 years old to get a tattoo.

问题和挑战

在我们实际为用户提供构建ChatBot的过程中，我们仍然遇到了很多问题，比如文本切分过碎，导致语义丢失，文本包含图表，切分后导致段落无法被理解等。

文本切分器 支持的匹配度直接影响识别率，而支持的识别率又和内容本身以及问题紧密联系在一起，存在一个很强大的嵌入模型，如果文本切分本身做的不好，也无法达到用户的预期效果。比如LangChain本身提供的CharacterTextSplitter，其会根据标点符号和换行符等来切分段落，在一些多级标题的场景下，小标题会被切分成单独的块，与正文分割开，导致被切分的标题和正文都无法很内聚地表达需要表达的内容。
优化切分长度，过长的chunk会导致在召回后达到token限制，过小的chunk又可能丢失想要的关键信息。我们尝试过很多切分策略，发现如果不做深度的优化，将文本直接按照200-500个token长度来切分反而效果比较好。
认知优化1.回溯上面，在某些场景中，我们能够准确地识别内容，但是这部分内容并不完整，因此我们可以在读取时为块按照文章级别构建id，在捕获时额外识别最相关块的相邻块，裁切。
认知优化2.构建标题树，在丰富的文本场景中，用户非常喜欢使用多级标题，有些文本内容在去掉标题之后就无法理解其到底在说什么，接下来我们可以通过构建内容标题树的方式来优化块。 chunk 按照下面的方式构建。

#大标题1-中标题1-小标题1#:内容1
#大标题1-中标题1-小标题1#:内容2
#大标题1-中标题1-小标题2#:内容1
#大标题2-中标题1-小标题1#:内容1

双路召回，纯醒醒有时会针对母语的不理解导致无法召回相关内容，接下来可以考虑使用醒醒和全文搜索进行双路醒醒，在醒后因为随后做精去重。搜索时，我们可以通过额外增加自定义词汇和虚词增强的方式来进一步优化召回效果。
问题优化，有时候用户的问题本身并不适合做护理匹配，接下来我们可以根据聊天历史做模型来总结独立问题，来提升反馈率，提高回答准确度。

虽然我们做了很多优化，但是由于用户的文档本身五花八门，现在依然无法找到一个完全通用的方案来应对所有的数据源。比如某样东西分器在markdown场景表现很好，但是对于pdf就效果回落得厉害。比如有的用户还要求能够在识别文本的同时识别图片、视频甚至ppt的切片。目前我们也只是通过元数据链接的方式识别相关内容，而不是把相关内容直接做处理。如果有同学有很好的方法，欢迎评论区交流。

构建AI代理

以LLM构建AI Agent是大语言模型的另一个典型的应用场景。一些开源的非常火热的项目，如AutoGPT、BabyAGI都是非常典型的例子。让我们明白LLM的潜力不仅仅局限于生成书写精彩的文本、故事、文章等；它可以被视为一个强大的自我决策的系统。用AI做决策存在一定的风险，但在一些简单的，只是处理繁琐工作的场景，让AI代替人工决策是可以取的。

Agent系统组成

在以LLM为核心的自主代理系统中，LLM是Agent的大脑，我们还需要一些其他的组件来补全它的四肢。AI Agent主要借助思维链和思维树的思想，提高Agent的思考和决策能力。

规划

规划的作用有两个：

进行子任务的设定和分解：实际生活中的任务往往很复杂，需要将大任务分层为更小、可管理的子目标，从而能够有效处理复杂任务。
进行自我反思和迭代：通过对过去的自我行为进行批评和反思，从错误中学习并为今后的步骤进行完善，从而提高最终结果的质量。

记忆

短期记忆：将所有上下文学习（参见提示工程）视为利用模型的短期记忆来学习。

长期记忆：这为代理提供了长时间内保留和检索（无限）信息的能力，通常通过利用外部存储和检索来快速实现。

工具

工具模块可以让Agent调用外部API以获取模型权限重中恢复的额外信息（通常在预训练后难以更改），包括实时信息、代码执行能力、访问逻辑信息源等。通常是通过设计API的让方式LLM调用执行。

规划模块

一个复杂的任务通常包括许多步骤。代理需要知道这些步骤并提前规划。

任务拆解

思维链（Chain of Thought） （CoT; Wei et al. 2022 ）已经成为提高模型在复杂任务上性能的标准提示技术。模型被指示“阶段性思考”，以利用更多的测试时间计算来将困难任务分解成更小更简单的步骤。CoT将大任务转化为多个可管理的任务，并揭示了模型思考过程的解释。

树（Tree of Thoughts） （Yao et al. 2023 ）通过在每一步探索多种推理可能性来扩展了CoT。它首先将问题分解为多个思维步骤，并在每一步生成多种思考，创建一个树状结构。搜索过程可以是广度优先搜索（BFS）或深度优先搜索（DFS），每个状态都由分类器（通过提示）或大多数投票进行评估。

完成任务拆解可以通过以下方式：（1）LLM使用简单的提示，如完成“任务X需要a、b、c的步骤。\n1。”，“实现任务X的子目标是什么？”，（ 2）使用任务特定的指令；例如，“编写文案大纲。”，或者（3）通过交互式输入指定需要操作的步骤。

反思自我（Self-Reflection）是一个非常重要的思想，它允许Agent通过改进过去的行动决策和修正提高以前错误的方式来不断。在可以允许犯错和试错的现实任务中，它发挥着关键作用。比如写一段某些用途的脚本代码。

ReAct ( Yao et al. 2023 )通过将行动空间扩展为任务特定的离散行动和语言空间的组合，将推理和行动整合到LLM中。上面使LLM能够与环境交互（例如使用搜索引擎API），而后者促使LLM生成自然语言中的推理趋势。

ReAct的提示模板包含明确的大致步骤，提供LLM思考，格式如下：

Thought: ...
Action: ...
Observation: ...
... (Repeated many times)

在对知识密集型任务和决策任务的两个实验中，ReAct都表现比仅仅包含行动（省略了“思考：…”步骤）更好的回答效果。

内存模块

记忆可以定义用于获取、存储、保留和以后检索信息的过程。对于人类大脑来说，有几种类型的记忆。

感觉记忆：这是记忆的初始阶段，它使我们能够在原始刺激结束后保留感觉信息（视觉、听觉等）的能力。感觉记忆通常只持续短暂的休息。子类别包括图像记忆（视觉记忆）、声音记忆记忆（听觉）和认知记忆（认知）。

短期记忆（Short-Term Memory）：它存储我们当前认知的信息，需要执行复杂的认知任务，例如学习和推理。短期记忆的容量被认为大约有7个项目（Miller 1956），持续时间为20-30秒。

长期记忆（Long-Term Memory）：长期记忆可以存储信息很长时间，范围从几天到目前的存储容量，本质上具有无限的存储容量。长期记忆有两种子类型：

显式/陈述性记忆：这是关于事实和事件的记忆，指的是那些有意识地回忆起来的记忆，包括情节记忆（事件和经历）和语义记忆（事实概念）。

隐式/程序性记忆：这种记忆是无意识的，涉及自动执行的技能和例行程序，如骑自行车、在键盘上打字等。

我们可以粗略地考虑以下映射关系：

记忆感觉为原始输入内容（包括文本、图像或其他模式），其可以在嵌入之后作为输入。

短期记忆就像上下文内容一样，因为聊天历史，它是短暂而有限的，因为受到Token长度的限制。

长期记忆就像Agent可以在查询时参考的外部支持存储，可以通过快速检索访问。

外部存储可以缓解有限的注意力跨度的限制。一个标准的做法是将信息的嵌入表示保存到一个支持存储数据库中，该数据库可以支持快速的最大内积搜索（Maximum Inner Product Search）。为了优化搜索速度，常见的选择是使用近似最近邻（ANN）算法，以返回近似的前k个最近邻，可以在轻微损失一些精度的情况下获得巨大的速度提升。对于类似性算法有兴趣的同学可以阅读这篇文章《ChatGPT都推荐的支持数据库，不仅仅是支持索引》。

工具模块

使用工具可以使LLM完成一些其本身无法直接完成的事情。

Modular Reasoning, Knowledge and Language ( Karpas et al. 2022 )提出了一个MRKL系统，包含一组专家模块，通用的LLM作为路由器，将查询路由到最合适的专家模块。这些模块是其他模型(文生可以图) ，领域天气模型等）或功能模块（例如数学转换器、货币转换器、API）。现在最典型的方式就是使用ChatGPT的函数调用功能。通过对C hatGP T注册和描述接口的意义，就可以让ChatGP T帮助我们调用对应的接口，返回正确的答案。

典型案例-AUTOGPT

autogpt通过类似下面的提示可以成功完成一些复杂的任务，比如回顾开源项目的代码，给开源项目代码写注释。最近看到了Aone Copilot，其主要焦点在代码补全和代码问答两个场景。那么如果我们可以调用Aone Copilot的API，是否也可以在我们主动mr之后，让agent帮我们完成一些代码风格、语法校验的代码审查工作，和单元测试用例编写的工作。

You are {{ai-name}}, {{user-provided AI bot description}}.
Your decisions must always be made independently without seeking user assistance. Play to your strengths as an LLM and pursue simple strategies with no legal complications.

GOALS:

1. {{user-provided goal 1}}
2. {{user-provided goal 2}}
3. ...
4. ...
5. ...

Constraints:
1. ~4000 word limit for short term memory. Your short term memory is short, so immediately save important information to files.
2. If you are unsure how you previously did something or want to recall past events, thinking about similar events will help you remember.
3. No user assistance
4. Exclusively use the commands listed in double quotes e.g. "command name"
5. Use subprocesses for commands that will not terminate within a few minutes

Commands:
1. Google Search: "google", args: "input": ""
2. Browse Website: "browse_website", args: "url": "", "question": ""
3. Start GPT Agent: "start_agent", args: "name": "", "task": "", "prompt": ""
4. Message GPT Agent: "message_agent", args: "key": "", "message": ""
5. List GPT Agents: "list_agents", args:
6. Delete GPT Agent: "delete_agent", args: "key": ""
7. Clone Repository: "clone_repository", args: "repository_url": "", "clone_path": ""
8. Write to file: "write_to_file", args: "file": "", "text": ""
9. Read file: "read_file", args: "file": ""
10. Append to file: "append_to_file", args: "file": "", "text": ""
11. Delete file: "delete_file", args: "file": ""
12. Search Files: "search_files", args: "directory": ""
13. Analyze Code: "analyze_code", args: "code": ""
14. Get Improved Code: "improve_code", args: "suggestions": "", "code": ""
15. Write Tests: "write_tests", args: "code": "", "focus": ""
16. Execute Python File: "execute_python_file", args: "file": ""
17. Generate Image: "generate_image", args: "prompt": ""
18. Send Tweet: "send_tweet", args: "text": ""
19. Do Nothing: "do_nothing", args:
20. Task Complete (Shutdown): "task_complete", args: "reason": ""

Resources:
1. Internet access for searches and information gathering.
2. Long Term memory management.
3. GPT-3.5 powered Agents for delegation of simple tasks.
4. File output.

Performance Evaluation:
1. Continuously review and analyze your actions to ensure you are performing to the best of your abilities.
2. Constructively self-criticize your big-picture behavior constantly.
3. Reflect on past decisions and strategies to refine your approach.
4. Every command has a cost, so be smart and efficient. Aim to complete tasks in the least number of steps.

You should only respond in JSON format as described below
Response Format:
{
    "thoughts": {
        "text": "thought",
        "reasoning": "reasoning",
        "plan": "- short bulleted\n- list that conveys\n- long-term plan",
        "criticism": "constructive self-criticism",
        "speak": "thoughts summary to say to user"
    },
    "command": {
        "name": "command name",
        "args": {
            "arg name": "value"
        }
    }
}
Ensure the response can be parsed by Python json.loads

LangChain Agent模块

LangChain已经内置了很多agent实现的框架模块，主要包含：

代理工具包

该模块目前是实验性的，其目的是为了模拟代替甚至超越C hatGP T插件的能力，通过提供一系列的工具集提供链式调用，来让用户完成自己的工作流程。比较典型的包括发送邮件功能,执行python代码，执行用户提供的sql，调用zapier api等。

toolkits主要通过注册机制向agent返回一系列可以调用的工具。其基类代码为BaseToolkit。

class BaseToolkit(BaseModel, ABC):
    """Base Toolkit representing a collection of related tools."""

    @abstractmethod
    def get_tools(self) -> List[BaseTool]:
        """Get the tools in the toolkit."""

我们可以通过继承BaseToolkit的方式来实现不同的工具包，每个工具包都会实现一系列的工具，一个工具则包含几个部分，必须包含的内容有name,description。通过这几个字段来告知LLM这个工具的作用和调用方法，这里就要求注册的工具最好能够通过名称明确表达其用途，同时也可以在描述中增加few-shot单独调用示例，使得LLM能够更好地理解工具。同时在LangChain内部已经集成了很多工具，我们可以直接调用这些工具来组成工具。

class BaseTool(BaseModel, Runnable[Union[str, Dict], Any]):
    name: str
    """The unique name of the tool that clearly communicates its purpose."""
    
    description: str
    """Used to tell the model how/when/why to use the tool.
    You can provide few-shot examples as a part of the description.
    """
    ...

class Tool(BaseTool):
    """Tool that takes in function or coroutine directly."""

    description: str = ""
    func: Optional[Callable[..., str]]
    """The function to run when the tool is called."""

示例1 计算代理

接下来我们做一个简单的代理演示，这个代理主要做两件事情。 1.从网上检索收集问题的数据 2.利用收集到的需要的数据进行科学计算，回答用户的问题。在这个流程中，我们主要用到搜索和计算器两个工具。

from langchain.agents import initialize_agent, AgentType, Tool
from langchain.chains import LLMMathChain
from langchain.chat_models import ChatOpenAI
from langchain.llms import OpenAI
from langchain.utilities import SerpAPIWrapper
llm = ChatOpenAI(temperature=0, model="gpt-3.5-turbo-0613")
search = SerpAPIWrapper()
llm_math_chain = LLMMathChain.from_llm(llm=llm, verbose=True)

tools = [
    Tool(
        name = "Search",
        func=search.run,
        description="useful for when you need to answer questions about current events. You should ask targeted questions"
    ),
    Tool(
        name="Calculator",
        func=llm_math_chain.run,
        description="useful for when you need to answer questions about math"
    )
]

agent = initialize_agent(tools, llm, agent=AgentType.OPENAI_FUNCTIONS, verbose=True)

agent.run("Who is Leo DiCaprio's girlfriend? What is her current age raised to the 0.43 power?")

> Entering new  chain...
    
    Invoking: `Search` with `{'query': 'Leo DiCaprio girlfriend'}`
    
    
    Amidst his casual romance with Gigi, Leo allegedly entered a relationship with 19-year old model, Eden Polani, in February 2023.
    Invoking: `Calculator` with `{'expression': '19^0.43'}`
    

    > Entering new  chain...
    19^0.43```text
    19**0.43
    ```
    ...numexpr.evaluate("19**0.43")...
    
    Answer: 3.547023357958959
    > Finished chain.
    Answer: 3.547023357958959Leo DiCaprio's girlfriend is reportedly Eden Polani. Her current age raised to the power of 0.43 is approximately 3.55.
    
    > Finished chain.


    "Leo DiCaprio's girlfriend is reportedly Eden Polani. Her current age raised to the power of 0.43 is approximately 3.55."

可以看到，该代理人可以成功地完成寻求知识和科学计算得到的结果。

示例2 SQL代理

这个案例是结合大模型和数据库，通过查询表里的数据来回答用户问题，用的关键提示为

_postgres_prompt = """You are a PostgreSQL expert. Given an input question, first create a syntactically correct PostgreSQL query to run, then look at the results of the query and return the answer to the input question.
Unless the user specifies in the question a specific number of examples to obtain, query for at most {top_k} results using the LIMIT clause as per PostgreSQL. You can order the results to return the most informative data in the database.
Never query for all columns from a table. You must query only the columns that are needed to answer the question. Wrap each column name in double quotes (") to denote them as delimited identifiers.
Pay attention to use only the column names you can see in the tables below. Be careful to not query for columns that do not exist. Also, pay attention to which column is in which table.
Pay attention to use CURRENT_DATE function to get the current date, if the question involves "today".

Use the following format:

Question: Question here
SQLQuery: SQL Query to run
SQLResult: Result of the SQLQuery
Answer: Final answer here

"""

下面是实际的工作代码，目前在这个场景中，openai的推理能力最强，能够正确完成这个复杂的代理工作。

## export your openai key first export OPENAI_API_KEY=sk-xxxxx

from langchain.agents import create_sql_agent
from langchain.agents.agent_toolkits import SQLDatabaseToolkit
from langchain.agents import AgentExecutor
from langchain.llms.tongyi import Tongyi

from langchain.sql_database import SQLDatabase
import psycopg2cffi as psycopg2 # pip install psycopg-binary if on linux, just use psycopg2
from langchain.chat_models import ChatOpenAI

db = SQLDatabase.from_uri('postgresql+psycopg2cffi://admin:password123@localhost/admin')


llm = ChatOpenAI(model_name="gpt-3.5-turbo")

toolkit = SQLDatabaseToolkit(db=db,llm=llm)

agent_executor = create_sql_agent(
    llm=llm,
    toolkit=toolkit,
    verbose=True
)

agent_executor.run("using the teachers table, find the first_name and last name of teachers who earn less the mean salary?")

可以看到大模型经过多轮思考，正确回答了我们的问题。

> Entering new AgentExecutor chain...
Action: sql_db_list_tables
Action Input: ""
Observation: teachers
Thought:I can query the "teachers" table to find the first_name and last_name columns.
Action: sql_db_schema
Action Input: "teachers"
Observation: 
CREATE TABLE teachers (
        id INTEGER, 
        first_name VARCHAR(25), 
        last_name VARCHAR(50), 
        school VARCHAR(50), 
        hire_data DATE, 
        salary NUMERIC
)

/*
3 rows from teachers table:
id      first_name      last_name       school  hire_data       salary
None    Janet   Smith   F.D. Roosevelt HS       2011-10-30      36200
None    Lee     Reynolds        F.D. Roosevelt HS       1993-05-22      65000
None    Samuel  Cole    Myers Middle School     2005-08-01      43500
*/
Thought:I can now construct a query to find the first_name and last_name of teachers who earn less than the mean salary.
Action: sql_db_query
Action Input: "SELECT first_name, last_name FROM teachers WHERE salary < (SELECT AVG(salary) FROM teachers) LIMIT 10"
Observation: [('Janet', 'Smith'), ('Samuel', 'Cole'), ('Samantha', 'Bush'), ('Betty', 'Diaz'), ('Kathleen', 'Roush')]
Thought:Retrying langchain.chat_models.openai.ChatOpenAI.completion_with_retry.._completion_with_retry in 4.0 seconds as it raised RateLimitError: Rate limit reached for default-gpt-3.5-turbo in organization org-FDYSniIsv0FIQBi9p4P9Dinn on requests per min. Limit: 3 / min. Please try again in 20s. Contact us through our help center at help.openai.com if you continue to have issues. Please add a payment method to your account to increase your rate limit. Visit https://platform.openai.com/account/billing to add a payment method..
Retrying langchain.chat_models.openai.ChatOpenAI.completion_with_retry.._completion_with_retry in 4.0 seconds as it raised RateLimitError: Rate limit reached for default-gpt-3.5-turbo in organization org-FDYSniIsv0FIQBi9p4P9Dinn on requests per min. Limit: 3 / min. Please try again in 20s. Contact us through our help center at help.openai.com if you continue to have issues. Please add a payment method to your account to increase your rate limit. Visit https://platform.openai.com/account/billing to add a payment method..
Retrying langchain.chat_models.openai.ChatOpenAI.completion_with_retry.._completion_with_retry in 4.0 seconds as it raised RateLimitError: Rate limit reached for default-gpt-3.5-turbo in organization org-FDYSniIsv0FIQBi9p4P9Dinn on requests per min. Limit: 3 / min. Please try again in 20s. Contact us through our help center at help.openai.com if you continue to have issues. Please add a payment method to your account to increase your rate limit. Visit https://platform.openai.com/account/billing to add a payment method..
Retrying langchain.chat_models.openai.ChatOpenAI.completion_with_retry.._completion_with_retry in 8.0 seconds as it raised RateLimitError: Rate limit reached for default-gpt-3.5-turbo in organization org-FDYSniIsv0FIQBi9p4P9Dinn on requests per min. Limit: 3 / min. Please try again in 20s. Contact us through our help center at help.openai.com if you continue to have issues. Please add a payment method to your account to increase your rate limit. Visit https://platform.openai.com/account/billing to add a payment method..
The first_name and last_name of teachers who earn less than the mean salary are Janet Smith, Samuel Cole, Samantha Bush, Betty Diaz, and Kathleen Roush.
Final Answer: Janet Smith, Samuel Cole, Samantha Bush, Betty Diaz, Kathleen Roush

> Finished chain.
'Janet Smith, Samuel Cole, Samantha Bush, Betty Diaz, Kathleen Roush'

问题和挑战

和ChatBot不同，agent的构建对LLM的推理能力提出了更高的要求。ChatBot的答案可能是不正确的，但仍然可以通过人类的判别回馈来确定问答结果是否可以有效，对于无效的答案是否可以有效耐受地直接忽略或者重新回答。但是代理对模型的错误判断的耐受程度则较高。虽然我们可以通过自我反思机制降低代理的错误率，但其当前可以应用的情况依然较小。需要我们不断去探索和开拓新的场景，同时不断提高大模型的推理能力，从而能够搭建更加复杂的代理。

同时，代理目前能够在比较小的场景中胜任工作，比如我们的意思是明确的，同时也只给代理提供了比较小的工具包来执行任务（10个以内），并且每个工具的用差异明显，在这种情况下，LLM能够正确地选择工具执行任务，并得到期望的结果。当一个代理里注册了上百个甚至更多的工具时，LLM就可能无法正确地选择工具执行操作了。这里的一个解决方法是通过层级agent树的方式来解决，父agent负责路由分发任务给不同的子agent。每个子agent则简单包含并使用有限的工具包来执行任务，从而agent复杂场景提高任务完成率。

快来关注

云原生数据仓库AnalyticDB是一款海量处理数据仓库服务，可提供海量数据在线分析服务。在云原生数据仓库能力上全自研企业级存储引擎，支持流式处理数据写入、百亿数据级索引检索数据；支持结构化数据分析、索引检索和全文检索多路召回，支持对问卷千问等主题主流大模型。

作者：清都

点击立即免费试用云产品开启云上实践之旅！

原文链接

本文为阿里云原创内容，未经允许不得转载

你可能感兴趣的:(云栖号技术分享,langchain,云计算,数据库)

索引失效的7中情况 qq_35460875 数据库 sql java
1.列与列对比索引失效情况某两列都建立了单独索引，下面情况不会走索引select*fromtestwhereid=c_id2.列存在NULL值索引失效情况我们在涉及数据库表的时候，应该尽量避免NULL值出现如果避免不了，最好也要给一个default默认值默认值可以为0，-1字符串默认值可以用“空字符串”3.NOT条件索引失效情况where条件中以下情况都会导致索引失效500;select*from
Python pip：包的云计算部署
Pythonpip：包的云计算部署关键词：Pythonpip、云计算部署、包管理、虚拟环境、云平台摘要：本文围绕Pythonpip进行包的云计算部署展开深入探讨。首先介绍了Pythonpip在包管理中的重要性以及云计算部署的背景和意义。接着详细阐述了pip的核心概念和工作原理，包括其与Python生态系统的紧密联系。通过具体的Python代码示例，讲解了pip包管理的核心算法原理和操作步骤。同时，
如何在Ubuntu上检查MySQL是否启动并放开3306端口好奇的菜鸟服务器数据库 ubuntu mysql adb
在使用Ubuntu系统时，MySQL数据库是许多开发人员和系统管理员的常用工具。本文将详细介绍如何在Ubuntu上检查MySQL是否启动，以及如何放开MySQL默认的3306端口，以便允许外部访问。一、检查MySQL是否启动在进行任何操作之前，首先需要确认MySQL服务是否已经启动。以下是几种检查MySQL是否启动的方法：1.使用systemctl命令systemctl是Linux系统中用于管理服
AI Infra：Airweave，让 AI agent 打开 APP 的数据黑盒 sluke
原创陆蔚青平行记陆1、项目概述Airweave是一个开源工具平台，致力于将各类应用、数据库和文档存储内容，转换为可供AIAgent进行语义搜索的知识库。让我想起很久以前的Deeplink。它通过标准化接口（RESTAPI或MCP）输出搜索能力，整体流程涵盖授权接入、内容提取、向量嵌入以及语义查询等模块。正如它的官方网站所说：Airweave-TurnAppsIntoAgent-ReadyKnowl
大数据分析技术的学习路径，不是绝对的，仅供参考水云桐程序员学习大数据数据分析学习方法
阶段一：基础筑基（1-3个月）1.编程语言：Python：掌握基础语法、数据结构、流程控制、函数、面向对象编程、常用库（NumPy,Pandas）。SQL：精通SELECT语句（过滤、排序、分组、聚合、连接）、DDL/DML基础。理解关系型数据库概念（表、主键、外键、索引）。MySQL或PostgreSQL是很好的起点。Java/Scala：深入理解Hadoop/Spark等框架会更有优势。初学者
【赵渝强老师】Oracle RMAN的目录数据库数据库oraclerman
在默认情况下，OracleRMAN将备份时产生的元信息保存到控制文件中。RMAN在执行恢复时，就需要读取控制文件，从而找到备份的信息来完成数据库的恢复。因此，如果控制文件发生了丢失和损坏将导致数据库无法执行恢复。另一方面随着备份的不断增多，也会导致控制文件的大小无限增长。为了更好地管理RMAN备份的元信息，Oracle可以使用一个专门的备份信息存储地来存储这些信息，这就是RMAN的目录数据库（Ca
python模拟内置函数reversed_Python内置函数reversed weixin_39594895
{"moduleinfo":{"card_count":[{"count_phone":1,"count":1}],"search_count":[{"count_phone":4,"count":4}]},"card":[{"des":"阿里技术人对外发布原创技术内容的最大平台；社区覆盖了云计算、大数据、人工智能、IoT、云原生、数据库、微服务、安全、开发与运维9大技术领域。","link1":
HBase 开发：使用Java操作HBase 睡觉的时候我不困 hbase java python
第1关：创建表任务描述相关知识如何使用Java连接HBase数据库HBaseConfigurationConnectionFactory创建表HBase2.X创建表编程要求测试说明任务描述本关任务：使用Java代码在HBase中创建表。相关知识为了完成本关任务，你需要掌握：1.如何使用Java连接HBase数据库，2.如何使用Java代码在HBase中创建表。如何使用Java连接HBase数据库J
红海云签约东莞科创金融集团，科创金融行业人力资源数字化红海云人工智能金融
东莞科技创新金融集团有限公司（以下简称“东莞科创金融集团”）是东莞市属一级重点国有企业，实施以股权投资为核心、以融资增信和园区运营为支撑的“一体两翼”发展战略，致力打造国内一流的“科技创新投资平台公司”。近日，东莞科创金融集团与广州红海云计算股份有限公司正式签署战略合作协议。红海云将依托其行业领先的数字化技术底座、全场景人力资源数字化管理经验及卓越的服务能力，为东莞科创金融集团构建全流程在线化、数
flink数据同步mysql到hive_基于Canal与Flink实现数据实时增量同步(二)
背景在数据仓库建模中，未经任何加工处理的原始业务层数据，我们称之为ODS(OperationalDataStore)数据。在互联网企业中，常见的ODS数据有业务日志数据(Log)和业务DB数据(DB)两类。对于业务DB数据来说，从MySQL等关系型数据库的业务数据进行采集，然后导入到Hive中，是进行数据仓库生产的重要环节。如何准确、高效地把MySQL数据同步到Hive中？一般常用的解决方案是批量
使用canal同步mysql增量数据至rocketmq
使用canal同步mysql增量数据至rocketmq组件版本canal1.1.5rocketmq4.9.2mysql5.7zk3.5.6canal使用参考地址:https://github.com/alibaba/canal主要配置如下:canal.properties:#tcp,kafka,rocketMQ,rabbitMQcanal.serverMode=rocketMQ#数据库名称cana
canal实现Mysql数据同步 BUG指挥官 MySQL数据库相关讲解 mysql 数据库
在当今互联网行业尤其是现在分布式、微服务开发环境下，为了提高搜索效率，以及搜索的精准度，会大量使用Redis、Memcached等NoSQL数据库，也会使用大量的Solr、Elasticsearch等全文检索服务和搜索引擎。那么，这个时候，就会有一个问题需要我们来思考和解决：那就是数据同步的问题！如何将实时变化的数据库中的数据同步到Redis/Memcached或者Solr/Elasticsear
OneCode FormField 基础表单字段功能说明低代码老李低代码软件行业领域设计低代码人工智能 java spring
一、基础表单组件组件名称功能说明CustomFormComponent基础表单布局组件，负责表单数据的加载、绑定、校验和提交，支持自定义布局和事件处理CustomMFormComponent主从表单组件，支持主子表数据结构，实现主表与子表数据的联动加载、保存和校验TableFormComponent表格表单组件，基于数据库表元数据动态生成表单，支持字段权限控制和动态列显示FormLayoutMod
MySQL数据库DML语句总结（最全终极版）山顶风景独好数据库 mysql adb
文章目录一、表记录操作-上1.1、DML概述1.2、插入记录二、表记录操作-下2.1、更新记录2.2、删除记录你好呀！我是山顶风景独好欢迎踏入我的博客世界，能与您在此邂逅，真是缘分使然！愿您在此停留的每一刻，都沐浴在轻松愉悦的氛围中。这里不仅有丰富的知识和趣味横生的内容等您来探索，更是一个自由交流的平台，期待您留下独特的思考与见解。让我们一起踏上这段探索与成长的旅程，携手挖掘更多可能，共同进步！✨
【架构设计（二）】高可用、高并发的 Java 架构设计架构学院 Java成神之路-架构师进阶 java 架构开发语言
【架构设计（二）】高可用、高并发的Java架构设计在互联网业务爆发式增长的今天，高可用和高并发已成为Java系统架构设计的核心目标。本文将围绕负载均衡与高可用架构、缓存设计与优化、数据库读写分离与分库分表三大关键领域，深入剖析其原理，并结合完整的代码示例，帮助开发者构建稳定高效的系统架构。无套路、关注即可领。持续更新中关注公众号：搜【架构研究站】回复：资料领取，即可获取全部面试题以及1000+份学
spring boot 之集成 druid数据库连接池我叫晨曦啊 spring boot spring boot 数据库后端
springboot版本：2.3.12.RELEASEMySQL版本：8.0Druid简介Druid是阿里开源的一个数据库连接池和SQL查询优化工具，用于提高应用程序对数据库的性能和可扩展性。主要提供的功能：数据库连接池、数据库连接池监控、SQL查询优化、数据源管理、防御SQL注入、统计和监控。引入pom依赖com.alibabadruid-spring-boot-starter1.2.16com
基于 Alpine 基础镜像构建 H2 Database 镜像
2019独角兽企业重金招聘Python工程师标准>>>基于Alpine基础镜像构建H2Database镜像0.说明x.x.xxx为h2版本,例:h2-1.4.197.jar1.H2数据库、Docker镜像文件Platform-IndependentZipalpine-3.8.0-1.0.tar2.解压下载的压缩文件,解压后目录如下h2-yyyy-mm-dd(此层文件夹省略)-h2-binh2.ba
【Spring Boot】HikariCP 连接池 YAML 配置详解
文章目录一、HikariCPYAML配置详解基础配置高级配置数据库特定配置MySQL优化配置PostgreSQL优化配置生产环境推荐配置配置说明与优化建议常见问题解决二、拓展1、什么是MySQL8小时问题问题本质解决方案1.调整MySQL配置（不推荐）2.优化连接池配置（推荐）HikariCP配置方案：Druid配置方案：3.最佳实践组合问题验证方法其他注意事项一、HikariCPYAML配置详解
【Spring Boot】主从数据库 - 初探 ladymorgana 日常工作总结 spring boot 数据库后端主从数据库
文章目录一、何时需要开启从数据库主要开启场景配置建议其他考虑因素最佳实践二、SpringBoot中使用Druid开启从库的表同步问题主从同步机制可能出现的问题解决方案1.初始设置主从同步2.确保表结构一致3.SpringBoot中的容错配置最佳实践一、何时需要开启从数据库开启从数据库(读写分离)通常基于以下几个方面的考虑：主要开启场景高读取负载场景当您的应用读取操作(QPS)远高于写入操作时(如8
POI实现Excel表格导入到数据库 phl成为自己的太阳 java excel导入到数据库表格数据 java mysql
POI实现Excel导入到数据库1.创建maven工程,工程结构如下2.导入依赖和编写配置文件org.springframework.bootspring-boot-parent2.0.0.RELEASE1.8org.springframework.bootspring-boot-starter-weborg.projectlomboklombokorg.apache.poipoi-ooxml4.
Python 爬虫实战：DOTA2 比赛数据全量采集（含赛事战报解析与数据库存储西攻城狮北 python 爬虫数据库
一、引言DOTA2作为一款全球知名的多人在线战术竞技游戏，拥有庞大的玩家群体和丰富的比赛数据。这些数据对于电竞分析师、数据研究员、游戏玩家等具有极高的价值。通过爬取DOTA2比赛数据，可以深入了解比赛详情、战队表现、选手数据等信息，为电竞行业提供数据支持。二、开发环境搭建（一）编程语言与工具选择选择Python语言，利用其丰富的库和简洁语法，高效完成爬虫开发任务。搭配PyCharm集成开发环境，享
网络安全理论第二章阿瓒119 网络安全
2.1影响信息安全的隐患(脆弱性)先天不足——网络协议有缺陷网络应用层的安全隐患IP层通信的欺骗性（假冒身份）局域网中以太网协议的数据传输机制是广播发送，使得系统和网络具有易被监视性（监听账号和密码）2.1影响信息安全的隐患(脆弱性)先天不足——系统软件有缺陷操作系统有漏洞应用软件有陷门数据库管理系统的脆弱性SQLServer数据库，超级管理员saMySQL数据库，信息数据库I
Flink OceanBase CDC 环境配置与验证 Edingbrugh.南空运维大数据 flink flink oceanbase 大数据
一、OceanBase数据库核心配置1.环境准备与版本要求版本要求：OceanBaseCE4.0+或OceanBaseEE2.2+组件依赖：需部署LogProxy服务（社区版/企业版部署方式不同）兼容模式：支持MySQL模式（默认）和Oracle模式2.创建用户与权限配置在sys租户创建管理用户（社区版示例）：--连接sys租户（默认端口2881）mysql-h127.0.0.1-P2881-ur
MySQL 锁机制深度解析：从分类到实战优化 Edingbrugh.南空运维 mysql 数据库
前言：锁的本质与意义在多并发场景下，数据库锁是协调多个进程/线程访问共享资源的核心机制。MySQL通过不同类型的锁实现数据一致性、隔离性和并发性的平衡。理解锁机制不仅能帮助开发者避免并发问题，还能优化系统性能。本文将从锁的分类、原理、实战场景到优化策略，全面解析MySQL锁机制。一、MySQL锁的多维分类1.按性能与策略分类乐观锁（OptimisticLock）假设并发冲突概率低，不主动加锁，而是
Flink MongoDB CDC 环境配置与验证 Edingbrugh.南空运维大数据 flink flink mongodb 大数据
一、MongoDB数据库核心配置1.环境准备与集群要求MongoDBCDC依赖ChangeStreams特性，需满足以下条件：版本要求：MongoDB≥3.6集群模式：副本集（ReplicaSet）或分片集群（ShardedCluster）存储引擎：WiredTiger（默认自3.2版本起）副本集协议：pv1（MongoDB4.0+默认）验证集群配置：#连接MongoDBshellmongo--h
Python 开发法律条文咨询APP Geeker-2025 python
#法律条文咨询APP-Python实现方案我将设计一个基于Python的法律条文咨询应用，提供一个直观的界面让用户轻松查找和浏览法律条文。##设计思路-使用Flask作为后端框架，轻量且高效-SQLite数据库存储法律条文数据-前端使用Bootstrap实现响应式设计-实现关键词搜索和分类浏览功能-提供条文详情展示和书签功能##完整实现代码###文件结构```legal_app/├──app.py
网络语言系列&php系列【仅供参考】：ThinkPHP6的ORM模型坦笑&&life 网络 php 开发语言
ThinkPHP6的ORM模型ThinkPHP6的ORM模型1.ORM简介2.ThinkPHP6ORM使用2.1数据库配置2.2创建模型2.3使用模型3.复杂查询4.事务处理ThinkPHP6的ORM模型ThinkPHP6是一个广泛使用的PHP框架，其ORM（对象关系映射）模型是其核心功能之一。ORM模型允许开发者通过面向对象的方式来操作数据库，极大地简化了数据库操作代码，提高了开发效率。1.OR
数据报表-自定义公式运算 kk star java jep BI 数据报表
本专栏用于解析自己开源的项目代码，作为复盘和学习使用。欢迎大家一起交流本样例说明源码开源在：ruoyi-reoprtgitee仓库ruoyi-reportgithub仓库欢迎大家到到项目中多给点star支持，对项目有建议或者有想要了解的欢迎一起讨论需求背景在报表数据处理中，用户先使用数据库中的字段向数据源读取到了需要的数据，或者使用字典将数据进行转化。对于一些特殊的字段，希望能进行一定的运算后，将
报表系统-连接数据库操作 kk star java BI 报表数据库
本专栏用于解析自己开源的项目代码，作为复盘和学习使用。欢迎大家一起交流本样例说明源码开源在：ruoyi-reoprtgitee仓库ruoyi-reportgithub仓库欢迎大家到到项目中多给点star支持，对项目有建议或者有想要了解的欢迎一起讨论连接数据库这一模块整体参考的是AJ-report的模块：去掉了目前不支持的数据库格式，仅保留了mysql和sqlserverhttps://gitee.
数据库锁等待时间过长问题的深度解析与大数据解决方案百态老人数据库大数据
一、锁等待问题的核心原因与日志特征锁等待超时是数据库高并发场景下的典型瓶颈问题，其根本原因与日志特征可归纳为以下维度：事务管理缺陷原因：未提交的长事务（如代码分支遗漏提交）、隐式事务（自动提交关闭）导致锁持有时间过长。日志特征：information_schema.innodb_trx表中存在trx_started时间早于当前时间数分钟的事务。错误日志中频繁出现Lockwaittimeoutexc
多线程编程之理财周凡杨 java 多线程生产者消费者理财
现实生活中，我们一边工作，一边消费，正常情况下会把多余的钱存起来，比如存到余额宝，还可以多挣点钱，现在就有这个情况：我每月可以发工资20000万元（暂定每月的1号），每月消费5000（租房+生活费）元（暂定每月的1号），其中租金是大头占90%，交房租的方式可以选择（一月一交，两月一交、三月一交），理财：1万元存余额宝一天可以赚1元钱，
[Zookeeper学习笔记之三]Zookeeper会话超时机制 bit1129 zookeeper
首先，会话超时是由Zookeeper服务端通知客户端会话已经超时，客户端不能自行决定会话已经超时，不过客户端可以通过调用Zookeeper.close()主动的发起会话结束请求，如下的代码输出内容 Created /zoo-739160015 CONNECTEDCONNECTED .............CONNECTEDCONNECTED CONNECTEDCLOSEDCLOSED
SecureCRT快捷键 daizj secureCRT 快捷键
ctrl + a : 移动光标到行首ctrl + e ：移动光标到行尾crtl + b: 光标前移1个字符crtl + f: 光标后移1个字符crtl + h : 删除光标之前的一个字符ctrl + d ：删除光标之后的一个字符crtl + k ：删除光标到行尾所有字符crtl + u : 删除光标至行首所有字符crtl + w: 删除光标至行首
Java 子类与父类这间的转换周凡杨 java 父类与子类的转换
最近同事调的一个服务报错，查看后是日期之间转换出的问题。代码里是把 java.sql.Date 类型的对象强制转换为 java.sql.Timestamp 类型的对象。报java.lang.ClassCastException。代码：
可视化swing界面编辑朱辉辉33 eclipse swing
今天发现了一个WindowBuilder插件，功能好强大，啊哈哈，从此告别手动编辑swing界面代码，直接像VB那样编辑界面，代码会自动生成。首先在Eclipse中点击help，选择Install New Software,然后在Work with中输入WindowBui
web报表工具FineReport常用函数的用法总结（文本函数）老A不折腾 finereport web报表工具报表软件 java报表
文本函数 CHAR CHAR(number):根据指定数字返回对应的字符。CHAR函数可将计算机其他类型的数字代码转换为字符。 Number:用于指定字符的数字，介于1Number:用于指定字符的数字，介于165535之间（包括1和65535）。示例: CHAR(88)等于“X”。 CHAR(45)等于“-”。 CODE CODE(text):计算文本串中第一个字
mysql安装出错林鹤霄 mysql安装
[root@localhost ~]# rpm -ivh MySQL-server-5.5.24-1.linux2.6.x86_64.rpm Preparing... #####################
linux下编译libuv aigo libuv
下载最新版本的libuv源码，解压后执行： ./autogen.sh 这时会提醒找不到automake命令，通过一下命令执行安装（redhat系用yum，Debian系用apt-get）： # yum -y install automake # yum -y install libtool 如果提示错误：make: *** No targe
中国行政区数据及三级联动菜单 alxw4616
近期做项目需要三级联动菜单,上网查了半天竟然没有发现一个能直接用的! 呵呵,都要自己填数据....我了个去这东西麻烦就麻烦的数据上. 哎,自己没办法动手写吧. 现将这些数据共享出了,以方便大家.嗯,代码也可以直接使用文件说明 lib\area.sql -- 县及县以上行政区划分代码（截止2013年8月31日)来源：国家统计局发布时间：2014-01-17 15:0
哈夫曼加密文件百合不是茶哈夫曼压缩哈夫曼加密二叉树
在上一篇介绍过哈夫曼编码的基础知识,下面就直接介绍使用哈夫曼编码怎么来做文件加密或者压缩与解压的软件,对于新手来是有点难度的,主要还是要理清楚步骤; 加密步骤: 1,统计文件中字节出现的次数,作为权值 2,创建节点和哈夫曼树 3,得到每个子节点01串 4,使用哈夫曼编码表示每个字节
JDK1.5 Cyclicbarrier实例 bijian1013 java thread java多线程 Cyclicbarrier
CyclicBarrier类一个同步辅助类，它允许一组线程互相等待，直到到达某个公共屏障点 (common barrier point)。在涉及一组固定大小的线程的程序中，这些线程必须不时地互相等待，此时 CyclicBarrier 很有用。因为该 barrier 在释放等待线程后可以重用，所以称它为循环的 barrier。 CyclicBarrier支持一个可选的 Runnable 命令，
九项重要的职业规划 bijian1013 工作学习
一. 学习的步伐不停止古人说，活到老，学到老。终身学习应该是您的座右铭。世界在不断变化，每个人都在寻找各自的事业途径。您只有保证了足够的技能储
【Java范型四】范型方法 bit1129 java
范型参数不仅仅可以用于类型的声明上，例如 package com.tom.lang.generics; import java.util.List; public class Generics<T> { private T value; public Generics(T value) { this.value =
【Hadoop十三】HDFS Java API基本操作 bit1129 hadoop
package com.examples.hadoop; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.FSDataInputStream; import org.apache.hadoop.fs.FileStatus; import org.apache.hadoo
ua实现split字符串分隔 ronin47 lua split
LUA并不象其它许多"大而全"的语言那样，包括很多功能，比如网络通讯、图形界面等。但是LUA可以很容易地被扩展：由宿主语言(通常是C或 C++)提供这些功能，LUA可以使用它们，就像是本来就内置的功能一样。LUA只包括一个精简的核心和最基本的库。这使得LUA体积小、启动速度快，从而适合嵌入在别的程序里。因此在lua中并没有其他语言那样多的系统函数。习惯了其他语言的字符串分割函
java-从先序遍历和中序遍历重建二叉树 bylijinnan java
public class BuildTreePreOrderInOrder { /** * Build Binary Tree from PreOrder and InOrder * _______7______ / \ __10__ ___2 / \ / 4
openfire开发指南《连接和登陆》开窍的石头 openfire 开发指南 smack
第一步官网下载smack.jar包下载地址：http://www.igniterealtime.org/downloads/index.jsp#smack 第二步把smack里边的jar导入你新建的java项目中开始编写smack连接openfire代码 p
[移动通讯]手机后盖应该按需要能够随时开启 comsci 移动
看到新的手机，很多由金属材质做的外壳，内存和闪存容量越来越大，CPU速度越来越快，对于这些改进，我们非常高兴，也非常欢迎但是，对于手机的新设计，有几点我们也要注意第一：手机的后盖应该能够被用户自行取下来，手机的电池的可更换性应该是必须保留的设计,
20款国外知名的php开源cms系统 cuiyadll cms
内容管理系统，简称CMS，是一种简易的发布和管理新闻的程序。用户可以在后端管理系统中发布，编辑和删除文章，即使您不需要懂得HTML和其他脚本语言，这就是CMS的优点。在这里我决定介绍20款目前国外市面上最流行的开源的PHP内容管理系统，以便没有PHP知识的读者也可以通过国外内容管理系统建立自己的网站。 1. Wordpress WordPress的是一个功能强大且易于使用的内容管
Java生成全局唯一标识符 darrenzhu java uuid unique identifier id
How to generate a globally unique identifier in Java http://stackoverflow.com/questions/21536572/generate-unique-id-in-java-to-label-groups-of-related-entries-in-a-log http://stackoverflow
php安装模块检测是否已安装过, 使用的SQL语句 dcj3sjt126com sql
SHOW [FULL] TABLES [FROM db_name] [LIKE 'pattern'] SHOW TABLES列举了给定数据库中的非TEMPORARY表。您也可以使用mysqlshow db_name命令得到此清单。本命令也列举数据库中的其它视图。支持FULL修改符，这样SHOW FULL TABLES就可以显示第二个输出列。对于一个表，第二列的值为BASE T
5天学会一种 web 开发框架 dcj3sjt126com Web 框架 framework
web framework层出不穷，特别是ruby/python,各有10+个,php/java也是一大堆根据我自己的经验写了一个to do list,按照这个清单，一条一条的学习，事半功倍，很快就能掌握一共25条，即便很磨蹭，2小时也能搞定一条，25*2=50。只需要50小时就能掌握任意一种web框架各类web框架大同小异:现代web开发框架的6大元素，把握主线，就不会迷路建议把本文
Gson使用三(Map集合的处理,一对多处理) eksliang json gson Gson map Gson 集合处理
转载请出自出处：http://eksliang.iteye.com/blog/2175532 一、概述 Map保存的是键值对的形式，Json的格式也是键值对的，所以正常情况下，map跟json之间的转换应当是理所当然的事情。二、Map参考实例 package com.ickes.json; import java.lang.refl
cordova实现“再点击一次退出”效果 gundumw100 android
基本的写法如下： document.addEventListener("deviceready", onDeviceReady, false); function onDeviceReady() { //navigator.splashscreen.hide(); document.addEventListener("b
openldap configuration leaning note iwindyforest configuration
hostname // to display the computer name hostname <changed name> // to change go to: /etc/sysconfig/network, add/modify HOSTNAME=NEWNAME to change permenately dont forget to change /etc/hosts
Nullability and Objective-C 啸笑天 Objective-C
https://developer.apple.com/swift/blog/?id=25 http://www.cocoachina.com/ios/20150601/11989.html http://blog.csdn.net/zhangao0086/article/details/44409913 http://blog.sunnyxx
jsp中实现参数隐藏的两种方法 macroli JavaScript jsp
在一个JSP页面有一个链接，//确定是一个链接?点击弹出一个页面，需要传给这个页面一些参数。//正常的方法是设置弹出页面的src="***.do?p1=aaa&p2=bbb&p3=ccc"//确定目标URL是Action来处理?但是这样会在页面上看到传过来的参数，可能会不安全。要求实现src="***.do"，参数通过其他方法传！//////
Bootstrap A标签关闭modal并打开新的链接解决方案 qiaolevip 每天进步一点点学习永无止境 bootstrap 纵观千象
Bootstrap里面的js modal控件使用起来很方便，关闭也很简单。只需添加标签 data-dismiss="modal" 即可。可是偏偏有时候需要a标签既要关闭modal，有要打开新的链接，尝试多种方法未果。只好使用原始js来控制。 <a href="#/group-buy" class="btn bt
二维数组在Java和C中的区别流淚的芥末 java c 二维数组数组
Java代码： public class test03 { public static void main(String[] args) { int[][] a = {{1},{2,3},{4,5,6}}; System.out.println(a[0][1]); } } 运行结果： Exception in thread "mai
systemctl命令用法 wmlJava linux systemctl
对比表，以 apache / httpd 为例任务旧指令新指令使某服务自动启动 chkconfig --level 3 httpd on systemctl enable httpd.service 使某服务不自动启动 chkconfig --level 3 httpd off systemctl disable httpd.service 检查服务状态 service h