机器学习社区

基于 LangChain + GLM搭建知识本地库

一种利用 langchain 思想实现的基于本地知识库的问答应用，目标期望建立一套对中文场景与开源模型支持友好、可离线运行的知识库问答解决方案。

受GanymedeNil的项目document.ai和AlexZhangji创建的ChatGLM-6B Pull Request启发，建立了全流程可使用开源模型实现的本地知识库问答应用。现已支持使用ChatGLM-6B等大语言模型直接接入，或通过fastchat api形式接入Vicuna, Alpaca, LLaMA, Koala, RWKV等模型。

今天分享中Embedding默认选用的是GanymedeNil/text2vec-large-chinese，LLM默认选用的是ChatGLM-6B。依托上述模型，本项目可实现全部使用开源模型离线私有部署。

实现原理如下图所示，过程包括加载文件 -> 读取文本 -> 文本分割 -> 文本向量化 -> 问句向量化 -> 在文本向量中匹配出与问句向量最相似的top k个 -> 匹配出的文本作为上下文和问题一起添加到prompt中 -> 提交给LLM生成回答。

从文档处理角度来看，实现流程如下：

本项目未涉及微调、训练过程，但可利用微调或训练对本项目效果进行优化。核心部分代码为：

 执行初始化    
init_cfg(LLM_MODEL, EMBEDDING_MODEL, LLM_HISTORY_LEN)    
# 使用 ChatGLM 的 readme 进行测试    
vector_store = init_knowledge_vector_store("/home/mw/project/test_chatglm_readme.md")

中vector_store的初始化可以传递 txt、docx、md 格式文件，或者包含md文件的目录。更多知识库加载方式可以参考langchain文档，通过修改 init_knowledge_vector_store 方法进行兼容。

技术交流群

前沿技术资讯、算法交流、求职内推、算法竞赛、面试交流(校招、社招、实习)等、与 10000+来自港科大、北大、清华、中科院、CMU、腾讯、百度等名校名企开发者互动交流~

建了技术交流群&星球！想要本文源码、进交流群的同学，可以直接加微信号：mlc2060。加的时候备注一下：研究方向 +学校/公司，即可。然后就可以拉你进群了。

方式①、添加微信号：mlc2060，备注：技术交流
方式②、微信搜索公众号：机器学习社区，后台回复：技术交流

硬件需求

ChatGLM-6B 模型硬件需求

注：如未将模型下载至本地，请执行前检查$HOME/.cache/huggingface/文件夹剩余空间，模型文件下载至本地需要15GB存储空间。

MOSS 模型硬件需求

注：如未将模型下载至本地，请执行前检查$HOME/.cache/huggingface/文件夹剩余空间，模型文件下载至本地需要70GB存储空间

Embedding 模型硬件需求

本项目中默认选用的Embedding 模型GanymedeNil/text2vec-large-chinese约占用显存3GB，也可修改为在CPU中运行。

Docker 部署

为了能让容器使用主机GPU资源，需要在主机上安装 NVIDIA Container Toolkit。具体安装步骤如下：

sudo apt-get update
sudo apt-get install -y nvidia-container-toolkit-base
sudo systemctl daemon-reload 
sudo systemctl restart docker

安装完成后，可以使用以下命令编译镜像和启动容器：

docker build -f Dockerfile-cuda -t chatglm-cuda:latest .
docker run --gpus all -d --name chatglm -p 7860:7860  chatglm-cuda:latest

#若要使用离线模型，请配置好模型路径，然后此repo挂载到Container
docker run --gpus all -d --name chatglm -p 7860:7860 -v ~/github/langchain-ChatGLM:/chatGLM  chatglm-cuda:latest

开发部署

软件需求

本项目已在 Python 3.8.1 - 3.10，CUDA 11.7 环境下完成测试。已在 Windows、ARM 架构的 macOS、Linux 系统中完成测试。

vue前端需要node18环境

从本地加载模型

请参考 THUDM/ChatGLM-6B#从本地加载模型

1. 安装环境

环境检查

# 首先，确信你的机器安装了 Python 3.8 及以上版本
$ python --version
Python 3.8.13

# 如果低于这个版本，可使用conda安装环境
$ conda create -p /your_path/env_name python=3.8

# 激活环境
$ source activate /your_path/env_name
$ pip3 install --upgrade pip

# 关闭环境
$ source deactivate /your_path/env_name

# 删除环境
$ conda env remove -p  /your_path/env_name

项目依赖

# 拉取仓库
$ git clone https://github.com/imClumsyPanda/langchain-ChatGLM.git

# 进入目录
$ cd langchain-ChatGLM

# 项目中 pdf 加载由先前的 detectron2 替换为使用 paddleocr，如果之前有安装过 detectron2 需要先完成卸载避免引发 tools 冲突
$ pip uninstall detectron2

# 检查paddleocr依赖，linux环境下paddleocr依赖libX11，libXext
$ yum install libX11
$ yum install libXext

# 安装依赖
$ pip install -r requirements.txt

# 验证paddleocr是否成功，首次运行会下载约18M模型到~/.paddleocr
$ python loader/image_loader.py

2. 设置模型默认参数

在开始执行 Web UI 或命令行交互前，请先检查 configs/model_config.py 中的各项模型参数设计是否符合需求。

如需通过 fastchat 以 api 形式调用 llm，请参考 fastchat 调用实现

3. 执行脚本体验 Web UI 或命令行交互

注：鉴于环境部署过程中可能遇到问题，建议首先测试命令行脚本。建议命令行脚本测试可正常运行后再运行 Web UI。

执行 cli_demo.py 脚本体验命令行交互：

$ python cli_demo.py

或执行 webui.py 脚本体验 Web 交互

$ python webui.py

或执行 api.py 利用 fastapi 部署 API

$ python api.py

或成功部署 API 后，执行以下脚本体验基于 VUE 的前端页面

$ cd views 

$ pnpm i

$ npm run dev

VUE 前端界面如下图所示：

对话界面

知识问答界面

bing搜索界面

WebUI 界面如下图所示：

对话Tab界面

知识库测试Beta Tab界面

模型配置Tab界面

Web UI 可以实现如下功能：

运行前自动读取configs/model_config.py中LLM及Embedding模型枚举及默认模型设置运行模型，如需重新加载模型，可在模型配置 Tab 重新选择后点击重新加载模型进行模型加载；
可手动调节保留对话历史长度、匹配知识库文段数量，可根据显存大小自行调节；
对话 Tab 具备模式选择功能，可选择 LLM对话与知识库问答模式进行对话，支持流式对话；
添加配置知识库功能，支持选择已有知识库或新建知识库，并可向知识库中新增上传文件/文件夹，使用文件上传组件选择好文件后点击上传文件并加载知识库，会将所选上传文档数据加载至知识库中，并基于更新后知识库进行问答；
新增知识库测试 Beta Tab，可用于测试不同文本切分方法与检索相关度阈值设置，暂不支持将测试参数作为对话 Tab 设置参数。
后续版本中将会增加对知识库的修改或删除，及知识库中已导入文件的查看。

你可能感兴趣的:(大模型,CV,自然语言,langchain,chatgpt,大模型,多模态)

React Compiler核心原理：新一代响应式引擎如何实现毫秒级热更新威哥说编程 react.js javascript 前端
React在前端开发中已经成为构建用户界面的标准库，它的声明式编程模型和组件化设计为开发者提供了极大的灵活性和便利性。然而，随着React应用变得越来越复杂，性能成为了一个不可忽视的问题。特别是在大型应用中，如何实现快速的组件更新和响应式渲染，成为了提高开发体验和用户体验的关键。在过去几年中，React团队致力于改进React的更新机制，以解决性能瓶颈和提升开发体验。ReactCompiler（或
LlamaIndex架构设计：大模型长期记忆模块竟暗藏图数据库玄机威哥说编程数据库 llama
随着人工智能技术的不断发展，大型语言模型（LLM）已经在自然语言处理、文本生成、对话系统等领域取得了显著的进展。然而，尽管这些模型在理解和生成语言方面表现出色，它们却面临着一个重要问题——长期记忆的缺失。传统的语言模型通常只依赖于当前输入的信息，并且无法记住过去的上下文或从历史中积累的知识。这使得它们在需要长期记忆或复杂知识推理的任务中表现不佳。为了解决这一问题，越来越多的研究开始探索如何为大模型
DeepSeek- R1 原理介绍 kcarly 大模型知识乱炖杂谈 DeepSeek R1 原理介绍
DeepSeek-R1是由DeepSeek公司推出的一款基于强化学习（RL）的开源推理模型，其核心原理和特点如下：1.核心技术与架构强化学习驱动：DeepSeek-R1是首个完全通过强化学习训练的大型语言模型，无需依赖监督微调（SFT）或人工标注数据。它采用组相对策略优化（GRPO）算法，通过奖励机制和规则引导模型生成结构化思维链（CoT），从而提升推理能力。多阶段训练流程：模型采用冷启动阶段、强
2024年最全Doris：读取Doris数据的N种方法_访问 doris，阿里大牛教你自己写大数据开发第三方库 2401_84181108 程序员大数据
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化资料的朋友，可以戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！arrow-memory-netty${arrow.v
PyTorch动态计算图:如何灵活构建复杂模型 AI天才研究院计算 AI大模型企业级应用开发实战 ChatGPT 计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
PyTorch动态计算图:如何灵活构建复杂模型关键词：PyTorch、动态计算图、自动微分、反向传播、神经网络、模型构建、计算图优化文章目录PyTorch动态计算图:如何灵活构建复杂模型1.背景介绍1.1深度学习框架的发展1.2静态图与动态图的对比1.3PyTorch的崛起及其优势2.核心概念与联系2.1PyTorch中的张量(Tensor)2.2自动微分(Autograd)机制2.3动态计算图的
深度学习框架PyTorch原理与实践 AI天才研究院 AI实战大数据人工智能语言模型 Java Python 架构设计
作者：禅与计算机程序设计艺术文章目录1.简介2.背景介绍3.基本概念和术语3.1PyTorch简介3.2PyTorch的特点1）自动求导机制2）GPU加速3）模型部署4）数据管道5）代码阅读友好4.核心算法原理4.1神经网络结构4.2神经网络层4.3激活函数5.实际案例——MNIST手写数字识别数据准备模型定义训练测试整体代码1.简介Deeplearning(DL)hasbeenanincreas
自定义数据集使用paddlepaddle框架实现逻辑回归并保存模型，然后保存模型后再加载模型进行预测辞落山逻辑回归
1.引言在这篇博客中，我们将使用PaddlePaddle框架实现一个逻辑回归模型，利用NumPy自定义数据集进行训练，并保存模型。最后，我们将演示如何加载保存的模型并进行预测。2.环境设置首先，确保已安装PaddlePaddle和NumPy：pipinstallpaddlepaddlenumpy3.数据集准备我们使用NumPy自定义一个简单的二分类数据集：importnumpyasnp#生成简单数
Databricks 开源 LLM，训练只需三个小时唐城 AI-毕业设计全套 spring log4j postgresql 数据库 java
大数据分析公司DatabricksInc近日也加入了生成式AI领域的竞争之中，发布了一个名为Dolly的开源大型语言模型，将模型命名为Dolly是为了向第一只克隆羊多莉致敬。像ChatGPT和Bard这样的生成式AI，它们使用的数据通常来自于在成千上万不同网站，使用的数据量十分惊人，而且想要使用这些数据训练AI还需要数以千计的强大GPU在背后提供支持。Databricks希望通过开源Dolly及其
解决_pickle.UnpicklingError: A load persistent id instruction was encountered,but no persistent_load 邻家的狗2 深度学习人工智能机器学习
报错信息：_pickle.UnpicklingError:Aloadpersistentidinstructionwasencountered,butnopersistent_loadfunctionwasspecified.报错原因：在加载模型参数时，torch版本发生变化，我报错因为训练前torch版本比较高，后面需要较低版本导致两个版本不一致发生报错。解决办法：将训练重新训练一次就欧克了，保
Python第三阶段学习 Django day08 MetalTrader Tude-Py django python
《DjangoWeb框架教学笔记》目录文章目录《DjangoWeb框架教学笔记》目录文件上传Django中的用户认证(使用Django认证系统)auth基本模型操作:auth扩展字段电子邮件发送项目部署uWSGI网关接口配置(ubuntu18.04配置)nginx及反向代理配置nginx配置静态文件路径404/500界面邮件告警文件上传文件上传必须为POST提交方式表单中文件上传时必须有带有enc
JavaWeb——CSS的使用糖JL是我儿 JavaWeb css 前端 javascript
CSS层叠样式表(英文全称:(cascadingstlesheets)能够对网页中元素位置的排版进行像素级精确控制，支持几乎所有的字体字号样式，拥有对网页对象和模型样式编辑的能力,简单来说,CSS用来美化页面一、CSS的引入方式:1.行内式：通过元素开始标签的style属性引入语法:style="样式名:样式值;样式名:样式值;......"缺点:代码复用度低，不利于维护CSS样式和HTML结构代
【笔记】架构上篇Day9b 六张图，带你回顾架构师的六条生存法则 gikod 系统架构笔记架构
六张图，带你回顾架构师的六条生存法则简介：包含模块一架构师的六大生存法则-模块小结：这些生存法则的逻辑是什么？&六张图，带你回顾架构师的六条生存法则2024-08-2922:40:12你好，我是辰洋，是《郭东白的架构课》的负责人。这是我们在这个专栏的第一次正式会面，你可能会觉得与我有些陌生。不过从我的眼光来看，对于专栏里的每一行字、每一个案例，对于在认真学习、留言打卡的你，我都太熟悉了。好了，感性
每日 Java 面试题分享【第 20 天】一只蜘猪【2025最新版】Java 基础面试题 java 开发语言面试 IO
欢迎来到每日Java面试题分享栏目！订阅专栏，不错过每一天的练习今日分享3道面试题目！评论区复述一遍印象更深刻噢~目录问题一：什么是BIO、NIO、AIO？问题二：什么是Channel？问题三：什么是Selector？问题一：什么是BIO、NIO、AIO？面试官视角拆解：这个问题考察对JavaI/O模型的体系化理解，以及不同场景下的技术选型能力。回答要体现三个层次：基础概念对比（核心特征+工作机制
自定义数据集使用pytorch框架实现逻辑回归并保存模型，然后保存模型后再加载模型进行预测 Z211613347 机器学习深度学习人工智能
importtorchimporttorch.nnasnnimporttorch.optimasoptimfromtorch.utils.dataimportDataset,DataLoaderimporttorchvision.transformsastransformsimportpandasaspdimportnumpyasnpclassCustomDataset(Dataset):def_
分布式id-雪花算法精通HelloWorld! 分布式 java 算法
通常我们在生成用户id或者订单id时都需要一个全局唯一的id来唯一标识，在单体情况下我们可以使用UUID、时间戳、数据库自增id而在分布式情况下，需要考虑大量服务器之间生成的id全局唯一，所以就使用了今天要介绍的雪花算法来生成分布式下的全局id单体服务UUID、时间戳、数据库自增id存在以下问题：UUID是无序的且数据非常大（128bit），且一般会使用36位长度的字符串存储，这样会导致id存入数
DeepSeek R1 AI 模型到底牛在哪里？老马啸西风 java
DeepSeekR1模型的优势原文地址：DeepSeekR1模型的优势最近都说DeepSeekR1模型很牛，到底牛在哪里？卓越的推理能力数学推理：在AIME2024数学竞赛中，DeepSeekR1取得了79.8%的pass@1得分，略微超过OpenAI-o1-1217。在MATH-500基准测试上，它获得了97.3%的高分，与OpenAI-o1-1217的性能相当，并且显著优于其他模型。代码推理：
DeepSeek R1 AI 论文翻译老马啸西风 java
摘要原文地址：DeepSeekR1AI论文翻译我们介绍了我们的第一代推理模型，DeepSeek-R1-Zero和DeepSeek-R1。DeepSeek-R1-Zero是一个通过大规模强化学习（RL）训练的模型，且在此过程中未使用监督微调（SFT）作为预处理步骤，展现出了显著的推理能力。通过RL，DeepSeek-R1-Zero自然而然地展现了许多强大且引人注目的推理行为。然而，它也遇到了一些挑战
落地DevOps的挑战及其解决方法 DevOps探索者 DevOps devops 运维自动化
开发团队在采用DevOps时面临哪些常见挑战？以及克服这些挑战的解决方案是什么？在DevOps软件开发方法中，开发和运营团队的传统分离被消除，取而代之的是协作和集成的团队模型。DevOps工程师的工作涉及整个应用程序生命周期，从开发和测试到部署和运营。这种方法鼓励团队成员开发多样化的技能，因为他们不局限于单一职能。DevOps还提倡一种共同负责开发软件质量和可靠性的文化。通过打破团队之间的隔阂并促
Yuan 2.0-M32 是一个基于 Yuan 2.0 架构的双语混合专家 (MoE) 语言模型，旨在以更少的参数和计算量实现更高的准确率东方佑量子变法架构语言模型人工智能
主要创新点：注意力路由器(AttentionRouter):提出了一种新的路由器网络，考虑了专家之间的相关性，从而提高了模型的准确率。高效计算：使用MoE架构，40B总参数中仅有3.7B激活参数，训练计算消耗仅为同规模密集模型的9.25%，推理成本与3.7B参数的密集模型相当。性能优异：在代码生成、数学解题、科学知识和推理等多个领域展现出与Llama3-70B等大型模型相当甚至更优的性能。模型结构
构建高效可扩展Web应用：Hapi.js项目架构实践芦苇毛
本文还有配套的精品资源，点击获取简介：Hapi.js是一个专为Web应用和服务设计的服务器端框架，由WalmartLabs开发，以模块化和插件驱动的架构闻名。Node.js作为其运行环境，提供了事件驱动和非阻塞I/O模型。本项目展示了Hapi.js的核心概念，包括其插件系统、路由和处理程序、请求和响应对象以及验证和序列化功能。同时介绍了典型的Hapi.js项目结构，包括服务器初始化、路由定义、插件
构建由局部观测、分布式决策与全局奖励协同作用的多智能体强化学习系统由数入道分布式强化学习智能体
1.问题背景与建模：从自治调度到POMDP1.1自治调度问题与多智能体环境在实际应用中（例如生产调度、资源分配等），多个自治决策单元（智能体）需要在一个共享的环境中协同工作，每个智能体只能获取局部信息（例如自身状态或部分环境观测），但它们的行为会相互影响。传统的单智能体强化学习（RL）模型难以直接适用于这种场景，因此需要多智能体强化学习（MARL）的方法。1.2将问题转化为部分可观测马尔可夫决策过
QGraphicView绘制圆形示例杨逸潼 qt 开发语言
#include#include#include#include#include#includeintmain(intargc,char*argv[]){
美团二面拷打：MySQL中 SQL 语句的执行流程？ JavaGuide 大厂面试 mysql sql java
本篇文章会分析下一个SQL语句在MySQL中的执行流程，包括SQL的查询在MySQL内部会怎么流转，SQL语句的更新是怎么完成的。在分析之前我会先带着你看看MySQL的基础架构，知道了MySQL由那些组件组成以及这些组件的作用是什么，可以帮助我们理解和解决这些问题。相关阅读：MySQL常见面试题总结MySQL索引详解MySQL三大日志(binlog、redolog和undolog)详解MySQL事
PyTorch 训练一个分类器亚里平台工具类 pytorch训练网络
文章目录0前言1加载和规范化CIFAR102定义一个卷积网络3定义损失函数和优化器4训练网络5测试网络6在GPU上训练模型参考资料0前言 TRAINGINGACLASSIFIER这篇教程很清楚的描述了如何使用PyTorch训练一个用于图像分类的卷积网络模型。这里记录一下，学习一波写法，供以后查阅，自己跑的项目在github上，稍微修改了一下训练策略，能使分类精度从53%提升到65%；并且增加了训
Flask 数据库操作 zhao1iyong flask
在Flask中，数据库操作是构建Web应用的一个重要方面。Flask提供了多种方式来与数据库进行交互，包括直接使用SQL和利用ORM（对象关系映射）工具，如SQLAlchemy。以下是对Flask数据库操作的详细说明，包括使用SQLAlchemy的基本操作和SQL语句的直接执行。使用SQLAlchemy：定义模型，配置数据库，执行基本的CRUD操作。创建和管理数据库：使用db.create_all
python import自己创建的.py文件-python 将自己写的py文件作为模块导入 weixin_39888268
在实战中我们往往需要导入自己写的一个.py文件，而且不是在当前目录下的文件，是不是可以作为模块直接import过来呢？并不是，我们必须让Python解释器能够找到你写的模块。主要有以下两种方法。1.sys.path.append()告知解释器假设我们自己的python文件名为inferSingleDocVec.py，那么这个文件可以作为一个模块被引入，现在Python解释器并不知道我写了这么一个文
开源模型应用落地-DeepSeek-R1-Distill-Qwen-7B与vllm实现推理加速的正确姿势（一）开源技术探险家开源模型-实际应用落地 #人工智能自然语言处理语言模型深度学习
一、前言在当今人工智能技术迅猛发展的时代，各类人工智能模型如雨后春笋般不断涌现，其性能的优劣直接影响着应用的广度与深度。从自然语言处理到计算机视觉，从智能安防到医疗诊断，AI模型广泛应用于各个领域，人们对其准确性、稳定性和高效性的期望也与日俱增。在此背景下，DeepSeek模型的出现为行业带来了新的曙光。DeepSeek团队开发的DeepSeek-R1-Distill-Qwen-7B模型，利用蒸馏
数据库如何应对保障大促活动 2401_86087710 数据库 oracle
当前，随着电商节日的增多（6.18、双十一、双十二）、平台拉新趋于频繁，大促活动也越来越普遍。作为一个电商平台，每年都会有一次，甚至几次的流量“大考”。数据库作为系统的重要节点，其稳定性和性能格外重要，数据库的全力保障是一个大的挑战。电商大促，这场没有硝烟的战争很多人已有体会，在此不再赘述。现在，我们直接切入主题–数据库如何积极应对，全力保障大促活动。这个题目分解为三个部分进行讲解：第一部分，准备
Diffusion--人工智能领域的革命性技术油泼辣子多加专业名词解释人工智能
在人工智能领域，“diffusion”一词通常指的是“扩散模型”（DiffusionModels），其全称为“DenoisingDiffusionProbabilisticModels”（DDPMs）。扩散模型是一类生成式模型，它通过逐步去噪的方式，从随机噪声中生成高质量的数据，近年来在图像、音频、视频等多个领域取得了显著进展。1.发展历史扩散模型的概念源于物理学中的扩散过程，即粒子在介质中的随机
Apache Tomcat 漏洞CVE-2024-50379条件竞争文件上传漏洞 servlet readonly spring boot 修复方式李三醒 apache tomcat spring boot
1，关于漏洞ApacheTomcat是一个流行的开源Web服务器和JavaServlet容器。二、漏洞描述ApacheTomcat中修复了个TOCTOU竞争条件远程代码执行漏洞(CVE-2024-50379)，该漏洞的CVSS评分为9.8。ApacheTomcat中JSP编译期间存在检查时间使用时间(TOCTOU)竞争条件漏洞，当ApacheTomcat的默认servlet被配置为允许写入（即re
怎么样才能成为专业的程序员？ cocos2d-x小菜编程 PHP
如何要想成为一名专业的程序员？仅仅会写代码是不够的。从团队合作去解决问题到版本控制，你还得具备其他关键技能的工具包。当我们询问相关的专业开发人员，那些必备的关键技能都是什么的时候，下面是我们了解到的情况。关于如何学习代码，各种声音很多，然后很多人就被误导为成为专业开发人员懂得一门编程语言就够了？！呵呵，就像其他工作一样，光会一个技能那是远远不够的。如果你想要成为
java web开发高并发处理 BreakingBad java Web 并发开发处理高
java处理高并发高负载类网站中数据库的设计方法（java教程,java处理大量数据，java高负载数据）一：高并发高负载类网站关注点之数据库没错,首先是数据库,这是大多数应用所面临的首个SPOF。尤其是Web2.0的应用，数据库的响应是首先要解决的。一般来说MySQL是最常用的，可能最初是一个mysql主机，当数据增加到100万以上，那么，MySQL的效能急剧下降。常用的优化措施是M-S（
mysql批量更新 ekian mysql
mysql更新优化：一版的更新的话都是采用update set的方式，但是如果需要批量更新的话，只能for循环的执行更新。或者采用executeBatch的方式，执行更新。无论哪种方式，性能都不见得多好。三千多条的更新，需要3分多钟。查询了批量更新的优化，有说replace into的方式，即： replace into tableName(id,status) values
微软BI（3） 18289753290 微软BI SSIS
1) Q：该列违反了完整性约束错误；已获得 OLE DB 记录。源:“Microsoft SQL Server Native Client 11.0” Hresult: 0x80004005 说明:“不能将值 NULL 插入列 'FZCHID'，表 'JRB_EnterpriseCredit.dbo.QYFZCH'；列不允许有 Null 值。INSERT 失败。”。 A：一般这类问题的存在是
Java中的List g21121 java
List是一个有序的 collection（也称为序列）。此接口的用户可以对列表中每个元素的插入位置进行精确地控制。用户可以根据元素的整数索引（在列表中的位置）访问元素，并搜索列表中的元素。与 set 不同，列表通常允许重复
读书笔记永夜-极光读书笔记
1. K是一家加工厂,需要采购原材料,有A,B,C,D 4家供应商,其中A给出的价格最低,性价比最高,那么假如你是这家企业的采购经理,你会如何决策? 传统决策: A:100%订单 B,C,D:0% &nbs
centos 安装 Codeblocks 随便小屋 codeblocks
1.安装gcc,需要c和c++两部分,默认安装下,CentOS不安装编译器的,在终端输入以下命令即可yum install gccyum install gcc-c++ 2.安装gtk2-devel,因为默认已经安装了正式产品需要的支持库,但是没有安装开发所需要的文档.yum install gtk2* 3. 安装wxGTK yum search w
23种设计模式的形象比喻 aijuans 设计模式
1、ABSTRACT FACTORY—追MM少不了请吃饭了，麦当劳的鸡翅和肯德基的鸡翅都是MM爱吃的东西，虽然口味有所不同，但不管你带MM去麦当劳或肯德基，只管向服务员说“来四个鸡翅”就行了。麦当劳和肯德基就是生产鸡翅的Factory 　　工厂模式：客户类和工厂类分开。消费者任何时候需要某种产品，只需向工厂请求即可。消费者无须修改就可以接纳新产品。缺点是当产品修改时，工厂类也要做相应的修改。如：
开发管理 CheckLists aoyouzi 开发管理 CheckLists
开发管理 CheckLists(23) -使项目组度过完整的生命周期开发管理 CheckLists(22) -组织项目资源开发管理 CheckLists(21) -控制项目的范围开发管理 CheckLists(20) -项目利益相关者责任开发管理 CheckLists(19) -选择合适的团队成员开发管理 CheckLists(18) -敏捷开发 Scrum Master 工作开发管理 C
js实现切换百合不是茶 JavaScript 栏目切换
js主要功能之一就是实现页面的特效,窗体的切换可以减少页面的大小,被门户网站大量应用思路: 1,先将要显示的设置为display:bisible 否则设为none 2,设置栏目的id ,js获取栏目的id,如果id为Null就设置为显示 3,判断js获取的id名字;再设置是否显示代码实现: html代码: <di
周鸿祎在360新员工入职培训上的讲话 bijian1013 感悟项目管理人生职场
这篇文章也是最近偶尔看到的，考虑到原博客发布者可能将其删除等原因，也更方便个人查找，特将原文拷贝再发布的。“学东西是为自己的，不要整天以混的姿态来跟公司博弈，就算是混，我觉得你要是能在混的时间里，收获一些别的有利于人生发展的东西，也是不错的，看你怎么把握了”，看了之后，对这句话记忆犹新。 &
前端Web开发的页面效果 Bill_chen html Web Microsoft
1.IE6下png图片的透明显示： <img src="图片地址" border="0" style="Filter.Alpha(Opacity)=数值(100),style=数值(3)"/> 或在<head></head>间加一段JS代码让透明png图片正常显示。 2.<li>标
【JVM五】老年代垃圾回收：并发标记清理GC(CMS GC) bit1129 垃圾回收
CMS概述并发标记清理垃圾回收(Concurrent Mark and Sweep GC）算法的主要目标是在GC过程中，减少暂停用户线程的次数以及在不得不暂停用户线程的请夸功能，尽可能短的暂停用户线程的时间。这对于交互式应用，比如web应用来说，是非常重要的。 CMS垃圾回收针对新生代和老年代采用不同的策略。相比同吞吐量垃圾回收，它要复杂的多。吞吐量垃圾回收在执
Struts2技术总结白糖_ struts2
必备jar文件早在struts2.0.*的时候，struts2的必备jar包需要如下几个： commons-logging-*.jar Apache旗下commons项目的log日志包 freemarker-*.jar
Jquery easyui layout应用注意事项 bozch jquery 浏览器 easyui layout
在jquery easyui中提供了easyui-layout布局，他的布局比较局限，类似java中GUI的border布局。下面对其使用注意事项作简要介绍：如果在现有的工程中前台界面均应用了jquery easyui，那么在布局的时候最好应用jquery eaysui的layout布局，否则在表单页面（编辑、查看、添加等等）在不同的浏览器会出
java-拷贝特殊链表：有一个特殊的链表，其中每个节点不但有指向下一个节点的指针pNext，还有一个指向链表中任意节点的指针pRand，如何拷贝这个特殊链表？ bylijinnan java
public class CopySpecialLinkedList { /** * 题目：有一个特殊的链表，其中每个节点不但有指向下一个节点的指针pNext，还有一个指向链表中任意节点的指针pRand，如何拷贝这个特殊链表？拷贝pNext指针非常容易，所以题目的难点是如何拷贝pRand指针。假设原来链表为A1 -> A2 ->... -> An，新拷贝
color Chen.H JavaScript html css
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <HTML> <HEAD>&nbs
[信息与战争]移动通讯与网络 comsci 网络
两个坚持:手机的电池必须可以取下来光纤不能够入户,只能够到楼宇建议大家找这本书看看:<&
oracle flashback query(闪回查询) daizj oracle flashback query flashback table
在Oracle 10g中，Flash back家族分为以下成员： Flashback Database Flashback Drop Flashback Table Flashback Query(分Flashback Query,Flashback Version Query，Flashback Transaction Query) 下面介绍一下Flashback Drop 和Flas
zeus持久层DAO单元测试 deng520159 单元测试
zeus代码测试正紧张进行中,但由于工作比较忙,但速度比较慢.现在已经完成读写分离单元测试了,现在把几种情况单元测试的例子发出来,希望有人能进出意见,让它走下去. 本文是zeus的dao单元测试: 1.单元测试直接上代码 package com.dengliang.zeus.webdemo.test; import org.junit.Test; import o
C语言学习三printf函数和scanf函数学习 dcj3sjt126com c printf scanf language
printf函数 /* 2013年3月10日20:42:32 地点：北京潘家园功能：目的：测试%x %X %#x %#X的用法 */ # include <stdio.h> int main(void) { printf("哈哈！\n"); // \n表示换行 int i = 10; printf
那你为什么小时候不好好读书? dcj3sjt126com life
dady, 我今天捡到了十块钱, 不过我还给那个人了 good girl! 那个人有没有和你讲thank you啊没有啦....他拉我的耳朵我才把钱还给他的, 他哪里会和我讲thank you 爸爸, 如果地上有一张5块一张10块你拿哪一张呢.... 当然是拿十块的咯... 爸爸你很笨的, 你不会两张都拿爸爸为什么上个月那个人来跟你讨钱, 你告诉他没
iptables开放端口 Fanyucai linux iptables 端口
1，找到配置文件 vi /etc/sysconfig/iptables 2，添加端口开放，增加一行，开放18081端口 -A INPUT -m state --state NEW -m tcp -p tcp --dport 18081 -j ACCEPT 3，保存 ESC :wq! 4，重启服务 service iptables
Ehcache（05）——缓存的查询 234390216 排序 ehcache 统计 query
缓存的查询目录 1. 使Cache可查询 1.1 基于Xml配置 1.2 基于代码的配置 2 指定可搜索的属性 2.1 可查询属性类型 2.2 &
通过hashset找到数组中重复的元素 jackyrong hashset
如何在hashset中快速找到重复的元素呢?方法很多，下面是其中一个办法： int[] array = {1,1,2,3,4,5,6,7,8,8}; Set<Integer> set = new HashSet<Integer>(); for(int i = 0
使用ajax和window.history.pushState无刷新改变页面内容和地址栏URL lanrikey history
后退时关闭当前页面 <script type="text/javascript"> jQuery(document).ready(function ($) { if (window.history && window.history.pushState) {
应用程序的通信成本 netkiller.github.com 虚拟机应用服务器陈景峰 netkiller neo
应用程序的通信成本什么是通信一个程序中两个以上功能相互传递信号或数据叫做通信。什么是成本这是是指时间成本与空间成本。时间就是传递数据所花费的时间。空间是指传递过程耗费容量大小。都有哪些通信方式全局变量线程间通信共享内存共享文件管道 Socket 硬件（串口，USB）等等全局变量全局变量是成本最低通信方法，通过设置
一维数组与二维数组的声明与定义恋洁e生二维数组一维数组定义声明初始化
/** * */ package test20111005; /** * @author FlyingFire * @date:2011-11-18 上午04:33:36 * @author ：代码整理 * @introduce :一维数组与二维数组的初始化 *summary： */ public c
Spring Mybatis独立事务配置 toknowme mybatis
在项目中有很多地方会使用到独立事务，下面以获取主键为例（1）修改配置文件spring-mybatis.xml  <tx:annotation-driven transaction-manager="transactionManager" /> &n
更新Anadroid SDK Tooks之后，Eclipse提示No update were found xp9802 eclipse
使用Android SDK Manager 更新了Anadroid SDK Tooks 之后，打开eclipse提示 This Android SDK requires Android Developer Toolkit version 23.0.0 or above, 点击Check for Updates 检测一会后提示 No update were found

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他