愤怒的可乐

ChatGLM2-6B 部署

引言

这是ChatGLM2-6B 部署的阅读笔记，主要介绍了ChatGLM2-6B模型的部署和一些原理的简单解释。

ChatGLM-6B

它是单卡开源的对话模型。

充分的中英双语预训练
较低的部署门槛
- FP16半精度下，需要至少13G的显存进行推理，甚至可以进一步降低到10G(INT8)和6G(INT4)
更长的序列长度 ChatGLM-6B 序列长度达2048；ChatGLM2-6B达8192；
人类意图对齐训练使用了监督微调、反馈自助、人类反馈强化学习等方式

ChatGLM-6B本地部署

1.克隆ChatGLM2-6B

git clone https://github.com/THUDM/ChatGLM2-6B

2.CD进去之后，安装依赖包

pip install -r requirements.txt

它会安装以下依赖：

protobuf
transformers==4.30.2
cpm_kernels
torch>=2.0
gradio
mdtex2html
sentencepiece
accelerate
sse-starlette

3.下载模型权重

有两种方法，第一种就是利用transformers包去加载：

from transformers import AutoTokenizer, AutoModel
tokenizer = AutoTokenizer.from_pretrained("THUDM/chatglm2-6b", trust_remote_code=True)

Downloading (…)enization_chatglm.py: 100%|████████████████████████████████████████████████████████████████████| 10.1k/10.1k [00:00<00:00, 1.61MB/s]
A new version of the following files was downloaded from https://huggingface.co/THUDM/chatglm2-6b:
- tokenization_chatglm.py
. Make sure to double-check they do not contain any added malicious code. To avoid downloading new versions of the code file, you can pin a revision.
Downloading tokenizer.model: 100%|████████████████████████████████████████████████████████████████████████████| 1.02M/1.02M [00:00<00:00, 2.22MB/s]

model = AutoModel.from_pretrained("THUDM/chatglm2-6b", trust_remote_code=True, device="cuda")

Loading checkpoint shards: 100%|█████████████████████████████████████████████████████████████████████████████████████| 7/7 [00:16<00:00,  2.41s/it]

由于博主已经下载过了，这里直接加载就好了，当然前提是你的显存和内存足够。

这样模型就下载好了，下面我们来体验以下：

model = model.eval()
# 传入tokenizer, 消息 和 历史
response, history = model.chat(tokenizer, "你好", history=[])
print(response)

你好！我是人工智能助手 ChatGLM2-6B，很高兴见到你，欢迎问我任何问题。

response, history =  model.chat(tokenizer, "如何学习大模型？", history)
print(response)

大模型学习通常需要大量的计算资源和数据集，以及高超的技术和经验。以下是一些学习大模型的步骤:

1. 选择合适的大模型：选择适合你应用领域的大模型，例如自然语言处理 (NLP) 中的 BERT、RoBERTa 等。

2. 准备数据集：获取大量高质量的训练数据集，这些数据集通常包括文本数据、图像数据等。

3. 选择训练方式：选择合适的训练方式，例如数据增强、迁移学习等。

4. 搭建训练环境：搭建一个适合大模型的训练环境，包括分布式计算、数据增强等。

5. 训练模型：使用训练工具对模型进行训练，常见的训练工具包括 PyTorch、TensorFlow 等。

6. 评估模型：使用评估工具对模型的性能进行评估，常见的评估指标包括 accuracy、召回率、F1-score 等。

7. 部署模型：将训练好的模型部署到生产环境中，以实时处理数据。

大模型学习需要大量的计算资源和数据集，以及高超的技术和经验。因此，建议在实践中根据自己的需求和能力选择适合自己的大模型，并逐步提高自己的技术水平。

如果这种方式下载模型很慢的话，还可以从云盘直接下载模型权重。

首先需要下载模型代码实现：

GIT_LFS_SKIP_SMUDGE=1 git clone https://huggingface.co/THUDM/chatglm2-6b

然后丛云盘中下载模型权重文件，放到本地目录，比如是chatglm2-6b下。

接着将模型加载路径替换成刚才这个本地目录chatglm2-6b：

tokenizer = AutoTokenizer.from_pretrained("chatglm2-6b", trust_remote_code=True)
model = AutoModel.from_pretrained("chatglm2-6b", trust_remote_code=True).cuda()

注意这里chatglm2-6b是保持下载好的权重的路径，可以放在项目的根目录下。

如果你手头上有一台Mac，那么可以参照以下方式部署(未验证)：

对于搭载了 Apple Silicon 或者 AMD GPU 的 Mac，可以使用 MPS 后端来在 GPU 上运行 ChatGLM2-6B。需要参考 Apple 的官方说明安装 PyTorch-Nightly（正确的版本号应该是2.x.x.dev2023xxxx，而不是 2.x.x）。

目前在 MacOS 上只支持从本地加载模型。将代码中的模型加载改为从本地加载，并使用 mps 后端：

model = AutoModel.from_pretrained("your local path", trust_remote_code=True).to('mps')

加载半精度的 ChatGLM2-6B 模型需要大概 13GB 内存。内存较小的机器（比如 16GB 内存的 MacBook Pro），在空余内存不足的情况下会使用硬盘上的虚拟内存，导致推理速度严重变慢。此时可以使用量化后的模型 chatglm2-6b-int4。因为 GPU 上量化的 kernel 是使用 CUDA 编写的，因此无法在 MacOS 上使用，只能使用 CPU 进行推理。为了充分使用 CPU 并行，还需要单独安装 OpenMP。

在 Mac 上进行推理也可以使用 ChatGLM.cpp

以上内容来自官方文档。

本地Web-Demo

除了通过代码的方式去和ChatGLM交流，还可以通过本地web-demo来进行。

在ChatGLM2-6B目录下，执行：

python web_demo.py

右下角有三个参数，分别是max length, top p和temperature。

Max length 最大输出长度
Top P nucleus采样阈值[0,1]之间，给定这个阈值，它会从解码器中挑选一个累计概率大于阈值的最小单词集合，然后把该集合中单词的概率重新进行归一化，然后从中采样。推荐0.7。
Temperature 采样温度[0,1]之间，越大回答多样性越高，但如果想要结果一致性高一点，这个值要设小一点。它根据 $P(x_i|x_{1:i-1}) = \frac{\exp (u_i/t)}{\sum_j \exp(u_j/t)}$ 计算。

ChatGLM2-6B 量化部署

采用INT4量化，可以把显存需求从13G降到了6G。

ChatGLM-6B 微调

利用新的数据，对已经部署好的大模型进行继续训练就是微调。

首先我们看一下微调的好处

增强模型通用性以及和人类对齐的能力
使模型更加适用于专业化领域场景

大模型微调范式

第一种是Prompting，即输入提示词来引导模型适应下游任务。

这种方式的优点是简单，但缺点是成本高，难以达到最优。可以从上图看到，不同的提示词得到的准确率相差较大，优化效果不稳定，需要不断尝试。

我们重点来看下更优的方式。可以分为全参数微调和高效参数微调。

假设全参数微调在13G显存的参数上，模型本身就占用了13G显存。此时在训练时需要模型参数的四倍，加上原来的13G，因此大概需要60G内存或显存。所以全量微调成本高，难以实现。

上图右边就是高效参数微调

Adapter 引入一小部分参数(额外可训练层)，只需要调整新加入的参数，但同时会引入额外的推理开销。
Prompt/Prefix tuning 效果更优，需要调参。
LoRA 依靠权重的低秩分解特点，没有额外推理开销。
数据量少的话，全参数微调效果更好，不容易过拟合。

这里还没有理解，需要进一步去了解。后续会继续阅读参考中的论文。

P-tuning V2原理

在输入的向量序列前面拼上几个不代表词含义的向量，让模型仅对前面这几个向量进行优化，冻结整个模型的其他60亿(6B)参数，这样来实现高效参数的微调。

这种微调方式的成本只有全参数微调成本的0.1%-0.5%。

同时只需要保持和载入前面的PrefixEncoder，模型保持空间非常小。

下面我们来看如何进行这种高效微调，在目录ptuning下有：

total 104K
drwxrwxrwx 2 root root 4.0K Sep  6 22:25 .
drwxrwxrwx 8 root root 4.0K Sep  6 23:04 ..
-rw-rw-rw- 1 root root 8.3K Sep  6 22:25 arguments.py
-rw-rw-rw- 1 root root  489 Sep  6 22:25 deepspeed.json
-rw-rw-rw- 1 root root  768 Sep  6 22:25 ds_train_finetune.sh
-rw-rw-rw- 1 root root  603 Sep  6 22:25 evaluate_finetune.sh
-rw-rw-rw- 1 root root  702 Sep  6 22:25 evaluate.sh
-rw-rw-rw- 1 root root  18K Sep  6 22:25 main.py
-rw-rw-rw- 1 root root 9.4K Sep  6 22:25 README.md
-rw-rw-rw- 1 root root  823 Sep  6 22:25 train_chat.sh
-rw-rw-rw- 1 root root 3.1K Sep  6 22:25 trainer.py
-rw-rw-rw- 1 root root  12K Sep  6 22:25 trainer_seq2seq.py
-rw-rw-rw- 1 root root  833 Sep  6 22:25 train.sh
-rw-rw-rw- 1 root root 5.9K Sep  6 22:25 web_demo.py
-rw-rw-rw- 1 root root  219 Sep  6 22:25 web_demo.sh

其中 train.sh可以帮我们进行微调，而evaluate.sh可以验证微调效果。

我们来看下train.sh的内容:

$ cat train.sh
PRE_SEQ_LEN=128
LR=2e-2
NUM_GPUS=1

torchrun --standalone --nnodes=1 --nproc-per-node=$NUM_GPUS main.py \
    --do_train \
    --train_file AdvertiseGen/train.json \ # 数据集位置
    --validation_file AdvertiseGen/dev.json \ # 验证集
    --preprocessing_num_workers 10 \
    --prompt_column content \
    --response_column summary \
    --overwrite_cache \
    --model_name_or_path THUDM/chatglm2-6b \ # 可设为本地模型路径
    --output_dir output/adgen-chatglm2-6b-pt-$PRE_SEQ_LEN-$LR \ # 微调模型保存路径
    --overwrite_output_dir \
    --max_source_length 64 \
    --max_target_length 128 \
    --per_device_train_batch_size 1 \
    --per_device_eval_batch_size 1 \
    --gradient_accumulation_steps 16 \
    --predict_with_generate \
    --max_steps 3000 \ # 总训练步数
    --logging_steps 10 \
    --save_steps 1000 \
    --learning_rate $LR \ # 学习率
    --pre_seq_len $PRE_SEQ_LEN \ # Prompt长度，不设置时全参数微调
    --quantization_bit 4

其中通过以下设置：

quantization_bit=4 per_device_train_batch_size=1 gradient_accumulation_steps=16

可以实现INT4的模型参数被冻结，一次训练迭代会以1的批处理大小进行16次累加的前后向传播(就是计算了16次前向传播后再进行反向传播更新梯度，等同于16的批大小)，此时最低只需要6.7G显存。

全参数微调

如果你资源比较多，满足

比如有4张A100显卡。

那么可以通过ds_train_finetune.sh脚本进行全参数微调，需要安装deepspeed进行多卡微调：

推理

推理通过运行脚本evaluate.sh：

PRE_SEQ_LEN=128
CHECKPOINT=adgen-chatglm2-6b-pt-128-2e-2
STEP=3000
NUM_GPUS=1

torchrun --standalone --nnodes=1 --nproc-per-node=$NUM_GPUS main.py \
    --do_predict \
    --validation_file AdvertiseGen/dev.json \
    --test_file AdvertiseGen/dev.json \
    --overwrite_cache \
    --prompt_column content \
    --response_column summary \
    --model_name_or_path THUDM/chatglm2-6b \
    --ptuning_checkpoint ./output/$CHECKPOINT/checkpoint-$STEP \
    --output_dir ./output/$CHECKPOINT \
    --overwrite_output_dir \
    --max_source_length 64 \
    --max_target_length 64 \
    --per_device_eval_batch_size 1 \
    --predict_with_generate \
    --pre_seq_len $PRE_SEQ_LEN \
    --quantization_bit 4

微调结果

广告生成

这是一个广告文案生成的例子，我们输入衣服的描述，微调前模型只是做了一些简单的解释，用summary中的例子去训练，使得模型学会偏广告风格的描述。

多轮对话数据集

在微调多轮对话数据时，可以提供聊天历史，在训练命令中指定 –history_column。

其实这里只给出了两个微调实例的简单说明，下篇文章我们来看下微调的完整过程是怎样的。

参考

Prefix-Tuning: Optimizing Continuous Prompts for Generation
P-Tuning: Prompt Tuning Can Be Comparable to Fine-tuning Across Scales and Tasks

你可能感兴趣的:(大模型,ChatGLM2,大模型部署)

银行家教你稳赚不赔的方法康森爱学习
我是康森，这是我每天一篇文章的第53篇，希望我的文章能为你赋能，也希望你能给我赋能。今天我们来讲一个金融领域的故事。在上个世纪80年代，美国埃克森石油公司发生了一起石油泄漏事故，导致公司的财务出现危机，于是埃克森向摩根大通银行申请一笔48亿美金的贷款。埃克森石油公司一直是摩根大通银行的大客户，所以这个贷款申请让摩根大通很为难，借吧，风险很大，万一还不上自己也没办法承担这笔损失；不借吧，这么大的客户
2022-09-12随笔半夏的熊猫
今天是幸福快乐的一天，能见到哥，我就会兴奋一整天。我也有点烦恼，我不知道该怎么劝我哥少喝点酒或者最好戒酒。主要是基于他的健康考虑。每天提醒，我怕他直接给我拉黑了，有什么比较容易让人接受的方法呢？其实，我从来不反对喝酒，只要身体允许，就比如我们奶奶，今年90多了，只要不是生病的时候，我们都是每餐让她喝一点点，这样可以促进血液循环，挺好的。喝酒最忌讳贪杯，哥是个好酒的人，有不同圈子酒友，三天一大聚，一
【现代言情】黑白摇曳的爱情（15）我是一棵开花的树
好巧不巧，两张嘴唇刚好恰到好处的碰到一处。一时有两股电流涌动，白月新忘了挣扎，忘了昨天一晚上的决心，面色潮红，心跳加速，被一个男人压在身下，显然是有些慌乱，有些不知所措，还有那么一丝期待。而这个时候的夜南昊，那一巴掌的耻辱早已荡然无存，他抓着她的两手纤细的手指，看着身下如此致命的诱惑，碰到一处的嘴唇按耐不住了，直接撬开了一道道防火墙，最后的一丝理智让她不由得打了一个寒战。浑身像被浇了一大盆冷水，她
《红楼梦》第三十三回：手足小动眈眈唇舌，不肖种种大承笞挞，我的读书分享清水秋
《红楼梦》第三十三回：手足小动眈眈唇舌，不肖种种大承笞挞。这一回里：忠顺府长史官代替忠顺王爷来找贾政询问琪官的下落，贾政不知道琪官将自己贴身的汗巾赠予宝玉。史官当着贾政的面，当场点破了这件事。史官问起琪官的最新住处，宝玉说在东郊离城二十里有个什么紫檀堡，他在那里置了几亩田地和几件房舍。史官说他去那里找找看，没找到还要问宝玉。贾环听闻金钏投井而死，就添油加醋的对贾政说：金钏的死与宝玉脱不了干系，还说
网关有什么用？如何选择合适的网关？ IT孟德架构兵法微服务云原生
大家好，我是IT孟德，YoucancallmeAman(阿瞒，阿弥陀佛的ē，Not阿门的ā)，一个喜欢所有对象（热爱技术）的男人。我正在创作架构专栏，秉承ITer开源精神分享给志同道合（爱江山爱技术更爱美人）的朋友。专栏更新不求速度但求质量（曹大诗人传世作品必属精品，请脑补一下《短歌行》：对酒当歌，红颜几何？譬如媳妇，吾不嫌多...青青罗裙，一见动心，但为佳人，挂念至今...），用朴实无华、通俗易
Sequential Thinking：AI深度思考的新范式及其与CoT、ReAct的对比分析码字的字节人工智能 Sequential CoT ReAct
引言：AI深度思考的演进与SequentialThinking的崛起在人工智能技术快速发展的今天，AI模型的思考能力正经历着从简单应答到深度推理的革命性转变。这一演进过程不仅反映了技术本身的进步，更体现了人类对机器智能认知边界的持续探索。早期的大语言模型虽然能够生成流畅的文本，但在处理复杂问题时往往表现出"浅思考"的局限性——答案可能看似合理，却缺乏严谨的推理过程和系统性考量。例如，2022年的一
一元线性回归模型与最小二乘法 liuzx32
监督学习中，如果预测的变量是离散的，我们称其为分类（如决策树，支持向量机等），如果预测的变量是连续的，我们称其为回归。回归分析中，如果只包括一个自变量和一个因变量，且二者的关系可用一条直线近似表示，这种回归分析称为一元线性回归分析。如果回归分析中包括两个或两个以上的自变量，且因变量和自变量之间是线性关系，则称为多元线性回归分析。对于二维空间线性是一条直线；对于三维空间线性是一个平面，对于多维空间线
4.11号复盘，第100天牛欢Vincent
昨天计划22：30睡觉，躺下后玩了会手机聊了会天，瞬间23：00，定的五点闹钟，起床后例行打卡，然后昏睡过去，6：20才起床，“假早起”要不起。早睡很简单，放下手机就成功一大半，但凡拿着手机，时间就会野蛮消耗。不早睡，早起无从谈起。只要躺下，就放下手机，把微信通知关闭，调好闹钟，睡觉，明早见。
为了母亲的微笑千漫千寻
妈，我还是你的小宝宝，快抱抱我为了母亲的微笑，写一篇哄妈开心宝典。看清楚咯，是开心宝典，不是葵花宝典，如果葵花，那你妈还不得和我提刀来见……今天母亲节，当然首要任务是让母亲高兴。第一大法，拥抱的力量无坚不摧。在母亲面前，我们永远是长不大的孩子，所以根本无需觉得羞涩，不好意思。哪怕你胡子一把了，在你妈目前，依然，老老实实，做个乖宝宝。宝宝抱妈妈，天经地义。不抱，才是没有天理。有的人说，在我的家里面，
随笔敲zan嘞
大家都有过忘记回复别人信息的时候吧。下面的话都是我在希哥信箱的一个公众号里看到的，当时看到的时候感觉完完全全写的就是我啊！其实，我们自己都这样，有时候确实忙，心情烦闷，又或者看到了留言，刚好来了个什么事，就忘记回复了，都是很正常的事情。又或者，躺床上聊天，不小心睡着了，其实也无大碍，尤其是像这样的大冷天，被窝的催眠力，真的很强。我们聊天忘记回复，有时候确实有“情有可原”的理由，但这个时候的聊天不回
【布谷書社“閱经典·習功夫”之庄子外篇·天道 0001】布谷鸟書社
图片发自App天道运而无所积，故万物成；帝道运而无所积，故天下归；圣道运而无所积，故海内服。明于天，通于圣，六通四辟于帝王之德者，其自为也，昧然无不静者矣！圣人之静也，非曰静也善，故静也。万物无足以挠心者，故静也。水静则明烛须眉，平中准，大匠取法焉。水静犹明，而况精神！圣人之心静乎！天地之鉴也，万物之镜也。夫虚静恬淡寂漠无为者，天地之平而道德之至也。故帝王圣人休焉。休则虚虚则实，实则伦矣。虚则静，
盟接之桥说制造：差异化定位与效率竞争的双轮驱动盟接之桥制造人工智能大数据数据库服务器
在当今竞争日益激烈的商业环境中，企业如何在市场中脱颖而出，既避免陷入同质化的价格战，又能够通过效率提升实现可持续发展，是每一个经营者必须思考的问题。本文将围绕“差异化”与“效率竞争”两大核心战略展开分析，探讨企业如何通过差异化定位构建独特的竞争优势，并通过效率优化降低成本结构，从而实现高质量发展。一、差异化竞争：构建独特价值的商业路径差异化是指企业在产品、服务、品牌、商业模式等方面与竞争对手形成显
Java 8 中的 Lambda 表达式
好的，今天就用大白话+例子给你讲清楚Java8的Lambda表达式！核心作用：简化代码，尤其是简化那些只包含一个方法的接口（函数式接口）的实现。想象一下：你让朋友帮忙做件事（比如：炒个菜、发个邮件）。通常你需要告诉他具体怎么做（写一大段步骤说明）。Lambda就像是你直接说：“嘿，帮我把这个菜炒了”（你不需要详细说明怎么开火、放油，默认朋友知道“炒菜”这个动作的标准流程）。在Java代码里，这个“
Datawhale X 魔塔 Ai夏令营 --深度学习基础
一、局部极小值与全局极小值全局极小值：在损失函数的整个定义域内，损失值最小的点。这是我们在训练深度学习模型时希望找到的点，因为它代表着模型的最佳性能。局部极小值：在损失函数的一个局部区域内，损失值达到最小，但在整个函数定义域内可能不是最小的。当优化算法陷入局部极小值时，它可能会误以为已经找到了全局最优解，从而停止搜索。局部极小值的检测两种直观的方法来检测局部极小值：可视化方法：对于低维问题，我们可
学大伟业：苏州大学2019年高考分省分专业录取分数线倒霉熊033
苏州大学位于江苏苏州，是一所211综合类院校，其化学、物理学、材料科学、临床医学等学科排在全球领先水平。北京学大伟业（bjxdwy）整理入学途径、王牌专业和2019年分省分专业录取分数线，供参考。一、学校简介苏州大学是江苏省属重点综合性大学，国家“211工程”重点建设高校、“2011计划”首批牵头高校。学校有天赐庄校区、独墅湖校区、阳澄湖校区3个校区，设有26个学院，130个本科专业；11个学科进
借助AI学习开源代码git0.7之二核心概念和总结余很多之很多源码学习 git 学习
借助AI学习开源代码git0.7之二核心概念和总结核心概念：对象数据库(ObjectDatabase):内容寻址:所有数据都通过其内容的SHA1哈希值来唯一标识和存储。这意味着任何内容的更改都会导致其SHA1哈希值的变化，从而生成一个新的对象。不可变性:一旦对象被创建并存储，它就是不可变的。这种设计保证了数据的完整性和历史的可靠性。对象类型:Blob(二进制大对象):存储文件的实际内容。它是最基本
Unet源码实现（pytorch） wyn20001128 pytorch 人工智能 python
U-Net是一种用于生物医学图像分割的卷积神经网络架构。它通过引入一种新颖的网络结构和训练策略解决了传统方法在数据量不足时面临的挑战。U-Net的主要思想是利用数据增强技术来高效利用有限的标注样本，并通过独特的网络设计来提高分割精度。主要贡献U-Net的主要贡献包括：1、数据增强策略：使用随机弹性变形和其他形式的数据增强来增加训练数据的多样性，从而在有限的数据集上训练出更强大的模型。2、U形网络结
pytorch的学习笔记 wyn20001128 算法
一cuda 2006年，NVIDIA公司发布了CUDA(ComputeUnifiedDeviceArchitecture)，是一种新的操作GPU计算的硬件和软件架构，是建立在NVIDIA的GPUs上的一个通用并行计算平台和编程模型，它提供了GPU编程的简易接口，基于CUDA编程可以构建基于GPU计算的应用程序。 CPU是用于负责逻辑性比较强的计算，GPU专注于执行高度线程化的并行处理任务。所以
深度学习模块实践手册（第十二期）加油吧zkf 目标检测目标检测模块解析与实践深度学习人工智能计算机视觉目标检测 python
56、Ghost模块论文《GhostNet:MoreFeaturesfromCheapOperations》1、作用：Ghost模块是一种轻量级的特征提取模块，旨在通过廉价操作生成更多特征图，减少计算量的同时保持模型性能。传统卷积神经网络在生成特征图时存在大量冗余计算，Ghost模块通过将特征图生成过程分解为两个步骤，有效减少了计算复杂度，特别适合移动端和嵌入式设备部署。2、机制Ghost模块的机
算法工程师必看！个性化信息流推荐算法系统的架构设计与优化实战指南
注：此文章内容均节选自充电了么创始人，CEO兼CTO陈敬雷老师的新书《GPT多模态大模型与AIAgent智能体》（跟我一起学人工智能）【陈敬雷编著】【清华大学出版社】GPT多模态大模型与AIAgent智能体书籍本章配套视频课程【陈敬雷】推荐算法系统实战全系列精品课【陈敬雷】文章目录推荐算法系统系列二算法工程师必看！个性化信息流推荐算法系统的架构设计与优化实战指南更多技术内容总结推荐算法系统系列二算
明天就是38女王节，你准备好“剁手”了吗？简笙
图片发自App不得不说，现在网店的营销水平比实体店的强太多了。无人不知无人不晓的“双十一”，已经成为了大部分人囤货和大抢购的重要日子。据传，去年双十一当日，阿里巴巴的成交额达到了2135亿元。就一个手机大小的屏幕里，可以轻松堆放下不同行业不同产品的广告，各种优惠券，各种明星的代言与推荐，能轻松地搜到自己想要的东西，还不用担心取货地点方不方便......正是因为有这么多的优势加在一起，才使得网上购物
桃花源里的狼与羊苏小步
【壹●阿丑】有一小溪，溪边有一个巨大的磐石，阻断了大部分的船只，普通人往下瞧只得见一片片的竹林。没多少人发现，随着小溪流下去约七八里路就有一座小山，人若沿着小山走过去，约一里路就会出现一大片桃花林，桃花林里面是一大片草原，草原里住着一群羊，这些羊群世代居住在此、从来没有离开过这片土地。但如果你往羊群里细看，还会发现有一个头部宽阔、耳朵呈三角形的其他动物，小羊们都称它为“阿丑”。“阿丑”没有父母，村
Scalers：认知战时代，你是战神、战士还是战俘？ Scalers
1现在是和平年代，我们已经不打肉搏的战争了。但是，战争仍然存在，只是转移成更隐蔽的形式了，比如认知战。认知战不会让我们流血，所以很多人往往意识不到。战争的目的是什么呢？往大了说，就是实现政治上的目的，比如想要搞掉你。往小了说，就是攻城略地，实现对敌人领土的占领，让你屈服于我。要达到这个目的，就要看谁拥有更强悍的武力，更丰富的战争资源储备，以及更多地获得人民的支持。当然这些支持，其实是可以通过一定手
c语言找出递增子数组的长度,C语言实现最长递增子序列问题的解决方法梁肖松 c语言找出递增子数组的长度
本文实例展示了C语言实现最长递增子序列问题的解决方法。分享给大家供大家参考。具体方法如下：问题描述：给定一个序列，找出其最长递增子序列长度。比如输入1375输出3算法解决思路：利用动态规划的思想，以序列的每个点最为最右端，找出每个点作为最右端时的子序列长度的最大值，即问题的求解。因此，在计算前面的每个点的时候，将其结果保存下来，后面的点与前面的点的数值进行比较，如果大，则在其长度基础上加1，并且找
035_ClaudeCode_MCP_介绍义薄云天us Claude Code菜鸟到高手专栏 Claude Code 机器学习深度学习 mcp
035_ClaudeCode_MCP_介绍摘要ModelContextProtocol（MCP）是一个开放的标准化协议，专为大型语言模型提供上下文数据而设计。作为ClaudeCode生态系统的重要组成部分，MCP如同"AI应用程序的USB-C端口"，提供了将AI模型连接到不同数据源和工具的标准化方式。本文全面介绍MCP的核心概念、架构设计和在ClaudeCode中的应用场景。目录什么是ModelC
算力网异构协同与能效优化驱动工业物联及智慧民生实践
内容概要算力网络作为数字基础设施的核心载体，正通过异构协同架构与能效优化框架的深度融合，构建起支撑工业物联网与智慧民生应用的技术底座。随着边缘计算节点的快速部署与模型压缩技术的突破性发展，工业场景中的设备健康检测与实时故障分析已实现毫秒级响应，典型应用场景包括产线异常识别、设备寿命预测等关键领域。与此同时，数据预处理技术的迭代升级有效缓解了工业传感器数据维度爆炸带来的算力压力，通过特征提取与噪声过
LangChain 源码剖析（八）：对话记忆的 “智能管家“_RunnableWithMessageHistory ATM006 机器智能人工智能 langchain Agent 大模型
每一篇文章都短小精悍，不啰嗦。一、功能定位：给Runnable装上"对话记忆"在聊天机器人、客服系统等场景中，多轮对话是核心需求——用户不会每次都重复历史信息，系统需要记住之前说过什么。RunnableWithMessageHistory就是为解决这个问题而生的组件：它像一个"智能管家"，给原本只能处理单次输入的Runnable（如大模型调用链）装上"记忆功能"，自动管理对话历史的加载、合并和保存
2022-08-20 郑龙_格雷
看到母亲悲伤的表情，我大受刺激，决心帮扶家计，守护家人，并向父亲提出制造和销售纸袋的建议。以前，我们家经营印刷作坊，同时，也做纸袋，父亲用菜刀一样的大型刀具把一大叠纸一下子裁断。周围受雇的阿姨们将裁好的纸张折叠，涂上糨糊。我想起年幼时看到的这种光景，就请求父亲再次制作纸袋，由我外出销售
深度学习模块实践手册（第十一期）加油吧zkf 目标检测目标检测模块解析与实践深度学习人工智能计算机视觉目标检测 python
46、缩放点积注意力模块论文《AttentionIsAllYouNeed》1、作用：缩放点积注意力（ScaledDot-ProductAttention）是Transformer模型的核心组件，旨在解决序列建模中长距离依赖关系捕捉的问题。传统的循环神经网络（RNN）在处理长序列时存在梯度消失或爆炸的问题，且并行性较差。该模块通过计算查询（Query）、键（Key）和值（Value）之间的相似度，实
病中感悟自带光芒的雨
今天气温是21----37，可是我却感冒了。和孩子去逛超市，我冷的浑身发抖。坚持陪她逛完超市，回来在社区卫生服务站看了医生，医生量完体温，说我发烧了，开了五盒子药，让一起吃。到家后，我打开那些花花绿绿的药片，按医生嘱的这种两片，那种三片的取了一大把，吃了下去。吃完药就跌到床上，不知天南海北的进入昏睡模式。一直睡了快十个小时人才有一点点精神。也不知道是这高温闹的人不适应感冒了还是因为抵抗力下降得的感
微信开发者验证接口开发 362217990 微信开发者 token 验证
微信开发者接口验证。 Token，自己随便定义，与微信填写一致就可以了。根据微信接入指南描述 http://mp.weixin.qq.com/wiki/17/2d4265491f12608cd170a95559800f2d.html 第一步：填写服务器配置第二步：验证服务器地址的有效性第三步：依据接口文档实现业务逻辑这里主要讲第二步验证服务器有效性。建一个
一个小编程题-类似约瑟夫环问题 BrokenDreams 编程
今天群友出了一题：一个数列,把第一个元素删除,然后把第二个元素放到数列的最后,依次操作下去,直到把数列中所有的数都删除,要求依次打印出这个过程中删除的数。 &
linux复习笔记之bash shell (5) 关于减号-的作用 eksliang linux关于减号“-”的含义 linux关于减号“-”的用途 linux关于“-”的含义 linux关于减号的含义
转载请出自出处： http://eksliang.iteye.com/blog/2105677 管道命令在bash的连续处理程序中是相当重要的，尤其在使用到前一个命令的studout（标准输出）作为这次的stdin（标准输入）时，就显得太重要了，某些命令需要用到文件名，例如上篇文档的的切割命令（split）、还有
Unix(3) 18289753290 unix ksh
1)若该变量需要在其他子进程执行，则可用"$变量名称"或${变量}累加内容什么是子进程？在我目前这个shell情况下，去打开一个新的shell，新的那个shell就是子进程。一般状态下，父进程的自定义变量是无法在子进程内使用的，但通过export将变量变成环境变量后就能够在子进程里面应用了。 2)条件判断： &&代表and ||代表or&nbs
关于ListView中性能优化中图片加载问题酷的飞上天空 ListView
ListView的性能优化网上很多信息，但是涉及到异步加载图片问题就会出现问题。具体参看上篇文章http://314858770.iteye.com/admin/blogs/1217594 如果每次都重新inflate一个新的View出来肯定会造成性能损失严重，可能会出现listview滚动是很卡的情况，还会出现内存溢出。现在想出一个方法就是每次都添加一个标识，然后设置图
德国总理默多克：给国人的一堂“震撼教育”课永夜-极光教育
http://bbs.voc.com.cn/topic-2443617-1-1.html德国总理默多克：给国人的一堂“震撼教育”课　安吉拉—默克尔，一位经历过社会主义的东德人，她利用自己的博客，发表一番来华前的谈话，该说的话，都在上面说了，全世界想看想传播——去看看默克尔总理的博客吧！　　德国总理默克尔以她的低调、朴素、谦和、平易近人等品格给国人留下了深刻印象。她以实际行动为中国人上了一堂
关于Java继承的一个小问题。。。随便小屋 java
今天看Java 编程思想的时候遇见一个问题，运行的结果和自己想想的完全不一样。先把代码贴出来！ //CanFight接口 interface Canfight { void fight(); } //ActionCharacter类 class ActionCharacter { public void fight() { System.out.pr
23种基本的设计模式 aijuans 设计模式
Abstract Factory：提供一个创建一系列相关或相互依赖对象的接口，而无需指定它们具体的类。　　Adapter：将一个类的接口转换成客户希望的另外一个接口。A d a p t e r模式使得原本由于接口不兼容而不能一起工作的那些类可以一起工作。　　Bridge：将抽象部分与它的实现部分分离，使它们都可以独立地变化。　　Builder：将一个复杂对象的构建与它的表示分离，使得同
《周鸿祎自述：我的互联网方法论》读书笔记 aoyouzi 读书笔记
从用户的角度来看,能解决问题的产品才是好产品,能方便/快速地解决问题的产品,就是一流产品. 商业模式不是赚钱模式一款产品免费获得海量用户后,它的边际成本趋于0,然后再通过广告或者增值服务的方式赚钱,实际上就是创造了新的价值链. 商业模式的基础是用户,木有用户,任何商业模式都是浮云.商业模式的核心是产品,本质是通过产品为用户创造价值. 商业模式还包括寻找需求
JavaScript动态改变样式访问技术百合不是茶 JavaScript style属性 ClassName属性
一:style属性格式: HTML元素.style.样式属性="值"; 创建菜单:在html标签中创建或者在head标签中用数组创建 <html> <head> <title>style改变样式</title> </head> &l
jQuery的deferred对象详解 bijian1013 jquery deferred对象
jQuery的开发速度很快，几乎每半年一个大版本，每两个月一个小版本。每个版本都会引入一些新功能，从jQuery 1.5.0版本开始引入的一个新功能----deferred对象。 &nb
淘宝开放平台TOP Bill_chen C++c 物流 C#
淘宝网开放平台首页：http://open.taobao.com/ 淘宝开放平台是淘宝TOP团队的产品，TOP即TaoBao Open Platform，是淘宝合作伙伴开发、发布、交易其服务的平台。支撑TOP的三条主线为： 1.开放数据和业务流程 * 以API数据形式开放商品、交易、物流等业务； &
【大型网站架构一】大型网站架构概述 bit1129 网站架构
大型互联网特点面对海量用户、海量数据大型互联网架构的关键指标高并发高性能高可用高可扩展性线性伸缩性安全性大型互联网技术要点前端优化 CDN缓存反向代理 KV缓存消息系统分布式存储 NoSQL数据库搜索监控安全想到的问题： 1.对于订单系统这种事务型系统，如
eclipse插件hibernate tools安装白糖_ Hibernate
eclipse helios(3.6)版 1.启动eclipse 2.选择 Help > Install New Software...> 3.添加如下地址： http://download.jboss.org/jbosstools/updates/stable/helios/ 4.选择性安装：hibernate tools在All Jboss tool
Jquery easyui Form表单提交注意事项 bozch jquery easyui
jquery easyui对表单的提交进行了封装，提交的方式采用的是ajax的方式，在开发的时候应该注意的事项如下： 1、在定义form标签的时候，要将method属性设置成post或者get，特别是进行大字段的文本信息提交的时候，要将method设置成post方式提交，否则页面会抛出跨域访问等异常。所以这个要
Trie tree(字典树)的Java实现及其应用-统计以某字符串为前缀的单词的数量 bylijinnan java实现
import java.util.LinkedList; public class CaseInsensitiveTrie { /** 字典树的Java实现。实现了插入、查询以及深度优先遍历。 Trie tree's java implementation.(Insert,Search,DFS) Problem Description Igna
html css 鼠标形状样式汇总 chenbowen00 html css
css鼠标手型cursor中hand与pointer Example：CSS鼠标手型效果 <a href="#" style="cursor:hand">CSS鼠标手型效果</a><br/> Example：CSS鼠标手型效果 <a href="#" style=&qu
[IT与投资]IT投资的几个原则 comsci it
无论是想在电商,软件,硬件还是互联网领域投资,都需要大量资金,虽然各个国家政府在媒体上都给予大家承诺,既要让市场的流动性宽松,又要保持经济的高速增长....但是,事实上,整个市场和社会对于真正的资金投入是非常渴望的,也就是说,表面上看起来,市场很活跃,但是投入的资金并不是很充足的......
oracle with语句详解 daizj oracle with with as
oracle with语句详解转在oracle中，select 查询语句，可以使用with,就是一个子查询，oracle 会把子查询的结果放到临时表中，可以反复使用例子:注意，这是sql语句，不是pl/sql语句，可以直接放到jdbc执行的 ----------------------------------------------------------------
hbase的简单操作 deng520159 数据库 hbase
近期公司用hbase来存储日志,然后再来分析 ,把hbase开发经常要用的命令找了出来. 用ssh登陆安装hbase那台linux后用hbase shell进行hbase命令控制台! 表的管理 1）查看有哪些表 hbase(main)> list 2）创建表 # 语法：create <table>, {NAME => <family&g
C语言scanf继续学习、算术运算符学习和逻辑运算符 dcj3sjt126com c
/* 2013年3月11日20:37:32 地点：北京潘家园功能：完成用户格式化输入多个值目的：学习scanf函数的使用 */ # include <stdio.h> int main(void) { int i, j, k; printf("please input three number:\n"); //提示用
2015越来越好 dcj3sjt126com 歌曲
越来越好房子大了电话小了感觉越来越好假期多了收入高了工作越来越好商品精了价格活了心情越来越好天更蓝了水更清了环境越来越好活得有奔头人会步步高想做到你要努力去做到幸福的笑容天天挂眉梢越来越好婆媳和了家庭暖了生活越来越好孩子高了懂事多了学习越来越好朋友多了心相通了大家越来越好道路宽了心气顺了日子越来越好活的有精神人就不显
java.sql.SQLException: Value '0000-00-00' can not be represented as java.sql.Tim feiteyizu mysql
数据表中有记录的time字段（属性为timestamp）其值为：“0000-00-00 00:00:00” 程序使用select 语句从中取数据时出现以下异常： java.sql.SQLException:Value '0000-00-00' can not be represented as java.sql.Date java.sql.SQLException: Valu
Ehcache（07）——Ehcache对并发的支持 234390216 并发 ehcache 锁 ReadLock WriteLock
Ehcache对并发的支持在高并发的情况下，使用Ehcache缓存时，由于并发的读与写，我们读的数据有可能是错误的，我们写的数据也有可能意外的被覆盖。所幸的是Ehcache为我们提供了针对于缓存元素Key的Read（读）、Write（写）锁。当一个线程获取了某一Key的Read锁之后，其它线程获取针对于同
mysql中blob,text字段的合成索引 jackyrong mysql
在mysql中，原来有一个叫合成索引的，可以提高blob,text字段的效率性能，但只能用在精确查询，核心是增加一个列，然后可以用md5进行散列，用散列值查找则速度快比如： create table abc(id varchar(10),context blog,hash_value varchar(40)); insert into abc(1,rep
逻辑运算与移位运算 latty 位运算逻辑运算
源码：正数的补码与原码相同例+7 源码：00000111 补码：00000111 （用8位二进制表示一个数）负数的补码：符号位为1，其余位为该数绝对值的原码按位取反；然后整个数加1。 -7 源码： 10000111 ，其绝对值为00000111 取反加一：11111001 为-7补码已知一个数的补码，求原码的操作分两种情况：
利用XSD 验证XML文件 newerdragon java xml xsd
XSD文件（XML Schema 语言也称作 XML Schema 定义（XML Schema Definition，XSD）。具体使用方法和定义请参看： http://www.w3school.com.cn/schema/index.asp java自jdk1.5以上新增了SchemaFactory类可以实现对XSD验证的支持，使用起来也很方便。以下代码可用在J
搭建 CentOS 6 服务器(12) - Samba rensanning centos
（1）安装 # yum -y install samba Installed: samba.i686 0:3.6.9-169.el6_5 # pdbedit -a rensn new password:123456 retype new password:123456 …… （2）Home文件夹 # mkdir /etc
Learn Nodejs 01 toknowme nodejs
（1）下载nodejs https://nodejs.org/download/ 选择相应的版本进行下载（2）安装nodejs 安装的方式比较多，请baidu下我这边下载的是“node-v0.12.7-linux-x64.tar.gz”这个版本（1）上传服务器（2）解压 tar -zxvf node-v0.12.
jquery控制自动刷新的代码举例 xp9802 jquery
1、html内容部分复制代码代码示例: <div id='log_reload'> <select name="id_s" size="1"> <option value='2'>-2s-</option> <option value='3'>-3s-</option

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他