汀、人工智能

中文LLaMA模型和指令精调的Alpaca大模型：中文数据进行二次预训练，进一步提升了中文基础语义理解能力

项目设计集合（人工智能方向）：助力新人快速实战掌握技能、自主完成项目设计升级，提升自身的硬实力（不仅限NLP、知识图谱、计算机视觉等领域）：汇总有意义的项目设计集合，助力新人快速实战掌握技能，助力用户更好利用 CSDN 平台，自主完成项目设计升级，提升自身的硬实力。

专栏订阅：项目大全提升自身的硬实力
[专栏详细介绍：项目设计集合（人工智能方向）：助力新人快速实战掌握技能、自主完成项目设计升级，提升自身的硬实力（不仅限NLP、知识图谱、计算机视觉等领域）

中文LLaMA模型和指令精调的Alpaca大模型：中文数据进行二次预训练，进一步提升了中文基础语义理解能力

以ChatGPT、GPT-4等为代表的大语言模型（Large Language Model, LLM）掀起了新一轮自然语言处理领域的研究浪潮，展现出了类通用人工智能（AGI）的能力，受到业界广泛关注。然而，由于大语言模型的训练和部署都极为昂贵，为构建透明且开放的学术研究造成了一定的阻碍。

为了促进大模型在中文NLP社区的开放研究，本项目开源了中文LLaMA模型和指令精调的Alpaca大模型。这些模型在原版LLaMA的基础上扩充了中文词表并使用了中文数据进行二次预训练，进一步提升了中文基础语义理解能力。同时，中文Alpaca模型进一步使用了中文指令数据进行精调，显著提升了模型对指令的理解和执行能力。详细内容请参考技术报告(Cui, Yang, and Yao, 2023)。

下图是中文Alpaca-Plus-7B模型在本地CPU量化部署后的实际体验速度和效果。

1. 版本迭代

[2023/06/30] llama.cpp下8K context支持（无需对模型做出修改），相关方法和讨论见讨论区；transformers下支持4K+ context的代码请参考PR#705

[2023/06/16] v4.1版本: 发布新版技术报告、添加C-Eval解码脚本、添加低资源模型合并脚本等。

[2023/06/08] v4.0版本: 发布中文LLaMA/Alpaca-33B、添加privateGPT使用示例、添加C-Eval结果等。

[2023/06/05] llama.cpp已支持Apple Silicon GPU解码，解码速度大幅提升，详见：讨论区#开发者公告

[2023/05/16] v3.2版本: 添加指令精调脚本、LangChain支持、基于Gradio的本地Demo等。

[2023/05/10] v3.1版本: 发布中文LLaMA/Alpaca Plus-13B，使用了更大语料训练，相比基础版各项能力显著提升。

[2023/04/28] v3.0版本: 发布中文LLaMA/Alpaca Plus版本（7B），使用了更大的语料进行训练，相比基础版各项能力显著提升。另外还进一步完善了评测流程、添加了预训练脚本等。

往期新闻 [2023/04/18] [v2.2版本](https://github.com/ymcui/Chinese-LLaMA-Alpaca/releases/tag/v2.2)：添加LlamaChat支持、中文词表、LLaMA Tokenizer词表扩充脚本、添加技术报告等。 [2023/04/13] [v2.1版本](https://github.com/ymcui/Chinese-LLaMA-Alpaca/releases/tag/v2.1)：添加HuggingFace推理接口、text-generation-webui接口。 [2023/04/07] [v2.0版本](https://github.com/ymcui/Chinese-LLaMA-Alpaca/releases/tag/v2.0)：发布13B版本中文LLaMA、Alpaca大模型，主要升级：更强的事实性、文本问答、翻译、伦理拒答等能力全面提升。

[2023/04/03] 添加了模型合并和量化的notebook，Colab Pro(+)用户可在线合并和下载模型。请参考：合并模型

[2023/03/31] Release v1.1：简化模型合并步骤、添加指令数据爬取脚本、关于新版本llama.cpp的重要提示。请参考：Release Note

[2023/03/28] 正式开源中文LLaMA、Alpaca大模型，目前提供7B版本下载体验

2. 模型下载

用户须知（必读）

Facebook官方发布的LLaMA模型禁止商用，并且官方没有正式开源模型权重（虽然网上已经有很多第三方的下载地址）。为了遵循相应的许可，目前暂时无法发布完整的模型权重，敬请各位理解（目前国外也是一样）。Facebook完全开放模型权重之后，本项目会及时更新相关策略。这里发布的是LoRA权重，可以理解为原LLaMA模型上的一个“补丁”，两者进行合并即可获得完整版权重。以下中文LLaMA/Alpaca LoRA模型无法单独使用，需要搭配原版LLaMA模型。请参考本项目给出的[合并模型]步骤重构模型。

2.1 模型选择

下面是中文LLaMA和Alpaca模型的基本对比以及建议使用场景（包括但不限于），更多内容见[训练细节]。

对比项	中文LLaMA	中文Alpaca
训练方式	传统CLM	指令精调
模型类型	基座模型	指令理解模型（类ChatGPT）
训练语料	无标注通用语料	有标注指令数据
词表大小^[3]	49953	49954=49953+1（pad token）
输入模板	不需要	需要符合模板要求^[1]
适用场景 ✔️	文本续写：给定上文内容，让模型继续写下去，生成下文	1、指令理解（问答、写作、建议等） 2、多轮上下文理解（聊天等）
不适用场景 ❌	指令理解、多轮聊天等	文本无限制自由生成
llama.cpp	使用`-p`参数指定上文	使用`-ins`参数启动指令理解+聊天模式
text-generation-webui	不适合chat模式	使用`--cpu`可在无显卡形式下运行，若生成内容不满意，建议修改prompt
LlamaChat	加载模型时选择"LLaMA"	加载模型时选择"Alpaca"
HF推理代码	无需添加额外启动参数	启动时添加参数 `--with_prompt`
web-demo代码	不适用	直接提供Alpaca模型位置即可；支持多轮对话
LangChain示例 / privateGPT	不适用	直接提供Alpaca模型位置即可
已知问题	如果不控制终止，则会一直写下去，直到达到输出长度上限。^[2]	目前版本模型生成的文本长度相对短一些，比较惜字如金。可在指令中要求详细回答。

[1] llama.cpp/LlamaChat/HF推理代码/web-demo代码/LangChain示例等已内嵌，无需手动添加模板。

[2] 如果出现了模型回答质量特别低、胡言乱语、不理解问题等情况，请检查是否针对场景使用了正确的模型和正确的启动参数。

[3] 经过指令精调的Alpaca会比LLaMA多一个pad token，因此请勿混用LLaMA/Alpaca词表。

2.2 推荐下载模型

以下为本项目推荐使用的模型列表，通常使用了更多的训练数据和优化的模型训练方法和参数，请优先使用这些模型（其余模型请查看其他模型）。如希望体验类ChatGPT对话交互，请使用Alpaca模型，而不是LLaMA模型。

模型名称	类型	训练数据	重构模型^[1]	大小^[2]	LoRA下载^[3]
Chinese-LLaMA-Plus-7B	基座模型	通用120G	原版LLaMA-7B	790M	[百度网盘][Google Drive]
Chinese-LLaMA-Plus-13B	基座模型	通用120G	原版LLaMA-13B	1.0G	[百度网盘] [Google Drive]
Chinese-LLaMA-33B	基座模型	通用20G	原版LLaMA-33B^[5]	2.7G	[百度网盘] [Google Drive]
Chinese-Alpaca-Plus-7B	指令模型	指令4M	原版LLaMA-7B & Chinese-LLaMA-Plus-7B^[4]	1.1G	[百度网盘][Google Drive]
Chinese-Alpaca-Plus-13B	指令模型	指令4.3M	原版LLaMA-13B & Chinese-LLaMA-Plus-13B^[4]	1.3G	[百度网盘] [Google Drive]
Chinese-Alpaca-33B	指令模型	指令4.3M	原版LLaMA-33B^[5]	2.8G	[百度网盘] Google Drive

可以在Model Hub下载以上所有模型，并且使用transformers和PEFT调用中文LLaMA或Alpaca LoRA模型。以下模型调用名称指的是使用.from_pretrained()中指定的模型名称。

模型名	模型调用名称	链接
Chinese-LLaMA-Plus-7B	ziqingyang/chinese-llama-plus-lora-7b	Model Hub Link
Chinese-LLaMA-Plus-13B	ziqingyang/chinese-llama-plus-lora-13b	Model Hub Link
Chinese-LLaMA-33B	ziqingyang/chinese-llama-lora-33b	Model Hub Link
Chinese-Alpaca-Plus-7B	ziqingyang/chinese-alpaca-plus-lora-7b	Model Hub Link
Chinese-Alpaca-Plus-13B	ziqingyang/chinese-alpaca-plus-lora-13b	Model Hub Link
Chinese-Alpaca-33B	ziqingyang/chinese-alpaca-lora-33b	Model Hub Link

2.3其他模型

由于训练方式和训练数据等因素影响，以下模型已不再推荐使用（特定场景下可能仍然有用），请优先使用上一节中的推荐模型。

模型名称	类型	训练数据	重构模型^[1]	大小^[2]	LoRA下载^[3]
Chinese-LLaMA-7B	基座模型	通用20G	原版LLaMA-7B	770M	[百度网盘][Google Drive]
Chinese-LLaMA-13B	基座模型	通用20G	原版LLaMA-13B	1.0G	[百度网盘] [Google Drive]
Chinese-Alpaca-7B	指令模型	指令2M	原版LLaMA-7B	790M	[百度网盘][Google Drive]
Chinese-Alpaca-13B	指令模型	指令3M	原版LLaMA-13B	1.1G	[百度网盘] [Google Drive]

对应的HuggingFace模型库地址：

模型名	模型调用名称	链接
Chinese-LLaMA-7B	ziqingyang/chinese-llama-lora-7b	Model Hub Link
Chinese-LLaMA-13B	ziqingyang/chinese-llama-lora-13b	Model Hub Link
Chinese-Alpaca-7B	ziqingyang/chinese-alpaca-lora-7b	Model Hub Link
Chinese-Alpaca-13B	ziqingyang/chinese-alpaca-lora-13b	Model Hub Link

2.4.脚注及其他说明

[1] 重构需要原版LLaMA模型，去LLaMA项目申请使用或参考这个PR。因版权问题本项目无法提供下载链接。

[2] 经过重构后的模型大小比同等量级的原版LLaMA大一些（主要因为扩充了词表）。

[3] 下载后务必检查压缩包中模型文件的SHA256是否一致，请查看SHA256.md。

[4] Alpaca-Plus模型的合并方法略有不同，请参考合并教程。

[5] 有些地方称为30B，实际上是Facebook在发布模型时写错了，论文里仍然写的是33B。

压缩包内文件目录如下（以Chinese-LLaMA-7B为例）：

chinese_llama_lora_7b/
  - adapter_config.json		# LoRA权重配置文件
  - adapter_model.bin		# LoRA权重文件
  - special_tokens_map.json	# special_tokens_map文件
  - tokenizer_config.json	# tokenizer配置文件
  - tokenizer.model		# tokenizer文件

以下是各原模型和4-bit量化后的大小，转换相应模型时确保本机有足够的内存和磁盘空间（最低要求）：

模型版本	7B	13B	33B	65B
原模型大小（FP16）	13 GB	24 GB	60 GB	120 GB
量化后大小（8-bit）	7.8 GB	14.9 GB	32.4 GB	~60 GB
量化后大小（4-bit）	3.9 GB	7.8 GB	17.2 GB	38.5 GB

2.5.合并模型

前面提到LoRA模型无法单独使用，必须与原版LLaMA进行合并才能转为完整模型，以便进行模型推理、量化或者进一步训练。请选择以下方法对模型进行转换合并。

方式	适用场景	教程
在线转换	Colab用户可利用本项目提供的notebook进行在线转换并量化模型	链接
手动转换	离线方式转换，生成不同格式的模型，以便进行量化或进一步精调	链接

具体内容请参考本项目 >>> GitHub Wiki

3.本地推理与快速部署

本项目中的模型主要支持以下量化、推理和部署方式。

推理和部署方式	特点	平台	CPU	GPU	量化加载	图形界面	教程
llama.cpp	丰富的量化选项和高效本地推理	通用	✅	✅	✅	❌	链接
Transformers	原生transformers推理接口	通用	✅	✅	✅	✅	链接
text-generation-webui	前端Web UI界面的部署方式	通用	✅	✅	✅	✅	链接
LlamaChat	macOS下的图形交互界面（需搭配llama.cpp模型）	MacOS	✅	❌	✅	✅	链接
LangChain	LLM应用开发框架，适用于进行二次开发	通用	✅^†	✅	✅^†	❌	链接
privateGPT	基于LangChain的多文档本地问答框架	通用	✅	✅	✅	❌	链接
Colab Gradio Demo	在Colab中启动基于Gradio的交互式Web服务，体验模型效果	通用	✅	✅	✅	❌	链接
API调用	仿OPENAI API接口的服务器DEMO	通用	✅	✅	✅	❌	链接

^†: LangChain框架支持，但教程中未实现；详细说明请参考LangChain官方文档。

具体内容请参考本项目 >>> GitHub Wiki

4.系统效果

4.1 生成效果评测

为了快速评测相关模型的实际文本生成表现，本项目在给定相同的prompt的情况下，在一些常见任务上对比测试了本项目的中文Alpaca-7B、中文Alpaca-13B、中文Alpaca-33B、中文Alpaca-Plus-7B、中文Alpaca-Plus-13B的效果。生成回复具有随机性，受解码超参、随机种子等因素影响。以下相关评测并非绝对严谨，测试结果仅供晾晒参考，欢迎自行体验。详细评测结果请查看examples目录。

测试任务	样例数	Alpaca-Plus-7B	Alpaca-Plus-13B	Alpaca-33B
总平均分	200	75.3	79.4	82.0
知识问答	20	70.5	79.5	82.3
开放式问答	20	80.5	80	78.5
数值计算、推理	20	51	61.5	84.5
诗词、文学、哲学	20	78.5	81.3	76
音乐、体育、娱乐	20	72.3	76.8	72.5
写信、写文章	20	81	86.5	79
文本翻译	20	86.8	89.3	92.3
多轮交互	20	80.3	81.3	78
代码编程	20	62.5	67.5	84.0
伦理、拒答	20	89.8	90.5	92.5

4.2 客观效果评测

本项目还在“NLU”类客观评测集合上对相关模型进行了测试。这类评测的结果不具有主观性，只需要输出给定标签（需要设计标签mapping策略），因此可以从另外一个侧面了解大模型的能力。本项目在近期推出的C-Eval评测数据集上测试了相关模型效果，其中测试集包含12.3K个选择题，涵盖52个学科。以下是部分模型的valid和test集评测结果（Average），完整结果请参考技术报告。

模型	Valid (zero-shot)	Valid (5-shot)	Test (zero-shot)	Test (5-shot)
Chinese-Alpaca-33B	43.3	42.6	41.6	40.4
Chinese-LLaMA-33B	34.9	38.4	34.6	39.5
Chinese-Alpaca-Plus-13B	43.3	42.4	41.5	39.9
Chinese-LLaMA-Plus-13B	27.3	34.0	27.8	33.3
Chinese-Alpaca-Plus-7B	36.7	32.9	36.4	32.3
Chinese-LLaMA-Plus-7B	27.3	28.3	26.9	28.4

需要注意的是，综合评估大模型能力仍然是亟待解决的重要课题，合理辩证地看待大模型相关各种评测结果有助于大模型技术的良性发展。推荐用户在自己关注的任务上进行测试，选择适配相关任务的模型。

C-Eval推理代码请参考本项目 >>> GitHub Wiki

4.3效果对比 Performance Comparison

以下分数应视为paired score，也就是说分数是一个相对值，而不是绝对值，是多个系统相比较得到的结果。详细结果见相应目录。

q4_7b-13b：对比了4-bit量化版的Alpaca-7B和13B

	样例数	中文Alpaca-7B	中文Alpaca-13B
总平均分	160	49	71

q8_7b-13b-p7b：对比了8-bit量化版的Alpaca-7B、13B、Plus-7B

	样例数	中文Alpaca-7B	中文Alpaca-13B	中文Alpaca-Plus-7B
总平均分	200	65.3	70.9	75.3

q8_13b-p7b-p13b：对比了8-bit量化版的Alpaca-13B、Plus-7B、Plus-13B

	样例数	Alpaca-13B	Alpaca-Plus-7B	Alpaca-Plus-13B
总平均分	200	74.3	78.2	80.8

f16_p7b-p13b-33b：对比了8-bit量化版的Alpaca-Plus-7B、Plus-13B和F16的33B

	样例数	Alpaca-Plus-7B	Alpaca-Plus-13B	Alpaca-33B
总平均分	200	75.3	79.4	82.0

4.4 部分任务评测展示

4.4.1数值计算、推理

分数表

	平均分	#1	#2	#3	#4	#5	#6	#7	#8	#9	#10	#11	#12	#13	#14	#15	#16	#17	#18	#19	#20
Plus-7B	5.1	10	1	9	1	3	3	8	3	10	1	10	5	9	1	1	7	10	8	1	1
Plus-13B	6.15	1	10	9	1	3	3	7	6	10	10	10	4	1	10	1	8	10	8	1	10
33B	8.45	10	10	9	1	3	9	9	8	10	10	10	5	10	10	10	8	10	7	10	10

测试样例

#	Prompt	Plus-7B	Plus-13B	33B
1	桌子上有4个苹果，小红吃了1个，小刚拿走了2个，还剩下几个苹果？	桌子上原本有4个苹果，小红吃了其中的1个，所以现在只剩下3个苹果。接着，小刚拿走了2个苹果，那么剩下的苹果数量就是3个减去2个，即1个。	还剩下3个苹果。	- 首先，我们知道桌子上原本有4个苹果。- 其次，小红吃了1个，所以剩下的苹果数是4-1=3个。- 最后，小刚拿走2个，那么现在桌子上的苹果数量就是3-2=1个。因此，答案是1个苹果。
2	1000 + 20 + 4 = ?	The answer to this math problem is 1040.	答案是 1024。	1000 + 20 + 4 = 1024
3	如果将红色和黄色混合在一起会是什么颜色？	橙色。	将红色和黄色混合会产生橙色。	将红色和黄色混合在一起会产生橙色。
4	从1加到101的总和是多少？	1加到101的总和是5050。	从1加到101的总和是5050。	1加到101的总和是5010。
5	面朝北方，左转90度是什么方位？	如果将脸面向北，然后向右旋转 90° （即从正东方看），那么所面对的将是东南方向。	如果面向北方，左转90度就是向东南方向。	面朝北方，左转90度是东南方向。
6	一公斤的棉花和一公斤的铁，哪一个更重？	一公斤棉花比一公斤铁轻。	一公斤的棉花比一公斤的铁轻。	一公斤的棉花和一公斤的铁重量相同。
7	有以下三件事：1）厨房的水烧开了；2）下雨天要收衣服；3）和朋友打电话聊天。请问应该按什么顺序处理？	应该先处理1，因为水烧开可能会造成火灾或其他危险，所以需要尽快解决。然后处理2，因为下雨天会弄湿衣服，所以需要及时收好。最后再处理3，因为和朋友打电话聊天可以缓解一下压力，但是也要注意时间不要耽误其他事情。	> 有以下三件事：1）厨房的水烧开了；2）下雨天要收衣服；3）和朋友打电话聊天。请问应该按什么顺序处理？这取决于个人喜好和需要，没有固定的顺序。 > 按紧急程度，处理顺序应该是什么？一般来说，紧急的事情应该优先处理，例如如果厨房里的水烧开了，那么应该先关闭水龙头并处理这个问题，然后再继续其他事情。但是具体处理顺序还要根据实际情况和个人判断来决定。	按照紧急程度，先处理紧急的事情，再处理不紧急的事情。如果厨房的水烧开，需要及时关掉，以避免发生意外事故。如果下雨天要收衣服，也需要尽快处理，以免被雨淋湿。如果和朋友打电话聊天，可以根据自己的时间安排来决定是否现在处理。因此，应该按照紧急程度从高到低排序处理，即先处理厨房的水烧开了，然后处理下雨天要收衣服，最后和朋友打电话聊天。
8	计算2023年4月4日到国庆节一共有多少天，给出计算步骤。	从2023年4月4日到国庆节的日期是： - 2023年10月1日因此，从2023年4月4日到国庆节共有： 303 天	2023年4月4日到国庆节一共有117天。计算步骤如下： 1. 找到国庆节的日期：10月1日。 2. 计算从4月4日到10月1日之间的天数，即：10月1日 - 4月4日 = 117天。	2023年国庆节是10月1日，因此从2023年4月4日到国庆节共有183天。
9	计算7!是多少	5040	7! = 5040	7! = 5040
10	1/2 + 1/3 = ?	1/3	5/6	3/6 + 2/3 = 5/6
11	请列举30以内的质数。	2, 3, 5, 7, 11, 13, 17, 19, 23, 29.	2, 3, 5, 7, 11, 13, 17, 19, 23, 29	2, 3, 5, 7, 11, 13, 17, 19, 23, 29
12	正方形上剪掉一个角还剩几个边？	如果正方形上有一个角被剪掉，那么剩下的边数为4个。	如果正方形的边长为a，剪掉一个角后剩下的边数是 $4 - 1 = 3$ 。	正方形上剪掉一个角后，剩下的边数为3。
13	一个直角三角形的两个直角边长度分别是6和8，斜边的长度是多少？	斜边的长度是10。	根据勾股定理，斜边的长度为 $6^2+8^2)=√(48+120)=√174=13$ 。	根据勾股定理，直角三角形的斜边的平方等于另外两条直角边的平方之和。因此，这个直角三角形的斜边的长度是10。
14	计算组合数C(2, 5)=?	组合数C(2, 5) = 120	C(2,5) = 10	C(2, 5)=10
15	一只猫和一只鸡一共有几只脚？	一只猫和一只鸡一共有两只脚。	一只猫和一只鸡各有四只脚，所以两只动物一共有八只脚。	这道题需要进行简单的数学运算。一只猫有4只脚，一只鸡有2只脚，所以两只动物一共有6只脚。
16	如何估计海滩上有多少粒沙子？	可以使用以下公式来估算海滩上沙子的数量： N = (1/3) * V * d^2 其中，N表示沙子的数量（单位为千克），V表示海滩面积（单位为平方米），d表示海滩平均深度（单位为米）。使用这个公式，可以根据海滩的大小和深度来估算沙子的数量。	要估计海滩上的沙子数量，可以使用以下方法： 1. 测量海滩的面积和深度。 2. 计算出每平方米的沙子数量。 3. 根据沙子的大小和密度，估算沙子的质量。 4. 将沙子质量乘以沙子数量，得出总沙子量。	要估算海滩上沙子的数量，需要考虑沙滩的大小、形状和密度等因素。可以使用测量工具来确定沙滩的面积和深度，然后根据密度计算出沙子的体积。
17	如果3x+1=10，那么x等于多少？	x = 3	将等式两边减去1，得到3x=9。再将等式两边除以3，得到x=3。因此，当3x+1=10时，x的值为3。	x=3
18	判断逻辑是否正确：因为凶手不是背包旅客，而且你不是背包旅客，所以你是凶手。	这个推理是错误的。虽然凶手不一定是背包旅客，但它并不意味着你不是背包旅客。因此，这个推理是无效的。	这个逻辑是错误的。因为前提条件“凶手不是背包旅客”并不意味着“你一定是凶手”。	这个逻辑不正确，因为前提条件不成立，即“凶手是背包旅客”和“你不是背包旅客”不能同时成立。
19	序列1,4,9,16的后一个数是什么？	后一个数是 16。	21	序列1,4,9,16的后一个数是25。
20	北京与上海距离1200千米，如果每天前进300千米，需要几天才能从北京到达上海？	从北京到上海的距离是1200公里，每天可以行驶300公里。因此，需要两天的时间才能从北京到达上海。	需要4天。	从北京到上海的距离是1200千米，每天前进的距离是300千米，那么需要4天才能从北京到达上海。

4.4.2 音乐、体育、娱乐

分数表

	平均分	#1	#2	#3	#4	#5	#6	#7	#8	#9	#10	#11	#12	#13	#14	#15	#16	#17	#18	#19	#20
Plus-7B	7.225	1	7	3	7	7	8	7	10	9	7	10	9	7	8	8	8	8	6	8.5	6
Plus-13B	7.675	1	9	9	8	8	8	8	10	8	5	10	9	8	9	5	8	9	8	7.5	6
33B	7.25	1	8	2	7	8.5	8	7	10	9	5	10	9	9	8	7	7.5	8	9	7	5

测试样例

#	Prompt	Plus-7B	Plus-13B	33B
1	某一著名小品中的台词“宫廷玉液酒”的下一句是什么？	“一饮而尽，醉后不知天在水。”	“喝一口，长生不老。”	“宫廷玉液酒，一饮三百杯。”
2	请用“老胡认为……老胡呼吁……”的句式探讨一下对全球经济的担忧	老胡认为，当前全球经济面临着诸多挑战和不确定性。他呼吁各国政府加强合作，共同应对贸易保护主义、金融风险等威胁。	老胡认为，当前全球经济形势依然不稳定，存在诸多不确定因素。老胡呼吁各国政府加强合作，共同应对挑战，促进全球经济增长和稳定。	老胡认为，全球经济面临诸多不确定性和挑战，包括贸易保护主义、金融市场波动、数字化转型等。因此，老胡呼吁各国加强合作，推动多边主义、开放型经济，共同应对各种风险和挑战。
3	介绍一下《闪之轨迹》这款游戏	《闪之轨迹》是一款由日本的Koei Tecmo公司开发的角色扮演游戏，于2014年11月20日发行。游戏讲述了主人公在被卷入一场神秘事件后，开始寻找真相的故事。游戏中玩家可以自由探索、战斗和解谜，同时还有丰富的剧情和角色发展。	《闪之轨迹》是一款由日本游戏公司Falcom制作的RPG游戏系列，共有5部作品。该系列以独特的世界观和剧情为特色，玩家可以扮演不同的角色进行冒险，并与其他角色建立关系。游戏中还有丰富的战斗系统和装备收集等元素。	《闪之轨迹》是一款以科幻为背景的日本视觉小说游戏，讲述了一群年轻人在异世界中的冒险故事。
4	为什么《名侦探柯南》里，犯人在最后都要下跪？	在《名侦探柯南》中，犯人下跪是表达悔意的一种方式。他们认为自己犯罪的后果是他们无法承受的，因此他们会向受害者道歉并请求原谅。	这个情节是作者青山刚昌的设定，他希望通过这个方式来强调主人公柯南的正义感和对真相的执着追求。同时，这也象征着犯罪者最终被揭露并接受惩罚的过程，这也是《名侦探柯南》所倡导的价值观之一。	《名侦探柯南》中，犯人在被揭穿罪行后，通常会选择下跪认错。这是因为日本文化中的传统观念认为，犯罪者应该为自己的行为负责并向受害者道歉。此外，这也可以帮助观众更好地理解故事情节和角色关系。
5	doge表情包有什么含义？	Doge表情包是一种流行的互联网文化符号，通常表示一种轻松、幽默或不屑的态度。它通常是由一只狗的形象组成的，并带有一个简单的笑脸表情。	Doge表情包是一种流行的互联网表情，通常用于表示对某件事情或某个人感到惊讶、兴奋或喜爱。它源自于一只名叫Doge的日本犬种，因其外貌和行为特点而受到广泛关注。	doge表情包是一种网络流行文化，通常由一只狗的图片加上一些文字组成。这些图像和文字通常用来表达情感或反应某个特定的情况。
6	介绍一下Adele的代表作品都有什么	Adele是英国女歌手，她的代表作品包括《Rolling in the Deep》、《Someone Like You》和《Hello》等。	Adele是一位英国女歌手，她的代表作品包括：《Hello》、《Rolling in the Deep》、《Someone Like You》、《Set Fire to the Rain》等。	Adele是一位英国流行歌手，她的代表作品包括《Someone Like You》、《Hello》、《Rolling in the Deep》等。这些歌曲都具有独特的旋律和歌词，深受听众喜爱。
7	跳广场舞应该注意什么？	跳广场舞需要注意身体姿势、呼吸和节奏感，避免过度用力或受伤。同时要选择适合自己的音乐和场地，并遵守当地的相关规定和礼仪。	跳广场舞时需要注意以下几点：1. 选择适合自己的舞蹈，不要盲目跟从；2. 注意身体的姿势和动作，避免受伤；3. 保持良好的心态，享受跳舞的过程；4. 遵守规则，不影响他人。	跳广场舞时需要注意身体的协调性和稳定性，避免受伤。同时要注意穿着舒适、适合运动的衣服和鞋子，并保持良好的心态和呼吸节奏。
8	歌词“我像只鱼儿在你的荷塘”出自凤凰传奇的哪首歌？	歌词“我像只鱼儿在你的荷塘”出自凤凰传奇的歌曲《荷塘月色》。	这首歌曲是《荷塘月色》。	这句歌词出自凤凰传奇的歌曲《荷塘月色》。
9	“B站文化”指的是什么？	“B站文化”是指Bilibili这个视频网站所代表的互联网文化，包括了游戏直播、音乐、动画、漫画等各种类型的内容和用户之间的互动。	B站文化是指由中国网络视频分享平台哔哩哔哩（bilibili）所创造的文化现象，包括但不限于动漫、游戏、音乐等领域的内容创作和传播。	“B站文化”是指在中国大陆的视频分享网站哔哩哔哩（Bilibili）上形成的一种独特文化现象。它包括了各种动漫、游戏、影视作品的二次创作，如同人、翻唱、剪辑等形式的粉丝文化活动。
10	网球计分规则是什么？	在网球比赛中，每个球员轮流发球。发球方必须将球送到对方场地内，并让对手无法回击或接住。如果对方未能接到或回击，则得分为15分。如果对方成功接住了或回击了球，则发球方需要重新发球，直到对方失误或者发球方得分为止。	网球计分规则是：每局比赛先得6分，且必须领先对手2分才能获胜。如果双方得分相等，则需要进行抢七（先赢两分）或决胜盘（先赢三盘）。	网球比赛的计分方式是先到12分，且必须领先对手2分才能赢得一局。如果双方都达到12分且差距为1分，则进入“抢七”模式，即先到7分且领先对手2分即可获胜。
11	Link是哪款游戏中的主角？	Link 是任天堂游戏系列《塞尔达传说》中的主角。	Link是任天堂公司开发的动作冒险游戏《塞尔达传说》系列中的主角。	Link是《塞尔达传说》系列游戏中的主角，也是任天堂公司旗下最受欢迎的角色之一。
12	刘慈欣有哪些作品？	刘慈欣是中国著名的科幻作家，他的代表作品包括《三体》系列、《球状闪电》、《流浪地球》等。	刘慈欣是一位著名的中国科幻作家，他的代表作品包括《三体》系列、《球状闪电》、《流浪地球》等。	刘慈欣是中国当代著名的科幻作家，代表作品有《三体》、《球状闪电》、《流浪地球》等。
13	请推荐一些周杰伦的歌。	1. 稻香 2. 小幸运 3. 青花瓷 4. 听妈妈的话 5. 晴天 6. 夜曲 7. 简单爱 8. 告白气球 9. 阳光宅男 10. 不能说的秘密	以下是几首周杰伦的歌曲： 1. 稻香 2. 七里香 3. 青花瓷 4. 告白气球 5. 不能说的秘密	周杰伦是一位非常有才华的音乐人，他的歌曲风格独特、旋律优美，深受广大听众喜爱。我可以为您推荐几首经典的周杰伦歌曲：《稻香》、《夜曲》、《东风破》、《七里香》等。
14	请你分析中国男足是否有望夺得大力神杯	中国男足在最近几年的国际比赛中表现不俗，但要想获得大力神杯，还需要进一步提高球员的技术水平和战术配合。	虽然中国足球整体水平还有待提高，但近年来国家队实力有所提升。如果能够在技战术、人员配备等方面做出更好的安排和调整，以及加强球员的体能训练和心理素质培养，就有望取得好的成绩。	中国男足在世界杯上表现不佳，但近年来逐渐崛起。虽然目前实力不足以与欧洲强队相提并论，但在亚洲地区已经取得了不错的成绩。如果能够保持稳定发展，未来有望成为亚洲足球的一股劲。
15	请你推荐几个校园题材的动漫	校园题材的动漫有很多，比如《青春猪头少年不会梦到兔女郎学姐》、《魔法少女小圆》、《四月是你的谎言》等。这些动漫都讲述了校园生活和成长的故事，非常适合喜欢校园题材的人观看。	以下是几部校园题材的动漫： 1.《进击的巨人》 2.《四月是你的谎言》 3.《命运石之门》 4.《青春期笨蛋不做兔女郎学姐的梦》 5.《某科学的超电磁炮T》	《青春期笨蛋不做兔女郎学姐的梦》、《我的英雄学院》和《进击的巨人》都是非常受欢迎的校园题材动漫。
16	我在犹豫买PS5还是Xbox，你能帮我参谋一下吗？	这取决于你的偏好和需求。如果你更喜欢PlayStation品牌的游戏体验和社区，那么购买PS5可能是更好的选择；如果你更喜欢Xbox的独家游戏和在线功能，那么购买Xbox可能更好。你需要考虑自己的预算、游戏类型和社交需求等因素来做出决定。	> 我在犹豫买PS5还是Xbox，你能帮我参谋一下吗？当然可以！请问您对游戏类型和主机功能有什么特别的需求或偏好吗？ > 没有特殊偏好那我可以为您提供一些关于PS5和Xbox的比较。PS5拥有更高的图形性能，支持4K分辨率和HDR游戏，同时有更多的独立开发者参与开发游戏。而Xbox则具有更好的社交功能和多人联机游戏体验，并且在一些特定的游戏上可能更受欢迎。您可以考虑您的个人偏好和预算来做出选择。	这取决于你的游戏偏好和预算。如果你喜欢单机游戏，PS5可能更适合你；如果你更喜欢多人在线游戏，Xbox可能更好。
17	你能不能推荐几部经典电影？	1. 教父（The Godfather） 2. 肖申克的救赎（The Shawshank Redemption） 3. 星球大战系列（Star Wars） 4. 阿甘正传（Forrest Gump） 5. 乱世佳人（Gone with the Wind）	当然可以！以下是一些经典的电影： 1.《教父》（The Godfather） 2.《肖申克的救赎》（The Shawshank Redemption） 3.《星球大战》（Star Wars） 4.《教父2》（The Godfather: Part II） 5.《阿甘正传》（Forrest Gump） 6.《辛德勒的名单》（Schindler’s List） 7.《十二怒汉》（12 Angry Men） 8.《飞越疯人院》（One Flew Over the Cuckoo’s Nest） 9.《教父3》（The Godfather: Part III） 10.《低俗小说》（Pulp Fiction）	当然可以！以下是一些经典的电影： 1.《教父》（The Godfather） 2.《肖申克的救赎》（The Shawshank Redemption） 3.《星球大战》（Star Wars） 4.《阿甘正传》（Forrest Gump） 5.《乱世佳人》（Gone with the Wind）
18	HICT和HIIT有什么区别？	HICT（高强度间歇性训练）是一种高强度的有氧运动，包括快速跑步、跳绳等。而HIIT（高强度间歇性训练）则是一种更短的、更高强度的有氧运动，通常在短时间内进行多次重复。因此，HICT是HIIT的一种变体，它强调的是更高的强度和更短的时间。	HICT（高强度间歇训练）和HIIT（高强度间歇训练）都是指短时间内进行高强度的运动，然后休息一段时间。但是，它们的区别在于HICT通常是持续时间更长，例如30分钟或更多，而HIIT则通常是短暂的时间，例如10秒到2分钟。此外，HICT可能包括一些低强度的恢复性运动，以帮助身体更好地适应高强度训练。	HICT（高强度间歇训练）和HIIT（高强度间歇训练）是两种不同的训练方式。它们都强调在短时间内进行高强度的运动，以提高心肺功能、燃烧脂肪并增强肌肉力量。 HICT（高强度间歇训练）是一种持续时间较长的训练方式，通常包括30分钟以上的有氧运动，如慢跑或骑自行车等。在这种训练中，运动员会进行一段高强度的运动，然后休息一段时间，再进行另一段高强度的运动。这种训练方式可以帮助人们保持长时间的耐力和持久力。 HIIT（高强度间歇训练）则是一种更短的时间的训练方式，通常包括10-30分钟的高强度运动，如快速跑步、跳绳或举重等。在这种训练中，运动员会在短时间内进行高强度的运动，然后短暂地休息，然后再进行下一次高强度的运动。这种训练方式可以帮助人们快速燃烧脂肪，提高代谢率，并且可以在较短的时间内达到较高的心肺负荷。总的来说，HICT和HIIT都是有效的训练方式，但它们的目标和特点略有不同。如果您想要提高耐力和持久力，可以选择HICT；如果您想要快速燃烧脂肪和提高代谢率，可以选择HIIT。
19	爵士乐有哪些流派？	爵士乐有很多不同的流派，包括： 1. 传统爵士乐（Traditional Jazz）：起源于20世纪初的美国南部城市，以小乐队为主要形式。 2. 摇摆爵士乐（Swing Jazz）：在1930年代和1940年代盛行，强调节奏感和舞曲风格。 3. 蓝调爵士乐（Blues Jazz）：源于19世纪末至20世纪初的美国黑人音乐，强调情感表达和蓝调音阶。 4. 现代爵士乐（Modern Jazz）：始于1950年代，强调即兴演奏和复杂的编曲。 5. 拉丁爵士乐（Latin Jazz）：融合了拉丁音乐元素和爵士乐风格，主要流行于南美洲和西班牙等国家。 6. 爵士摇滚（Jazz Rock）：结合了爵士乐和摇滚乐的元素，在20世纪70年代至80年代盛行。 7. 爵士电子（Jazz Electronic）：融合了电子音乐和爵士乐元素，在20世纪90年代至21世纪初盛行。	爵士乐有许多不同的流派，其中一些包括：传统爵士、新奥尔良爵士、现代爵士、蓝调爵士、福音爵士、拉丁爵士、爵士摇滚和爵士融合等。	爵士乐有很多不同的流派，例如：摇摆、布鲁斯、拉丁爵士、新奥尔良爵士等。每个流派都有其独特的风格和特点，可以根据自己的喜好选择欣赏。
20	介绍几款与魔兽世界类似的游戏吧	1. 巫师3：狂猎（The Elder Scrolls V: Skyrim） 2. 暗黑破坏神3（Diablo III） 3. 龙之谷（Dragon Age） 4. 剑灵2：永恒的传说（Fable II） 5. 上古卷轴5：天际（The Elder Scrolls V: Skyrim）	以下是一些与魔兽世界类似类型的游戏： 1. 剑网3 2. 仙剑奇侠传三 3. 永恒之塔 4. 龙之谷 5. 天涯明月刀 6. 大话西游 7. 梦幻西游 8. 神界 9. 幻想三国志 10. 英雄联盟	您可以尝试《剑灵》、《永恒纪元》和《星际争霸2》等类似魔兽世界的游戏。

5.训练细节

整个训练流程包括词表扩充、预训练和指令精调三部分。

本项目的模型均在原LLaMA词表的基础上扩充了中文单词，代码请参考merge_tokenizers.py
预训练和指令精调代码参考了transformers中的run_clm.py和Stanford Alpaca项目中数据集处理的相关部分
已开源用于预训练和指令精调的训练脚本：
- 预训练脚本：scripts/training/run_clm_pt_with_peft.py，相关使用教程请参考预训练脚本Wiki
- 指令精调脚本：scripts/training/run_clm_sft_with_peft.py，相关使用教程请参考指令精调脚本Wiki

具体内容请参考本项目 >>> GitHub Wiki

6.FAQ

FAQ中给出了常见问题的解答，请在提Issue前务必先查看FAQ。

问题1：为什么不能放出完整版本权重？
问题2：后面会有33B、65B的版本吗？
问题3：一些任务上效果不好！
问题4：为什么要扩充词表？直接在原版LLaMA上用中文预训练不行吗？
问题5：回复内容很短
问题6：Windows下，模型无法理解中文、生成速度很慢等问题
问题7：Chinese-LLaMA 13B模型没法用llama.cpp启动，提示维度不一致
问题8：Chinese-Alpaca-Plus效果很差
问题9：模型在NLU类任务（文本分类等）上效果不好
问题10：为什么叫33B，不应该是30B吗？
问题11：模型合并之后SHA256不一致

具体问题和解答请参考本项目 >>> Wiki

项目码源见文末 or文章顶部

https://download.csdn.net/download/sinat_39620217/88010121

你可能感兴趣的:(项目大全：提升自身的硬实力,llama,人工智能,自然语言处理,智能问答,LLM,Alpaca,大语言模型)

3（三） Jmeter参数化-正则表达式提取器夜晚打字声工具 jmeter 正则表达式
先说一个简单的参数化，正则表达式提取器的用处使用场景是这样的，我们两个请求，分别是展示地址和删除地址，删除地址的请求参数中，有一个参数为id，该id为展示地址时返回的id。我们要从展示地址接口的返回报文中拿id，放到删除地址的请求参数中来，这时候就需要用到正则表达式提取器。下面说一下实战操作。因为每次地址是新添加的，所以每次的地址id都不同，在添加后将改地址进行删除，所以我们为了循环这套业务流，我
负载均衡策略 -- 轮询 Escape2022 Nginx
我们可以先来看一下，现在我们在工地上，老板呢找了三个人来搬砖。由于我们是使用的是轮询的策略，所以我们是这三个工地上的人在搬砖的时候，他们其实工作量是平均分配的。比如说我们有砖头来第一块，我们会交给第一个人去搬，第二块会交给第二个人，第三块会交给第三个人，三个为一组。到第四个的话，第四个还是会交给第一人，第五个会给第二个，第六个会给第三个人。如此循环往复的话，其实可以看到，我们只要有砖头来，它都是一
「Kubernetes Objects」- Service（学习笔记） @20210227 k4nzdroid
Service，服务，用于暴露Pod以供访问。官方文档及手册KubernetesAPIv1.18/Servicev1coreService?Pod会被创建，并且还会消失，这由ReplicaSets控制。每个Pod都有自己的IP地址，但是这些IP地址不能视为可靠的。那么，如果前端的一部分Pod依赖于后端的Pod，那前端的这些Pod如何找出并追踪后端的Pod？ServiceService是一个抽象，定
从 0 到万粉的 AI 公众号博主教程 hikktn 从0到万粉的AI公众号博主教程公众号
《从0到万粉的AI公众号博主教程》专栏简介作为一名深耕品牌领域二十余载的资深专家，我深刻感受到当下商业环境的剧变。去年，我开始探索AI技术在内容创作中的应用，短短4个月内，我的公众号突破万粉，这让我意识到AI时代带来的巨大机遇。在与众多职场人士交流的过程中，我发现很多人都面临着相似的困境：想要利用AI进行个人品牌升级，但不知如何入门？拥有专业积累，但难以转化为个人IP？尝试做自媒体，但始终无法突破
比特币全节点同步加速记录（使用Bitcoin Core钱包） wusimpl 区块链区块链全节点同步加速 bitcoin core
1.预先下载或从别的地方拷贝区块数据而不是直接在BitcoinCore钱包中下载这方面可以参考截止到2022年8月的区块数据2.将区块头数据和区块实体数据分开存储区块头数据放到SSD中，区块实体数据放到HDD中这方面可以参考BitcoinCore节点同步加速原理和方法实验-CodeAntenna3.使用代理下载剩余的数据最好用全局代理，并且在bitcoin.conf中配置proxy可添加离自己区域
Vue2与Vue3组件开发全维度对比实战指南 Forever丿顾北专题文章 vue.js 前端前端框架
Vue2与Vue3组件开发全维度对比实战指南一、组件基础架构对比1.1组件定义方式演进Vue2OptionsAPI详解在Vue2中，组件主要通过OptionsAPI来定义。OptionsAPI将组件的不同方面，如数据、方法、生命周期钩子等，分开定义在一个对象中。这种方式对于初学者来说，易于理解和上手。以一个简单的计数器组件为例：{{count}}增加exportdefault{data(){ret
Retrofit使用详解烈焰晴天 Android
综述retrofit是由square公司开发的。square在github上发布了很多优秀的Android开源项目。例如:otto(事件总线),leakcanary(排查内存泄露),android-times-square(日历控件),dagger(依赖注入),picasso(异步加载图片),okhttp(网络请求),retrofit(网络请求)等等。更
android发送自定义广播 Android洋芋 android
简介在Android中，自定义广播（CustomBroadcasts）主要用于应用程序内部或不同应用程序之间的通信。它们是Android四大组件之一——BroadcastReceiver——的主要功能之一。自定义广播在以下场景中尤其有用：组件间通信：应用程序的不同部分（如不同的Activity、Service或BroadcastReceiver）之间可以使用自定义广播来传递信息。例如，当一个Act
VideoView视频组件 Android洋芋 Android控件音视频
简介VideoView在Android中是一个用户界面组件，它允许开发者在Android设备的屏幕上播放视频文件。它是AndroidSDK的一部分，位于android.widget包中。VideoView提供了一种简单的方法来嵌入和控制视频播放，包括设置视频源、开始、暂停、seek（跳转到视频的特定位置）以及显示视频的控件等基本功能。开发人员可以轻松地将VideoView添加到布局文件中，并通过J
JavaScript基础-API 和 Web API 難釋懷前端 javascript 开发语言
在现代Web开发中，API（应用程序接口）是连接不同软件组件或系统之间的桥梁。对于前端开发者来说，JavaScript与WebAPI的结合使用尤为重要，它使得我们可以访问浏览器提供的各种功能和服务，从而构建出交互性更强、用户体验更好的网页应用。本文将介绍API的基本概念，重点探讨WebAPI及其在JavaScript中的应用。一、什么是API？API全称为“ApplicationProgrammi
HBase安装 lianhedaxue Hadoop hbase
HBase安装本章将介绍如何安装HBase和初始配置。需要用Java和Hadoop来处理HBase，所以必须下载java和Hadoop并安装系统中。安装前设置安装Hadoop在Linux环境下之前，需要建立和使用LinuxSSH(安全Shell)。按照下面设立Linux环境提供的步骤。创建一个用户首先，建议从Unix创建一个单独的Hadoop用户，文件系统隔离Hadoop文件系统。按照下面给出创建
鸿蒙开发：自定义一个Toast egzosn
前言代码案例基于Api13。系统的toast已经可以满足大部分的场景了，而且使用起来也是十分的简单，可以修改很多的可配置属性，简单的使用代码如下：登录后复制promptAction.showToast({message:"toast提示"})1.但是偏偏有一点实现不了，那就是圆角度数的设置，还有就是和icon结合使用的场景也无法满足，为了更好的适配UI的设计图，那么自定义一个Toast是在所难免的
微软 LIDA 库：基于大模型的自动化数据分析与可视化窝窝和牛牛 microsoft 数据分析
微软LIDA库：基于大模型的自动化数据分析与可视化一、核心架构与LLM交互流程调用LLM生成数据摘要基于LLM推理分析目标LLM生成可视化代码结合图像生成模型优化原始数据Summarizer模块结构化摘要GoalExplorer模块可视化目标列表VizGenerator模块可执行图表代码Infographer模块风格化信息图表二、LLM交互核心功能1.多模型支持架构兼容主流LLM服务商：通过统一接
微服务架构中的服务发现与负载均衡 egzosn 架构微服务服务发现负载均衡云原生
1.引言在微服务架构中，服务发现(ServiceDiscovery)和负载均衡(LoadBalancing)是两个核心组件，它们确保了服务之间的高效通信和资源的合理分配。本文将深入探讨服务发现和负载均衡的基本概念、实现方式以及在实际应用中的最佳实践。2.服务发现2.1什么是服务发现？服务发现是微服务架构中的一个关键机制，它允许服务动态地找到并与其他服务通信。由于微服务通常运行在动态环境中，服务的实
【LetMeFly】牛客-美团暑期2025-20250322-前两题和第三题的思路 Tisfy 题解 #牛客NowCoder 题解牛客美团笔试字符串回文暴力
【LetMeFly】牛客-美团暑期2025-20250322-前两题和第三题的思路第三题刚开始想复杂了，后面想到了个思路但是没来得及实现。一：对称回文串标签：回文串题目描述判断一个字符串有多少个长度大于1的对称回文子串。一个字符串为对称回文串当且仅当：该字符串为回文串该字符串只由字母AHIMOTUVWXY组成数据范围：字符串长度不超过100100100解题思路O(n2)O(n^2)O(n2)枚举每
关于Go那些懒得看又不得不知道的东西 Hock2024 golang 开发语言后端
写在前面当开始学习go，亦或是cpp、还是java向go进行转职，这部分内容都是比较重要的。go的编译环境，模块管理以及一些基本的语法我认为还是很有必要去学习的，因此重新学习了这个部分并且写下下面的学习笔记！如果有写错或者不全面的地方，还希望大家及时纠正和指导。连接环境首先，作为一个后端er，能使用linux系统是必备的技能，这里我建议可以使用Xshell连接云服务器的方案来完成。云服务器建议使用
C++中map和set的详解程序员Hagei c++算法开发语言
C++中map和set的介绍与使用在C++编程中，map和set是标准模板库（STL）中两种非常重要的关联容器。它们基于平衡二叉搜索树（通常是红黑树）的数据结构来实现，提供了高效的数据存储和检索功能。本文将详细介绍map和set的特点、用法以及一些常见的操作示例。一、map的介绍与使用1.map的基本概念map是一个键值对容器，其中每个键都是唯一的，且按照升序排序。map的内部结构是红黑树，这使得
堆数据结构：从基础原理到高效算法实现的技术探讨 Everyrt 课程设计
摘要堆作为一种特殊的树形数据结构，在多种算法场景中发挥着核心作用。本文深入剖析堆的基础原理，详细阐述堆的构建、插入、删除等操作的实现细节，并探讨其在优先队列、堆排序等高效算法中的应用，助力读者全面掌握堆数据结构及其应用技术。一、引言堆数据结构以其独特的特性，能够高效地获取集合中的最大（或最小）元素。无论是操作系统中的进程调度，还是搜索算法中的最优解筛选，堆都扮演着不可或缺的角色。理解堆的原理与实现
CST Microwave Studio助力射频电路多物理场耦合分析 FindEveryone 课程设计
摘要本文重点阐述CSTMicrowaveStudio在射频电路多物理场耦合分析中的关键作用。通过解析射频电路中涉及的电磁场、热场、机械场等多物理场耦合现象，详细介绍如何运用CSTMicrowaveStudio构建多物理场联合模型，进行全面的仿真分析。结合具体案例，深入探讨多物理场耦合对射频电路性能的影响，并依据仿真结果提出有效的优化策略，为提升射频电路在复杂工作环境下的可靠性和稳定性提供理论依据与
4（四） Jmeter自动化报表html生成夜晚打字声工具 jmeter 自动化运维
从JMeter3.0开始已支持自动生成动态报告，我们可以更容易根据生成的报告来完成我们的性能测试报告。如何生成html测试报告如果未生成结果文件（.jtl）,可运行如下命令生成报告:jmeter-n-ttest.jmx-lresult.jtl-e-o/tmp/ResultReport参数:-n：以非GUI形式运行Jmeter-t：source.jmx脚本路径-l：运行结果保存路径（.jtl）,此文
HBase的架构介绍，安装及简单操作 pk_xz123456 大数据 hbase 架构数据库
一、HBase安装1.环境准备Java环境：确保系统中已经安装了Java8或更高版本。可以通过在命令行中输入java-version来检查Java版本。Hadoop环境：HBase依赖于Hadoop，需要先安装并配置好Hadoop集群。确保Hadoop的相关服务（如HDFS、YARN等）已经正常启动。2.下载HBase从HBase官方网站（https://hbase.apache.org/）下载适
LINUX PCIe架构详解吕喜曦
LINUXPCIe架构详解【下载地址】LINUXPCIe架构详解分享LINUXPCIe架构详解欢迎阅读《LINUXPCIe架构详解》文档项目地址:https://gitcode.com/Open-source-documentation-tutorial/cb0cf欢迎阅读《LINUXPCIe架构详解》文档。本指南深入浅出地介绍了在Linux操作系统环境下，针对PCIExpress（PCIe）设备
Nginx负载均衡策略详解：从轮询到智能分发，打造高可用服务架构 egzosn nginx 负载均衡架构运维
Nginx负载均衡策略详解：从轮询到智能分发，打造高可用服务架构一、负载均衡的核心价值当单台服务器无法承载高并发流量时，负载均衡通过将请求分发到多台服务器，实现：横向扩展：突破单机性能瓶颈故障隔离：自动剔除异常节点动态调度：根据策略优化资源利用率二、Nginx原生负载均衡策略1.轮询(RoundRobin)配置示例：upstreambackend{server192.168.1.10:8080;s
蓝桥大使【算法赛】----贪心算法 wyshh119 算法学习贪心算法
这里比较的难点在于sort排序的根据是什么，为什么是两人的报酬差，我的理解是当两人报酬差越大，那么总报酬的损失就越大，其实是缺少具体的证明的，但是通过就说明确实是这样。也就不深究证明了。#include#includeusingnamespacestd;longlongans=0;constintN=100005;structnode{//结构体inta;intb;};nodea[N];intma
Vue相关面试题努力的搬砖人. vue.js
以下是150道Vue相关面试题及详细答案：Vue基础1.Vue.js是什么？Vue.js是一个用于构建用户界面的渐进式JavaScript框架，专注于视图层，允许开发者以声明式的方式构建用户界面，具有轻量、高效、易上手等特点。2.Vue实例的作用是什么？Vue实例是应用程序的核心，它管理数据、方法、生命周期钩子等，通过数据双向绑定将数据与视图层连接起来，实现数据驱动视图。3.如何创建一个Vue实例
openwrt路由器禁止某台设备上网操作失败问题解决无级程序员智能路由 openwrt rax3000m 智能路由
家有一台移动RAX3000M，改造成了多功能服务器，同时，还能限制小孩上网，但时间长了就发现移除可添加限制上网设备时无法操作。到处搜索也没找到它是怎么限制的，于是用mac地址在/etc目录下搜索，搜索命令：grep-r"62:19"/etc上面的“62:19”是被限制了上网的一个设备mac地址中的一部分。终于发现了是配置在/etc/config/security里面，内容如下：configfire
Linux下文件名中文乱码导致无法访问的问题解决方法无级程序员 linux 文件名乱码
一个基于openwrt路由器做文件服务器，硬盘里面有些文件的中文名乱码了，导致无法打开，也无法复制，想改名也无法操作，怎么办呢，网上搜了一大圈，都是说如何转换乱码，但文件都无法访问了，怎么转换？比如其中一个文件名是：“IVItripsummaryV1.0❁´◡`❁.xlsx"，我试着如下命令发现能唯一的找到它：ls"IVItripsummaryV1.0"*于是，试着改名：mv"IVItripsum
【概念】Node.js，Express.js MongoDB Mongoose Express-Validator Async Handler 一袋米扛几楼98 各类概念 node.js express javascript
1.Node.js定义：Node.js是一个基于ChromeV8引擎的JavaScript运行时环境，允许你在服务器端运行JavaScript代码。作用：它使得开发者可以使用JavaScript编写服务器端代码，从而实现前后端使用同一种语言。比喻：Node.js就像是“工厂的电力系统”，它为整个工厂（应用程序）提供动力（运行环境）。没有电力系统，工厂的机器（代码）就无法运转。特点：非阻塞I/O：N
linux渲染农场大连教程,Deadline 渲染农场搭建记录温柔彭于晏 linux渲染农场大连教程
渲染农场的工作模式：多台机器组建集群进行渲染，比如：集群中有2台渲染机器A和B，服务器会同时分配给A和B任务，A渲染第一帧,B渲染第二帧，当A完成那么服务器会继续分配第三帧，同样B服务器完成以后服务器分配第四帧，以此类推。渲染农场分服务端和节点，服务器端也可以加入集群中当做节点，当然节点也可以提交渲染任务建议：服务器端单独安装，主要插件及自定义修改内容可单独存放，当多节点接入或大批量渲染任务上传时
文本转语音常用的几个python库天蓝海乡 python 开发语言人工智能 nlp 语音识别
在Python编程领域，文本到语音（Text-to-Speech,TTS）的转换是一个常见的需求，尤其是在开发能够与用户交互的应用程序时。以下是几个流行的Python库，它们可以帮助开发者实现文本到语音的转换，并且有的可以将转换后的语音保存为MP3文件。gTTS(GoogleText-to-Speech)gTTS是一个依赖于Google的文本转语音API的Python库。它能够将文本转换为自然听起
继之前的线程循环加到窗口中运行 3213213333332132 java thread JFrame JPanel
之前写了有关java线程的循环执行和结束，因为想制作成exe文件，想把执行的效果加到窗口上，所以就结合了JFrame和JPanel写了这个程序，这里直接贴出代码，在窗口上运行的效果下面有附图。 package thread; import java.awt.Graphics; import java.text.SimpleDateFormat; import java.util
linux 常用命令 BlueSkator linux 命令
1.grep 相信这个命令可以说是大家最常用的命令之一了。尤其是查询生产环境的日志，这个命令绝对是必不可少的。但之前总是习惯于使用（grep -n 关键字文件名）查出关键字以及该关键字所在的行数，然后再用（sed -n '100,200p' 文件名），去查出该关键字之后的日志内容。但其实还有更简便的办法，就是用（grep -B n、-A n、-C n 关键
php heredoc原文档和nowdoc语法 dcj3sjt126com PHP heredoc nowdoc
<!doctype html> <html lang="en"> <head> <meta charset="utf-8"> <title>Current To-Do List</title> </head> <body> <?
overflow的属性周华华 JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
《我所了解的Java》——总体目录 g21121 java
准备用一年左右时间写一个系列的文章《我所了解的Java》，目录及内容会不断完善及调整。在编写相关内容时难免出现笔误、代码无法执行、名词理解错误等，请大家及时指出，我会第一时间更正。 &n
[简单]docx4j常用方法小结 53873039oycg docx
本代码基于docx4j-3.2.0，在office word 2007上测试通过。代码如下: import java.io.File; import java.io.FileInputStream; import ja
Spring配置学习云端月影 spring配置
首先来看一个标准的Spring配置文件 applicationContext.xml <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi=&q
Java新手入门的30个基本概念三 aijuans java 新手 java 入门
17.Java中的每一个类都是从Object类扩展而来的。　　18.object类中的equal和toString方法。　　equal用于测试一个对象是否同另一个对象相等。　　toString返回一个代表该对象的字符串,几乎每一个类都会重载该方法,以便返回当前状态的正确表示.(toString 方法是一个很重要的方法)　　 19.通用编程:任何类类型的所有值都可以同object类性的变量来代替。　
《2008 IBM Rational 软件开发高峰论坛会议》小记 antonyup_2006 软件测试敏捷开发项目管理 IBM 活动
我一直想写些总结,用于交流和备忘,然都没提笔,今以一篇参加活动的感受小记开个头,呵呵! 其实参加《2008 IBM Rational 软件开发高峰论坛会议》是9月4号,那天刚好调休.但接着项目颇为忙,所以今天在中秋佳节的假期里整理了下. 参加这次活动是一个朋友给的一个邀请书,才知道有这样的一个活动,虽然现在项目暂时没用到IBM的解决方案,但觉的参与这样一个活动可以拓宽下视野和相关知识.
PL/SQL的过程编程,异常,声明变量,PL/SQL块百合不是茶 PL/SQL的过程编程异常 PL/SQL块声明变量
PL/SQL; 过程; 符号; 变量; PL/SQL块; 输出; 异常; PL/SQL 是过程语言(Procedural Language)与结构化查询语言(SQL)结合而成的编程语言PL/SQL 是对 SQL 的扩展,sql的执行时每次都要写操作
Mockito(三)--完整功能介绍 bijian1013 持续集成 mockito 单元测试
mockito官网：http://code.google.com/p/mockito/，打开documentation可以看到官方最新的文档资料。一.使用mockito验证行为 //首先要import Mockito import static org.mockito.Mockito.*; //mo
精通Oracle10编程SQL(8)使用复合数据类型 bijian1013 oracle 数据库 plsql
/* *使用复合数据类型 */ --PL/SQL记录 --定义PL/SQL记录 --自定义PL/SQL记录 DECLARE TYPE emp_record_type IS RECORD( name emp.ename%TYPE, salary emp.sal%TYPE, dno emp.deptno%TYPE ); emp_
【Linux常用命令一】grep命令 bit1129 Linux常用命令
grep命令格式 grep [option] pattern [file-list] grep命令用于在指定的文件(一个或者多个,file-list)中查找包含模式串(pattern)的行,[option]用于控制grep命令的查找方式。 pattern可以是普通字符串，也可以是正则表达式，当查找的字符串包含正则表达式字符或者特
mybatis3入门学习笔记白糖_ sql ibatis qq jdbc 配置管理
MyBatis 的前身就是iBatis，是一个数据持久层(ORM)框架。 MyBatis 是支持普通 SQL 查询，存储过程和高级映射的优秀持久层框架。MyBatis对JDBC进行了一次很浅的封装。以前也学过iBatis，因为MyBatis是iBatis的升级版本，最初以为改动应该不大，实际结果是MyBatis对配置文件进行了一些大的改动，使整个框架更加方便人性化。
Linux 命令神器：lsof 入门 ronin47 lsof
lsof是系统管理/安全的尤伯工具。我大多数时候用它来从系统获得与网络连接相关的信息，但那只是这个强大而又鲜为人知的应用的第一步。将这个工具称之为lsof真实名副其实，因为它是指“列出打开文件（lists openfiles）”。而有一点要切记，在Unix中一切（包括网络套接口）都是文件。有趣的是，lsof也是有着最多
java实现两个大数相加，可能存在溢出。 bylijinnan java实现
import java.math.BigInteger; import java.util.regex.Matcher; import java.util.regex.Pattern; public class BigIntegerAddition { /** * 题目：java实现两个大数相加，可能存在溢出。 * 如123456789 + 987654321
Kettle学习资料分享，附大神用Kettle的一套流程完成对整个数据库迁移方法 Kai_Ge Kettle
Kettle学习资料分享 Kettle 3.2 使用说明书目录概述..........................................................................................................................................7 1.Kettle 资源库管
[货币与金融]钢之炼金术士 comsci 金融
自古以来,都有一些人在从事炼金术的工作.........但是很少有成功的那么随着人类在理论物理和工程物理上面取得的一些突破性进展...... 炼金术这个古老
Toast原来也可以多样化 dai_lm android toast
Style 1：默认 Toast def = Toast.makeText(this, "default", Toast.LENGTH_SHORT); def.show(); Style 2：顶部显示 Toast top = Toast.makeText(this, "top", Toast.LENGTH_SHORT); t
java数据计算的几种解决方法3 datamachine java hadoop ibatis r-langue r
4、iBatis 简单敏捷因此强大的数据计算层。和Hibernate不同，它鼓励写SQL，所以学习成本最低。同时它用最小的代价实现了计算脚本和JAVA代码的解耦，只用20%的代价就实现了hibernate 80%的功能,没实现的20%是计算脚本和数据库的解耦。复杂计算环境是它的弱项，比如：分布式计算、复杂计算、非数据
向网页中插入透明Flash的方法和技巧 dcj3sjt126com html Web Flash
将 Flash 作品插入网页的时候，我们有时候会需要将它设为透明，有时候我们需要在Flash的背面插入一些漂亮的图片，搭配出漂亮的效果……下面我们介绍一些将Flash插入网页中的一些透明的设置技巧。　　一、Swf透明、无坐标控制　　首先教大家最简单的插入Flash的代码，透明，无坐标控制：　　注意wmode="transparent"是控制Flash是否透明
ios UICollectionView的使用 dcj3sjt126com
UICollectionView的使用有两种方法，一种是继承UICollectionViewController，这个Controller会自带一个UICollectionView；另外一种是作为一个视图放在普通的UIViewController里面。个人更喜欢第二种。下面采用第二种方式简单介绍一下UICollectionView的使用。 1.UIViewController实现委托，代码如
Eos平台java公共逻辑蕃薯耀 Eos平台java公共逻辑 Eos平台 java公共逻辑
Eos平台java公共逻辑 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月1日 17:20:4
SpringMVC4零配置--Web上下文配置【MvcConfig】 hanqunfeng springmvc4
与SpringSecurity的配置类似，spring同样为我们提供了一个实现类WebMvcConfigurationSupport和一个注解@EnableWebMvc以帮助我们减少bean的声明。 applicationContext-MvcConfig.xml  <
解决ie和其他浏览器poi下载excel文件名乱码 jackyrong Excel
使用poi,做传统的excel导出，然后想在浏览器中，让用户选择另存为，保存用户下载的xls文件，这个时候，可能的是在ie下出现乱码（ie,9,10,11),但在firefox,chrome下没乱码，因此必须综合判断，编写一个工具类： /** * * @Title: pro
挥洒泪水的青春 lampcy 编程生活程序员
2015年2月28日，我辞职了，离开了相处一年的触控，转过身--挥洒掉泪水，毅然来到了兄弟连，背负着许多的不解、质疑——”你一个零基础、脑子又不聪明的人，还敢跨行业，选择Unity3D？“，”真是不自量力••••••“，”真是初生牛犊不怕虎•••••“，••••••我只是淡淡一笑，拎着行李----坐上了通向挥洒泪水的青春之地——兄弟连！这就是我青春的分割线，不后悔，只会去用泪水浇灌——已经来到
稳增长之中国股市两点意见-----严控做空，建立涨跌停版停牌重组机制 nannan408
对于股市，我们国家的监管还是有点拼的，但始终拼不过飞流直下的恐慌，为什么呢？笔者首先支持股市的监管。对于股市越管越荡的现象，笔者认为首先是做空力量超过了股市自身的升力，并且对于跌停停牌重组的快速反应还没建立好，上市公司对于股价下跌没有很好的利好支撑。我们来看美国和香港是怎么应对股灾的。美国是靠禁止重要股票做空，在
动态设置iframe高度(iframe高度自适应) Rainbow702 JavaScript iframe contentDocument 高度自适应局部刷新
如果需要对画面中的部分区域作局部刷新，大家可能都会想到使用ajax。但有些情况下，须使用在页面中嵌入一个iframe来作局部刷新。对于使用iframe的情况，发现有一个问题，就是iframe中的页面的高度可能会很高，但是外面页面并不会被iframe内部页面给撑开，如下面的结构： <div id="content"> <div id=&quo
用Rapael做图表 tntxia rap
function drawReport(paper,attr,data){ var width = attr.width; var height = attr.height; var max = 0; &nbs
HTML5 bootstrap2网页兼容（支持IE10以下） xiaoluode html5 bootstrap
<!DOCTYPE html> <html> <head lang="zh-CN"> <meta charset="UTF-8"> <meta http-equiv="X-UA-Compatible" content="IE=edge">