行动π技术博客

【论文翻译】DeepSeek-Coder-V2: Breaking the Barrier of Closed-Source Models in Code Intelligence

本翻译来自大模型翻译，如有不对的地方，敬请谅解

引言

开源社区通过开发诸如StarCoder（Li等人，2023b；Lozhkov等人，2024）、CodeLlama（Roziere等人，2023）、DeepSeek-Coder（Guo等人，2024）和Codestral（MistralAI，2024）等开源代码模型，在推进代码智能方面取得了显著进展。这些模型的性能已稳步接近闭源同类产品，为代码智能的进步做出了贡献。然而，当与像GPT4-Turbo（OpenAI，2023）、Claude 3 Opus（Anthropic，2024）和Gemini 1.5 Pro（Reid等人，2024）这样的最先进闭源模型相比时，仍然存在明显的差距。为了弥补这一差距并进一步推动开源代码模型的发展，我们引入了DeepSeek-Coder-V2系列。这些模型基于DeepSeek-V2（DeepSeek-AI，2024）的基础构建，并使用额外的6万亿个token的语料库进行了进一步预训练。

在预训练阶段，DeepSeek-Coder-V2的数据集由60%的源代码、10%的数学语料库和30%的自然语言语料库组成。源代码包括来自GitHub和CommonCrawl的1,170亿个与代码相关的token，使用的是与DeepSeekMath（Shao等人，2024）相同的流程。这个语料库与用于训练DeepSeek-Coder的代码语料库相比，从86种编程语言扩展到了338种。为了展示新代码语料库的有效性，我们使用1亿参数模型进行了消融研究，并观察到在HumanEval（从30.5%提高到37.2%）和MBPP（从44.6%提高到54.0%）基准测试中的准确率分别提高了6.7%和9.4%（Austin等人，2021a；Chen等人，2021）。对于数学语料库，我们使用相同的流程从CommonCrawl收集了2210亿个与数学相关的token，这大约是120亿DeepSeekMath语料库（Shao等人，2024）的两倍大小，而对于自然语言语料库，我们直接从DeepSeek-V2的训练语料库中进行采样。总的来说，DeepSeek-Coder-V2在10.2万亿个训练token中得到了曝光，其中4.2万亿个token来自DeepSeek V2数据集，其余6万亿个token来自DeepSeek-Coder-V2数据集。

为了适应更长的代码输入，并增强在各种编程场景中的适用性，我们把上下文长度从16K扩展到了128K个token，使我们的模型能够处理更复杂和广泛的编码任务。在对DeepSeekV2进行持续预训练后，我们发现DeepSeek-Coder-V2在编码和数学推理方面显著增强了模型的能力，同时保持了与DeepSeek-V2相当的一般语言性能。

在对齐阶段，我们首先构建了一个指令训练数据集，其中包含来自DeepSeek-Coder（Guo等人，2024）和DeepSeek-Math（Shao等人，2024）的代码和数学数据，以及来自DeepSeek-V2（DeepSeek-AI，2024）的一般指令数据。该数据集用于微调基础模型。然后，在强化学习阶段，我们采用群体相对策略优化（GRPO）算法使其行为与人类偏好对齐。偏好数据是通过编译器反馈和测试用例在编码领域收集的，并开发了一个奖励模型来指导策略模型的训练。这种方法确保了模型的响应针对编码任务的正确性和人类偏好进行了优化。为了使模型在对齐后能够支持代码补全，我们还在使用16B参数的基于模型的微调期间采用了Fill-In-Middle方法（Guo等人，2024）。

1.1. 贡献

总结来说，我们的主要贡献包括：

我们引入了基于DeepSeek MoE框架的DeepSeek-Coder-V2，具有16B和236B参数，其激活参数分别仅为2.4B和21B，有效支持多样化的计算和应用需求。此外，DeepSeek-Coder-V2支持338种编程语言和最大128K个token的上下文长度。
我们首次尝试开发一个开源的千亿参数代码模型，以推进代码智能领域。实验结果表明，DeepSeek-Coder-V2 236B在编码和数学任务中的性能超越了GPT4-Turbo、Claude 3 Opus和Gemini 1.5 Pro等最先进的闭源模型。
DeepSeek-Coder-V2模型在宽松的许可证下公开发布，允许进行研究和不受限制的商业使用。

1.2. 评估和指标摘要

代码：在代码生成基准评估方面，DeepSeek-Coder-V2在所有开源模型中展现出显著的优越性，并与GPT4-Turbo、Claude 3 Opus和Gemini 1.5 Pro等领先的闭源模型表现相当。值得注意的是，我们在HumanEval上取得了90.2%的分数，在MBPP上取得了76.2%的分数（使用EvalPlus评估流程建立了新的最先进结果），并在LiveCodeBench上取得了43.4%的分数（问题来自2023年12月至2024年6月）。此外，DeepSeek-Coder-V2是首个在SWEBench上得分超过10%的开源模型。
数学：DeepSeek-Coder-V2展现出强大的数学推理能力，在GSM8K等基础基准和包括MATH、AIME 2024和Math Odyssey在内的高级竞赛级基准上，与GPT-4o、Gemini 1.5 Pro和Claude 3 Opus等顶级闭源模型相媲美。值得注意的是，DeepSeek-Coder-V2在MATH基准上达到了75.7%的准确率，几乎与GPT-4o实现的最先进准确率76.6%相匹配。此外，它在2024年的AIME竞赛中的性能超越了这些闭源模型。
自然语言：DeepSeek-Coder-V2保持了与DeepSeek-V2相当的一般语言性能。例如，在MMLU上，DeepSeek-Coder-V2使用OpenAI simple-eval流程达到了79.2%的准确率。在以GPT-4为评判的主观评估中，DeepSeek-Coder-V2在arena-hard上达到了65.0分，在MT-bench上达到了8.77分，在alignbench上达到了7.84分。这些分数明显优于其他特定于代码的模型，甚至与一般开源模型相当。

基准 (指标)	DeepSeek-V2-Lite	DeepSeek-Coder-V2-Lite	DeepSeek-V2	DeepSeek-Coder-V2
# 激活参数	2.4B	2.4B	21B	21B
# 总参数	16B	16B	236B	236B
# 训练token	5.7T	10.2T	8.1T	10.2T

英语

BBH (EM)	3-shot 48.1	61.2	79.7	83.9
MMLU (Acc.)	5-shot 55.7	60.1	78.1	79.2
ARC-Easy (Acc.)	25-shot 86.1	88.9	98.1	97.4
ARC-Challenge (Acc.)	25-shot 73.4	77.4	92.3	92.8
TriviaQA (EM)	5-shot 65.2	59.5	86.7	82.3
NaturalQuestions (EM)	5-shot 35.5	30.8	53.4	47.5
AGIEval (Acc.)	0-shot 42.8	28.7	61.4	60.0

中文

CLUEWSC (EM)	5-shot 80.0	76.5	89.9	85.9
C-Eval (Acc.)	5-shot 60.1	61.6	78.0	79.4
CMMLU (Acc.)	5-shot 62.5	62.7	81.6	80.9

开放式

Arena-Hard	11.40	38.10	41.60	65.00
AlpacaEval 2.0	16.85	17.74	38.90	36.92
MT-Bench	7.37	7.81	8.97	8.77
Alignbench	6.02	6.83	7.91	7.84

请注意，表格中的“#TP”和“#AP”分别代表“# Total Parameters（总参数数）”和“# Active Parameters（激活参数数）”，而“# Shots”表示评估时使用的样本数量。其他缩写如“Acc.”代表“Accuracy（准确率）”，“EM”代表“Exact Match（精确匹配）”。

2. 数据收集

DeepSeek-Coder-V2的预训练数据主要由60%的源代码、10%的数学语料库和30%的自然语言语料库组成。由于自然语言语料库直接从DeepSeek-V2的训练数据集中采样，本节重点介绍代码和数学数据的收集、清洗和过滤过程。同时，我们通过比较分析实验进一步验证了这些数据的质量。

我们收集了2023年11月之前在GitHub上创建的公共仓库。首先，我们应用与DeepSeek-Coder (Guo et al., 2024)中使用的相同的过滤规则和近重复数据删除，以筛选出低质量和重复的源代码。为了使论文自包含，我们简要描述了过滤规则。首先，我们过滤掉平均行长度超过100个字符或最大行长度超过1000个字符的文件。此外，我们移除了字母字符少于25%的文件。除了XSLT编程语言外，我们还进一步过滤掉在前100个字符中出现"

为了从Common Crawl中收集与代码和数学相关的网页文本，我们遵循了DeepSeekMath (Shao et al., 2024)中相同的流程。具体来说，我们选择编码论坛如StackOverflow1、库站点如PyTorch文档2，以及数学网站如StackExchange3作为我们最初的种子语料库。使用这个种子语料库，我们训练了一个fastText模型 (Joulin et al., 2016)来回忆更多与编码和数学相关的网页。由于像中文这样的语言不能通过空格进行分词，我们使用了DeepSeek-V2中的Byte Pair Encoding (BPE)分词器，这显著提高了fastText的召回准确率。对于每个领域，我们计算了第一次迭代中收集的网页百分比。收集超过10%网页的领域被分类为与代码或数学相关。然后我们注释了与这些已识别领域中代码或数学相关内容相关联的URL。将链接到这些URL的未收集网页添加到种子语料库中。经过三次迭代的数据收集，我们从网页中收集了70亿与代码相关的token和221亿与数学相关的token。为了从GitHub进一步收集高质量的源代码，我们也在GitHub上应用了相同的流程，进行了两次迭代的数据收集，并收集了94亿源代码。最初的种子语料库是通过手动收集高质量的源代码构建的，例如包含详细描述的那些。最后，新的代码语料库包括来自GitHub和CommonCrawl的1170亿与代码相关的token。

为了展示新代码语料库的有效性，我们使用1亿参数模型进行了消融研究（见表1），将其与用于训练DeepSeek-Coder的语料库进行了比较。使用1T个token在新代码语料库上预训练1B模型，在HumanEval（从30.5%提高到36.0%）和MBPP（从44.6%提高到49.0%）基准上分别提高了5.5%和4.4%的准确率。进一步使用2T个token训练1B模型，HumanEval和MBPP的分数分别提高到37.2%和54.0%。因此，新代码语料库优于用于训练DeepSeek-Coder的语料库。

3. 训练策略

3.1. 训练策略

我们为DeepSeek-Coder-V2 16B使用了两种训练目标：Next-Token-Prediction（下一个词元预测）和Fill-In-Middle（FIM）（Bavarian等人，2022；Guo等人，2024；Li等人，2023b）。对于DeepSeek-Coder-V2 236B，我们仅使用Next-Token-Prediction目标。这里简要介绍FIM训练策略。我们采用FIM训练方法开发DeepSeekCoder-V2-16B，利用PSM（前缀，后缀，中间）模式。这种方法将内容重建结构化为序列：前缀，后缀和中间，如下所示：

<｜fim_begin｜> ????<｜fim_hole｜> ??? ?<｜fim_end｜> ??????
<|eos_token|>

这种结构作为预打包过程的一部分在文档级别上应用。FIM以0.5的比率使用，与PSM框架一致，以提高训练效率和模型性能。

3.2. 模型架构

我们的架构与DeepSeekV2 (DeepSeek-AI, 2024) 保持一致。超参数设置，16B和236B，分别对应于DeepSeek-V2-Lite和DeepSeek-V2中使用的设置。值得注意的是，在训练过程中我们遇到了不稳定性以及梯度值的尖峰，我们将其归因于指数归一化技术。为了解决这个问题，我们恢复使用了传统的归一化方法。

3.3. 训练超参数

与DeepSeek V2方法 (DeepSeek-AI, 2024) 一致，我们使用AdamW优化器 (Loshchilov和Hutter, 2019)，配置为1 = 0.9, 2 = 0.95，并使用0.1的权重衰减。批量大小和学习率根据DeepSeek-V2的规格进行调整。对于学习率调度，我们采用余弦衰减策略，从2000个预热步骤开始，逐渐将学习率降低到初始值的10%。

DeepSeek-Coder-V2和DeepSeek-Coder-V2-Lite都使用相同的方法进行训练。为了保持DeepSeek-Coder-V2在自然语言理解方面的稳健能力，我们从DeepSeek-V2的中间检查点继续预训练过程。最初的中间检查点是在4.2T个token上训练的。因此，在预训练阶段，DeepSeek-Coder-V2总共接触了10.2T个高质量token。

模型	DeepSeek-Coder-V2-Lite	DeepSeek-Coder-V2
# 总参数 (#TP)	16B	236B
# 激活参数 (#AP)	2.4B	21B
预训练token	4.2T+6T	4.2T+6T
LR调度器	余弦	余弦
FIM启用	启用	禁用

表 2 | DeepSeek-Coder-V2的训练设置。

3.4. 长上下文扩展

遵循DeepSeek-V2，我们使用Yarn (Peng等人，2023)将DeepSeek-Coder-V2的上下文长度扩展到128K。YARN的超参数与DeepSeek-V2相同：比例? 到40, ? 到1, 到32。我们进一步通过两个阶段继续训练模型，以增强其处理长上下文的能力。在第一阶段，我们使用32K的序列长度和1152的批量大小进行1000步训练。在第二阶段，我们再训练模型1000步，采用128K的序列长度和288序列的批量大小。

3.5. 对齐
3.5.1. 监督微调
为了构建DeepSeek-Coder-V2 Chat，我们构建了一个包含代码和数学数据的指令训练数据集。我们首先收集了20k与代码相关的指令数据和30k与数学相关的数据，这些数据来自DeepSeek-Coder和DeepSeek-Math。为了保持通用能力，我们还从DeepSeek-V2的指令数据中采样了一些数据。最后，我们使用了总共300M个token的指令数据集。在训练中，我们使用了一个余弦计划，预热步骤为100，初始学习率为5?−6。我们还使用了1M个token的批量大小，总共1B个token。

3.5.2. 强化学习
我们进一步采用强化学习技术来充分模拟DeepSeek-Coder-V2的能力，这已被证明是非常有效的。

提示
我们花费了相当的努力从各种来源收集与代码和数学相关的提示，每个代码提示都配有相应的测试用例。在筛选提示后，总共大约有40k条数据。

奖励建模
奖励模型在RL训练中扮演着至关重要的角色。在数学偏好数据方面，我们使用真实标签来获取它们。在代码偏好数据方面，尽管代码编译器本身已经可以提供0-1反馈（无论代码是否通过了所有测试用例），但一些代码提示可能只有有限数量的测试用例，并没有提供全面覆盖，因此直接使用编译器的0-1反馈可能是嘈杂和次优的。因此，我们决定在编译器提供的数据上训练一个奖励模型，并在RL训练中使用奖励模型来提供信号，这比原始编译器信号更具鲁棒性和更好的泛化能力。如图3所示，在我们的内部测试集（Leetcode和Leetcode-zh）中，使用奖励模型提供RL训练信号的表现明显优于使用原始编译器信号。因此，在所有后续实验中，我们使用奖励模型信号而不是编译器信号。

强化学习算法
我们采用Group Relative Policy Optimization (GRPO)算法作为我们的RL算法，这与DeepSeek-V2使用的相同。值得注意的是，GRPO已被证明是非常有效的，并且与PPO相比成本更低，因为没有必要维护一个额外的评论家模型。

第四部分：实验结果

在本节中，我们评估了DeepSeek-Coder-V2在三种类型的任务上的表现，包括编码、数学和一般自然语言。我们将DeepSeek-Coder-V2与以前的最先进大型语言模型进行了比较。

CodeLlama (Roziere等人，2023)包括一系列基于Llama2 (Touvron等人，2023)的代码语言模型，并在500到1000亿代码令牌的数据集上继续预训练。这些模型有四种大小：7B、13B、34B和70B。
StarCoder (Lozhkov等人，2024)是一个公开访问的模型，有15亿参数。它专门在Stack数据集 (Kocetkov等人，2022)的一个精心策划的子集上进行训练，涵盖了86种编程语言。
StarCoder2 (Lozhkov等人，2024)包括3B、7B和15B参数模型，在Stack2数据集 (Lozhkov等人，2024)的3.3到4.3万亿令牌上进行训练，涵盖了619种编程语言。
DeepSeek-Coder (Guo等人，2024)包括一系列代码语言模型，参数从10亿到33亿不等。每个模型都是从头开始在2万亿令牌上训练的，其中87%是代码，13%是中英文混合的自然语言。这些模型是在项目级代码语料库上使用16K窗口大小和额外的填空任务进行预训练的，使其支持项目级代码补全和填充。
Codestral (MistralAI，2024)是由Mistral开发的22B参数模型。它在一个超过80种编程语言的多样化数据集上进行训练，包括Python、Java和JavaScript等流行语言，以及像Swift和Fortran这样的更专业的语言。
我们比较的通用语言模型包括Llama3 70B (Meta，2024)、GPT-4 (OpenAI，2023)、Claude 3 Opus (Anthropic，2024)和Gemini 1.5 Pro (Reid等人，2024)。虽然它们不是专门在大型代码语料库上训练的，但它们在编码方面达到了最先进的性能。

4.1. 代码生成
HumanEval和MBPP基准测试。HumanEval (Chen等人，2021) 4和MBPP (Austin等人，2021b)基准测试通常用于评估生成代码的大型语言模型(LLMs)的性能。HumanEval包含164个Python任务，这些任务通过测试用例在零样本情况下验证了代码LLMs的性能。对于MBPP，我们使用MBPP-Plus版本 (Liu等人，2023a)来评估模型。为了测试模型的多语言能力，我们将HumanEval基准问题扩展到七种额外的语言：C++、Java、PHP、TypeScript、C#、Bash、JavaScript、Swift、R、Julia、D、Rust和Racket。对于两个基准测试，我们采用了贪婪搜索策略，并使用相同的脚本和环境重新创建了基线结果，以确保公平比较。

以下是各种模型在HumanEval和MBPP+基准测试上的性能指标的详细概述。DeepSeek-Coder-V2-Instruct展示了卓越的性能，以75.3%的平均分排名第二，这一表现值得注意的是，它打破了封闭源模型通常的主导地位，成为领先的开源竞争者。它仅次于GPT-4o，后者以76.4%的平均分领先。DeepSeek-Coder-V2-Instruct在包括Java和PHP在内的各种语言上都取得了最高分，并在Python、C++、C#、TypeScript和JavaScript上表现强劲，突显了其处理多样化编码挑战的稳健性和多功能性。

此外，DeepSeek-Coder-V2-Lite-Instruct也表现出色，超过了更大的33B模型。在平均性能上有很大的优势(65.6%对61.9%)，这突出了16B模型在提供竞争性结果方面的有效性，尽管其尺寸较小。这突显了模型的效率以及模型架构和训练方法的进步，使其能够超越更大的对手。

竞争性编程。为了进一步验证模型在现实世界竞争性编程问题中的能力，我们使用LiveCodeBench (Jain等人，2024)和USACO基准测试 (Shi等人，2024)来评估DeepSeek-Coder-V2的有效性。LiveCodeBench是对大型语言模型(LLMs)进行代码生成评估的细致且无污染的评估，系统地从LeetCode、AtCoder和CodeForces三个著名竞争性编程平台收集随时间变化的新挑战。由于训练数据的截止日期是2023年11月之前，我们使用了Livecodebench的子集(1201-0601)。USACO基准测试包含307个来自美国计算机奥林匹克的问题，以及每个问题的高质量单元测试、参考代码和官方分析。

以下是各种语言模型在两个基准测试上的性能。值得注意的是，DeepSeek-Coder-V2-Instruct提供了出色的表现，与大型模型中得分最高的GPT-4o并列，达到了43.4%，这将其排在第二位，仅次于以45.7%的整体表现领先的GPT-4-Turbo-0409。DeepSeek-Coder-V2-Instruct处理复杂编码挑战的印象深刻的能力，牢固地确立了它作为顶级竞争者的地位，紧随领先的GPT-4-Turbo变体之后。

4.2. 代码补全
4.2.1. 仓库级代码补全评估
我们使用RepoBench (Liu等人，2023b)来评估当前可用的开源代码模型在仓库级代码补全任务中的能力，这些模型的大小在35B以下。这个数据集是由两种流行的编程语言Python和Java的多样化真实世界、开源、许可宽松的仓库构建的。值得注意的是，RepoBench的最新版本(v1.1)的数据来自2023年10月6日至12月31日之间在GitHub上创建的仓库，而我们的预训练数据包括2023年11月之前创建的代码。为确保此数据集不在我们的预训练数据中并避免数据泄露，我们只使用2023年12月的数据。

我们的评估包括五个上下文长度级别—2k、4k、8k、12k和16k令牌—在三个设置中：跨文件首、跨文件随机和文件内。我们对所有评估中的模型使用贪婪搜索。模型被限制在每个提示下最多生成64个新令牌，并将输出中的第一行非空非注释行选为预测。通过截断多余的跨文件上下文，将提示的最大令牌长度设置为15,800。我们报告不同上下文长度级别的平均完全匹配。

以下是不同模型在RepoBench v1.1的12月子集上的性能。

尽管DeepSeek-Coder-V2-Lite-Base模型只有24亿个活跃参数，但其在Python上的代码补全能力与33B的DeepSeek-Coder-Base模型相当，在Java上与7B的DeepSeek-Coder-Base模型相当。与CodeStral相比，DeepSeek-Coder-V2-Lite-Base模型的活跃参数数量只有CodeStral的十分之一，因此在代码补全任务中的性能较低。然而，我们认为DeepSeek-Coder-V2的较小活跃参数数量使其在代码补全场景中更快。

4.2.2. 填充中间的代码补全
DeepSeek-Coder-V2-Lite采用了一种独特的方法，包括在预训练阶段使用0.5的填充中间(FIM)率。这种方法允许模型利用周围的上下文，包括前面的和后面的代码段，来填补空白，从而熟练地完成代码。这对于代码补全工具特别有利。几个开源模型，如SantaCoder (Allal等人，2023)、StarCoder (Li等人，2023b)和CodeLlama (Roziere等人，2023)，也利用类似的能力，在代码生成和补全领域树立了高标准。

为了评估DeepSeek-Coder-V2模型的性能，我们对领先模型进行了比较分析。评估基于Single-Line Infilling基准测试，涵盖了由Allal等人(2023)描述的三种不同的编程语言。此次评估的主要指标是行精确匹配准确率。

以下是各种编码模型在FIM任务上的性能，涵盖三种编程语言：Python、Java和JavaScript，平均得分表明整体有效性。在比较的模型中，配置有24亿活跃参数的DeepSeek-Coder-V2-Lite-Base取得了杰出的结果。它在Python中得分80.0%，在Java中得分89.1%，在JavaScript中得分87.2%，导致平均得分最高为86.4%。这表明DeepSeek-Coder-V2-Lite-Base在处理不同编程语言的FIM任务方面的卓越有效性，与其他在评估中更大的模型实现了相当的性能。

4.3. 代码修复
为了评估模型的错误修复能力，我们使用了Defects4J 7、SWE-bench (Jimenez等人，2023)和Aider 8数据集进行测试。Defects4J是软件工程领域中广泛使用的数据集，专门设计用于评估和测试程序修复技术。它包括来自各种开源项目的现实世界软件错误集合，包括但不限于Apache Commons、JFreeChart和Closure Compiler。数据集中的每个错误都伴随着可以用来验证程序修复工具有效性的测试套件。由于Defec4J中的原始错误可能需要修改存储库中的多个文件，导致上下文较长，我们收集了238个只需要修改此基准中的一个方法的错误。

SWE-bench是一个全面基准，旨在评估大型语言模型解决来自GitHub的现实世界软件问题的性能。基准测试提供了一个代码库以及一个特定的问题，挑战语言模型生成一个补丁，有效地解决所描述的问题。这一严格的评估框架确保了语言模型理解和修复现实世界软件问题的能力得到了彻底的测试，为其在软件开发任务中的实用性和有效性提供了清晰的衡量。

Aider的代码编辑基准测试评估了LLM修改Python源文件、完成133个不同编码任务的能力。这个基准测试不仅测试了LLM的编码技能，还检查了它根据提示中的规范一致性地生成代码编辑的能力。

对于DeepSeek-Coder-V2模型，我们使用整体格式进行评估。

以下是不同语言模型在软件修复基准测试上的性能，包括Defects4J、SWE-bench和Aider。在开源模型中，DeepSeekCoder-Instruct脱颖而出，成为开源模型中的佼佼者。它在Defects4J中得分21%，在SWE-bench中得分12.7%，接近领先的封闭源模型的结果，并展示了处理较长代码序列的显著能力。值得注意的是，DeepSeek-Coder-V2-Instruct在Aider中得分最高，为73.7%，超过了所有其他列出的模型，包括封闭源的竞争对手。这一卓越的性能突出了其在自动化代码修复任务中的效率和鲁棒性，使DeepSeek-Coder-V2-Instruct成为顶级开源模型，也是封闭源替代品在该领域中的有力竞争者。

4.4. 代码理解和推理
为了评估我们的模型的代码推理能力，我们使用了CRUXEval基准测试。该基准测试包括800个Python函数，配以相应的输入输出示例。它分为两个不同的任务：CRUXEval-I，要求大型语言模型(LLM)根据给定的输入预测输出；CRUXEval-O，模型必须根据已知的输出预测输入。这种结构挑战了模型理解和推理Python代码的能力，无论是正向还是反向。表8显示了各种语言模型在CruxEval基准测试上的性能，该基准测试根据两个指标对模型进行评估：CruxEval-I-COT和CruxEval-O-COT。在开源模型中，DeepSeek-Coder-V2-Instruct显著突出。它在CruxEval-I-COT上得分70.0%，在CruxEval-O-COT上得分75.1%，展示了其在开源领域内的卓越能力。然而，与更大的封闭源模型相比，存在性能差距。这种性能差距可能在很大程度上归因于DeepSeek-Coder-V2-Instruct仅使用210亿个激活参数，这比像GPT-4o这样的更大、更先进的封闭源模型中的参数要少得多。模型复杂性的限制可能限制了其学习和解决问题的能力。

以下是不同模型在CruxEval基准测试上的性能。

4.5. 数学推理
为了评估DeepSeekCoder-V2的数学推理能力，我们使用了流行的小学基准测试GSM8K (Cobbe等人，2021)，以及包括MATH (Hendrycks等人，2021)、2024年美国邀请数学考试(AIME) (MAA，2024)和数学奥德赛(Math Odyssey) (Netmind.AI，2024)在内的高级竞赛级基准测试。

以下是不同模型在数学推理上的性能。DeepSeek-Coder-V2在MATH基准测试上达到了75.7%的准确率，在数学奥德赛上达到了53.7%，与最先进的GPT-4o相当。此外，DeepSeek-Coder-V2比其他模型解决了更多的2024年AIME问题，展示了其强大的数学推理能力。

4.6. 一般自然语言
由于DeepSeek-Coder-V2是建立在DeepSeek-V2的基础上的，它继承了强大的自然语言能力，甚至在与推理相关的基准测试上超过了DeepSeek-V2。我们在标准基准测试上将DeepSeek-Coder-V2 Instruct与DeepSeek-V2 Chat进行了比较，这些基准测试涵盖了包括BigBench Hard (BBH) (Suzgun等人，2022)、MMLU (Hendrycks等人，2020)、ARC (Clark等人，2018)、TriviaQA (Joshi等人，2017)、NaturalQuestions (Kwiatkowski等人，2019)、AGIEval (Zhong等人，2023)、CLUEWSC (Xu等人，2020)、C-Eval (Huang等人，2023)和CMMLU (Li等人，2023a)在内的中英文基准测试。此外，我们还评估了模型的开放式生成能力，包括Arena-Hard (Li等人，2024)、AlpacaEval2.0 (Dubois等人，2024)、MT-Bench (Zheng等人，2023)和Alignbench (Liu等人，2023c)。评估流程和指标与DeepSeek-V2相同，其中MMLU使用OpenAI simple-eval包进行评估。

以下是DeepSeek-Coder-V2 Instruct与DeepSeek-V2 Chat的比较。

当比较16B模型时，很明显DeepSeek-Coder-V2-Lite-Instruct在BBH和Arena-Hard等基准测试中优于DeepSeek-V2-Lite-Chat。这些基准测试对模型的推理能力要求很高，DeepSeek-Coder-V2-Lite-Instruct在这方面表现出色。然而，DeepSeek-Coder-V2-Lite Instruct在像TriviaQA这样的知识密集型基准测试中落后，这主要是因为预训练期间使用的网络数据量相对较少。

对于236B模型，DeepSeek-Coder-V2 Instruct在推理基准测试中表现出更大的优势，特别是在Arena-Hard中，它包含了大量的代码、数学和推理问题。另一方面，DeepSeek-V2 Chat在MT-bench (Zheng等人，2023)、AlpacaEval 2.0 (Dubois等人，2024)和AlignBench (Liu等人，2023c)等基准测试中表现略好。这种优势可以归因于DeepSeek-V2 Chat的通用对齐阶段。

结论
在本文中，我们介绍了DeepSeek-Coder-V2，以进一步推进代码智能领域，这是从DeepSeek-V2继续预训练，使用了来自高质量和多源语料库的6万亿令牌。通过这种持续的预训练，我们发现DeepSeek-Coder-V2显著增强了模型在编码和数学推理方面的能力，同时保持了与DeepSeek-V2相当的一般语言性能。与DeepSeek-Coder相比，DeepSeek-Coder-V2支持的编程语言数量显著增加，从86种增加到338种，并将最大上下文长度从16K扩展到128K令牌。实验结果表明，DeepSeek-Coder-V2在代码和数学特定任务上实现了与最先进的封闭源模型如GPT-4 Turbo、Claude 3 Opus和Gemini 1.5 Pro相当的性能。

尽管DeepSeek-Coder-V2在标准基准测试上取得了令人印象深刻的性能，但我们发现与当前最先进模型如GPT-4 Turbo相比，在遵循指令的能力上仍存在显著差距。这一差距导致在SWEbench等复杂场景和任务中表现不佳。因此，我们认为，代码模型不仅需要强大的编码能力，还需要出色的遵循指令的能力，以更好地处理现实世界的复杂编程场景。在未来，我们将更多地专注于提高模型的遵循指令的能力，以更好地处理现实世界的复杂编程场景，并提高开发过程的生产力。

你可能感兴趣的:(代码大模型,deepseek)

在Vue 3中，如何创建一个异步组件？ JJCTO袁龙 Vue vue.js 前端 javascript
在Vue3中，如何创建一个异步组件？在现代前端开发中，组件的重用性和异步加载是提升用户体验和优化性能的关键因素。在Vue3中，创建异步组件变得更为便利。本文将探讨如何在Vue3中使用setup语法糖来创建异步组件，并通过示例代码来深入理解这一特性。什么是异步组件？异步组件是一种在需要时才被加载的组件，而不是在应用启动时一次性加载所有组件。这种做法有助于减小初始加载的包大小，从而提升加载速度和响应性
Express + MongoDB 实现登录验证码 yqcoder express mongodb 数据库
使用svg-captcha生成SVG格式验证码，express-session存储验证码一、安装依赖npminstallsvg-captchaexpress-session二、核心代码示例constsvgCaptcha=require("svg-captcha");constsession=require("express-session");//配置会话中间件app.use(session({s
【模型调优的深入分析与Python实践】蝉叫醒了夏天机器学习 python 开发语言模型调优
模型调优的深入分析与Python实践一、模型调优的定义与目标模型调优（ModelTuning）是通过系统化调整机器学习模型的超参数和结构参数，使模型在特定数据集上达到最佳性能的过程。其核心目标是在以下两者间找到平衡：泛化能力∝1过拟合风险\text{泛化能力}\propto\frac{1}{\text{过拟合风险}}泛化能力∝过拟合风险1二、调优注意事项1.数据层面确保训练集/验证集/测试集的独立
9 万天价激活码？手把手教你免费申请 Manus 邀请码！前端后花园前端热门开源项目人工智能 Manus AI
Manus爆火，继国产大模型的DeepSeek后又一个国产之光。它是AIagent，可以帮你规划旅游行程、分析股票、做课程PPT、做数据分析报告等等。现在激活码难求，某鱼上炒到了9w了。某鱼上还有代申请Manus账号的单子，实在看不下去了，写一篇如何免费申请Manus邀请码的教程，防止大家被割韭菜。方式一：官网申请最靠谱的办法了，ManusAI官方发布公告了，创始人承诺会优先让waitlist中的
保姆级教程：阿里QwQ-32B模型本地部署与企业级应用实战（附万字指南+工具链） emmm形成中 AI科技前沿 python java ai 人工智能
保姆级教程：阿里QwQ-32B模型本地部署与企业级应用实战（附万字指南+工具链）目录QwQ-32B核心优势与技术突破本地部署全攻略：从环境配置到模型运行六大企业级应用场景深度解析实战案例：数学推理/代码生成/Agent能力测试常见问题与性能优化指南2025年技术展望与行业影响核心优势1.1模型技术突破维度QwQ-32B特性传统大模型对比参数规模320亿参数（仅需16GB显存）DeepSeek-R1
2025最新QwQ-32B模型使用教程：从部署到实战，手把手教你玩转AI推理模型（附保姆级指南） emmm形成中 AI科技前沿人工智能
2025最新QwQ-32B模型使用教程：从部署到实战，手把手教你玩转AI推理模型（附保姆级指南）目录QwQ-32B模型简介与核心优势本地部署教程：从环境配置到模型运行实战案例：数学、编程与逻辑推理能力测试高级功能：Agent能力与FunctionCall详解常见问题与解决方案资源推荐与学习路径一、QwQ-32B模型简介与核心优势1.1模型简介QwQ-32B是阿里巴巴推出的最新推理模型，仅用320亿
python读取多张图片文字为表格_python批量给图片加图文水印+读取excel weixin_39612220
在python3.7环境实现给图片添加图片水印以及文字水印。另附python读取excel单元格内容。利用本程序修改后可以实现，给商品sku图片批量添加水印的功能。excel操作仅测试了读取单元格内容的代码。#fromPILimportImagefromPILimportImage,ImageDraw,ImageFont##pipinstallpillow##importdatetimeimpor
spyder python下载_Spyder Python软件-Spyder Python下载-最火手机站黄sir好 spyder python下载
SpyderPython软件是一款使用用Python编写的强大的编程环境。应用于Python，由科学家、技术人员、数据分析家设计，由科学家、技术人员、数据分析家设计。综合开发工具的高级编辑、分析、调试、概要分析功能和科学包装的数据搜索、交互执行、深度检查和精巧的可视化功能被独特地结合在一起。SpyderPython下载就在最火软件站!SpyderPython软件功能编辑功能/类浏览器、代码解析工具
DeepSeek开源周：面向大模型训练的三个工具包花生糖@ AIGC学习资料库 DeepSeek 实用集 DualPipe EPLB Profile-data Deepseek
在2025年的开源周中，DeepSeek推出了一系列旨在优化大规模模型训练效率的工具。这些工具包括DualPipe、EPLB以及Profile-data，它们分别从不同的角度解决了万亿参数模型训练中的算力瓶颈问题，为行业带来了前所未有的加速和效率提升。DualPipe：双向流水线架构的创新DualPipe通过其首创的双向流水线架构，极大地提高了计算与通信的重叠率至92%，相比NVIDIAMegat
机器学习模型-从线性回归到神经网络 Earth explosion 机器学习线性回归神经网络
在当今的数据驱动世界中，机器学习模型是许多应用程序的核心。无论是推荐系统、图像识别，还是自动驾驶汽车，机器学习技术都在背后发挥着重要作用。在这篇文章中，我们将探索几种基础的机器学习模型，并了解它们的基本原理和应用场景。1.线性回归基本原理线性回归是最简单的机器学习模型之一。它旨在找到一个最佳拟合线来预测目标变量（通常是连续值）。线性回归假设输入变量和输出变量之间存在线性关系，其数学表达式为：[y=
运行PaddleOCR时遇到的一些问题汇总江木27 PaddleOCR python ocr 计算机视觉图像处理 paddle
官方文档提供了PaddleOCR的各类用例说明，但是使用中仍然会有一些问题，这里做一些总结和整理跑通train.py代码pythontools/train.py-cconfigs/rec/PP-OCRv3/ch_PP-OCRv3_rec_distillation.yml-oGlobal.pretrained_model=ckpt/ch_PP-OCRv3_rec_train/best_accurac
神经网络探秘：原理、架构与实战案例二川bro 智能AI 神经网络人工智能深度学习
神经网络探秘：原理、架构与实战案例前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，可以分享一下给大家。点击跳转到网站。https://www.captainbed.cn/ccc在人工智能的浪潮中，神经网络作为核心驱动力之一，正引领着技术革新与产业变革。本文旨在深入剖析神经网络的原理、常见架构，并通过一个实际的代码案例，带领读者亲手实践神经网络的构建与训练过程。无论你是机器学习初学者，还
还在蹲Manus的邀请码？别等了！开源版Manus为你快速创建AI工位，给AI一台电脑，然后你就玩去吧！蚝油菜花每日 AI 项目与应用实例开源人工智能人工智能开源
❤️如果你也关注AI的发展现状，且对AI应用开发感兴趣，我会每日分享大模型与AI领域的开源项目和应用，提供运行实例和实用教程，帮助你快速上手AI技术！AI在线答疑->智能检索历史文章和开源项目->尽在微信公众号->搜一搜：蚝油菜花就在昨天，一个叫做Manus的AIAgent平台在各大社媒和社区火速的传播开来，引发了各界火热的讨论，相信大家也看到了不少关于Manus的实测和评价了。可当大家跃跃欲试冲
邀请码炒至上万元，中国AI新星一夜爆火华尔街见闻2025-03-06 21:38北京——为什么中国的ai公司接连突然爆火？——看来大家都在闷头做大事，做任何事情要先潜龙勿用，好好积蓄力量，蓄势待发分享是一种传递，一种快乐杂学百货铺-啥都学人工智能
邀请码炒至上万元，中国AI新星一夜爆火华尔街见闻2025-03-0621:38北京——为什么中国的ai公司接连突然爆火？——看来大家都在闷头做大事，做任何事情要先潜龙勿用，好好积蓄力量，蓄势待发邀请码炒至上万元，中国AI新星一夜爆火华尔街见闻2025-03-0621:38北京作者|柴旭晨编辑|周智宇没有丝毫预热和剧透，中国AI团队深夜直接丢下核弹，掀起DeepSeek之后的又一场狂欢。3月6日凌晨
【鸿蒙开发】MongoDB入门牧歌悠悠开发数据库 mongodb 数据库
https://www.mongodb.com/try/download/community下载MongoDB:varmongoose=require("mongoose");//localhost域名，代表本机//127.0.0.1ip,代码本机mongoose.connect("mongodb://localhost:27017/jiaju").then(()=>{console.log("数
【QwQ-32B-Preview】阿里通义QwQ登场MATH测试超OpenAI o1,开源AI推理新王,为数不多可以与OpenAI o1媲美的模型之一 Yukuii_0v0 人工智能 ai AI编程自然语言处理
阿里通义千问今天（11月28日）发布《QwQ:思忖未知之界》博文，推出了QwQ-32B-Preview实验性研究模型，在数学和编程领域，尤其在需要深度推理的复杂问题上，具备卓越的AI推理能力。它是少数能与OpenAI的o1匹敌的模型之一，并且是第一个能以宽松许可证下载的模型。QwQ-32B-Preview在Apache2.0许可证下“公开”可用，这意味着它可以用于商业应用。QwQ-32B-Prev
量化交易中的模型评估指标有哪些？股票量化量化炒股股票炒股程序化交易量化炒股 miniQMT 股票交易 AKShare 程序化交易股票投资 deepseek
量化交易中的模型评估指标有哪些？在量化交易的世界里，模型评估指标就像是航海者手中的指南针，指引着我们穿越市场的波涛。这篇文章将带你深入了解量化交易中那些至关重要的模型评估指标，让你在交易的海洋中不再迷失方向。引言量化交易，这个听起来既神秘又高大上的领域，其实离我们并不遥远。简单来说，量化交易就是利用数学模型来指导交易决策的过程。而在这个过程中，模型评估指标就是衡量模型好坏的尺子。一个好的模型，不仅
DeepSeek开源第一弹！突破H800性能上限，FlashMLA重磅开源开源项目精选人工智能
FlashMLA是一个针对HopperGPU优化的高效MLA（Multi-HeadLatentAttention）解码内核，支持变长序列处理，现在已经投入生产使用。FlashMLA通过优化MLA解码和分页KV缓存，能够提高LLM（大语言模型）推理效率，尤其是在H100/H800这样的高端GPU上发挥出极致性能。说人话就是，FlashMLA是一种专门为Hopper高性能AI芯片设计的先进技术——一种
（语法笔记分析题解语法二分 “unordered_map与vector＜pair＜＞＞“ 快速数组）leetocde 1146 维齐洛波奇特利(male) 算法前端 c++
*注：代码和题解思路来源于灵茶山艾府，因为我之前未接触过vector>与map的联合使用才写的笔记链接：灵茶山艾府题解核心思路：建立unordered_map>>history;令key为下标vector存放不同快照引索的值，详看下文的输出unordered_map>>history;键：int值：vector>history[0]会访问history中键为0所对应的std::vector>。如果
MindSearch: 革新人工智能搜索引擎的未来 2401_87189860 人工智能搜索引擎
MindSearch:革新人工智能搜索引擎的未来在人工智能和大语言模型快速发展的今天,搜索引擎领域正迎来新的变革。由上海人工智能实验室开发的MindSearch项目,正是这场变革中的佼佼者。MindSearch是一个开源的AI搜索引擎框架,它通过模仿人类思维过程,为用户提供深度的AI搜索能力。本文将深入探讨MindSearch的特点、工作原理以及它对未来搜索技术的影响。MindSearch的核心特
如何提升OmniParser V2的小元素识别率——YOLOv8 增加 P2 层的性能变化解析 AI-AIGC-7744423 目标跟踪人工智能计算机视觉
YOLOv8增加P2层通过牺牲部分计算效率换取了小目标检测性能的显著提升，尤其适用于高分辨率、小目标密集的场景。开发者需根据具体任务需求，在精度与速度之间进行合理权衡，并通过模型轻量化技术优化部署效果。更多技术细节可参考微软等机构的开源实现136。YOLOv8增加P2层的性能变化解析一、性能提升方向小目标检测精度显著提高原理：P2层对应更高分辨率的浅层特征图（如1/4下采样），能捕捉更细粒度的纹理
Python 冒泡排序 2301_80891383 python python 开发语言算法
defbubble_sort(lst):n=len(lst)#遍历所有列表元素foriinrange(n):#每次遍历后，最后的i个元素已经排好序，因此不需要再检查forjinrange(0,n-i-1):#如果当前元素比下一个大，交换它们iflst[j]>lst[j+1]:lst[j],lst[j+1]=lst[j+1],lst[j]returnlst#接收输入并转换为列表data_list=l
OmniParser技术分析（一） _深海凉_ 深度学习自动化目标检测 ui
1.引言通过上篇文章介绍OmniParser:下一代纯视觉UI自动化测试先驱相信大家已经对OmniParser有初步了解，接下来详细介绍下OmniParser使用了哪些技术模型实现了对UI纯视觉的检测和理解。2.整体方案通过阅读OmniParser提供的运行Demo代码知道，其实整个UI纯视觉检测主要分为2部分，涉及3个环节分别是：图片OCR、图片icon检测、图片元素理解，分别使用的模型为：环节
Scira：极简AI驱动搜索引擎开源项目精选人工智能
Scira（原名MiniPerplx）是一款极简的AI驱动搜索引擎，可帮助您在互联网上查找信息。它由VercelAISDK提供支持，并可使用Grok2.0等模型进行搜索。Stars数7,186Forks数845主要特点AI驱动的智能搜索：借助Anthropic的模型，快速获取问题的答案，让搜索变得更加智能化。网页搜索：使用Tavily的API来进行高效的网页搜索，无需额外的插件即可快速得到网页内容
为什么要使用JUnit 开发规范潜意识Java Java知识 junit log4j 数据库
目录命名规范：让代码一目了然测试类命名测试方法命名测试方法结构规范：遵循AAA原则Arrange（准备）Act（执行）Assert（断言）一个测试方法只做一件事断言使用规范：精准验证结果选择合适的断言方法提供有意义的错误信息测试数据管理规范：让测试更可靠使用测试数据生成器避免硬编码测试数据异常处理规范：应对意外情况测试异常抛出异常处理要合理总结嘿，小伙伴们！在咱们Java开发的世界里，JUnit就
信奥赛CSP-J复赛集训（模拟算法专题）（11）：P1420 最长连号王老师青少年编程算法 csp 信奥赛 c++数据结构模拟算法 gesp
信奥赛CSP-J复赛集训（模拟算法专题）（11）：P1420最长连号题目描述输入长度为nnn的一个正整数序列，要求输出序列中最长连号的长度。连号指在序列中，从小到大的连续自然数。输入格式第一行，一个整数nnn。第二行，nnn个整数aia_iai，之间用空格隔开。输出格式一个数，最长连号的个数。输入输出样例#1输入#1101562345689输出#15说明/提示数据规模与约定对于100%100\%1
vue2 - 实现elementUI表格组件table动态添加或删除行功能，表格列表动态新增/插入/删除表格行，可编辑单元格/点击修改表格内数据并更新数据列表（支持接口懒加载、表格分页、复杂嵌套表格）街尾杂货店& 前端组件与功能(开箱即用)elementui vue Table动态表格 table动态新增删除编辑动态增加一行并能编辑内容数据行内编辑功能并且校验是否为空懒加载数据表格分页怎么办
效果图在vue2+elementui开发中，详细实现el-table实现表格动态增加/删除/编辑表格行/编辑单元格数据等，并且带必填或其他校验规则(如果为空则提示)，vue2elementUI表格动态操作插入新行或点击编辑数据，统一保存或删除行后更新表格列表数据，一旦表格列表发生改变后，确保表格分页情况下或表格children父子级嵌套行表格正确更新数据，提供示例源码！提供详细示例代码，新手小白复
必看！C# 与 HALCON 构建基于轮廓模板匹配实战宝典 AI_DL_CODE 机器视觉 c#人工智能机器视觉 HALCON 模板匹配特征点匹配
摘要：本文专注于利用C#与HALCON实现基于轮廓的模板匹配技术。从环境搭建，即HALCON安装、C#项目创建及库引用配置，到核心步骤如初始化HALCON环境、读取图像、提取轮廓、创建模板、执行匹配及显示结果等，结合详尽代码示例进行阐述。还深入探讨在实际应用中的优化策略，包括图像预处理、参数精细调整、多模板匹配及实时匹配实现等。旨在助力读者全方位掌握技术，为机器视觉相关项目开发提供有力支撑，高效解
linux ftp服务源代码,linux下最简单的ftpget ftpput 源代码轮回道人 linux ftp服务源代码
/*FtpGetRun*/#include#include#include#include#include#include#include#include#include/*FtpGetRunVariable*/FILE*pFtpIOFile=NULL;FILE*pFileCmdChmod;//使用popen方式修改文件属性为可执行的文件指针FILE*pRunGetFile;//使用popen方式
WBC已形成“东亚-美洲双中心”格局·棒球1号位棒球1号位人工智能学习
世界棒球经典赛（WBC）作为全球最高水平的国家队棒球赛事，参赛队伍按实力、地域和历史表现可分为多个“阵营”。以下是基于历届赛事（截至2023年）的阵营划分及代表性队伍分析：第一阵营：传统豪强（争冠级别）代表队伍：日本（3次冠军：2006、2009、2023）特点：细腻战术+顶级投手群，大谷翔平、达比修有等MLB巨星压阵。优势：青训体系完善，国内职棒（NPB）水平仅次于MLB。美国（1次冠军：201
怎么样才能成为专业的程序员？ cocos2d-x小菜编程 PHP
如何要想成为一名专业的程序员？仅仅会写代码是不够的。从团队合作去解决问题到版本控制，你还得具备其他关键技能的工具包。当我们询问相关的专业开发人员，那些必备的关键技能都是什么的时候，下面是我们了解到的情况。关于如何学习代码，各种声音很多，然后很多人就被误导为成为专业开发人员懂得一门编程语言就够了？！呵呵，就像其他工作一样，光会一个技能那是远远不够的。如果你想要成为
java web开发高并发处理 BreakingBad java Web 并发开发处理高
java处理高并发高负载类网站中数据库的设计方法（java教程,java处理大量数据，java高负载数据）一：高并发高负载类网站关注点之数据库没错,首先是数据库,这是大多数应用所面临的首个SPOF。尤其是Web2.0的应用，数据库的响应是首先要解决的。一般来说MySQL是最常用的，可能最初是一个mysql主机，当数据增加到100万以上，那么，MySQL的效能急剧下降。常用的优化措施是M-S（
mysql批量更新 ekian mysql
mysql更新优化：一版的更新的话都是采用update set的方式，但是如果需要批量更新的话，只能for循环的执行更新。或者采用executeBatch的方式，执行更新。无论哪种方式，性能都不见得多好。三千多条的更新，需要3分多钟。查询了批量更新的优化，有说replace into的方式，即： replace into tableName(id,status) values
微软BI（3） 18289753290 微软BI SSIS
1) Q：该列违反了完整性约束错误；已获得 OLE DB 记录。源:“Microsoft SQL Server Native Client 11.0” Hresult: 0x80004005 说明:“不能将值 NULL 插入列 'FZCHID'，表 'JRB_EnterpriseCredit.dbo.QYFZCH'；列不允许有 Null 值。INSERT 失败。”。 A：一般这类问题的存在是
Java中的List g21121 java
List是一个有序的 collection（也称为序列）。此接口的用户可以对列表中每个元素的插入位置进行精确地控制。用户可以根据元素的整数索引（在列表中的位置）访问元素，并搜索列表中的元素。与 set 不同，列表通常允许重复
读书笔记永夜-极光读书笔记
1. K是一家加工厂,需要采购原材料,有A,B,C,D 4家供应商,其中A给出的价格最低,性价比最高,那么假如你是这家企业的采购经理,你会如何决策? 传统决策: A:100%订单 B,C,D:0% &nbs
centos 安装 Codeblocks 随便小屋 codeblocks
1.安装gcc,需要c和c++两部分,默认安装下,CentOS不安装编译器的,在终端输入以下命令即可yum install gccyum install gcc-c++ 2.安装gtk2-devel,因为默认已经安装了正式产品需要的支持库,但是没有安装开发所需要的文档.yum install gtk2* 3. 安装wxGTK yum search w
23种设计模式的形象比喻 aijuans 设计模式
1、ABSTRACT FACTORY—追MM少不了请吃饭了，麦当劳的鸡翅和肯德基的鸡翅都是MM爱吃的东西，虽然口味有所不同，但不管你带MM去麦当劳或肯德基，只管向服务员说“来四个鸡翅”就行了。麦当劳和肯德基就是生产鸡翅的Factory 　　工厂模式：客户类和工厂类分开。消费者任何时候需要某种产品，只需向工厂请求即可。消费者无须修改就可以接纳新产品。缺点是当产品修改时，工厂类也要做相应的修改。如：
开发管理 CheckLists aoyouzi 开发管理 CheckLists
开发管理 CheckLists(23) -使项目组度过完整的生命周期开发管理 CheckLists(22) -组织项目资源开发管理 CheckLists(21) -控制项目的范围开发管理 CheckLists(20) -项目利益相关者责任开发管理 CheckLists(19) -选择合适的团队成员开发管理 CheckLists(18) -敏捷开发 Scrum Master 工作开发管理 C
js实现切换百合不是茶 JavaScript 栏目切换
js主要功能之一就是实现页面的特效,窗体的切换可以减少页面的大小,被门户网站大量应用思路: 1,先将要显示的设置为display:bisible 否则设为none 2,设置栏目的id ,js获取栏目的id,如果id为Null就设置为显示 3,判断js获取的id名字;再设置是否显示代码实现: html代码: <di
周鸿祎在360新员工入职培训上的讲话 bijian1013 感悟项目管理人生职场
这篇文章也是最近偶尔看到的，考虑到原博客发布者可能将其删除等原因，也更方便个人查找，特将原文拷贝再发布的。“学东西是为自己的，不要整天以混的姿态来跟公司博弈，就算是混，我觉得你要是能在混的时间里，收获一些别的有利于人生发展的东西，也是不错的，看你怎么把握了”，看了之后，对这句话记忆犹新。 &
前端Web开发的页面效果 Bill_chen html Web Microsoft
1.IE6下png图片的透明显示： <img src="图片地址" border="0" style="Filter.Alpha(Opacity)=数值(100),style=数值(3)"/> 或在<head></head>间加一段JS代码让透明png图片正常显示。 2.<li>标
【JVM五】老年代垃圾回收：并发标记清理GC(CMS GC) bit1129 垃圾回收
CMS概述并发标记清理垃圾回收(Concurrent Mark and Sweep GC）算法的主要目标是在GC过程中，减少暂停用户线程的次数以及在不得不暂停用户线程的请夸功能，尽可能短的暂停用户线程的时间。这对于交互式应用，比如web应用来说，是非常重要的。 CMS垃圾回收针对新生代和老年代采用不同的策略。相比同吞吐量垃圾回收，它要复杂的多。吞吐量垃圾回收在执
Struts2技术总结白糖_ struts2
必备jar文件早在struts2.0.*的时候，struts2的必备jar包需要如下几个： commons-logging-*.jar Apache旗下commons项目的log日志包 freemarker-*.jar
Jquery easyui layout应用注意事项 bozch jquery 浏览器 easyui layout
在jquery easyui中提供了easyui-layout布局，他的布局比较局限，类似java中GUI的border布局。下面对其使用注意事项作简要介绍：如果在现有的工程中前台界面均应用了jquery easyui，那么在布局的时候最好应用jquery eaysui的layout布局，否则在表单页面（编辑、查看、添加等等）在不同的浏览器会出
java-拷贝特殊链表：有一个特殊的链表，其中每个节点不但有指向下一个节点的指针pNext，还有一个指向链表中任意节点的指针pRand，如何拷贝这个特殊链表？ bylijinnan java
public class CopySpecialLinkedList { /** * 题目：有一个特殊的链表，其中每个节点不但有指向下一个节点的指针pNext，还有一个指向链表中任意节点的指针pRand，如何拷贝这个特殊链表？拷贝pNext指针非常容易，所以题目的难点是如何拷贝pRand指针。假设原来链表为A1 -> A2 ->... -> An，新拷贝
color Chen.H JavaScript html css
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <HTML> <HEAD>&nbs
[信息与战争]移动通讯与网络 comsci 网络
两个坚持:手机的电池必须可以取下来光纤不能够入户,只能够到楼宇建议大家找这本书看看:<&
oracle flashback query(闪回查询) daizj oracle flashback query flashback table
在Oracle 10g中，Flash back家族分为以下成员： Flashback Database Flashback Drop Flashback Table Flashback Query(分Flashback Query,Flashback Version Query，Flashback Transaction Query) 下面介绍一下Flashback Drop 和Flas
zeus持久层DAO单元测试 deng520159 单元测试
zeus代码测试正紧张进行中,但由于工作比较忙,但速度比较慢.现在已经完成读写分离单元测试了,现在把几种情况单元测试的例子发出来,希望有人能进出意见,让它走下去. 本文是zeus的dao单元测试: 1.单元测试直接上代码 package com.dengliang.zeus.webdemo.test; import org.junit.Test; import o
C语言学习三printf函数和scanf函数学习 dcj3sjt126com c printf scanf language
printf函数 /* 2013年3月10日20:42:32 地点：北京潘家园功能：目的：测试%x %X %#x %#X的用法 */ # include <stdio.h> int main(void) { printf("哈哈！\n"); // \n表示换行 int i = 10; printf
那你为什么小时候不好好读书? dcj3sjt126com life
dady, 我今天捡到了十块钱, 不过我还给那个人了 good girl! 那个人有没有和你讲thank you啊没有啦....他拉我的耳朵我才把钱还给他的, 他哪里会和我讲thank you 爸爸, 如果地上有一张5块一张10块你拿哪一张呢.... 当然是拿十块的咯... 爸爸你很笨的, 你不会两张都拿爸爸为什么上个月那个人来跟你讨钱, 你告诉他没
iptables开放端口 Fanyucai linux iptables 端口
1，找到配置文件 vi /etc/sysconfig/iptables 2，添加端口开放，增加一行，开放18081端口 -A INPUT -m state --state NEW -m tcp -p tcp --dport 18081 -j ACCEPT 3，保存 ESC :wq! 4，重启服务 service iptables
Ehcache（05）——缓存的查询 234390216 排序 ehcache 统计 query
缓存的查询目录 1. 使Cache可查询 1.1 基于Xml配置 1.2 基于代码的配置 2 指定可搜索的属性 2.1 可查询属性类型 2.2 &
通过hashset找到数组中重复的元素 jackyrong hashset
如何在hashset中快速找到重复的元素呢?方法很多，下面是其中一个办法： int[] array = {1,1,2,3,4,5,6,7,8,8}; Set<Integer> set = new HashSet<Integer>(); for(int i = 0
使用ajax和window.history.pushState无刷新改变页面内容和地址栏URL lanrikey history
后退时关闭当前页面 <script type="text/javascript"> jQuery(document).ready(function ($) { if (window.history && window.history.pushState) {
应用程序的通信成本 netkiller.github.com 虚拟机应用服务器陈景峰 netkiller neo
应用程序的通信成本什么是通信一个程序中两个以上功能相互传递信号或数据叫做通信。什么是成本这是是指时间成本与空间成本。时间就是传递数据所花费的时间。空间是指传递过程耗费容量大小。都有哪些通信方式全局变量线程间通信共享内存共享文件管道 Socket 硬件（串口，USB）等等全局变量全局变量是成本最低通信方法，通过设置
一维数组与二维数组的声明与定义恋洁e生二维数组一维数组定义声明初始化
/** * */ package test20111005; /** * @author FlyingFire * @date:2011-11-18 上午04:33:36 * @author ：代码整理 * @introduce :一维数组与二维数组的初始化 *summary： */ public c
Spring Mybatis独立事务配置 toknowme mybatis
在项目中有很多地方会使用到独立事务，下面以获取主键为例（1）修改配置文件spring-mybatis.xml  <tx:annotation-driven transaction-manager="transactionManager" /> &n
更新Anadroid SDK Tooks之后，Eclipse提示No update were found xp9802 eclipse
使用Android SDK Manager 更新了Anadroid SDK Tooks 之后，打开eclipse提示 This Android SDK requires Android Developer Toolkit version 23.0.0 or above, 点击Check for Updates 检测一会后提示 No update were found