山顶夕景

【LLM模型篇】LLaMA2 | Vicuna | EcomGPT等（更新中）

文章目录

一、Base model
chatglm2模型
Vicuna模型
LLaMA2模型
- 1. 训练细节
- 2. Evaluation Results
- 3. 更多参考
alpaca模型
其他大模型和peft高效参数微调
二、垂直领域大模型
MedicalGPT：医疗大模型
ChatLaw：法律大模型
TransGPT：交通大模型
EcomGPT：电商领域大模型
- 1. sft数据
- 2. 模型微调
- 3. 评测数据集和评测结果
llama变体
三、微调场景
- 1. fine-tune的目的和场景
- 2. LLM微调的相关参数
Reference

一、Base model

chatglm2模型

ChatGLM2-6B 训练参数解释
ChatGLM-6B 的部署与微调以及过程中涉及知识总结(7.26更新)
ChatGLM P-Tuning v2 避坑指南

小样本（100条）微调，建议 num_train_epochs（最大迭代轮数） =20 才能稳定拟合任务要求
百度文心千帆推荐：100条数据时, Epoch为15，1000条数据时, Epoch为10，10000条数据时, Epoch为2。

Vicuna模型

Vicuna开源代码地址：https://github.com/lm-sys/FastChat

Vicuna在线demo地址：https://chat.lmsys.org/

LLaMA2模型

LLaMA2的开源地址：https://github.com/facebookresearch/llama/blob/main/MODEL_CARD.md
LLaMA2的下载地址：https://ai.meta.com/resources/models-and-libraries/llama-downloads/
LLaMA2的官方博客地址：https://ai.meta.com/resources/models-and-libraries/llama/

Llama-2-Chat：三个版本，7B，13B，70B
- input：text only
- ouput：text only
- 同样是基于transformer架构的自回归模型，使用SFT（supervised fine-tuning）和RLHF（human feedback）
70B版本推理：Grouped-Query Attention (GQA) 来优化
训练数据：截止到2022年9月的数据，一些微调数据是2023年7月前的

1. 训练细节

transformer architecture (Vaswani et al., 2017),
使用RMSNorm(Root Mean Square Layer Normalization)方法对transformer每层的输入进行归约(norm)操作，代替了transformer之前对输出进行归约(norm)：apply pre-normalization using RMSNorm (Zhang and Sennrich, 2019),
SwiGLU激活函数：use the SwiGLU activation function (Shazeer, 2020),
旋转位置编码：rotary positional embeddings(RoPE, Su et al. 2022).
上下文长度和分组查询注意力(GQA)：The primary architectural differences from Llama 1 include increased context length and grouped-query attention (GQA).

训练65B参数的模型，使用了2048块80G显存大小的A100卡，处理对应380 tokens/sec/GPU，1.4T个token训练了有21天。训练loss如下：

参数设置：

使用AdamW优化器，对应超参beta1=0.9, beta2=0.95; 使用cosine学习率调度，最终学习率是最大学习率的10%；weight decay为0.1， gradient clipping为0.1。
训练使用前2000个step进行warmup

2. Evaluation Results

Llama 1 and Llama 2评测结果：

Model	Size	Code	Commonsense Reasoning	World Knowledge	Reading Comprehension	Math	MMLU	BBH	AGI Eval
Llama 1	7B	14.1	60.8	46.2	58.5	6.95	35.1	30.3	23.9
Llama 1	13B	18.9	66.1	52.6	62.3	10.9	46.9	37.0	33.9
Llama 1	33B	26.0	70.0	58.4	67.6	21.4	57.8	39.8	41.7
Llama 1	65B	30.7	70.7	60.5	68.6	30.8	63.4	43.5	47.6
Llama 2	7B	16.8	63.9	48.9	61.3	14.6	45.3	32.6	29.3
Llama 2	13B	24.5	66.9	55.4	65.8	28.7	54.8	39.4	39.1
Llama 2	70B	37.5	71.9	63.6	69.4	35.2	68.9	51.2	54.2

3. 更多参考

[1] Llama 2 官方公告：https://ai.meta.com/llama/

[2] Llama 2 官方论文：https://huggingface.co/papers/2307.09288

[3] “GQA: Training Generalized Multi-Query Transformer Models from Multi-Head Checkpoints” by Google Research：https://arxiv.org/pdf/2305.13245.pdf

[4] “Llama 2: an incredible open LLM” by Nathan Lambert: https://www.interconnects.ai/p/llama-2-from-meta

[5] Llama 2 models: https://huggingface.co/meta-llama

[6] Text generation web UI github: https://github.com/oobabooga/text-generation-webu

alpaca模型

standford-alpaca微调记录

注意：从0写个gpt简易版可以参考——极简PicoGPT
https://github.com/jaymody/picoGPT/tree/29e78cc52b58ed2c1c483ffea2eb46ff6bdec785
介绍：60行代码就能构建GPT！网友：比之前的教程都要清晰｜附代码

其他大模型和peft高效参数微调

参考之前的：【LLM大模型】指令微调、peft高效参数微调

二、垂直领域大模型

MedicalGPT：医疗大模型

MedicalGPT项目：https://github.com/shibing624/MedicalGPT/tree/main

基于ChatGPT Training Pipeline，本项目实现了领域模型–医疗模型的四阶段训练：

第一阶段：PT(Continue PreTraining)增量预训练，在海量领域文档数据上二次预训练GPT模型，以注入领域知识
第二阶段：SFT(Supervised Fine-tuning)有监督微调，构造指令微调数据集，在预训练模型基础上做指令精调，以对齐指令意图
第三阶段：RM(Reward Model)奖励模型建模，构造人类偏好排序数据集，训练奖励模型，用来对齐人类偏好，主要是"HHH"原则，具体是"helpful, honest, harmless"
第四阶段：RL(Reinforcement Learning)基于人类反馈的强化学习(RLHF)，用奖励模型来训练SFT模型，生成模型使用奖励或惩罚来更新其策略，以便生成更高质量、更符合人类偏好的文本

ChatLaw：法律大模型

项目：https://github.com/PKU-YuanGroup/ChatLaw

将query提取为keyword，然后将keyword和query分别embedding后，两者拼接的结果去向量数据库中求topk找上下文。
base model：姜子牙-13B、Anima-33B，使用大量领域文本构建对话数据、也使用大量考题作为sft数据。

TransGPT：交通大模型

https://github.com/DUOMO/TransGPT

pt训练代码：采用了MedicalGPT提供的pretraining.py代码。
sft训练代码：采用了MedicalGPT提供的supervised_finetuning.py代码。

EcomGPT：电商领域大模型

解决问题：解决电商场景任务（如品牌识别，评价解析，广告文案生成等）
论文链接：https://arxiv.org/abs/2308.06966
GitHub链接：https://github.com/Alibaba-NLP/EcomGPT

1. sft数据

从学术论文或竞赛平台等开放数据源收集了共65个各种电商任务数据集，包括命名实体识别、评论问答、商品类目预测、多轮对话等传统的自然语言处理任务。这些开源数据集的任务都是由领域专家设计，然后由受过培训的人工标注，数据质量很高。
电商领域的商品item虽然变化很快，但是电商数据类型相对稳定，包括产品信息、用户对话、用户评论和搜索查询等，所以EcomGPT对基础数据构建大量原子任务（如实体片段识别、实体分类等），即任务链任务（Chain of tasks）。原子任务的标注答案尽可能从公开任务原始的标注构造，以保证准确性。实在无法构造的，借助ChatGPT帮助生成。

2. 模型微调

多任务的指令微调
将特定数据集的任务指令与数据样本结合起来，构造了大规模的指令调优数据，然后基于这个指令数据集采用标准的因果语言模型（Causal Language Model）的训练范式训练。指令包含三个部分：任务描述、任务指令、输入句子。任务描述给出任务名称，任务指令描述具体的任务需求，输入句子则是具体需要分析的句子。

3. 评测数据集和评测结果

在12个训练时没见过的数据集中进行测试，使用Rouge指标，对于分类、实体识别等任务也使用F1指标。

分析：微调后的模型能够理解电商任务

从下图中看到，数据越多样化（每个任务的训练数据越多），模型效果越好（ROUGE-L指标越高）。

llama变体

中文BiLLa: A Bilingual LLaMA with Enhanced Reasoning Ability，参考

第一阶段：扩充中文词表，使用中文预训练语料Wudao、英文预训练语料PILE、翻译语料WMT的中英数据进行二次预训练。
第二阶段：训练数据在第一阶段基础上增加任务型数据，训练过程中两部分数据保持1:1的比例混合。任务型数据均为NLP各任务的主流开源数据，包含有数学解题、阅读理解、开放域问答、摘要、代码生成等，利用ChatGPT API为数据标签生成解析，用于训练提升模型对任务求解逻辑的理解。
第三阶段：保留第二阶段任务型数据，并转化为对话格式，增加其他指令数据（如Dolly 2.0、Alpaca GPT4、COIG等），进行对齐阶段的微调。

三、微调场景

1. fine-tune的目的和场景

垂直领域（如英文类微调到中文）：可以用无监督的继续预训练，构造带标注的指令微调数据（多场景、不同任务的数据，指令的描述形式也应该多样化，同时为了防止知识遗忘，需要引入通用领域预料）
- BloomBerg尽量让通用语料与金融语料达到1:1的混合比例
- 度小满将数据按照是否通用、是否带标注的指令数据等特性切分成块，包括通用无监督语料、金融无监督语料、通用标注指令语料、金融标注指令语料。然后将这些语料块打散随机组成训练的batch。
下游任务场景：
- faq对话类任务：知识库的具体内容问答，在6b、7b模型很难微调，如果模型较小，更适合结合langchain、autogpt等方式，将本地知识库的访问工具化，让模型不直接回答，而是做用户意图理解、知识检索与整合等
- 文本分类、抽取、摘要等传统nlp任务：一般来说不需要太多数据，甚至不需要微调，直接在prompt加入一些样例，用few-shot激发大模型的in-context learning能力。但由于大模型的输入context长度通常有限制，而样例涉及的上下文通常也比较长，所以很多时候还是要做微调（微调方法借鉴第二大点）

2. LLM微调的相关参数

以firefly模型全参微调为例：
进行全量参数微调：

deepspeed --num_gpus={num_gpus} train.py --train_args_file train_args/sft.json

train_args/sft.json中的主要参数说明如下，以下参数可以根据需求进行修改，其他参数建议不做修改：

output_dir：训练输出目录，存储checkpoint、tokenizer、tensorboard等
model_name_or_path：预训练模型的本地目录，或者在huggingface上的模型名称。
train_file：训练数据集路径。可以使用data/dummy_data.jsonl进行debug。
num_train_epochs：训练的轮次。如果数据量足够大，一般建议只训一个epoch。
per_device_train_batch_size：每张显卡的batch size。
gradient_accumulation_steps：梯度累计步数。global batch=num_gpus * per_device_train_batch_size * gradient_accumulation_steps。
gradient_checkpointing：如果显存捉襟见肘，可以开启。以时间换空间，模型不缓存激活状态，会进行两次forward计算，以节省显存。
learning_rate：学习率。全量参数微调的时候，建议小一些，1e-5或5e-6。
max_seq_length：训练时的最大长度。按照自己的设备进行设置，越长需要占用越多显存。
logging_steps：每隔多少步统计一次train loss。
save_steps：每隔多少步保存一个模型。
save_total_limit：output_dir目录中最多保存多少个checkpoint，超出则会将最旧的删除。
lr_scheduler_type：学习率变化策略。
warmup_steps：warm up步数。学习率经过多少步，增长到指定的数值。
optim：优化器。如果是全量参数微调，建议使用adamw_hf。
seed：随机种子，用于复现实验结果。
fp16：使用使用fp16混合精度。V100建议开启。
bf16：使用使用fp16混合精度。A100建议开启。

Reference

[1] 论文：Instruction Tuning for Large Language Models: A Survey
[2] 地址：https://arxiv.org/pdf/2308.10792.pdf
[3] 论文链接：https://arxiv.org/abs/2308.06966
[4] GitHub链接：https://github.com/Alibaba-NLP/EcomGPT
[5] Llama 2：最强开源大模型简单体验及原理分析
[6] 人大综述：https://github.com/RUCAIBox/LLMSurvey

django parler 使用教程
1.什么是DjangoParler？DjangoParler是一个强大的Django插件，用于实现多语言模型字段。它允许你在Django模型中定义可翻译的字段，使得每个语言版本的数据能够独立存储和管理。2.安装与配置首先，使用pip安装DjangoParler：pipinstalldjango-parler然后，在你的Django项目的settings.py中添加parler到INSTALLED_
SFT：大型语言模型专业化定制的核心技术体系——原理、创新与应用全景大千AI助手人工智能 Python #OTHER 语言模型人工智能自然语言处理深度学习机器学习微调 SFT
本文由「大千AI助手」原创发布，专注用真话讲AI，回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我，一起撕掉过度包装，学习真实的AI技术！以下基于权威期刊、会议论文及技术报告，对监督微调（SupervisedFine-Tuning,SFT）的技术框架、创新方法与实际应用进行系统梳理：一、核心定义与技术原理基本概念SFT是在预训练语言模型（如GPT、BERT）基础上，利用标注数据集对模型进
小报纸大乐趣——海南幼儿园小3班游戏活动 jkklmyt
新《纲要》中指出:幼儿是教育活动的积极参与者，而非被动者，活动内容必须与幼儿兴趣、需要及接受能力相吻合，最近，我发现我们班孩子喜欢玩纸，有时一张小小的纸，几个孩子围在一起玩，擦嘴巴的餐巾纸都舍不得扔，上课的时候拿在手上玩。报纸是日常生活中随手可见的物品，所以我觉得这是一个贴近幼儿生活的选材，是一个符合小班幼儿年龄的选材，是一个能让幼儿喜欢的选材。今天我们海南园小三班开展了“小报纸，大乐趣”室内游戏
一般莆田鞋在哪个app买？三大app莆田鞋平台推荐给大家美鞋之家
一般莆田鞋在哪个app买？三大app莆田鞋平台推荐给大家莆田鞋在什么app平台上买，莆田鞋在淘宝app，微商app，得物app都可以购买到，为什么在这些渠道购买莆田鞋呢？微商价格也比较实惠，档口价格有优势，实体店可以试穿，至于淘宝和微商差不多，价格优势已经透底了。微信:a40273(下单赠送精美礼品)莆田鞋在哪个app买1、微商app可以说是买莆田鞋人数最多的渠道。2、淘宝app。买莆田鞋当然少不
Servlet概述出门撞大运 servlet
在JavaWeb开发中，Servlet是核心组件之一，负责处理客户端请求并生成响应。本文将从Servlet的基本概念出发，逐步深入其生命周期、实现方式、路径映射等关键知识点，帮助你全面掌握Servlet技术。一、Servlet概述与JavaWeb三大组件Servlet（ServerLet）是运行在Web服务器中的小型Java程序，主要作用是处理用户请求。当客户端发出请求后，由Web服务器（如Tom
2021-01-02 困境怕什么往前走才是出路 YiYiDuo
早上看《阿里铁军》。成长的初期，即便现在大如阿里巴巴，也面对了很多的困境。1因为当时还是一个不太知名的公司，招不到本科生，选择销售的标准是手脚健全能说话的就行。经历3个月的培训，培训价值观念和一些销售技巧，这是很多企业没有的。经过这种密集的培训和学习，人与人之间的联结会更深刻。2早起因为想做国际化的大公司，在美国、香港和各地开办公室，给员工开十几万美元的薪水，当时的普通员工才两三千一个月，烧了几个
杨幂离婚，生涯规划师你怎么看？紫柠檬Nancy
这两天朋友圈被杨幂,刘恺威的离婚事件刷屏。作为一名生涯规划咨询师，我其实一眼就能够看透离婚背后的真相：01人职匹配模型不过在揭露真相之前,我还需要先给大家安利一个生涯规划里面的基础模型,叫做CD模型，也叫人职匹配模型。这个模型可以作为一个很好的思维框架，来帮助我们梳理清楚在这个多变的大环境下:我们的职业,婚姻，生活，交友......甚至方方面面的困惑，以期更好地掌控自己未来的幸福生活。大家先来看看
【DeepSeek实战】10、模型上下文协议（MCP）全解析：从核心架构到实战应用，揭秘AI协作的“凤雏”之力无心水人工智能架构 DeepSeek实战模型上下文协议MCP CSDN技术干货 DeepSeek AI大模型
在人工智能技术飞速发展的今天，大型语言模型（LLM）的能力不断突破，但跨模型协作、上下文一致性维护等问题却成为制约AI系统向更智能、更协同方向发展的瓶颈。模型上下文协议（ModelContextProtocol，MCP）作为专为大模型设计的标准化通信框架，如同“凤雏”之于“卧龙”，为解决这些核心问题提供了关键方案。本文将全面解析MCP的核心概念、架构设计、实操代码、应用案例及未来趋势，通过5000
【自然语言处理】文本规范化 2401_84149564 自然语言处理自然语言处理人工智能文本规范化 python 分词词的规范化分句
目录一、引言二、分词三、词规范化四、分句五、文本规范化的Python代码实战六、总结一、引言在自然语言处理的许多任务中，第一步都离不开文本规范化。文本规范化的作用是将使用字符串表示的文本转化为更易于计算机处理的规范形式。文本规范化一般包括3个步骤：分词、词的规范化、分句。本文将分别介绍这3个步骤及Python代码实战。二、分词词是语言的基本单元，人类学习语言的过程也是从理解词开始的。显而易见，自然
侄儿家添了个女娃我坚持写简书
昨天晚上吃了两个咳核敏，今儿是被大侄儿的电话喊醒了。侄儿说：“姑，屈琳已经进产房了”我赶紧起床，吃好饭，先生把我送到医院门口。我来到产房，二嫂，侄媳的嫂，大侄，二侄，侄女婿都在那里等着呢。二嫂说生了个女娃，六斤六两，母女平安。要在产房里观察两小时。大侄家已经有个女娃，现在一对千金，真是幸福啊。现在计生政策好，可以生两娃。可惜我们没赶上，只有儿子结婚给我们生两个孙子孙女了。看着二嫂一宿没睡，一直忙前
交换机配置VLAN及Access接口蒋慧慧网络交换机VLAN
交换机VLAN配置VLAN原理VLAN配置实验内容实验拓扑实验步骤VLAN原理VLAN（VirtualLocalAreaNetwork，虚拟局域网），VLAN是一种比较新的技术，工作在OSI参考模型的第2层和第3层，一个VLAN就是一个广播域，VLAN之间的通信是通过第3层的路由器来完成的。与传统的局域网技术相比较，VLAN技术更加灵活，它具有以下优点：网络设备的移动、添加和修改的管理开销减少；可
abaqus质量缩放系数取值_ABAQUS-延性损伤模型模拟金属材料断裂微尘-黄含驰 abaqus质量缩放系数取值
延性损伤模型可以模拟金属材料的拉伸破坏过程。该模型通常结合塑性模型进行分析，常见的延性破环过程如下图所示：如果不设置延性损伤，材料在塑性阶段强度逐渐增加，刚度保持不变；考虑延性损伤模型后，假设材料的强度受到损伤作用的影响，逐渐下降，同时刚度也随着损伤参数D的增加而减小。在使用ABAQUS模拟材料的延性损伤模型时，通常需要输入材料强度下降段的范围，即displacementatfailure。该参数
mvc ljh_10e3
Mvc的核心思想将业务逻辑和显示相分离。MVC全名是ModelViewController，是模型(model)－视图(view)－控制器(controller)的缩写，一种软件设计典范，用一种业务逻辑、数据、界面显示分离的方法组织代码，将业务逻辑聚集到一个部件里面，在改进和个性化定制界面及用户交互的同时，不需要重新编写业务逻辑。MVC被独特的发展起来用于映射传统的输入、处理和输出功能在一个逻辑的
AI摄像头动捕：零束缚的运动教练，如何精准量化你的动作？广州虚拟动力-动捕&虚拟主播无标记点面捕 AI摄像头动捕运动捕捉
在竞技体育和日常训练中，动作的精准度直接决定了运动表现与损伤风险。传统运动分析依赖教练肉眼观察或二维录像，难以捕捉三维空间中的关节角度、发力轨迹等关键细节。动作捕捉技术通过数字化人体运动，将每个转身、跨步、挥臂转化为精确数据，让训练从“经验指导”迈向“科学量化”，为优化技术动作提供客观依据。而AI无穿戴动捕技术，正以三大优势革新运动分析：1.零干扰采集：无需穿戴传感器或粘贴标记点，运动员在自然状态
【DW11月-深度学习】Task03前馈神经网络沫2021
参考链接：https://datawhalechina.github.io/unusual-deep-learning/#/4.%E5%89%8D%E9%A6%88%E7%A5%9E%E7%BB%8F%E7%BD%91%E7%BB%9C一、神经元模型2.1神经元1943年，美国神经生理学家沃伦·麦卡洛克(WarrenMcCulloch)和数学家沃尔特·皮茨(WalterPitts)对生物神经元进行
悬疑奇幻小说——西出玉门小小猪的时间之旅
书名：西出玉门作者：尾鱼故事：素有“死亡之海”之称的无人区罗布泊，隐藏着一个汉武帝时代的大秘密，而早已风化成沙的古玉门头，会在深夜的沙暴里集结成形，为某些特殊的“人”放行。被称为沙漠獠牙的昌东，两年前带团进入沙漠时遭遇沙漠风暴，除了他以外的所有团员遇难（其中包括他的女友）这件大事被外界称为：黑色山茶事件……黑色山茶事件后，人人喊打的昌东隐姓埋名，不生不死的在乡下做起了皮影师。两年后，一天一个叫叶流
【python学习】使用魔塔社区的模型
前言魔塔社区有很多模型，但是怎么使用呢？刚开始学习python，简单的摸索一下一、新建项目1、创建虚拟环境condacreate-npaddlepython=3.102、激活虚拟环境condaactivatepaddle3、新建项目PyCharn新建一个项目，选择已创建的虚拟环境paddle项目新增models目录二、下载模型打开PyCharm的Terminal，命令行前面有一个(paddle)，
唯品会618超级红包官方领取入口，唯品会2023年优惠减免规则攻略一览氧惠佣金真的高
一年一段的618年中大促马上就要开始了，不少小伙伴都非常期待，届时淘宝京东得物唯品会等平台都会推出优惠活动，唯品会是大家喜欢的网购软件之一，今天小编把唯品会618优惠减免规则，以及红包领取方式分享给大家，唯品会红包一天可以领取3次，5月23到5月30日每天可以领取3次，下方入口保存好，记得每天领取红包！️唯品会整体时间线：5月23日-6月21日记住两大核心玩法--【超荭+会场】领荭包时间（边领边用
如何分析用户满意度？这4种常用满意度分析模型，一定要学会 spssau
说到问卷调查，满意度调查算是众多问卷调查类型中应用最广泛的。不论是大小企业，或是政府、机构都可以通过满意度问卷调查了解服务对象的满意程度。比如医院需要了解患者对医护人员服务的满意程度，企业需要了解顾客对自家产品的满意程度及需求，政府需要了解公众的的服务需求等等。本文将介绍4种常用的顾客满意度模型，以及如何使用SPSSAU进行这些模型的建立和分析。1、四分图四分图，又称为四象限图，是一种简单实用的满
网络编程7.12
实现2个客户端之间互相聊天服务器要求：使用select模型实现接受多个客户端连接，以及转发消息客户端要求：使用poll模型解决技能够read读取服务器发来的消息，又能够scanf读取键盘输入的信息客户端服务器不允许开启额外线程和进程服务器代码：#include#include#include#include#include#include#include//最大客户端数量#defineMAX_CL
记忆中的红薯饭朋友来吧
经常看到红薯被夸赞的视频和文章，内心不由感慨，昔日的这个土鳖，缘何竟成了趋之若鹜的时尚美食？这个尤物，也叫番薯、甘薯、山莜……据说它含有多种营养元素，具有减肥、降血脂、降血压的功效，被营养学家称为“营养最均衡的食品”。每每视听到这些，心里总会涌起些许回味。生于七十年代的我辈人，对红薯丝饭有着刻骨铭心的记忆。其时，农村人能经常吃到米饭的，就荣获“大户人家”的美誉了，其实也就是吃米饭的频率稍高而已。大
主流编程语言全景图：从Python到Rust的深度解析万能小贤哥 python rust 开发语言
2024年编程语言生态报告显示，全球开发者使用的语言数量已达260+，但真正主导行业的不到20种。本文带你穿透技术迷雾，掌握8大核心语言的本质差异。一、选择编程语言的黄金标准图表代码二、八大主流语言对比解析1.Python-通用胶水语言特性：动态类型+缩进语法丰富的库生态（20万+包）GIL全局锁限制并发适用场景：python#机器学习示例（TensorFlow）importtensorflowa
PHP实战就业指南：从入门到高薪的核心技能图谱
PHP实战就业指南：从入门到高薪的核心技能图谱残酷现实与光明前景：尽管新兴语言不断涌现，PHP仍占据全球78.9%的服务器市场份额（W3Techs2024），国内招聘平台日均发布2.3万+PHP岗位，薪资范围6K-45K。关键在于掌握市场真正需要的技能组合。一、就业市场三大方向与薪资对标方向代表岗位薪资范围(1-3年经验)核心技术栈要求企业级开发PHP高级开发工程师15K-25KLaravel/S
想认真跟你们聊一件很俗的事儿，2022年该如何赚钱? 唐夕
因为今年我给自己制定了赚钱目标，以前真的从来没想过给自己制定这个目标，今年我给自己定了。一直以来，我都很少跟你们聊赚钱的话题。一方面是我自己并没有赚到太多钱，又很多赚钱的经验分享，所以积累不足，也就无法多写。另一方面是我自己一直以来对钱都没有多么大的渴求，也没有很大的欲望。当然，并不是我不缺钱哈，农村家庭出身的孩子，不说多缺，但是也没有多有。你们想想我小学六年级毕业的那个暑假就开始自己打工赚钱了，
React源码6 三大核心模块之一：commit, finishConcurrentRender函数 gzzeason ReactV18.2源码 react.js javascript 前端
Renderer工作的阶段在React内部被称为commit阶段。commit阶段流程图一、finishConcurrentRender函数functionfinishConcurrentRender(root,exitStatus,lanes){switch(exitStatus){caseRootInProgress:caseRootFatalErrored:{thrownewError('R
牵牛花散书斋
牵牛花，在人们眼里没有出奇的地方，长在不起眼的地方或野外，没有人工培植，萧瑟秋天里默默开着，人们也不会打扰她，但在陈曾寿的眼中是别样的：一枝颜色费评誇，冷翠光中晕淡霞。绝世幽情容一现，能如我意是秋花。人如花，花似人，陈曾寿（1878～1949）晚清诗人。字仁先，号耐寂、复志、焦庵，家藏元代吴镇所画《苍虬图》，因以名阁，自称苍虬居士，湖北蕲水县（今浠水县）巴河陈家大岭人，状元陈沆曾孙。光绪二十九年进
2022-05-06 羊羊得逸
中原焦点团队徐晓霞网络中级28期坚持分享第（332）约练（125）（2022-5-6）不管来访者怎么讲，咨询师要把握大的方向，咨询才不容易跑偏。来访者说的比较多，比较散的时候，咨询师的对咨询脉络的把控很重要，如果单纯跟着来访者，看似贴着，问的比较散，容易跑偏。目标一定清晰，但不要着急去帮忙解决问题，先让来访者把心里情绪宣泄出来，中间可以多次进行目标的确认。
2019-03-12 黄侠_美兮妈
【美兮修能】20190312识字营009期D110（学习力践行记录D499）早上读了《民国老课本》第121课，看了《森林里的小房子》，读了一本牛津树《Thejourey》。图片发自App下午从幼儿园回来的路上背了《望庐山瀑布》《瀑布》。晚饭后上外教课，玩得很开心。图片发自App然后和小伙伴一起做实验，熔岩大爆发、颜色变变变和彩虹糖水。图片发自App然后他们一起玩颜色。又拼了小猪佩奇的拼图。图片发自
297.宝宝的衣服大小选择 EvaingWu
今天带宝宝出去玩时，穿了一件去年夏天买的衣服。发现它的大小合适，但是已经旧了。突然想起一套衣服穿两年的说法其实并不是很可靠。假设这件价格还是需要咬咬牙才下手的。如果你今年买了大一码，首先穿上去不合身，然后呢，等第二年合身了，却显旧，价值明显下降，尤其是纯棉的衣服。现在的话，我下次买衣服就会选择买合适的价格相对便宜质量还不错的。同时，我把宝宝100码的衣服收起来了。因为现在穿有点大，如果明年穿的话就
母愛激勵著我成長千樽羽心
图片发自App如果母親是一顆遮擋風澤，則我就是依偎在大樹旁的小草；如果母親是一片大海，則我就是那其中一朵浪花；如果母親是一片天空，則我就一只徘徊在空中的鳥兒。母親一路呵護著我，激勵著我不斷成長。我的母親不識字。有時，我便教她，有時，我卻一味地責怪她……每天很早，母親都是第一個起床，這時候睡夢中的我便會迷迷糊糊的聽到母親做飯聲。我撩開窗簾望著外面，天還是灰沉沉的，北風呼嘯我不禁打個哆嗦又鑽進暖轟轟的
java短路运算符和逻辑运算符的区别 3213213333332132 java基础
/* * 逻辑运算符——不论是什么条件都要执行左右两边代码 * 短路运算符——我认为在底层就是利用物理电路的“并联”和“串联”实现的 * 原理很简单，并联电路代表短路或（||），串联电路代表短路与（&&）。 * * 并联电路两个开关只要有一个开关闭合，电路就会通。 * 类似于短路或（||），只要有其中一个为true（开关闭合）是
Java异常那些不得不说的事白糖_ java exception
一、在finally块中做数据回收操作比如数据库连接都是很宝贵的，所以最好在finally中关闭连接。 JDBCAgent jdbc = new JDBCAgent(); try{ jdbc.excute("select * from ctp_log"); }catch(SQLException e){ ... }finally{ jdbc.close();
utf-8与utf-8(无BOM)的区别 dcj3sjt126com PHP
BOM——Byte Order Mark，就是字节序标记在UCS 编码中有一个叫做"ZERO WIDTH NO-BREAK SPACE"的字符，它的编码是FEFF。而FFFE在UCS中是不存在的字符，所以不应该出现在实际传输中。UCS规范建议我们在传输字节流前，先传输字符"ZERO WIDTH NO-BREAK SPACE"。这样如
JAVA Annotation之定义篇周凡杨 java 注解 annotation 入门注释
Annotation: 译为注释或注解 An annotation, in the Java computer programming language, is a form of syntactic metadata that can be added to Java source code. Classes, methods, variables, pa
tomcat的多域名、虚拟主机配置 g21121 tomcat
众所周知apache可以配置多域名和虚拟主机，而且配置起来比较简单，但是项目用到的是tomcat，配来配去总是不成功。查了些资料才总算可以，下面就跟大家分享下经验。很多朋友搜索的内容基本是告诉我们这么配置：在Engine标签下增面积Host标签，如下： <Host name="www.site1.com" appBase="webapps"
Linux SSH 错误解析（Capistrano 的cap 访问错误 Permission ） 510888780 linux capistrano
1.ssh -v [email protected] 出现 Permission denied (publickey,gssapi-keyex,gssapi-with-mic,password). 错误运行状况如下： OpenSSH_5.3p1, OpenSSL 1.0.1e-fips 11 Feb 2013 debug1: Reading configuratio
log4j的用法 Harry642 java log4j
一、前言： log4j 是一个开放源码项目，是广泛使用的以Java编写的日志记录包。由于log4j出色的表现，当时在log4j完成时，log4j开发组织曾建议sun在jdk1.4中用log4j取代jdk1.4 的日志工具类，但当时jdk1.4已接近完成，所以sun拒绝使用log4j，当在java开发中
mysql、sqlserver、oracle分页，java分页统一接口实现 aijuans oracle jave
定义：pageStart 起始页，pageEnd 终止页,pageSize页面容量 oracle分页：　　　　select * from ( select mytable.*,rownum num from (实际传的SQL) where rownum<=pageEnd) where num>=pageStart sqlServer分页：
Hessian 简单例子 antlove java Web service hessian
hello.hessian.MyCar.java package hessian.pojo; import java.io.Serializable; public class MyCar implements Serializable { private static final long serialVersionUID = 473690540190845543
数据库对象的同义词和序列百合不是茶 sql 序列同义词 ORACLE权限
回顾简单的数据库权限等命令; 解锁用户和锁定用户 alter user scott account lock/unlock; //system下查看系统中的用户 select * dba_users; //创建用户名和密码 create user wj identified by wj; identified by //授予连接权和建表权 grant connect to
使用Powermock和mockito测试静态方法 bijian1013 持续集成单元测试 mockito Powermock
实例： package com.bijian.study; import static org.junit.Assert.assertEquals; import java.io.IOException; import org.junit.Before; import org.junit.Test; import or
精通Oracle10编程SQL(6)访问ORACLE bijian1013 oracle 数据库 plsql
/* *访问ORACLE */ --检索单行数据 --使用标量变量接收数据 DECLARE v_ename emp.ename%TYPE; v_sal emp.sal%TYPE; BEGIN select ename,sal into v_ename,v_sal from emp where empno=&no; dbms_output.pu
【Nginx四】Nginx作为HTTP负载均衡服务器 bit1129 nginx
Nginx的另一个常用的功能是作为负载均衡服务器。一个典型的web应用系统，通过负载均衡服务器，可以使得应用有多台后端服务器来响应客户端的请求。一个应用配置多台后端服务器，可以带来很多好处：负载均衡的好处增加可用资源增加吞吐量加快响应速度，降低延时出错的重试验机制 Nginx主要支持三种均衡算法： round-robin l
jquery-validation备忘白糖_ jquery css F#Firebug
留点学习jquery validation总结的代码： function checkForm(){ validator = $("#commentForm").validate({// #formId为需要进行验证的表单ID errorElement :"span",// 使用"div"标签标记错误，默认:&
solr限制admin界面访问（端口限制和http授权限制） ronin47 限定Ip访问
solr的管理界面可以帮助我们做很多事情，但是把solr程序放到公网之后就要限制对admin的访问了。可以通过tomcat的http基本授权来做限制，也可以通过iptables防火墙来限制。我们先看如何通过tomcat配置http授权限制。第一步：在tomcat的conf/tomcat-users.xml文件中添加管理用户，比如： <userusername="ad
多线程-用JAVA写一个多线程程序，写四个线程，其中二个对一个变量加1，另外二个对一个变量减1 bylijinnan java 多线程
public class IncDecThread { private int j=10; /* * 题目:用JAVA写一个多线程程序，写四个线程，其中二个对一个变量加1，另外二个对一个变量减1 * 两个问题： * 1、线程同步--synchronized * 2、线程之间如何共享同一个j变量--内部类 */ public static
买房历程 cfyme
2015-06-21: 万科未来城，看房子 2015-06-26: 办理贷款手续，贷款73万，贷款利率5.65=5.3675 2015-06-27: 房子首付,签完合同 2015-06-28，央行宣布降息 0.25，就2天的时间差啊，没赶上。首付，老婆找他的小姐妹接了5万，另外几个朋友借了1-
[军事与科技]制造大型太空战舰的前奏 comsci 制造
天气热了........空调和电扇要准备好.......... 最近,世界形势日趋复杂化,战争的阴影开始覆盖全世界.......... 所以,我们不得不关
dateformat dai_lm DateFormat
"Symbol Meaning Presentation Ex." "------ ------- ------------ ----" "G era designator (Text) AD" "y year
Hadoop如何实现关联计算 datamachine mapreduce hadoop 关联计算
选择Hadoop，低成本和高扩展性是主要原因，但但它的开发效率实在无法让人满意。以关联计算为例。假设：HDFS上有2个文件，分别是客户信息和订单信息，customerID是它们之间的关联字段。如何进行关联计算，以便将客户名称添加到订单列表中？ &nbs
用户模型中修改用户信息时，密码是如何处理的 dcj3sjt126com yii
当我添加或修改用户记录的时候对于处理确认密码我遇到了一些麻烦，所有我想分享一下我是怎么处理的。场景是使用的基本的那些(系统自带)，你需要有一个数据表(user)并且表中有一个密码字段(password),它使用 sha1、md5或其他加密方式加密用户密码。面是它的工作流程: 当创建用户的时候密码需要加密并且保存，但当修改用户记录时如果使用同样的场景我们最终就会把用户加密过的密码再次加密，这
中文 iOS/Mac 开发博客列表 dcj3sjt126com Blog
本博客列表会不断更新维护，如果有推荐的博客，请到此处提交博客信息。本博客列表涉及的文章内容支持定制化Google搜索，特别感谢 JeOam 提供并帮助更新。本博客列表也提供同步更新的OPML文件（下载OPML文件），可供导入到例如feedly等第三方定阅工具中，特别感谢 lcepy 提供自动转换脚本。这里有导入教程。
js去除空格，去除左右两端的空格蕃薯耀去除左右两端的空格 js去掉所有空格 js去除空格
js去除空格，去除左右两端的空格 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>&g
SpringMVC4零配置--web.xml hanqunfeng springmvc4
servlet3.0+规范后，允许servlet，filter，listener不必声明在web.xml中，而是以硬编码的方式存在，实现容器的零配置。 ServletContainerInitializer：启动容器时负责加载相关配置 package javax.servlet; import java.util.Set; public interface ServletContainer
《开源框架那些事儿21》：巧借力与借巧力 j2eetop 框架 UI
同样做前端UI，为什么有人花了一点力气，就可以做好？而有的人费尽全力，仍然错误百出？我们可以先看看几个故事。故事1：巧借力，乌鸦也可以吃核桃有一个盛产核桃的村子，每年秋末冬初，成群的乌鸦总会来到这里，到果园里捡拾那些被果农们遗落的核桃。核桃仁虽然美味，但是外壳那么坚硬，乌鸦怎么才能吃到呢？原来乌鸦先把核桃叼起，然后飞到高高的树枝上，再将核桃摔下去，核桃落到坚硬的地面上，被撞破了，于是，
JQuery EasyUI 验证扩展可怜的猫 jquery easyui 验证
最近项目中用到了前端框架-- EasyUI，在做校验的时候会涉及到很多需要自定义的内容，现把常用的验证方式总结出来，留待后用。以下内容只需要在公用js中添加即可。使用类似于如下： <input class="easyui-textbox" name="mobile" id="mobile&
架构师之httpurlconnection----------读取和发送(流读取效率通用类) nannan408
1.前言. 如题. 2.代码. /* * Copyright (c) 2015, S.F. Express Inc. All rights reserved. */ package com.test.test.test.send; import java.io.IOException; import java.io.InputStream
Jquery性能优化 r361251 JavaScript jquery
一、注意定义jQuery变量的时候添加var关键字这个不仅仅是jQuery，所有javascript开发过程中，都需要注意，请一定不要定义成如下： $loading = $('#loading'); //这个是全局定义，不知道哪里位置倒霉引用了相同的变量名，就会郁闷至死的二、请使用一个var来定义变量如果你使用多个变量的话，请如下方式定义： . 代码如下: var page
在eclipse项目中使用maven管理依赖 tjj006 eclipse maven
概览: 如何导入maven项目至eclipse中建立自有Maven Java类库服务器建立符合maven代码库标准的自定义类库 Maven在管理Java类库方面有巨大的优势，像白衣所说就是非常“环保”。我们平时用IDE开发都是把所需要的类库一股脑的全丢到项目目录下，然后全部添加到ide的构建路径中，如果用了SVN/CVS，这样会很容易就把
中国天气网省市级联页面 x125858805 级联
1、页面及级联js <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"> &l