爱看烟花的码农

大语言模型（LLM）的训练和推理

一、大语言模型简介

大语言模型（如GPT、BERT、LLaMA、Grok等）是基于深度神经网络（主要是Transformer架构）的模型，通过在大规模文本数据上训练，学习语言的统计规律、语义和上下文关系。它们可以完成多种任务，包括文本生成、分类、翻译、问答等。训练和推理是模型生命周期的两个核心阶段：

训练：从海量数据中学习语言模式，优化模型参数。
推理：使用训练好的模型处理新输入，生成输出。

二、大语言模型的训练过程

训练一个大语言模型是一个复杂的过程，涉及数据准备、模型架构设计、优化算法、分布式计算和微调等多个阶段。以下是详细分解：

1. 数据准备

数据是LLM训练的基础，其质量和规模直接影响模型性能。

(1) 数据收集

来源：
- 网络爬取：如Common Crawl（数十TB的网页数据，包含论坛、博客、新闻等）。
- 公开数据集：Wikipedia（多语言百科全书）、BooksCorpus（免费电子书）、ArXiv（学术论文）。
- 专有数据：企业可能使用内部数据（如社交媒体帖子、客服对话）。
- 多模态数据（新兴趋势）：如图像-文本对（用于多模态LLM，如CLIP）。
规模：
- GPT-3训练数据约45TB（压缩后约570GB），包含约5000亿个token（假设平均token长度为4字节）。
- LLaMA-3（假设）可能使用更大规模数据，如100TB+。
多样性：
- 覆盖多种语言（英语、汉语、西班牙语等）。
- 包含多种领域（科技、文学、法律、日常对话）。
- 风格多样（正式、口语、创意写作）。
细节：
- 数据通常以纯文本或JSON格式存储。
- 收集需要遵守版权和隐私法规（如GDPR）。
- 工具：如wget、BeautifulSoup（Python爬虫）、Apache Nutch。

(2) 数据清洗

去噪：
- 移除广告、导航菜单、HTML标签、乱码。
- 示例：使用正则表达式过滤HTML标签（<.*?>）。
- 工具：lxml、html2text。
去重：
- 使用哈希算法（如MinHash）或精确匹配检测重复文本。
- 工具：datasketch（MinHash实现）。
- 目的：避免模型记住重复模式，减少过拟合。
过滤低质量内容：
- 移除语法错误严重的文本、过短的句子。
- 使用语言模型（如BERT）评分文本质量，过滤低分内容。
隐私保护：
- 移除个人信息（如姓名、电话号码）。
- 工具：正则表达式、NER（命名实体识别）模型。
示例：
- 原始文本：Buy now for $99! Visit www.example.com
- 清洗后：Buy now for $99!

(3) 数据预处理

分词（Tokenization）：
- 目标：将文本分割成token（单词、子词或字符）。
- 算法：
  - Byte-Pair Encoding (BPE）：
    - 初始将文本拆分为字符，迭代合并高频字符对。
    - 示例：单词“unhappiness”可能拆为“un”+“happi”+“ness”。
    - 实现：sentencepiece库、tokenizers（Hugging Face）。
  - WordPiece（BERT使用）：
    - 类似BPE，但优化交叉熵损失。
  - Unigram（SentencePiece使用）：
    - 从大词汇表开始，逐步删除低概率token。
- 词汇表：
  - 大小：通常为3万到10万（GPT-3约5万，BERT约3万）。
  - 包含特殊token，如[CLS]（分类）、[SEP]（分隔）、<|start|>（开始）。
- 代码示例（使用Hugging Face tokenizers）：
```
from tokenizers import Tokenizer
from tokenizers.models import BPE
from tokenizers.trainers import BpeTrainer

tokenizer = Tokenizer(BPE())
trainer = BpeTrainer(vocab_size=30000, special_tokens=["<|start|>", "<|end|>"])
tokenizer.train(files=["corpus.txt"], trainer=trainer)
encoded = tokenizer.encode("Hello, world!")
print(encoded.tokens)  # ['Hel', 'lo', ',', 'wor', 'ld', '!']
```
序列化：
- 将token映射为数字ID。
- 示例：Hello → 1001，, → 1002。
- 存储为张量（如PyTorch的torch.tensor）。
分组：
- 将文本切分为固定长度序列（最大长度如512或2048 token）。
- 填充（Padding）：短序列补齐到最大长度，使用[PAD]。
- 截断（Truncation）：长序列截断，保留关键部分。
- 注意力掩码（Attention Mask）：
  - 生成掩码张量，标记有效token（1）和填充token（0）。
  - 示例：输入[Hello, world, [PAD]]，掩码为[1, 1, 0]。
- 代码示例：
```
import torch
tokens = [1001, 1002, 1003]  # Hello, world
padded = tokens + [0] * (512 - len(tokens))  # 填充到512
attention_mask = [1] * len(tokens) + [0] * (512 - len(tokens))
input_tensor = torch.tensor([padded])
mask_tensor = torch.tensor([attention_mask])
```

2. 模型架构

LLM通常基于Transformer架构，以下是详细分解。

(1) Transformer核心组件

自注意力机制（Self-Attention）：

原理：
- 每个token的表示通过查询（Query）、键（Key）、值（Value）向量计算。
- 注意力分数衡量token间的相关性。
数学公式：
- 输入：嵌入矩阵X ∈ ℝ^{n×d}，n为序列长度，d为嵌入维度。
- 计算Q、K、V：
  - Q = XW_Q, K = XW_K, V = XW_V，其中W_Q, W_K, W_V ∈ ℝ^{d×d_k}。
- 注意力权重：
  - Attention(Q, K, V) = softmax(QK^T / √d_k)V。
  - √d_k为缩放因子，防止数值过大。

代码示例（简化的自注意力）：

import torch
import torch.nn as nn

class SelfAttention(nn.Module):
    def __init__(self, d_model, d_k):
        super().__init__()
        self.d_k = d_k
        self.W_q = nn.Linear(d_model, d_k)
        self.W_k = nn.Linear(d_model, d_k)
        self.W_v = nn.Linear(d_model, d_k)
    
    def forward(self, x):
        Q = self.W_q(x)  # [batch, seq_len, d_k]
        K = self.W_k(x)
        V = self.W_v(x)
        scores = torch.matmul(Q, K.transpose(-2, -1)) / (self.d_k ** 0.5)
        attn_weights = torch.softmax(scores, dim=-1)
        output = torch.matmul(attn_weights, V)
        return output

多头注意力（Multi-Head Attention）：
- 将注意力分为h个头（head），每头独立计算：
  - head_i = Attention(QW_Q^i, KW_K^i, VW_V^i)。
  - 合并：MultiHead(Q, K, V) = Concat(head_1, ..., head_h)W_O。
- 参数：
  - 头数h：如12（BERT）或96（GPT-3）。
  - 每头维度：d_k = d_model / h。
- 优势：捕捉不同的语义关系（如语法、语义）。

前馈神经网络（FFN）：

逐位置应用：
- FFN(x) = max(0, xW_1 + b_1)W_2 + b_2。
参数：
- 中间维度通常为4 * d_model（如BERT的3072）。

实现：

class FeedForward(nn.Module):
    def __init__(self, d_model, d_ff):
        super().__init__()
        self.linear1 = nn.Linear(d_model, d_ff)
        self.linear2 = nn.Linear(d_ff, d_model)
        self.relu = nn.ReLU()
    
    def forward(self, x):
        return self.linear2(self.relu(self.linear1(x)))

层归一化（Layer Normalization）：
- 稳定训练：
  - LayerNorm(x) = γ * (x - μ) / σ + β，其中μ、σ为均值和标准差，γ、β为可学习参数。
- 位置：通常在注意力后和FFN后。
残差连接（Residual Connection）：
- x = x + Sublayer(x)，避免梯度消失。

位置编码（Positional Encoding）：

固定正弦/余弦编码：
- PE(pos, 2i) = sin(pos / 10000^(2i/d_model))。
- PE(pos, 2i+1) = cos(pos / 10000^(2i/d_model))。
可学习编码：直接优化嵌入向量。

实现：

def get_positional_encoding(seq_len, d_model):
    pos = torch.arange(seq_len).unsqueeze(1)
    div_term = torch.exp(torch.arange(0, d_model, 2) * (-math.log(10000.0) / d_model))
    pe = torch.zeros(seq_len, d_model)
    pe[:, 0::2] = torch.sin(pos * div_term)
    pe[:, 1::2] = torch.cos(pos * div_term)
    return pe

(2) 模型类型

仅解码器模型（如GPT）：
- 单向自回归，适合生成任务。
- 注意力掩码：因果掩码（Causal Mask），只关注前文。
仅编码器模型（如BERT）：
- 双向建模，适合理解任务。
- 注意力掩码：全连接（无掩码）。
编码器-解码器模型（如T5）：
- 适合序列到序列任务。
- 编码器：双向；解码器：自回归。

(3) 模型规模

参数量：
- GPT-3：1750亿。
- LLaMA-3-70B：700亿。
- 参数分布：嵌入层约20%，注意力层约40%，FFN约40%。
层数与维度：
- GPT-3：96层，d_model=12288，h=96。
- BERT：12层（Base）或24层（Large），d_model=768或1024。
计算复杂度：
- 自注意力：O(n^2 * d)，n为序列长度。
- FFN：O(n * d * d_ff)。
- 序列长度增加会显著提高成本。

3. 训练目标

训练目标定义了模型优化的方向。以下是详细分析：

(1) 自回归语言建模（Causal Language Modeling）

目标：
- 预测下一个token，给定前文：
  - P(x_t | x_1, ..., x_{t-1})。
损失函数：
- 交叉熵损失：
  - L = -∑_{t=1}^T log P(x_t | x_1, ..., x_{t-1})。
- 对每个token计算softmax概率：
  - P(x_t) = softmax(W_o * h_t)，其中h_t为Transformer输出。

实现：

class LanguageModel(nn.Module):
    def __init__(self, vocab_size, d_model):
        super().__init__()
        self.transformer = TransformerDecoder(...)  # 简化的Transformer
        self.output = nn.Linear(d_model, vocab_size)
    
    def forward(self, x):
        h = self.transformer(x)
        logits = self.output(h)
        return logits

criterion = nn.CrossEntropyLoss()
logits = model(input_ids)  # [batch, seq_len, vocab_size]
loss = criterion(logits.view(-1, vocab_size), target_ids.view(-1))

细节：
- 输入和目标偏移一位（target_ids = input_ids[1:]）。
- 因果掩码确保只关注前文。

(2) 掩码语言建模（Masked Language Modeling）

目标：
- 随机掩盖15%的token，预测原始token。
- 示例：输入The cat [MASK] on the mat.，预测sat。
损失函数：
- 仅对掩码token计算交叉熵：
  - L = -∑_{i∈masked} log P(x_i | x)。

细节：

掩码策略：
- 80%替换为[MASK]。
- 10%替换为随机token。
- 10%保持不变。

实现：

def mask_tokens(inputs, tokenizer, mlm_prob=0.15):
    labels = inputs.clone()
    mask = torch.rand(inputs.shape) < mlm_prob
    inputs[mask] = tokenizer.mask_token_id
    return inputs, labels

(3) 序列到序列建模

目标：
- 将输入序列映射到输出序列：
  - P(y_1, ..., y_m | x_1, ..., x_n)。
损失函数：
- 交叉熵：
  - L = -∑_{t=1}^m log P(y_t | y_1, ..., y_{t-1}, x)。
实现：
- 编码器处理输入，解码器生成输出。
- 使用teacher forcing：训练时输入真实目标序列。

4. 优化算法

(1) 随机梯度下降（SGD）与Adam

Adam：
- 结合一阶动量（均值）和二阶动量（方差）。
- 更新规则：
  - m_t = β_1 m_{t-1} + (1 - β_1) g_t。
  - v_t = β_2 v_{t-1} + (1 - β_2) g_t^2。
  - θ_t = θ_{t-1} - η * m_t / (√v_t + ε)。
- 参数：β_1=0.9, β_2=0.999, ε=1e-8。

实现：

optimizer = torch.optim.Adam(model.parameters(), lr=6e-4, betas=(0.9, 0.999))

(2) 学习率调度

Warm-up：
- 初始阶段线性增加学习率：
  - lr_t = lr_max * t / T_warmup。
- 示例：前10%步数从0到6e-4。

衰减：

余弦退火：
- lr_t = lr_min + 0.5 * (lr_max - lr_min) * (1 + cos(π * t / T))。

实现：

from torch.optim.lr_scheduler import CosineAnnealingLR

scheduler = CosineAnnealingLR(optimizer, T_max=100000, eta_min=1e-6)

(3) 批量大小

大批量：
- GPT-3使用约3.2M token/batch。
- 提高并行效率，稳定梯度。

梯度累积：

显存不足时，分多次计算小批量：

optimizer.zero_grad()
for i, batch in enumerate(data):
    loss = model(batch).loss
    loss.backward()
    if (i + 1) % accumulation_steps == 0:
        optimizer.step()
        optimizer.zero_grad()

(4) 混合精度训练

原理：
- 使用FP16/BF16计算，FP32存储权重。
- 减少显存，加速计算。

实现：

from torch.cuda.amp import autocast, GradScaler

scaler = GradScaler()
for batch in data:
    optimizer.zero_grad()
    with autocast():
        loss = model(batch).loss
    scaler.scale(loss).backward()
    scaler.step(optimizer)
    scaler.update()

5. 分布式训练

(1) 数据并行

每个GPU处理不同数据子集，同步梯度：
- All-Reduce聚合梯度。

实现：PyTorch DDP：

import torch.distributed as dist
from torch.nn.parallel import DistributedDataParallel as DDP

dist.init_process_group(backend="nccl")
model = DDP(model)

(2) 模型并行

流水线并行：
- 将层分配到不同设备：
  - GPU 1：层1-10，GPU 2：层11-20。
- 实现：DeepSpeed Pipe。
张量并行：
- 将矩阵运算分割：
  - 注意力头的W_Q、W_K分割到不同GPU。
- 实现：Megatron-LM。

(3) ZeRO（Zero Redundancy Optimizer）

分片优化器状态、梯度和参数：
- ZeRO-1：分片优化器状态。
- ZeRO-2：分片梯度。
- ZeRO-3：分片参数。

实现：DeepSpeed：

from deepspeed import init_distributed
import deepspeed

model_engine, optimizer, _, _ = deepspeed.initialize(model=model, config=ds_config)

(4) 通信优化

Ring All-Reduce：
- 环形拓扑减少通信开销。
NVLink：
- NVIDIA GPU间高速互联。
InfiniBand：
- 集群间高速网络。

6. 训练中的挑战与解决方案

(1) 计算资源

硬件：
- GPT-3训练可能使用8000块A100 GPU，耗时约1个月。
- 成本：数百万美元。
解决方案：
- 云服务：AWS（EC2 P4d）、Azure（NDv4）。
- 高效算法：ZeRO、混合精度。

(2) 过拟合

Dropout：
- 随机丢弃神经元（概率如0.1）。
权重衰减：
- L2正则化，惩罚大权重。
数据增强：
- 动态掩码、文本替换。

(3) 稳定性

梯度裁剪：

限制梯度范数（如1.0）。

torch.nn.utils.clip_grad_norm_(model.parameters(), max_norm=1.0)

初始化：
- Xavier或He初始化，稳定初始梯度。

7. 微调

(1) 监督微调（SFT）

数据：标注的问答对、翻译对。

实现：

from transformers import Trainer, TrainingArguments

training_args = TrainingArguments(
    output_dir="./sft",
    per_device_train_batch_size=8,
    num_train_epochs=3,
)
trainer = Trainer(model=model, args=training_args, train_dataset=dataset)
trainer.train()

(2) 强化学习微调（RLHF）

步骤：
- 收集人类偏好数据（比较模型输出）。
- 训练奖励模型（Reward Model）：
  - 输入：输出对，输出：偏好分数。
- 使用PPO优化：
  - 最大化奖励，同时约束KL散度。

实现：TRL库：

from trl import PPOTrainer

ppo_trainer = PPOTrainer(model=model, ref_model=ref_model, config=ppo_config)
ppo_trainer.train()

(3) 参数高效微调（PEFT）

LoRA：

冻结预训练权重，添加低秩矩阵：
- W = W_0 + BA，B、A为小矩阵。

实现：PEFT库：

from peft import LoraConfig, get_peft_model

lora_config = LoraConfig(r=8, lora_alpha=16, target_modules=["q", "v"])
model = get_peft_model(model, lora_config)

三、大语言模型的推理过程

推理是使用训练好的模型处理输入，生成输出的过程。以下是详细分解：

1. 输入处理

(1) 分词

使用训练时相同的分词器。
示例：
- 输入：“我爱学习人工智能”
- 输出：["我", "爱", "学", "习", "人", "工", "智", "能"]。

(2) 序列化

转换为ID：
- token_ids = tokenizer.convert_tokens_to_ids(tokens)。

(3) 填充与截断

固定长度（如2048）：
- 填充：[PAD]。
- 截断：保留前2048 token。
注意力掩码：
- attention_mask = [1, 1, ..., 0, 0]。

2. 模型前向传播

(1) 嵌入层

词嵌入：
- x = embedding(token_ids)，x ∈ ℝ^{seq_len×d_model}。
位置嵌入：
- x = x + positional_encoding(seq_len, d_model)。

(2) Transformer层

每层：
- 自注意力：h = MultiHeadAttention(x)。
- 残差：x = x + h。
- 层归一化：x = LayerNorm(x)。
- FFN：h = FeedForward(x)。
- 残差与归一化：x = LayerNorm(x + h)。

(3) 输出层

线性层+softmax：
- logits = W_o * h，probs = softmax(logits)。
输出：词汇表概率分布。

3. 输出生成

(1) 自回归生成

过程：
- 初始输入：x_1, ..., x_t。
- 预测：x_{t+1} ~ P(x_{t+1} | x_1, ..., x_t)。
- 加入新token，重复。

解码策略：

贪心搜索：
- x_{t+1} = argmax(P(x_{t+1}))。
束搜索：
- 保留k个候选序列：
  - score = ∑ log P(x_t)。
- 参数：beam_size=5。
采样：
- 随机采样：x_{t+1} ~ P(x_{t+1})。
- Top-k：从前k个token采样。
- Top-p：从累计概率p的token采样。
温度：
- P'(x) = P(x)^(1/T) / ∑ P(x)^(1/T)。
- T<1：更确定，T>1：更随机。

实现：

from transformers import GPT2LMHeadModel, GPT2Tokenizer

model = GPT2LMHeadModel.from_pretrained("gpt2")
tokenizer = GPT2Tokenizer.from_pretrained("gpt2")
inputs = tokenizer("Hello, world!", return_tensors="pt")
outputs = model.generate(
    inputs["input_ids"],
    max_length=50,
    do_sample=True,
    top_k=50,
    top_p=0.95,
    temperature=0.7,
)
print(tokenizer.decode(outputs[0]))

(2) 非自回归生成

一次性输出：
- 示例：BERT预测[MASK]。

实现：

from transformers import BertForMaskedLM

model = BertForMaskedLM.from_pretrained("bert-base-uncased")
inputs = tokenizer("The cat [MASK] on the mat.", return_tensors="pt")
logits = model(**inputs).logits
masked_idx = (inputs["input_ids"] == tokenizer.mask_token_id).nonzero()
predicted_token = logits[0, masked_idx, :].argmax(dim=-1)

4. 推理优化

(1) 量化

INT8量化：
- 将FP32权重转换为INT8：
  - w_int8 = round(w_fp32 / scale)。
实现：torch.quantization。

(2) 剪枝

结构化剪枝：
- 删除整个注意力头或FFN单元。
非结构化剪枝：
- 删除小权重。
实现：torch.nn.utils.prune。

(3) 蒸馏

知识蒸馏：
- 学生模型优化：
  - L = α * L_CE + (1 - α) * L_KL(teacher_logits, student_logits)。
实现：Hugging Face DistilBERT。

(4) KV缓存

原理：
- 缓存自注意力的K、V：
  - K_t = [K_1, ..., K_t], V_t = [V_1, ..., V_t]。

实现：

class TransformerDecoderWithCache(nn.Module):
    def __init__(self):
        super().__init__()
        self.k_cache = []
        self.v_cache = []
    
    def forward(self, x, use_cache=True):
        if use_cache:
            k, v = self.attention(x)
            self.k_cache.append(k)
            self.v_cache.append(v)
        return self.attention(x, k_cache=self.k_cache, v_cache=self.v_cache)

(5) 硬件加速

TensorRT：
- 优化推理图，融合算子。
ONNX：
- 跨平台优化。

5. 推理中的挑战

(1) 计算成本

显存：
- GPT-3推理需要约350GB（FP16）。
解决方案：
- 模型并行、量化。

(2) 延迟

实时要求：
- 对话系统需<200ms。
解决方案：
- 高效解码、缓存。

(3) 输出质量

幻觉（Hallucination）：
- 生成错误事实。
解决方案：
- 微调、后处理。

四、案例分析：以LLaMA-3为例

1. 训练

数据：
- 假设100TB，包含Common Crawl、Wikipedia、C4。
- 清洗：去重（MinHash）、去噪（正则表达式）。
- 分词：SentencePiece，词汇表约5万。
架构：
- 仅解码器，70B参数，80层，d_model=8192，h=64。
目标：
- 自回归建模，交叉熵损失。
优化：
- AdamW，lr=3e-4，余弦衰减。
- 混合精度（BF16）。
- 批量大小：4M token。
分布式：
- 4096块H100 GPU，ZeRO-3。
- 训练约2个月。

2. 推理

输入：
- “请解释量子力学”
- 分词：["请", "解", "释", "量", "子", "力", "学"]。
前向传播：
- 嵌入：8192维向量。
- Transformer：80层，KV缓存加速。
生成：
- Top-p采样，p=0.9，temperature=0.8。
- 输出：逐token生成，约100 token。
优化：
- INT8量化，TensorRT加速。

五、学习建议

1. 理论

书籍：
- 《Deep Learning》：数学基础。
- 《Transformers for Natural Language Processing》：Transformer详解。
论文：
- 《Scaling Laws for Neural Language Models》：规模效应。
- 《LoRA: Low-Rank Adaptation》：高效微调。
课程：
- CS231n（Stanford，CNN与Transformer）。
- fast.ai NLP课程。

2. 实践

框架：PyTorch（推荐）、JAX（高性能）。

项目：

实现小型Transformer：

class Transformer(nn.Module):
    def __init__(self, d_model, nhead, num_layers):
        super().__init__()
        self.encoder = nn.TransformerEncoder(
            nn.TransformerEncoderLayer(d_model, nhead), num_layers
        )
    
    def forward(self, src):
        return self.encoder(src)

微调LLaMA：
- 使用Hugging Face PEFT。
推理优化：
- 实现KV缓存。

数据集：
- WikiText、C4。
工具：
- Hugging Face、DeepSpeed。

3. 资源

免费：
- Colab Pro（A100 GPU）。
- Kaggle（TPU）。
社区：
- CSDN平台（#NLP、#LLM）。
- GitHub、Hugging Face、Meta AI。

六、总结

训练：
- 数据：收集、清洗、分词（BPE）。
- 架构：Transformer（自注意力、FFN）。
- 目标：自回归、掩码建模。
- 优化：Adam、混合精度、分布式（ZeRO）。
- 微调：SFT、RLHF、LoRA。
推理：
- 输入：分词、序列化。
- 前向：嵌入、Transformer、输出。
- 生成：贪心、束搜索、采样。
- 优化：量化、KV缓存、TensorRT。

你可能感兴趣的:(AIGC,AIGC,人工智能,自然语言处理,LLMs,大语言模型)

探索 AI 系统提示与模型资源库：`system-prompts-and-models-of-ai-tools` 几道之旅人工智能智能体及数字员工人工智能
在当今的人工智能领域，系统提示和工具模型的优化与应用对于提升AI助手的性能和响应质量至关重要。x1xhlol开源的system-prompts-and-models-of-ai-tools仓库为开发者们提供了一个丰富的资源集合，涵盖了多种AI工具的系统提示、工具和模型。仓库概述这个仓库包含了超过7500行的代码和文档，详细介绍了多个知名AI工具的系统提示和相关模型，其中包括FULLv0、Curso
【知识图谱构建系列1】数据集介绍几道之旅人工智能智能体及数字员工 Python杂货铺 AI 自建MCP 学习记录知识图谱
文章目录项目简介数据集简介数据集核心内容应用与影响小细节参考论文：hal.science/hal-04862214/项目地址：https://github.com/ChristopheCruz/LLM4KGC/项目简介我们所要学习的项目（LLM4KGC）聚焦于利用大语言模型（LLMs）实现从文本到知识图谱（Text-to-KnowledgeGraph,T2KG）的自动化构建，旨在探索高效可靠的知识
2025 年 6 月底大模型产品进展与现状 AIGC前沿技术探索大模型技术与产品前沿探索大模型
上半年，各大厂商完成了从“秀肌肉”（展示模型能力）到“上货架”（推出可用产品和平台）的关键转变。市场的讨论焦点也从“哪个模型更强”转向了“哪个产品更好用，哪个生态更完善”。以下是最新的全局态势：1.三大闭源巨头的“产品全家桶”之争竞争已经不再是单一模型的对决，而是平台级、生态级的对抗。OpenAI、Google和Anthropic的产品线都已成型，并展现出清晰的战略分野。公司(Company)核心
Electron 菜单系统深度解析：从基础到高级实践斯~内克 Electron electron javascript 前端
一、Electron菜单体系架构1.1菜单系统的核心组成Electron的菜单系统由三大核心模块构成：应用菜单（ApplicationMenu）：位于窗口顶部的全局菜单栏（Windows/Linux）或系统菜单栏（macOS）上下文菜单（ContextMenu）：右键触发的上下文相关菜单托盘菜单（TrayMenu）：系统托盘区的弹出式菜单1.2多平台适配差异特性WindowsmacOSLinux菜
2025年中总结 Just Jump 人生经历思考反思认知方法 2025年中总结
2025年中总结。一如往年惯例，总结近半年工作中的体悟和经验。一、把大而难的事拆解成小而具体的小目标。专注解决小目标，每周迭代交付，先完成再完善。1.1把大任务拆解成具体可执行的小目标2025年5月起我开始做大模型相关的技术调研、技术升级和开发工作。传统的机器学习、深度学习算法和大模型的算法在技术知识上还是有很大的差异的。想要快速转型使用大模型做开发、训练，是需要些时间和精力投入的，这并不是一个简
AI人工智能中LSTM在视频行为识别的应用
AI人工智能中LSTM在视频行为识别的应用关键词：LSTM、视频行为识别、深度学习、时序建模、计算机视觉、神经网络、动作识别摘要：本文将深入探讨LSTM（长短期记忆网络）在视频行为识别领域的应用。我们将从基础概念出发，逐步讲解LSTM如何解决视频时序建模的挑战，分析其核心算法原理，并通过实际代码示例展示LSTM在行为识别中的具体实现。文章还将探讨当前的应用场景、工具资源以及未来发展趋势，为读者提供
API编排在AI原生应用中的5大核心应用场景解析
API编排在AI原生应用中的5大核心应用场景解析关键词：API编排、AI原生应用、微服务架构、工作流自动化、服务集成、智能决策、实时数据处理摘要：本文深入探讨API编排在AI原生应用中的核心应用场景，揭示其如何成为连接智能服务的关键纽带。我们将从基础概念出发，通过5个典型场景分析，展示API编排如何提升AI应用的灵活性、可扩展性和智能化水平，并辅以实际代码示例和架构图解。背景介绍目的和范围本文旨在
多模态AI：让机器像人一样“全感官”理解世界 Echo_Wish 前沿技术人工智能人工智能
多模态AI：让机器像人一样“全感官”理解世界咱们人类理解世界，从来不是只靠单一感官：眼睛看到画面，耳朵听到声音，皮肤感受到温度，嘴巴尝到味道，甚至鼻子闻到气味。正是这多感官的“多模态”输入，构筑了我们对复杂世界的深刻认知。而人工智能领域的多模态学习（MultimodalLearning），正是让机器拥有“多感官”理解能力的技术突破。今天，我想跟大家聊聊：多模态学习为何重要？当前有哪些创新模型？如何
车载毫米波雷达行业发展5——企业奔袭的算法工程师行业资讯人工智能自动驾驶目标检测
5.1博世5.1.1公司简介博世集团创立于1886年，业务涵盖汽车与智能交通技术、工业技术、消费品、能源与建筑技术四大领域，是德国最大的工业企业之一、全球最大的汽车零部件供应商、最早研究车载毫米波雷达的企业之一。博世在高级辅助驾驶和自动驾驶上拥有业界最为领先和完整的产品线，也是智能驾驶行业发展的风向标。在中国市场，2022年，博世在前向雷达市场的份额为40.54%，占据着国内前雷达市场第一的位置。
【PaddleOCR】快速集成 PP-OCRv5 的 Python 实战秘籍--- PaddleOCR实例化 OCR 对象的参数介绍云天徽上 PaddleOCR python ocr 开发语言人工智能文字识别
博主简介：曾任某智慧城市类企业算法总监，目前在美国市场的物流公司从事高级算法工程师一职，深耕人工智能领域，精通python数据挖掘、可视化、机器学习等，发表过AI相关的专利并多次在AI类比赛中获奖。CSDN人工智能领域的优质创作者，提供AI相关的技术咨询、项目开发和个性化解决方案等服务，如有需要请站内私信或者联系任意文章底部的的VX名片（ID：xf982831907）博主粉丝群介绍：①群内初中生、
提高 Xcode 编译速度方法大总结 SwiftFun ios ios开发 xcode swift ios objective-c
怎样测量编译时间消耗在最新版本的Xcode中，编译后查看ReportNavigator面板，点击刚刚的那次编译，即可查看到整个编译流程，以及每一步的耗时。右键点击任意一个步骤，选择ShowInTimeline可打开一个时间线面板，在实现面板中，可以查看到编译的各个步骤，包括PreparePackages、Planbuild、Createbuilddescription等，可以通过每个条目的长度直观
镍钯金 vs 电金工艺：猎板PCB如何以技术创新重塑高端电子制造？猎板PCB黄浩人工智能
在高端电子制造领域，PCB表面处理工艺的可靠性直接决定了产品的性能和寿命。镍钯金（ENEPIG）与电金（ElectroplatedGold）作为两种核心工艺，长期占据行业技术制高点。猎板PCB凭借在特殊工艺领域的深耕，通过镍钯金与电金的精准匹配，解决了5G通信、汽车电子等场景的痛点问题。本文将从性能对比、技术突破与行业实践三大维度，解析猎板PCB如何以工艺创新推动产业升级。一、性能对比：镍钯金与电
最新人工智能硬件培训AI基础入门学习课程参考2025版（离线AI语音视觉识别篇）聆思科技AI芯片聆思大模型开发板实践分享语音识别人机交互人工智能视觉检测嵌入式硬件 mcu AI编程
前言端侧离线AI智能硬件作为AI技术的重要载体之一，凭借其无需依赖网络即可实现智能功能的特性，在一些网络条件受限或对数据隐私有较高要求的场景中，发挥着不可或缺的作用。本章基于CSK6大模型语音视觉开发板开箱即用的离线AI能力，分类列出学习课程知识点和实操参考，希望能够帮助大家快速掌握离线AI智能硬件的基础知识与实战技能，同时了解相关AI技术在实际场景的应用情况。正文按入下框架展开，相关理论和实操除
最新人工智能硬件培训AI 基础入门学习课程参考2025版（大模型篇）聆思科技AI芯片聆思大模型开发板实践分享大模型语音交互人工智能语音识别视觉检测 AI编程人机交互
前言在人工智能大模型重塑教育与社会发展的当下，无论是探索未来职业方向，还是更新技术储备，掌握大模型知识都已成为新时代的必修课。从职场上辅助工作的智能助手，到课堂用于学术研究的智能工具，大模型正在工作生活教育等领域发挥着越来越重要的作用。针对日前前来咨询的广大客户对面向大模型智能硬件的学习需求，我们根据CSK6大模型语音视觉开发板已有功能，整理了一份适合基于本开发板进行教学活动的学习课程参考给大家备
Java线程安全集合类 paishishaba java 开发语言
目录概述主要线程安全集合类及对比1.List系列2.Map系列3.Set系列4.Queue系列核心区别与选择标准使用场景案例实践建议概述Java集合框架提供了多种线程安全的集合实现，主要分为三大类：早期线程安全集合：Vector、Hashtable同步包装集合：Collections.synchronizedXxx()并发集合：java.util.concurrent包下的实现主要线程安全集合类及
创客匠人：不是用户眼瞎,是你卖课的方法不对 | 产品篇
在知识付费领域，不少从业者常困惑于课程滞销的问题。事实上，用户并非缺乏消费能力，而是商家未能构建有效的价值认知体系。继上期探讨产品设计后，本期将深入解析定价策略的底层逻辑与实践方法，帮助从业者突破销售瓶颈。定价的底层逻辑：价值认知的三重维度消费者对产品的价格判断，本质上由其价值认知决定，具体受三大因素影响：需求强度的刚性特征刚需产品往往具备天然的定价优势。如“双减”前的教育，父母对孩子教育的焦虑形
卓力达蚀刻工艺：精密制造的跨行业赋能者 NantongZhuoLIDa-Chen 南通卓力达蚀刻加工蚀刻金属蚀刻蚀刻厂家蚀刻工艺
引言蚀刻技术作为现代精密制造的核心工艺之一，通过化学或物理方法对金属材料进行选择性去除，实现微米级复杂结构的加工。南通卓力达凭借20余年技术积淀与全产业链布局，成为全球高端制造领域的重要支撑力量。本文将从蚀刻技术的多领域应用与卓力达的核心优势两大维度展开解析。一、蚀刻技术的多元化应用场景消费电子领域折叠屏设备：通过0.02-0.04mm超薄不锈钢蚀刻，制造折叠屏金属中板，满足30万次弯折无断裂的严
算法: 冒泡排序 Code溪算法 java 算法数据结构
冒泡排序是一种简单的排序算法，通过相邻元素的比较和交换，使较大的元素逐渐"浮"到数组末尾。时间复杂度:最佳O(n)|平均O(n²)|最差O(n²)空间复杂度:O(1)稳定性:稳定应用场景/前提条件适用于小规模数据对几乎已排序的数据效率较高算法步骤比较相邻的元素。如果第一个比第二个大，就交换它们对每一对相邻元素做同样的工作，从开始第一对到结尾的最后一对这步做完后，最后的元素会是最大的数针对所有的元素
洞洞鞋品牌”Crocs卡骆驰”OMS系统升级项目完美交付，商派团队喜获客户感谢信徐礼昭｜商派软件市场负责人 B2B商城零售商派OMS
图片：Crocs官网引言：Crocs（卡骆驰）OMS系统升级项目成功通过618大促考验，商派项目团队喜获客户发来的感谢信！——随着2025年618大促活动的圆满落幕，商派与知名洞洞鞋品牌——Crocs（卡骆驰）合作的Crocs-商派OMS系统升级项目，成功通过了大流量与多次业务调整的双重考验，标志着这一数字化升级项目取得了里程碑式的胜利。为此，Crocs团队特地向商派项目团队发来了感谢信。客户表示
从零开始大模型开发与微调：PyTorch中的卷积函数实现详解 AI天才研究院 AI人工智能与大数据 AI大模型企业级应用开发实战计算计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
从零开始大模型开发与微调：PyTorch中的卷积函数实现详解1.背景介绍1.1大模型开发的意义1.2卷积神经网络在大模型中的应用1.3PyTorch框架简介2.核心概念与联系2.1卷积的数学定义2.2卷积神经网络的组成2.2.1卷积层2.2.2池化层2.2.3全连接层2.3卷积与大模型的关系3.核心算法原理具体操作步骤3.1卷积的前向传播3.2卷积的反向传播3.3卷积的优化策略3.3.1卷积核大小
【Spring AI】 1接入 Ollama实践占星安啦 springai java springai ollama
SpringAI接入Ollama实践学习笔记Ollama官方文档SpringAI快速开始SpringAIOllama集成文档1.pom.xml依赖配置前置条件：请确保你已安装好Java17+、Maven、Ollama，并已下载好所需大模型。在pom.xml中添加SpringAI及Ollama相关依赖：org.springframework.bootspring-boot-starter-webor
WEB攻防-Java安全&JNDI&RMI&LDAP&五大不安全组件&RCE执行&不出网教IT的小强前端 java 安全
#知识点：1、Java安全-RCE执行-5大类函数调用2、Java安全-JNDI注入-RMI&LDAP&高版本3、Java安全-不安全组件(框架)-Shiro&FastJson&Jackson&XStream&Log4j一、演示案例-Java安全-RCE执行-5大类函数调用1、GroovyExec![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/38c
YOLOv11性能评估全解析：从理论到实战的指标指南芯作者 D2:YOLO YOLO 计算机视觉
深入剖析目标检测核心指标，掌握模型优化的关键密码为什么需要性能评估指标？在目标检测领域，YOLO系列模型以其卓越的速度-精度平衡成为行业标杆。当我们训练或使用YOLOv11模型时，一个核心问题始终存在：如何量化模型的性能？性能评估指标正是回答这个问题的关键工具，它们不仅衡量模型效果，更是模型优化迭代的导航灯。本文将系统解析YOLOv11的七大核心评估指标，结合理论公式、可视化解释和实战代码，带您深
深度剖析数据中台：大数据领域的核心技术架构大数据洞察大数据架构 java ai
深度剖析数据中台：大数据领域的核心技术架构关键词：数据中台、大数据、核心技术架构、数据治理、数据服务摘要：本文旨在对数据中台这一大数据领域的核心技术架构进行深度剖析。首先介绍了数据中台的背景，包括其目的、适用读者、文档结构和相关术语。接着阐述了数据中台的核心概念、原理和架构，通过文本示意图和Mermaid流程图进行直观展示。详细讲解了核心算法原理及具体操作步骤，并结合Python源代码进行说明。引
飞算JavaAI 2.0.0深度测评：自然语言编程如何重构开发生产力？知识产权13937636601 计算机 Java
摘要2025年自然语言编程（NLPProgramming）迎来工业化拐点，飞算JavaAI2.0.0以语义理解精度＞92%、企业级代码生成通过率＞87%的核心能力，正在重构Java开发范式。本文通过电商、金融、工业物联网三大场景实测，揭秘其如何实现需求描述到可部署代码的端到端转化。数据显示：复杂业务模块开发效率提升3-8倍，逻辑缺陷率降低70%，同时提供语义级安全审计、架构腐化预警等独家能力，为传
汽车轮速测量专用轮速传感器 EVERSPIN 汽车传感器轮速传感器
RAMSUN提供一款高度集成的主动式轮速传感器，它在一个超小型封装内集成了AMR磁传感器和高精度CMOS处理电路以及滤波电容，同时在封装体表面安装一个永磁背磁铁，因此客户不需要PCB贴片，可直接与多极磁环配合使用。基于各向异性磁阻（AMR）的工作原理，具有高灵敏度、低抖动、大的工作气隙和宽的工作温度范围等优点，可实时提供轮速、转向、工作气隙等关键信息。由于具有极低的jitter，因此非常适合于间接
2025年全球数据安全发展趋势 jinan886 人工智能大数据安全数据分析
随着云计算、大数据、人工智能等技术的迅猛发展，数据已成为驱动经济社会发展的关键生产要素。然而，数据泄露、网络攻击等安全事件频发，给个人隐私、企业利益乃至国家安全带来了前所未有的挑战。全球数据安全发展趋势正随着技术进步和威胁演变而不断变化，以下是主要趋势：1.数据隐私法规加强GDPR（欧盟《通用数据保护条例）和CCPA（加州消费者隐私法案）等法规推动了全球对数据隐私的重视，更多国家和地区正在制定或更
近百万奖金！2024 Web3.0 创新大赛重磅来袭！ DataFountain数据科学 web3 数据竞赛大数据人工智能
10月30日，中国互联网协会与香港Web3.0协会共同组织举办的2024Web3.0创新大赛在上海举行启动会，宣布大赛正式在DataFountain竞赛平台（简称DF平台，http://www.datafountain.cn）启动上线。大赛面向社会各界征集参赛团队，不限年龄、国籍，高校、科研院所、企业人员均可参赛！两大赛区，六大赛道，近百万奖金，你不来吗：https://www.datafount
使用Chaindesk进行简单高效的文档检索 2501_92325368 langchain
##技术背景介绍Chaindesk是一个开源的文档检索平台，它帮助将个人数据与大型语言模型结合起来，实现高效的信息搜索和数据分析。Chaindesk的核心功能是通过创建数据存储库(datastore)并与大型语言模型进行交互，以提供快捷准确的文档检索能力。##核心原理解析Chaindesk通过一种称为Retriever的组件实现数据检索。Retriever可以与不同的数据存储库进行交互，拉取相关文
家装设计师必存：2025年5大爆火环保建材避坑指南渲吧-云渲染 3d
选材如战场，既要环保潮流，又要规避陷阱。今天深度剖析5种高热度环保建材，从性能短板到施工要点，助你专业提案，底气十足。一、竹材：速生之美，细节定成败优势：3年速生，抗弯强度超松木40%，耐用环保。碳化竹材打造水墨纹理背景墙，成本比实木省30%。避坑：南方潮湿环境必须选择“高温碳化+环保清漆”处理板材，甲醛释放量需5℃（避免成膜不均）。创意应用：衣柜内贴生物基防潮膜（香樟木粉改性款天然防虫），儿童房
统一思想认识永夜-极光思想
1.统一思想认识的基础,才能有的放矢原因: 总有一种描述事物的方式最贴近本质,最容易让人理解. 如何让教育更轻松,在于找到最适合学生的方式. 难点在于,如何模拟对方的思维基础选择合适的方式. &
Joda Time使用笔记 bylijinnan java joda time
Joda Time的介绍可以参考这篇文章： http://www.ibm.com/developerworks/cn/java/j-jodatime.html 工作中也常常用到Joda Time，为了避免每次使用都查API，记录一下常用的用法： /** * DateTime变化（增减） */ @Tes
FileUtils API eksliang FileUtils FileUtils API
转载请出自出处：http://eksliang.iteye.com/blog/2217374 一、概述这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。非常的好用。
各种新兴技术不懂事的小屁孩技术
1:gradle Gradle 是以 Groovy 语言为基础，面向Java应用为主。基于DSL（领域特定语言）语法的自动化构建工具。现在构建系统常用到maven工具，现在有更容易上手的gradle，搭建java环境: http://www.ibm.com/developerworks/cn/opensource/os-cn-gradle/ 搭建android环境： http://m
tomcat6的https双向认证酷的飞上天空 tomcat6
1.生成服务器端证书 keytool -genkey -keyalg RSA -dname "cn=localhost,ou=sango,o=none,l=china,st=beijing,c=cn" -alias server -keypass password -keystore server.jks -storepass password -validity 36
托管虚拟桌面市场势不可挡蓝儿唯美
用户还需要冗余的数据中心，dinCloud的高级副总裁兼首席营销官Ali Din指出。该公司转售一个MSP可以让用户登录并管理和提供服务的用于DaaS的云自动化控制台，提供服务或者MSP也可以自己来控制。在某些情况下，MSP会在dinCloud的云服务上进行服务分层，如监控和补丁管理。 MSP的利润空间将根据其参与的程度而有所不同，Din说。 “我们有一些合作伙伴负责将我们推荐给客户作为个
spring学习——xml文件的配置 a-john spring
在Spring的学习中，对于其xml文件的配置是必不可少的。在Spring的多种装配Bean的方式中，采用XML配置也是最常见的。以下是一个简单的XML配置文件： <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.or
HDU 4342 History repeat itself 模拟 aijuans 模拟
来源：http://acm.hdu.edu.cn/showproblem.php?pid=4342 题意：首先让求第几个非平方数，然后求从1到该数之间的每个sqrt(i)的下取整的和。思路：一个简单的模拟题目，但是由于数据范围大，需要用__int64。我们可以首先把平方数筛选出来，假如让求第n个非平方数的话，看n前面有多少个平方数，假设有x个，则第n个非平方数就是n+x。注意两种特殊情况，即
java中最常用jar包的用途 asia007 java
java中最常用jar包的用途 jar包用途axis.jarSOAP引擎包commons-discovery-0.2.jar用来发现、查找和实现可插入式接口，提供一些一般类实例化、单件的生命周期管理的常用方法.jaxrpc.jarAxis运行所需要的组件包saaj.jar创建到端点的点到点连接的方法、创建并处理SOAP消息和附件的方法，以及接收和处理SOAP错误的方法. w
ajax获取Struts框架中的json编码异常和Struts中的主控制器异常的解决办法百合不是茶 js json编码返回异常
一:ajax获取自定义Struts框架中的json编码出现以下问题: 1,强制flush输出 json编码打印在首页 2, 不强制flush js会解析json 打印出来的是错误的jsp页面却没有跳转到错误页面 3, ajax中的dataType的json 改为text 会
JUnit使用的设计模式 bijian1013 java 设计模式 JUnit
JUnit源代码涉及使用了大量设计模式 1、模板方法模式（Template Method）定义一个操作中的算法骨架，而将一些步骤延伸到子类中去，使得子类可以不改变一个算法的结构，即可重新定义该算法的某些特定步骤。这里需要复用的是算法的结构，也就是步骤，而步骤的实现可以在子类中完成。
Linux常用命令（摘录） sunjing crond chkconfig
chkconfig --list 查看linux所有服务 chkconfig --add servicename 添加linux服务 netstat -apn | grep 8080 查看端口占用 env 查看所有环境变量 echo $JAVA_HOME 查看JAVA_HOME环境变量安装编译器 yum install -y gcc
【Hadoop一】Hadoop伪集群环境搭建 bit1129 hadoop
结合网上多份文档，不断反复的修正hadoop启动和运行过程中出现的问题，终于把Hadoop2.5.2伪分布式安装起来，跑通了wordcount例子。Hadoop的安装复杂性的体现之一是，Hadoop的安装文档非常多，但是能一个文档走下来的少之又少，尤其是Hadoop不同版本的配置差异非常的大。Hadoop2.5.2于前两天发布，但是它的配置跟2.5.0，2.5.1没有分别。 &nb
Anychart图表系列五之事件监听白糖_ chart
创建图表事件监听非常简单：首先是通过addEventListener('监听类型',js监听方法)添加事件监听，然后在js监听方法中定义具体监听逻辑。以钻取操作为例，当用户点击图表某一个point的时候弹出point的name和value，代码如下： <script> //创建AnyChart var chart = new AnyChart(); //添加钻取操作&quo
Web前端相关段子 braveCS web前端
Web标准：结构、样式和行为分离使用语义化标签 0）标签的语义：使用有良好语义的标签，能够很好地实现自我解释，方便搜索引擎理解网页结构，抓取重要内容。去样式后也会根据浏览器的默认样式很好的组织网页内容，具有很好的可读性，从而实现对特殊终端的兼容。 1）div和span是没有语义的：只是分别用作块级元素和行内元素的区域分隔符。当页面内标签无法满足设计需求时，才会适当添加div
编程之美-24点游戏 bylijinnan 编程之美
import java.util.ArrayList; import java.util.Arrays; import java.util.HashSet; import java.util.List; import java.util.Random; import java.util.Set; public class PointGame { /**编程之美
主页面子页面传值总结 chengxuyuancsdn 总结
1、showModalDialog returnValue是javascript中html的window对象的属性,目的是返回窗口值,当用window.showModalDialog函数打开一个IE的模式窗口时,用于返回窗口的值主界面 var sonValue=window.showModalDialog("son.jsp"); 子界面 window.retu
[网络与经济]互联网+的含义 comsci 互联网+
互联网+后面是一个人的名字 = 网络控制系统互联网+你的名字 = 网络个人数据库每日提示:如果人觉得不舒服,千万不要外出到处走动,就呆在床上,玩玩手游,更不能够去开车,现在交通状况不
oracle 创建视图 with check option daizj 视图 view oralce
我们来看下面的例子： create or replace view testview as select empno,ename from emp where ename like ‘M%’ with check option; 这里我们创建了一个视图，并使用了with check option来限制了视图。然后我们来看一下视图包含的结果： select * from testv
ToastPlugin插件在cordova3.3下使用 dibov Cordova
自己开发的Todos应用，想实现“ 再按一次返回键退出程序 ”的功能，采用网上的ToastPlugins插件，发现代码或文章基本都是老版本，运行问题比较多。折腾了好久才弄好。下面吧基于cordova3.3下的ToastPlugins相关代码共享。 ToastPlugin.java package&nbs
C语言22个系统函数 dcj3sjt126com c function
C语言系统函数一、数学函数下列函数存放在math.h头文件中Double floor(double num) 求出不大于num的最大数。Double fmod(x, y) 求整数x/y的余数。Double frexp(num, exp); double num; int *exp; 将num分为数字部分（尾数）x和以2位的指数部分n，即num=x*2n，指数n存放在exp指向的变量中，返回x。D
开发一个类的流程 dcj3sjt126com 开发
本人近日根据自己的开发经验总结了一个类的开发流程。这个流程适用于单独开发的构件，并不适用于对一个项目中的系统对象开发。开发出的类可以存入私人类库，供以后复用。以下是开发流程： 1. 明确类的功能，抽象出类的大概结构 2. 初步设想类的接口 3. 类名设计（驼峰式命名） 4. 属性设置(权限设置) 判断某些变量是否有必要作为成员属
java 并发 shuizhaosi888 java 并发
能够写出高伸缩性的并发是一门艺术在JAVA SE5中新增了3个包 java.util.concurrent java.util.concurrent.atomic java.util.concurrent.locks 在java的内存模型中，类的实例字段、静态字段和构成数组的对象元素都会被多个线程所共享，局部变量与方法参数都是线程私有的，不会被共享。
Spring Security（11）——匿名认证 234390216 Spring Security ROLE_ANNOYMOUS 匿名
匿名认证目录 1.1 配置 1.2 AuthenticationTrustResolver 对于匿名访问的用户，Spring Security支持为其建立一个匿名的AnonymousAuthenticat
NODEJS项目实践0.2[ express,ajax通信...] 逐行分析JS源代码 Ajax nodejs express
一、前言通过上节学习，我们已经 ubuntu系统搭建了一个可以访问的nodejs系统，并做了nginx转发。本节原要做web端服务及 mongodb的存取，但写着写着，web端就
在Struts2 的Action中怎样获取表单提交上来的多个checkbox的值 lhbthanks java html struts checkbox
第一种方法：获取结果String类型在 Action 中获得的是一个 String 型数据，每一个被选中的 checkbox 的 value 被拼接在一起，每个值之间以逗号隔开(,)。所以在 Action 中定义一个跟 checkbox 的 name 同名的属性来接收这些被选中的 checkbox 的 value 即可。以下是实现的代码：前台 HTML 代码：
003.Kafka基本概念 nweiren hadoop kafka
Kafka基本概念：Topic、Partition、Message、Producer、Broker、Consumer。 Topic：消息源（Message）的分类。 Partition： Topic物理上的分组，一
Linux环境下安装JDK roadrunners jdk linux
1、准备工作创建JDK的安装目录： mkdir -p /usr/java/ 下载JDK，找到适合自己系统的JDK版本进行下载： http://www.oracle.com/technetwork/java/javase/downloads/index.html 把JDK安装包下载到/usr/java/目录，然后进行解压： tar -zxvf jre-7
Linux忘记root密码的解决思路 tomcat_oracle linux
1：使用同版本的linux启动系统，chroot到忘记密码的根分区passwd改密码　　2：grub启动菜单中加入init=/bin/bash进入系统，不过这时挂载的是只读分区。根据系统的分区情况进一步判断. 　　3: grub启动菜单中加入 single以单用户进入系统. 　　4:用以上方法mount到根分区把/etc/passwd中的root密码去除　　例如: 　　ro
跨浏览器 HTML5 postMessage 方法以及 message 事件模拟实现 xueyou jsonp jquery 框架 UI html5
postMessage 是 HTML5 新方法，它可以实现跨域窗口之间通讯。到目前为止，只有 IE8+, Firefox 3, Opera 9, Chrome 3和 Safari 4 支持，而本篇文章主要讲述 postMessage 方法与 message 事件跨浏览器实现。postMessage 方法 JSONP 技术不一样，前者是前端擅长跨域文档数据即时通讯，后者擅长针对跨域服务端数据通讯，p