AI筑梦师

用 5 条数据搞定行业专家模型：Few-shot Prompt × 微调联合实战指南

第1章：大模型时代的“以少胜多”范式正在崛起

过去的AI世界强调“数据驱动一切”：大模型靠海量数据训练才能“变聪明”，而微调也总被认为需要成千上万条样本。可现实是，大多数企业、开发者根本没有这些“量级”的资源。

但如今，有种趋势在悄悄逆袭：

用极少样本，微调出强专家。

这不是口号，而是已经被验证过的工程范式：
Few-shot Prompt + LoRA 微调的组合打法，已经在多个领域（财税、政务、法律、教育）中获得惊人的效果。

为什么“以少胜多”成为主流？

数据合规压力更大了
- 自建大规模数据集越来越难，数据标注、人力成本高。
- 合规法规（如《生成式AI管理办法》《GDPR》）让“随便抓数据”成为风险源。
业务定制化需求上升
- 企业希望模型说“自己行业的话”，而不是泛泛其谈。
- 个性化领域模型的“小定制”成为主战场。
大模型原生能力强，少样本足够激发潜力
- 比如：Qwen2.5-7B、DeepSeek-V2、Baichuan2-13B，甚至不开微调，仅靠 Few-shot Prompt 就能实现行业答题水平。

微调方式对比（成本 × 数据 × 适用性）

模型定制方式	数据需求	计算资源	特点	适用场景
全参数微调	上万到百万	非常高	最彻底的改写方式	模型预训练阶段、自研大厂
LoRA 微调	几百～几千	中等	插入可学习层、成本低	企业级小定制
Prompt Fine-tuning	5条起步	极低	不改模型、不需训练	快速测试、低门槛接入
联合策略（推荐）	5～500条	低-中	Prompt + LoRA 效果叠加	多轮交互、RAG接入

核心观点：你不需要几十万数据，只要几十条设计良好的“黄金样本”，就能训练出行业专家模型。

✅ 我们要解决什么问题？

本系列文章将围绕一个目标展开：

用尽可能少的样本（5~100条），训练出能够在特定领域回答问题、辅助决策、甚至写文档的专家模型。

涉及三种核心策略：

✍️ Prompt Few-shot（模板 + 上下文控制 + 多示例）
LoRA 微调（轻量调参 + 局部记忆建模）
Prompt + 微调联合优化（从短期试用到长期部署）

第2章：什么是 Few-shot Prompt？为什么它能打？

“Few-shot Prompt”说白了就是这样一个策略：

我不给你训练，只给你几个例子，看你能不能举一反三。

这正是大模型与传统机器学习最大的差异：它们具备了强大的**“上下文学习”能力（In-context Learning）**，你只要“喂得巧”，它就能“学得好”。

Prompt 类型快速扫盲

类型	描述	示例数	是否训练模型
Zero-shot	不提供示例，直接提问	0	否
Few-shot	提供2~5个类似问题的问答示例	2~5	否
CoT Prompt	加入“推理链”或步骤展示	2~10	否
Fine-tune	用大量数据训练模型参数	上千	是

我们关注的核心是：Few-shot Prompt + 自定义结构设计 + 模型能力激活

✳️ Few-shot Prompt 的结构组成

一个高质量 Few-shot Prompt 通常具备以下结构：

【系统提示】你是一位领域专家，请准确回答用户提出的相关问题。

问：公司发年终奖需要缴哪些税？
答：需要代扣代缴个人所得税，按“全年一次性奖金”计税方式处理。

问：购买二手房要交哪些税？
答：通常包括契税、增值税和个税，具体情况视房产年限与类型而定。

问：{{用户实际问题}}
答：

我们要特别注意三个重点：

示例选择需代表高频 / 边界 / 歧义
上下文长度控制 ≤ 模型输入限制（2K / 4K / 32K Token）
不要有“教学口吻”，要保持自然问答语气

Prompt 效果优化技巧汇总

技巧类型	操作建议
示例选择	优先选高频问题、用户常错问题、易混淆问题
顺序优化	将最重要的问题排前、弱问题排后，提升模型激活路径
多样化改写	同一问题用不同语气说法构建 Prompt，避免模型“记死答案”
标签型提示设计	明确指定“角色”/“知识类型”/“输出结构”，如“你是财税专家”
样本标签隐式化	将问题难度/分类标签加入提示中，如“复杂问题：…”

Prompt 工具推荐（可编排）

你可以通过简单的 Python 模板系统来生成高质量 Prompt，以下是一个最简实战版：

def build_prompt(role: str, examples: list, user_question: str):
    prompt = f"你是{role}，请准确回答以下问题。\n\n"
    for ex in examples:
        prompt += f"问：{ex['q']}\n答：{ex['a']}\n\n"
    prompt += f"问：{user_question}\n答："
    return prompt

第3章：如何构建高质量 Few-shot 数据集？

Few-shot Prompt 好不好，不在于你写了多少，而在于你写得是否有代表性。
构建 Few-shot 数据的核心目标是：

用极少数样本，覆盖最大范围的用户真实提问场景，并引导模型输出“符合你期待”的答案风格。

本章我们就来拆解这件事，提供可操作的方案、样本结构与构建流程。

什么是“高质量 Few-shot 样本”？

我们不求量，而求“质”：

✳️ 能覆盖高频问题 → 保证模型覆盖主干业务
✳️ 能覆盖边界问题 → 避免“翻车”
✳️ 能体现回答风格 → 控制答题逻辑、格式、语气

比如对于“财税领域”，你要挑选：

高频场景：发工资、报销、买房
容易答错：税率适用、临界情况
需要格式化输出：列出条目、附法规条文

✅ Few-shot 示例结构推荐

字段	说明	示例
`instruction`	问题描述/任务指令	“请告诉我该场景应缴哪些税？”
`input`	问题上下文（可选）	“我在北京卖掉了一套自住房。”
`output`	答案/行为期望	“需要缴纳契税，符合减免条件可申请免税。”

推荐标准化格式如下（JSONL 每行为一组样本）：

{"instruction": "公司年终奖需交哪些税？", "input": "", "output": "需缴纳个税，按照全年一次性奖金计税方式处理。"}

️ 构建策略：从真实数据出发

采集历史问答
- 来源：客服记录 / 用户提问 / 搜索日志
- 工具：Excel + 正则 + OpenAI / DeepSeek 清洗摘要
分类聚合
- 类目：高频、边界、易混
- 技巧：每类挑 1~3 个代表示例即可
语义去重 + 多样改写
- 方法：相似问法归并（如“要交哪些税”和“哪些税要交”）
- 可引入 paraphrase 模型自动改写
格式规范 + 样式控制
- 保证回答一致性（口吻、是否分点、是否引用法规）

一个黄金示例组（Prompt-ready）

[
  {
    "instruction": "公司发年终奖要交哪些税？",
    "output": "需要代扣代缴个人所得税，按“全年一次性奖金”计税方法处理。"
  },
  {
    "instruction": "卖二手房需要缴哪些税？",
    "output": "通常包括契税、增值税和个税，视房屋年限和是否唯一住房决定。"
  },
  {
    "instruction": "离职补偿金要交税吗？",
    "output": "在合理补偿范围内免税，超额部分需缴纳个人所得税。"
  }
]

常见误区

误区	正确做法
示例太泛	选“业务高频+易混”才有价值
示例太长或过短	控制在 100~300 字为佳
回答风格前后不一致	统一回答口吻（如是否列举）
输入输出内容结构混乱	保持 instruction / output 区分

第4章：如何基于 Few-shot 构建领域模型（Zero Fine-tune）

如果你现在有了 3~5 组高质量的领域问题示例，恭喜你，你就能立即构建一个“行业模型的原型版本”，完全不需要微调。

这就是 Prompt 的力量。

Prompt 结构模板（推荐格式）

你是一位{{领域}}专家，请根据已有示例回答用户提问：

问：{{示例问题1}}  
答：{{示例答案1}}

问：{{示例问题2}}  
答：{{示例答案2}}

问：{{用户实际问题}}  
答：

每组 Prompt 控制在 800～1200 tokens 内，避免截断。建议使用 2～4 个示例问题最佳。

️ 自动化构建脚本（Python）

你可以很快搭出一个 Prompt 构造引擎：

def build_fewshot_prompt(role, examples, user_input):
    prompt = f"你是一位{role}，请根据示例回答用户提问：\n\n"
    for ex in examples:
        prompt += f"问：{ex['instruction']}\n答：{ex['output']}\n\n"
    prompt += f"问：{user_input}\n答："
    return prompt

你可以把它接到任何大模型 API 上，比如：

from openai import OpenAI

prompt = build_fewshot_prompt("财税专家", fewshot_examples, "个人卖房需要交什么税？")
response = OpenAI().chat(prompt=prompt)

Prompt 效果评估指标

维度	说明
相关性	回答是否与问题紧密相关
正确性	回答是否包含真实可靠的信息
一致性	回答风格是否统一、语气是否稳定
灵活性	是否支持用户输入不同问法仍能答对

实操建议：

构建一组10条测试集，覆盖用户不同输入风格
用原始模型 vs Few-shot Prompt 模型输出比对
每条打分 1~5 分，记录平均得分

Few-shot Prompt 的上线策略

阶段	操作
本地评估	多组 Prompt + 多组输入交叉对比输出效果
实验环境	用 Prompt API 接入业务系统灰度流量
动态切换	支持 A/B Prompt 切换、更新 Prompt 版本
长期演进	用户反馈回收 → 更新示例 → Prompt 自学习

第5章：如何用极少样本进行 LoRA 微调

Prompt 很强，但有两个“隐形问题”：

每次调用都要带入上下文（token 浪费、输入麻烦）
无法真正“记住”新知识，表现不稳定

而轻量级的 LoRA 微调，刚好可以把 Prompt 中的知识固化进模型本体，从“临时激发”进化成“永久记忆”。

LoRA 微调的本质是什么？

全量微调（Fine-tune）会动模型上百亿个参数，成本高、过拟合风险大。而 LoRA（Low-Rank Adaptation）策略的核心是：

只训练少数插入层参数，把新知识“外挂”到已有大模型上。

优点很明确：

优势	说明
速度快	通常几十分钟内完成微调
不改模型结构	插入权重不影响原模型参数
存储省	LoRA 文件通常 < 300MB
可热插拔	Prompt 不变时直接加载 LoRA 权重动态生效

✅ 推荐配置（适配国产模型）

项目	推荐值	说明
LoRA R 值	8	控制微调参数量，4~16之间常用
LoRA α 值	16	缩放比例
Dropout	0.05	防止过拟合
Epoch	3~5	小样本情况下不要过多
Batch size	2~4	显存决定上限
学习率	2e-4 ～ 5e-5	建议线性 warmup，配合 scheduler

数据准备格式（标准SFT格式）

使用 HuggingFace / Swift 微调框架时，需将 Few-shot Prompt 转为统一格式，如：

{
  "instruction": "公司发年终奖要交哪些税？",
  "input": "",
  "output": "需要代扣代缴个人所得税，按“全年一次性奖金”计税方法处理。"
}

转换为训练语料（推荐模板）：

用户：公司发年终奖要交哪些税？
助手：需要代扣代缴个人所得税，按“全年一次性奖金”计税方法处理。

️ Swift 框架微调示例（适配 DeepSeek/Qwen2.5）

from datasets import load_dataset
from swift.tuners import SwiftModel

model = SwiftModel.from_pretrained("deepseek-ai/deepseek-7b")
dataset = load_dataset("json", data_files="fewshot_data.json")

model.finetune(
    train_dataset=dataset,
    lora_r=8,
    lora_alpha=16,
    lora_dropout=0.05,
    epochs=3,
    batch_size=2,
    lr=5e-5
)

输出模型保存位置下，会生成：

adapter_model.bin：LoRA 权重
config.json：LoRA 结构定义
tokenizer_config.json：兼容原模型 tokenizer

常见微调坑位排查

问题症状	可能原因
输出格式错乱	训练样本格式不统一 / 不清楚回答边界
输出“记不住”	示例量太少 or Prompt 输入不清晰
微调后表现变差	LoRA 学习率过高 / Epoch 过多导致过拟合
微调文件太大 / 无法部署	没有使用正确的 adapter-only 保存方式

第6章：实战对比测试：原始模型 vs Few-shot vs 微调后

你写的代码训练完了，模型也跑通了。那效果到底怎么样？本章我们来实测三种方式输出的实际效果差异，从多个维度给出对比分析。

对比测试样本

以“财税领域”示例测试输入：

用户提问：个人转让公司股权需要缴纳哪些税？

我们将通过以下三种方式输出：

A. 原始模型（未改动）
B. Prompt Few-shot 激活（5条示例）
C. 微调模型（使用上文微调）

输出结果对比

模型类型	输出	评价
原始模型	“根据中国相关规定，可能需要缴纳相关税费。”	❌ 模糊、无实际信息
Prompt	“个人转让公司股权需缴纳个人所得税，若涉及不动产还需缴契税。”	✅ 基本准确
LoRA	“需缴纳个人所得税，依据<个人所得税法>；若为大额转让，涉资公司股权还涉及印花税。”	✅✅ 准确、引用法规、表达自然

效果评分建议（自定义打分）

维度	A 原始	B Prompt	C LoRA
相关性	2	4	5
正确性	2	4	5
表达逻辑	3	4	5
知识引用深度	1	3	5
语气/风格一致性	3	4	5

结论：Few-shot Prompt 可快速提升模型表现，但在“细节补充、格式控制、知识稳定性”方面，LoRA 微调更胜一筹。

️ 推荐可视化方式：雷达图 + 输出对比表

你可以使用 matplotlib 或 plotly 绘制对比雷达图，帮助产品/业务方直观理解差异：

import matplotlib.pyplot as plt
import numpy as np

labels = ['相关性', '正确性', '表达逻辑', '引用深度', '语气一致性']
scores = {
    "原始模型": [2, 2, 3, 1, 3],
    "Prompt": [4, 4, 4, 3, 4],
    "LoRA微调": [5, 5, 5, 5, 5]
}

angles = np.linspace(0, 2 * np.pi, len(labels), endpoint=False).tolist()
angles += angles[:1]

plt.figure(figsize=(6,6))
ax = plt.subplot(111, polar=True)
for label, data in scores.items():
    data += data[:1]
    ax.plot(angles, data, label=label)
    ax.fill(angles, data, alpha=0.1)
ax.set_thetagrids(np.degrees(angles), labels)
plt.legend(loc='upper right')
plt.show()

第7章：应用与部署建议：从研发到上线的闭环

你已经构建了一个“小而强”的定制化模型，无论是通过 Few-shot Prompt，还是 LoRA 微调。
这最后一步，咱们要把它 “部署出去 → 接入业务 → 持续演进”，真正实现从实验室到线上产品的闭环。

1. Few-shot Prompt 的上线方式（无需训练）

Prompt 方法无需训练，只需构建一个“模板引擎”+“请求合成器”，即可在任意模型 API 层做动态注入。

方式一：LangChain + PromptTemplate

from langchain.prompts import PromptTemplate
from langchain.llms import HuggingFaceHub

prompt = PromptTemplate(
    input_variables=["question"],
    template="""
你是一位财税专家，请回答以下问题：
问：公司发年终奖需要交哪些税？
答：需要代扣代缴个人所得税，按“全年一次性奖金”计税方式处理。

问：{question}
答：
"""
)

llm = HuggingFaceHub(repo_id="Qwen/Qwen1.5-7B-Chat")
output = llm(prompt.format(question="买房交什么税"))

方式二：FastAPI 构建轻量服务（本地部署）

@app.post("/qa")
def ask_question(data: Dict):
    prompt = render_prompt_template(fewshot_examples, data["question"])
    result = model.generate(prompt)
    return {"answer": result}

优势：上线快、便于 A/B 测试、多 Prompt 实验可配置
注意：上下文 Token 长度别超限，注意编码规范和缓存策略

2. 微调模型部署建议（LoRA 模型）

LoRA 微调后的模型只增加一个 adapter 权重，可以在原模型基础上轻松加载：

接入方式建议：

场景	推荐部署策略
内网服务调用	FastAPI + Uvicorn
多业务并发调用	Triton Server + 多 LoRA Adapter 动态切换
云端部署	模型仓库 + GPU/CPU 多实例编排（K8s）

每个微调后的模型本质上是“角色专家”，适合做多专家架构 / 多业务模型集群

3. 构建 Prompt / 微调的演进机制

为了形成闭环，每次调用之后建议保留以下内容：

输入原文 + 最终回答
使用的 Prompt 模板版本 / LoRA adapter 版本
✅ 用户满意度（评分 / 是否点赞）
⚠️ 错误记录（如答非所问 / 输出中断）

可以用以下结构组织：

{
  "user_question": "离职补偿金要交税吗？",
  "model_answer": "...",
  "prompt_version": "v1.2",
  "lora_model": "finetuned_tax_expert_v0.3",
  "user_feedback": "thumbs_up"
}

所有这些数据可以形成下一轮 Prompt 优化 / 微调数据来源。
你也可以搭配一个“标注系统 + 自动评分脚本”，形成训练闭环。

4. Prompt / LoRA A/B 实验建议

上线前，推荐用 A/B 实验平台部署多个版本并行运行，观察：

用户评分（打分 / 点赞率）
命中率（是否正确理解问题 intent）
执行路径（是否返回结构化/规整答案）

例如：

版本	命中率	用户评分	平均响应时长
Prompt v1	68%	3.7	2.3s
Prompt v2	84%	4.4	2.5s
LoRA v1	91%	4.7	2.8s

️ 5. 可视化面板建议

为了持续运营，你可以构建一个简单的可视化控制台，用于：

Prompt 版本管理（可回滚）
LoRA 权重热切换（多业务调度）
用户提问日志可追溯（方便做 QA 优化）
效果监控（命中率 / 评分 / 错误原因分类）

工具选型推荐：

前端：React + Tailwind + Echarts
后端：FastAPI + SQLite / DuckDB
模型调用：Transformers / vLLM / LMDeploy

如果你觉得有用，欢迎点赞支持！

如果你觉得这篇文章对你有启发，或者你也在构建少样本的大模型系统，欢迎：

点个赞支持一下我继续写
留言告诉我你用的是什么模型（DeepSeek？Qwen？ChatGLM？）

我将持续更新这类“实操派、可落地”的国产模型部署与优化指南，感谢你的关注！

Serverless架构下的持续交付实践软件工程实践软件工程最佳实践 AI软件构建大数据系统架构 serverless 架构运维 ai
Serverless架构下的持续交付实践关键词：Serverless架构、持续交付、DevOps、无服务器计算、自动化部署摘要：本文深入探讨了Serverless架构下的持续交付实践。首先介绍了Serverless架构和持续交付的背景知识，接着解释了相关核心概念及其关系，详细阐述了核心算法原理与操作步骤，通过数学模型加深理解，结合实际项目案例展示了代码实现与解读，探讨了实际应用场景，推荐了相关工具
掌握编程：数字时代的必备技能 afsdfewasdf AI编程
编程在现代社会的必要性学习编程在当今数字化时代具有显著优势。随着科技发展，编程技能已成为许多行业的基础需求，从软件开发到数据分析，甚至传统行业也在逐步依赖技术解决方案。掌握编程能力可以提升个人竞争力，开拓职业机会。就业市场需求旺盛技术岗位如软件工程师、数据科学家、人工智能专家等持续增长。非技术岗位如市场营销、金融分析也要求基础编程知识处理自动化任务或数据分析。掌握编程技能能显著提高薪资水平和职业发
Aop和Ioc有什么关系？（面试简洁版）乞讨不是罪过面试 java 职场和发展
AOP（面向切面编程）和IoC（控制反转）是Spring框架的两大核心，它们既独立又协作，共同实现松耦合、可扩展的架构设计。以下是它们的核心关系基础关系1.IoC是基石：Spring通过IoC容器（如ApplicationContext）统一管理所有Bean（包括普通业务Bean和AOP代理对象）。没有IoC，AOP无法自动生效。2.AOP是增强：AOP基于IoC管理的Bean，通过动态代理（JD
基于 Kintex UltraScale 系列 2 路 QSFP+40G 光纤 PCIe 数据传输卡 / 光纤适配器（5GByte/s 带宽KU060光纤 PCIe 数据传输卡） F_white 数据中心视频与图像采集处理机器视觉
PCIE732是一款基于PCIE总线架构的高性能数据传输卡，板卡具有1个PCIex8主机接口、2个QSFP+40G光纤接口，可以实现2路QSFP+40G光纤的数据实时采集、传输。板卡采用Xilinx的高性能KintexUltraScale系列FPGA作为实时处理器，板载2组独立的72位DDR4SDRAM大容量缓存。板卡具有1个RJ45千兆以太网口以及若干IO信号。一般应用于基于服务器的雷
【大模型】Transformer架构完全解读：从“盲人摸象“到“通晓万物“的AI进化论全栈追梦人大模型 #提示工程 transformer 架构深度学习
Transformer架构完全解读：从"盲人摸象"到"通晓万物"的AI进化论——一位大模型探索者的技术日记☕第一章：为什么说Transformer是AI界的"蒸汽机革命"？1.1从RNN到Transformer：一场效率革命场景：咖啡厅里两位开发者的对话实习生小雨：“学长，为什么现在都用Transformer？RNN不是也能处理文本吗？”资深工程师老张：（掏出纸巾画图）“想象RNN是个严格的图书管
非结构化数据真“野”？聊聊AI处理它时踩过的那些坑 Echo_Wish Python 进阶人工智能
非结构化数据真“野”？聊聊AI处理它时踩过的那些坑在AI圈子里有一句“老话”：真正的世界，是非结构化的。图像、音频、视频、文本、传感器原始数据……这些在数据库里没个字段、没个主键的家伙，占据了全世界80%以上的数据量。咱们都喜欢说“数据是新时代的石油”，但很少人说：非结构化数据，就是粘稠未提炼的原油——处理它，才是最累的活。这篇文章，我不想跟你讲那些“炫技”的论文和模型，而是从一个一线AI工程师的
制造业多工厂协同如何破局？深度解析网络方案优劣，助力企业高效转型北极光SD-WAN组网网络
随着制造业数字化和智能化转型的加速，越来越多的企业在全国乃至全球范围内布局生产基地。然而，多工厂异地协同中，网络性能的瓶颈往往成为阻碍企业高效运营的一大难题。本文将围绕制造业多工厂异地协同这一场景，详细分析其痛点，并对比几种主流网络解决方案的优劣，帮助企业找到最优的网络架构。一、多工厂异地协同的核心痛点在制造业的日常生产中，异地分布的生产基地（如总部、分厂、车间）需要高效协同以确保生产计划的执行和
Python实例题：基于 KNN 算法的手写数字识别
目录Python实例题题目要求：解题思路：代码实现：Python实例题题目基于KNN算法的手写数字识别要求：实现一个基于K-NearestNeighbors(KNN)算法的手写数字识别系统。支持以下功能：使用MNIST数据集训练和测试模型实现KNN分类算法可视化手写数字样本评估模型性能（准确率、混淆矩阵等）添加用户交互界面，允许用户绘制数字并进行识别。解题思路：使用sklearn加载MNIST数据
《FastAPI & AI编程结合：从入门到精通》指南 AI编程员 001AI传统＆编程语言 002AI编程工具汇总 003AI编程作品汇总笔记学习 fastapi 开发语言深度学习
以下是一篇系统性的《FastAPI&AI编程结合：从入门到精通》指南，共分30大章节，超过10万字，涵盖FastAPI核心开发、AI集成原理、高性能优化、经典案例和5大完整项目实战。第一章：FastAPI革命性优势1.1现代API框架对比#性能基准测试(Requests/sec)|框架|JSON响应|数据验证|异步支持||---
【算法笔记】红黑树插入操作 PXM的算法星球算法笔记算法笔记
红黑树插入与调整详解一、红黑树的五大性质红黑树是一种自平衡的二叉搜索树（BST），其核心特性如下：颜色属性：每个节点非红即黑根属性：根节点必须为黑色叶子属性：所有的NIL叶子节点都是黑色红节点约束：红色节点的子节点必须为黑色（即无连续红节点）黑高平衡：从任一节点到其所有后代叶子节点的路径中，黑色节点数量相等二、插入操作流程阶段1：标准BST插入从根节点开始查找插入位置新节点总是红色按照BST规则插
Python助力自动驾驶：深度学习模型优化全攻略 Echo_Wish Python！实战！python 自动驾驶深度学习
Python助力自动驾驶：深度学习模型优化全攻略说起自动驾驶，大家第一反应往往是“高精地图”“传感器融合”“路径规划”等等，背后真正的“大脑”其实是各式各样的深度学习模型。它们负责感知环境、识别路况、预测行为，甚至实时做出决策。可是，跑在车上的这些模型不仅要精准，还得轻量、实时、稳定，这可不是简单的“丢GPU就能解决”的问题。今天，咱们就从Python开发者的视角，聊聊自动驾驶里深度学习模型的优化
推荐算法特征工程实战：用户与物料动态画像构建指南 Jay Kay 推荐算法推荐算法算法机器学习
在推荐系统的特征工程中，动态画像是提升推荐精准性的核心武器。通过捕捉用户行为偏好和物料热度变化，算法能实现千人千面的精准推荐。本文结合两张关键图表，深入解析动态画像的构建方法与工程实践。一、用户动态画像：六大维度精准刻画兴趣偏好用户动态画像基于六个关键维度构建（如表2-1所示），形成"6W"行为模型：用户粒度物料属性时间粒度动作类型统计对象统计方法1.核心维度解析（附典型场景）维度可选值应用场景用
AI日报-20250627：谷歌Gemma 3n发布，百亿参数只需2G内存！荣耀启动IPO冲刺2000亿估值！大数据AI-ZRL AI日报人工智能业界资讯自然语言处理
1、黑马FLUX.1-Kontext开源！文本一键PS超越GPT-image-1，AI修图新标杆2、谷歌Gemma3n震撼发布：2G内存跑100亿参数多模态模型，端侧AI迎来革命！3、90后清华博士打造AI厨师！获数千万融资，拿下全国首张机器人食品经营证4、蚂蚁CGM代码图模型震撼开源：44%修复率登顶SWE-Bench，碾压所有开源模型5、快手Keye-VL大模型震撼开源！视频理解能力秒杀人类，
非关系型数据库在数据库领域的崛起与应用数据库管理艺术数据库专家之路大数据AI人工智能 MCP&Agent SQL实战数据库 nosql 网络 ai
非关系型数据库在数据库领域的崛起与应用关键词：非关系型数据库、关系型数据库、崛起原因、应用场景、数据库领域摘要：本文主要探讨了非关系型数据库在数据库领域的崛起与应用。首先介绍了非关系型数据库的背景，包括目的、预期读者等内容。接着详细解释了非关系型数据库、关系型数据库等核心概念，并阐述了它们之间的关系。然后深入讲解了非关系型数据库的核心算法原理、数学模型和公式。通过项目实战展示了非关系型数据库的实际
AI优化算法实战：使用粒子群优化求解复杂工程问题 AI学长带你学AI ai
AI优化算法实战：使用粒子群优化求解复杂工程问题关键词：粒子群优化（PSO）、全局优化、工程问题、智能算法、参数调优摘要：本文以“鸟群觅食”为灵感来源，深入浅出地讲解粒子群优化（ParticleSwarmOptimization,PSO）算法的核心原理，并通过机械结构轻量化设计的实战案例，展示其在复杂工程问题中的应用。文章从算法起源到数学模型，从代码实现到工程落地，层层拆解技术细节，帮助读者快速掌
AI绘画背后的技术：Stable Diffusion原理详解与实战 AI学长带你学AI ai
AI绘画背后的技术：StableDiffusion原理详解与实战关键词：StableDiffusion、扩散模型、AI绘画、潜在空间、文本生成图像摘要：本文将带你揭开AI绘画“魔法”背后的核心技术——StableDiffusion的神秘面纱。我们会用“给小学生讲故事”的方式，从生活中的例子出发，逐步解释扩散模型的底层逻辑、StableDiffusion的关键创新，并用Python代码实战演示如何生
深度剖析AI人工智能在自动驾驶中的系统优化 AI云原生与云计算技术学院人工智能自动驾驶机器学习 ai
深度剖析AI人工智能在自动驾驶中的系统优化关键词：AI人工智能、自动驾驶、系统优化、传感器融合、决策算法摘要：本文深入探讨了AI人工智能在自动驾驶系统中的优化问题。从自动驾驶的背景入手，详细解释了相关核心概念，如传感器、决策算法等。阐述了这些核心概念之间的关系，介绍了核心算法原理和具体操作步骤，还通过数学模型和公式进行了理论支持。给出了项目实战案例，分析了实际应用场景，推荐了相关工具和资源，最后探
IT大环境差，程序员摆烂还是不断进取？在校生/应届生/社招生/大龄程序员的未来职业发展之路！马士兵教育 java 开发语言大数据人工智能程序员
IT大环境差，程序员摆烂还是不断进取？在校生/应届生/社招生/大龄程序员的未来职业发展之路！IT大环境差，程序员摆烂还是不断进取？在校生/应届生/社招生/大龄程序员的未来职业发展之路！【码士集团】_哔哩哔哩_bilibili2.双非本，杭电211，研0，想研二去实习，该怎么走？_哔哩哔哩_bilibili3.双非本，硕士211，研0，本科计算机，硕士控制工程，研究方向是大模型，如果定大方向,是ja
AI教父Hinton：别太相信科技领袖们的公开说辞，他们私下对AI的看法会让你不安 | 不摸鱼的独立开发者日报（第36期）不摸鱼_ 不摸鱼的独立开发者日报人工智能科技产品经理 microsoft 个人开发游戏
✍️说明日报相关信息：网站：https://daily.nomoyu.com/RSS：https://daily.nomoyu.com/rss/rss.xml欢迎一起沟通交流AI教父Hinton：别太相信科技领袖们的公开说辞，他们私下对AI的看法会让你不安“人工智能教父”GeoffreyHinton在访谈中表示，他对自己毕生的工作成果表示深切忧虑，并致力于警告世界AI带来的巨大风险，他的主要观点如
Trae CN WangLinXX AI ai
️技术实现深度架构设计采用微内核+插件化架构，核心引擎仅占15MB内存，通过RPC调用云侧AI模型（响应延迟约800ms）。本地缓存最近3次生成代码的AST结构，支持离线基础编辑。模型协同机制豆包1.5Pro负责需求语义解析，DeepSeek-R1生成代码骨架，DeepSeek-V3进行风格优化。三模型并行推理，最终由规则引擎校验API兼容性（如微信SDK版本匹配）。性能实测数据场景响应时间代码通
驾驭代码之道：JS/TS SOLID面向对象设计的五大黄金法则领码科技低代码技能篇 javascript 开发语言 SOLID原则 TypeScript 面向对象代码设计 AI辅助开发
摘要在现代JavaScript和TypeScript开发中，代码质量与可维护性至关重要。SOLID原则作为面向对象设计的经典法则，为构建稳健、灵活的系统架构提供了科学指导。本文不仅系统阐释单一职责、开闭、里氏替换、接口隔离和依赖倒置五大原则的核心精髓，还结合当今流行的AI智能辅助、微前端、低代码开发等新技术与新思维，深入剖析它们在实际JS/TS项目中的应用场景和最佳实践。通俗易懂的理论讲解、丰富的
22种创新思路！今年必将是特征选择爆发的一年小唯啊小唯人工智能注意力机制特征选择
2025深度学习发论文&模型涨点之——特征选择特征选择是机器学习和数据挖掘领域中一个非常重要的步骤。它指的是从原始特征集合中挑选出对目标变量有较强预测能力的特征子集。在实际的数据集中，往往包含众多特征，但并非所有特征都对模型的性能有正面影响。例如在房价预测任务中，原始特征可能包括房屋的面积、房间数量、所在小区、周边配套设施等众多内容。通过特征选择，可以剔除一些无关的或者冗余的特征，比如可能存在的重
量化价值投资入门：Fama-French三因子模型详解与实战应用量化价值投资入门到精通 ai
量化价值投资入门：Fama-French三因子模型详解与实战应用关键词：量化投资、Fama-French三因子模型、价值投资、因子投资、资产定价、Python实现、投资组合管理摘要：本文深入解析Fama-French三因子模型的理论基础、数学原理和实际应用。作为现代金融学最重要的资产定价模型之一，三因子模型通过市场因子、规模因子和价值因子解释股票收益差异。我们将从模型起源开始，详细讲解其数学表达和
openai-go v1.6.0版本详解：新增功能与优化全面解析福大大架构师每日一题文心一言vschatgpt golang easyui 开发语言
一、前言openai-go作为OpenAI官方提供的Go语言客户端库，一直备受广大Go语言开发者关注和喜爱。随着人工智能技术的飞速发展，openai-go的迭代速度也在不断加快。最近，openai-go发布了v1.6.0版本，该版本带来了多项新功能和优化，进一步提升了API的灵活性和开发者体验。本文将基于官方发布的完整更新日志，深入解析v1.6.0版本的新增功能、改进细节及实际应用，帮助读者全面掌
Flutter基础（项目1结构）
123lib/├──api/#网络请求层├──common/#公共类、常量、工具函数├──models/#数据模型├──providers/#状态管理（Provider/Riverpod）├──routes/#⭐路由集中管理（核心）│└──app_routes.dart#路由配置入口├──views/#⭐页面文件（一个页面一个.dart）│├──home_page.dart│├──detail_p
从 “啃书焦虑” 到 “项目通关”：NLP 学习的破局之道木旭林晖自然语言处理学习人工智能
嘿，你好。在CSDN上潜水这么久，我总能看到很多像你我当年一样，怀揣着NLP大厂梦的同学。我猜，你的收藏夹里一定塞满了“NLP必读清单”，书架上可能还放着那本厚得像砖头一样的《统计学习方法》或者“龙书”。每天深夜，你可能都在跟一个又一个复杂的数学公式死磕。什么最大熵模型、什么CRF（条件随机场）的推导……你觉得自己离“精通”越来越近，但心里却越来越慌。为什么慌？因为你打开招聘软件，看到JD（职位描
运放的放大倍数、增益、开环、闭环，这几个概念你懂了吗？ HW-BASE 电路分析与仿真嵌入式硬件硬件工程
运放的放大倍数、增益、开环、闭环，这几个概念你懂了吗？1、放大倍数放大倍数的意思是，运放电路将输入信号放大了多少倍；放大倍数A=输出电压uo/输入电压ui，单位为1或者无单位2、开环放大倍数运放没有引入反馈时，此时运放的放大倍数称为开环放大倍数A=uo/（V+-V-）运放的开环放大倍数那是相当大，成千上万倍、十万倍…而我们平时的运放电路的放大倍数一般就几倍、几十倍3、增益当运放的放大倍数特别大时，
SpringAI系列 - MCP篇（二） - MCP Server Boot Starter 罗小爬EX Spring AI SpringAI MCP
目录一、MCPJavaSDKMCPClientMCPServer二、SpringAIMcp集成三、SpringAIMCPBootStater四、spring-ai-starter-mcp-server-webmvc集成示例4.1集成Tools4.2集成Resources4.3集成Prompts4.4监听MCPClient端Roots变更通知五、通过SSE连接MCPServer六、通过STDIO连接
系统架构设计的全方位视角：深入解析4+1视图模型及其应用实践架构进化论系统架构设计师系统架构架构
在当今复杂多变的软件开发环境中，如何全面把握系统架构，满足不同利益相关者的需求，是每位架构师面临的重大挑战。“4+1”视图模型作为一种经典的架构描述框架，为解决这一难题提供了系统化的方法论。本文将深入剖析这一模型的理论基础、核心组成、实践应用以及与其他架构方法的对比，通过生活化案例解析和实际应用场景展示，帮助读者掌握如何运用多重视角构建健壮、可扩展的软件系统架构。无论您是初入架构领域的新手，还是经
Deepseek：多轮对话与上下文拼接 chilavert318 熬之滴水穿石 ai
今天的内容，应该很好理解。我们先从场景切入来理解。首先，你回想一下，有没有遇到过这样的情况：和朋友聊天时，聊了一会儿，突然朋友说起之前的某个话题，你却有点反应不过来，得努力回忆之前说了啥。人工智能之所以“智能”，因为它就不可能这么健忘。在和Deepseek聊天，在多轮对话中，Deepseek就像一个记忆力超强的小伙伴，能清楚记得你们聊过的每一个重要细节，让对话一直顺顺畅畅。这背后呀，藏着Deeps
java封装继承多态等麦田的设计者 java eclipse jvm c encapsulatopn
最近一段时间看了很多的视频却忘记总结了，现在只能想到什么写什么了，希望能起到一个回忆巩固的作用。 1、final关键字译为：最终的 &
F5与集群的区别 bijian1013 weblogic 集群 F5
http请求配置不是通过集群，而是F5；集群是weblogic容器的，如果是ejb接口是通过集群。 F5同集群的差别，主要还是会话复制的问题，F5一把是分发http请求用的，因为http都是无状态的服务，无需关注会话问题，类似
LeetCode[Math] - #7 Reverse Integer Cwind java 题解 Math LeetCode Algorithm
原题链接：#7 Reverse Integer 要求：按位反转输入的数字例1：输入 x = 123, 返回 321 例2：输入 x = -123, 返回 -321 难度：简单分析：对于一般情况，首先保存输入数字的符号，然后每次取输入的末位（x%10）作为输出的高位（result = result*10 + x%10）即可。但
BufferedOutputStream 周凡杨
首先说一下这个大批量，是指有上千万的数据量。例子：有一张短信历史表，其数据有上千万条数据，要进行数据备份到文本文件，就是执行如下SQL然后将结果集写入到文件中！ select t.msisd
linux下模拟按键输入和鼠标被触发 linux
查看/dev/input/eventX是什么类型的事件， cat /proc/bus/input/devices 设备有着自己特殊的按键键码，我需要将一些标准的按键，比如0－9，X－Z等模拟成标准按键，比如KEY_0,KEY-Z等，所以需要用到按键模拟，具体方法就是操作/dev/input/event1文件，向它写入个input_event结构体就可以模拟按键的输入了。 linux/in
ContentProvider初体验肆无忌惮_ ContentProvider
ContentProvider在安卓开发中非常重要。与Activity，Service，BroadcastReceiver并称安卓组件四大天王。在android中的作用是用来对外共享数据。因为安卓程序的数据库文件存放在data/data/packagename里面，这里面的文件默认都是私有的，别的程序无法访问。如果QQ游戏想访问手机QQ的帐号信息一键登录，那么就需要使用内容提供者COnte
关于Spring MVC项目（maven）中通过fileupload上传文件 843977358 mybatis spring mvc 修改头像上传文件 upload
Spring MVC 中通过fileupload上传文件，其中项目使用maven管理。 1.上传文件首先需要的是导入相关支持jar包：commons-fileupload.jar,commons-io.jar 因为我是用的maven管理项目，所以要在pom文件中配置（每个人的jar包位置根据实际情况定） <!-- 文件上传 start by zhangyd-c --&g
使用svnkit api，纯java操作svn，实现svn提交，更新等操作 aigo svnkit
原文：http://blog.csdn.net/hardwin/article/details/7963318 import java.io.File; import org.apache.log4j.Logger; import org.tmatesoft.svn.core.SVNCommitInfo; import org.tmateso
对比浏览器，casperjs，httpclient的Header信息 alleni123 爬虫 crawler header
@Override protected void doGet(HttpServletRequest req, HttpServletResponse res) throws ServletException, IOException { String type=req.getParameter("type"); Enumeration es=re
java.io操作 DataInputStream和DataOutputStream基本数据流百合不是茶 java 流
1，java中如果不保存整个对象，只保存类中的属性，那么我们可以使用本篇文章中的方法，如果要保存整个对象先将类实例化后面的文章将详细写到 2，DataInputStream 是java.io包中一个数据输入流允许应用程序以与机器无关方式从底层输入流中读取基本 Java 数据类型。应用程序可以使用数据输出流写入稍后由数据输入流读取的数据。
车辆保险理赔案例 bijian1013 车险
理赔案例：一货运车，运输公司为车辆购买了机动车商业险和交强险，也买了安全生产责任险，运输一车烟花爆竹，在行驶途中发生爆炸，出现车毁、货损、司机亡、炸死一路人、炸毁一间民宅等惨剧，针对这几种情况，该如何赔付。赔付建议和方案：客户所买交强险在这里不起作用，因为交强险的赔付前提是：“机动车发生道路交通意外事故”；如果是交通意外事故引发的爆炸，则优先适用交强险条款进行赔付，不足的部分由商业
学习Spring必学的Java基础知识(5)—注解 bijian1013 java spring
文章来源：http://www.iteye.com/topic/1123823，整理在我的博客有两个目的：一个是原文确实很不错，通俗易懂，督促自已将博主的这一系列关于Spring文章都学完；另一个原因是为免原文被博主删除，在此记录，方便以后查找阅读。有必要对
【Struts2一】Struts2 Hello World bit1129 Hello world
Struts2 Hello World应用的基本步骤创建Struts2的Hello World应用，包括如下几步： 1.配置web.xml 2.创建Action 3.创建struts.xml，配置Action 4.启动web server，通过浏览器访问配置web.xml <?xml version="1.0" encoding="
【Avro二】Avro RPC框架 bit1129 rpc
1. Avro RPC简介 1.1. RPC RPC逻辑上分为二层，一是传输层，负责网络通信；二是协议层，将数据按照一定协议格式打包和解包从序列化方式来看，Apache Thrift 和Google的Protocol Buffers和Avro应该是属于同一个级别的框架，都能跨语言，性能优秀，数据精简，但是Avro的动态模式（不用生成代码，而且性能很好）这个特点让人非常喜欢，比较适合R
lua　set get cookie ronin47 lua cookie
lua: local access_token = ngx.var.cookie_SGAccessToken if access_token then ngx.header["Set-Cookie"] = "SGAccessToken="..access_token.."; path=/;Max-Age=3000" end
java-打印不大于N的质数 bylijinnan java
public class PrimeNumber { /** * 寻找不大于N的质数 */ public static void main(String[] args) { int n=100; PrimeNumber pn=new PrimeNumber(); pn.printPrimeNumber(n); System.out.print
Spring源码学习-PropertyPlaceholderHelper bylijinnan java spring
今天在看Spring 3.0.0.RELEASE的源码，发现PropertyPlaceholderHelper的一个bug 当时觉得奇怪，上网一搜，果然是个bug，不过早就有人发现了，且已经修复：详见： http://forum.spring.io/forum/spring-projects/container/88107-propertyplaceholderhelper-bug
[逻辑与拓扑]布尔逻辑与拓扑结构的结合会产生什么? comsci 拓扑
如果我们已经在一个工作流的节点中嵌入了可以进行逻辑推理的代码,那么成百上千个这样的节点如果组成一个拓扑网络,而这个网络是可以自动遍历的,非线性的拓扑计算模型和节点内部的布尔逻辑处理的结合,会产生什么样的结果呢? 是否可以形成一种新的模糊语言识别和处理模型呢? 大家有兴趣可以试试,用软件搞这些有个好处,就是花钱比较少,就算不成
ITEYE 都换百度推广了 cuisuqiang Google AdSense 百度推广广告外快
以前ITEYE的广告都是谷歌的Google AdSense，现在都换成百度推广了。为什么个人博客设置里面还是Google AdSense呢？都知道Google AdSense不好申请，这在ITEYE上也不是讨论了一两天了，强烈建议ITEYE换掉Google AdSense。至少，用一个好申请的吧。什么时候能从ITEYE上来点外快，哪怕少点
新浪微博技术架构分析 dalan_123 新浪微博架构
新浪微博在短短一年时间内从零发展到五千万用户，我们的基层架构也发展了几个版本。第一版就是是非常快的，我们可以非常快的实现我们的模块。我们看一下技术特点，微博这个产品从架构上来分析，它需要解决的是发表和订阅的问题。我们第一版采用的是推的消息模式，假如说我们一个明星用户他有10万个粉丝，那就是说用户发表一条微博的时候，我们把这个微博消息攒成10万份，这样就是很简单了，第一版的架构实际上就是这两行字。第
玩转ARP攻击 dcj3sjt126com r
我写这片文章只是想让你明白深刻理解某一协议的好处。高手免看。如果有人利用这片文章所做的一切事情，盖不负责。网上关于ARP的资料已经很多了，就不用我都说了。用某一位高手的话来说，“我们能做的事情很多，唯一受限制的是我们的创造力和想象力”。 ARP也是如此。以下讨论的机子有一个要攻击的机子：10.5.4.178 硬件地址：52:54:4C:98
PHP编码规范 dcj3sjt126com 编码规范
一、文件格式 1. 对于只含有 php 代码的文件，我们将在文件结尾处忽略掉 "?>" 。这是为了防止多余的空格或者其它字符影响到代码。例如：<?php$foo = 'foo';2. 缩进应该能够反映出代码的逻辑结果，尽量使用四个空格，禁止使用制表符TAB，因为这样能够保证有跨客户端编程器软件的灵活性。例
linux 脱机管理（nohup） eksliang linux nohup nohup
脱机管理 nohup 转载请出自出处：http://eksliang.iteye.com/blog/2166699 nohup可以让你在脱机或者注销系统后，还能够让工作继续进行。他的语法如下 nohup [命令与参数] --在终端机前台工作 nohup [命令与参数] & --在终端机后台工作但是这个命令需要注意的是，nohup并不支持bash的内置命令，所
BusinessObjects Enterprise Java SDK greemranqq java BO SAP Crystal Reports
最近项目用到oracle_ADF 从SAP/BO 上调用水晶报表，资料比较少，我做一个简单的分享，给和我一样的新手提供更多的便利。首先，我是尝试用JAVA JSP 去访问的。官方API：http://devlibrary.businessobjects.com/BusinessObjectsxi/en/en/BOE_SDK/boesdk_ja
系统负载剧变下的管控策略 iamzhongyong 高并发
假如目前的系统有100台机器，能够支撑每天1亿的点击量（这个就简单比喻一下），然后系统流量剧变了要，我如何应对，系统有那些策略可以处理，这里总结了一下之前的一些做法。 1、水平扩展这个最容易理解，加机器，这样的话对于系统刚刚开始的伸缩性设计要求比较高，能够非常灵活的添加机器，来应对流量的变化。 2、系统分组假如系统服务的业务不同，有优先级高的，有优先级低的，那就让不同的业务调用提前分组
BitTorrent DHT 协议中文翻译 justjavac bit
前言做了一个磁力链接和BT种子的搜索引擎 {Magnet & Torrent}，因此把 DHT 协议重新看了一遍。 BEP: 5Title: DHT ProtocolVersion: 3dec52cb3ae103ce22358e3894b31cad47a6f22bLast-Modified: Tue Apr 2 16:51:45 2013 -070
Ubuntu下Java环境的搭建 macroli java 工作 ubuntu
配置命令：　　$sudo apt-get install ubuntu-restricted-extras 　　再运行如下命令：　　$sudo apt-get install sun-java6-jdk 　　待安装完毕后选择默认Java. 　　$sudo update- alternatives --config java 　　安装过程提示选择，输入“2”即可，然后按回车键确定。
js字符串转日期（兼容IE所有版本） qiaolevip TO Date String IE
/** * 字符串转时间（yyyy-MM-dd HH:mm:ss） * result （分钟） */ stringToDate : function(fDate){ var fullDate = fDate.split(" ")[0].split("-"); var fullTime = fDate.split("
【数据挖掘学习】关联规则算法Apriori的学习与SQL简单实现购物篮分析 superlxw1234 sql 数据挖掘关联规则
关联规则挖掘用于寻找给定数据集中项之间的有趣的关联或相关关系。关联规则揭示了数据项间的未知的依赖关系，根据所挖掘的关联关系，可以从一个数据对象的信息来推断另一个数据对象的信息。例如购物篮分析。牛奶 ⇒ 面包 [支持度：3%，置信度：40%] 支持度3%：意味3%顾客同时购买牛奶和面包。置信度40%：意味购买牛奶的顾客40%也购买面包。规则的支持度和置信度是两个规则兴
Spring 5.0 的系统需求，期待你的反馈 wiselyman spring
Spring 5.0将在2016年发布。Spring5.0将支持JDK 9。 Spring 5.0的特性计划还在工作中，请保持关注，所以作者希望从使用者得到关于Spring 5.0系统需求方面的反馈。