机器学习社区

大语言模型在天猫AI导购助理项目的实践！

本文主要介绍了Prompt设计、大语言模型SFT和LLM在手机天猫AI导购助理项目应用。

ChatGPT基本原理

“会说话的AI”，“智能体”

简单概括成以下几个步骤：

预处理文本：ChatGPT的输入文本需要进行预处理。
输入编码：ChatGPT将经过预处理的文本输入到神经网络中进行编码处理，使用的是多层transformer编码器结构。
预测输出：ChatGPT通过对输入进行逐个token预测，输出下一个最可能出现的token序列，使用的是softmax函数进行概率预测。
输出解码：ChatGPT将预测的token序列作为输入，经过多层transformer解码器结构进行解码处理，最终输出模型的回答。
重复步骤3和4：ChatGPT在处理输入时会持续输出预测的token序列，直到遇到停止符号或达到最大输出长度为止。

算法内核——Transformer

由 Encoder 和 Decoder 两个部分组成

技术交流群

建了技术交流群！想要进交流群的同学，可以直接加微信号：mlc2060。加的时候备注一下：研究方向 +学校/公司+CSDN，即可。然后就可以拉你进群了。

前沿技术资讯、算法交流、求职内推、算法竞赛、面试交流(校招、社招、实习)等、与 10000+来自港科大、北大、清华、中科院、CMU、腾讯、百度等名校名企开发者互动交流~

方式①、添加微信号：mlc2060，备注：技术交流
方式②、微信搜索公众号：机器学习社区，后台回复：技术交流

Prompt设计

▐ 什么是prompt？

看来跟我今天想分享的不太一样，加个具体的限定条件，然后呢？

这下对了！

Prompt的不同能直接决定模型是否能按我们的预期输出

▐ prompt基本技巧

1.清晰，明确，避免模糊的词语

bad case

good case

产品描述不应该太短，用一些句子就行，也不用特别多

用3到5个短语描述这个产品

给手机天猫写首诗

给手机天猫写一首四句的古文诗，模仿李白的《早发白帝城》

2.用###或者"""或者<>或者’''将指令和待处理的内容分开

bad case

good case

将下面内容总结为一句话。你应该提供尽可能清晰和具体的指令来表达你想让模型做什么。这将引导模型朝着期望的输出方向发展，并减少收到无关或不正确响应的可能性。不要混淆写一个清晰的提示和写一个简短的提示。在许多情况下，更长的提示提供更多的清晰度和上下文，这可以导致更详细和相关的输出。

将下面用三个引号括起来的内容总结为一句话：

需要总结的文本是：

'''

你应该提供尽可能清晰和具体的指令来表达你想让模型做什么。这将引导模型朝着期望的输出方向发展，并减少收到无关或不正确响应的可能性。不要混淆写一个清晰的提示和写一个简短的提示。在许多情况下，更长的提示提供更多的清晰度和上下文，这可以导致更详细和相关的输出。

'''

3.指定输出格式

bad case

good case

生成三个虚构书名，包括它们的作者和类型。

生成三个虚构书名，包括它们的作者和类型。以JSON列表的格式提供，包括以下键：book_id、title、author、genre

4.角色扮演，用扮演、担任等这一类词汇告诉大模型在对话中特定的人格或角色

bad case

good case

给我推销一款男士洗面奶

system:我想让你扮演一个专业的导购员。你可以充分利用你的电商知识、导购话术，生动活泼的帮顾客介绍推销商品。

user:给我推销一款男士洗面奶

▐ Few shot进阶

启用上下文in-context learning学习，在prompt中提供几个样例（这里只有一个例子one-shot）

▐ Chain of Thought（Cot）

思维链（CoT）是一种改进的提示策略，用于提高 LLM 在复杂推理任务中的性能，如算术推理、常识推理和符号推理。

one-shot

Cot

model input：

Q：小明有5个球，他又买了2筐，每一筐有3个球。那么他现在总共有几个球？

A：答案是11

Q：小花有23个苹果，他们午餐用去了20个，又买了6个。那么现在还有多少个苹果？

model output：

model input：

Q：小明有5个球，他又买了2筐，每一筐有3个球。那么他现在总共有几个球？

A：小明开始有5个球，又买了2筐球，每筐3个共6个球，合计11个球，答案是11

Q：小花有23个苹果，他们午餐用去了20个，又买了6个。那么现在还有多少个苹果？

model output：

上面的例子很好的激发了大模型的潜能，是否有prompt技巧无能为力的问题？

答案是肯定的，一些偏实时，模型训练过程中缺乏的语料知识，它也无能为力。

▐ Search API & GPT

"""
网页搜索结果:
{web_results}

当前日期:{current_date}

指令: 用给定的网络搜索结果，总结回复用户query

用户Query: {query}

回复语言: {reply_language}
"""

私有化知识库（嵌入式向量检索+LLM）

▐ ReAct框架

大模型Agent功能，大模型会自己分析问题，选择合适的工具，最终解决问题。

ReAct方式的作用就是协调LLM模型和外部的信息获取，与其他功能交互。如果说LLM模型是大脑，那ReAct框架就是这个大脑的手脚和五官。

关键概念	描述
Thought	由LLM模型生成，是LLM产生行为和依据
Act	Act是指LLM判断本次需要执行的具体行为
Obs	LLM框架对于外界输入的获取。

尽可能回答以下问题，可以使用工具：
{工具名和描述}
使用以下格式回答：
问题：你必须回答的问题

思考：你应该一致保持思考，思考要怎么解决问题
动作：{工具名}。每次动作只选择一个工具，工具列表{工具名和描述}
输入：{调用工具时需要传入的参数}
观察：{第三方工具返回的结果}

【思考-动作-输入-观察】循环N次

思考：最后，输出最终结果
最终结果：针对原始问题，输出最终结果

开始！
问题：上海最高楼是多少？它楼层高度的平方是多少？
思考：我需要知道上海最高楼，然后进行计算。
动作：搜索API
观察：632米
思考：我需要计算上海最高楼高度的平方，然后得到结果。
动作：计算器
输入：632^2
观察：399424
思考：
最终结果：上海最高楼632米，它的高度平方是399424

大模型SFT（supervised fine tuning）

▐ 预训练 VS 微调

预训练：模型以一种无监督的方式去训练，学习根据前文生成下一个单词。在海量数据下进行，让大模型具备语言理解和生成能力。

指令微调：有监督的方式进行学习，包括任务描述，输入等，去预测答案。目标是如何跟人类指令对齐，让模型更加适应专业化领域场景

业务数据从哪来？

人工标注
种子数据 + self-instruct（gpt 3.5构造）

▐ P-tuning

动机：Fine-tuning需要微调整个预训练语言模型，且额外添加了新的参数，而Prompting则可以将整个预训练语言模型的参数保持固定，而只需要添加prompt来预测结果即可；

P-tuning：将Prompt转换为可以学习的Embedding层，并用MLP+LSTM的方式来对Prompt Embedding进行一层处理。

P-tuning V2：每一层都加入可训练的prompts，只对Prompt部分的参数进行训练，而语言模型的参数固定不变。

▐ LoRA

Low-rank Adaption of LLM，利用低秩适配（low-rank adaptation）的方法，可以在使用大模型适配下游任务时只需要训练少量的参数即可达到一个很好的效果。在计算资源受限的情况下的弥补方案。

对于不同的下游任务，只需要在预训练模型基础上重新训练AB就可以了，这样也能加快大模型的训练节奏。

▐ LoRA VS 全参数微调

lora的优点在于轻量化，低资源。但缺点很明显，参与训练的模型参数量不多，在百万到千万级别的参数量，实验来看效果比全量微调差一些。

▐ C-Eval评估

C-Eval由上海交通大学，清华大学，爱丁堡大学共同完成，是构造了一个覆盖人文，社科，理工，其他专业四个大方向，52 个学科（微积分，线代 …），从中学到大学研究生以及职业考试，一共 13948 道题目的中文知识和推理型测试集。

C-Eval认为：一个模型要强，首先需要广泛的知识，然后在知识的基础上做推理，这样才能代表一个模型可以做复杂且困难的事情。

此外，还有一些公开评测集，用于评估模型在学科综合、语言能力、推理能力等。

手机天猫AI导购助理项目落地应用

▐ 项目背景

“AI形象”璇玑作为个人专属导购员，在交互式对话中进行用户理解、导购商品。

定位：交互式搜索导购产品

▐ 算法框架

▐ 语料收集

电商种子问题收集：端内会话日志、小红书sug收集电商领域种子问题：
问题泛化：明确场景问题定义，通过手猫核心query、种子问题等，设计prompt，通过gpt补充收集问题；
人工标注: 标注高质量语料；
self-instruction：通过prompt(few-shot)方法根据已有人工标注扩充新的instruction。通过gpt获取更多训练语料，解决标注人效瓶颈。

▐ 模型训练

base模型选型

中文评测

数学评测

训练平台：AOP/星云/PAI

基于达摩院模型基座qwen-14B，针对璇玑产品，新增电商领域的训练数据，增强模型的电商领域知识、安全、导购等能力。

params="--stage sft \
--model_name_or_path /data/oss_bucket_0/Qwen_14B_Chat_ms_v100/  \
--do_train \
--dataset_dir data \
--dataset xuanji \
--template chatml  \
--finetuning_type  full  \
--output_dir file_path  \
--overwrite_cache \
--per_device_train_batch_size 2 \
--gradient_accumulation_steps 4 \
--lr_scheduler_type cosine  \
--logging_steps 5 \
--save_strategy epoch \
--save_steps 10000 \
--learning_rate 2e-6 \
--num_train_epochs 3.0 \
--warmup_ratio 0.15 \
--warmup_steps 0 \
--weight_decay 0.1 \
--fp16 ${fp16} \
--bf16 ${bf16} \
--deepspeed ds_config.json \
--max_source_length 4096 \
--max_target_length 4096 \
--use_fast_tokenizer False \
--is_shuffle True \
--val_size 0.0 \
"

pai -name pytorch112z
-project algo_platform_dev
-Dscript='${job_path}'
  -DentryFile='-m torch.distributed.launch --nnodes=${workerCount} --nproc_per_node=${node}  ${entry_file}'
-DuserDefinedParameters=\"${params}\"
-DworkerCount=${workerCount}
-Dcluster=${resource_param_config}
-Dbuckets=${oss_info}${end_point}

训练中间过程

▐ 模型部署&调用

达摩院千问

模型基于allspark做量化加速，部署在dashscope平台，机器为双卡A10。

# For prerequisites running the following sample

import dashscope
from dashscope import Generation
from http import HTTPStatus

dashscope.api_key = 'your-dashscope-api-key'

response_generator = Generation.call(
    model='model_name',
    prompt=build_prompt([
        {'role':'system','content':'content_info'},
        {'role':'user', 'content':'query'}
    ]),
    stream=True,
    use_raw_prompt=True,
    seed=random_num
)

for resp in response_generator:
    # when stream, you need to get the result through iteration
    if resp.status_code == HTTPStatus.OK:
        print(resp.output)
    else:
        print('Failed request_id: %s, status_code: %s, \
                  code: %s, message:%s' %
              (resp.request_id, resp.status_code, resp.code, resp.message))

# Result: 
# {"text": "汝亦来", "finish_reason": "null"}
# {"text": "汝亦来哉，幸会。\n\n汝可", "finish_reason": "null"}
# {"text": "汝亦来哉，幸会。\n\n汝可唤我一声「百晓生", "finish_reason": "null"}
# {"text": "汝亦来哉，幸会。\n\n汝可唤我一声「百晓生」，不知可否？", "finish_reason": "null"}
# {"text": "汝亦来哉，幸会。\n\n汝可唤我一声「百晓生」，不知可否？", "finish_reason": "stop"}

Whale私有化

部署发布：

模型管理：

from whale import TextGeneration
import json

# 设置apiKey
# 预发或线上请勿指定base_url
TextGeneration.set_api_key("api_key", base_url="api_url")

# 设置模型生成结果过程中的参数

config = {"pad_token_id": 0,  "bos_token_id": 1,  "eos_token_id": 2,  "user_token_id": 0,  "assistant_token_id": 0,  "max_new_tokens": 2048,  "temperature": 0.95,  "top_k": 5,  "top_p": 0.7,  "repetition_penalty": 1.1,  "do_sample": False,  "transformers_version": "4.29.2"}
prompt = [
    {
      "role": "user",
      "content": "content_info"
    }
]

# 请求模型
response = TextGeneration.call(
    model="model_name",
    prompt=json.dumps(prompt),
    timeout=120,
    streaming=True,
    generate_config=config)


# 处理流式结果
for event in response:
    if event.status_code == 200:
        print(event.finished)
        if event.finished is False:
            print(event.output['response'], end="")
    else:
        print('error_code: [%d], error_message: [%s]'
              % (event.status_code, event.status_message))

借助EAS，将代码和模型文件分离进行LLM服务部署，基于http协议提供流式输出。模型存储在oss上。

▐ 模型评测

基础能力评测：在公开评测集上评估模型中英文、推理、知识问答能力表现。

业务评测：以业务人工评测为主，每个大模型任务150个评测问题。

体验问题：埋点日志获取，定期review。

参考链接

1.https://www.semanticscholar.org/paper/Attention-is-All-you-Need-Vaswani-Shazeer/204e3073870fae3d05bcbc2f6a8e263d9b72e776

2.https://huggingface.co/Qwen/Qwen-14B-Chat

3.https://github.com/yuanzhoulvpi2017/zero_nlp

4.https://github.com/THUDM/ChatGLM-6B/tree/main/ptuning

5.https://www.bilibili.com/video/BV1jP411d7or/?spm_id_from=333.337.search-card.all.click

6.https://arxiv.org/pdf/2305.08322v1.pdf

7.https://zhuanlan.zhihu.com/p/630111535?utm_id=0

8.https://cdn.baichuan-ai.com/paper/Baichuan2-technical-report.pdf

9.https://github.com/tatsu-lab/stanford_alpaca

AI 对程序员的冲击剖析程序员WANG 工具人工智能机器学习语言模型
摘要随着人工智能（AI）技术的飞速发展，其影响力已逐渐渗透到各个行业，程序员群体也面临着前所未有的冲击。本文深入探讨AI对程序员在编程工作模式、技能需求以及职业发展路径等方面带来的冲击，并分析程序员应对这些冲击的策略与方向，旨在为程序员在AI时代的职业发展提供参考。一、引言AI技术近年来取得了突破性进展，其在自然语言处理、机器学习、深度学习等领域的应用日益广泛。在软件开发领域，AI不再仅仅是辅助工
AI 在生活中的渗透与技术解析程序员WANG 工具深度学习机器学习语音识别自然语言处理语言模型
引言在当今数字化时代，人工智能（AI）已不再是科幻小说中的概念，而是实实在在地渗透到人们生活的方方面面。从清晨醒来使用的智能语音助手，到夜晚入睡时智能家居设备营造的舒适环境，AI技术正悄然改变着我们的生活方式、工作模式以及社会互动。本文旨在深入探讨AI在生活中的具体应用场景，并解析支撑这些应用的关键技术。AI在日常生活中的应用场景智能语音助手智能语音助手如Siri、小爱同学和小度等，已成为许多人日
初识C语言|笑谈函数指针与数组小邓儿◑.◑ c语言
C语言函数指针和函数指针数组：代码世界的“神秘宝藏”家人们，今天咱来唠唠C语言里超“哇塞”的函数指针和函数指针数组，这俩可堪称代码宇宙中的“神秘宝藏”，一旦掌握，那编程水平直接“起飞”，在代码江湖中“大杀四方”都不是事儿。先说说函数指针，这玩意儿就像是给函数定制的“专属导航仪”。你想啊，函数在内存里有它的“小窝”，函数指针呢，就是能精准定位到这个“小窝”的神器。比如说，咱定义一个函数指针int(*
WebRover：专为训练大型语言模型和 AI 应用程序而设计的 Python 库数据集
2024-11-30，由Area-25团队开发的一个专门用于生成高质量网络内容数据集的Python库。该数据集旨在为大型语言模型（LLM）和人工智能应用的训练提供丰富的数据资源。数据集地址：WebRoverDataset|自然语言处理数据集|AI模型训练数据集一、让我们一起来看一下WebRoverWebRover通过智能网络爬虫技术，自动从网络中提取与特定主题相关的内容，并支持多种输入格式，如JS
学习OpenEuler的经验分享 leegong23111 学习华为
学习OpenEuler的实用经验分享想要精通OpenEuler，扎实的基础是首要前提。建议从官方网站下载并研读技术文档，这些文档涵盖内核原理、系统架构和网络模型等关键知识，为后续学习筑牢根基。官方文档不仅全面，还紧密贴合最新版本特性，能让你紧跟技术前沿。比如，在理解OpenEuler内核调度机制时，官方文档详细阐述了任务分配和资源管理原则，让对系统底层运行逻辑有了清晰认知。同时，参考专业书籍也极为
YOLOv11目标检测模型部署到微信小程序上小阿技术 YOLO 目标跟踪人工智能微信小程序目标检测计算机视觉 python
1.效果YOLOv11目标检测模型部署到微信小程序上2.后端主要代码importosimporttimeimportnumpyasnpimporttorchfromflaskimportFlask,request,send_fileimportcv2fromultralyticsimportYOLO#导入YOLOv11模型，需要提前安装ultralytics库#初始化Flask应用app=Flas
Linux网络 TCP socket 我要满血复活网络 linux tcp/ip
TCP简介TCP（TransmissionControlProtocol）是一种面向连接的、可靠的、基于字节流的传输层通信协议。它位于OSI模型的第四层，主要为应用层提供数据传输服务。TCP通过三次握手建立连接，确保数据在发送和接收过程中的准确性和顺序性。TCP的主要特点可靠性：TCP通过序列号、确认应答、超时重传等机制保证数据可靠传输。面向连接：通信双方在传输数据前需要建立连接，通信结束后释放连
人类大脑与大规模神经网络的对比及未来展望东方佑量子变法神经网络人工智能深度学习
引言随着人工智能（AI）技术的迅猛发展，研究人员不断尝试构建更加复杂和强大的模型，以期实现与人类大脑相媲美的智能水平。本文将探讨当前大规模神经网络（LLM,LargeLanguageModels）的发展现状，并基于现有数据对未来进行预测。特别地，我们将分析达到人类大脑突触连接规模所需的时间框架、可能面临的挑战以及使用转义词表技术所带来的优势。人类大脑的基本结构人类大脑是一个极其复杂的系统，包含大约
SVM模型实战1 浊酒南街 #支持向量机机器学习 python
目录前言实战前言这里有一份手写体字母识别的数据，我们采用网格搜索法，分别测试LinearSVC和SVC模型，最终选择SVC模型，并计算预测结果的准确性。实战#导入第三方模块fromsklearnimportsvmimportpandasaspdfromsklearnimportmodel_selectionfromsklearnimportmetrics#读取外部数据letters=pd.read
99.13 金融难点通俗解释：营业利润率金融OG 金融资产组合模型进化论金融 python 机器学习算法大数据
目录0.承前1.简述2.比喻：冰淇淋店的日常开销2.1第一步：基础成本2.2第二步：经营支出2.3第三步：计算营业利润率3.生活中的例子3.1好的营业利润率3.2一般的营业利润率3.3差的营业利润率4.小朋友要注意4.1开销大不一定不好4.2开销小不一定好5.总结6.实现代码0.承前如果想更加全面清晰地了解金融资产组合模型进化论的体系架构，可参考：0.金融资产组合模型进化全图鉴1.简述描述营业利润
4. 马科维茨资产组合模型+Fama-French五因子优化方案（理论+Python实战）金融OG 金融资产组合模型进化论 python java 前端金融数据库机器学习大数据
目录0.承前1.Fama-French五因子优化的现代投资组合理论1.1WhatisFama-French五因子优化的现代投资组合理论1.2WhyisFama-French五因子优化的现代投资组合理论1.3HowtoFama-French五因子优化的现代投资组合理论2.数据要素&计算流程2.1参数集设置2.2数据获取&预处理2.3收益率计算2.4因子构建与预期收益率计算2.5协方差矩阵计算2.6投
2. 马科维茨资产组合模型+CAMP优化方案（理论+Python实战）金融OG 金融资产组合模型进化论人工智能大数据金融 python 数据库机器学习
目录0.承前1.资本资产定价模型(CAPM)优化的现代投资组合理论1.1WhatisCAPM优化的现代投资组合理论1.2WhyisCAPM优化的现代投资组合理论1.3HowtoCAPM优化的现代投资组合理论2.数据要素&计算流程2.1参数集设置2.2数据获取&预处理2.3收益率计算2.4CAPM预期收益率计算2.5协方差矩阵计算2.6投资组合表现计算2.7夏普比率优化2.8持仓筛选3.汇总代码4.
【AI量金术师：简易代码领悟高深金融术语】02.马科维茨资产组合模型Python实战金融OG 高深金融术语私厨人工智能金融 python
目录1.马科维茨资产组合模型简介1.1模型的起源与发展1.2核心概念2.模型的基本假设2.1投资者行为假设2.2市场环境假设3.模型的应用与局限性3.1实际应用3.2局限性探讨4.Python代码案例：实现马科维茨资产组合模型4.1环境准备与数据获取4.2数据收集4.3计算收益率与协方差矩阵4.4随机生成投资组合4.5绘制有效前沿4.6优化求解最优投资组合5.结论与展望1.马科维茨资产组合模型简介
svm python 模型绘图_1SVM处理数据并绘图张炜大师傅 svm python 模型绘图
爬虫Python基础、数据分析扩展包Numpy、pandas、matplotlib，Python读取MySQL数据，Python爬虫及Scrapy框架，无监督机器学习算法聚类分析等，以及案例：互联网金融行业客户价值分析等。机器学习机器学习是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有
深入MapReduce——引入黄雪超大数据基础 #深入MapReduce mapreduce 大数据 hadoop
引入前面我们已经深入了HDFS的设计与实现，对于分布式系统也有了不错的理解。但HDFS仅仅解决了海量数据存储和读写的问题。但要想让数据产生价值，一定是需要从数据中挖掘出价值才行，这就需要我们拥有海量数据的计算处理能力。下面我们还是老样子，来数据一下要实现海量计算处理能力，有些什么核心痛点大数据计算核心痛点量级大在稍微大一点的互联网企业，需要计算处理的数据量都开始以PB计了。而传统的计算处理模型中，
NIO 和 Netty 在 Spring Boot 中的集成与使用阿乾之铭 java 网络开发语言
Netty到底是个啥，有啥子作用1.Netty的本质：对NIO的封装NIO的原生问题：Java的NIO提供了非阻塞I/O和多路复用机制，但其使用较为复杂（如Selector、Channel、Buffer的配置和管理）。开发者需要自己处理线程模型、资源管理、协议解析等底层细节，代码冗长且容易出错。Netty的改进：Netty对NIO进行了高级封装，提供了更加易用的API和灵活的抽象层，例如：Chan
Linux 权限体系详解:、777、755、644、600、chmod、chown、chgrp 和 umask；SUID、SGID 和 Sticky Bit；ACL (访问控制列表) 是什么？小胡说技书手册/开发图谱运维 linux 运维服务器
文章目录1.引言1.1为什么学习Linux权限？1.2本文目标2.Linux权限基础概念2.1权限模型2.2权限类型2.3权限表示法2.3.1字母表示法2.3.2数字表示法2.3.3字母与数字表示法对比2.3.4案例：字母与数字的权限切换3.常见权限分配方法对比表格3.1使用`chmod`分配权限3.2使用`chown`和`chgrp`修改拥有者和用户组3.3使用`umask`设置默认权限4.高级
探秘ARMv7-M架构：打造高效嵌入式系统指南嵇影钰
探秘ARMv7-M架构：打造高效嵌入式系统指南【下载地址】ARMv7-M架构参考手册及应用指南分享本资源包包含：-**ARMv7-MArchitectureReferenceManual**：这是ARM官方发布的权威文档，全面深入地介绍了ARMv7-M架构的核心概念、指令集、内存模型和编程模型等，是开发高性能、低功耗嵌入式系统的理论基础。-**ARMv7-MApplicationLevelRefe
“上海慧眼”超高层建筑的稳定之魂 doubt。知识图谱
“摩羯”“普拉桑”“苏力”不断来袭，作为我国最高的大楼，高达632米的上海中心大厦，是如何做到稳固不倒的？“上海慧眼”阻尼器发挥着至关重要的作用，"慧眼"本质上是一种摆式电涡流调谐质量阻尼器。其核心是一个大质量物体，惯性是这个物体作用的的关键。这个物体由配重物和吊索构成，类似巨型复摆。重达1000吨，距离地面583米，其单边摆幅的极限为2米，在正常情况下，阻尼器的摆动幅度非常小，但在强风等极端条件
ARMv7-M架构参考手册及应用指南董鉴勃
ARMv7-M架构参考手册及应用指南【下载地址】ARMv7-M架构参考手册及应用指南分享本资源包包含：-**ARMv7-MArchitectureReferenceManual**：这是ARM官方发布的权威文档，全面深入地介绍了ARMv7-M架构的核心概念、指令集、内存模型和编程模型等，是开发高性能、低功耗嵌入式系统的理论基础。-**ARMv7-MApplicationLevelReference
国内领先的AI智能体平台大比拼 zhulangfly AI 人工智能智能体
在当今人工智能飞速发展的时代，AI智能体平台如雨后春笋般涌现，为各行业带来了前所未有的创新机遇。今天，我们就来深入了解一下国内几家做得相当出色的AI智能体平台，包括百度的文心智能体平台、阿里巴巴的魔塔智能体平台、腾讯的元器智能体开放平台以及字节跳动的扣子AI平台，看看它们各自都有哪些独特之处，以及在市场中的表现如何。一、百度文心智能体平台详细介绍百度文心智能体平台依托百度强大的人工智能技术研发实力
从自然语言到提示词：编程范式的革命 AI天才研究院计算机软件编程原理与应用实践大数据AI人工智能 java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
从自然语言到提示词：编程范式的革命关键词：编程范式、自然语言处理、提示词编程、人工智能、算法原理摘要：随着人工智能技术的不断发展，编程范式正经历着从自然语言处理向基于提示词的人工智能编程模式的转变。本文旨在探讨这一转变的背景、动机、原理及其在软件开发实践和工程方法论中的影响。文章将逐步分析自然语言处理和提示词编程的核心概念，讲解算法原理和数学模型，并通过实际案例展示编程范式转变的应用效果。第一部分
大模型WebUI：Gradio全解11——Chatbot：融合大模型的多模态聊天机器人（5）龙焰智能 gradio events undo retry like edit
大模型WebUI：Gradio全解11——Chatbot：融合大模型的多模态聊天机器人（5）前言本篇摘要11.Chatbot：融合大模型的多模态聊天机器人11.5Chatbot的特殊Events11.5.1各事件总演示11.5.2详解.undo、.retry、.like和.edit事件1..undo：撤销2..retry：重试3..like：点赞4..edit：编辑参考文献前言本系列文章主要介绍W
信息流广告预估技术在美团外卖的实践思维导图-java架构用心去追梦 java 架构开发语言
创建一个关于“信息流广告预估技术在美团外卖的实践”的思维导图，并且专注于Java架构下的实现，可以按照以下结构来组织内容。这个思维导图将涵盖从数据收集、特征工程、模型选择与训练、系统架构设计到性能优化和效果评估的关键领域。思维导图结构1.项目背景美团外卖平台简介用户群体与市场定位信息流广告的意义提升用户体验增加广告收益2.用户及上下文数据收集数据来源用户行为（点击、浏览、下单等）广告主提供的创意素
fps游戏服务器架构设计你一身傲骨怎能输游戏服务器运维
FPS（First-PersonShooter，第一人称射击游戏）服务器的架构设计需要考虑到游戏性能、实时性、可扩展性和安全性等多方面的需求。以下是一个基本的FPS游戏服务器架构设计：客户端-服务器模型：采用客户端-服务器模型，游戏客户端负责呈现游戏画面、获取用户输入、播放音效等，游戏服务器负责处理游戏逻辑、同步玩家状态、检测作弊等。客户端和服务器通过网络进行实时通信。高性能网络通信：FPS游戏对
【AI论文】PaSa：一款用于全面学术论文搜索的大型语言模型（LLM）代理东临碣石82 人工智能语言模型自然语言处理
摘要：我们推出了PaSa，这是一款由大型语言模型驱动的高级论文搜索代理。PaSa能够自主做出一系列决策，包括调用搜索工具、阅读论文以及选择相关参考文献，从而最终为复杂的学术查询提供全面且准确的结果。我们使用强化学习方法和一个合成数据集AutoScholarQuery对PaSa进行了优化，该数据集包含3.5万个细粒度的学术查询以及来自顶级人工智能会议出版物的相应论文。此外，我们还开发了RealSch
gradio库的基本使用 Echo..... python python
Gradio（通过pipinstallgradio安装）是一个用于创建交互式界面的Python库。它允许你基于预训练模型、函数或任意代码块创建实时演示和部署模型的图形用户界面（GUI）。使用Gradio库，你可以轻松创建Web界面，用于输入数据、调用模型、显示结果，并为用户提供与模型交互的功能。它支持多种输入类型（如文本框、图片上传、滑块等）和输出展示方式（如图像展示、文本展示等）。你可以根据需要
大型语言模型高效预训练策略的比较研究二进制独立开发非纯粹GenAI 深度思索 GenAI与Python 语言模型深度学习人工智能自然语言处理 python 开发语言机器学习
文章目录摘要1.引言2.背景与挑战2.1LLM中的预训练2.2扩展LLM的挑战3.高效预训练策略3.1增量训练3.1.1理论基础3.1.2实际实现3.1.3实验结果3.2混合优化3.2.1理论基础3.2.2实际实现3.2.3实验结果3.3其他新兴技术3.3.1知识蒸馏3.3.2稀疏训练3.3.3数据增强3.3.4迁移学习4.比较分析4.1性能指标4.2增量训练vs.混合优化4.2.1模型精度4.2
ChatGPT写作助手：论文写作必备提示词一览学境思源AcademicIdeas 学境思源 ChatGPT AI写作 chatgpt
随着人工智能技术的发展，ChatGPT在学术写作领域的应用越来越广泛。它不仅能够帮助撰写论文，还可以通过不同的提示词完成构思、文献综述、数据分析、润色等任务，极大提升写作效率。今天的内容将分享ChatGPT在论文写作中最常用的提示词，帮助学术工作者更好地利用这一工具，从构思到定稿，全方位提升写作体验与效率。1.论文构思与选题目的：帮助确定研究方向、制定研究问题和目标。常用提示词：“提出一个关于[主
题目：解码方法（来自leetcode）动态规划----斐波那契模型清风逸梦 leetcode 动态规划算法
解码方法题目动态规划（5步走）状态表示状态转移方程初始化填表顺序返回值代码题目链接题目动态规划（5步走）状态表示dp[i]表示为从下标i之前的的解码数。状态转移方程以i位置为终点，下标为i的位置有两种方式：第一种就是单独解码，第二种就是与前面的一位数合并解码。单独解码有分两种情况：第一种是：当s[i]在[1，9]时可以单独解码，就相当于在dp[i-1]种情况后接上一个单独解码，所以dp[i]=dp
C/C++Win32编程基础详解视频下载择善Zach 编程 C++Win32
课题视频：C/C++Win32编程基础详解视频知识：win32窗口的创建 windows事件机制主讲：择善Uncle老师学习交流群：386620625 验证码：625 --
Guava Cache使用笔记 bylijinnan java guava cache
1.Guava Cache的get/getIfPresent方法当参数为null时会抛空指针异常我刚开始使用时还以为Guava Cache跟HashMap一样，get(null)返回null。实际上Guava整体设计思想就是拒绝null的，很多地方都会执行com.google.common.base.Preconditions.checkNotNull的检查。 2.Guava
解决ora-01652无法通过128（在temp表空间中） 0624chenhong oracle
解决ora-01652无法通过128（在temp表空间中）扩展temp段的过程一个sql语句后，大约花了10分钟，好不容易有一个结果，但是报了一个ora-01652错误，查阅了oracle的错误代码说明：意思是指temp表空间无法自动扩展temp段。这种问题一般有两种原因：一是临时表空间空间太小，二是不能自动扩展。分析过程：既然是temp表空间有问题，那当
Struct在jsp标签不懂事的小屁孩 struct
非UI标签介绍：控制类标签： 1：程序流程控制标签 if elseif else <s:if test="isUsed"> <span class="label label-success">True</span> </
按对象属性排序换个号韩国红果果 JavaScript 对象排序
利用JavaScript进行对象排序，根据用户的年龄排序展示 <script> var bob={ name;bob, age:30 } var peter={ name;peter, age:30 } var amy={ name;amy, age:24 } var mike={ name;mike, age:29 } var john={
大数据分析让个性化的客户体验不再遥远蓝儿唯美数据分析
顾客通过多种渠道制造大量数据，企业则热衷于利用这些信息来实现更为个性化的体验。分析公司Gartner表示，高级分析会成为客户服务的关键，但是大数据分析的采用目前仅局限于不到一成的企业。挑战在于企业还在努力适应结构化数据，疲于根据自身的客户关系管理（CRM）系统部署有效的分析框架，以及集成不同的内外部信息源。然而，面对顾客通过数字技术参与而产生的快速变化的信息，企业需要及时作出反应。要想实
java笔记4 a-john java
操作符 1，使用java操作符操作符接受一个或多个参数，并生成一个新值。参数的形式与普通的方法调用不用，但是效果是相同的。加号和一元的正号（+）、减号和一元的负号（-）、乘号（*）、除号（/）以及赋值号（=）的用法与其他编程语言类似。操作符作用于操作数，生成一个新值。另外，有些操作符可能会改变操作数自身的
从裸机编程到嵌入式Linux编程思想的转变------分而治之：驱动和应用程序 aijuans 嵌入式学习
笔者学习嵌入式Linux也有一段时间了，很奇怪的是很多书讲驱动编程方面的知识，也有很多书将ARM9方面的知识，但是从以前51形式的（对寄存器直接操作，初始化芯片的功能模块）编程方法，和思维模式，变换为基于Linux操作系统编程，讲这个思想转变的书几乎没有，让初学者走了很多弯路，撞了很多难墙。笔者因此写上自己的学习心得，希望能给和我一样转变
在springmvc中解决FastJson循环引用的问题 asialee 循环引用 fastjson
我们先来看一个例子： package com.elong.bms; import java.io.OutputStream; import java.util.HashMap; import java.util.Map; import co
ArrayAdapter和SimpleAdapter技术总结百合不是茶 android SimpleAdapter ArrayAdapter 高级组件基础
ArrayAdapter比较简单，但它只能用于显示文字。而SimpleAdapter则有很强的扩展性，可以自定义出各种效果 ArrayAdapter;的数据可以是数组或者是队列 // 获得下拉框对象 AutoCompleteTextView textview = (AutoCompleteTextView) this
九封信 bijian1013 人生励志
有时候，莫名的心情不好，不想和任何人说话，只想一个人静静的发呆。有时候，想一个人躲起来脆弱，不愿别人看到自己的伤口。有时候，走过熟悉的街角，看到熟悉的背影，突然想起一个人的脸。有时候，发现自己一夜之间就长大了。 2014，写给人
Linux下安装MySQL Web 管理工具phpMyAdmin sunjing PHP Install phpMyAdmin
PHP http://php.net/ phpMyAdmin http://www.phpmyadmin.net Error compiling PHP on CentOS x64 一、安装Apache 请参阅http://billben.iteye.com/admin/blogs/1985244 二、安装依赖包 sudo yum install gd
分布式系统理论 bit1129 分布式
FLP One famous theory in distributed computing, known as FLP after the authors Fischer, Lynch, and Patterson, proved that in a distributed system with asynchronous communication and process crashes,
ssh2整合(spring+struts2+hibernate)-附源码白糖_ eclipse spring Hibernate mysql 项目管理
最近抽空又整理了一套ssh2框架，主要使用的技术如下： spring做容器，管理了三层(dao,service,actioin)的对象 struts2实现与页面交互(MVC)，自己做了一个异常拦截器，能拦截Action层抛出的异常 hibernate与数据库交互 BoneCp数据库连接池，据说比其它数据库连接池快20倍，仅仅是据说 MySql数据库项目用eclipse
treetable bug记录 braveCS table
// 插入子节点删除再插入时不能正常显示。修改： //不知改后有没有错，先做个备忘 Tree.prototype.removeNode = function(node) { // Recursively remove all descendants of +node+ this.unloadBranch(node); // Remove
编程之美-电话号码对应英语单词 bylijinnan java 算法编程之美
import java.util.Arrays; public class NumberToWord { /** * 编程之美电话号码对应英语单词 * 题目： * 手机上的拨号盘，每个数字都对应一些字母，比如2对应ABC，3对应DEF.........，8对应TUV，9对应WXYZ， * 要求对一段数字，输出其代表的所有可能的字母组合
jquery ajax读书笔记 chengxuyuancsdn jQuery ajax
1、jsp页面 <%@ page language="java" import="java.util.*" pageEncoding="GBK"%> <% String path = request.getContextPath(); String basePath = request.getScheme()
JWFD工作流拓扑结构解析伪码描述算法 comsci 数据结构算法工作活动 J#
对工作流拓扑结构解析感兴趣的朋友可以下载附件，或者下载JWFD的全部代码进行分析 /* 流程图拓扑结构解析伪码描述算法 public java.util.ArrayList DFS(String graphid, String stepid, int j)
oracle I/O 从属进程 daizj oracle
I/O 从属进程　　I/O从属进程用于为不支持异步I/O的系统或设备模拟异步I/O.例如，磁带设备(相当慢)就不支持异步I/O.通过使用I/O 从属进程，可以让磁带机模仿通常只为磁盘驱动器提供的功能。就好像支持真正的异步I/O 一样，写设备的进程(调用者)会收集大量数据，并交由写入器写出。数据成功地写出时，写入器(此时写入器是I/O 从属进程，而不是操作系统)会通知原来的调用者，调用者则会
高级排序:希尔排序 dieslrae 希尔排序
public void shellSort(int[] array){ int limit = 1; int temp; int index; while(limit <= array.length/3){ limit = limit * 3 + 1;
初二下学期难记忆单词 dcj3sjt126com english word
kitchen 厨房 cupboard 厨柜 salt 盐 sugar 糖 oil 油 fork 叉；餐叉 spoon 匙；调羹 chopsticks 筷子 cabbage 卷心菜；洋白菜 soup 汤 Italian 意大利的 Indian 印度的 workplace 工作场所 even 甚至；更 Italy 意大利 laugh 笑 m
Go语言使用MySQL数据库进行增删改查 dcj3sjt126com mysql
目前Internet上流行的网站构架方式是LAMP，其中的M即MySQL, 作为数据库，MySQL以免费、开源、使用方便为优势成为了很多Web开发的后端数据库存储引擎。MySQL驱动Go中支持MySQL的驱动目前比较多，有如下几种，有些是支持database/sql标准，而有些是采用了自己的实现接口,常用的有如下几种: http://code.google.c...o-mysql-dri
git命令 shuizhaosi888 git
---------------设置全局用户名： git config --global user.name "HanShuliang" //设置用户名 git config --global user.email "[email protected]" //设置邮箱 ---------------查看环境配置 git config --li
qemu-kvm 网络 nat模式 (四) haoningabc kvm qemu
qemu-ifup-NAT #!/bin/bash BRIDGE=virbr0 NETWORK=192.168.122.0 GATEWAY=192.168.122.1 NETMASK=255.255.255.0 DHCPRANGE=192.168.122.2,192.168.122.254 TFTPROOT= BOOTP= function check_bridge()
不要让未来的你，讨厌现在的自己 jingjing0907 生活奋斗工作梦想
故事one 　23岁，他大学毕业，放弃了父母安排的稳定工作，独闯京城，在家小公司混个小职位，工作还算顺手，月薪三千，混了混，混走了一年的光阴。　　　　24岁，有了女朋友，从二环12人的集体宿舍搬到香山民居，一间平房，二人世界，爱爱爱。偶然约三朋四友，打扑克搓麻将，日子快乐似神仙；　　　　25岁，出了几次差，调了两次岗，薪水涨了不过百，生猛狂飙的物价让现实血淋淋，无力为心爱银儿购件大牌
枚举类型详解一路欢笑一路走 enum 枚举详解 enumset enumMap
枚举类型详解一.Enum详解 1.1枚举类型的介绍 JDK1.5加入了一个全新的类型的”类”—枚举类型，为此JDK1.5引入了一个新的关键字enum,我们可以这样定义一个枚举类型。 Demo:一个最简单的枚举类 public enum ColorType { RED
第11章动画效果（上） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Eclipse中jsp、js文件编辑时，卡死现象解决汇总 ljf_home eclipse jsp卡死 js卡死
使用Eclipse编辑jsp、js文件时，经常出现卡死现象，在网上百度了N次，经过N次优化调整后，卡死现象逐步好转，具体那个方法起到作用，不太好讲。将所有用过的方法罗列如下： 1、取消验证 windows–>perferences–>validation 把除了manual 下面的全部点掉，build下只留 classpath dependency Valida
MySQL编程中的6个重要的实用技巧 tomcat_oracle mysql
每一行命令都是用分号(;)作为结束对于MySQL，第一件你必须牢记的是它的每一行命令都是用分号(;)作为结束的，但当一行MySQL被插入在PHP代码中时，最好把后面的分号省略掉，例如： mysql_query("INSERT INTO tablename(first_name,last_name)VALUES('$first_name',$last_name')");
zoj 3820 Building Fire Stations(二分+bfs) 阿尔萨斯 Build
题目链接：zoj 3820 Building Fire Stations 题目大意：给定一棵树，选取两个建立加油站，问说所有点距离加油站距离的最大值的最小值是多少，并且任意输出一种建立加油站的方式。解题思路：二分距离判断，判断函数的复杂度是o(n)，这样的复杂度应该是o(nlogn)，即使常数系数偏大，但是居然跑了4.5s，也是醉了。判断函数里面做了3次bfs，但是每次bfs节点最多

大语言模型在天猫AI导购助理项目的实践！

ChatGPT基本原理

技术交流群

Prompt设计

大模型SFT（supervised fine tuning）

▐ 预训练 VS 微调

▐ LoRA VS 全参数微调

▐ C-Eval评估

手机天猫AI导购助理项目落地应用

▐ 项目背景

▐ 算法框架

▐ 语料收集

▐ 模型训练

▐ 模型部署&调用

达摩院千问

Whale私有化

EAS

▐ 模型评测

参考链接

你可能感兴趣的:(机器学习,人工智能,语言模型,自然语言处理,大模型,计算机视觉)