junewgl

Text-to-SQL小白入门（九）InstructGPT论文：教你如何训练ChatGPT

论文概述

InstructGPT和ChatGPT 的训练流程基本一致，ChatGPT是改进后的InstructGPT，比如InstructGPT是基于GPT-3训练，而ChatGPT是基于GPT-3.5训练。

基本信息

英文标题：Training language models to follow instructions with human feedback
中文标题：通过人类反馈的指令训练语言模型
发表时间：2023年3月 arxiv
作者单位：Open AI
论文链接：https://arxiv.org/pdf/2203.02155.pdf
代码链接：GitHub - openai/following-instructions-human-feedback

学习InstructGPT论文之前，想了解了基本的LLM或者RLHF流程，可以看看组织「eosphoros-ai」（今年的8000+star的开源项目DB-GPT的开源社区）提出的LLM+Text2SQL汇总项目：https://github.com/eosphoros-ai/Awesome-Text2SQL,里面也收集了一些微调SFT（lora, qlora, p-tuning等），RLHF相关的论文（比如RLHF，RRHF，RLTF, RRTF， RLAIF等等），目前也有300+的star，持续更新中，欢迎围观使用star!

摘要

背景

使语言模型更大并不能使它们更好地遵循用户的意图。例如，大型语言模型可能生成不真实的(untruthful)、有害的(toxic)或对用户没有帮助(not helpful)的输出。

贡献/方法

在本文中，作者展示了一种方法，通过使用人类反馈进行微调，在广泛的任务中使语言模型与用户意图保持一致。

先使用有监督微调SFT
然后收集一批rank排序的模型输出
再使用人类反馈的强化学习rlhf微调
最终得到的模型叫做InstructGPT

结果：参数量小了100倍，性能差不多。真实性⬆️、有毒⬇️、精度⬇️（轻微）

结果惊艳：

1.3b参数的InstructGPT的模型输出和175b GPT-3的输出很类似。
在公共NLP数据集上，InstructGPT模型显示出真实性的改进和有毒输出生成的减少，同时性能下降最小

结论：

尽管InstructGPT仍然会犯一些简单的错误，但结果表明，根据人类反馈进行微调是使语言模型与人类意图保持一致的一个有希望的方向。

结果

API prompt distribution

参数说明：

- 横坐标是模型参数大小，纵坐标是和175B GPT SFT比较赢的概率（比如绿色的线条，横坐标为175B时候，赢的概率刚好为0.5，此时就是175B GPT SFT vs 175B GPT SFT ）
- GPT就是最普通的模型
- GPT(prompted)就是给几个例子few-shot
- SFT 有监督微调
- PPO 用强化学习
- PPO-ptx：在PPO算法期间，使用pretraining mix （但是几乎没有什么效果）

对比的模型是SFT 175B，可以发现的是1.3B PPO或者PPO-ptx已经超过0.5的概率赢175B，说明方法很有效。
InstructGPT就是PPO-ptx

论文还在 public NLP dataset进行了实验，InstructGPT模型在公有NLP数据集上有“对齐税”导致性能下降，可能是因为API prompt 训练的原因。

论文还公布了qualitative results，InstructGPT模型泛化能力很强，具体实验参考原论文。

结论

对齐研究alignment research的影响

提高模型对齐度的成本比预训练低。
InstructGPT泛化能力强，可以推广到没有监督数据的领域。
通过微调，可以减少性能下降
验证了对齐技术在现实生活中应用

对齐的是什么？

人类偏好，人类价值观 --> 标注者的偏好、OpenAI 研究人员的偏好、API 用户的偏好。

核心方法

RLHF架构图

基础背景知识

RLHF方法最早是2017年提出：Deep reinforcement learning from human preferences（2017）
在2020年RLHF文章「Learning to summarize from human feedback（2020」中，RM训练使用了两个模型在相同input情况下的output进行比较，使用交叉熵损失。——InstructGPT使用KL散度
PPO算法，也是Open AI 2017年提出的：Proximal policy optimization algorithms（2017），这篇文章的作者「John Schulman」也在InstructGPT作者名单中。

这个图也是经典大图了，RLHF实践参考的范式，RLHF主要分成了3个阶段：

第一阶段：SFT
第二阶段：RM
第三阶段：RL （使用PPO算法：proximal policy optimization 最近策略优化），对第三阶段进行一个简单解释：

- 输入一个标注数据，模型经过PPO算法输出一个response
- RM模型对response打分
- 根据打分score更新PPO策略。

PPO算法具体是什么呢？——（留个坑，后续补上）

详情参考论文：Schulman, J., Wolski, F., Dhariwal, P., Radford, A., and Klimov, O. (2017). Proximal policy optimization algorithms. arXiv preprint arXiv:1707.06347.

SFT

数据格式

prompt - output

更直观一点，以一个具体的小任务比如Text2SQL为例子，构造的数据集如下所示：

来源知乎文档：Text-to-SQL小白入门（八）RLAIF论文：AI代替人类反馈的强化学习

{"prompt": "I want you to act as a SQL terminal in front of an example database, you need only to return the sql command to me.Below is an instruction that describes a task, Write a response that appropriately completes the request.\n\"\n##Instruction:\ndepartment_management contains tables such as department, head, management. Table department has columns such as Department_ID, Name, Creation, Ranking, Budget_in_Billions, Num_Employees. Department_ID is the primary key.\nTable head has columns such as head_ID, name, born_state, age. head_ID is the primary key.\nTable management has columns such as department_ID, head_ID, temporary_acting. department_ID is the primary key.\nThe head_ID of management is the foreign key of head_ID of head.\nThe department_ID of management is the foreign key of Department_ID of department.\n###Input:\nHow many heads of the departments are older than 56 ?\n\n###Response:","output": "SELECT count(*) FROM head WHERE age  >  56"}

实验参数

参数如下：

base model——GPT-3
epoch——16
lr decay——cosine
dropout——0.2

选择最终的SFT模型时，是根据验证集上的RM分数。

惊讶点：

1个epoch后已经过拟合了，但是为了后续的RM分数，还是多跑几轮epoch

RM

数据格式

prompy-chosen-rejected

同样的，以Text2SQL任务为例子，构造的数据集如下所示：

{"prompt": "I want you to act as a SQL terminal in front of an example database, you need only to return the sql command to me.Below is an instruction that describes a task, Write a response that appropriately completes the request.\n\"\n##Instruction:\ndepartment_management contains tables such as department, head, management. Table department has columns such as Department_ID, Name, Creation, Ranking, Budget_in_Billions, Num_Employees. Department_ID is the primary key.\nTable head has columns such as head_ID, name, born_state, age. head_ID is the primary key.\nTable management has columns such as department_ID, head_ID, temporary_acting. department_ID is the primary key.\nThe head_ID of management is the foreign key of head_ID of head.\nThe department_ID of management is the foreign key of Department_ID of department.\n###Input:\nHow many heads of the departments are older than 56 ?\n\n###Response:","chosen": "SELECT count(*) FROM head WHERE age  >  56","rejected":"SELECT COUNT(head_name) FROM head WHERE age > 56;"}

实验参数

base model: 是GPT-3 SFT之后的模型，但是去掉了最后一层

- 因为原始模型输入是prompt，输出是response
- 现在需要模型输入是prompt + response，输出是score

参数量仅选择的6B大小

为什么RM模型选6B，不是175B?

- 6B 减少计算量
- 175B 训练不稳定

标注者，需要对K=4 和 K=9之间的response进行排序，会产生C(k, 2)个两两比较pair
一个epoch中，对所有的C(k, 2)比较对训练，一次传播loss

损失函数：

x代表输入的prompt；y_w代表chosen_data; y_l代表rejected_data; D代表实验数据集
r_θ(x,y)代表RM模型输入prompt x和response y的输出得分

最后要对奖励归一化，使得平均奖励为0。

RL

数据格式

prompt-output

和SFT阶段数据格式一致。

{"prompt": "I want you to act as a SQL terminal in front of an example database, you need only to return the sql command to me.Below is an instruction that describes a task, Write a response that appropriately completes the request.\n\"\n##Instruction:\ndepartment_management contains tables such as department, head, management. Table department has columns such as Department_ID, Name, Creation, Ranking, Budget_in_Billions, Num_Employees. Department_ID is the primary key.\nTable head has columns such as head_ID, name, born_state, age. head_ID is the primary key.\nTable management has columns such as department_ID, head_ID, temporary_acting. department_ID is the primary key.\nThe head_ID of management is the foreign key of head_ID of head.\nThe department_ID of management is the foreign key of Department_ID of department.\n###Input:\nHow many heads of the departments are older than 56 ?\n\n###Response:","output": "SELECT count(*) FROM head WHERE age  >  56"}

实验参数

1.RM可以和RL重复多轮迭代——这样构建更多数据，越来越趋近于人类偏好。

SFT训练->训练一个RM->训练一个RL->不断重复下面的步骤：

- 构建RM数据->重新训练一个RM->重新训练一个RL->
- 构建RM数据->重新训练一个RM->重新训练一个RL->
- 构建RM数据->重新训练一个RM->重新训练一个RL->

2.实践中，大部分的比较数据来源于SFT的数据，少部分数据来源于RL模型的比较数据。

继2020文章「Learning to summarize from human feedback」之后，作者再次使用PPO对环境中的SFT模型进行了微调。
额外增加了 KL散度。
额外增加了预训练梯度——目的是为了减少在NLP数据集上性能倒退，所以InstructGPT模型 == PPO-ptx

π^RL代表学习到的强化学习RL模型； π^SFT代表SFT阶段训练的模型。

为什么用π表示？为什么用除法表示？这就是强化学习的基本概念

从状态State到动作Action的过程就称之为一个策略Policy，一般用π表示(可以理解为一个函数表示)，也就是在强化学习阶段需要找到一个关系：a=π(s) 或者是 π(a|s)， a 就是action, s就是state

D_pretrain代表预训练阶段的数据分布；D_π^RL代表强化学习阶段的数据分布
r_θ(x,y)代表RM模型输入prompt x和response y的输出得分
β是控制KL奖励的系数； γ是控制预训练梯度的系数，如果是普通的PPO，那么γ=0

数据收集

之前听一个大学教授的讲座，有个观点很有意思：Open AI做大模型为什么比谷歌强，因为包括transformer在内的一些创新模型大多是谷歌研究的，那为什么Open AI在大模型领域为什么比谷歌强？答：因为Open AI在数据清洗，数据质量把控这方面做的很好。——所以数据是相当重要的！

API数据

为了训练本文的最终InstructGPT

prompt dataset 主要由OpenAI 的API获得，用户和API交互，把这些数据收集起来（前提是用户使用的时候就告知数据要被收集），此时的API是早期的InstructGPT模型，并且没有使用用户在生产中使用API的数据。

API数据分布如下，主要有9类。

那么问题来了？早期的InstructGPT模型的训练数据怎么来？

通过人工标注的有监督学习训练得到的

对API收集的数据做了一些处理：

去除重复的提示：通过检查公共前缀（感觉回到了leetcode刷题，求两个字符串的最长公共前缀）
每个用户不超过200条prompt：应该是避免单独个体的偏好
基于用户id，划分train，val，test——这样验证集和测试集就不包含来自训练集中的用户的数据

- 比如训练数据用id 1, 2, 3, 4的所有数据
- 测试的数据用id 5的数据。

过滤掉了个人身份信息的数据

人工标注数据

主要是为了训练早期的InstructGPT

标注者被要求手写以下三种类型的prompt:

plain：标记人员提出任意的简单任务，同时保证任务的多样性
few-shot：标注人员提出一条指令instruction，以及该指令的多个查询/响应对（query/response)
user-based：标注人员在OpenAI 提供的API中获取用例，标注人员需要给出这些用例相对应的instruction

数据量级

数据中96%以上是英文，其它20个语种例如中文，法语，西班牙语等加起来不到4%，这可能导致InstructGPT/ChatGPT能进行其它语种的生成时，效果应该远不如英文

SFT 数据，大概13k
RM 数据，大概33k
PPO数据，大概31k

论文还有大量的附录数据详情，可以参考论文原文，比如标注人员分布，数据示例，数据标注等等，不得不说，Open AI数据扎实，正文20页，附录48页，总共68页。

其他文章

Text-to-SQL小白入门（一）综述文章学习

Text-to-SQL小白入门（二）Transformer学习

Text-to-SQL小白入门（三）IRNet：引入中间表示SemQL

Text-to-SQL小白入门（四）指令进化大模型WizardLM

Text-to-SQL小白入门（五）开源代码大模型Code Llama

Text-to-SQL小白入门（六）Awesome-Text2SQL项目介绍

Text-to-SQL小白入门（七）PanGu-Coder2论文——RRTF

Text-to-SQL小白入门（八）RLAIF论文：AI代替人类反馈的强化学习

OpenAI发布"深度研究"AI助手：开启复杂问题分析新纪元
OpenAI近日宣布推出一款新的AI"代理"，旨在帮助用户通过ChatGPT平台进行深入、复杂的研究工作。这项新功能被恰如其分地命名为"深度研究"（deepresearch）。根据OpenAI周日发布的博客文章，这项新功能主要面向"在金融、科学、政策和工程等领域从事密集知识工作，需要进行全面、精确和可靠研究的人群"。该公司还表示，对于那些需要仔细研究才能做出购买决定的商品，如汽车、家电和家具等，这
为什么尽量避免使用 `IN` 和 `NOT IN`？数据库数据库性能优化后端
为什么尽量避免使用IN和NOTIN？前言在SQL查询中，IN和NOTIN是常用的关键字，用于筛选符合条件的数据。然而，尽管它们使用方便，但在某些情况下，使用它们可能会导致效率低下或查询结果不准确。本文将从效率和潜在问题两个角度，深入探讨为什么应尽量避免使用IN和NOTIN，并提供替代方案。一、效率问题1.NOTIN的性能瓶颈在SQL查询中，NOTIN往往会导致性能问题，尤其是在处理大数据集时。以下
MySQL 插入数据指南 wjs2024 开发语言
MySQL插入数据指南引言MySQL是一款广泛使用的开源关系数据库管理系统，被广泛应用于各种规模的组织中。在数据库管理中，数据的插入是基础操作之一。本文将详细介绍如何在MySQL中插入数据，包括插入单条记录和多条记录，以及一些高级插入技术。准备工作在开始之前，请确保您已经：安装并配置了MySQL数据库。创建了一个数据库和一个表。连接到MySQL数据库。插入单条记录插入单条记录是最基本的插入操作。以
Neo4j图数据库初识六尘知识图谱 nosql neo4j 数据库
graphdatabase图数据库的笔记之Neo4j图数据库初识目录什么是图数据库为什么使用图数据库Neo4j的下载安装Cypher查询语言Neo4j的各类API事务Neo4j数据建模大规模数据导入neo4j一.什么是图数据库关键词：存储图结构数据，NoSQLNeo4j的基本要素(构造单元)：结点，关系，属性二.为什么使用图数据库最大优势：查询的高性能举例说明：RDBMS-MySQLVS.Grap
neo4j初识笔记（一）（python操作篇）夏么 python neo4j python neo4j
1、安装驱动pipinstallpy2neo2、插入数据#-*-coding:UTF-8-*-frompy2neoimportGraph,Node,Relationship#连接neo4j数据库，输入地址、用户名、密码graph=Graph('http://192.168.25.223:7474',username='neo4j',password='123456')defcreate_date(
mysql sqlite 语法_SQLite SQL语法详解 weixin_39880621 mysql sqlite 语法
SELECTsql-statement::=SELECT[ALL|DISTINCT]result[FROMtable-list][WHEREexpr][GROUPBYexpr-list][HAVINGexpr][compound-opselect]*[ORDERBYsort-expr-list][LIMITinteger[(OFFSET|,)integer]]result::=result-col
SQLite 语句详解曦德1 android_sqlite SQLite
SQLiteOpenHelper几个重要方法：onCreate(SQLiteDatabasedb)；用于初次使用软件时生成数据库表当调用SQLiteOpenHelper的getWritableDatabase()或者getReadableDatabase()方法获取用于操作数据库的SQLiteDatabase实例的时候，如果数据库不存在，Android系统会自动生成一个数据库，接着调用onCrea
关于Sqlite数据库Update语句的一点介绍 maqiutian sqlite 数据库 mysql
sqlite数据库不支持update……from语句，但可以用两种不同的方法来替代它，本文主要介绍了这一过程，接下来就让我们一起学习吧。AD：Sqlite数据库中的Update语句，你能了解多少呢？因为这种微型数据库用到的语句非常少，所以可能我们不会经常的用到。但要想真正的玩转sqlite这种微型数据库，掌握这些语句的用法是非常重要的。本文我们就来介绍一下update语句的使用。1.典型的Upda
Android——SQLite数据库使用详解 2401_89760782 数据库 android sqlite
登录后的页面activity_index.xml，这个页面就显示了一个用户的姓名（开始还有几个测试按钮，之后感觉不好看删除了O(∩_∩)O哈哈~，你们可以自己加几个按钮测试）页面，样式代码都在这里了，还一张背景图片，可以到网上随便找一张。下面来看看数据库操作的代码。TUser.java相当于实体类。packagecom.example.androiddemo01.model;publicclass
SQLite Update 语句详解 wjs2024 开发语言
SQLiteUpdate语句详解SQLite是一款轻量级的数据库管理系统，以其简单、易用和高效的特点在全球范围内得到了广泛的应用。在SQLite中，UPDATE语句是用于修改数据库表中记录的常用命令。本文将详细解析SQLite的UPDATE语句，包括其语法、用法以及注意事项。1.UPDATE语句基本语法UPDATE语句的基本语法如下：UPDATEtable_nameSETcolumn1=value
【项目实战】Android应用程序架构，MVC、MVP、MVVM三种模式介绍本本本添哥 011 -物联网车联网与车载系统开发 android 架构 mvc
一、Android应用程序架构汇总简单的Android应用程序架构，包括MVC、MVP和MVVM模式。二、MVC模式介绍MVC（Model-View-Controller）模式2.1MVC模式组成部分MVC模式将应用程序分为三个主要组成部分：Model、View和Controller。Model：负责处理应用程序的数据和业务逻辑。它与数据库进行交互，获取数据并处理数据。View：负责呈现用户界面。
第1章-PostgreSQL（PG）介绍我心中有一片海 #PostgreSQL数据库基础 postgresql 数据库 dba
第1章-PostgreSQL（PG）介绍1、简介2、排名3、发展4、应用5、优势6、对比1、简介PostgreSQL是一种特性非常齐全的自由软件的对象-关系型数据库管理系统（ORDBMS），是以加州大学计算机系开发的POSTGRES，4.2版本为基础的对象关系型数据库管理系统。POSTGRES的许多领先概念只是在比较迟的时候才出现在商业网站数据库中。PostgreSQL支持大部分的SQL标准并且提
第2章-PostgreSQL 15安装及登录我心中有一片海 #PostgreSQL数据库基础 PostgreSQL 数据库 dba
第2章-PostgreSQL15安装及登录1、windows安装2、centos/redhat安装（在线安装）3、源码安装4、登录4.1本地登录4.2远程登录1、windows安装按照提示双击安装包一步一步操作即可2、centos/redhat安装（在线安装）#安装源sudoyuminstall-yhttps://download.postgresql.org/pub/repos/yum/repo
技术速递｜测试和 .NET Aspire 入门微软Reactor .net 自动化
作者：AaronPowell-PrincipalCloudAdvocate排版：AlanWang自动化测试是软件开发的一个重要组成部分，有助于确保在早期发现漏洞并防止回归问题。在这篇博文中，我们将探讨如何开始在.NETAspire中进行测试，以便我们能够测试分布式应用程序中的各种场景。测试分布式应用程序分布式应用程序本质上很复杂，您需要确保数据库、缓存等组件可用且处于正确状态。然后您的应用程序可能
Golang 应用的 Docker 部署方式介绍及使用详解特立独行的猫a Go语言实践笔记 golang docker 开发语言
本文将介绍如何使用Docker部署一个基于Go语言的后台服务应用godco，并介绍如何配置MongoDB数据库容器的连接，确保应用能够成功启动并连接到容器方式部署的mongoDB数据库。前提条件1.已安装Docker/Podman2.已安装MongoDB数据库容器（参见博文：使用Docker(Podman)部署MongoDB数据库及使用详解）3.已安装Golang环境1.准备工作Docker可以简
ORACLE数据库的OGG日志苦苦挣扎的小码农数据库 oracle
若要使用OGG,ORACLE必须开启归档模式,可以理解为设置ORACLE的REDOLOG落地,这样才能让OGG拿到所需的日志信息.1.查询数据库是否处于归档模式,如果处于归档模式,则返回结果ARCHIVELOGSQL>selectlog_modefromv$database;2.如果不处于归档模式，则要开启归档$>sqlplus/nologSQL>conn/assysdbaSQL>shutdown
使用doris过程中总结的与mysql中语法差异数据游戏数仓 mysql 数据库 database
1.mysql中的varchar()长度与doris中长度不一致，导致导入失败2.doris中where后面时间与字符串比较需转化类型#当create_time为datetime类型，mysql中使用concat()函数可直接比较，doris则不行，需进行类型转化wheredate_format(create_time,'%Y-%m-%d%H:%i:%s')0
Doris使用手册以及与Mysql差异整理 Jet-W mysql 数据库 doris 大数据后端
目录数据类型Doris数据类型数值类型日期类型字符串类型半结构类型聚合类型IP类型MySQL到Doris类型映射数据模型Doris的数据模型Aggregate模型示例一：导入数据聚合建表插入数据查看表示例二：保留明细数据示例三：导入数据与已有数据聚合Uniq模型建表插入数据查询表使用注意Duplicate模型建表插入数据查看表数据模型的选择建议与mysql差异语法DDLCreate-TableDo
Python进阶之-上下文管理器小佟 python上下文管理器 python 数据库服务器
本文介绍了Python中的上下文管理器，包括其基本概念、组成、标准库中的应用、自定义上下文管理器的实现以及contextlib模块的使用。重点强调了上下文管理器在资源管理、异常处理和代码整洁性方面的优势。✨前言：什么是上下文管理器？在Python中，上下文管理器是支持with语句的对象，用于为代码块提供设置及清理代码。上下文管理器广泛应用于资源管理场景，例如文件操作、网络连接、数据库会话等，其目的
MySQL常见优化手段唐僧不爱八戒 mysql 数据库
1.配置优化1.1缓存设置查询缓存：查询缓存可以显著减少对同一查询的重复执行次数。SETGLOBALquery_cache_size=268435456;--设置查询缓存大小为256MBSETGLOBALquery_cache_type=ON;--启用查询缓存例如，执行SELECT*FROMusersWHEREid=1;后，再次执行相同查询将直接从缓存中读取结果。表缓存：表缓存大小决定了可以同时打
第六篇：事务与并发控制猿享天开数据库数据库
第六篇：事务与并发控制目标读者：本篇文章适合中级数据库学习者，特别是那些希望理解数据库事务管理与并发控制机制的开发者或数据库管理员。通过掌握事务的原理与控制方法，你将能够设计高效且可靠的数据库应用，确保在多用户并发访问时数据的一致性和完整性。内容概述：本文将深入讲解数据库事务及其管理，重点包括：数据库事务的概念与四大特性（ACID）事务的实现与管理（开始、提交、回滚）锁机制（共享锁、排他锁、行级锁
DorisSQL与MySQL函数与语法对照差异篇小晨说数据字符串 mysql java 数据库 sql
1.日期函数时区.mysql -> convert_tz(dt,from_tz,to_tz)doris -> CONVERT_TZ(DATETIME dt, VARCHAR from_tz, VARCHAR to_tz)获取当前的日期，以DATE类型返回.mysql -> CURDATE()doris -> CURDATE()获得当前的时间,返回datatime类型.mysql -> NOW()d
2025mysql经典面试题合集！ Java八股文面试 mysql 面试职场 myspl面试 myspl面试题
1.解释MySQL中的JOIN操作。JOIN操作用于结合两个或多个数据库表的行。类型包括INNERJOIN（只返回两表匹配的行）、LEFTJOIN（返回左表的所有行及右表匹配的行）、RIGHTJOIN（返回右表的所有行及左表匹配的行）等。2.如何优化MySQL查询？优化MySQL查询的方法包括：使用合适的索引、避免在WHERE子句中使用函数、选择合适的数据类型、使用LIMIT语句减少数据量、避免全
Doris中架构和mysql语法的差异苦苦挣扎的小码农架构
Doris的架构只设FE,BE两种角色，两个进程，不依赖于外部组件，方便部署和运维，FE和BE都可线性扩展。FE（Frontend）：存储、维护集群元数据；负责接收、解析查询请求，规划查询计划，调度查询执行，返回查询结果。主要有三个角色：（1）Leader和Follower：主要是用来达到元数据的高可用，保证单节点宕机的情况下，元数据能够实时地在线恢复，而不影响整个服务。（2）Observer：用
Java基于Web美食网站设计(源码+mysql+文档) 灵军程序设计 java 前端美食
本系统（程序+源码）带文档lw万字以上文末可领取本课题的JAVA源码参考系统程序文件列表系统的选题背景和意义选题背景：随着互联网的普及和发展，人们的生活方式发生了巨大的变化。在这个信息爆炸的时代，人们越来越依赖于网络来获取各种信息，包括美食。美食作为人类生活中不可或缺的一部分，吸引了大量的关注和讨论。然而，传统的美食信息传播方式已经无法满足现代人的需求，人们渴望能够更方便、快捷地获取到各种美食信息
SSM框架——Spring+SpringMVC+Mybatis的搭建教程搬砖养女人 spring java maven
一：概述SSM框架在项目开发中经常使用到，相比于SSH框架，它在仅几年的开发中运用的更加广泛。Spring作为一个轻量级的框架，有很多的拓展功能，最主要的我们一般项目使用的就是IOC和AOP。SpringMVC是Spring实现的一个Web层，相当于Struts的框架，但是比Struts更加灵活和强大！Mybatis是一个持久层的框架，在使用上相比Hibernate更加灵活，可以控制sql的编写，
Python ORM svygh123 python 编程 python 开发语言
Python中的ORM（Object-RelationalMapping）框架，其中最著名和广泛使用的两个是SQLAlchemy和DjangoORM。1.SQLAlchemySQLAlchemy是Python中功能最强大的SQL工具库之一，它不仅提供了ORM功能，还提供了核心的数据库SQL工具。它允许你用Python类来表示数据库表，并且可以使用Python代码而不是直接写SQL查询语句来操作数据
python orm框架有哪些 hakesashou python基础知识 python 数据库 sqlite
ORM概念ORM（ObjectRalationalMapping，对象关系映射）用来把对象模型表示的对象映射到基于SQL的关系模型数据库结构中去。这样，我们在具体的操作实体对象的时候，就不需要再去和复杂的SQL语句打交道，只需简单的操作实体对象的属性和方法。ORM技术是在对象和关系之间提供了一条桥梁，前台的对象型数据和数据库中的关系型的数据通过这个桥梁来相互转化。Python中常用的ORMSQLO
[SAP ABAP] 性能优化山茶花开时。 SAP #SAP ABAP SAP ABAP 开发语言
1.数据库编程OPENSQL方面优化1.避免使用SELECT*，只查询需要的字段即可尽量使用SELECTf1f2...(具体字段)来代替SELECT*写法2.如果确定只查询一条数据时，使用SELECTSINGLE...或者是SELECT...UPTO1ROWS...使用语法UPTOnROWS来实现对数据前n项的查询3.统计时，直接使用SQL聚合函数，而不是将数据读取出来后在程序里再进行统计充分利用
Python 魔法学院 - 第32篇：Python ORM框架 ⭐⭐⭐ 星核日记《Python 魔法学院》python 数据库 pycharm 开发语言 windows
目录引言1.ORM框架概述1.1什么是ORM？比喻：ORM就像一位翻译官1.2ORM的优势2.[SQLAlchemy](https://docs.sqlalchemy.org.cn/en/20/intro.html)2.1SQLAlchemy简介2.2SQLAlchemy的核心组件2.3SQLAlchemy示例2.3.1安装SQLAlchemy2.3.2定义模型2.3.3插入数据2.3.4查询数据
Java常用排序算法/程序员必须掌握的8大排序算法 cugfy java
分类： 1）插入排序（直接插入排序、希尔排序） 2）交换排序（冒泡排序、快速排序） 3）选择排序（直接选择排序、堆排序） 4）归并排序 5）分配排序（基数排序）所需辅助空间最多：归并排序所需辅助空间最少：堆排序平均速度最快：快速排序不稳定：快速排序，希尔排序，堆排序。先来看看8种排序之间的关系： 1.直接插入排序（1
【Spark102】Spark存储模块BlockManager剖析 bit1129 manager
Spark围绕着BlockManager构建了存储模块，包括RDD，Shuffle，Broadcast的存储都使用了BlockManager。而BlockManager在实现上是一个针对每个应用的Master/Executor结构，即Driver上BlockManager充当了Master角色，而各个Slave上(具体到应用范围，就是Executor)的BlockManager充当了Slave角色
linux 查看端口被占用情况详解 daizj linux 端口占用 netstat lsof
经常在启动一个程序会碰到端口被占用，这里讲一下怎么查看端口是否被占用，及哪个程序占用，怎么Kill掉已占用端口的程序 1、lsof -i:port port为端口号 [root@slave /data/spark-1.4.0-bin-cdh4]# lsof -i:8080 COMMAND PID USER FD TY
Hosts文件使用周凡杨 hosts locahost
一切都要从localhost说起，经常在tomcat容器起动后，访问页面时输入http://localhost:8088/index.jsp，大家都知道localhost代表本机地址，如果本机IP是10.10.134.21，那就相当于http://10.10.134.21:8088/index.jsp，有时候也会看到http: 127.0.0.1:
java excel工具 g21121 Java excel
直接上代码，一看就懂，利用的是jxl： import java.io.File; import java.io.IOException; import jxl.Cell; import jxl.Sheet; import jxl.Workbook; import jxl.read.biff.BiffException; import jxl.write.Label; import
web报表工具finereport常用函数的用法总结（数组函数）老A不折腾 finereport web报表函数总结
ADD2ARRAY ADDARRAY(array,insertArray, start):在数组第start个位置插入insertArray中的所有元素，再返回该数组。示例： ADDARRAY([3,4, 1, 5, 7], [23, 43, 22], 3)返回[3, 4, 23, 43, 22, 1, 5, 7]. ADDARRAY([3,4, 1, 5, 7], "测试&q
游戏服务器网络带宽负载计算墙头上一根草服务器
家庭所安装的4M，8M宽带。其中M是指，Mbits/S 其中要提前说明的是： 8bits = 1Byte 即8位等于1字节。我们硬盘大小50G。意思是50*1024M字节，约为 50000多字节。但是网宽是以“位”为单位的，所以，8Mbits就是1M字节。是容积体积的单位。 8Mbits/s后面的S是秒。8Mbits/s意思是每秒8M位，即每秒1M字节。我是在计算我们网络流量时想到的
我的spring学习笔记2-IoC（反向控制依赖注入） aijuans Spring 3 系列
IoC（反向控制依赖注入）这是Spring提出来了，这也是Spring一大特色。这里我不用多说，我们看Spring教程就可以了解。当然我们不用Spring也可以用IoC，下面我将介绍不用Spring的IoC。 IoC不是框架，她是java的技术，如今大多数轻量级的容器都会用到IoC技术。这里我就用一个例子来说明：如：程序中有 Mysql.calss 、Oracle.class 、SqlSe
高性能mysql 之选择存储引擎(一) annan211 mysql InnoDB MySQL引擎存储引擎
1 没有特殊情况，应尽可能使用InnoDB存储引擎。原因：InnoDB 和 MYIsAM 是mysql 最常用、使用最普遍的存储引擎。其中InnoDB是最重要、最广泛的存储引擎。她被设计用来处理大量的短期事务。短期事务大部分情况下是正常提交的，很少有回滚的情况。InnoDB的性能和自动崩溃恢复特性使得她在非事务型存储的需求中也非常流行，除非有非常
UDP网络编程百合不是茶 UDP编程局域网组播
UDP是基于无连接的,不可靠的传输与TCP/IP相反 UDP实现私聊,发送方式客户端,接受方式服务器 package netUDP_sc; import java.net.DatagramPacket; import java.net.DatagramSocket; import java.net.Ine
JQuery对象的val()方法执行结果分析 bijian1013 JavaScript js jquery
JavaScript中，如果id对应的标签不存在（同理JAVA中，如果对象不存在），则调用它的方法会报错或抛异常。在实际开发中，发现JQuery在id对应的标签不存在时，调其val()方法不会报错，结果是undefined。
http请求测试实例（采用json-lib解析） bijian1013 json http
由于fastjson只支持JDK1.5版本，因些对于JDK1.4的项目，可以采用json-lib来解析JSON数据。如下是http请求的另外一种写法，仅供参考。 package com; import java.util.HashMap; import java.util.Map; import
【RPC框架Hessian四】Hessian与Spring集成 bit1129 hessian
在【RPC框架Hessian二】Hessian 对象序列化和反序列化一文中介绍了基于Hessian的RPC服务的实现步骤，在那里使用Hessian提供的API完成基于Hessian的RPC服务开发和客户端调用，本文使用Spring对Hessian的集成来实现Hessian的RPC调用。定义模型、接口和服务器端代码 |---Model &nb
【Mahout三】基于Mahout CBayes算法的20newsgroup流程分析 bit1129 Mahout
1.Mahout环境搭建 1.下载Mahout http://mirror.bit.edu.cn/apache/mahout/0.10.0/mahout-distribution-0.10.0.tar.gz 2.解压Mahout 3. 配置环境变量 vim /etc/profile export HADOOP_HOME=/home
nginx负载tomcat遇非80时的转发问题 ronin47
　　nginx负载后端容器是tomcat（其它容器如WAS,JBOSS暂没发现这个问题）非８０端口，遇到跳转异常问题。解决的思路是：$host:port 详细如下：　　该问题是最先发现的，由于之前对nginx不是特别的熟悉所以该问题是个入门级别的： ? 1 2 3 4 5
java-17-在一个字符串中找到第一个只出现一次的字符 bylijinnan java
public class FirstShowOnlyOnceElement { /**Q17.在一个字符串中找到第一个只出现一次的字符。如输入abaccdeff，则输出b * 1.int[] count:count[i]表示i对应字符出现的次数 * 2.将26个英文字母映射：a-z <--> 0-25 * 3.假设全部字母都是小写 */ pu
mongoDB 复制集开窍的石头 mongodb
mongo的复制集就像mysql的主从数据库，当你往其中的主复制集(primary)写数据的时候，副复制集(secondary)会自动同步主复制集(Primary)的数据,当主复制集挂掉以后其中的一个副复制集会自动成为主复制集。提供服务器的可用性。和防止当机问题 mo
[宇宙与天文]宇宙时代的经济学 comsci 经济
宇宙尺度的交通工具一般都体型巨大，造价高昂。。。。。在宇宙中进行航行，近程采用反作用力类型的发动机，需要消耗少量矿石燃料，中远程航行要采用量子或者聚变反应堆发动机，进行超空间跳跃，要消耗大量高纯度水晶体能源以目前地球上国家的经济发展水平来讲，
Git忽略文件 Cwind git
有很多文件不必使用git管理。例如Eclipse或其他IDE生成的项目文件，编译生成的各种目标或临时文件等。使用git status时，会在Untracked files里面看到这些文件列表，在一次需要添加的文件比较多时（使用git add . / git add -u），会把这些所有的未跟踪文件添加进索引。 ==== ==== ==== 一些牢骚
MySQL连接数据库的必须配置 dashuaifu mysql 连接数据库配置
MySQL连接数据库的必须配置 1.driverClass：com.mysql.jdbc.Driver 2.jdbcUrl：jdbc:mysql://localhost:3306/dbname 3.user：username 4.password：password 其中1是驱动名；2是url，这里的‘dbna
一生要养成的60个习惯 dcj3sjt126com 习惯
一生要养成的60个习惯第1篇让你更受大家欢迎的习惯 1 守时，不准时赴约,让别人等,会失去很多机会。如何做到： ①该起床时就起床， ②养成任何事情都提前15分钟的习惯。 ③带本可以随时阅读的书，如果早了就拿出来读读。 ④有条理，生活没条理最容易耽误时间。 ⑤提前计划：将重要和不重要的事情岔开。 ⑥今天就准备好明天要穿的衣服。 ⑦按时睡觉，这会让按时起床更容易。 2 注重
[介绍]Yii 是什么 dcj3sjt126com PHP yii2
Yii 是一个高性能，基于组件的 PHP 框架，用于快速开发现代 Web 应用程序。名字 Yii （读作易）在中文里有“极致简单与不断演变”两重含义，也可看作 Yes It Is! 的缩写。 Yii 最适合做什么？ Yii 是一个通用的 Web 编程框架，即可以用于开发各种用 PHP 构建的 Web 应用。因为基于组件的框架结构和设计精巧的缓存支持，它特别适合开发大型应
Linux SSH常用总结 eksliang linux ssh SSHD
转载请出自出处：http://eksliang.iteye.com/blog/2186931 一、连接到远程主机格式： ssh name@remoteserver 例如： ssh [email protected] 二、连接到远程主机指定的端口格式： ssh name@remoteserver -p 22 例如： ssh i
快速上传头像到服务端工具类FaceUtil gundumw100 android
快速迭代用 import java.io.DataOutputStream; import java.io.File; import java.io.FileInputStream; import java.io.FileNotFoundException; import java.io.FileOutputStream; import java.io.IOExceptio
jQuery入门之怎么使用 ini JavaScript html jquery Web css
jQuery的强大我何问起（个人主页：hovertree.com）就不用多说了，那么怎么使用jQuery呢？首先，下载jquery。下载地址：http://hovertree.com/hvtart/bjae/b8627323101a4994.htm，一个是压缩版本，一个是未压缩版本，如果在开发测试阶段，可以使用未压缩版本，实际应用一般使用压缩版本(min)。然后就在页面上引用。
带filter的hbase查询优化 kane_xie 查询优化 hbase RandomRowFilter
问题描述 hbase scan数据缓慢，server端出现LeaseException。hbase写入缓慢。问题原因直接原因是： hbase client端每次和regionserver交互的时候，都会在服务器端生成一个Lease,Lease的有效期由参数hbase.regionserver.lease.period确定。如果hbase scan需
java设计模式-单例模式 men4661273 java 单例枚举反射 IOC
单例模式1，饿汉模式 //饿汉式单例类.在类初始化时，已经自行实例化 public class Singleton1 { //私有的默认构造函数 private Singleton1() {} //已经自行实例化 private static final Singleton1 singl
mongodb 查询某一天所有信息的3种方法，根据日期查询 qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
// mongodb的查询真让人难以琢磨，就查询单天信息，都需要花费一番功夫才行。 // 第一种方式： coll.aggregate([ {$project:{sendDate: {$substr: ['$sendTime', 0, 10]}, sendTime: 1, content:1}}, {$match:{sendDate: '2015-
二维数组转换成JSON tangqi609567707 java 二维数组 json
原文出处：http://blog.csdn.net/springsen/article/details/7833596 public class Demo { public static void main(String[] args) { String[][] blogL
erlang supervisor wudixiaotie erlang
定义supervisor时，如果是监控celuesimple_one_for_one则删除children的时候就用supervisor:terminate_child (SupModuleName, ChildPid)，如果shutdown策略选择的是brutal_kill，那么supervisor会调用exit(ChildPid, kill)，这样的话如果Child的behavior是gen_

Text-to-SQL小白入门（九）InstructGPT论文：教你如何训练ChatGPT

论文概述

基本信息

摘要

结果

API prompt distribution

结论

对齐研究alignment research的影响

对齐的是什么？

核心方法

RLHF架构图

SFT

数据格式

实验参数

RM

数据格式

实验参数

RL

数据格式

实验参数

数据收集

API数据

人工标注数据

数据量级

其他文章

你可能感兴趣的:(Text-to-SQL,sql,chatgpt,数据库)