汀、人工智能

ChatGenTitle：使用百万arXiv论文信息在LLaMA模型上进行微调的论文题目生成模型

项目设计集合（人工智能方向）：助力新人快速实战掌握技能、自主完成项目设计升级，提升自身的硬实力（不仅限NLP、知识图谱、计算机视觉等领域）：汇总有意义的项目设计集合，助力新人快速实战掌握技能，助力用户更好利用 CSDN 平台，自主完成项目设计升级，提升自身的硬实力。

专栏订阅：项目大全提升自身的硬实力
[专栏详细介绍：项目设计集合（人工智能方向）：助力新人快速实战掌握技能、自主完成项目设计升级，提升自身的硬实力（不仅限NLP、知识图谱、计算机视觉等领域）

ChatGenTitle：使用百万arXiv论文信息在LLaMA模型上进行微调的论文题目生成模型

相关信息

1.训练数据集在Cornell-University/arxiv，可以直接使用；
2.正式发布LLaMa-Lora-7B-3 和 LLaMa-Lora-7B-3-new 版本的LoRA模型权重，允许本地部署使用；
1. 完成了基于alpaca-lora 上进行的LLaMa-Lora-7B-3和LLaMa-Lora-13B-3模型微调；
1. 开始了一项长期进行在arXiv上定时爬取cs.AI 、cs.CV 、cs.LG 论文的任务，目的是为了支持 CS 相关方向的研究；
5.整理了220W+篇arXiv论文的元信息，这些元信息包括：title和abstract，更多的有：id、submitter、authors、comments、journal-ref、doi、categories、versions；

1.项目背景

科研论文写作中，生成一个有吸引力的、准确的论文标题需要综合考虑多个因素，这是论文作者面临的一个重要挑战。生成一个论文标题的难点有：

简洁但准确：一个好的论文标题应该简洁、精炼，但同时又能准确地反映出论文研究的重点和核心所在，这对于作者来说是一个巨大的挑战。
独特但易于理解：论文题目应该是独特的，能够吸引读者的兴趣，但同时也要易于理解，避免过于笼统或过于繁琐深奥的词汇。
体现研究的贡献：好的论文题目应该能够明确体现出研究的贡献，突出研究创新点，使读者对该研究的贡献显而易见。
避免使用口头禅：一些常用的词汇、短语等可能被过多的使用，这样会使得论文的题目显得陈旧、无创新性，甚至会让人感到毫无意义。

最近，以ChatGPT、GPT-4等为代表的大语言模型（Large Language Model, LLM）掀起了新一轮自然语言处理领域的研究浪潮，展现出了类通用人工智能（AGI）的能力，受到业界广泛关注。在这些工作以外，许多学者开始关注以低成本实现个人"ChatGPT"的方案，如：stanford_alpaca[1]、alpaca-lora[2]，这些方案聚焦于大模型微调，然而我们更期望探索大模型在下游任务的落地。

为此，我们关注到论文题目生成领域，ArXiv（全称为：The arXiv.org e-Print archive）是一个由康奈尔大学创建和维护的一个免费、开放的学术预印本社区，它于1991年创立。ArXiv是全球数学、物理学等学科的电子预印本和会议论文库，包含了众多的高质量学术论文和研究报告，覆盖面日益增广。arXiv中包含了众多高质量的论文元信息。通过arXiv上开放的论文信息，我们构建了一个包含220万篇论文元信息的数据库。这些数据通过数据清洗等被构建成了可以用于大模型微调的数据对。

将这些论文元信息引入大模型微调，它可以对生成论文题目涉及的难点产生积极影响，它可以从以下几个方面提供帮助：

提供更准确、广泛的语言模型：大模型通常使用了大量数据进行训练，因此其语言模型可以更准确地解释自然语言，能够应对更多的语言场景，提升论文题目的语言表达能力。
提供更加精准的语义理解：大模型采用了深度学习的技术手段，能够构建语言的高维向量表示，从而提供更准确的语义理解能力，帮助生成更精确、准确的论文题目。
增强创造性和创新性：大模型使用了大量的训练数据，并能够从数据中提取规律，从而提供更多的词汇或句子组合方式，增强了生成论文题目的创造性和创新性。
提高效率：相比传统的手动方式，使用大模型来生成论文题目可以极大地提高效率，不仅减少了需要写出标题的时间，同时也不容易产生显著的错误，提高了输出的质量。

总之，引入大模型可以提供更好的帮助来解决生成论文题目的难点，有望提升分析、抽象、创新等能力。

2.arXiv数据集介绍

我们所搜集的论文元信息包含全部的学科分类，如：

计算机科学（Computer Science）
数学（Mathematics）
物理学（Physics）
统计学（Statistics）
电气工程和系统科学（Electrical Engineering and Systems Science）
经济学（Economics）
量子物理（Quantum Physics）
材料科学（Materials Science）
生物学（Biology）
量化金融（Quantitative Finance）
信息科学（Information Science）
交叉学科（Interdisciplinary）。

每个大类下面还有很多具体的子类，如计算机科学大类下又包括计算机视觉、机器学习、人工智能、计算机网络等子类。如果您想找到特定领域的论文，可以根据这些分类进行选择。

每一篇论文都包含如下字段的元信息：

{
	"id":string"0704.0001",
	"submitter":string"Pavel Nadolsky",
	"authors":string"C. Bal\'azs, E. L. Berger, P. M. Nadolsky, C.-P. Yuan",
	"title":string"Calculation of prompt diphoton production cross sections at Tevatron and LHC energies",
	"comments":string"37 pages, 15 figures; published version",
	"journal-ref":string"Phys.Rev.D76:013009,2007",
	"doi":string"10.1103/PhysRevD.76.013009",
	"report-no":string"ANL-HEP-PR-07-12",
	"categories":string"hep-ph",
	"license":NULL,
	"abstract":string" A fully differential calculation in perturbative quantum chromodynamics is presented for the production of massive photon pairs at hadron colliders. All next-to-leading order perturbative contributions from quark-antiquark, gluon-(anti)quark, and gluon-gluon subprocesses are included, as well as all-orders resummation of initial-state gluon radiation valid at next-to-next-to-leading logarithmic accuracy. The region of phase space is specified in which the calculation is most reliable. Good agreement is demonstrated with data from the Fermilab Tevatron, and predictions are made for more detailed tests with CDF and DO data. Predictions are shown for distributions of diphoton pairs produced at the energy of the Large Hadron Collider (LHC). Distributions of the diphoton pairs from the decay of a Higgs boson are contrasted with those produced from QCD processes at the LHC, showing that enhanced sensitivity to the signal can be obtained with judicious selection of events. ",
	"versions": 
}

id: ArXiv ID (can be used to access the paper, see below)
submitter: Who submitted the paper
authors: Authors of the paper
title: Title of the paper
comments: Additional info, such as number of pages and figures
journal-ref: Information about the journal the paper was published in
doi: [https://www.doi.org](Digital Object Identifier)
abstract: The abstract of the paper
categories: Categories / tags in the ArXiv system
versions: A version history

3.LLMs微调

ChatGenTitle基于Meta的LLaMA模型进行微调，微调主流的方法有：Instruct微调和LoRa微调。

Instruct微调和LoRa微调是两种不同的技术。Instruct微调是指在深度神经网络训练过程中调整模型参数的过程，以优化模型的性能。在微调过程中，使用一个预先训练好的模型作为基础模型，然后在新的数据集上对该模型进行微调。Instruct微调是一种通过更新预训练模型的所有参数来完成的微调方法，通过微调使其适用于多个下游应用。LoRa微调则是指对低功耗广域网（LoRaWAN）中的LoRa节点参数进行微调的过程，以提高节点的传输效率。在LoRa微调中，需要了解节点的硬件和网络部署情况，并通过对节点参数进行微小调整来优化传输效率。与Instruct微调相比，LoRA在每个Transformer块中注入可训练层，因为不需要为大多数模型权重计算梯度，大大减少了需要训练参数的数量并且降低了GPU内存的要求。研究发现，使用LoRA进行的微调质量与全模型微调相当，速度更快并且需要更少的计算。因此，如果有低延迟和低内存需求的情况，建议使用LoRA微调。

因此我们选择使用LoRA微调构建整个ChatGenTitle。

#下载项目
git clone https://github.com/tloen/alpaca-lora.git

#安装依赖
pip install -r requirements.txt

#转化模型
python src/transformers/models/llama/convert_llama_weights_to_hf.py \
    --input_dir ../model/ \
    --model_size 7B \
    --output_dir ../model/7B-hf
	
#单机单卡训练模型
python finetune.py \
    --base_model '../model/7B-hf' \
    --data_path '../train.json' \
    --output_dir '../alpaca-lora-output'

#单机多卡(4*A100)训练模型
WORLD_SIZE=4 CUDA_VISIBLE_DEVICES=0,1,2,3 torchrun --nproc_per_node=4 --master_port=3192 finetune.py \
    --base_model '../model/7B-hf' \
    --data_path '../train.json' \
    --output_dir '../alpaca-lora-output' \
    --batch_size 1024 \
    --micro_batch_size 128 \
	--num_epochs 3

在线访问

在开始部署使用之前，我们需要知道两个模型的定义。整个项目会有LLaMA和LoRA两种模型，LoRA模型是我们微调产生保存的权重，LLaMA 权重则是由Meta公司开源的大模型预训练权重。我们可以将生成的LoRA权重认为是一个原来LLaMA模型的补丁权重。因此我们要同时加载两种不同模型。目前我们已经提供的LoRA模型有：

模型名称	微调数据	微调基准模型	模型大小	微调时长
LLaMa-Lora-7B-3	arXiv-50-all	LLaMa-7B	148.1MB	9 hours
LLaMa-Lora-7B-3-new	arXiv-50-all	LLaMa-7B	586MB	12.5 hours
LLaMa-Lora-13B-3	arXiv-100-all	LLaMa-13B	230.05MB	26 hours

更多模型将会很快发布！

准备好需要的两种权重，就可以开启使用：

#推理
python generate.py \
    --load_8bit \
    --base_model '../model/7B-hf' \
    --lora_weights '../alpaca-lora-output'

当模型运行以后，访问127.0.0.1:7860即可。

然后在Instruction中输入：

If you are an expert in writing papers, please generate a good paper title for this paper based on other authors' descriptions of their abstracts.

在Input中输入：

<你论文的摘要>：Waste pollution is one of the most important environmental problems in the modern world. With the continuous improvement of the living standard of the population and the increasing richness of the consumption structure, the amount of domestic waste generated has increased dramatically and there is an urgent need for further waste treatment of waste. The rapid development of artificial intelligence provides an effective solution for automated waste classification. However, the large computational power and high complexity of algorithms make convolutional neural networks (CNNs) unsuitable for real-time embedded applications. In this paper, we propose a lightweight network architecture, Focus-RCNet, designed with reference to the sandglass structure of MobileNetV2, which uses deeply separable convolution to extract features from images. The Focus module is introduced into the field of recyclable waste image classification to reduce the dimensionality of features while retaining relevant information. In order to make the model focus more on waste image features while keeping the amount of parameters computationally small, we introduce the SimAM attention mechanism. Additionally, knowledge distillation is used to further compress the number of parameters in the model. By training and testing on the TrashNet dataset, the Focus-RCNet model not only achieves an accuracy of 92%, but also has high mobility of deployment.

点击Submit等待即可！

Output输出即为ChatGenTitle为你生成的论文题目。

4.模型效果展示

Note：Meta发布的LLaMA模型禁止商用，因此这里我们开源的是LoRA模型，LoRA模型必须搭配对应版本的LLaMA模型使用才可以

模型名称	微调数据	微调基准模型	模型大小	微调时长	微调效果
✅LLaMa-Lora-7B-3	arXiv-50-all	LLaMa-7B	-MB	9 hours

|✅LLaMa-Lora-7B-3-new |arXiv-50-all|LLaMa-7B|-MB|12.5 hours||

|✅LLaMa-Lora-7B-cs-3-new |arXiv-cs |LLaMa-7B|-MB|20.5 hours||

|✅LLaMa-Lora-7B-cs-6-new |arXiv-cs|LLaMa-7B|-MB|34 hours||

|✅LLaMa-Lora-13B-3 |arXiv-100-all|LLaMa-13B|-MB|26 hours||

训练设置:实验在A100 (4卡, 80GB)上进行

5.LLM效果对比

提示词	摘要	原始论文题目	ChatGenTitle	ChatGPT(GPT3.5)	GPT4	ChatGLM(130B)
提示词①	摘要①	Focus-RCNet: A lightweight recyclable waste classification algorithm based on Focus and knowledge distillation	Focus-RCNet: A Lightweight Convolutional Neural Network for Recyclable Waste Image Classification	Focus-RCNet: A lightweight deep learning model for automated waste classification with enhanced recyclable waste image feature recognition	Efficient Waste Classification with Focus-RCNet: A Lightweight Deep Learning Architecture Employing Sandglass Structure, SimAM Attention Mechanism, and Knowledge Distillation for Real-Time Embedded Applications	超过Token长度
提示词②	摘要②	ShuffleNet: An Extremely Efficient Convolutional Neural Network for Mobile Devices	ShuffleNet: Efficient Convolutional Neural Networks for Mobile Devices	ShuffleNet: A Computation-Efficient CNN Architecture for Mobile Devices with Superior Performance in Object Detection and ImageNet Classification while Maintaining Accuracy	ShuffleNet: A Computationally Efficient CNN Architecture for Mobile Devices with Enhanced Performance in ImageNet Classification and MS COCO Object Detection	ShuffleNet: An Extremely Computation-Efficient CNN Architecture for Mobile Devices
提示词③	摘要③	Segment Anything	Segment Anything	Segment Anything: Introducing a New Task, Model, and Dataset for Promptable Image Segmentation with Superior Zero-Shot Performance	Exploring the Segment Anything Project: A Promptable Image Segmentation Model and Extensive Dataset with Impressive Zero-Shot Performance	Segment Anything (SA) Project: A New Task, Model, and Dataset for Image Segmentation

5.1.提示词①和摘要①

提示词①：If you are an expert in writing papers, please generate a good paper title for this paper based on other authors’ descriptions of their abstracts.
摘要①：Waste pollution is one of the most important environmental problems in the modern world. With the continuous improvement of the living standard of the population and the increasing richness of the consumption structure, the amount of domestic waste generated has increased dramatically and there is an urgent need for further waste treatment of waste. The rapid development of artificial intelligence provides an effective solution for automated waste classification. However, the large computational power and high complexity of algorithms make convolutional neural networks (CNNs) unsuitable for real-time embedded applications. In this paper, we propose a lightweight network architecture, Focus-RCNet, designed with reference to the sandglass structure of MobileNetV2, which uses deeply separable convolution to extract features from images. The Focus module is introduced into the field of recyclable waste image classification to reduce the dimensionality of features while retaining relevant information. In order to make the model focus more on waste image features while keeping the amount of parameters computationally small, we introduce the SimAM attention mechanism. Additionally, knowledge distillation is used to further compress the number of parameters in the model. By training and testing on the TrashNet dataset, the Focus-RCNet model not only achieves an accuracy of 92%, but also has high mobility of deployment.

5.2 提示词②和摘要②

提示词②：If you are an expert in writing papers, please generate a good paper title for this paper based on other authors’ descriptions of their abstracts.
摘要②：We introduce an extremely computation-efficient CNN architecture named ShuffleNet, which is designed specially for mobile devices with very limited computing power (e.g., 10-150 MFLOPs). The new architecture utilizes two new operations, pointwise group convolution and channel shuffle, to greatly reduce computation cost while maintaining accuracy. Experiments on ImageNet classification and MS COCO object detection demonstrate the superior performance of ShuffleNet over other structures, e.g. lower top-1 error (absolute 7.8%) than recent MobileNet on ImageNet classification task, under the computation budget of 40 MFLOPs. On an ARM-based mobile device, ShuffleNet achieves ~13x actual speedup over AlexNet while maintaining comparable accuracy.

5.3 提示词③和摘要③

提示词③：If you are an expert in writing papers, please generate a good paper title for this paper based on other authors’ descriptions of their abstracts.
摘要③：We introduce the Segment Anything (SA) project: a new task, model, and dataset for image segmentation. Using our efficient model in a data collection loop, we built the largest segmentation dataset to date (by far), with over 1 billion masks on 11M licensed and privacy respecting images. The model is designed and trained to be promptable, so it can transfer zero-shot to new image distributions and tasks. We evaluate its capabilities on numerous tasks and find that its zero-shot performance is impressive – often competitive with or even superior to prior fully supervised results. We are releasing the Segment Anything Model (SAM) and corresponding dataset (SA-1B) of 1B masks and 11M images.

6.QA

关于Instruct微调和LoRa微调

Instruct微调和LoRa微调是两种不同的技术。
Instruct微调是指在深度神经网络训练过程中调整模型参数的过程，以优化模型的性能。在微调过程中，使用一个预先训练好的模型作为基础模型，然后在新的数据集上对该模型进行微调。Instruct微调是一种通过更新预训练模型的所有参数来完成的微调方法，通过微调使其适用于多个下游应用。
LoRa微调则是指对低功耗广域网（LoRaWAN）中的LoRa节点参数进行微调的过程，以提高节点的传输效率。在LoRa微调中，需要了解节点的硬件和网络部署情况，并通过对节点参数进行微小调整来优化传输效率。与Instruct微调相比，LoRA在每个Transformer块中注入可训练层，因为不需要为大多数模型权重计算梯度，大大减少了需要训练参数的数量并且降低了GPU内存的要求。
研究发现，使用LoRA进行的微调质量与全模型微调相当，速度更快并且需要更少的计算。因此，如果有低延迟和低内存需求的情况，建议使用LoRA微调。

为什么会有LLaMA模型和LoRA两种模型？

如1所述，模型的微调方式有很多种，基于LoRA的微调产生保存了新的权重，我们可以将生成的LoRA权重认为是一个原来LLaMA模型的补丁权重。至于LLaMA 权重，它则是由Mean公司开源的大模型预训练权重。

关于词表扩充

加入词表是有一定破坏性的，一是破坏原有分词体系，二是增加了未训练的权重。所以如果不能进行充分训练的话，可能会有比较大的问题。个人觉得如果不是特别专的领域（比如生物医学等涉及很多专业词汇的领域）没有太大必要去扩充英文词表。 Chinese-LLaMA-Alpaca/issues/16

参考文献

stanford_alpaca
alpaca-lora
ChatDoctor
Chinese-alpaca-lora
cabrita
japanese-alpaca-lora
Chinese-LLaMA-Alpaca
FastChat
LLaMA-Adapter
LMFlow
中文科学文献数据集

项目码源下载

https://download.csdn.net/download/sinat_39620217/88010022

Python软件包中的__init__.py文件的作用 python_136 python
当然可以，我会尽量用更详细和易懂的方式来说明Python软件包中的__init__.py文件的作用。一、__init__.py文件的基本作用在Python中，一个包含__init__.py文件的目录被视为一个Python包。这个文件的存在告诉Python解释器，这个目录应该被当作一个整体来对待，里面的Python文件（.py文件）可以被当作模块（module）来导入。二、__init__.py文件
icm20608 linux驱动 regmap spi的方式读写寄存器 Embedded-Alien linux kernel linux driver arm linux
开发版芯片imx6ull驱动测量了系统调用read10000次的时间验证了开启硬件浮点和不开启硬件浮点的运算浮点数时间基本相同1.驱动代码#include#include#include#include#include#include#include#include#include#include#include#include#include#include#include#include#in
Python自动化运维：一键掌控服务器的高效之道蒙娜丽宁 Python杂谈运维 python 自动化
《PythonOpenCV从菜鸟到高手》带你进入图像处理与计算机视觉的大门！解锁Python编程的无限可能：《奇妙的Python》带你漫游代码世界在互联网和云计算高速发展的今天，服务器数量的指数增长使得手动运维和管理变得异常繁琐。Python凭借其强大的可读性和丰富的生态系统，成为实现自动化运维的理想语言。本文以“Python自动化运维：编写自动化脚本进行服务器管理”为主题，深入探讨了如何利用Py
Java复习第四天 Allen_idle 算法 leetcode 职场和发展
一、代码题1.相同的树(1)题目给你两棵二叉树的根节点p和q，编写一个函数来检验这两棵树是否相同。如果两个树在结构上相同，并且节点具有相同的值，则认为它们是相同的。示例1:输入:p=[1,2,3]，q=[1,2,3]输出:true示例2:输入:p=[1,2]，q=[1,null,2]输出:false示例3:输入:p=[1,2,1]，q=[1,1,2]输出:false(2)思路实现a.题目实现如果两
代码随想录算法训练营day28（0121） Lazy.land 算法
1.买卖股票的最佳时机II想到思路其实代码非常简单，其实也跟之前做的那一题摆动序列有一点关联，只不过更加地简单这题的代码，思路很巧妙！题目122.买卖股票的最佳时机II给你一个整数数组prices，其中prices[i]表示某支股票第i天的价格。在每一天，你可以决定是否购买和/或出售股票。你在任何时候最多只能持有一股股票。你也可以先购买，然后在同一天出售。返回你能获得的最大利润。示例1：输入：pr
leetcode136.寻找重复数努力d小白 #其他算法数据结构
标签：计数排序给定一个包含n+1个整数的数组nums，其数字都在[1,n]范围内（包括1和n），可知至少存在一个重复的整数。假设nums只有一个重复的整数，返回这个重复的数。你设计的解决方案必须不修改数组nums且只用常量级O(1)的额外空间。示例1：输入：nums=[1,3,4,2,2]输出：2示例2：输入：nums=[3,1,3,4,2]输出：3示例3:输入：nums=[3,3,3,3,3]输
Redis实战-初识Redis 啥都想学的又啥都不会的研究生 redis 数据库缓存
初识Redis1、Redis简介2、Redis数据结构简介3、Redis命令3.1字符串3.2列表3.3集合3.4散列3.5有序集合3.6发布与订阅3.7其他命令3.7.1排序3.7.2过期时间如有侵权，请联系～如有错误，也欢迎批评指正～本篇文章大部分是来自学习《Redis实战》的笔记1、Redis简介Redis是一个远程内存数据库，它不仅性能强劲，而且还具有复制特性以及为解决问题而生的独一无二的
Css3 3D转换黄丫丫07 css3 3d css
特点：近大远小物体后面遮挡不可见三维坐标系：三维坐标系其实就是指立体空间，立体空间是由3个轴共同组成的。X轴：水平向右为正Y轴：垂直向下为正Z轴：垂直屏幕向外为正3D位移和3D旋转：主要知识点：3D位移：translate3d（x,y,z）3D旋转：rotate3d(x,y,z)透视：perspective3D呈现transform-style3D位移：translate3d（x,y,z）:Tra
Python二叉树用法介绍很酷的站长编程笔记 python 开发语言
二叉树是一种非常重要的数据结构，它在计算机科学中得到了广泛应用，例如在搜索算法、图形渲染和游戏AI等领域。本文将以Python二叉树为中心，从多个角度对其进行详细阐述，包括二叉树定义、二叉树遍历、二叉搜索树、平衡二叉树等内容。一、二叉树定义二叉树是一种有根树，它满足以下条件：每个节点最多有两个子节点每个节点只有一个父节点左子节点是其父节点的左子树，而右子节点是其父节点的右子树按照这个定义，我们可以
高并发系统的艺术：如何在流量洪峰中游刃有余京东云开发者京东云
作者：京东物流赵勇萍前言我们常说的三高，高并发、高可用、高性能，这些技术是构建现代互联网应用程序所必需的。对于京东618备战来说，所有的中台系统服务，无疑都是围绕着三高来展开的。而对于京东庞大的客户群体，高并发的要求尤为重要。用户对在线服务的需求和期望不断提高，系统的并发处理能力成为衡量其性能和用户体验的关键指标之一。高并发系统不仅仅是大型互联网企业的专利，对于任何希望在市场中占据一席之地的公司来
大数据平台Bug Bash大扫除最佳实践京东云开发者大数据 bug bash
作者：尹伟一、背景随着越来越多的"新人"在日常工作以及大促备战中担当大任，我们发现仅了解自身系统业务已不能满足日常系统开发运维需求。为此，大数据平台部门组织了一次BugBash活动，既能提升自己对兄弟产品的理解和使用，又能促使自家产品功能日趋完善。今天来给大家分享一些实际操作过程和经验总结~二、什么是BugBash？BugBash，顾名思义就是缺陷大扫除。通常由QA主导发起，团队全员放下手中的活，
记录一次RPC服务有损上线的分析过程京东云开发者 rpc java sql
作者：京东零售郭宏宇1.问题背景某应用在启动完提供JSF服务后，短时间内出现了大量的空指针异常。分析日志，发现是服务依赖的藏经阁配置数据未加载完成导致。即所谓的有损上线或者是直接发布，当****应用启动时，service还没加载完，就开始对外提供服务，导致失败调用。关键代码如下数据的初始化加载是通过实现CommandLineRunner接口完成的@ComponentpublicclassLoadS
Linux 存储设备和 Ventoy 启动盘制作指南小白也有IT梦 linux 运维服务器
一、Linux存储设备基础知识1.设备路径（/dev）设备路径是Linux系统中物理存储设备的唯一标识，类似设备的"身份证号"。命名规则解析/dev/sda：/dev：device（设备）的缩写，存放设备文件的目录sd：源自SCSIdevice，现在用于表示存储设备a：表示第一个检测到的存储设备数字（如sda1）：表示该设备上的分区编号2.挂载点与挂载过程挂载点是访问存储设备内容的入口，本质是一个
交叉引用多篇文献操作小白也有IT梦 word
要在Word中为多个连续的参考文献创建一个交叉引用（如[1-3]表示文献1、2、3），你可以按以下步骤操作：使用“交叉引用”功能，插入你需要引用的文献范围内的第一个和最后一个文献编号，比如[1][3]。选中这两个编号，右键选择“切换域代码”，将其转换为域代码形式。对于第一个文献的域代码，在代码末尾添加\#"[0"；对于最后一个文献的域代码，在代码末尾添加\#"0]"。\#"[0",\"#0]"选择
ubuntu取消输入密码 hunter206206 ubuntu ubuntu 服务器运维
要在Ubuntu中取消登录时输入密码，可以设置自动登录。以下是具体步骤：方法1：通过图形界面设置自动登录打开“设置”：点击右上角的系统菜单（电源图标或用户图标）。选择“设置”。进入“用户”设置：在“设置”窗口中，选择“用户”选项。解锁设置：点击右上角的“解锁”按钮。输入当前用户的密码，点击“认证”。启用自动登录：在“用户”设置中，找到“自动登录”选项。打开“自动登录”开关。选择要自动登录的用户（如
ubuntu取消定时锁定 hunter206206 ubuntu ubuntu 服务器运维
在Ubuntu中，取消定时锁定屏幕的功能可以通过以下步骤实现。定时锁定通常是由屏幕保护程序或电源管理设置触发的，因此需要调整相关设置。方法1：通过图形界面取消定时锁定打开“设置”：点击右上角的系统菜单（电源图标或用户图标）。选择“设置”。进入“电源”设置：在“设置”窗口中，选择“电源”选项。调整屏幕锁定时间：找到“屏幕空白”或“自动挂起”选项。将“屏幕空白”时间设置为“从不”。将“自动挂起”时间设
在VSCode中更改专用终端的Conda环境小白也有IT梦 python vscode
步骤打开VSCode：启动VSCode并打开你需要的工作目录。打开命令面板：使用快捷键Ctrl+Shift+P（Windows/Linux）或Cmd+Shift+P（macOS）打开命令面板。选择Conda环境：在命令面板中输入Python:SelectInterpreter并选择该选项。在出现的列表中选择你需要的Conda环境。这个步骤会改变当前工作目录下Python解释器的环境。打开终端：使用
CES Asia 2025优惠期倒计时5天，科技盛宴即将开启赛逸展张胜科技
随着时间的推移，备受瞩目的CESAsia2025优惠期已进入最后5天倒计时。作为亚洲顶级的消费电子盛会，CESAsia2025将汇聚众多国内外知名的科技企业，展示涵盖智能家居、智能出行、虚拟现实、人工智能等热门赛道的顶尖成果，是行业交流、商贸合作、趋势洞察的绝佳平台。在这最后的优惠时段内，参展商们仍有机会享受到展位费用的梯度折扣，越早锁定，优惠力度越大，还能优先挑选心仪展位，获得额外的宣传推广资源
CES Asia 2025：民族凝聚力引领科技创新未来赛逸展张胜 ces赛逸展消费电子科技
2024年12月03日，星期二，虽CESAsia2025（赛逸展）尚未举办，但已然引发广泛关注。面对西方组团拒签中国企业的挑战，中华民族正以强大的民族凝聚力积极筹备这场科技盛会。中国科技协会勇挑大梁，凝聚各方力量，为展会的成功举办奠定坚实基础。众多国内科技企业摩拳擦掌，准备在CESAsia2025上展现中国科技创新的卓越实力。这场尚未开幕的展会，将成为科技创新与民族凝聚力的精彩舞台。从充满想象力的
CES Asia 2025：智慧健康与生活科技领域买家聚焦盛会赛逸展张胜人工智能科技大数据
随着科技的飞速发展，智慧健康和生活科技领域正日益成为全球关注的焦点。即将在2025年举办的CESAsia（赛逸展）展会，更是吸引了众多专业买家的目光。这些买家涵盖了医疗机构、美容机构、零售商与电商平台、游戏与娱乐公司以及金融机构等多个领域，他们将在展会上积极探寻行业最新趋势与创新产品，为推动智慧健康和生活科技产业的蓬勃发展注入强大动力。在医疗机构方面，北京大学第三医院、上海交通大学医学院附属瑞金医
AI Agent 原理解析及应用场景深度洞察 power-辰南大模型算法实战工程人工智能 ai agent 大模型
在当今科技飞速发展的时代，AIAgent作为人工智能领域的重要分支，正以其独特的智能特性和广泛的应用潜力，逐渐渗透到各个行业和我们生活的方方面面。它为解决复杂问题、提升系统效率和实现智能化交互提供了全新的途径。本文将深入剖析AIAgent的原理，并详细探讨其在多个领域的关键应用场景。一、AIAgent的定义与基本概念AIAgent，即人工智能代理，是一种能够感知其所处环境，并基于所感知的信息自主地
引发类型为“System.Windows.Forms.AxHost+InvalidActiveXStateException”的异常解决办法 . 旅行皮箱 asp.net winform cam
这几天在做一个winForm功能时，因为引用了第三方的OCX控件，一般来说一个对象只要实例化就行了但是不知为什么引用这个控件时老是报引发类型为“System.Windows.Forms.AxHost+InvalidActiveXStateException”的异常错误，后经查，除了实例化，还要初始化该对象。AxJAVOLELib.AxJAVOlecam[i]=newAxJAVOLELib.AxJA
[实战]Ubuntu使用工具和命令无法ssh,但使用另一台Ubuntu机器可以用命令ssh,非root用户。江湖一码农 ubuntu ssh linux
现象新安装一台Ubuntu22.04服务器，各种远程工具都无法SSH，但使用公司的另一台Ubuntu22.04的机器可以正常SSH。并且我使用的是非root用户。百度、谷哥上能试的方案全试了一遍，使用命令ssh仍然提示permissiondeniedpleasetryagain。使用工具ssh提示还是Accessdenied。原因经过排查，发现新安装的服务器出现了IP冲突。重新换一个IP即可。我这
Bootstrap4网格系统详解半点寒12W css css3
一、基本概念Bootstrap4的网格系统是其核心部分，它基于一个12列的布局，能够帮助你轻松创建响应式的网页布局。这种网格系统可以让你将页面内容划分为不同的行和列，使得内容在不同设备上都能呈现出最佳的显示效果。二、容器（Container）容器的作用：容器是用来包裹页面内容的元素，它提供了一个水平居中的布局空间，并为内部的行和列设置了合适的内边距。容器的类型：**.container：**这是一
CSS3 2D 转换介绍半点寒12W css css3 css 前端
CSS3中的2D转换（2DTransforms）允许你在二维平面上对元素进行操作，如移动、旋转、缩放和倾斜等，这可以让网页的布局和动画效果更加丰富多样。以下是一些主要的2D转换方法：一、translate（移动）语法：transform:translate(x,y);或者transform:translateX(x);和transform:translateY(y);。其中x和y是长度值（可以是像
使用XMLHttpRequest发送网络请求半点寒12W 计算机网络网络 javascript 前端
使用XMLHttpRequest发送get请求步骤创建xhr对象调用xhr.open()函数调用xhr.send函数监听onreadystatechange事件未携带参数的get请求varxhr=newXMLHttpRequest();xhr.open("get","http://127.0.0.1:8000");xhr.send();xhr.onreadystatechange=function
【Java基础】抽象类、接口、内部的运用与作用分析，枚举类型的使用唐僧洗头爱飘柔9527 java java 开发语言 Java SE 内部类抽象类 interface接口枚举类
1.抽象类在面向对象的概念中，所有的对象都是通过类来描绘的，但是反过来，并不是所有的类都是用来描绘对象的，如果一个类中没有包含足够的信息来描绘一个具体的对象，这样的类就是抽象类。抽象类除了不能实例化对象之外，类的其它功能依然存在，成员变量、成员方法、初始化块和构造方法和普通类一样。并且抽象类和普通类相比还多出了抽象方法。格式：[修饰符]abstractclass类名{//零到多个成员变量//零到多
SQL语言中的查询语句整理唐僧洗头爱飘柔9527 sql mysql 数据库
1、查询语句的介绍：本篇主要介绍sql语句里的查询语句，这其中包括了查询语句中的子内容，也就是拓展的内容，这些内容代入到查询语句中将会有更多的反应。2、查询语句：FROM命令：SELECT字段1,字段2,字段3FROM表文件名执行顺序：mysql共有7个查询命令，FROM命令永远是第一个执行的查询命令执行作用：FROM命令相当于一个读取流，分则将硬盘上表文件加载到内存中生成一个【临时表】供后续查询
RocketMQ源码之消息刷盘分析小虾米 ~ RocketMQ rocketmq
前言刷盘是将内存中的消息写入磁盘，分为同步刷盘和异步刷盘。同步刷盘指一条消息写入磁盘才返回成功，异步刷盘指写入内存就返回成功，稍后异步线程刷盘。在创建CommitLog对象的时候，会初始化刷盘服务：//代码位置：org.apache.rocketmq.store.CommitLogpublicCommitLog(finalDefaultMessageStoredefaultMessageStore
字符串的子串的个数小虾米 ~
字串：串中任意个连续的字符组成的子序列称为该串的字串。空串属于字串（1）长度为n的字符串，如果串中字符各不相同，则字串的个数为n(n+1)/2+1解析：包含1个字符的子串共n个包含2个字符的子串共n-1个包含3个字符的子串共n-2个包含4个字符的子串共n-3个.。。。。。包含n个字符的子串共1个空串1个综上所述：子串个数共：1+2+3+。。。+n+1（空串）=n(n+1)/2+1（2）串中字符出现
knob UI插件使用换个号韩国红果果 JavaScript jsonp knob
图形是用canvas绘制的 js代码 var paras = { max:800, min:100, skin:'tron',//button type thickness:.3,//button width width:'200',//define canvas width.,canvas height displayInput:'tr
Android+Jquery Mobile学习系列(5)-SQLite数据库白糖_ JQuery Mobile
目录导航 SQLite是轻量级的、嵌入式的、关系型数据库，目前已经在iPhone、Android等手机系统中使用,SQLite可移植性好，很容易使用，很小，高效而且可靠。因为Android已经集成了SQLite，所以开发人员无需引入任何JAR包，而且Android也针对SQLite封装了专属的API，调用起来非常快捷方便。我也是第一次接触S
impala-2.1.2-CDH5.3.2 dayutianfei impala
最近在整理impala编译的东西，简单记录几个要点：根据官网的信息（https://github.com/cloudera/Impala/wiki/How-to-build-Impala）： 1. 首次编译impala，推荐使用命令： ${IMPALA_HOME}/buildall.sh -skiptests -build_shared_libs -format 2.仅编译BE ${I
求二进制数中1的个数周凡杨 java 算法二进制
解法一：对于一个正整数如果是偶数，该数的二进制数的最后一位是 0 ，反之若是奇数，则该数的二进制数的最后一位是 1 。因此，可以考虑利用位移、判断奇偶来实现。 public int bitCount(int x){ int count = 0; while(x!=0){ if(x%2!=0){ /
spring中hibernate及事务配置 g21121 Hibernate
hibernate的sessionFactory配置：  <bean id="sessionFactory" class="org.springframework.orm.hibernate3.LocalSessionFactoryBean"> <
log4j.properties 使用 510888780 log4j
log4j.properties 使用一.参数意义说明输出级别的种类 ERROR、WARN、INFO、DEBUG ERROR 为严重错误主要是程序的错误 WARN 为一般警告，比如session丢失 INFO 为一般要显示的信息，比如登录登出 DEBUG 为程序的调试信息配置日志信息输出目的地 log4j.appender.appenderName = fully.qua
Spring mvc-jfreeChart柱图（2）布衣凌宇 jfreechart
上一篇中生成的图是静态的，这篇将按条件进行搜索，并统计成图表，左面为统计图，右面显示搜索出的结果。第一步：导包第二步；配置web.xml(上一篇有代码) 建BarRenderer类用于柱子颜色 import java.awt.Color; import java.awt.Paint; import org.jfree.chart.renderer.category.BarR
我的spring学习笔记14-容器扩展点之PropertyPlaceholderConfigurer aijuans Spring3
PropertyPlaceholderConfigurer是个bean工厂后置处理器的实现，也就是BeanFactoryPostProcessor接口的一个实现。关于BeanFactoryPostProcessor和BeanPostProcessor类似。我会在其他地方介绍。 PropertyPlaceholderConfigurer可以将上下文（配置文件）中的属性值放在另一个单独的标准java
maven 之 cobertura 简单使用 antlove maven test unit cobertura report
1. 创建一个maven项目 2. 创建com.CoberturaStart.java package com; public class CoberturaStart { public void helloEveryone(){ System.out.println("=================================================
程序的执行顺序百合不是茶 JAVA执行顺序
刚在看java核心技术时发现对java的执行顺序不是很明白了,百度一下也没有找到适合自己的资料,所以就简单的回顾一下吧代码如下; 经典的程序执行面试题 //关于程序执行的顺序 //例如： //定义一个基类 public class A(){ public A(
设置session失效的几种方法 bijian1013 web.xml session失效监听器
在系统登录后，都会设置一个当前session失效的时间，以确保在用户长时间不与服务器交互，自动退出登录，销毁session。具体设置很简单，方法有三种：（1）在主页面或者公共页面中加入：session.setMaxInactiveInterval(900);参数900单位是秒，即在没有活动15分钟后，session将失效。这里要注意这个session设置的时间是根据服务器来计算的，而不是客户端。所
java jvm常用命令工具 bijian1013 java jvm
一.概述程序运行中经常会遇到各种问题，定位问题时通常需要综合各种信息，如系统日志、堆dump文件、线程dump文件、GC日志等。通过虚拟机监控和诊断工具可以帮忙我们快速获取、分析需要的数据，进而提高问题解决速度。本文将介绍虚拟机常用监控和问题诊断命令工具的使用方法，主要包含以下工具: &nbs
【Spring框架一】Spring常用注解之Autowired和Resource注解 bit1129 Spring常用注解
Spring自从2.0引入注解的方式取代XML配置的方式来做IOC之后，对Spring一些常用注解的含义行为一直处于比较模糊的状态，写几篇总结下Spring常用的注解。本篇包含的注解有如下几个： Autowired Resource Component Service Controller Transactional 根据它们的功能、目的，可以分为三组，Autow
mysql 操作遇到safe update mode问题 bitray update
我并不知道出现这个问题的实际原理,只是通过其他朋友的博客,文章得知的一个解决方案,目前先记录一个解决方法,未来要是真了解以后,还会继续补全. 在mysql5中有一个safe update mode,这个模式让sql操作更加安全,据说要求有where条件,防止全表更新操作.如果必须要进行全表操作,我们可以执行 SET
nginx_perl试用 ronin47 nginx_perl试用
因为空闲时间比较多，所以在CPAN上乱翻，看到了nginx_perl这个项目(原名Nginx::Engine)，现在托管在github.com上。地址见：https://github.com/zzzcpan/nginx-perl 这个模块的目的，是在nginx内置官方perl模块的基础上，实现一系列异步非阻塞的api。用connector/writer/reader完成类似proxy的功能（这里
java-63-在字符串中删除特定的字符 bylijinnan java
public class DeleteSpecificChars { /** * Q 63 在字符串中删除特定的字符 * 输入两个字符串，从第一字符串中删除第二个字符串中所有的字符。 * 例如，输入”They are students.”和”aeiou”，则删除之后的第一个字符串变成”Thy r stdnts.” */ public static voi
EffectiveJava--创建和销毁对象 ccii 创建和销毁对象
本章内容： 1. 考虑用静态工厂方法代替构造器 2. 遇到多个构造器参数时要考虑用构建器（Builder模式） 3. 用私有构造器或者枚举类型强化Singleton属性 4. 通过私有构造器强化不可实例化的能力 5. 避免创建不必要的对象 6. 消除过期的对象引用 7. 避免使用终结方法 1. 考虑用静态工厂方法代替构造器类可以通过
[宇宙时代]四边形理论与光速飞行 comsci
从四边形理论来推论为什么光子飞船必须获得星光信号才能够进行光速飞行？一组星体组成星座向空间辐射一组由复杂星光信号组成的辐射频带，按照四边形-频率假说一组频率就代表一个时空的入口那么这种由星光信号组成的辐射频带就代表由这些星体所控制的时空通道，该时空通道在三维空间的投影是一
ubuntu server下python脚本迁移数据 cywhoyi python Kettle pymysql cx_Oracle ubuntu server
因为是在Ubuntu下，所以安装python、pip、pymysql等都极其方便，sudo apt-get install pymysql，但是在安装cx_Oracle（连接oracle的模块）出现许多问题，查阅相关资料，发现这边文章能够帮我解决，希望大家少走点弯路。http://www.tbdazhe.com/archives/602 1.安装python 2.安装pip、pymysql
Ajax正确但是请求不到值解决方案 dashuaifu Ajax async
Ajax正确但是请求不到值解决方案解决方案：1 . async: false , 2. 设置延时执行js里的ajax或者延时后台java方法！！！！！！！例如： $.ajax({ &
windows安装配置php+memcached dcj3sjt126com PHP Install memcache
Windows下Memcached的安装配置方法 1、将第一个包解压放某个盘下面，比如在c:\memcached。 2、在终端（也即cmd命令界面）下输入 'c:\memcached\memcached.exe -d install' 安装。 3、再输入： 'c:\memcached\memcached.exe -d start' 启动。（需要注意的: 以后memcached将作为windo
iOS开发学习路径的一些建议 dcj3sjt126com ios
iOS论坛里有朋友要求回答帖子，帖子的标题是：想学IOS开发高阶一点的东西，从何开始，然后我吧啦吧啦回答写了很多。既然敲了那么多字，我就把我写的回复也贴到博客里来分享，希望能对大家有帮助。欢迎大家也到帖子里讨论和分享，地址：http://bbs.csdn.net/topics/390920759 下面是我回复的内容：结合自己情况聊下iOS学习建议，
Javascript闭包概念 fanfanlovey JavaScript 闭包
1.参考资料 http://www.jb51.net/article/24101.htm http://blog.csdn.net/yn49782026/article/details/8549462 2.内容概述要理解闭包，首先需要理解变量作用域问题内部函数可以饮用外面全局变量 var n=999; 　　functio
yum安装mysql5.6 haisheng mysql
1、安装http://dev.mysql.com/get/mysql-community-release-el7-5.noarch.rpm 2、yum install mysql 3、yum install mysql-server 4、vi /etc/my.cnf 添加character_set_server=utf8
po/bo/vo/dao/pojo的详介 IT_zhlp80 java BO VO DAO POJO po
JAVA几种对象的解释 PO:persistant object持久对象,可以看成是与数据库中的表相映射的java对象。最简单的PO就是对应数据库中某个表中的一条记录，多个记录可以用PO的集合。PO中应该不包含任何对数据库的操作. VO:value object值对象。通常用于业务层之间的数据传递，和PO一样也是仅仅包含数据而已。但应是抽象出的业务对象,可
java设计模式 kerryg java 设计模式
设计模式的分类：一、设计模式总体分为三大类： 1、创建型模式（5种）：工厂方法模式，抽象工厂模式，单例模式，建造者模式，原型模式。 2、结构型模式（7种）：适配器模式，装饰器模式，代理模式，外观模式，桥接模式，组合模式，享元模式。 3、行为型模式（11种）：策略模式，模版方法模式，观察者模式，迭代子模式，责任链模式，命令模式，备忘录模式，状态模式，访问者
[1]CXF3.1整合Spring开发webservice——helloworld篇木头.java spring webservice CXF
Spring 版本3.2.10 CXF 版本3.1.1 项目采用MAVEN组织依赖jar 我这里是有parent的pom，为了简洁明了，我直接把所有的依赖都列一起了，所以都没version，反正上面已经写了版本 <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="ht
Google 工程师亲授：菜鸟开发者一定要投资的十大目标 qindongliang1922 工作感悟人生
身为软件开发者，有什么是一定得投资的？ Google 软件工程师 Emanuel Saringan 整理了十项他认为必要的投资，第一项就是身体健康，英文与数学也都是必备能力吗？来看看他怎么说。（以下文字以作者第一人称撰写））你的健康无疑地，软件开发者是世界上最久坐不动的职业之一。每天连坐八到十六小时，休息时间只有一点点，绝对会让你的鲔鱼肚肆无忌惮的生长。肥胖容易扩大罹患其他疾病的风险，
linux打开最大文件数量1,048,576 tianzhihehe c linux
File descriptors are represented by the C int type. Not using a special type is often considered odd, but is, historically, the Unix way. Each Linux process has a maximum number of files th
java语言中PO、VO、DAO、BO、POJO几种对象的解释衞酆夼 java VO BO POJO po
PO:persistant object持久对象最形象的理解就是一个PO就是数据库中的一条记录。好处是可以把一条记录作为一个对象处理，可以方便的转为其它对象。可以看成是与数据库中的表相映射的java对象。最简单的PO就是对应数据库中某个表中的一条记录，多个记录可以用PO的集合。PO中应该不包含任何对数据库的操作。 BO:business object业务对象封装业务逻辑的java对象

ChatGenTitle：使用百万arXiv论文信息在LLaMA模型上进行微调的论文题目生成模型

ChatGenTitle：使用百万arXiv论文信息在LLaMA模型上进行微调的论文题目生成模型

1.项目背景

2.arXiv数据集介绍

3.LLMs微调

4.模型效果展示

5.LLM效果对比

5.1.提示词①和摘要①

5.2 提示词②和摘要②

5.3 提示词③和摘要③

6.QA

参考文献

项目码源下载

你可能感兴趣的:(项目大全：提升自身的硬实力,llama,人工智能,自然语言处理,nlp,LLama,大语言模型)