小小帅AIGC

AI推介-大语言模型LLMs论文速览（arXiv方向）：2024.02.20-2024.02.25

论文目录~

1.Zero-shot cross-lingual transfer in instruction tuning of large language model
2.Scaling Efficient LLMs
3.LLM-DA: Data Augmentation via Large Language Models for Few-Shot Named Entity Recognition
4.Whose LLM is it Anyway? Linguistic Comparison and LLM Attribution for GPT-3.5, GPT-4 and Bard
5.Do LLMs Implicitly Determine the Suitable Text Difficulty for Users?
6.Can Language Models Act as Knowledge Bases at Scale?
7.Take the Bull by the Horns: Hard Sample-Reweighted Continual Training Improves LLM Generalization
8.Can Large Language Models Detect Misinformation in Scientific News Reporting?
9.FanOutQA: Multi-Hop, Multi-Document Question Answering for Large Language Models
10.LexC-Gen: Generating Data for Extremely Low-Resource Languages with Large Language Models and Bilingual Lexicons
11.Can Watermarks Survive Translation? On the Cross-lingual Consistency of Text Watermark for Large Language Models
12.Hallucinations or Attention Misdirection? The Path to Strategic Value Extraction in Business Using Large Language Models
13.What Linguistic Features and Languages are Important in LLM Translation?
14.LongRoPE: Extending LLM Context Window Beyond 2 Million Tokens
15.From Text to CQL: Bridging Natural Language and Corpus Search Engine
16. $\infty$ Bench: Extending Long Context Evaluation Beyond 100K Tokens
17.Neeko: Leveraging Dynamic LoRA for Efficient Multi-Character Role-Playing Agent
18.GCOF: Self-iterative Text Generation for Copywriting Using Large Language Model
19.User-LLM: Efficient LLM Contextualization with User Embeddings
20.LLMs Meet Long Video: Advancing Long Video Comprehension with An Interactive Visual Adapter in LLMs

1.Zero-shot cross-lingual transfer in instruction tuning of large language model

标题:大型语言模型指令调整中的零点跨语言转移

author:Nadezhda Chirkova, Vassilina Nikoulina

date Time:2024-02-22

paper pdf:http://arxiv.org/pdf/2402.14778v1

摘要：
指令调整（IT）被广泛用于教导预训练的大型语言模型（LLMs）遵循任意指令，但在多语言环境中的研究却不足。在这项工作中，我们对 IT 中的零次跨语言迁移进行了系统研究，即在纯英语数据上对 LLM 进行指令调整，然后在其他语言的用户提示上进行测试。我们研究了模型配置选择的影响，并为多语言教学设计了多方面的评估策略。我们发现，即使模型训练的所有阶段都以英语为中心，跨语言迁移也能在信息技术中成功实现，但前提是在超参数调整中考虑到多语言性，并且有足够大的信息技术数据。经过英语训练的 LLM 能够用其他语言生成语言正确、全面和有帮助的回答，但事实性较低，偶尔会出现流利性错误。

2.Scaling Efficient LLMs

标题:高效扩展 LLM

author:B. N. Kausik

date Time:2024-02-22

paper pdf:http://arxiv.org/pdf/2402.14746v1

摘要：
训练过的 LLM 通常是稀疏的，即大部分参数为零，这就提出了效率问题。对此，我们研究了高效的 LLM，即在训练语料库上能达到预期准确度的参数最少的 LLM。具体来说，我们比较了当前规模下训练损失的理论估计值和经验估计值，以获得自然训练语料库中唯一序列的数量随其规模变化的上下限。我们的结果意味着：(1) 若要将训练语料库中代表的技能数量增加一倍，语料库的规模必须扩大大约三到五倍；(2) 对于高效的 LLM，自然训练语料库的参数数 $N$ 和大小 $D$ 的比例为 $\sim D^{0.58}$ ；(3) 如果 LLM 的参数数小于训练语料库中唯一序列的数量，那么扩大规模就能发现新出现的技能。

3.LLM-DA: Data Augmentation via Large Language Models for Few-Shot Named Entity Recognition

标题:LLM-DA：通过大型语言模型进行数据扩充，实现少量命名实体识别

author:Junjie Ye, Nuo Xu, Yikun Wang, Jie Zhou, Qi Zhang, Tao Gui, Xuanjing Huang

date Time:2024-02-22

paper pdf:http://arxiv.org/pdf/2402.14568v1

摘要：
尽管大型语言模型（LLM）的能力令人印象深刻，但它们在信息提取任务中的表现仍不尽如人意。然而，它们卓越的重写能力和广泛的世界知识为改进这些任务提供了宝贵的见解。在本文中，我们提出了一种基于 LLMs 的新型数据增强技术– $LL M - D A$ ，用于少量信息提取任务。为了克服现有数据扩增方法的局限性，即损害语义完整性和解决 LLM 生成文本中固有的不确定性，我们通过在上下文和实体两个层面扩增原始数据，充分利用了 NER 任务的显著特征。我们的方法包括采用 14 种上下文重写策略，设计同类型的实体替换，以及注入噪声以增强鲁棒性。广泛的实验证明了我们的方法在利用有限数据提高 NER 模型性能方面的有效性。此外，额外的分析还提供了进一步的证据，证明我们生成的数据质量超过了其他现有方法。

4.Whose LLM is it Anyway? Linguistic Comparison and LLM Attribution for GPT-3.5, GPT-4 and Bard

标题:到底是谁的 LLM？GPT-3.5、GPT-4 和 Bard 的语言学比较和 LLM 归属

author:Ariel Rosenfeld, Teddy Lazebnik

date Time:2024-02-22

paper pdf:http://arxiv.org/pdf/2402.14533v1

摘要：
大型语言模型（LLM）能够生成与人类质量相似或更高的文本。然而，目前还不清楚 LLM 是否倾向于表现出与人类作者类似的独特语言风格。通过全面的语言分析，我们比较了由当今最流行的三种 LLMS（GPT-3.5、GPT-4 和 Bard）生成的文本的词汇、语音部分（POS）分布、依赖关系分布和情感，以及不同的输入。研究结果表明，语言上的显著差异反过来又使我们能够使用一个简单的现成分类模型，以88%的准确率将给定文本归因于其 LLM 起源。本文讨论了这一有趣发现的理论和实践意义。

5.Do LLMs Implicitly Determine the Suitable Text Difficulty for Users?

标题:LLM 是否会隐含地为用户确定合适的文本难度？

author:Seiji Gobara, Hidetaka Kamigaito, Taro Watanabe

date Time:2024-02-22

paper pdf:http://arxiv.org/pdf/2402.14453v1

摘要：
要提高学生的理解能力，就必须开展适合个人学习水平的教育。利用大语言模型（LLMs）实现这一目的的第一步是调整学生回答的文本难度。这项工作分析了 LLM 如何在用户输入和其生成的文本之间隐式地调整文本难度。为了进行实验，我们从 Stack-Overflow 中创建了一个新的数据集，以探索基于问题解答的对话的性能。在 Stack-Overflow 数据集和 TSCC 数据集（包括多轮对话）上的实验结果表明，LLM 可以隐式处理用户输入与其生成的回复之间的文本难度。我们还观察到，一些 LLM 在处理文本难度和指令调整的重要性方面超过了人类。

6.Can Language Models Act as Knowledge Bases at Scale?

标题:语言模型能否作为大规模知识库？

author:Qiyuan He, Yizhong Wang, Wenya Wang

date Time:2024-02-22

paper pdf:http://arxiv.org/pdf/2402.14273v1

摘要：
大型语言模型（LLMs）通过大规模的预训练，在理解和生成对复杂查询的响应方面表现出了非凡的能力。然而，这些模型在记忆大规模结构化知识（尤其是明确涵盖大量事实信息的世界知识）并进行推理方面的功效仍然值得怀疑。针对这一空白，我们的研究探讨了 LLM 是否能有效地存储、调用和推理与维基数据（Wikidata）等最新知识库（KB）相当的大规模知识。具体来说，我们主要从三个关键方面来研究其可行性：(1) 不同规模的 LLM 在记忆大规模知识库中的准确知识方面的效率；(2) 在响应自然语言查询时调用记忆知识的灵活性；(3) 通过推理推断新知识的能力。我们的研究结果表明，虽然 LLM 有希望成为能够灵活检索和响应的大规模知识库，但要充分发挥其潜力，还需要增强其推理能力。

7.Take the Bull by the Horns: Hard Sample-Reweighted Continual Training Improves LLM Generalization

标题:迎难而上硬样本加权持续训练提高了 LLM 的泛化能力

author:Xuxi Chen, Zhendong Wang, Daouda Sow, Junjie Yang, Tianlong Chen, Yingbin Liang, Mingyuan Zhou, Zhangyang Wang

date Time:2024-02-22

paper pdf:http://arxiv.org/pdf/2402.14270v1

摘要：
在快速发展的大型语言模型（LLMs）领域，一个关键的挑战是如何在高质量训练数据短缺的情况下提高其能力。我们的研究从使用原始预训练数据集对 LLMs 进行轻度持续训练的经验策略入手，重点关注有选择地保留损失率适中的样本。这些样本被认为信息丰富，有利于模型的完善，与损失最大的样本形成鲜明对比，后者会因为与数据噪声和复杂性相关而被舍弃。然后，我们将这一策略形式化为实例重加权分布稳健优化（IR-DRO）的原则性框架。IR-DRO 的设计目的是通过实例重权机制，动态地将训练重点优先放在信息样本上，并通过闭式解决方案进行简化，以便直接集成到既定的训练协议中。通过对各种模型和数据集的严格实验，我们的研究结果表明，在持续预训练和指令调整场景中，我们的样本定向方法显著提高了多个基准的 LLM 性能。我们的代码见 https://github.com/VITA-Group/HardFocusTraining。

8.Can Large Language Models Detect Misinformation in Scientific News Reporting?

标题:大型语言模型能否发现科学新闻报道中的错误信息？

author:Yupeng Cao, Aishwarya Muralidharan Nair, Elyon Eyimife, Nastaran Jamalipour Soofi, K. P. Subbalakshmi, John R. Wullert II, Chumki Basu, David Shallcross

date Time:2024-02-22

paper pdf:http://arxiv.org/pdf/2402.14268v1

摘要：
科学事实经常被大众媒体歪曲，目的是影响公众舆论和行动，这在 COVID-19 大流行期间就有所体现。自动检测科学领域的错误信息是一项挑战，因为这两种媒体的写作风格截然不同，而且仍处于起步阶段。大多数关于科学报道有效性的研究都将这一问题视为索赔验证难题。在此过程中，需要大量的专家人力来生成适当的声明。我们的解决方案绕过了这一步骤，解决了现实世界中可能无法获得这种明确、标注的声明的问题。本文的核心研究问题是，是否有可能使用大型语言模型（LLM）来检测科学报告中的错误信息。为此，我们首先提出了一个新的标注数据集 SciNews，其中包含来自可信和不可信来源的 2.4k 篇科学新闻报道，以及 CORD-19 数据库中的相关摘要。我们的数据集既包括人工撰写的新闻文章，也包括由 LLM 生成的新闻文章，因此在捕捉使用 LLM 生成热门新闻文章这一日益增长的趋势方面更加全面。然后，我们确定了科学新闻文章中的科学有效性维度，并探讨了如何将其整合到科学错误信息的自动检测中。我们提出了几种使用 LLM 自动检测大众媒体中科学发现的虚假表述的基准架构。对于每个架构，我们都使用了几种提示工程策略，包括零点提示、少量提示和思维链提示。我们还在 GPT-3.5、GPT-4 和 Llama2-7B、Llama2-13B 上测试了这些架构和提示策略。

9.FanOutQA: Multi-Hop, Multi-Document Question Answering for Large Language Models

标题:FanOutQA：大型语言模型的多跳、多文档问题解答

author:Andrew Zhu, Alyssa Hwang, Liam Dugan, Chris Callison-Burch

date Time:2024-02-21

paper pdf:http://arxiv.org/pdf/2402.14116v1

摘要：
日常场景中常见的一类问题是 "fan-out "问题，即需要查找大量实体信息的复杂的多跳、多文档推理问题。然而，目前用于评估大型语言模型中此类问题解答能力的资源很少。为了更全面地评估 LLM 的复杂推理能力，我们提出了 FanOutQA，这是一个以英语维基百科为知识基础的高质量数据集，包含扇出问题-答案对和人类注释的分解。我们在数据集上制定了三个基准设置，并对 GPT-4、LLaMA 2、Claude-2.1 和 Mixtral-8x7B 等 7 个 LLM 进行了基准测试，发现当代模型仍有改进长语境下文档间依赖关系推理的空间。我们提供了数据集和运行模型的开源工具，以鼓励在 https://fanoutqa.com 上进行评估。

10.LexC-Gen: Generating Data for Extremely Low-Resource Languages with Large Language Models and Bilingual Lexicons

标题:LexC-Gen：利用大型语言模型和双语词典为资源极少的语言生成数据

author:Zheng-Xin Yong, Cristina Menghini, Stephen H. Bach

date Time:2024-02-21

paper pdf:http://arxiv.org/pdf/2402.14086v1

摘要：
低资源语言的数据匮乏问题可以通过使用双语词典从高资源语言的标注任务数据中进行词对词翻译来解决。然而，双语词典通常与任务数据的词汇重叠有限，导致翻译覆盖率和词典利用率低下。我们提出了词典条件数据生成（LexC-Gen），这是一种大规模生成低资源语言分类任务数据的方法。具体来说，LexC-Gen 首先使用双语词典中的高资源语言词汇生成与词典兼容的任务数据，然后通过单词翻译将其翻译成具有双语词典的低资源语言。在 17 种资源极度匮乏的语言中，LexC-Gen 生成的数据与专家翻译的黄金数据相比具有竞争力，在情感分析和主题分类任务上分别比现有的基于词典的单词翻译方法平均提高了 5.6 分和 8.9 分。我们表明，以双语词典为条件是 LexC-Gen 的关键组成部分。LexC-Gen 也很实用–它只需要一个 GPU 就能大规模生成数据。它能很好地与开放访问的 LLM 配合使用，其成本仅为基于 GPT4 的多语言数据生成成本的五分之一。

11.Can Watermarks Survive Translation? On the Cross-lingual Consistency of Text Watermark for Large Language Models

标题:水印能否经得起翻译？论大语言模型文本水印的跨语言一致性

author:Zhiwei He, Binglin Zhou, Hongkun Hao, Aiwei Liu, Xing Wang, Zhaopeng Tu, Zhuosheng Zhang, Rui Wang

date Time:2024-02-21

paper pdf:http://arxiv.org/pdf/2402.14007v1

摘要：
文本水印技术旨在标记和识别由大型语言模型（LLM）生成的内容，以防止滥用。在本研究中，我们引入了文本水印的 "跨语言一致性 "概念，即评估文本水印在翻译成其他语言后保持其有效性的能力。两种 LLM 和三种水印方法的初步实证结果表明，当前的文本水印技术在文本被翻译成不同语言时缺乏一致性。基于这一观察结果，我们提出了一种跨语言水印去除攻击（CWRA），通过首先从一种支点语言的 LLM 获取响应，然后将其翻译成目标语言，从而绕过水印。CWRA 可以有效去除水印，将曲线下面积（AUC）从 0.95 降低到 0.67，而不会造成性能损失。此外，我们还分析了导致文本水印跨语言一致性的两个关键因素，并提出了一种防御方法，可将 CWRA 下的 AUC 从 0.67 提高到 0.88。

12.Hallucinations or Attention Misdirection? The Path to Strategic Value Extraction in Business Using Large Language Models

标题:幻觉还是注意力误导？利用大型语言模型挖掘商业战略价值之路

author:Aline Ioste

date Time:2024-02-21

paper pdf:http://arxiv.org/pdf/2402.14002v1

摘要：
采用转换器架构的大型语言模型在文本生成领域掀起了一场革命，树立了前所未有的标杆。尽管大型语言模型的能力令人印象深刻，但也有人批评它们生成的结果偏离事实准确性或显示逻辑不一致，这些现象通常被称为幻觉。然而，这一术语往往被误用于任何偏离教师预期的结果，本文将其定义为注意力误导，而非真正的幻觉。在商业环境中，理解幻觉和注意力误导之间的区别变得越来越重要，因为这种错误的后果会严重影响从这些固有的预训练模型中提取价值。本文重点介绍了 PGI（角色、分组和智能）方法的最佳实践，该方法是一个战略框架，在应对实际业务挑战时，GPT 生成的 4,000 个回复中，错误率仅为 3.15%，成绩斐然。报告强调，通过为实验配备知识，企业可以利用这些原生预训练模型释放创新机会。这强化了一个概念，即以熟练团队为基础的战略应用可以最大限度地发挥 LLMs 等新兴技术的优势。

13.What Linguistic Features and Languages are Important in LLM Translation?

标题:哪些语言特点和语言在 LLM 翻译中很重要？

author:Ryandito Diandaru, Lucky Susanto, Zilu Tang, Ayu Purwarianti, Derry Wijaya

date Time:2024-02-21

paper pdf:http://arxiv.org/pdf/2402.13917v1

摘要：
大型语言模型（LLM）在包括机器翻译在内的多项任务中表现出强大的能力。我们的研究重点是评估 Llama2 的机器翻译能力，并探索翻译如何取决于其训练数据中的语言。我们的实验表明，7B Llama2 模型在所有见过的语言中都能获得高于 10 的 BLEU 分数，但在没见过的语言中却不一定。与使用聊天版本或增加拍摄次数相比，使用该模型规模对那些未见过的语言的增益最大。此外，我们的语言距离分析表明，句法相似性并不总是决定翻译质量的主要语言因素。有趣的是，我们发现在特定情况下，尽管某些语言的训练数据比英语少得多，但却表现出与英语相当的强相关性。我们在这里的发现为当前的 LLMs 提供了新的视角，使以英语以外的语言为中心的 LLMs 有可能为多语言模型提供更有效的基础。

14.LongRoPE: Extending LLM Context Window Beyond 2 Million Tokens

标题:LongRoPE：将 LLM 上下文窗口扩展到 200 万个代币以上

author:Yiran Ding, Li Lyna Zhang, Chengruidong Zhang, Yuanyuan Xu, Ning Shang, Jiahang Xu, Fan Yang, Mao Yang

date Time:2024-02-21

paper pdf:http://arxiv.org/pdf/2402.13753v1

摘要：
大语境窗口是大型语言模型（LLM）的理想功能。然而，由于微调成本高、长文本稀缺以及新标记位置引入的灾难性值，目前的扩展上下文窗口仅限于 128k 左右的标记。本文介绍了 LongRoPE，它首次将预训练 LLM 的上下文窗口扩展到了令人印象深刻的 2048k 标记，在 256k 的训练长度内只需 1k 个微调步骤，同时保持了原始短上下文窗口的性能。这是通过三项关键创新实现的：(i) 我们通过高效搜索识别并利用位置插值中的两种不均匀性，为微调提供更好的初始化，并在非微调情况下实现 8 倍扩展；(ii) 我们引入渐进扩展策略，首先微调 256k 长度的 LLM，然后在微调扩展的 LLM 上进行第二次位置插值，以实现 2048k 上下文窗口；(iii) 我们在 8k 长度上重新调整 LongRoPE，以恢复短上下文窗口性能。在 LLaMA2 和 Mistral 上对各种任务进行的大量实验证明了我们方法的有效性。通过 LongRoPE 扩展的模型保留了原始架构，只对位置嵌入稍作修改，并且可以重复使用大部分已有的优化。

15.From Text to CQL: Bridging Natural Language and Corpus Search Engine

标题:从文本到 CQL：衔接自然语言和语料库搜索引擎

author:Luming Lu, Jiyuan An, Yujie Wang, Liner yang, Cunliang Kong, Zhenghao Liu, Shuo Wang, Haozhe Lin, Mingwei Fang, Yaping Huang, Erhong Yang

date Time:2024-02-21

paper pdf:http://arxiv.org/pdf/2402.13740v1

摘要：
自然语言处理（NLP）技术彻底改变了我们与信息系统交互的方式，其重点是将自然语言查询转换为正式查询语言（如 SQL）。然而，人们对语料库查询语言（CQL）的重视程度较低，而 CQL 是语言学研究和文本语料库详细分析的重要工具。手动构建 CQL 查询是一项复杂而耗时的任务，需要大量的专业知识，这对研究人员和从业人员都是一个显著的挑战。本文首次提出了文本到 CQL 任务，旨在将自然语言自动翻译成 CQL。我们为这项任务提出了一个全面的框架，包括一个专门策划的大规模数据集和利用大型语言模型（LLM）的方法，以有效地完成文本到 CQL 任务。此外，我们还建立了先进的评估指标，以评估生成查询的语法和语义准确性。我们创建了基于 LLM 的创新转换方法并进行了详细的实验。实验结果证明了我们方法的有效性，并让我们深入了解了文本到 CQL 任务的复杂性。

16. $\infty$ Bench: Extending Long Context Evaluation Beyond 100K Tokens

标题: $in f t y$ Bench：将长语境评估扩展到 100K 标记之外

author:Xinrong Zhang, Yingfa Chen, Shengding Hu, Zihang Xu, Junhao Chen, Moo Khai Hao, Xu Han, Zhen Leng Thai, Shuo Wang, Zhiyuan Liu, Maosong Sun

date Time:2024-02-21

paper pdf:http://arxiv.org/pdf/2402.13718v2

摘要：
处理和推理长语境对于大型语言模型（LLM）的许多实际应用（如文档理解和代理构建）至关重要。尽管最近在使 LLM 处理超过 10 万个词组的上下文方面取得了长足进步，但目前仍缺乏评估这种长上下文能力的标准化基准。现有的公开基准通常侧重于 10K 左右的上下文，这限制了对 LLM 处理更长上下文的评估和比较。在本文中，我们提出了 $\infty$ Bench，它是第一个平均数据长度超过 10 万 token 的 LLM 基准。 $\infty$ Bench由跨不同领域的合成任务和现实任务组成，以中英文两种语言呈现。 $\infty$ Bench中的任务需要很好地理解上下文中的长依赖关系，因此仅仅从上下文中检索有限数量的段落不足以完成这些任务。在基于 $\infty$ Bench 的实验中，我们评估了专为处理长上下文而定制的最先进的专有和开源 LLM。结果表明，现有的长上下文 LLM 仍需大幅改进，才能有效处理 100K 以上的上下文。我们进一步介绍了有关处理长上下文的 LLM 行为的三项引人入胜的分析。

17.Neeko: Leveraging Dynamic LoRA for Efficient Multi-Character Role-Playing Agent

标题:Neeko：利用动态 LoRA 实现高效的多角色角色扮演代理

author:Xiaoyan Yu, Tongxu Luo, Yifan Wei, Fangyu Lei, Yiming Huang, Peng Hao, Liehuang Zhu

date Time:2024-02-21

paper pdf:http://arxiv.org/pdf/2402.13717v1

摘要：
大型语言模型（LLM）为开放域对话代理带来了革命性的变化，但在多角色扮演（MCRP）场景中却遇到了挑战。为了解决这个问题，我们提出了 Neeko，这是一个专为高效多角色模仿而设计的创新框架。与现有方法不同，Neeko 采用了动态低等级适配器（LoRA）策略，使其能够无缝适应各种角色。我们的框架将角色扮演过程分解为代理预培训、多角色扮演和角色增量学习，可有效处理见过和没见过的角色。这种动态方法与每个角色独特的 LoRA 模块相结合，增强了 Neeko 对独特属性、个性和说话模式的适应性。因此，与大多数现有方法相比，Neeko 在 MCRP 中表现出了卓越的性能，为用户提供了更具吸引力和更多用途的交互体验。代码和数据请访问 https://github.com/weiyifan1023/Neeko。

18.GCOF: Self-iterative Text Generation for Copywriting Using Large Language Model

标题:GCOF：利用大语言模型自迭代生成文案文本

author:Jianghui Zhou, Ya Gao, Jie Liu, Xuemin Zhao, Zhaohua Yang, Yue Wu, Lirong Shi

date Time:2024-02-21

paper pdf:http://arxiv.org/pdf/2402.13667v1

摘要：
大型语言模型（LLM）（如 ChatGPT）大大简化了营销文案的生成，但要制作出满足特定领域要求（如有效吸引客户）的内容仍然是一项重大挑战。在这项工作中，我们引入了遗传文案优化框架（GCOF），旨在提高营销文案创建的效率和吸引力。我们在 LLM 的提示中进行了明确的特征工程。此外，我们还修改了遗传算法（GA）中的交叉算子，将其集成到 GCOF 中，以实现自动特征工程。这种整合促进了营销文案的自我迭代完善。与人工策划的文案相比，在线结果表明，由我们的框架生成的文案的点击率（CTR）平均提高了 50% 以上。

19.User-LLM: Efficient LLM Contextualization with User Embeddings

标题:User-LLM：利用用户嵌入实现高效的 LLM 上下文关联化

author:Lin Ning, Luyang Liu, Jiaxing Wu, Neo Wu, Devora Berlowitz, Sushant Prakash, Bradley Green, Shawn O’Banion, Jun Xie

date Time:2024-02-21

paper pdf:http://arxiv.org/pdf/2402.13598v1

摘要：
大型语言模型（LLM）为自然语言处理带来了革命性的变化。然而，有效整合复杂且可能存在噪声的用户交互数据仍然是一项挑战。为了解决这个问题，我们提出了 User-LLM，这是一个新颖的框架，它利用用户嵌入对 LLM 进行语境化。这些内嵌数据是通过自监督预训练从不同的用户交互中提炼出来的，可以捕捉潜在的用户偏好及其随时间的演变。我们通过交叉关注和软提示将这些用户嵌入信息与 LLM 相结合，使 LLM 能够动态地适应用户上下文。我们在 MovieLens、Amazon Review 和 Google Local Review 数据集上进行的综合实验表明，我们在各种任务中都取得了显著的性能提升。值得注意的是，在长序列任务和需要深入理解用户的任务上，我们的方法优于基于文本提示的上下文化，同时计算效率也很高。我们进一步加入了感知器层，以简化用户编码器和 LLM 之间的集成，从而降低计算需求。

20.LLMs Meet Long Video: Advancing Long Video Comprehension with An Interactive Visual Adapter in LLMs

标题:语言学习者与长视频相遇：利用交互式视觉适配器促进学习者对长视频的理解

author:Yunxin Li, Xinyu Chen, Baotain Hu, Min Zhang

date Time:2024-02-21

paper pdf:http://arxiv.org/pdf/2402.13546v1

摘要：
长视频理解是多媒体和人工智能交叉领域的一项重大而持续的挑战。利用大型语言模型（LLMs）理解视频成为一种新兴且前景广阔的方法。然而，由于视频标记数量庞大，这种方法的计算成本很高；标记聚合会降低视觉清晰度；在回答与视频相关的问题时，还会面临无关视觉标记带来的挑战。为了缓解这些问题，我们在 LLM 中提出了交互式视觉适配器（IVA），旨在增强与细粒度视觉元素的交互。具体来说，我们首先利用视觉编码器和经过预训练的因果转换器将长视频转换成时态视频标记，然后将它们与视频指令一起输入 LLM。随后，我们在 LLM 的内部区块中集成了 IVA，其中包含一个轻量级时帧选择器和一个空间特征交互器，以捕捉指令感知和细粒度的视觉信号。因此，拟议的视频 LLM 可通过适当的长视频建模和精确的视觉交互来促进对长视频内容的全面理解。我们在九个视频理解基准上进行了广泛的实验，实验结果表明，我们的交互式视觉适配器显著提高了视频 LLM 在长视频质量保证任务上的性能。消融研究进一步验证了 IVA 在长视频和短视频理解方面的有效性。

你可能感兴趣的:(LLMs论文时报,人工智能,语言模型,深度学习,LLM,大语言模型,论文推送)

卷积神经网络（Convolutional Neural Network, CNN）不想秃头的程序神经网络语音识别人工智能深度学习网络卷积神经网络
卷积神经网络（ConvolutionalNeuralNetwork,CNN）是一种专门用于处理图像、视频等网格数据的深度学习模型。它通过卷积层自动提取数据的特征，并利用空间共享权重和池化层减少参数量和计算复杂度，成为计算机视觉领域的核心技术。以下是CNN的详细介绍：一、核心思想CNN的核心目标是从图像中自动学习层次化特征，并通过空间共享权重和平移不变性减少参数量和计算成本。其关键组件包括：卷积层（
ResNet（Residual Network）不想秃头的程序神经网络语音识别人工智能深度学习网络残差网络神经网络
ResNet（ResidualNetwork）是深度学习中一种经典的卷积神经网络（CNN）架构，由微软研究院的KaimingHe等人在2015年提出。它通过引入残差连接（SkipConnection）解决了深度神经网络中的梯度消失问题，使得网络可以训练极深的模型（如上百层），并在图像分类、目标检测、语义分割等任务中取得了突破性成果。以下是ResNet的详细介绍：一、核心思想ResNet的核心创新是
平台再升级！接入DeepSeek AI，三大能力一键生成橙武科技低代码 AI deepseek 人工智能
在数字化项目落地过程中，很多企业都会面临相同的问题：数据库建模要写SQL表结构；业务流程需要画LogicFlow流程图；前端页面还要写AMISJSON配置。从想法到实现，中间至少要经历产品经理、架构师、后端、前端多轮沟通。每个环节都耗时，改起来还要推翻重来。demo地址：https://admin.cwcode.top✨我们的平台，现在直接整合了DeepSeekAI大模型只要输入一句需求，就能：✅
P25：LSTM实现糖尿病探索与预测 ?Agony lstm 人工智能 rnn
本文为365天深度学习训练营中的学习记录博客原作者：K同学啊一、相关技术1.LSTM基本概念LSTM（长短期记忆网络）是RNN（循环神经网络）的一种变体，它通过引入特殊的结构来解决传统RNN中的梯度消失和梯度爆炸问题，特别适合处理序列数据。结构组成：遗忘门：决定丢弃哪些信息，通过sigmoid函数输出0-1之间的值，表示保留或遗忘的程度。输入门：决定更新哪些信息，同样通过sigmoid函数控制更新
Python训练营打卡——DAY16（2025.5.5） cosine2025 Python训练营打卡 python 开发语言机器学习
目录一、NumPy数组基础笔记1.理解数组的维度(Dimensions)2.NumPy数组与深度学习Tensor的关系3.一维数组(1DArray)4.二维数组(2DArray)5.数组的创建5.1数组的简单创建5.2数组的随机化创建5.3数组的遍历5.4数组的运算6.数组的索引6.1一维数组索引6.2二维数组索引6.3三维数组索引二、SHAP值的深入理解三、总结1.NumPy数组基础总结2.SH
【重构推荐系统】国产大模型驱动的电商个性化推荐完整实战：架构设计、推理优化与在线部署闭环观熵国产大模型部署实战全流程指南重构人工智能 Agent 智能体落地方案
个人简介作者简介：全栈研发，具备端到端系统落地能力，专注大模型的压缩部署、多模态理解与Agent架构设计。热爱“结构”与“秩序”，相信复杂系统背后总有简洁可控的可能。我叫观熵。不是在控熵，就是在观测熵的流动个人主页：观熵个人邮箱：[email protected]座右铭：愿科技之光，不止照亮智能，也照亮人心！专栏导航观熵系列专栏导航：AI前沿探索：从大模型进化、多模态交互、AIGC内容生成，到
python 脚本遍历目录，并把目录下的非utf-8文件改成utf8 还债大湿兄 python 开发语言数据库
从网上下载的qt项目我本地编译里面经常包含中文，提示编译不过，实际上以前经常手动转，发觉还是用脚本不，毕竟这次下的有点大，我只改.h.cpp#pythonD:\python\filetoUtf.pyE:\EasyCanvas-master\EasyCanvas-masterimportosimportcodecsimportargparseimportsysdefconvert_to_utf8_b
FB-OCC: 3D Occupancy Prediction based on Forward-BackwardView Transformation justtoomuchforyou 智驾
NVidia，CVPR20233DOccupancyPredictionChallengeworkshoppaper：https://arxiv.org/pdf/2307.1492code：https://github.com/NVlabs/FB-BEV大参数量imagebackboneInternImage-H，1B外部数据集预训练：object365nuscenes：有点云label，强化网络
Prompt Engineering for Large Language Models 三月七꧁ ꧂ 论文合集llm+prompt prompt 语言模型人工智能自然语言处理 pdf javascript 前端
题目大型语言模型的快速工程简介随着OpenAI的ChatGPT和Google的Bard等软件的普及，大语言模型（LLM）已经渗透到生活和工作的许多方面。例如，ChatGPT可用于提供定制食谱，建议替换缺失的成分。它可用于起草研究提案、用多种编程语言编写工作代码、在语言之间翻译文本、协助政策制定等等（Gao2023）。用户通过“提示”或自然语言指令与大型语言模型进行交互。精心设计的提示可以带
[Python]-基础篇1- 从零开始的Python入门指南踏雪无痕老爷子 Python python 开发语言
无论你是尚未接触编程的新手，还是想从其他语言转向Python的开发者，这篇文章都是你的入门课。一、Python是什么？Python是一种解释型、高级、通用型编程语言，以简洁明了、简单易用着称。它可以应用于网站开发、自动化脚本、数据分析、人工智能、系统操作等多种场景。二、如何安装Python步骤：访问Python官方网站选择目前最新的Python3.x版本下载Windows用户请务必勾选“AddPy
RAG应用的评估（一） AI老炮 AIGC ai 机器学习人工智能语言模型
前言上篇文档主要是对Advanced-RAG的定义、策略和适用场景做了一个细致的分析，那么当我们准备将一个基于大模型的RAG应用投入生产时，如何去判断这个RAG是否合理呢？下面有一些问题是需要提前考并应付的：LLM输出的不确定性会带来一定的不可预知性。一个RAG应用在投入生产之前需要科学的测试以衡量这种不可预知性。在LLM应用上线后的持续维护中,需要科学、快速、可复用的手段来衡量其改进效果,比如回
【RAG面试题】LLMs已经具备了较强能力,存在哪些不足点? 一叶千舟 AI面试题【RAG】RAG
目录LLMs核心不足点1、知识过时与静态性（LackofReal-Time&DynamicKnowledge）：2、幻觉与事实性错误（Hallucinations&FactualInaccuracies）：3、领域专业知识深度不足（LimitedDomain-SpecificExpertise）：4、缺乏透明度和可追溯性（LackofTransparency&Traceability）：5、上下文
MCP-Proxy：开发多LLM & 多MCP 支持并安全访问MCP Server的秘密 IT古董技术杂谈安全 MCP MCP-Proxy
在构建多模型、多协议、可控可信的大模型接入平台时，MCP-Proxy扮演着关键中枢。它不仅要支持多个LLM接入，还要保障对后端MCPServer的安全访问、请求审计、能力切换与资源隔离。什么是MCP/MCP-Proxy？MCP（ModelCapabilityProtocol）是新一代模型能力调用协议，类似于OpenAI的API，但可支持：多厂商大模型（OpenAI、DeepSeek、Yi、Chat
构建医学文献智能助手：基于 LangChain 的专业领域 RAG 系统实践
前言在当今医疗科技快速发展的时代，每天都有数以千计的医学研究成果在全球范围内发表。从临床试验报告到基础研究论文，从流行病学调查到药物研发数据，这些专业文献承载着推动医学进步的重要知识。然而，面对如此海量且专业性极强的文献资料，医疗从业者往往感到力不从心。如何在有限的时间内，准确把握文献核心价值，并将其转化为临床实践的指导？这个问题一直困扰着整个医疗行业。1.项目背景与业务价值1.1医学文献阅读的困
【机器学习&深度学习】反向传播机制
目录一、一句话定义二、类比理解三、为什重要？四、用生活例子解释：神经网络=烹饪机器人4.1第一步：尝一口（前向传播）4.2第二步：倒着推原因（反向传播）五、换成人工智能流程说一遍六、图示类比：找山顶（最优参数）七、总结一句人话八、PyTorch代码示例：亲眼看到每一层的梯度九、梯度=损失函数对参数的偏导数十、类比总结反向传播（Backpropagation）是神经网络中训练过程的核心机制，它就像“
人脸识别算法赋能园区无人超市安防升级智驱力人工智能算法人工智能边缘计算人脸识别智慧园区智慧工地智慧煤矿
人脸识别算法赋能园区无人超市安防升级正文在园区无人超市的运营管理中，传统安防手段依赖人工巡检或基础监控设备，存在响应滞后、误报率高、环境适应性差等问题。本文从技术背景、实现路径、功能优势及应用场景四个维度，阐述如何通过人脸识别检测、人员入侵算法及疲劳检测算法的协同应用，构建高效、精准的智能安防体系。一、技术背景：视觉分析算法的核心支撑人脸识别算法基于深度学习的卷积神经网络（CNN）模型，通过提取面
企业级知识库私有化部署：腾讯混元+云容器服务TKE实战大熊计算机 #腾讯云语言模型
1.背景需求分析在金融、医疗等数据敏感行业，企业需要构建完全自主可控的知识库系统。本文以某证券机构智能投研系统为原型，演示如何基于腾讯混元大模型与TKE容器服务实现：千亿级参数模型的私有化部署金融领域垂直场景微调高并发低延迟推理服务全链路安全合规方案1.1典型技术挑战#性能基准测试数据（单位：QPS）|场景|裸机部署|容器化部署|优化后||--------------------|--------
GPT-4o重磅升级！只需一条指令，教你秒出SCI级专业科研图！智写AI AI学术写作指南信息可视化人工智能
经过数月爆肝，七哥终于完成专业的学术AI使用教程，估计也有个80万字的详细操作指南。分为多个细分的专业写作场景，跟着一步一步操作，借助ChatGPT做学术、干科研、写论文、课题申报都变得超简单。欢迎加我交流（yida985），祝你一臂之力。七哥之前写过关于用AI生成流程图的教程，不过需要借助其他软件才能搞定完美的流程图。近期GPT-4o全新推出了“生图功能”，这个生图的过程就更加方便轻松了，全能G
RAG 调优指南：Spring AI Alibaba 模块化 RAG 原理与使用 ApacheDubbo spring 人工智能架构 Spring AI RAG
>夏冬,SpringAIAlibabaContributorRAG简介什么是RAG（检索增强生成）RAG（RetrievalAugmentedGeneration，检索增强生成）是一种结合信息检索和文本生成的技术范式。核心设计理念RAG技术就像给AI装上了「实时百科大脑」，通过先查资料后回答的机制，让AI摆脱传统模型的"知识遗忘"困境。️四大核心步骤1.文档切割→建立智能档案库核心任务:将海量文档
潜入思维的海洋：SoftCoT++如何让语言模型更聪明步子哥智能涌现语言模型人工智能自然语言处理
在人工智能的浩瀚星空下，大型语言模型（LLMs）如同一颗颗璀璨的恒星，照亮了从文本生成到复杂推理的广阔领域。然而，这些模型在推理任务中往往像是在迷雾中航行——尽管它们能抵达目的地，却常常因为固定的思维路径而错过更优的航线。2025年5月，一篇题为《SoftCoT++:Test-TimeScalingwithSoftChain-of-ThoughtReasoning》的论文如同一盏明灯，照亮了如何让
BI+AI实战：我们如何用3秒完成车企供应链推演 qq_43696218 人工智能
一、BI+AI引领财务分析新纪元在财务数据分析领域，奥威BI+AI正以革命性的姿态颠覆传统。当金蝶、用友等工具仍深陷报表泥潭时，奥威BI+AI通过深度融合商业智能（BI）与人工智能（AI），实现了从滞后报表到实时洞察的飞跃。这不仅极大地提升了财务分析的效率，更为企业的战略决策提供了前所未有的精准支持。二、BI+AI的核心技术优势‌实时动态分析‌o奥威BI+AI摒弃了静态数据集，依托原始科目余额表实
Spring AI Alibaba 支持国产大模型的Spring ai框架程序员老陈头面试学习路线阿里巴巴 spring 人工智能 java
总计30万奖金，SpringAIAlibaba应用框架挑战赛开赛点此了解SpringAI：java做ai应用的最好选择过去，Java在AI应用开发方面缺乏一个高效且易于集成的框架，这限制了开发者快速构建和部署智能应用程序的能力。SpringAI正是为解决这一问题而生，它提供了一套统一的接口，使得AI功能能够以一种标准化的方式被集成到现有的Java项目中。此外，SpringAI与原有的Spring生
技术调研：时序数据库（一） myskybeyond 时序数据库时序数据库数据库
选择时序数据库时，选择当下主流的解决方案。目前主流的开源解决方案有InfluxDB、TDengine和TimescaleDB。下文从多个维度对比分析，最终根据需求做出选型决策。1.核心架构与设计理念数据库架构特点核心优势InfluxDB-专为时序数据设计的分布式数据库-基于时间线（TimeSeries）模型-开源版（OSS）与商业版（Cloud/Enterprise）功能差异大高写入吞吐量、原生支
DeepSeek-V3 通俗详解：从诞生到优势，以及与 GPT-4o 的对比码事漫谈 AI ai
前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站1.DeepSeek的前世今生1.1什么是DeepSeek？DeepSeek是一家专注于人工智能技术研发的公司，致力于打造高性能、低成本的AI模型。它的目标是让AI技术更加普惠，让更多人能够用上强大的AI工具。1.2DeepSeek-V3的诞生DeepSeek-V3是DeepSeek公司推出的最新一代A
企业级AI开发利器：Spring AI框架深度解析与实战_spring ai实战 AI大模型-海文人工智能 spring python 算法开发语言 java 机器学习
企业级AI开发利器：SpringAI框架深度解析与实战一、前言：Java生态的AI新纪元在人工智能技术爆发式发展的今天，Java开发者面临着一个新的挑战：如何将大语言模型（LLMs）和生成式AI（GenAI）无缝融入企业级应用。传统的Java生态缺乏统一的AI集成方案，开发者往往需要为不同AI供应商（如OpenAI、阿里云、HuggingFace）编写大量重复的接口适配代码，这不仅增加了开发成本，
【第15章】亿级电商平台订单系统-高可用架构设计 cherry5230 亿级流量架构设计与落地系统架构分布式架构中间件
1-1本章导学课程概述核心内容：订单系统高可用架构设计项目背景：年交易额200亿的B2B电商平台订单系统本章学习路径高可用概念解析设计原则学习七大架构设计方法论项目实战应用一、高可用核心概念定义与价值解析系统可靠性标准指标二、设计原则体系冗余设计故障自动转移服务降级策略监控预警机制三、七大高可用设计方法论<
图扑软件智慧云展厅，开启数字化展馆新模式智慧园区可视化 5g 人工智能大数据安全云计算
随着疫情的影响以及新兴技术的不断发展，展会的发展形式也逐渐从线下转向线上。通过“云”上启动、云端互动、双线共频的形式开展。通过应用大数据、人工智能、沉浸式交互等多重技术手段，构建数据共享、信息互通、精准匹配的高精度“云展厅”，突破时空壁垒限制。图扑软件运用HT强大的渲染功能，数字孪生“云展位”，1:1复现实际展厅内部独特的结构造型和建筑特色。也可以第一人称视角漫游，模拟用户在展厅内的参观场景，在保
转行要趁早！网络安全行业人才缺口大，企业招聘需求正旺！
网络安全行业具有人才缺口大、岗位选择多、薪资待遇好、学历要求不高等优势，对于想要转行的人员来说，是一个非常不错的选择。人才缺口大网络安全攻防技术手段日新月异，特别是现在人工智能技术飞速发展，网络安全形势复杂严峻，人才重要性凸显。教育部《网络安全人才实战能力白皮书》数据显示，到2027年，我国网络安全人员缺口将达327万。近期发布的《2024年网络安全产业人才发展报告》中提到，沿用ISC2的人才缺口
GEO引领品牌大模型种草：迈向Web3.0与元宇宙的认知新空间 GEO科技经验分享
在数字技术的演进历程中，我们正经历着从Web2.0到Web3.0、从平面互联网到沉浸式元宇宙的范式转变。这一转变不仅重塑了数字空间的形态和交互方式，更深刻改变了品牌与用户的连接模式和价值创造逻辑。而在这个新兴的数字疆域中，生成式引擎优化（GEO）正展现出前所未有的战略价值和应用潜力，成为品牌构建元宇宙和Web3.0存在的关键能力，特别是在“品牌大模型种草”场景下，品牌如何被理解、记住、推荐，正成为
基于机器学习的智能文本分类技术研究与应用
在当今数字化时代，文本数据的爆炸式增长给信息管理和知识发现带来了巨大的挑战。从新闻文章、社交媒体帖子到企业文档和学术论文，海量的文本数据需要高效地分类和管理，以便用户能够快速找到所需信息。传统的文本分类方法主要依赖于人工规则和关键词匹配，这些方法不仅效率低下，而且难以应对复杂多变的文本内容。近年来，机器学习技术的快速发展为文本分类提供了一种高效、自动化的解决方案。一、机器学习在文本分类中的应用概述
关于旗正规则引擎中的MD5加密问题何必如此 jsp MD5 规则加密
一般情况下，为了防止个人隐私的泄露，我们都会对用户登录密码进行加密，使数据库相应字段保存的是加密后的字符串，而非原始密码。在旗正规则引擎中，通过外部调用，可以实现MD5的加密，具体步骤如下： 1.在对象库中选择外部调用，选择“com.flagleader.util.MD5”，在子选项中选择“com.flagleader.util.MD5.getMD5ofStr({arg1})”； 2.在规
【Spark101】Scala Promise/Future在Spark中的应用 bit1129 Promise
Promise和Future是Scala用于异步调用并实现结果汇集的并发原语，Scala的Future同JUC里面的Future接口含义相同，Promise理解起来就有些绕。等有时间了再仔细的研究下Promise和Future的语义以及应用场景，具体参见Scala在线文档：http://docs.scala-lang.org/sips/completed/futures-promises.html
spark sql 访问hive数据的配置详解 daizj spark sql hive thriftserver
spark sql 能够通过thriftserver 访问hive数据，默认spark编译的版本是不支持访问hive，因为hive依赖比较多，因此打的包中不包含hive和thriftserver,因此需要自己下载源码进行编译，将hive，thriftserver打包进去才能够访问，详细配置步骤如下： 1、下载源码 2、下载Maven,并配置此配置简单，就略过
HTTP 协议通信周凡杨 java httpclient http 通信
一：简介 HTTPCLIENT，通过JAVA基于HTTP协议进行点与点间的通信！二：代码举例测试类： import java
java unix时间戳转换 g21121 java
把java时间戳转换成unix时间戳： Timestamp appointTime=Timestamp.valueOf(new SimpleDateFormat("yyyy-MM-dd HH:mm:ss").format(new Date())) SimpleDateFormat df = new SimpleDateFormat("yyyy-MM-dd hh:m
web报表工具FineReport常用函数的用法总结（报表函数）老A不折腾 web报表 finereport 总结
说明：本次总结中，凡是以tableName或viewName作为参数因子的。函数在调用的时候均按照先从私有数据源中查找，然后再从公有数据源中查找的顺序。 CLASS CLASS(object):返回object对象的所属的类。 CNMONEY CNMONEY(number,unit)返回人民币大写。 number:需要转换的数值型的数。 unit:单位，
java jni调用c++ 代码报错墙头上一根草 java C++jni
# # A fatal error has been detected by the Java Runtime Environment: # # EXCEPTION_ACCESS_VIOLATION (0xc0000005) at pc=0x00000000777c3290, pid=5632, tid=6656 # # JRE version: Java(TM) SE Ru
Spring中事件处理de小技巧 aijuans spring Spring 教程 Spring 实例 Spring 入门 Spring3
Spring 中提供一些Aware相关de接口，BeanFactoryAware、 ApplicationContextAware、ResourceLoaderAware、ServletContextAware等等，其中最常用到de匙ApplicationContextAware.实现ApplicationContextAwaredeBean，在Bean被初始后，将会被注入 Applicati
linux shell ls脚本样例 annan211 linux linux ls源码 linux 源码
#! /bin/sh - #查找输入文件的路径 #在查找路径下寻找一个或多个原始文件或文件模式 # 查找路径由特定的环境变量所定义 #标准输出所产生的结果通常是查找路径下找到的每个文件的第一个实体的完整路径 # 或是filename :not found 的标准错误输出。 #如果文件没有找到则退出码为0 #否则即为找不到的文件个数 #语法 pathfind [--
List,Set,Map遍历方式 (收集的资源,值得看一下) 百合不是茶 list set Map遍历方式
List特点：元素有放入顺序，元素可重复 Map特点：元素按键值对存储，无放入顺序 Set特点：元素无放入顺序，元素不可重复（注意：元素虽然无放入顺序，但是元素在set中的位置是有该元素的HashCode决定的，其位置其实是固定的） List接口有三个实现类：LinkedList，ArrayList，Vector LinkedList：底层基于链表实现，链表内存是散乱的，每一个元素存储本身
解决SimpleDateFormat的线程不安全问题的方法 bijian1013 java thread 线程安全
在Java项目中，我们通常会自己写一个DateUtil类，处理日期和字符串的转换，如下所示： public class DateUtil01 { private SimpleDateFormat dateformat = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss"); public void format(Date d
http请求测试实例（采用fastjson解析） bijian1013 http 测试
在实际开发中，我们经常会去做http请求的开发，下面则是如何请求的单元测试小实例，仅供参考。 import java.util.HashMap; import java.util.Map; import org.apache.commons.httpclient.HttpClient; import
【RPC框架Hessian三】Hessian 异常处理 bit1129 hessian
RPC异常处理概述 RPC异常处理指是，当客户端调用远端的服务，如果服务执行过程中发生异常，这个异常能否序列到客户端？如果服务在执行过程中可能发生异常，那么在服务接口的声明中，就该声明该接口可能抛出的异常。在Hessian中，服务器端发生异常，可以将异常信息从服务器端序列化到客户端，因为Exception本身是实现了Serializable的
【日志分析】日志分析工具 bit1129 日志分析
1. 网站日志实时分析工具 GoAccess http://www.vpsee.com/2014/02/a-real-time-web-log-analyzer-goaccess/ 2. 通过日志监控并收集 Java 应用程序性能数据(Perf4J) http://www.ibm.com/developerworks/cn/java/j-lo-logforperf/ 3.log.io 和
nginx优化加强战斗力及遇到的坑解决 ronin47 nginx 优化
　　　先说遇到个坑，第一个是负载问题，这个问题与架构有关，由于我设计架构多了两层，结果导致会话负载只转向一个。解决这样的问题思路有两个：一是改变负载策略，二是更改架构设计。　　　由于采用动静分离部署，而nginx又设计了静态，结果客户端去读nginx静态，访问量上来，页面加载很慢。解决：二者留其一。最好是保留apache服务器。　　　来以下优化：　　　
java-50-输入两棵二叉树A和B，判断树B是不是A的子结构 bylijinnan java
思路来自： http://zhedahht.blog.163.com/blog/static/25411174201011445550396/ import ljn.help.*; public class HasSubtree { /**Q50. * 输入两棵二叉树A和B，判断树B是不是A的子结构。例如，下图中的两棵树A和B，由于A中有一部分子树的结构和B是一
mongoDB 备份与恢复开窍的石头 mongDB备份与恢复
Mongodb导出与导入 1: 导入/导出可以操作的是本地的mongodb服务器,也可以是远程的. 所以,都有如下通用选项: -h host 主机 --port port 端口 -u username 用户名 -p passwd 密码 2: mongoexport 导出json格式的文件
[网络与通讯]椭圆轨道计算的一些问题 comsci 网络
如果按照中国古代农历的历法，现在应该是某个季节的开始，但是由于农历历法是3000年前的天文观测数据，如果按照现在的天文学记录来进行修正的话，这个季节已经过去一段时间了。。。。。也就是说，还要再等3000年。才有机会了，太阳系的行星的椭圆轨道受到外来天体的干扰，轨道次序发生了变
软件专利如何申请 cuiyadll 软件专利申请
软件技术可以申请软件著作权以保护软件源代码，也可以申请发明专利以保护软件流程中的步骤执行方式。专利保护的是软件解决问题的思想，而软件著作权保护的是软件代码（即软件思想的表达形式）。例如，离线传送文件，那发明专利保护是如何实现离线传送文件。基于相同的软件思想，但实现离线传送的程序代码有千千万万种，每种代码都可以享有各自的软件著作权。申请一个软件发明专利的代理费大概需要5000-8000申请发明专利可
Android学习笔记 darrenzhu android
1.启动一个AVD 2.命令行运行adb shell可连接到AVD,这也就是命令行客户端 3.如何启动一个程序 am start -n package name/.activityName am start -n com.example.helloworld/.MainActivity 启动Android设置工具的命令如下所示： # am start -
apache虚拟机配置，本地多域名访问本地网站 dcj3sjt126com apache
现在假定你有两个目录，一个存在于 /htdocs/a，另一个存在于 /htdocs/b 。现在你想要在本地测试的时候访问 www.freeman.com 对应的目录是 /xampp/htdocs/freeman ,访问 www.duchengjiu.com 对应的目录是 /htdocs/duchengjiu。 1、首先修改C盘WINDOWS\system32\drivers\etc目录下的
yii2 restful web服务[速率限制] dcj3sjt126com PHP yii2
速率限制为防止滥用，你应该考虑增加速率限制到您的API。例如，您可以限制每个用户的API的使用是在10分钟内最多100次的API调用。如果一个用户同一个时间段内太多的请求被接收，将返回响应状态代码 429 (这意味着过多的请求)。要启用速率限制, [[yii\web\User::identityClass|user identity class]] 应该实现 [[yii\filter
Hadoop2.5.2安装——单机模式 eksliang hadoop hadoop单机部署
转载请出自出处：http://eksliang.iteye.com/blog/2185414 一、概述 Hadoop有三种模式单机模式、伪分布模式和完全分布模式，这里先简单介绍单机模式，默认情况下，Hadoop被配置成一个非分布式模式，独立运行JAVA进程，适合开始做调试工作。二、下载地址 Hadoop 网址http:
LoadMoreListView+SwipeRefreshLayout（分页下拉）基本结构 gundumw100 android
一切为了快速迭代 import java.util.ArrayList; import org.json.JSONObject; import android.animation.ObjectAnimator; import android.os.Bundle; import android.support.v4.widget.SwipeRefreshLayo
三道简单的前端HTML/CSS题目 ini html Web 前端 css 题目
使用CSS为多个网页进行相同风格的布局和外观设置时，为了方便对这些网页进行修改，最好使用（）。http://hovertree.com/shortanswer/bjae/7bd72acca3206862.htm 在HTML中加入<table style=”color:red; font-size:10pt”>，此为（）。http://hovertree.com/s
overrided方法编译错误 kane_xie override
问题描述：在实现类中的某一或某几个Override方法发生编译错误如下： Name clash: The method put(String) of type XXXServiceImpl has the same erasure as put(String) of type XXXService but does not override it 当去掉@Over
Java中使用代理IP获取网址内容（防IP被封，做数据爬虫） mcj8089 免费代理IP 代理IP 数据爬虫 JAVA设置代理IP 爬虫封IP
推荐两个代理IP网站： 1. 全网代理IP：http://proxy.goubanjia.com/ 2. 敲代码免费IP：http://ip.qiaodm.com/ Java语言有两种方式使用代理IP访问网址并获取内容，方式一，设置System系统属性 // 设置代理IP System.getProper
Nodejs Express 报错之 listen EADDRINUSE qiaolevip 每天进步一点点学习永无止境 nodejs 纵观千象
当你启动 nodejs服务报错： >node app Express server listening on port 80 events.js:85 throw er; // Unhandled 'error' event ^ Error: listen EADDRINUSE at exports._errnoException (
C++中三种new的用法 _荆棘鸟_ C++new
转载自：http://news.ccidnet.com/art/32855/20100713/2114025_1.html 作者: mt 其一是new operator，也叫new表达式；其二是operator new，也叫new操作符。这两个英文名称起的也太绝了，很容易搞混，那就记中文名称吧。new表达式比较常见，也最常用，例如： string* ps = new string("
Ruby深入研究笔记1 wudixiaotie Ruby
module是可以定义private方法的 module MTest def aaa puts "aaa" private_method end private def private_method puts "this is private_method" end end

AI推介-大语言模型LLMs论文速览（arXiv方向）：2024.02.20-2024.02.25

论文目录~

1.Zero-shot cross-lingual transfer in instruction tuning of large language model

2.Scaling Efficient LLMs

3.LLM-DA: Data Augmentation via Large Language Models for Few-Shot Named Entity Recognition

4.Whose LLM is it Anyway? Linguistic Comparison and LLM Attribution for GPT-3.5, GPT-4 and Bard

5.Do LLMs Implicitly Determine the Suitable Text Difficulty for Users?

6.Can Language Models Act as Knowledge Bases at Scale?

7.Take the Bull by the Horns: Hard Sample-Reweighted Continual Training Improves LLM Generalization

8.Can Large Language Models Detect Misinformation in Scientific News Reporting?

9.FanOutQA: Multi-Hop, Multi-Document Question Answering for Large Language Models

10.LexC-Gen: Generating Data for Extremely Low-Resource Languages with Large Language Models and Bilingual Lexicons

11.Can Watermarks Survive Translation? On the Cross-lingual Consistency of Text Watermark for Large Language Models

12.Hallucinations or Attention Misdirection? The Path to Strategic Value Extraction in Business Using Large Language Models

13.What Linguistic Features and Languages are Important in LLM Translation?

14.LongRoPE: Extending LLM Context Window Beyond 2 Million Tokens

15.From Text to CQL: Bridging Natural Language and Corpus Search Engine

16. ∞ \infty ∞Bench: Extending Long Context Evaluation Beyond 100K Tokens

17.Neeko: Leveraging Dynamic LoRA for Efficient Multi-Character Role-Playing Agent

18.GCOF: Self-iterative Text Generation for Copywriting Using Large Language Model

19.User-LLM: Efficient LLM Contextualization with User Embeddings

20.LLMs Meet Long Video: Advancing Long Video Comprehension with An Interactive Visual Adapter in LLMs

你可能感兴趣的:(LLMs论文时报,人工智能,语言模型,深度学习,LLM,大语言模型,论文推送)

16. $\infty$ Bench: Extending Long Context Evaluation Beyond 100K Tokens