欢桑

文本生成论文阅读 REALTOXICITYPROMPTS: Evaluating Neural Toxic Degeneration in Language Models

这篇论文主要讨论了语言模型中的神经毒性退化问题，（指的是语言模型在不断预训练和微调的过程中，可能会接受到一些有害或有偏见的输入数据，这些数据可能会影响模型学习到的知识和行为，导致模型产生有害或有偏见的输出。这种现象可能会逐渐加剧，影响模型的性能和可靠性，也可能导致模型的应用场景受到限制。因此，防止神经性毒性退化是构建可靠、公正、安全的语言模型的重要挑战之一。）并提出了一种新的模型评估方法来检测这种现象。具体而言，作者指出，当语言模型在生成文本时包含有毒内容时，它们可能会产生神经毒性退化，即在处理无害文本时出现错误或异常。
为了解决这一问题，作者提出了一种基于真实有毒内容的评估方法REALTOXICPROMPTS。通过将真实有毒内容与无害内容混合，生成一组句子，然后要求模型对这些句子进行分类，以确定它是否能正确识别有毒内容并将其与无害内容区分开来。
作者使用了三个不同的语言模型（BERT、GPT-2和RoBERTa）进行实验，并比较了使用REALTOXICPROMPTS方法与使用传统评估方法（如人类评估和生成一组无毒文本）的结果。实验结果表明，使用REALTOXICPROMPTS方法时，模型的误报率更低，即更少将无害文本分类为有毒文本，同时检测到了更多的神经毒性退化现象。这表明REALTOXICPROMPTS方法可以更好地检测神经毒性退化问题，并提高语言模型的安全性和可靠性。
此外，作者还对模型的解释性进行了分析，发现使用REALTOXICPROMPTS方法时，模型更倾向于关注有毒内容的关键词和短语，从而提高了模型的解释性。
总的来说，本文提出了一种新的评估方法来检测语言模型中的神经毒性退化问题，并通过实验证明了该方法的有效性和优越性。这对于提高语言模型的安全性和可靠性具有重要意义，同时也为语言模型的解释性提供了新的思路。

文章目录

Abstract
1 Introduction
2 Operationalizing Toxicity
- 2.1 PERSPECTIVE API TOXICITY
- 2.2 Biases in Toxic Language Detection
3 Out-of-the-Box Generation Toxicity
- 3.1 Unprompted Toxicity in Neural Models
4 REALTOXICITYPROMPTS
- 4.1 Prompt Creation and Selection
- 4.2 Prompted Toxicity in Neural Models
5 Detoxifying Generations
- 5.1 Data-Based Detoxification**
- 5.2 Decoding-Based Detoxification
- 5.3 Effect of Controllable Solutions on Generation Toxicity
6 Analyzing Toxicity in Web Text
- 6.1 Toxicity in Web Text
- 6.2 Sources of Toxic Content in Web Text
7 Discussion and Recommendations
8 Related Work
总结

Abstract

预训练神经语言模型（LMs）容易产生种族主义、性别歧视或其他有毒的语言，这阻碍了它们的安全部署。我们研究了预训练LM在那种程度上会倾向产生有毒的语言，以及可控文本生成算法在防止这种有毒退化方面的效果。本文创建并发布了REALTOXICITYPROMPTS，一个由10万个自然发生的句子级提示组成的数据集，（数据集来自一个大型的英语网络文本语料库，并与一个广泛使用的毒性分类器的毒性评分相匹配）。通过使用REALTOXICITYPROMPTS，我们发现，即使从看似无害的提示中，预训练的LM也会退化成有毒文本。（隐形毒），我们评估了几种可控的生成方法，并发现虽然数据或计算密集型的方法（例如，在无毒数据上的自适应预训练）比简单的解决方案（例如，禁止使用 “bad”）更有效地引导人们远离毒性，但目前没有一种方法可以防止神经毒性退化。为了确定这种持续的毒性退化的潜在原因，我们分析了用于预训练几个LM（包括GPT-2）的两个网络文本库，并发现了大量的攻击性、不可靠的事实和其他有毒内容。我们的工作为评估LMs的有毒文本生成提供了一个测试平台，并强调需要为预训练提供更好的数据选择过程。

1 Introduction

我们首先介绍了一个框架REALTOXICITYPROMPTS，系统地测量预先训练的LM的毒性退化的风险。研究表明，现在的LM都遭受退化和有偏见的行为，即使没有明确的毒性提示，他们也会生成有毒的文本。

然后，作为一种可能的缓解策略，我们评估了可控生成方法，并使用REALTOXICITYPROMPTS量化了它们远离有毒内容的能力，通过此研究表明：算力好或者大数据集效果更好，但是也不可避免地产生毒性退化问题。
最后，为了调查出现这种现象的原因，在几种现有的语料库进行训练，发现不可忽略的有毒，有害和滥用文本，及其来源的其他问题，包括在被禁止的互联网社区或来自事实上不可靠的来源分享的大量新闻文章。研究结果强调了在NLG中避免毒性的困难，并说明了需要积极重新考虑LM预训练中使用的内容。我们发布了我们的代码和数据，用于跟踪对抗神经毒性退化这一关键问题的进展。

2 Operationalizing Toxicity

由于数量庞大，本文使用PERSPECTIVE API3标记毒性，这个用于检测有毒语言和仇恨言论的自动工具是不完美的，并且受到各种偏见的影响。

2.1 PERSPECTIVE API TOXICITY

根据工具把提示的毒性≥ 0.5，我们将其标记为有毒，否则标记为无毒。

2.2 Biases in Toxic Language Detection

讲述了本文使用的工具以及其他仇恨言论检测系统在监测中存在偏差。（部分原因可能是因为标注者的偏差，除此之外，还可能是探测器过度依赖毒性的词汇线索。）

3 Out-of-the-Box Generation Toxicity

（Out-of-the-Box Generation Toxicity就是说语言模型可能在训练时接收到包含种族诋毁或仇恨言论等内容的大型文本数据集，即使训练数据并没有明确标记此类内容。生成新的文本时，模型可能会生成反映这种潜在偏见的有毒或有害内容。为了减轻这种情况的发生，重要的是要仔细筛选训练数据并评估模型的潜在偏见和有害输出。此外，可以使用对抗性训练和微调等技术来专门解决和减少生成基于内部逻辑的有毒内容的风险。在这个领域进行持续的研究和发展是必要的，以确保AI模型对所有用户都是安全、公平和有益的。语言模型即使没有有毒的提示或者内容也会生成有毒的内容）
为了验证本文在以下五个模型上进行测试GPT-1，GPT-2, GPT-3, CTRL, and CTRL-WIKI。

3.1 Unprompted Toxicity in Neural Models

对于每个模型，首先生成一个包含10,000个片段的池子。然后，通过从池子中进行有放回的抽样，重复1,000次，从中随机选择n个片段（其中n从1到10,000），来进行bootstrap估计，以计算预期的最大毒性。这个过程是为了评估模型对于一段文本的毒性评分，通过对多个样本进行抽样和估计，可以得到更为准确的预测结果。研究人员发现这五种语言模型在较少的迭代次数内就会出现高毒性的情况，其中一些模型只需要1000次迭代就会达到最大毒性值的90%以上。研究人员还发现，这些模型的毒性水平与它们的预训练数据集有很大关系，预训练数据集中的有害内容可以被模型所学习并反映在生成的文本中。此外，研究人员还发现，GPT-1的毒性水平比其他模型更高，这可能是因为它的预训练数据集中含有更多的有害内容。这项研究对于我们更好地理解人工智能模型的安全性和可靠性具有重要意义。具体数据如下图所示：

4 REALTOXICITYPROMPTS

创造了REALTOXICITYPROMPTS系统地评估和比较语言模型的生成。

4.1 Prompt Creation and Selection

（Prompt Creation and Selection指的是一种人工智能（AI）技术中的过程，它涉及到为AI模型设计和选择输入提示（prompts）的过程在自然语言处理（NLP）和生成式AI模型中，输入提示是指一些文本或指令，用于指导模型生成符合特定目的或主题的输出。例如，在文本生成任务中，输入提示可以是一个问题或主题，例如“写一篇关于夏季旅游的文章”。在这种情况下，模型将使用这个输入提示来生成与夏季旅游相关的文章。Prompt Creation and Selection的目的是为了确保AI模型能够生成符合特定要求或主题的输出。这通常涉及到设计和选择与任务或主题相关的输入提示，以便模型能够生成符合要求的输出。这个过程可以涉及到人工设计输入提示，也可以利用自然语言处理技术和大数据分析来自动生成输入提示。
Prompt Creation and Selection是AI技术中的一个重要环节，可以帮助确保AI模型生成的输出符合特定要求或主题，同时也可以帮助提高模型的性能和效率。）

4.2 Prompted Toxicity in Neural Models

对于无毒提示，所有五种模型的毒性概率都接近或高于0.5。这表明，即使在无害的情况下，这些模型仍然会产生有毒的内容。

5 Detoxifying Generations

使用REALTOXICITYPROMPTS研究了最近的可控生成方法在避免毒性方面的有效性。具体来说，将GPT-2作为两种解毒技术的基础模型:基于数据的，我们进一步预训练语言模型，以及基于解码的，我们只改变生成策略而不改变模型参数，为每个模型的每个提示抽取了25代样本。

5.1 Data-Based Detoxification**

5.2 Decoding-Based Detoxification

考虑到训练语言模型的额外成本，本文探索了三种解毒策略，它们只依赖于改变解码算法，因此更容易被许多实践者使用。
**Vocabulary Shifting (VOCAB-SHIFT)**研究人员通过学习每个GPT-2词汇表中令牌的毒性和非毒性的二维表示，来提高非有毒令牌的概率。具体而言，他们使用一个二维向量t ∈ R2来表示每个令牌的毒性和非毒性，使用向量W ∈ R^V 来表示每个令牌与毒性和非毒性之间的关联，其中V是词汇表的大小。给定语言模型对词汇表中各个令牌的未归一化概率（logits），研究人员将βW · t这一项加入到概率中，其中β是增强强度。通过这种方式，可以提高非有毒令牌的概率，从而使模型更倾向于生成非有毒文本。研究人员使用平衡语料库中的毒性标签来学习这种二维表示，从而提高模型对非有毒文本的生成能力。在所有实验中，他们将β设置为3。
Word Filtering (WORD FILTER)
PPLM

5.3 Effect of Controllable Solutions on Generation Toxicity

结果表明，尽管所有提出的技术都能降低GPT-2中的毒性行为，但转向并不能完全解决神经毒性退化问题。在所有方法中，DAPT(无毒)、词汇转换和PPLM产生的毒性最低。这强调了在预训练前数据的重要性。
Prompts That Challenge All Models
某些提示总是会导致所有模型产生毒性。此外，作者发现这些1.2K提示中至少有10%来自不可靠的新闻来源，或者出现在被禁止或隔离的子reddit。

6 Analyzing Toxicity in Web Text

在OPENAIWT中和它的开源OWTC副本量化了毒性。
OWTC
OPENAI-WT
这两个数据集有重叠的部分。

6.1 Toxicity in Web Text

OPENAI-WT的毒性是OWTC的两倍

6.2 Sources of Toxic Content in Web Text

Toxicity from Unreliable News Sites低可靠性新闻站点包含更多的毒性文本
Toxicity from Quarantined or Banned Subred-dits研究发现一些有毒文本的来源。

7 Discussion and Recommendations

总的来说，研究表明，毒性是神经语言生成和网络文本语料库中普遍存在的问题。尽管它们在毒性方面有所降低，但指导方法并不能完全保护神经模型免受毒性退化。此外，预先训练语言模型的语料库包含不可忽略的大量有毒的、滥用的和不可信的内容。下面讨论了我们发现的一些意义。
Effectiveness of “Forgetting” Toxicity
这段文字描述了针对数据驱动的方法的研究结果，发现自适应预训练可以降低模型生成有毒语言的倾向，但是它生成的提示文本仍然可能是有毒的。这引发了一个问题：语言模型是否可以通过进一步的适应性训练完全“遗忘”有毒的预训练数据？DAPT生成的大量有毒内容表明，语言模型可能会“记住”预训练数据中的有毒信息，或者有毒样本可能对模型更加明显，因此更难以忘记。
未来的研究可以探讨某些类型的毒性是否比其他类型更难以忘记，以及用于选择训练数据的模型的偏见是否会在适应性训练后引入不良的副作用，影响语言模型的行为。这些研究结果提醒我们注意语言模型中可能存在的有毒信息，需要采取措施来减少或消除这些信息的影响。同时，这也提示我们在训练语言模型和选择训练数据时需要更加谨慎，以避免引入不必要的偏见和有毒信息。
Decoding with a Purpose PPLM是其中最有效的方式。未来的工作可以探索使用手工挑选的毒性文件作为“负面例子”，以避免毒性生成。未来的工作还可以研究注入更复杂或微妙的社会偏见表征模型。
Choice of Pretraining Data 随着预训练模型的增长，对于数据库的要求也在逐步增长，其中也引发了许多伦理问题。强调了研究人员需要分析预训练数据以了解数据中可能存在的偏见和有害性，并建议研究人员在数据收集期间公开发布所有相关信息以增加透明度。本文还讨论了使用Reddit热度作为筛选启发式方法可能引起的潜在伤害，这可能会影响语言模型的预训练数据和行为，并建议重新审视NLP系统与其最终用户之间的关系，使用人类中心设计方法。最后，本文建议研究人员在设计阶段与技术的最终用户进行接触，以避免伤害，并改善公开发布大型语言模型的政策。
Improving Toxicity Detection
随着REALTOXICITYPROMPTS的发布，我们希望能够鼓励对语言模型的解毒技术进行大规模、系统的评估。
Limitations首先，该研究使用了一种不完美的毒性测量方法，可能会导致偏向词汇线索，未能检测到更微妙的偏见，并错误地标记非毒性内容。其次，该分析仅局限于五种语言模型及其变体，进一步的研究可以探索其他模型，包括遮蔽语言模型。最后，由于OPENAI-WT数据集缺乏可用的元数据，并且对子论坛和新闻可靠性数据的覆盖不完全，该研究只提供了网络文本语料库毒性的下限估计。

8 Related Work

总结

这篇论文研究了大型预训练语言模型（如GPT-3）在生成有毒文本时的表现。以下是论文的主要内容：
问题与挑战：大型预训练语言模型在生成文本时可能会产生有毒、有害或不道德的内容。这是因为这些模型在训练过程中会学习到大量存在于训练数据中的有毒信息。这种现象不仅会导致模型生成不当内容，还可能加剧社会问题，如仇恨言论、歧视和偏见。
方法与实验：作者提出了一种新方法，名为REALTOXICPROMPTS，用于评估预训练语言模型在生成有毒文本时的表现。该方法包括两个步骤：首先，收集一组用于评估的提示，这些提示可能会导致模型生成有毒内容；其次，使用这些提示生成文本，并使用一个基准有毒检测系统对生成的文本进行评分。
结果与发现：作者发现，各种预训练语言模型在生成有毒文本时表现不一。一些模型在生成有毒内容方面的表现较差，而另一些模型则表现出较好的抵制能力。此外，作者还发现，模型的训练数据量和有毒文本生成能力之间存在一定的关系：数据量较大的模型往往更容易生成有毒文本。
讨论与未来方向：作者认为，为了降低预训练语言模型在生成有毒文本时的风险，研究人员和开发者需要采取一系列措施。这些措施包括：改进模型训练数据的质量、采用更好的有毒文本检测方法、提高模型的可解释性等。此外，作者还呼吁相关领域的研究人员加强对有毒文本生成问题的关注，进一步研究和改进预训练语言模型。
总之，这篇论文关注了预训练语言模型在生成有毒文本方面的问题，并提出了一种新方法来评估模型的表现。这项研究有助于我们了解如何改进模型，以减少有毒文本的生成，并为未来研究提供了一个有益的方向。

分类模型（BERT）训练全流程巴伦是只猫人工智能分类 bert 数据挖掘
使用BERT实现分类模型的完整训练流程BERT(BidirectionalEncoderRepresentationsfromTransformers)是一种强大的预训练语言模型，在各种NLP任务中表现出色。下面我将详细梳理使用BERT实现文本分类模型的完整训练过程。1.准备工作1.1环境配置pipinstalltransformerstorchtensorflowpandassklearn1.2
京东零售重磅开源 | OxyGent：像搭乐高一样组装AI团队，实现群体智能京东零售技术零售开源人工智能
京东零售Oxygen团队正式开源发布多智能体协作框架——OxyGent。这一创新框架致力于帮助开发者高效组装多智能体协作系统，实现智能体间的无缝协作、弹性扩展与全链路可追溯。推动人工智能从“单点突破”迈向“群体智能”时代。OxyGent已在开源社区正式上线。开源地址：https://github.com/jd-opensource/OxyGent官网地址：https://oxygent.jd.co
具身智能的视觉-语言导航综述
24年2月来自曲阜师范、华东师大和哈工大的论文“Vision-LanguageNavigationwithEmbodiedIntelligence:ASurvey”。作为人工智能领域的长期愿景，具身智能的核心目标是提升智体与环境的感知、理解和交互能力。视觉-语言导航（VLN）作为实现具身智能的重要研究路径，致力于探索智体如何利用自然语言与人进行有效沟通，接收并理解指令，并最终依靠视觉信息实现精准导
具身智能：从理论到实践的跨越
具身智能（EmbodiedAI）的概念起源与发展是一个跨越半个多世纪的学术探索历程，其核心思想在不同学科的交叉碰撞中逐渐成型。以下从理论源头、技术奠基、术语演进三个维度展开解析，揭示这一概念的学术脉络与产业价值：一、理论源头：从图灵的哲学构想到认知科学的具身化转向1.图灵的"感官机器"设想（1950年）在人工智能奠基性论文《计算机器与智能》中，图灵提出了两种智能发展路径：抽象计算路径：如国际象棋等
家庭服务具身智能机器人体系架构
硬件方面：差速移动机器人+六轴协作机械臂，软件方面选择ROS系统：底盘控制move_group，机械臂操纵MoveIt，大模型方面采用VLM+LLM：（1）视觉语言模型（VLM），用来实现环境理解与指令解析，候选模型为LLaVA和Qwen-VL。微调VLM需要2~4周，工作量主要是准备环境数据和标注期望输出。（2）大语言模型（LLM），用来实现任务分解与技能调用，候选工具有LangChain（任务
PD分离技术分析老兵发新帖人工智能
PD分离中的“PD”指的是大语言模型（LLM）推理过程中的两个核心阶段：Prefill（预填充）和Decode（解码）。这两个阶段在计算特性和资源需求上存在显著差异，分离部署可优化整体性能。以下是详细解析：一、PD的具体含义Prefill（预填充阶段）任务：处理用户输入的整个提示（Prompt），为所有Token生成初始的键值缓存（KVCache）和隐藏状态（HiddenStates）。特性：计算
生命3.0时代，面对人工智能时代的到来，我们可以做些什么笃定的沙丁鱼
生命的定义生命的定义有很多，最为人所熟知的是在生物学上的定义，即生命是蛋白质存在的一种形式。但是，这种定义可能不太适用于未来的智能机器和外星文明，我们不能将我们对未来生命的思考局限在过去遇到过的物种，所以需要将生命定义得更广阔一些：生命是一个能保持自身复杂性并能进行复制的过程。复制的对象并不是由原子组成的物质，而是能阐明原子是如何排列的信息，这种信息由比特组成。换句话说：我们可以将生命看作一种自我
快手开源 Kwaipilot-AutoThink 思考模型，有效解决过度思考问题
新闻在专为防止数据泄露设计的挑战性基准测试LiveCodeBenchPro中，Kwaipilot-AutoThink位列所有开源模型榜首，甚至超越了Seed和o3-mini等强大的专有系统。介绍KAT(Kwaipilot-AutoThink)是一个开源大语言模型，通过学习何时生成显式思维链及何时直接作答，有效缓解过度思考问题。它的发展遵循简洁的两阶段训练流程：阶段核心思想关键技术成果1.预训练阶段
一文弄懂开源大型语言模型 (LLM) 应用程序开发平台--Dify Llama-Turbo AI大模型程序员 LLM 人工智能大模型 dify
Dify简介Dify是一个开源大型语言模型(LLM)应用程序开发平台，旨在弥合AI应用程序原型设计与生产部署之间的差距。本文为希望了解或扩展该平台的开发者和技术用户提供了Dify架构、组件和功能的技术概述。平台概述Dify提供端到端解决方案，通过可视化工具和API的组合，构建基于LLM的应用程序。其架构旨在支持AI应用程序开发的整个生命周期，包括模型集成、提示、知识管理、工作流编排和部署。主要特点
不正规不靠谱：假摩根士丹利内部群推荐绿色低碳减排平台骗局揭露!送一万体验资金做慈善全是假的! 易星辰分享普法
关于曝光网上摩根士丹利何晓斌宝丰能源节能减排在炒股群推荐智慧农业中粮仓平台骗局的文章，其内容主要揭示了近期频发的一种投资诈骗手段。以下是该骗局的主要特点和步骤：为什么明明跟老师对过视频，确认是本人，怎么还会被骗了?你有没有想过一个名人大咖怎么会有时间给你们一对一视频，其次我来给大家揭露一下，这个套路AI换脸骗局是一种利用人工智能技术，通过替换视频中的人脸来伪造身份或进行诈骗的行为。你的账户“余额”
开源的大语言模型（LLM）应用开发平台Dify
概述Dify是一个开源的大语言模型（LLM）应用开发平台，结合了后端即服务（Backend-as-a-Service）和LLMOps的理念，旨在帮助开发者快速构建生产级的生成式AI应用。它通过直观的界面、强大的功能和灵活的部署方式，降低了AI应用开发的门槛，即使是非技术人员也能参与应用的定义和数据运营。本文档将指导您了解Dify的核心功能、安装部署、应用创建及常见使用场景。Dify简介Dify（D
假冒朱民！通达OA社科院朱民ST-balance项目就是假的，被骗亏损真相揭秘，亲身亏损经历正义青天
通达OA社科院朱民ST-balance项目不正规——杀猪盘不能提现投票骗局曝光！随着互联网的普及，数字经济蓬勃发展，各种线上平台如雨后春笋般涌现。然而，在这些看似繁荣的平台中，不乏一些黑平台，它们以欺诈手段骗取用户的财产，给人们的财产安全带来严重威胁！因此，我们有必要提高警惕，防范黑平台诈骗。针对网上素未谋面的牛散大咖，经济学家等推荐网上投资理财、数字经济，数字体育市场，人工智能项目，数字低碳，慈
基于深度学习的语音识别：从音频信号到文本转录 Blossom.118 机器学习与人工智能深度学习语音识别音视频人工智能机器学习线性代数计算机视觉
前言语音识别（AutomaticSpeechRecognition,ASR）是人工智能领域中一个极具挑战性和应用前景的研究方向。它通过将语音信号转换为文本，为人们提供了更加自然和便捷的人机交互方式。近年来，深度学习技术在语音识别领域取得了显著进展，极大地提高了语音识别的准确率和鲁棒性。本文将详细介绍如何使用深度学习技术构建一个语音识别系统，从音频信号的预处理到模型的训练与部署。一、语音识别的基本概
大模型记忆灾难优化：分层存储架构与7B参数实战调优 AI咸鱼保护协会架构人工智能 AI gpu算力 gpu
点击“AladdinEdu，同学们用得起的【H卡】算力平台”，H卡级别算力，按量计费，灵活弹性，顶级配置，学生专属优惠。大模型在处理长对话时遭遇的“健忘症”并非无解，智能分层存储架构正成为突破上下文限制的工程利刃。近年来，大型语言模型在文本生成、复杂推理等任务上展现出惊人能力，但其固定长度上下文窗口导致的“记忆灾难”日益凸显。当对话轮次或文档长度超出限制，关键信息被无情挤出，模型表现急剧下降——在
什么是GPT-4T？亿只小灿灿人工智能 GPT-4T
1.引言：GPT-4T概述GPT-4T是OpenAI开发的新一代多模态大型语言模型，在GPT-4的基础上增强了对表格数据、数学表达式和代码的处理能力。其核心创新在于Transformer架构的优化，使模型能够更高效地处理结构化数据与文本的融合任务。本文将深入探讨GPT-4T的技术原理、应用场景及代码实现。2.GPT-4T核心技术解析2.1多模态输入处理GPT-4T支持三种主要输入模态：自然语言文本
医疗AI应用中的幻觉缓解：案例与经验 AI天才研究院计算 AI人工智能与大数据 Agentic AI 实战人工智能 ai
医疗AI的“说谎”问题：如何让AI不再“信口开河”？——幻觉缓解的案例与经验关键词：医疗AI、幻觉现象、大语言模型、知识Grounding、多模态验证、临床安全、可解释性摘要：医疗AI（如大语言模型、辅助诊断系统）在提升医疗效率的同时，“幻觉”（生成不符合事实的医疗建议）成为其临床应用的致命隐患——比如告诉糖尿病患者“吃蜂蜜能降血糖”、编造不存在的药物副作用。本文用“小朋友乱说话”的类比拆解幻觉的
普通人想利用AI变现，这5个赛道不能错过！浮沉导师
随着人工智能技术的迅猛发展，越来越多的普通人开始关注如何利用AI实现变现。AI不仅改变了我们的工作方式，也创造了众多赚钱的机会。本文将介绍五个值得关注的AI赛道，帮助你抓住这些机会，实现收入增长。【高省】APP网购优惠券免费领，分享还能赚钱。【高省】是一个自用省钱佣金高，分享推广赚钱多的平台。佣金更高，模式更好，终端用户不流失。0投资，稳定可靠，百度有几百万篇报道，期待你的加入。应用市场下载【高省
AI人工智能 Agent：金融投资中智能体的应用 AI天才研究院 AI大模型企业级应用开发实战 AI大模型应用入门实战与进阶 AI人工智能与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
AI人工智能Agent：金融投资中智能体的应用1.背景介绍在金融投资领域，人工智能（AI）技术的应用已经成为一种趋势。随着数据量的爆炸性增长和计算能力的提升，AI技术在金融市场中的应用变得越来越广泛和深入。智能体（Agent）作为AI技术的重要组成部分，能够在金融投资中发挥重要作用。智能体可以通过学习和适应市场环境，自动执行交易策略，优化投资组合，甚至预测市场趋势。2.核心概念与联系2.1智能体（
对话谷歌前 CEO Eric Schmidt：数字超智能将在十年内到来，AI 将创造更多更高薪的工作 AI科技大本营人工智能
责编|王启隆出品|CSDN（ID：CSDNnews）投稿或寻求报道|[email protected]科技巨擘、谷歌前CEOEricSchmidt最近做客PeterDiamandis的Moonshots播客，与主持人PeterDiamandis及DaveLondon展开了一场关于人工智能未来的深度对话。全世界都在为AI的飞速发展感到兴奋又焦虑时，这位曾经执掌谷歌帝国长达十年、亲眼见证并推动了这场技术
格灵深瞳视觉算法面试30问全景精解机＿长算法面试职场和发展
格灵深瞳视觉算法面试30问全景精解——AI感知×智能安防×场景创新：格灵深瞳视觉算法面试核心考点全览前言格灵深瞳（GREATVISION）作为国内领先的人工智能与计算机视觉企业，专注于智慧安防、智能交通、智慧零售等领域，推动视觉算法在大规模城市级场景的落地。格灵深瞳视觉算法岗位面试不仅考察候选人对视觉基础理论的扎实掌握，更关注其在复杂场景下的创新能力与工程实践。本文精选30个高质量面试问题，涵盖基
商汤科技视觉算法面试30问全景精解
商汤科技视觉算法面试30问全景精解——AI赋能×智能视觉×产业创新：商汤科技视觉算法面试核心考点全览前言商汤科技（SenseTime）作为全球领先的人工智能平台公司，专注于计算机视觉、深度学习和智慧城市、智能汽车、智能医疗等领域，推动人脸识别、目标检测、视频分析、自动驾驶等前沿技术的产业化落地。商汤视觉算法岗位面试不仅考察候选人对视觉基础理论的扎实掌握，更关注其在大规模安防、自动驾驶、智慧医疗等复
旷视科技视觉算法面试30问全景精解机＿长科技算法面试深度学习 YOLO
旷视科技视觉算法面试30问全景精解——AI赋能×智能安防×视觉创新：旷视科技视觉算法面试核心考点全览前言旷视科技（Megvii）作为全球领先的人工智能公司，专注于计算机视觉、深度学习和智能安防等领域，推动人脸识别、目标检测、视频分析、工业视觉等前沿技术的产业化落地。旷视视觉算法岗位面试不仅考察候选人对视觉基础理论的扎实掌握，更关注其在大规模安防、工业检测、智慧城市等复杂场景下的创新与工程能力。本文
今日播报！庆衍书院郭庆旺被骗黑幕曝光，KSD2.0光伏市场不能出金不要再次踏入！法律咨询维权
社交平台有这样一种群，群里都是“理财专家”“炒股大神”“操盘高手”，不仅每天免费授课、推荐牛股，还有助理“一对一”指导具体操作。针对网上素未谋面的牛散大咖，经济学家等推荐网上投资理财、数字经济，数字体育市场，人工智能项目，数字低碳，慈善投票网站买数字的等等都是骗局，广大市民对此要提高警惕，遇到此类情况一概不要相信。咨询顾问：182--71402640（电微同号）数字经济数字体育数字农业慈善投票大赛
大模型软件的多租户架构设计 AI天才研究院 AI人工智能与大数据 ChatGPT java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
大模型软件的多租户架构设计关键词：大模型软件、多租户架构、设计、性能优化、安全性摘要：随着大数据和人工智能技术的迅猛发展，大模型软件在各个领域得到了广泛应用。然而，如何在大模型软件中实现高效的多租户架构设计，成为当前技术领域的一个关键挑战。本文将深入探讨大模型软件的多租户架构设计，包括其背景、核心概念、算法原理、系统架构、项目实战以及最佳实践等，旨在为开发者提供一套系统化、全面化的设计指南。设计过
智能衣橱革命：大语言模型如何成为你的24小时私人造型师？
从清晨通勤的干练西装到约会餐厅的惊艳晚装，从孕期舒适穿搭到面试首印象的决胜战袍，大语言模型正悄然成为我们私人形象顾问。它融合历史时尚数据库、百万用户风格偏好与实时场景分析，在你输入“重要会议穿什么”的瞬间，便为你构建出专属着装方案——古典智慧与未来科技在指尖碰撞。导言：衣装，无声的宣言与永恒的困惑“衣裳常常显示人品”——莎士比亚在《哈姆雷特》中的箴言，穿越时空，道破了着装亘古不变的力量。衣装，这层
AI人才实在太抢手！顶级科学家年薪超7000万：中高级也能过千万程序员超超人工智能 transformer 深度学习 java spring boot ai 大模型
快科技7月2日消息，据媒体报道，激烈的人工智能人才争夺战，导致一些顶尖资深研究科学家的年薪超过1000万美元（约7167万元人民币）。而典型的薪资方案则处于300万至700万美元区间，相较于2022年，这一数字实现了约50%的增长。薪酬追踪网站Levels的统计数据显示，Meta给予AI工程师的薪酬范围为18.6万至320万美元，OpenAI则在21.2万至250万美元之间；若以薪酬中位数来衡量，
边缘计算与量子模型优化驱动医疗诊断新突破
内容概要在医疗人工智能领域，边缘计算与量子模型优化的协同演进正重构诊断系统的技术范式。通过将计算节点前置至医疗设备端，边缘架构有效解决了传统云端模型面临的实时性瓶颈，配合量子优化算法对复杂特征空间的快速寻优能力，使得CT、MRI等高维影像数据的解析效率提升显著。值得关注的是，框架选型直接影响着模型部署的可行性——TensorFlow在移动端推理优化方面的工具链完备性，与PyTorch动态图机制对迭
量子生成对抗网络：量子计算与生成模型的融合革命牧之112 量子计算生成对抗网络人工智能
引言：当生成对抗网络遇上量子计算在人工智能与量子计算双重浪潮的交汇处，量子生成对抗网络（QuantumGenerativeAdversarialNetworks,QGAN）正成为突破经典算力瓶颈的关键技术。传统生成对抗网络（GAN）在图像生成、数据增强等领域已取得辉煌成就，但其参数规模与计算复杂度随着数据维度呈指数级增长。量子计算的叠加性、纠缠性和并行性，为解决这一矛盾提供了全新思路。2025年，
OpenAI模型可解释性工具：理解AI的黑箱 AIGC应用创新大全 AI大模型与大数据技术 AI人工智能与大数据应用开发 MCP&Agent 云算力网络人工智能百度 ai
OpenAI模型可解释性工具：理解AI的黑箱关键词：OpenAI模型、可解释性工具、AI黑箱、模型理解、人工智能摘要：本文旨在深入探讨OpenAI模型可解释性工具，帮助大家理解AI这个“黑箱”。首先介绍了研究的背景、目的和预期读者，接着解释了核心概念，包括OpenAI模型、可解释性工具等，阐述了它们之间的关系。通过核心算法原理、数学模型和公式的讲解，让大家明白其内在机制。还给出了项目实战案例，包括
骗局套路：卧虎藏隆应天书府隆国强被骗无法提现！讲述背后事实！正义青天
为什么明明跟老师对过视频，确认是本人，怎么还会被骗了?你有没有想过一个名人大咖怎么会有时间给你们一对一视频，其次我来给大家揭露一下，这个套路AI换脸骗局是一种利用人工智能技术，通过替换视频中的人脸来伪造身份或进行诈骗的行为。你的账户“余额”是真的吗？为什么不能提现呢？其实都是骗子给你的一串数字而已！近期作者接触到了很多投资者被所谓的“隆国强”（骗子假冒）在卧虎藏隆应天书府带单的案例。这些新平台打着
LeetCode[位运算] - #137 Single Number II Cwind java Algorithm LeetCode 题解位运算
原题链接：#137 Single Number II 要求：给定一个整型数组，其中除了一个元素之外，每个元素都出现三次。找出这个元素注意：算法的时间复杂度应为O(n)，最好不使用额外的内存空间难度：中等分析：与#136类似，都是考察位运算。不过出现两次的可以使用异或运算的特性 n XOR n = 0, n XOR 0 = n，即某一
《JavaScript语言精粹》笔记 aijuans JavaScript
0、JavaScript的简单数据类型包括数字、字符创、布尔值（true/false）、null和undefined值，其它值都是对象。 1、JavaScript只有一个数字类型，它在内部被表示为64位的浮点数。没有分离出整数，所以1和1.0的值相同。 2、NaN是一个数值，表示一个不能产生正常结果的运算结果。NaN不等于任何值，包括它本身。可以用函数isNaN(number)检测NaN,但是
你应该更新的Java知识之常用程序库 Kai_Ge java
在很多人眼中，Java 已经是一门垂垂老矣的语言，但并不妨碍 Java 世界依然在前进。如果你曾离开 Java，云游于其它世界，或是每日只在遗留代码中挣扎，或许是时候抬起头，看看老 Java 中的新东西。 Guava Guava[gwɑ:və]，一句话，只要你做Java项目，就应该用Guava（Github）。 guava 是 Google 出品的一套 Java 核心库，在我看来，它甚至应该
HttpClient 120153216 httpclient
/** * 可以传对象的请求转发，对象已流形式放入HTTP中 */ public static Object doPost(Map<String,Object> parmMap,String url) { Object object = null; HttpClient hc = new HttpClient(); String fullURL
Django model字段类型清单 2002wmj django
Django 通过 models 实现数据库的创建、修改、删除等操作，本文为模型中一般常用的类型的清单，便于查询和使用： AutoField：一个自动递增的整型字段，添加记录时它会自动增长。你通常不需要直接使用这个字段；如果你不指定主键的话，系统会自动添加一个主键字段到你的model。(参阅自动主键字段) BooleanField：布尔字段,管理工具里会自动将其描述为checkbox。 Cha
在SQLSERVER中查找消耗CPU最多的SQL 357029540 SQL Server
返回消耗CPU数目最多的10条语句 SELECT TOP 10 total_worker_time/execution_count AS avg_cpu_cost, plan_handle, execution_count, (SELECT SUBSTRING(text, statement_start_of
Myeclipse项目无法部署，Undefined exploded archive location 7454103 eclipse MyEclipse
做个备忘！错误信息为： Undefined exploded archive location 原因：在工程转移过程中，导致工程的配置文件出错；解决方法：
GMT时间格式转换 adminjun GMT 时间转换
普通的时间转换问题我这里就不再罗嗦了，我想大家应该都会那种低级的转换问题吧，现在我向大家总结一下如何转换GMT时间格式，这种格式的转换方法网上还不是很多，所以有必要总结一下，也算给有需要的朋友一个小小的帮助啦。 1、可以使用 SimpleDateFormat SimpleDateFormat EEE-三位星期 d-天 MMM-月 yyyy-四位年
Oracle数据库新装连接串问题 aijuans oracle数据库
割接新装了数据库，客户端登陆无问题，apache/cgi-bin程序有问题，sqlnet.log日志如下： Fatal NI connect error 12170. VERSION INFORMATION: TNS for Linux: Version 10.2.0.4.0 - Product
回顾java数组复制 ayaoxinchao java 数组
在写这篇文章之前，也看了一些别人写的，基本上都是大同小异。文章是对java数组复制基础知识的回顾，算是作为学习笔记，供以后自己翻阅。首先，简单想一下这个问题：为什么要复制数组？我的个人理解：在我们在利用一个数组时，在每一次使用，我们都希望它的值是初始值。这时我们就要对数组进行复制，以达到原始数组值的安全性。java数组复制大致分为3种方式：①for循环方式 ②clone方式 ③arrayCopy方
java web会话监听并使用spring注入 bewithme Java Web
在java web应用中，当你想在建立会话或移除会话时，让系统做某些事情，比如说，统计在线用户，每当有用户登录时，或退出时，那么可以用下面这个监听器来监听。 import java.util.ArrayList; import java.ut
NoSQL数据库之Redis数据库管理(Redis的常用命令及高级应用) bijian1013 redis 数据库 NoSQL
一 .Redis常用命令 Redis提供了丰富的命令对数据库和各种数据库类型进行操作，这些命令可以在Linux终端使用。 a.键值相关命令 b.服务器相关命令 1.键值相关命令 &
java枚举序列化问题 bingyingao java 枚举序列化
对象在网络中传输离不开序列化和反序列化。而如果序列化的对象中有枚举值就要特别注意一些发布兼容问题: 1.加一个枚举值新机器代码读分布式缓存中老对象，没有问题，不会抛异常。老机器代码读分布式缓存中新对像，反序列化会中断，所以在所有机器发布完成之前要避免出现新对象，或者提前让老机器拥有新增枚举的jar。 2.删一个枚举值新机器代码读分布式缓存中老对象，反序列
【Spark七十八】Spark Kyro序列化 bit1129 spark
当使用SparkContext的saveAsObjectFile方法将对象序列化到文件，以及通过objectFile方法将对象从文件反序列出来的时候，Spark默认使用Java的序列化以及反序列化机制，通常情况下，这种序列化机制是很低效的，Spark支持使用Kyro作为对象的序列化和反序列化机制，序列化的速度比java更快，但是使用Kyro时要注意，Kyro目前还是有些bug。 Spark
Hybridizing OO and Functional Design bookjovi erlang haskell
推荐博文： Tell Above, and Ask Below - Hybridizing OO and Functional Design 文章中把OO和FP讲的深入透彻，里面把smalltalk和haskell作为典型的两种编程范式代表语言，此点本人极为同意，smalltalk可以说是最能体现OO设计的面向对象语言，smalltalk的作者Alan kay也是OO的最早先驱，
Java-Collections Framework学习与总结-HashMap BrokenDreams Collections
开发中常常会用到这样一种数据结构，根据一个关键字，找到所需的信息。这个过程有点像查字典，拿到一个key，去字典表中查找对应的value。Java1.0版本提供了这样的类java.util.Dictionary(抽象类)，基本上支持字典表的操作。后来引入了Map接口，更好的描述的这种数据结构。 &nb
读《研磨设计模式》-代码笔记-职责链模式-Chain Of Responsibility bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 业务逻辑：项目经理只能处理500以下的费用申请，部门经理是1000，总经理不设限。简单起见，只同意“Tom”的申请 * bylijinnan */ abstract class Handler { /*
Android中启动外部程序 cherishLC android
1、启动外部程序引用自： http://blog.csdn.net/linxcool/article/details/7692374 //方法一 Intent intent=new Intent(); //包名包名+类名（全路径） intent.setClassName("com.linxcool", "com.linxcool.PlaneActi
summary_keep_rate coollyj SUM
BEGIN /*DECLARE minDate varchar(20) ; DECLARE maxDate varchar(20) ;*/ DECLARE stkDate varchar(20) ; DECLARE done int default -1; /* 游标中注册服务器地址 */ DE
hadoop hdfs 添加数据目录出错 daizj hadoop hdfs 扩容
由于原来配置的hadoop data目录快要用满了，故准备修改配置文件增加数据目录，以便扩容，但由于疏忽，把core-site.xml, hdfs-site.xml配置文件dfs.datanode.data.dir 配置项增加了配置目录，但未创建实际目录，重启datanode服务时，报如下错误： 2014-11-18 08:51:39,128 WARN org.apache.hadoop.h
grep 目录级联查找 dongwei_6688 grep
在Mac或者Linux下使用grep进行文件内容查找时，如果给定的目标搜索路径是当前目录，那么它默认只搜索当前目录下的文件，而不会搜索其下面子目录中的文件内容，如果想级联搜索下级目录，需要使用一个“-r”参数： grep -n -r "GET" . 上面的命令将会找出当前目录“.”及当前目录中所有下级目录
yii 修改模块使用的布局文件 dcj3sjt126com yii layouts
方法一：yii模块默认使用系统当前的主题布局文件，如果在主配置文件中配置了主题比如: 'theme'=>'mythm', 那么yii的模块就使用 protected/themes/mythm/views/layouts 下的布局文件；如果未配置主题，那么 yii的模块就使用 protected/views/layouts 下的布局文件，总之默认不是使用自身目录 pr
设计模式之单例模式 come_for_dream 设计模式单例模式懒汉式饿汉式双重检验锁失败无序写入
今天该来的面试还没来，这个店估计不会来电话了，安静下来写写博客也不错，没事翻了翻小易哥的博客甚至与大牛们之间的差距，基础知识不扎实建起来的楼再高也只能是危楼罢了，陈下心回归基础把以前学过的东西总结一下。 *********************************
8、数组豆豆咖啡二维数组数组一维数组
一、概念数组是同一种类型数据的集合。其实数组就是一个容器。二、好处可以自动给数组中的元素从0开始编号，方便操作这些元素三、格式 //一维数组 1,元素类型[] 变量名 = new 元素类型[元素的个数] int[] arr =
Decode Ways hcx2013 decode
A message containing letters from A-Z is being encoded to numbers using the following mapping: 'A' -> 1 'B' -> 2 ... 'Z' -> 26 Given an encoded message containing digits, det
Spring4.1新特性——异步调度和事件机制的异常处理 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
squid3(高命中率)缓存服务器配置 liyonghui160com
系统:centos 5.x 需要的软件:squid-3.0.STABLE25.tar.gz 1.下载squid wget http://www.squid-cache.org/Versions/v3/3.0/squid-3.0.STABLE25.tar.gz tar zxf squid-3.0.STABLE25.tar.gz &&
避免Java应用中NullPointerException的技巧和最佳实践 pda158 java
1) 从已知的String对象中调用equals()和equalsIgnoreCase()方法，而非未知对象。　　总是从已知的非空String对象中调用equals()方法。因为equals()方法是对称的，调用a.equals(b)和调用b.equals(a)是完全相同的，这也是为什么程序员对于对象a和b这么不上心。如果调用者是空指针，这种调用可能导致一个空指针异常 Object unk
如何在Swift语言中创建http请求 shoothao http swift
概述：本文通过实例从同步和异步两种方式上回答了”如何在Swift语言中创建http请求“的问题。如果你对Objective-C比较了解的话，对于如何创建http请求你一定驾轻就熟了，而新语言Swift与其相比只有语法上的区别。但是，对才接触到这个崭新平台的初学者来说，他们仍然想知道“如何在Swift语言中创建http请求？”。在这里,我将作出一些建议来回答上述问题。常见的
Spring事务的传播方式 uule spring事务
传播方式：新建事务 required required_new - 挂起当前非事务方式运行 supports &nbs