Vincy_King

【Speaker Recognition】A CHAPTER-WISE UNDERSTANDING SYSTEM FOR TEXT-TO-SPEECH IN CHINESE NOVELS

A CHAPTER-WISE UNDERSTANDING SYSTEM FOR TEXT-TO-SPEECH IN CHINESE NOVELS

Abstract

在基于文本转语音TTS的有声读物制作中，多角色配音和情感表达可以显著提高有声读物的自然性。然而，它需要在句子水平上手动标注带有明确的说话者和情感标签的原创小说，这是非常耗时和昂贵的。在本文中，我们提出了一种中国小说的章节理解系统，基于章节级语境自动预测说话者和情感标签。与每个组件的基线相比，我们的模型获得了更高的性能。由我们提出的系统制作的有声读物和多扬声器情感TTS系统，被证明具有与个人制作人制作的有声读物相当的质量分数。演示模块在https://jeffpan.net/icassp/2021/main.html中进行了演示。

1. INTRODUCTION

由于文本到语音(TTS)相对较低的成本和较高的制作效率，人们试图将小说转换为有声读物。最简单的方法是使用单扬声器TTS系统在句子级合成小说，并将合成的音频组合在一起。该解决方案已广泛应用于新闻和导航广播场景。

然而，小说是相对长尾文本，随意的写作形式，频繁的人物互动和多元对话。由于这些特性，传统的TTS解决方案可能会让观众听力疲劳，对内容理解感到困惑。通过对人类制作的有声读物的分析，我们发现了影响高质量有声读物的两个关键因素——基于故事情节的情感表达和不同对话的各种配音。在此基础上，我们构建了一个创新的小说合成生产管道，它包括两个阶段。首先，首先将非结构化的小说文本手动转换为脚本，每个对话都贴有说话者和情感标签。其次，将标记脚本输入具有多说话者模型的情绪TTS系统，将属于不同说话者的对话以不同的声音合成。根据我们的经验，手工标签工作相当耗时和昂贵，这使得大规模制作有声读物不切实际。

为了解决这一问题，我们提出了一种针对中国小说的章节理解系统来自动预测说话者和情感标签。据我们所知，这是对语音合成的新理解的第一个工作。我们的实验表明，系统中的每个组件都比独立的基线获得了更好的性能。该系统采用多说话人情感TTS系统实现，可以显著提高小说合成的制作效率，并制作出质量与人类个人制作人相当的有声读物。

2. BACKGROUND

该系统实现了汉语小说中的两个文本理解任务——说话人的确定和情感的分类。

在确定说话者时，由于角色列表并不总是可用的，因此需要首先确定所有个人角色的范围。需要挖出对话和这些上诉之间的因果关系，即使这些联系没有明确说明。在每一段对话被分配到最可能的名称后，应采用共同引用决议将指同一人的名称合并在一起，确保同一个人的对话可以用同一声音合成。
在情绪分类中，基于目标对话预测情绪通常是不可靠和令人困惑的，因为情绪并不总是隐含在对话本身中，而是由长期语境暗示。

在本节中，我们简要回顾了我们提出的系统中的一些主要组成部分，包括人姓名识别(PerNER)、对话中的说话人识别(SID)、共同参考分辨率(CoRef)和基于随机上下文的情绪分类。

2.1 PerNER

从常识上说，命名实体识别(NER)是提取命名实体的过程，如人员名称、组织、位置、医疗代码、时间表达式、数量、货币值和百分比。在中国的NER中已经进行了顺序标记工作。然而，小说中的命名实体因常见情况的不同而差异很大，特别是在人物名称、地点和组织中，而且中国小说中没有开源的NER语料库。考虑到我们的目标是提取人的名字，我们定义了NER-PerNER的一个子任务，它只寻求定位人的姓名和头衔。PerNER大大简化了标签的工作，但它带来了另一个问题，即标签变得更加稀疏，这可能会降低PerNER的性能。为了解决这个问题，我们提出了一个数据增强策略。

2.2 SID

说话者对话识别(SID)的目的是识别从文本中引用的说话者。在新闻或戏剧中，这似乎很简单，因为在这些场景中，说话者总是通过说话模式来明确地陈述，比如说、回答或声明。然而，小说中的内隐说话者和说话者交替模式使SID任务极其困难。基于规则的模型和基于神经网络的模型已由[9]实现。多标签分类不适合用于这个任务，因为类别（说话者）的数量不是固定的。在我们的工作中，SID被认为是所有可能的演讲者中的一个排名任务。

2.3 CoRef

在我们提出的系统中，CoRef共同参考分辨率(Coref)被定义为将人的名称分组到共同引用链中，其中每个链引用一个唯一的说话者。与SID类似，多标签分类也不适合CoRef。为了简化这个任务，我们将人员分为两类——主要名称和候选名称，并将CoRef转换为两阶段排名任务。当在基于TTS的有声读物制作管道中实现时，在同一共参考链中的说话者以相同的声音合成，从而确保了听力的一致性。

2.4 Emotion Classification

为情绪TTS系统提供了情感标签，使合成音频更具表现性。传统的情感分类是指从一段非正式的文本[10,11]中区分积极类和消极类。对于有声读物来说，二元情感分类似乎过于简单，因为情感在对话中更为复杂。根据《普鲁奇克的《情绪之轮[12]》，人们的情绪可以分为八类，每种情绪可以进一步分为不同程度的三种情绪，结合单一情绪可以识别出更多的复合情绪。一些研究已经在社交媒体中从如此细粒度的文本中检测情绪，在英语和中文[15]中检测常识故事。章节理解系统的结构。在我们的研究中，我们选择了7种情绪作为标签（中性、快乐、愤怒、厌恶、悲伤、惊讶、恐惧），并考虑了长期的语境特征。

3. MODEL ARCHITECTURE

在本节中，我们提出了一个章节式的理解系统，将非结构化的小说文本转换为带有说话者和情感标签的脚本。整个结构如图1所示。由于训练数据量少和标记工作的难度大，我们选择了统计机器学习模型和相对简单的神经网络(NN)模型，而不是像BERT[16]这样复杂的预训练模型。

3.1 Speaker Determination

说话者决定告诉TTS系统将选择哪个声音来合成当前的句子。所有的叙述都被标记为相同的声音，每个对话都被分配给相应的说话者。指同一个人的说话者被合并成一个单一的说话者标签，因此相应的对话以相同的声音合成。说话者的决定由三个组成部分组成——PerNER、SID和CoRef，如图1所示。

3.1.1. PerNER

PerNER模型是基于变压器的，包括一个256个单元的前置器，一个有8个单元和256个单元的多头自注意层，和一个CRF输出层。PerNER的输入是一个句子的字符嵌入[17]，输出是一个BMEIO1标签的序列。采用了如第4.1.1节所述的数据增强策略。

3.1.2. SID

在SID任务中实现了一个基于GBDT的排序模型。SID的输入是来自5个句子窗口的潜在名称，其中中间的一个是目标对话句子，并为每个名称计算11维特征(如表1所示。在dist_rank特征中，候选人根据到目标对话框从最小到最大的距离进行排序

3.1.3. CoRef

如第2.3节所述，我们定义了两种名称——主要名称和候选名称。以中文姓氏开头，在一章中至少出现三次或最常见的两种称呼被定义为主姓名。其他名称被定义为候选名称。首先，所有的候选名称都被分配给最可能的主名称。然后将主名称分配给另一个最可能的主名称或其本身。在此之后，在每个共引用链中生成一个主名作为根节点的共引用链。

CoRef中使用了基于GBDT的模型，输入特征见表2。C表示当前候选名称，T表示与的最近的目标主名称 C. 距离被定义为C和 D. 性别特征由ngender预测，这是一个开源的中文名称性别预测工具。同样的关系特征也可以用公式1计算出来。

$same\_relation=length[set(C_{a20}\&set(T_{a20}))]$

其中 $C_{s20}$ 和 $T_{s20}$ 是与C和D最接近的20个名称的列表。

3.2 Emotion Classification

情绪分类模型由一个包含256个单元的1层BLSTM组成，然后是一个7维的密集层。原输入句子及其前后句子被分割成单词。在每个句子中，最多选择25个情感单词（由第3.2.1节中描述的情感字典定义）并转换为300维的单词嵌入。对于每个单词，其句子索引和位置嵌入连接到嵌入向量。然后最后的输入是所有单词嵌入的连接。

3.2.1. Emotional Word Dictionary

训练语料库首先分为7个部分，每个部分 $N_e$ 包含所有标记为相同情感的句子。对于每个单词，其在 $N_e$ 中的TF-IDF得分由公式2计算。

$f(w,S,N_e)=\frac{count(w)}{count(all_words)}·\log\frac{S}{|s∈N_e:w∈s|}$

其中 $w$ 表示当前单词， $S$ 表示 $N_e$ 中的句子数， $s∈N_e: w∈s|$ 表示单词 $w$ 出现的句子数。 $f(w,S,N_e)$ 越高，情感 $e$ 中的词 $w$ 就越重要。对每个情绪重复这个过程，可以获得一个TF-IDF $F_w$ 的列表。然后根据 $F_w$ 的方差对所有单词进行排序，其中方差越高，意味着情感区分的重要性越高。在我们的工作中，我们选择了前8000个情感词来构建字典。

4. EXPERIMENTS AND RESULTS

4.1. Dataset

由于没有开源数据，我们从章节层面的中国小说中抽取文本，并进行标记，构建训练语料库。数据集的详细信息列于表3。

4.1.1. Data Augmentation in PerNER dataset

对于PerNER数据集，采用了四种基于替换的数据增强策略：

标记的说话者名字被从名称字典中随机选择的名字替换；
标签说话者的姓氏被其他中文姓氏取代；
标签说话者的标题被从标题字典中选择的其他标题取代；
未标记的部分被分割成单词，同义词和反义词字典中的同义词被同义词或反义词取代。数据的增强帮助我们的PerNER模型更多地关注句子结构，而不是被标记的词本身。

4.2. Results and Analysis

4.2.1. Evaluation of PerNER

在这部分中，我们将基于转换器的模型与HanLP[18]、Stanza（使用中文模型）[19]和基于BLSTM的NER模型进行了比较。由于HanLP和Stanza无法训练，它们的召回率极低，导致f1分数较低。表4表明，我们通过增强数据训练的基于变压器的模型获得了与基于BLSTM的模型相当的结果，而我们的模型显示了明显更快的推理速度。我们还可以发现，第4.1.1节中提到的数据增强策略在f1-分数中使我们的模型提高了约0.03。

4.2.2. Evaluation of SID

我们在[9]中使用了基于bert增强的基于分类器的模型，并与我们提出的模型进行了比较。结果表明，我们的模型的准确率提高了10.63%(0.8703vs0.7640)。数据量的限制可能是限制BERT性能的主要因素。

4.2.3. Evaluation of CoRef

如表5所示，我们将我们的模型与Stanza（中文）和随机选择策略进行了比较。因为Stanza只能使用其预测的NER作为共参考分辨率的输入，所以我们也用PerNER预测的输入作为比较来评估我们的模型。可以发现，Stanza的表现最差，这可能是由于其在PerNER任务中的召回率极低所致。我们提出的预测输入和地面真实输入模型的f1分数分别比随机选择高22.13%和40.12%。

4.2.4. Evaluation of Emotion Classification

在小说综合中，我们只在对话中使用情绪控制，所有的叙述都被设置为中性情绪。基于此，我们只在对话中评估了我们的情感分类方法。此外，非中性情绪比中性情绪对听力的影响更大，因此非中性标签的指标也被考虑在内。相比之下，我们选择了一个朴素贝叶斯分类器作为基线。可以发现，与基线相比，我们的模型在总体对话准确性上仅高0.1，但在非中性结果中高0.3。

4.2.5. Cascade with Emotional Multi-Speaker TTS

我们最初建立这样一个章节理解系统的目的是构建一个基于TTS的高质量和高效的有声读物制作管道。为了评估其端到端性能，我们将由我们提出的基于TTS的制作管道与人工制作的有声读物进行了比较。S级有声读物是由专业的制作团队制作的，有各种背景音乐，合适的音效，和高质量的各种声音的录音。A级有声读物由业余制作团队制作，由专业配音演员制作，但很少进行后期处理。B级有声读物是由个别制作人制作的，没有经过后处理。

表7中的有声读物评价测试3的质量分数表明，我们提出的系统达到了与b级有声读物相当的质量。演示文稿可以在摘要中找到。

5. CONCLUSION

本文介绍了一种中国小说的章节理解系统，这是在有声读物制作领域的一种创新方法。对于该系统中的每个组件，实验结果表明，我们的模型比独立的基线具有更好的性能。用多说话者情感TTS系统实现我们提出的系统，可以产生与b级人工TTS系统质量分数相当的有声读物。

未来的潜在工作包括调整我们用其他语言提出的系统，并将情绪分类扩展到复合情绪。此外，还可以研究多任务的端到端结构，以避免在管道结构中的错误传播。

AI原生应用必知：5大高效多轮对话框架对比 AI原生应用开发 AI-native easyui 前端 ai
AI原生应用必知：5大高效多轮对话框架对比关键词：AI原生应用、多轮对话、对话框架、自然语言处理、上下文管理、意图识别、对话状态跟踪摘要：本文深入探讨了构建AI原生应用时必备的5大多轮对话框架，包括Rasa、Dialogflow、MicrosoftBotFramework、AmazonLex和IBMWatsonAssistant。通过对比分析它们的架构设计、核心功能和应用场景，帮助开发者选择最适合
在线摄像头 JeffWoodNo.1 google 网络 internet tools 互联网加密
在线摄像头2009-07-2209:4910人阅读评论(0)收藏举报在Google中输入“inurl:"ViewerFrame?Mode="”或者“inurl:"MultiCameraFrame?Mode="”、“inurl:"view/index.shtml"”(输入时不带外面的双引号，在英文状态下输入)，你会获得无数个未经加密的网络摄像机监视到的画面。http://www.onlinecame
【LangChain编程：从入门到实践】LangChain与其他框架的比较 AI天才研究院 Agentic AI 实战计算 AI人工智能与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【LangChain编程：从入门到实践】LangChain与其他框架的比较1.背景介绍1.1人工智能发展现状在当今时代，人工智能(AI)已经成为科技领域中最热门和最具革命性的话题之一。随着计算能力的不断提升和算法的持续优化,AI系统正在不断扩展其应用范围,包括自然语言处理、计算机视觉、决策系统等各个领域。1.2LangChain概述在这种背景下,LangChain作为一个新兴的AI框架应运而生。L
踏入真实：具身智能与物理世界的认知交响
当大型语言模型在文本的海洋中纵横捭阖，生成式AI在数字画布上挥洒创意时，人工智能仍有一个根本性的疆域尚未完全征服——真实的三维物理世界。理解一个苹果，不能仅靠词向量坐标；学会行走，无法通过阅读说明书达成；在拥挤的街道导航，远非处理符号逻辑那般简单。智能的进化，自生命诞生之初，便与具身性（Embodiment）和环境交互（Interaction）密不可分。我们的认知、学习、乃至意识的雏形，都源于身体
happy-llm 第一章 NLP 基础概念 weixin_38374194 自然语言处理人工智能学习
文章目录一、什么是NLP？二、NLP发展三大阶段三、NLP核心任务精要四、文本表示演进史1.传统方法：统计表征2.神经网络：语义向量化课程地址：happy-llmNLP基础概念一、什么是NLP？核心目标：让计算机理解、生成、处理人类语言，实现人机自然交互。现状与挑战：成就：深度学习推动文本分类、翻译等任务达到近人类水平。瓶颈：歧义性、隐喻理解、跨文化差异等。二、NLP发展三大阶段时期代表技术核心思
Nystromformer：一种基于 Nyström 方法的自注意力近似算法 AI专题精讲 Paper阅读人工智能自然语言处理 AI
1.摘要Transformer已经成为广泛自然语言处理任务中的强大工具。推动Transformer展现出卓越性能的一个关键组件是self-attention机制，它对每个token编码了其他token的影响或依赖关系。虽然self-attention机制具有诸多优势，但其在输入序列长度上的二次复杂度限制了其在较长序列上的应用——这是当前社区积极研究的一个主题。为了解决这一限制，我们提出了Nystr
供应链风险管理：AI预测潜在风险 AI智能应用 AI大模型应用入门实战与进阶 java python javascript kotlin golang 架构人工智能
供应链风险管理,AI预测,机器学习,深度学习,自然语言处理,风险评估,供应链可视化1.背景介绍在当今全球化经济体系中，供应链的复杂性和脆弱性日益凸显。供应链风险是指任何可能对供应链正常运行造成负面影响的事件或因素。这些风险可能来自自然灾害、政治动荡、经济波动、技术故障、供应商违约等方面。一旦供应链风险爆发，可能会导致生产中断、产品短缺、成本飙升、品牌形象受损等严重后果。传统供应链风险管理方法主要依
供应链风险管理：AI如何预测供应链风险 AI大模型应用之禅 java python javascript kotlin golang 架构人工智能
供应链风险管理,AI预测,机器学习,深度学习,自然语言处理,时间序列分析,风险评估1.背景介绍在当今全球化经济体系中，供应链风险已成为企业面临的重大挑战。供应链的复杂性和不可预测性使得企业更容易受到各种风险的影响，例如自然灾害、政治动荡、经济波动、疫情爆发等。这些风险可能导致供应中断、成本增加、交付延迟，甚至损害企业声誉。传统供应链风险管理方法主要依赖于经验和专家判断，缺乏数据驱动和预测能力。随着
【AI】大语言模型（LLM）& NLP G皮T #大语言模型 LLM NLP 大模型大语言模型 AI 人工智能
大语言模型（LLM）&NLP1.大语言模型（LLM）1.1一句话解释1.2更形象的比喻1.3为什么叫“大”模型1.4它能做什么1.5现实中的例子2.对比NLP2.1用“汽车进化”比喻NLP→LLM2.2为什么说LLM属于NLP2.3LLM的“革命性突破”在哪里2.4总结1.大语言模型（LLM）1.1一句话解释大语言模型（LargeLanguageModel，LLM）是一个“超级文字预测器”，它通过
手把手全程带你使用springboot2.6.7+vue2前后端分离腾讯云对象存储COS上传文件星绪173 腾讯云 java spring boot vue elementui
时间：2022.6.27往后的版本可能需要更改依赖前后端分离腾讯云对象存储COS上传文件创建腾讯云COS对象存储存储桶后端添加pom依赖在application.yml中添加动态配置以下为方法示例SQLEntityMapperControllerServiceServiceImplServiceExceptionConstants前端按钮上传对话框相关方法完整示例File.vueconfig.js
使用Python爬虫与自然语言处理技术抓取并分析网页内容 Python爬虫项目 python 爬虫自然语言处理 javascript 数据分析人工智能
1.引言在如今数据驱动的时代，网页爬虫（WebScraping）和自然语言处理（NLP）已成为处理大量网页数据的重要工具。利用Python爬虫抓取网页内容，结合NLP技术进行文本分析和信息抽取，能够从大量网页中提取有价值的信息。无论是新闻文章的情感分析、社交媒体的舆情分析，还是电商网站的商品评论挖掘，这些技术都发挥着至关重要的作用。本文将介绍如何利用Python爬虫与自然语言处理技术抓取并分析网页
AIOps助力AI研发平台的自我优化能力构建 TechVision大咖圈人工智能 AIOps 能力构建
关键词：AIOps在AI研发平台中的自我优化能力构建适用读者：AI平台架构师、研发效能团队、智能运维工程师阅读时长：约8分钟目录什么是AIOps？AI研发平台的挑战AIOps如何赋能AI研发平台自我优化能力的核心构建要素架构图与流程示意最佳实践案例写在最后什么是AIOps？AIOps，全称ArtificialIntelligenceforITOperations。别害怕这个“高大上”的名词，其实它
GPT在AI原生应用领域的无限潜力
GPT在AI原生应用领域的无限潜力关键词：GPT、AI原生应用、自然语言处理、无限潜力、应用场景摘要：本文深入探讨了GPT在AI原生应用领域所展现出的无限潜力。首先介绍了相关背景知识，包括GPT的基本概念和AI原生应用的定义。接着详细解释了GPT的核心概念，以及它与AI原生应用的紧密联系。通过数学模型和公式对GPT的工作原理进行了阐述，并给出了实际的代码案例。还探讨了GPT在多个实际应用场景中的表
深度学习前置知识全面解析：从机器学习到深度学习的进阶之路
一、引言：人工智能时代的核心技术在当今这个数据爆炸的时代，人工智能(AI)已经成为推动社会进步的核心技术之一。作为AI领域最重要的分支，深度学习(DeepLearning)在计算机视觉、自然语言处理、语音识别等领域取得了突破性进展，彻底改变了我们与机器交互的方式。本教案将从机器学习的基础知识出发，系统性地介绍深度学习的核心概念、数学基础、网络架构和训练方法，为读者构建完整的知识体系框架。无论你是刚
GraphRAG革命性突破！美国Cedars-Sinai医疗中心揭秘：知识增强大模型如何重塑阿尔茨海默病基因研究与治疗？ DeepSeek-大模型系统教程人工智能大模型 chatgpt 语言模型 ai 大模型学习大模型教程
摘要：随着阿尔茨海默病患者人数不断攀升，Cedars-Sinai医学中心通过知识图谱和AI技术，打造了AlzKB阿尔茨海默病知识库，用以推动新型病因和药物的发现。本文详解这些前沿工具如何结合，赋能专业人士实现高效科研转化，为认知障碍领域带来突破正文据估计，690万65岁及以上的美国人患有阿尔茨海默病。如果没有重大的医学突破，预计到2060年，美国这一数字将上升到1380万，到2050年全球将上升到
计算机视觉中的Transformer：ViT模型详解与代码实现 AI大模型应用工坊计算机视觉 transformer 人工智能 ai
计算机视觉中的Transformer：ViT模型详解与代码实现关键词：计算机视觉、Transformer、ViT、自注意力机制、图像分块摘要：传统卷积神经网络（CNN）统治计算机视觉领域多年，但2020年一篇《AnImageisWorth16x16Words:TransformersforImageRecognitionatScale》的论文打破了这一格局——它将NLP领域的Transformer
AI 加持下的智能家居行业：变革、挑战与机遇低代码老李人工智能智能家居
在当今科技迅猛发展的浪潮中，人工智能（AI）已深深融入智能家居领域，成为推动其蓬勃发展的关键力量，为人们的生活带来了诸多便利和创新体验，同时也面临着一系列亟待解决的问题。一、AI驱动的智能家居功能升级（1）智能语音交互与控制智能语音助手作为智能家居的核心交互方式，借助自然语言处理（NLP）技术，让用户仅通过简单的语音指令，就能轻松操控家中各类智能设备，如精准控制灯光的开关与亮度调节、窗帘的开合、电
《美化生活》投稿简介 Editor_li 论文阅读
《美化生活》杂志是国家新闻出版署批准的正规期刊，是面向全国发行的文学艺术刊。本刊坚持“传播新理念，交流新经验”办刊方针，坚持“指导消费、丰富生活、美化心灵、雅俗共赏”的宗旨，以其丰富的内容，融学术性与技术性为一体的特点，获得了广大学者的喜爱。主要栏目：欣赏生活、艺术生活、文学生活、走进生活等。刊名：美化生活主管单位：上海纺织控股（集团）公司主办单位：上海纺织控股（集团）公司出版周期：旬刊国内统一连
《小学生作文辅导》期刊投稿邮箱
《小学生作文辅导》是国家新闻出版总署批准的正规教育类期刊，适用于全国各小学语文老师事业单位及个人，具有原创性的学术理论、工作实践、科研成果和科研课题及相关领域等人员评高级职称时的论文发表（单位有特殊要求除外）。栏目设置：写法导引、智慧阅读、课堂建设、课堂建设、教学透视、教育撷英等。刊名：小学生作文辅导级别：省级主管单位：吉林出版集团股份有限公司主办单位：北方妇女儿童出版社有限责任公司ISSN：16
手把手教你学intel cpu bios开发（2）--Intel BIOS架构和组成小蘑菇二号手把手教你学inte cpu l bios专栏 bios
目录第2天：IntelBIOS架构和组成目标任务总结第2天：IntelBIOS架构和组成目标熟悉IntelBIOS的架构和组成部分。了解UEFI（UnifiedExtensibleFirmwareInterface）的概念和优势。了解EFI（ExtensibleFirmwareInterface）和UEFI的区别。任务阅读IntelBIOS开发指南IntelBIOSImplementationGu
【Python】已解决：Traceback (most recent call last): File “C:/python/kfc.py”, line 8, in KfcError: KFC Cra 屿小夏 python c语言开发语言
个人简介：某不知名博主，致力于全栈领域的优质博客分享|用最优质的内容带来最舒适的阅读体验！文末获取免费IT学习资料！文末获取更多信息精彩专栏推荐订阅收藏专栏系列直达链接相关介绍书籍分享点我跳转书籍作为获取知识的重要途径，对于IT从业者来说更是不可或缺的资源。不定期更新IT图书，并在评论区抽取随机粉丝，书籍免费包邮到家AI前沿点我跳转探讨人工智能技术领域的最新发展和创新，涵盖机器学习、深度学习、自然
如何成为一名合格的 Prompt 工程师？ csdn_tom_168 AI 人工智能 ai prompt
以下为基于行业实践与最新趋势的Prompt工程师成长体系，结合技术能力、实战经验与职业发展三个维度构建的完整路径：一、核心能力模型构建1.基础认知能力领域知识融合掌握垂直领域知识图谱（如医疗术语、法律条文），通过RAG技术实现专业语料注入案例：设计医疗诊断Prompt时需理解ICD-11疾病分类标准模型原理理解熟悉主流模型特性（如GPT-4长文本处理优势、Claude3的逻辑推理强项），针对性设计
简要介绍redis tornadoami AI 系统运维 redis 数据库缓存开源 ai 键值 insight
redis阅读原文建议阅读原文，始终查看最新文档版本，获得最佳阅读体验：《redis》什么是redisRedis（REmoteDIctionaryServer）是一个开源的、高性能的内存键值数据库，属于NoSQL数据库类别，由C语言编写。它支持网络访问、持久化存储及多种数据结构，广泛应用于缓存、消息队列等场景。以下是其核心特点的简要介绍：⚙️核心特性高性能内存存储数据主要存储在内存中，读写速度达1
2025web建议
随便收集的信息新手入门路线推荐第一步：Web安全相关概念建议学习时间：2周学习内容如下：1、熟悉基本概念(SQL注入、上传、XSS、CSRF、一句话木马等)。2、通过关键字(SQL注入、上传、XSS、CSRF、一句话木马等)进行Google。3、阅读《Web安全深度剖析》，作为入门学习还是可以的。4、看一些渗透笔记/视频，了解渗透实战的整个过程，可以Google(渗透笔记、渗透过程、入侵过程等)。
java中http调用接口传参为form-data 洋:Y springboot java http servlet
直接上代码@OverridepublicJSONObjectgetCameraList(intcurrent,intsize,Stringcode,Stringname)throwsIOException{DefaultHttpClientclient=newDefaultHttpClient();MultipartEntityBuilderbuilder=MultipartEntityBuild
AWS Directory Services全解析在云上（oncloudai） aws
在企业加速迈向数字化与云端转型的今天，身份和访问管理（IdentityandAccessManagement，IAM）逐渐成为企业信息系统中的基础设施级能力。无论是员工系统登录权限管理，还是跨系统的统一认证，身份管理的成熟度直接影响到企业信息安全水平、系统协同效率以及用户体验。尤其在多云架构和混合办公日趋普遍的背景下，企业需要能够兼顾安全性、可用性、扩展性与兼容性的目录服务解决方案。AWSDire
视觉表征和多模态融合一只齐刘海的猫语言模型
视觉表征和多模态融合是当前人工智能领域的研究热点，特别是在计算机视觉和自然语言处理的交叉领域。视觉表征是指将图像或视频信息转化为模型可以处理的向量形式，而多模态融合则是将不同类型的数据（如视觉、文本、音频等）进行整合，以实现更全面、准确的信息理解和处理。视觉表征(VisualRepresentation)目的：将图像或视频数据转化为深度学习模型可以理解的特征向量。方法：卷积神经网络(CNN)：传
【软件开发 | 项目架构】实现缓存一致性秋说前后端项目开发(新手必知必会)架构缓存软件开发
文章目录前言缓存失效与缓存一致性的定义我们为何如此关注缓存一致性？缓存失效的思维模型可靠的一致性观测能力一致性追踪真实缺陷总结前言缓存有助于降低延迟、扩展读密集型负载并节省成本，几乎无处不在。缓存不仅运行在你的手机和浏览器中，诸如CDN（内容分发网络）和DNS（域名系统）本质上也是地理分布式的缓存系统。正是因为背后有众多缓存协同工作，你才能顺畅地阅读这篇博客文章。著名计算机科学家PhilKarlt
【LLM论文阅读】一只齐刘海的猫论文阅读
LLM论文阅读论文重点论文链接RopeRoFormer:EnhancedTransformerwithRotaryPositionEmbeddingRoPE论文阅读YarnUnderstandingYaRN:ExtendingContextWindowofLLMs论文YaRN笔记T5ExploringtheLimitsofTransferLearningwithaUnifiedText-to-Te
提炼总结—ROS2机器人开发（第9章）（下）
写在最前面的话为什么做该博客？该博客的特点是什么？随着DeepSeek、ChatGPT等AI技术的崛起，促使机器人技术发展到了新的高度，诞生了宇树科技、特斯拉为代表的人形机器人，四足机器人等等，越来越多的科技巨头涌入机器人赛道，行业对于相关人才的需求也随之达到了顶峰。本博客的内容是替你阅读所有关于机器人的经典书籍，采用书籍瘦身计划，帮你提炼出核心内容，采用最通俗易懂的语言来解释原理，将书读薄。大大
书其实只有三类西蜀石兰类
一个人一辈子其实只读三种书，知识类、技能类、修心类。知识类的书可以让我们活得更明白。类似十万个为什么这种书籍，我一直不太乐意去读，因为单纯的知识是没法做事的，就像知道地球转速是多少一样（我肯定不知道），这种所谓的知识，除非用到，普通人掌握了完全是一种负担，维基百科能找到的东西，为什么去记忆？知识类的书，每个方面都涉及些，让自己显得不那么没文化，仅此而已。社会认为的学识渊博，肯定不是站在
《TCP/IP 详解，卷1：协议》学习笔记、吐槽及其他 bylijinnan tcp
《TCP/IP 详解，卷1：协议》是经典，但不适合初学者。它更像是一本字典，适合学过网络的人温习和查阅一些记不清的概念。这本书，我看的版本是机械工业出版社、范建华等译的。这本书在我看来，翻译得一般，甚至有明显的错误。如果英文熟练，看原版更好： http://pcvr.nl/tcpip/ 下面是我的一些笔记，包括我看书时有疑问的地方，也有对该书的吐槽，有不对的地方请指正： 1.
Linux—— 静态IP跟动态IP设置 eksliang linux IP
一.在终端输入 vi /etc/sysconfig/network-scripts/ifcfg-eth0 静态ip模板如下： DEVICE="eth0" #网卡名称 BOOTPROTO="static" #静态IP（必须） HWADDR="00:0C:29:B5:65:CA" #网卡mac地址 IPV6INIT=&q
Informatica update strategy transformation 18289753290
更新策略组件：标记你的数据进入target里面做什么操作，一般会和lookup配合使用，有时候用0,1,1代表 forward rejected rows被选中，rejected row是输出在错误文件里，不想看到reject输出，将错误输出到文件，因为有时候数据库原因导致某些column不能update，reject就会output到错误文件里面供查看，在workflow的
使用Scrapy时出现虽然队列里有很多Request但是却不下载，造成假死状态酷的飞上天空 request
现象就是：程序运行一段时间，可能是几十分钟或者几个小时，然后后台日志里面就不出现下载页面的信息，一直显示上一分钟抓取了0个网页的信息。刚开始已经猜到是某些下载线程没有正常执行回调方法引起程序一直以为线程还未下载完成，但是水平有限研究源码未果。经过不停的google终于发现一个有价值的信息，是给twisted提出的一个bugfix 连接地址如下http://twistedmatrix.
利用预测分析技术来进行辅助医疗蓝儿唯美医疗
2014年，克利夫兰诊所（Cleveland Clinic）想要更有效地控制其手术中心做膝关节置换手术的费用。整个系统每年大约进行2600例此类手术，所以，即使降低很少一部分成本，都可以为诊所和病人节约大量的资金。为了找到适合的解决方案，供应商将视野投向了预测分析技术和工具，但其分析团队还必须花时间向医生解释基于数据的治疗方案意味着什么。克利夫兰诊所负责企业信息管理和分析的医疗
java 线程(一)：基础篇 DavidIsOK java 多线程线程
&nbs
Tomcat服务器框架之Servlet开发分析 aijuans servlet
最近使用Tomcat做web服务器，使用Servlet技术做开发时，对Tomcat的框架的简易分析：疑问：为什么我们在继承HttpServlet类之后，覆盖doGet(HttpServletRequest req, HttpServetResponse rep)方法后，该方法会自动被Tomcat服务器调用，doGet方法的参数有谁传递过来？怎样传递？分析之我见： doGet方法的
揭秘玖富的粉丝营销之谜与小米粉丝社区类似 aoyouzi 揭秘玖富的粉丝营销之谜
玖富旗下悟空理财凭借着一个微信公众号上线当天成交量即破百万，第七天成交量单日破了1000万;第23天时，累计成交量超1个亿……至今成立不到10个月，粉丝已经超过500万，月交易额突破10亿，而玖富平台目前的总用户数也已经超过了1800万，位居P2P平台第一位。很多互联网金融创业者慕名前来学习效仿，但是却鲜有成功者，玖富的粉丝营销对外至今仍然是个谜。　　近日，一直坚持微信粉丝营销
Java web的会话跟踪技术百合不是茶 url会话 Cookie会话 Seession会话 Java Web 隐藏域会话
会话跟踪主要是用在用户页面点击不同的页面时,需要用到的技术点会话:多次请求与响应的过程 1,url地址传递参数,实现页面跟踪技术格式:传一个参数的 url?名=值传两个参数的 url?名=值 &名=值关键代码
web.xml之Servlet配置 bijian1013 java web.xml Servlet配置
定义： <servlet> <servlet-name>myservlet</servlet-name> <servlet-class>com.myapp.controller.MyFirstServlet</servlet-class> <init-param> <param-name>
利用svnsync实现SVN同步备份 sunjing SVN 同步 E000022 svnsync 镜像
1. 在备份SVN服务器上建立版本库 svnadmin create test 2. 创建pre-revprop-change文件 cd test/hooks/ cp pre-revprop-change.tmpl pre-revprop-change 3. 修改pre-revprop-
【分布式数据一致性三】MongoDB读写一致性 bit1129 mongodb
本系列文章结合MongoDB，探讨分布式数据库的数据一致性，这个系列文章包括：数据一致性概述与CAP 最终一致性(Eventually Consistency) 网络分裂(Network Partition)问题多数据中心(Multi Data Center) 多个写者(Multi Writer)最终一致性一致性图表(Consistency Chart) 数据
Anychart图表组件-Flash图转IMG普通图的方法白糖_ Flash
问题背景：项目使用的是Anychart图表组件，渲染出来的图是Flash的，往往一个页面有时候会有多个flash图，而需求是让我们做一个打印预览和打印功能，让多个Flash图在一个页面上打印出来。那么我们打印预览的思路是获取页面的body元素，然后在打印预览界面通过$("body").append(html)的形式显示预览效果，结果让人大跌眼镜：Flash是
Window 80端口被占用 WHY? bozch 端口占用 window
平时在启动一些可能使用80端口软件的时候，会提示80端口已经被其他软件占用，那一般又会有那些软件占用这些端口呢？下面坐下总结： 1、web服务器是最经常见的占用80端口的，例如：tomcat , apache , IIS , Php等等； 2
编程之美-数组的最大值和最小值-分治法（两种形式） bylijinnan 编程之美
import java.util.Arrays; public class MinMaxInArray { /** * 编程之美数组的最大值和最小值分治法 * 两种形式 */ public static void main(String[] args) { int[] t={11,23,34,4,6,7,8,1,2,23}; int[]
Perl正则表达式 chenbowen00 正则表达式 perl
首先我们应该知道 Perl 程序中，正则表达式有三种存在形式，他们分别是：匹配：m/<regexp>;/ （还可以简写为 /<regexp>;/ ，略去 m）替换：s/<pattern>;/<replacement>;/ 转化：tr/<pattern>;/<replacemnt>;
[宇宙与天文]行星议会是否具有本行星大气层以外的权力呢? comsci
举个例子: 地球,地球上由200多个国家选举出一个代表地球联合体的议会,那么现在地球联合体遇到一个问题,地球这颗星球上面的矿产资源快要采掘完了....那么地球议会全体投票,一致通过一项带有法律性质的议案,既批准地球上的国家用各种技术手段在地球以外开采矿产资源和其它资源........ &
Oracle Profile 使用详解 daizj oracle profile 资源限制
Oracle Profile 使用详解转一、目的： Oracle系统中的profile可以用来对用户所能使用的数据库资源进行限制，使用Create Profile命令创建一个Profile，用它来实现对数据库资源的限制使用，如果把该profile分配给用户，则该用户所能使用的数据库资源都在该profile的限制之内。二、条件：创建profile必须要有CREATE PROFIL
How HipChat Stores And Indexes Billions Of Messages Using ElasticSearch & Redis dengkane elasticsearch Lucene
This article is from an interview with Zuhaib Siddique, a production engineer at HipChat, makers of group chat and IM for teams. HipChat started in an unusual space, one you might not
循环小示例，菲波拉契序列，循环解一元二次方程以及switch示例程序 dcj3sjt126com c 算法
# include <stdio.h> int main(void) { int n; int i; int f1, f2, f3; f1 = 1; f2 = 1; printf("请输入您需要求的想的序列："); scanf("%d", &n); for (i=3; i<n; i
macbook的lamp环境 dcj3sjt126com lamp
sudo vim /etc/apache2/httpd.conf /Library/WebServer/Documents 是默认的网站根目录重启Mac上的Apache服务这个命令很早以前就查过了，但是每次使用的时候还是要在网上查：停止服务：sudo /usr/sbin/apachectl stop 开启服务：s
java ArrayList源码下 shuizhaosi888 ArrayList源码
版本 jdk-7u71-windows-x64 JavaSE7 ArrayList源码上：http://flyouwith.iteye.com/blog/2166890 /** * 从这个列表中移除所有c中包含元素 */ public boolean removeAll(Collection<?> c) {
Spring Security（08）——intercept-url配置 234390216 Spring Security intercept-url 访问权限访问协议请求方法
intercept-url配置目录 1.1 指定拦截的url 1.2 指定访问权限 1.3 指定访问协议 1.4 指定请求方法 1.1 &n
Linux环境下的oracle安装 jayung oracle
linux系统下的oracle安装本文档是Linux(redhat6.x、centos6.x、redhat7.x) 64位操作系统安装Oracle 11g(Oracle Database 11g Enterprise Edition Release 11.2.0.4.0 - 64bit Production)，本文基于各种网络资料精心整理而成，共享给有需要的朋友。如有问题可联系：QQ：52-7
hotspot虚拟机 leichenlei java HotSpot jvm 虚拟机文档
JVM参数 http://docs.oracle.com/javase/6/docs/technotes/guides/vm/index.html JVM工具 http://docs.oracle.com/javase/6/docs/technotes/tools/index.html JVM垃圾回收 http://www.oracle.com
读《Node.js项目实践：构建可扩展的Web应用》 ——引编程慢慢变成系统化的“砌砖活” noaighost Web node.js
读《Node.js项目实践：构建可扩展的Web应用》 ——引编程慢慢变成系统化的“砌砖活” 眼里的Node.JS 初初接触node是一年前的事，那时候年少不更事。还在纠结什么语言可以编写出牛逼的程序，想必每个码农都会经历这个月经性的问题：微信用什么语言写的？facebook为什么推荐系统这么智能，用什么语言写的？dota2的外挂这么牛逼，用什么语言写的？……用什么语言写这句话，困扰人也是阻碍
快速开发Android应用 rensanning android
Android应用开发过程中，经常会遇到很多常见的类似问题，解决这些问题需要花时间，其实很多问题已经有了成熟的解决方案，比如很多第三方的开源lib，参考 Android Libraries 和 Android UI/UX Libraries。编码越少，Bug越少，效率自然会高。但可能由于根本没听说过、听说过但没用过、特殊原因不能用、自己已经有了解决方案等等原因，这些成熟的解决
理解Java中的弱引用 tomcat_oracle java 工作面试
　不久之前，我面试了一些求职Java高级开发工程师的应聘者。我常常会面试他们说，“你能给我介绍一些Java中得弱引用吗？”，如果面试者这样说，“嗯，是不是垃圾回收有关的？”，我就会基本满意了，我并不期待回答是一篇诘究本末的论文描述。　　然而事与愿违，我很吃惊的发现，在将近20多个有着平均5年开发经验和高学历背景的应聘者中，居然只有两个人知道弱引用的存在，但是在这两个人之中只有一个人真正了
标签输出html标签" target="_blank">关于标签输出html标签 xshdch jsp
http://back-888888.iteye.com/blog/1181202 关于<c:out value=""/>标签的使用，其中有一个属性是escapeXml默认是true(将html标签当做转移字符，直接显示不在浏览器上面进行解析)，当设置escapeXml属性值为false的时候就是不过滤xml，这样就能在浏览器上解析html标签， &nb