__盛夏光年__

【论文】Legal Judgment Prediction via Topological Learning

该论文发表于：EMNLP 2018
文章目录
- 摘要
- 1、Introduction
- 2、Related Work
- - 2.1 Judgment Prediction
  - 2.2 Multi-task Learning（MTL）
- 3、Method
- - 3.1 Problem Formulation
  - 3.2 DAG Dependencies of Subtasks
  - 3.3 Neural Encoder for Fact Descriptions
  - 3.4 Judgment Predictor over DAG
  - 3.5 Training
- 4、Experiments
- - 4.1 Dataset Construction
  - 4.2 Baselines
  - 4.3 Experimental Settings
  - 4.4 Results and Analysis
  - 其他实验
- 5 Conclusion

摘要

Legal Judgment Prediction (LJP) ：基于案件的事实来预测审判结果。
法律审判由多个子任务组成： the decisions of applicable law articles（可用法条）, charges（罪名指控）, fines（罚金）, and the term of penalty（处罚）.
存在问题：现有的工作仅仅关注 judgment Prediction（审判预测）中的特定的子任务，而忽略了子任务之间的拓扑依赖关系。
解决方法：本文将子任务之间的依赖视为有向无环图（DAG），并提出一个拓扑的多任务学习框架（TOPJUDGE），该框架将多任务学习和DAG依赖融入到judgment Prediction中。
github：https://github.com/thunlp/TopJudge

1、Introduction

Legal Judgment Prediction (LJP) ：根据事实描述对法律案件预测审判的结果。是法律辅助系统中一项关键的技术。
作用：为不熟悉法律术语和复杂的审判程序的群众提供低花费且高质量的法律咨询服务；不仅能够提高法律专业人士的工作效率、给予更加专业的法律建议。
现状：大多数现有的工作将 LJP 当作文本分类任务（text classification task）——设计有效的特征、使用先进的NLP技术。
现有两大问题：
- Multiple Subtasks in Legal Judgment：现有工作通常关注审判中的某个特定的子任务，不适用于真实场景；虽然，有工作同时预测 law articles 和 charges，但这些模型是为具体的一系列子任务设计的，难以扩展到其他子任务。
- Topological Dependencies between Subtasks：子任务之间存在严格的顺序，如图1所示。具体流程：给定某案件的事实描述，大陆法系的法官首先确定与案件相关的法条（law articles），然后根据相关法条的说明确定指控罪名（charges）；基于上述结果，法官进一步确定处罚（penalty）和罚金（fines）。如何模仿法官的逻辑并建模子任务指甲剪的拓扑依赖将极大地影响审判预测的可信度和可解释性（creditability and interpretability）。
- 由于特定任务的限制和忽视拓扑依赖性（the limitation of specific tasks and neglecting topological dependencies），传统工作无法解决这两个挑战。
文本方法：使用一个有向无环图（Directed Acyclic Graph，DAG）定义子任务之间的拓扑性的依赖关系，并提出一个统一的框架TOPJUDGE。具体来讲，给定事实描述的编码表示，TOPJUDGE根据拓扑顺序预测所有子任务的输出，并且某个特定子任务的输出将会影响其被依赖的子任务。
贡献：
- 第一个将LJP的多个子任务统一到一个学习框架，此外，将LJP的子任务之间的依赖建立成DAG的形式并利用先验知识提升审判预测。
- 提出统一多子任务的TOPJUDGE框架，和通过topological learning的审判预测。该模型可处理任何DAG依赖的子任务。
- state-of-the-art 的结果

2、Related Work

2.1 Judgment Prediction

早期工作：通常侧重于使用数学和统计算法分析特定场景中的现有法律案例；

机器学习和文本挖掘技术 ：将其视为文本分类问题，

关注：从文本内容或案例注释（e.g., dates, terms, locations, and types）中提取有效的特征；
评价：这些方法利用浅层的文本特征和手动设计的因素，而两者都消耗大量人力，并且当应用于其他场景时会出现泛化的问题。

基于神经网络的方法

例如：基于注意力机制的神经网络等等

2.2 Multi-task Learning（MTL）

Multi-task learning (MTL) 旨在于通过同时解决相关任务，探索它们的共性和差异性（aims to exploit the commonalities and differences across relevant tasks by solving them at the same time），它可以在各种任务之间传递有用的信息，并已经有了广泛的应用。

常用思路：

hard parameter sharing：sharing representations or some encoding layers among relevant tasks.
soft parameter sharing：通常假设每个任务都有其特定的参数，不同任务中的参数之间的距离相近。
有部分工作关注：增加任务或处理无标签数据

本文工作中，我们介绍 拓扑(topological)学习框架 TOPJUDGE，用于处理 LJP 中的多个子任务。TOPJUDGE 不同于传统的 MTL 模型，这些模型侧重于如何在相关任务之间共享参数，TOPJUDGE 使用可扩展的 DAG 形式对这些子任务之间的显式依赖关系进行模型

3、Method

3.1 Problem Formulation

本文关注的是民法（civil law）中的 LJP 任务。

LJP 任务的定义：

假设一个案件的事实描述是一个单词序列 $\mathrm{x}=\{x_1,x_2,...,x_n\}$ ，其中 $n$ 表示 $\mathrm{x}$ 的长度，且每个单词 $x_i$ 都来自固定的词汇 $W$ 。
基于事实描述 $\mathrm{x}$ ，LJP $T$ 的任务是预测适用 law articles（法律条款）、charges（罪名指控）、term of penalty（处罚期限）、fines（罚款）等的判断结果。
形式上，假设 $T$ 包含 $∣ T ∣$ 个子任务，即 $T=\{t_1,t_2,...,t_{|T|}\}$ ，每个都是一个分类任务。对于第 $i$ 个子任务 $t_i\in{T}$ ，我们的目标是预测相应的结果 $\mathrm{y}_i\subseteq{Y_i}$ ，其中 $Y_i$ 是子任务特定标签集合。
以 charges prediction 的子任务为例：其对应的标签集合应该包括 Theft（偷窃）,Traffic Violation（交通违章）, Intentional Homicide（故意杀人）等等.

3.2 DAG Dependencies of Subtasks

我们假设 LJP 的多个子任务之间的依赖关系可形成 DAG。因此，任务列表 $T$ 应满足 topological constraints（拓扑约束）。

形式上：

使用记号 $t_i\triangleleft{t_j}$ 来定义第 $j$ 个子任务取决于第 $i$ 个子任务； $D_j=\{t_i|t_i\triangleleft{t_j}\}$ 定义依赖集合。
则任务列表 $T$ 需要满足以下约束：

我们通过描述两个特殊情况，以展示公式的灵活性。

（1）如图（a）所示，若不存在依赖，即 $D_j=\varnothing$ ，它对应于典型的 MTL setting，即我们同时对所有子任务进行预测。
如图（b）所示，若每个任务仅依赖于前一个的任务，即 $D_j=\{t_{j-1}\}$ ，它形成了一个顺序的学习过程。

3.3 Neural Encoder for Fact Descriptions

我们使用 a fact encoder 来生成 事实描述的向量表示，它作为 TOPJUDGE 的输入。此处使用一个基于 CNN 的 encoder。

将单词序列 $\mathrm{x}$ 作为输入，the CNN encoder 通过三个层（即lookup layer, convolution layer 和 pooling layer） 计算文本表示。

Lookup：将 $\mathrm{x}$ 中的每个单词 $x_i$ 转换为 word embedding $\mathrm{x}_i\in{\mathbb{R}^k}$ ，其中 $k$ 表示 word embedding 的维度，则 word embedding 序列表示为
$\hat{\mathrm{x}}=\{\mathrm{x}_1,\mathrm{x}_2,...,\mathrm{x}_n\}\tag{2}$
Convolution：卷积操作 涉及卷积矩阵 $\mathrm{W}\in{\mathbb{R}^{m\times(h\times k)}}$ ，在该矩阵上应用 $m$ 个filter（其长度为 $h$ ），以生成 feature map，其中 $\mathrm{x}_{i:i+h-1}$ 是 $i$ -th window 中 word embedding 的串联结果， $\mathrm{b}\in{\mathbb{R}^m}$ 是偏置向量。通过在每个window上运用conv操作，获得 $\mathrm{c}=\{c_{1},...,c_{n-h+1}\}$
$\mathrm{c}_i=\mathrm{W}·{\mathrm{x}_{i:i+h-1}}+\mathrm{b}\tag{3}$
Pooling：在 $c$ 的每个维度上应用 max pooling，并获得最终的事实表示 $\mathrm{d}=[d_1,d_2,...,d_m]$ ，计算公式如下：
$d_t=max(c_{1,t},...,c_{n-h+1,t}),\ \ \ \ \forall{t}\in[1,m]\tag{4}$

3.4 Judgment Predictor over DAG

基于 DAG 假设，我们获得一个有顺序的任务列表 $T^*=[t_1,t_2,...,t_{|T|}]$ 。对于每个任务 $t_j\in{T}$ ，我们的目标是 根据事实表示向量 $\mathrm{d}$ 及其所依赖任务的判断结果来预测其判断结果 $\mathrm{y}_j$ 。

为了预测，我们为每个任务使用特定的 LSTM cell，并按拓扑顺序获取每个任务的输出。更具体地说，对于每个任务 $t_j\in{T}$ ，通过三步获取其最终的判决结果，步骤：cell initialization, taskspecific representation, 和 prediction。

Cell Initialization： $t_j$ 的预测结果将以 事实表示 $\mathrm{d}$ 和 所有依赖任务 $\mathrm{y}_k,\ \forall{t_k}\in{D_j}$ 的输出 为条件。因此，有
$\left[ \begin{matrix} \bar{\mathrm{h}_j} \\ \bar{\mathrm{c}_j} \\ \end{matrix} \right] =\sum_{t_i\in{D_j}}(\mathrm{W}_{i,j} \left[ \begin{matrix} {\mathrm{h}_i} \\ {\mathrm{c}_i} \\ \end{matrix} \right])+\mathrm{b}_j\tag{5}$
- 其中， ${\mathrm{h}_i}$ 和 ${\mathrm{c}_i}$ 是 cell $t_i$ 的 hidden state(隐藏状态) 和memory cell (内存单元)。 $\bar{\mathrm{h}_j}$ 和 $\bar{\mathrm{c}_j}$ 是 cell $t_j$ 的 initial hidden state(初始隐藏状态) 和memory cell (内存单元)。 $\mathrm{W}_{i,j}$ 和 $\mathrm{b}_j$ 是特定于 $t_i$ 和 $t_j$ 的变换矩阵和偏置矢量。
Task-Specific Representation：
- 输入：the fact representation $\mathrm{d}$ , the initial hidden state $\bar{\mathrm{h}_j}$ , 和 the initial memory cell $\bar{\mathrm{c}_j}$
- 使用LSTM cell 处理输入：我们将 final hidden state $\mathrm{h}_j$ 作为任务 $t_j$ 的特定任务的表示。The last cell state $\mathrm{c}_j$ 用于构建接下来的任务的 the initial hidden state（初始隐含状态），如公式5所示。
Prediction：在表示 $\mathrm{h}_j$ 上使用放射变换（affine transformation），然后应用 softmax，之后获得 the final prediction 如下：
$\mathrm{\hat{y}}_j=\mathrm{softmax}(\mathrm{W}_j^p\mathrm{h}_j+\mathrm{b}_j^p)\tag{6}$
- 其中， $\mathrm{W}_j^p$ 和 $\mathrm{b}_j^p$ 是特点任务 $t_j$ 的参数。
- 优化：最小化 $\mathrm{\hat{y}}_j$ 和 $\mathrm{{y}}_j$ 之间的交叉熵，公式如下：
  $\mathcal{L}_j(\mathrm{\hat{y}}_j,\mathrm{{y}}_j)=-\sum_{j=1}^{|Y_j|}\mathrm{{y}}_{j,k}\log(\mathrm{\hat{y}}_{j,k})\tag{7}$

3.5 Training

我们对每一个子任务使用交叉熵损失，并对所有任务的损失进行加权求和所有的损失来训练TOPJUDGE：
$\mathcal{L}=\sum_{j=1}^{|T|}\lambda_j\mathcal{L}_j(\mathrm{\hat{y}}_j,\mathrm{{y}}_j)\tag{8}$

其中， $\lambda_j$ 是子任务 $t_j$ 的权重因子。

子任务的DAG依赖确保了本文模型是可微分的，并且可以以端到端的方式进行训练。在实践中，我们设置所有的 $\lambda_j=1$ ，使用 Adam 进行优化。为了防止过拟合，我们在fact representation上使用dropout。

4、Experiments

三个典型的子任务： law articles, charges, and the terms of penalty

4.1 Dataset Construction

数据集：CJO, PKU, 和 CAIL

CJO：包含犯罪案件，数据来源中国裁判文书网
PKU：包含犯罪案件，数据来源北大法宝
CAIL：竞赛数据集，数据来源中国裁判文书网
上述数据集文档有很好的结构和注释，易于提取 fact descriptions, applicable law articles, charges and the terms of penalty。

数据预处理：

数据过滤：对于存在多个被告和多项指控罪名的案件过滤，原因：本文关注点是子任务之间的拓扑性依赖的有效性；
数据过滤：对不常见的指控罪名（charges）和法律条款（law articles）的案件进行过滤，只保留频率大于100。
将 penalty 离散成非重叠的区间。

数据统计

4.2 Baselines

TFIDF+SVM：特征提取 + 文本分类器
CNN：多尺度核来 fact encoding、classification
Hierarchical LSTM (HLSTM)：
Fact-Law Attention Model（2017）：使用注意力机制捕捉fact描述和适用的law articles之间的交互作用来charge预测的神经网络模型；
Pipeline Model (PM)：3 separate CNN classifiers for law articles, charges, and term of penalty，每个子任务的输入为 the concatenation of the fact representation 和 the embeddings for predicted labels of previous subtasks

4.3 Experimental Settings

分词：THULAC
预训练词向量：Skip-Gram model，embedding size = 200，frequency threshold = 25.
模型参数：the fact representation and task-specific representation = 256，maximum sentence length=128words，maximum document length=32sentences
超参数：learning rate（Adam）= $10^{-3}$ ，dropout=0.5，batch size=128，epochs=16
评价指标：accuracy (Acc.), macro-precision(MP), macro-recall (MR) 和 macro-F1 (F1)

4.4 Results and Analysis

子任务：law articles： $t_1$ , charges： $t_2$ , the terms of penalty： $t_3$

依赖设置： $D_1=\varnothing,D_2=\{t_1\},D_3=\{t_1,t_2\}$ ，即charges依赖于law articles，the terms of penalty依赖于law articles和charges。

实验结果：

优于其他方法，体现本方法的有效性和鲁棒性；
与单任务模型相比：多任务模型利用相关子任务的相关性，并得到提升，体现子任务联合建模的重要性；
charges and the terms of penalty的预测结果显著高于MTL方法，体现了LJP子任务的DAG依赖模型的合理性和重要性。

其他实验

研究：不同DAG依赖对结构性能的影响

5 Conclusion

In this paper, we focus on the task of legal judgment prediction (LJP) and address multiple subtasks of judgment predication with a topological learning framework. To be specific, we formalize the explicit dependencies over these subtasks in a DAG form, and propose a novel MTL framework, TOPJUDGE, by integrating the DAG dependencies. Experimental results on three LJP subtasks and three different datasets show that our TOPJUDGE outperforms all single-task baselines and conventional MTL models consistently and significantly.

探索思路：

(1) 更多子任务、多场景案件（eg：多被告、多项指控罪名）下 TOPJUDGE 的有效性；
(2) LJP + temporal factors（时间因素）

ESG证书：AI预测未来十年职场人的黄金入场券 ESG学习圈 pandas python django
当ChatGPT开始撰写ESG报告，当机器学习模型精准预测企业碳排放轨迹，一场由AI驱动的ESG革命正在颠覆传统可持续发展领域。根据彭博新能源财经预测，到2030年全球ESG资产管理规模将突破50万亿美元，而AI技术将成为撬动这个万亿级市场的核心杠杆。一、AI透视下的ESG黄金时代在微软开发的AI模型ESG-NOW系统中，通过分析全球4300家上市公司近十年的环境数据，成功预测2025年新能源行业
巨人学术搜索官网入口，免费参考文献论文及学术搜索引擎黄豆匿zlib 学习方法
巨人学术搜索自2024年上线以来，迅速成为学术界不可或缺的重要工具，尤其受到研究人员、教师及学生的青睐。这款专注于学术领域的专业搜索引擎，覆盖了自然科学、人文科学、社会科学等多个学科领域，整合了国内外众多主流数据库，包括维普、万方、Elsevier、WebofScience等，为用户提供了期刊论文、学位论文、专利、图书、预印本等多种类型资源的精准检索服务。与普通搜索引擎相比，巨人学术搜索的优势在于
云原生边缘计算：分布式智能的时代黎明桂月二二云原生边缘计算分布式
引言：从集中式算力到万物智联的范式裂变AT&T边缘节点部署超5000个，特斯拉自动驾驶系统每节点200TOPS算力。国家电网通过边缘计算实现毫秒级电网故障隔离，菜鸟物流分拣效率提升400%。IDC预测2027年边缘基础设施支出将达亿，宝马汽车工厂设备预测性维护准确率达9亿运维成本。一、边缘计算范式进化论1.1算力拓扑结构演变世代大型主机中心化云计算分布式雾计算去中心化边缘计算泛在化神经形态计算体计
基于大模型的腮腺多形性腺瘤全周期诊疗方案研究报告 LCG元围术期危险因子预测模型研究人工智能
目录一、引言1.1研究背景与目的1.2研究现状与趋势二、大模型预测原理与方法2.1大模型概述2.2数据收集与预处理2.3模型训练与优化三、术前预测与评估3.1肿瘤特征预测3.2风险评估3.3案例分析四、术中方案制定与实施4.1手术方案选择4.2面神经保护策略4.3麻醉方案确定五、术后恢复与并发症预测5.1恢复情况预测5.2并发症风险预测5.3案例分析六、术后护理与康复6.1护理措施6.2康复训练6
大规模语言模型从理论到实践分布式训练的集群架构 AI智能涌现深度研究 DeepSeek R1 &大数据AI人工智能 Python入门实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
大规模语言模型从理论到实践分布式训练的集群架构作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着深度学习技术的飞速发展，大规模语言模型（LargeLanguageModels,LLMs）在自然语言处理（NaturalLanguageProcessing,NLP）领域取得了突破性进展。LLMs，如BERT、GPT-3等，通
【论文阅读】MMedPO：用临床感知多模态偏好优化调整医学视觉语言模型勤奋的小笼包论文阅读语言模型人工智能自然语言处理 chatgpt
MMedPO：用临床感知多模态偏好优化调整医学视觉语言模型1.背景2.核心问题：3.方法：3.实验结果与优势4.技术贡献与意义5.结论MMedPO:AligningMedicalVision-LanguageModelswithClinical-AwareMultimodalPreferenceOptimizationMMedPO：用临床感知多模态偏好优化调整医学视觉语言模型gitgub:地址1.
计算机专业毕业设计指南晴天毕设课程设计毕业设计开发语言 java
毕业设计是计算机专业学生展示综合能力的重要环节，它不仅是对所学知识的总结，也是进入职场或深造前的实战演练。本文将为你提供一份详细的毕业设计指南，帮助你从选题到答辩顺利完成毕业设计。如果有什么问题可以点击文章末尾名片咨询哦一、毕业设计流程概述毕业设计通常包括以下几个阶段：选题需求分析系统设计编码实现测试与优化论文撰写答辩准备每个阶段都有其重要性，下面将逐一详细说明。二、详细步骤1.选题选题是毕业设计
Trae AI 上新 SSHremote：服务器 Python 接口日志排查实战指南芯作者 DD：日记人工智能深度学习机器学习
在当今的软件开发中，服务器端的稳定性和可靠性至关重要。然而，生产环境中的问题往往难以预测，尤其是接口返回502错误却无日志记录的情况，更是让开发者头疼不已。幸运的是，字节跳动推出的AI原生IDE——Trae，近期上线的SSHremote功能，为远程服务器日志排查提供了全新的解决方案。本文将结合实战案例，深入探讨如何利用TraeAI的SSHremote功能高效排查Python接口日志问题，并分享创新
Moodle + Websoft9：创新教育的强大组合，助力教学与学习开源软件
Moodle+Websoft9：构建未来课堂的技术基石一、Moodle：开源生态的深度解析•模块化设计：支持超800个官方插件，如H5P交互内容创作、BigBlueButton虚拟课堂，满足个性化教学需求。•学习分析引擎：内置LearningAnalyticsAPI，可集成Python/R语言进行深度学习，预测学生学业风险。•移动优先战略：MoodleApp支持离线学习、扫码签到，2023年新增A
根据论文复现大模型方法以及出错处理技巧 Ai玩家hly 从0倒1 论文复现大模型复现 Ai大模型复现
复现一篇论文中的大模型搭建涉及以下几个关键步骤：理解论文的模型架构、数据集处理、超参数设置以及实验环境的搭建。这里给出一个基本的实现方法示例，假设我们选择复现一个图像分类任务中的经典模型，例如ResNet。实现步骤示例1.理解论文和模型架构选择一篇关于ResNet的论文作为示例，例如《DeepResidualLearningforImageRecognition》（Heetal.,2015）。2.
书籍-《优化基础：理论、工具及应用（论文版）》机器学习人工智能
书籍：OptimizationEssentials:Theory,Tools,andApplications作者：FaizHamid出版：Springer编辑：陈萍萍的公主@一点人工一点智能下载：书籍下载-《优化基础：理论、工具及应用（论文版）》01书籍介绍本书探讨了运筹学和数学优化领域的最新发展和令人兴奋的挑战。它以统一且精心编排的方式呈现了以下内容：(a)现实生活中出现的新颖优化问题，并突出每
你准备好迎接它了吗？英伟达CEO黄仁勋预言：人形机器人将成为未来主流杰克尼机器人人工智能
在近日举行的“CadenceLIVE硅谷2024”大会上，英伟达公司的首席执行官黄仁勋与大会主办方Cadence公司的CEO进行了一场富有深度的对话。在这场引人瞩目的交流中，黄仁勋大胆预测，未来人形机器人将成为主流，引领科技发展的新潮流。你准备好迎接它了吗？英伟达CEO黄仁勋预言：人形机器人将成为未来主流©由18183手游网提供黄仁勋坚信，在不久的将来，我们所有人都都要制造的设备将会是人形机器人。
【MALTAB递归预测未来】VMD-Bayes-LSTM单变量时序预测-递归预测未来 (单输入单输出) 前程算法屋私信获取源码 lstm 人工智能 rnn
VMD-Bayes-LSTM单变量时序预测递归预测未来MALTAB代码一、引言1.1单变量时序预测的背景和意义在当今快速发展的社会中，数据无处不在，而时间序列数据作为其中一种重要类型，在众多领域发挥着不可替代的作用。单变量时序预测，即对单一变量随时间变化趋势的预测，在工业、经济等领域具有极其重要的意义。工业生产是国民经济的支柱产业，其稳定运行对整个社会经济发展至关重要。在制造业中，设备是生产的基础
Matlab基于BP神经网络与NSGA-II的多目标工艺参数优化方法天天酷科研工艺参数优化 matlab 神经网络工艺参数优化
Matlab基于BP神经网络与NSGA-II的多目标工艺参数优化方法一、方法原理与框架BP神经网络的作用BP神经网络通过建立工艺参数与目标性能（如翘曲变形、收缩率、硬度等）之间的非线性映射关系，作为代理模型替代复杂的物理仿真或实验。其优势在于：能够处理多输入-多输出的复杂非线性关系，例如激光功率、扫描速度与熔覆层性能的关联。在注塑成型中，预测体积收缩率和翘曲变形的相对误差可控制在5%以内。通过正交
集成学习（Ensemble Learning）基础知识1 代码骑士 #机器学习集成学习机器学习人工智能
文章目录一、集成学习1、基本概念2、回顾:误差的偏差-方差分解3、为什么集成学习有效？4、基学习器：“好而不同”5、集成学习的两个基本问题（1）如何训练出具有差异性的多个基学习器？（2）如何将多个基学习器的预测结果集成为最终的强学习器预测结果？二、自助法（Bagging）1、Bagging2、BootstrapBootstrap采样的数学性质3、Bagging:集成学习的两个基本问题（1）如何训练
图像分割技术的应用不要不开心了计算机视觉 dash python
今天的内容为：图像分割技术与应用，以下是内容总结1.图像分割概述图像分割是指预测目标的轮廓，将不同的像素划分到不同的类别，属于非常细粒度的分类任务。其应用场景广泛，包括人像抠图、医学组织提取、遥感图像分析、自动驾驶、材料图像分析等。2.图像分割的前景与背景-物体（Things）：可数的前景目标，如行人、车辆等。-事物（Stuff）：不可数的背景，如天空、草地、路面等。3.图像分割的三层境界-语义分
【开题报告+论文+源码】基于SpringBoot+Vue的社区团购配送系统编程毕设 spring boot 后端 java
项目背景与意义随着社会的进步和收入的提高，消费者对购物体验有了更高的要求。他们希望获得更多样化的商品选择，更加便捷的购物方式，以及更加优质的售后服务。同时，越来越多的老年人开始关注健康饮食和食品质量。他们不再满足于传统的购物方式，而是希望通过更加方便的方式来获取更加安全和健康的食品。社区团购配送系统在满足用户日常生活需求的同时，也带来了许多便利和机遇。项目介绍本课程演示的是一款基于SpringBo
实战LLM强化学习——使用GRPO（DeepSeek R1出圈算法）大富大贵7 程序员知识储备1 程序员知识储备2 程序员知识储备3 经验分享
引言近年来，深度强化学习（DRL）已经成为解决复杂决策问题的一个强有力工具，尤其是在自然语言处理（NLP）领域的广泛应用。通过不断优化决策策略，DRL能在大量数据中学习最佳行为，尤其是大型语言模型（LLM）在任务中展现出的巨大潜力。然而，随着模型规模的扩大和任务复杂性的增加，传统的强化学习算法开始暴露出训练效率低、收敛速度慢等问题。为了解决这些挑战，DeepSeek公司提出了一个新的强化学习算法—
混合整数非线性规划的松弛与分解方法 Waiyuet Fung 混合整数非线性规划松弛方法分解技术启发式算法全局优化
背景简介混合整数非线性规划（MINLPs）作为运筹学中的一个重要领域，涉及到优化问题的连续和离散变量混合，在工程设计、生产调度、资源分配等多个领域发挥着关键作用。本书由I.Nowak撰写，旨在深入探讨这一复杂的优化问题及其解决方案。MINLPs基础概念在本书的第一部分，Nowak介绍了MINLPs的基本概念。MINLPs的目标是寻找一组连续和整数变量的最优组合，以最小化或最大化某个非线性目标函数。
[0482]基于JAVA的养老服务监控智慧管理系统的设计与实现阿鑫学长【毕设工场】 java 人工智能大数据毕业设计课程设计
毕业设计（论文）开题报告表姓名学院专业班级题目基于JAVA的养老服务监控智慧管理系统的设计与实现指导老师（一）选题的背景和意义选题背景与意义：随着全球社会老龄化的不断加剧，养老服务的信息化、智能化转型已成为必然趋势。我国作为世界上老年人口最多的国家，面临着巨大的养老压力和挑战，如何高效、科学地管理和优化养老服务资源，保障老年群体的生活质量及健康安全，是当前社会亟待解决的重要课题。基于此现实背景，设
基于传感器数据的城市空气质量预测与污染源分类云端.代码农夫CloudFarmer 分类数据挖掘人工智能
项目名称：基于传感器数据的城市空气质量预测与污染源分类创新点：结合时间序列预测（回归）与污染源分类（多标签分类），使用公开API获取实时数据。项目目标预测未来6小时的空气质量指数（AQI）。根据传感器数据判断可能的污染源类型（如工业排放、交通尾气、扬尘等）。数据集来源数据获取：通过开放API实时抓取（如OpenAQ、AirNow或国内公开的城市空气质量平台）。特征示例：PM2.5、PM10、SO2
一文搞懂大数据神器Spark，真的太牛了！ qq_23519469 大数据 spark 分布式
Spark是什么在如今这个大数据时代，数据量呈爆炸式增长，传统的数据处理方式已经难以满足需求。就拿电商平台来说，每天产生的交易数据、用户浏览数据、评论数据等，数量巨大且种类繁多。假如要对这些数据进行分析，比如分析用户的购买行为，找出最受欢迎的商品，预测未来的销售趋势等，用普通的单机处理方式，可能需要花费很长时间，甚至根本无法完成。这时，Spark就应运而生了。Spark是一个开源的、基于内存计算的
使用Deepseek书写一篇综述论文，如何提示？学术乙方小知识经验分享
使用DeepSeek撰写综述论文时，可以通过以下提示和步骤来高效完成任务：明确研究主题与范围在开始撰写之前，首先需要明确研究主题、文献综述的时间跨度、地理范畴和文献类型。这有助于聚焦研究方向，避免偏离主题。制定详细的提示词提示词的设计是高效利用DeepSeek的关键。可以参考以下模板：研究背景与现状：请帮我梳理XXX领域的研究背景与现状，包括国内外的主要研究成果和研究热点。文献筛选与阅读：请帮我筛
文本纠错（Text Correction） dundunmm 人工智能数据挖掘文本纠错人工智能数据挖掘文本纠错深度学习
文本纠错（TextCorrection）是自然语言处理（NLP）中的一个重要任务，旨在自动检测并修正文本中的错误，包括拼写、语法、语义等层面的错误。其核心目标是通过算法模型将错误文本转换为符合语言规范的表达。该任务在自动写作辅助、搜索引擎优化、智能客服、教育等多个领域具有广泛应用。输入：包含错误的原始文本（如“我明天要去北京，希望天汽好。”）输出：修正后的规范文本（如“我明天要去北京，希望天气好。
使用CharacterTextSplitter实现文本按字符拆分 bavDHAUO python
在文本处理任务中，按字符进行拆分是一种简单且有效的方法。本篇文章将介绍如何使用CharacterTextSplitter类对文本进行按字符拆分，并生成适用于下游任务的LangChainDocument对象。技术背景介绍文本拆分是自然语言处理（NLP）中的一个基础步骤，尤其在大文本分块处理、文本摘要等任务中。CharacterTextSplitter是langchain-text-splitters
代码逐行解析 | 教你在C++中使用深度学习提取特征点 3Ｄ视觉工坊 3D视觉从入门到精通 c++深度学习开发语言人工智能
点击下方卡片，关注「3D视觉工坊」公众号选择星标，干货第一时间送达扫描下方二维码，加入3D视觉技术星球，星球内汇集了众多3D视觉实战问题，以及各个模块的学习资料：最新顶会论文、书籍、源码、视频（近20门系统课程[星球成员可免费学习]）等。想要入门3D视觉、做项目、搞科研，就加入我们吧。作者：泡椒味的口香糖|来源：3DCV添加微信：dddvision
2025年毕设ssm校园二手交易平台论文+源码锦程学长--毕设程序课程设计
本系统（程序+源码）带文档lw万字以上文末可获取一份本项目的java源码和数据库参考。系统程序文件列表开题报告内容选题背景关于校园二手交易平台的研究，现有成果多集中于社会综合型平台（如闲鱼、转转）的商业模式分析，或理论层面的共享经济模型探讨，而针对高校场景特殊性（如用户密度高、交易标的额小、社交属性强）的垂直型平台研究存在明显缺口。当前高校内二手交易多依赖社群、论坛等分散渠道，存在信息不对称、交易
【产品小白】什么是AI产品经理百事不可口y 产品经理的一步一步人工智能产品经理学习产品运营内容运营用户运营
一、AI产品经理的定义与角色定位AI产品经理是人工智能技术与商业应用之间的核心桥梁，负责将复杂的AI技术转化为满足市场需求的产品。需同时具备技术理解力、商业洞察力和用户思维，既要参与算法选型与数据建模，又要定义产品功能与市场策略，是贯穿产品全生命周期的关键角色。与传统互联网产品经理相比，AI产品经理的独特之处在于：技术深度参与：需理解机器学习、自然语言处理（NLP）、计算机视觉等技术原理，并参与数
人工智能（AI）系统化学习路线 xiaoyu❅ python 人工智能学习
一、为什么需要系统化学习AI？人工智能技术正在重塑各行各业，但许多初学者容易陷入误区：❌盲目跟风：直接学习TensorFlow/PyTorch，忽视数学与算法基础。❌纸上谈兵：只看理论不写代码，无法解决实际问题。❌方向模糊：对CV/NLP/RL等细分领域缺乏认知，难以针对性提升。正确的学习姿势：“金字塔式”分层学习（理论→算法→框架→应用→工程化），逐步构建完整的AI知识体系。二、人工智能学习路线
NLP高频面试题（三）——普通RNN的梯度消失和梯度爆炸问题 Chaos_Wang_ NLP常见面试题自然语言处理 rnn 人工智能
普通RNN（循环神经网络）的梯度消失和梯度爆炸问题是指在训练深层或长序列的RNN模型时出现的两种典型问题：一、梯度消失（VanishingGradient）梯度消失是指在反向传播过程中，梯度逐层传播时变得越来越小，最终趋于接近0，导致模型前层的参数难以更新。原因：在反向传播时，每一层的梯度是通过链式法则计算得到的。因为链式求导中不断乘以一个较小的数值（小于1），随着层数或时间步的增加，梯度将指数级
html 周华华 html
js 1，数组的排列 var arr=[1,4,234,43,52,]; for(var x=0;x<arr.length;x++){ for(var y=x-1;y<arr.length;y++){ if(arr[x]<arr[y]){ &
【Struts2 四】Struts2拦截器 bit1129 struts2拦截器
Struts2框架是基于拦截器实现的，可以对某个Action进行拦截，然后某些逻辑处理，拦截器相当于AOP里面的环绕通知，即在Action方法的执行之前和之后根据需要添加相应的逻辑。事实上，即使struts.xml没有任何关于拦截器的配置，Struts2也会为我们添加一组默认的拦截器，最常见的是，请求参数自动绑定到Action对应的字段上。 Struts2中自定义拦截器的步骤是：
make:cc 命令未找到解决方法 daizj linux 命令未知 make cc
安装rz sz程序时，报下面错误： [root@slave2 src]# make posix cc -O -DPOSIX -DMD=2 rz.c -o rz make: cc：命令未找到 make: *** [posix] 错误 127 系统：centos 6.6 环境：虚拟机错误原因：系统未安装gcc，这个是由于在安
Oracle之Job应用周凡杨 oracle job
最近写服务，服务上线后，需要写一个定时执行的SQL脚本，清理并更新数据库表里的数据，应用到了Oracle 的 Job的相关知识。在此总结一下。一：查看相关job信息 1、相关视图 dba_jobs all_jobs user_jobs dba_jobs_running 包含正在运行
多线程机制朱辉辉33 多线程
转至http://blog.csdn.net/lj70024/archive/2010/04/06/5455790.aspx 程序、进程和线程：程序是一段静态的代码，它是应用程序执行的蓝本。进程是程序的一次动态执行过程，它对应了从代码加载、执行至执行完毕的一个完整过程，这个过程也是进程本身从产生、发展至消亡的过程。线程是比进程更小的单位，一个进程执行过程中可以产生多个线程，每个线程有自身的
web报表工具FineReport使用中遇到的常见报错及解决办法（一）老A不折腾 web报表 finereport java报表报表工具
FineReport使用中遇到的常见报错及解决办法（一）这里写点抛砖引玉，希望大家能把自己整理的问题及解决方法晾出来，Mark一下，利人利己。出现问题先搜一下文档上有没有，再看看度娘有没有，再看看论坛有没有。有报错要看日志。下面简单罗列下常见的问题，大多文档上都有提到的。 1、address pool is full：含义：地址池满，连接数超过并发数上
mysql rpm安装后没有my.cnf 林鹤霄没有my.cnf
Linux下用rpm包安装的MySQL是不会安装/etc/my.cnf文件的，至于为什么没有这个文件而MySQL却也能正常启动和作用，在这儿有两个说法，第一种说法，my.cnf只是MySQL启动时的一个参数文件，可以没有它，这时MySQL会用内置的默认参数启动，第二种说法，MySQL在启动时自动使用/usr/share/mysql目录下的my-medium.cnf文件，这种说法仅限于r
Kindle Fire HDX root并安装谷歌服务框架之后仍无法登陆谷歌账号的问题 aigo root
原文：http://kindlefireforkid.com/how-to-setup-a-google-account-on-amazon-fire-tablet/ Step 4: Run ADB command from your PC On the PC, you need install Amazon Fire ADB driver and instal
javascript 中var提升的典型实例 alxw4616 JavaScript
// 刚刚在书上看到的一个小问题,很有意思.大家一起思考下吧 myname = 'global'; var fn = function () { console.log(myname); // undefined var myname = 'local'; console.log(myname); // local }; fn() // 上述代码实际上等同于以下代码 m
定时器和获取时间的使用百合不是茶时间的转换定时器
定时器:定时创建任务在游戏设计的时候用的比较多 Timer();定时器 TImerTask();Timer的子类由 Timer 安排为一次执行或重复执行的任务。定时器类Timer在java.util包中。使用时，先实例化，然后使用实例的schedule(TimerTask task, long delay)方法，设定
JDK1.5 Queue bijian1013 java thread java多线程 Queue
JDK1.5 Queue LinkedList： LinkedList不是同步的。如果多个线程同时访问列表，而其中至少一个线程从结构上修改了该列表，则它必须保持外部同步。（结构修改指添加或删除一个或多个元素的任何操作；仅设置元素的值不是结构修改。）这一般通过对自然封装该列表的对象进行同步操作来完成。如果不存在这样的对象，则应该使用 Collections.synchronizedList 方
http认证原理和https bijian1013 http https
一.基础介绍在URL前加https://前缀表明是用SSL加密的。你的电脑与服务器之间收发的信息传输将更加安全。 Web服务器启用SSL需要获得一个服务器证书并将该证书与要使用SSL的服务器绑定。 http和https使用的是完全不同的连接方式，用的端口也不一样,前者是80，后
【Java范型五】范型继承 bit1129 java
定义如下一个抽象的范型类，其中定义了两个范型参数，T1，T2 package com.tom.lang.generics; public abstract class SuperGenerics<T1, T2> { private T1 t1; private T2 t2; public abstract void doIt(T
【Nginx六】nginx.conf常用指令(Directive) bit1129 Directive
1. worker_processes 8; 表示Nginx将启动8个工作者进程，通过ps -ef|grep nginx,会发现有8个Nginx Worker Process在运行 nobody 53879 118449 0 Apr22 ? 00:26:15 nginx: worker process
lua 遍历Header头部 ronin47 lua header 遍历　
local headers = ngx.req.get_headers() ngx.say("headers begin", "<br/>") ngx.say("Host : ", he
java-32.通过交换a,b中的元素，使[序列a元素的和]与[序列b元素的和]之间的差最小(两数组的差最小)。 bylijinnan java
import java.util.Arrays; public class MinSumASumB { /** * Q32.有两个序列a,b，大小都为n,序列元素的值任意整数，无序. * * 要求：通过交换a,b中的元素，使[序列a元素的和]与[序列b元素的和]之间的差最小。 * 例如: * int[] a = {100,99,98,1,2,3
redis 开窍的石头 redis
在redis的redis.conf配置文件中找到# requirepass foobared 把它替换成requirepass 12356789 后边的12356789就是你的密码打开redis客户端输入config get requirepass 返回 redis 127.0.0.1:6379> config get requirepass 1) "require
[JAVA图像与图形]现有的GPU架构支持JAVA语言吗？ comsci java语言
无论是opengl还是cuda，都是建立在C语言体系架构基础上的，在未来，图像图形处理业务快速发展，相关领域市场不断扩大的情况下，我们JAVA语言系统怎么从这么庞大，且还在不断扩大的市场上分到一块蛋糕，是值得每个JAVAER认真思考和行动的事情
安装ubuntu14.04登录后花屏了怎么办 cuiyadll ubuntu
这个情况，一般属于显卡驱动问题。可以先尝试安装显卡的官方闭源驱动。按键盘三个键：CTRL + ALT + F1 进入终端，输入用户名和密码登录终端：安装amd的显卡驱动 sudo apt-get install fglrx 安装nvidia显卡驱动 sudo ap
SSL 与数字证书的基本概念和工作原理 darrenzhu 加密 ssl 证书密钥签名
SSL 与数字证书的基本概念和工作原理 http://www.linuxde.net/2012/03/8301.html SSL握手协议的目的是或最终结果是让客户端和服务器拥有一个共同的密钥，握手协议本身是基于非对称加密机制的，之后就使用共同的密钥基于对称加密机制进行信息交换。 http://www.ibm.com/developerworks/cn/webspher
Ubuntu设置ip的步骤 dcj3sjt126com ubuntu
在单位的一台机器完全装了Ubuntu Server，但回家只能在XP上VM一个，装的时候网卡是DHCP的，用ifconfig查了一下ip是192.168.92.128,可以ping通。转载不是错： Ubuntu命令行修改网络配置方法 /etc/network/interfaces打开后里面可设置DHCP或手动设置静态ip。前面auto eth0，让网卡开机自动挂载. 1. 以D
php包管理工具推荐 dcj3sjt126com PHP Composer
http://www.phpcomposer.com/ Composer是 PHP 用来管理依赖（dependency）关系的工具。你可以在自己的项目中声明所依赖的外部工具库（libraries），Composer 会帮你安装这些依赖的库文件。中文文档入门指南下载安装包列表 Composer 中国镜像
Gson使用四（TypeAdapter） eksliang json gson Gson自定义转换器 gsonTypeAdapter
转载请出自出处：http://eksliang.iteye.com/blog/2175595 一.概述 Gson的TypeAapter可以理解成自定义序列化和返序列化二、应用场景举例例如我们通常去注册时（那些外国网站），会让我们输入firstName，lastName,但是转到我们都
JQM控件之Navbar和Tabs gundumw100 html xml css
在JQM中使用导航栏Navbar是简单的。只需要将data-role="navbar"赋给div即可： <div data-role="navbar"> <ul> <li><a href="#" class="ui-btn-active&qu
利用归并排序算法对大文件进行排序 iwindyforest java 归并排序大文件分治法 Merge sort
归并排序算法介绍，请参照Wikipeida zh.wikipedia.org/wiki/%E5%BD%92%E5%B9%B6%E6%8E%92%E5%BA%8F 基本思想：大文件分割成行数相等的两个子文件，递归（归并排序）两个子文件，直到递归到分割成的子文件低于限制行数低于限制行数的子文件直接排序两个排序好的子文件归并到父文件直到最后所有排序好的父文件归并到输入
iOS UIWebView URL拦截啸笑天 UIWebView
本文译者：candeladiao，原文：URL filtering for UIWebView on the iPhone说明：译者在做app开发时，因为页面的javascript文件比较大导致加载速度很慢，所以想把javascript文件打包在app里，当UIWebView需要加载该脚本时就从app本地读取，但UIWebView并不支持加载本地资源。最后从下文中找到了解决方法，第一次翻译，难免有
索引的碎片整理SQL语句 macroli sql
SET NOCOUNT ON DECLARE @tablename VARCHAR (128) DECLARE @execstr VARCHAR (255) DECLARE @objectid INT DECLARE @indexid INT DECLARE @frag DECIMAL DECLARE @maxfrag DECIMAL --设置最大允许的碎片数量,超过则对索引进行碎片
Angularjs同步操作http请求with $promise qiaolevip 每天进步一点点学习永无止境 AngularJS 纵观千象
// Define a factory app.factory('profilePromise', ['$q', 'AccountService', function($q, AccountService) { var deferred = $q.defer(); AccountService.getProfile().then(function(res) {
hibernate联合查询问题 sxj19881213 sql Hibernate HQL 联合查询
最近在用hibernate做项目，遇到了联合查询的问题，以及联合查询中的N+1问题。针对无外键关联的联合查询，我做了HQL和SQL的实验，希望能帮助到大家。（我使用的版本是hibernate3.3.2） 1 几个常识：（1）hql中的几种join查询，只有在外键关联、并且作了相应配置时才能使用。（2）hql的默认查询策略，在进行联合查询时，会产
struts2.xml wuai struts
<?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTD Struts Configuration 2.3//EN" "http://struts.apache