挚爱FXJ

课程向：深度学习与人类语言处理 ——李宏毅，2020 (P26)

Constituency Parsing

李宏毅老师2020新课深度学习与人类语言处理课程主页：
http://speech.ee.ntu.edu.tw/~tlkagk/courses_DLHLP20.html
视频链接地址：
https://www.bilibili.com/video/BV1RE411g7rQ
图片均截自课程PPT、且已得到李宏毅老师的许可:)

考虑到部分英文术语的不易理解性，因此笔记尽可能在标题后加中文辅助理解，虽然这样看起来会乱一些，但更好读者理解，以及文章内部较少使用英文术语或者即使用英文也会加中文注释，望见谅

深度学习与人类语言处理 P26 系列文章目录

Constituency Parsing
前言
I Constituency Parsing 成分句法分析
- 1.1 Constituent 组成成分
- 1.2 Labels 组成成分的类别
- 1.3 Training targets 训练目标
II Approach 解法
- 2.1 Chart-based Approach 基于图的方法
- - 2.1.1 Task abstraction 任务抽象化
  - 2.1.2 Classifier 分类器
  - 2.1.3 Problem 问题
  - 2.1.4 Inference 测试
- 2.2 Transition-based Approach 基于转变的方法
- - 2.2.1 Modules 模块
  - 2.2.2 Example 例子
  - 2.2.3 RNN Grammar 一种深度学习模型决定命令
  - 2.2.4 RNN Grammar training 训练方式
  - 2.2.5 Grammar as a Foreign Language 将语法视为一种语言

前言

在前一篇的上半篇中(P25)我们讲解了 Multilingual BERT，多语种BERT的神奇之处，零样本学习的跨语言学习能力以及有关猜想和实验。

而在本篇P26 和下一篇P27，我们将进入 Parsing 句法分析，
在本篇P26中将讲解
Constituency Parsing 成分句法分析：把句子组织成短语的形式
在下一篇P27中将讲解
Dependency Parsing 依存句法分析：找出句子中词的依赖关系

本篇 Constituency Parsing 成分句法分析将讲解任务的基本概念、训练目标以及常用的两种解法，和深度学习在这些解法中的使用。

I Constituency Parsing 成分句法分析

1.1 Constituent 组成成分

Constituency Parsing 成分句法分析，是指判断句中某一些连续片段spans是不是一个 constituent 组成成分，以及这个组成成分是什么类别。

在此，你可以将 constituent 组成成分理解为一个单位，某些词汇组合在一起可以构成一个单位，这个单位就是组成成分。举例来说，如上图，“deep learning is very powerful” 一句中有这样的组成成分：
”deep learning“ 是一个组成成分 NP 名词，
”very powerful“ 是一个组成成分 ADJP 形容词，
而”learning is very“ 不是一个组成成分。

1.2 Labels 组成成分的类别

有关constituent 组成成分的类别可参考上图，如”ADJP“ 代表形容词短语；”ADVP“代表副词短语；”NP“代表名词短语；”PP“代表”介词短语“；”S“代表一个子句等等…

1.3 Training targets 训练目标

Constituency Parsing 成分句法分析要解决的问题是，如上图，给出一个句子，我们要找出句子中所有能够构组成成分的词汇段，以及该组成成分是哪个类别。把这些组成成分放在一起，便可得到这个句子的一个成分句法树，根节点是整个句子s，叶子是句中的每个词，左右子树的顶点是这棵树是一个组成成分以及其类别。

注：本课中仅考虑二叉树，其实每个顶点可以分出多个分支，有多个叶子。且我们主要关注deep learning怎么应用到成分句法分析上，因此忽略了语言学角度的专业知识等。

简而言之，成分句法分析的训练目标是：
任务一：找出句中所有的constituent 组成成分
任务二：给每一个constituent 组成成分一个类别标签

那上述问题，该怎么解呢？

II Approach 解法

有关上述问题的方法主要有两大类的解法：
Chart-based Approach 基于图的方法和 Transition-based Approach 基于转变的方法

2.1 Chart-based Approach 基于图的方法

2.1.1 Task abstraction 任务抽象化

这种方法其实是由 CKY chart parsing的方法演化而来， Chart-based Approach 方法简单来讲就是训练一个二分类器和多分类器：
二分类器输入一个词汇段，判断它是否是一个constituent 组成成分
如果它是一个组成成分，多分类器输入该组成成分，即词汇段，输出该组成成分的类别，如”ADJP“形容词短语等等

此时，任务一：找出句中所有的constituent 组成成分，就变成了一个二分类任务；任务二：给每一个constituent 组成成分一个类别标签，就变成了一个多分类任务。

2.1.2 Classifier 分类器

这个 Classifier 分类器，如上图：
首先，输入一串tokens序列，通过预训练模型ELMO、BERT等对其编码，得到序列中每个token的词向量表示。
然后，选出你想要判断的词汇段span，用一个Span Feature Extraction 将这一个词汇段的词向量序列抽取为一个向量表示。
最后，对这个向量进行分类判断，首先判断这个向量是否是一个组成成分，如果是，再进行多分类找出它的类别。

2.1.3 Problem 问题

但是如果仅仅按照上述2.1.2的训练方式去训练的话，可能会出现这样的一个问题：
我们会对由N个tokens组成的序列，进行每一段的穷举，一共会穷举得到 $\frac{N(N-1)}{2}$ 个词汇段，并进行一一分类判断。此时，在某些片段的判断中可能出现的问题，如上图，我们的分类器并不是完美的，两个词汇段都被判断为是一个组成成分，但这两个词汇段是有交集的，而在句法分析上显然是没有有交集的组成成分，这是组不成一棵树的。

2.1.4 Inference 测试

为了避免上述问题，实际上，在测试时，我们是按照上图方式使用分类器的

给我们一个句子，我们会先穷举出所有的合理合法的树状结构，如上图，对”I am good“ 有两种可能的树状结构，用我们训练好的分类器对这两种树状结构进行分类判断输出，树中每颗子树是组成成分的分数。

对于第一种树，”I am“分数为0.1，”I am good“分数为0.9，第一棵树的分数便为0.1+0.9=1

对于第二种树，”am good“分数为0.8，”I am good“分数为0.9，第二棵树的分数便为0.8+0.9=1.7

因此，第二棵树更有可能是正确的树状结构，因此我们的输出也就是第二棵树的树状结构作为这个句子的成分句法树。

疑问解答：
Q：那我们该怎么穷举所有可能的树状结构呢？
A：这个时候就需要用到 CKY算法，一种动态规划算法。

Q：那我们该怎么训练呢？测试时是直接考虑整棵树的分数，而不是之前讲的单纯的分类，这样不就会导致训练和测试的不匹配了吗？
A：其实在训练的时候并不是简单的分类任务，它的训练目标是很复杂的，简而言之，会给正确的树一个最高的分数，一个错误的树较低的分数。

2.2 Transition-based Approach 基于转变的方法

除了上述Chart-based Approach 基于图的方法外，还有第二种解法：Transition-based Approach 基于转变的方法，这种方法类似于数据结构中的队列一样，通过各种命令来还原替代原队列。

2.2.1 Modules 模块

对于成分句法分析任务而言，其实我们要做的就是输入一串文字序列，输出表示这串文字序列的成分句法树，而这棵树形式上也是一串序列，因此有这样一种方法尝试用三种命令组成的序列来代替这棵树。

Transition-based Approach 基于转变的方法，如上图，主要由三个模块组成：

Stack 栈；
Buffer 缓存区；
Actions 命令；

在操作开始，Stack 栈为空，Buffer 缓存区保存着输入的文字序列，Actions 命令由三个具体命令组成：

CREATE（X）：创造一个组成成分X，这个X便是组成成分的类别，如“ADJP”形容词短语、“S”子句等等，全部类别请见本篇中 1.2 Labels 组成成分的类别
SHIFT ：从Buffer 缓存区取一个token放到 Stack 栈中
REDUCE：一个组成成分已生成结束，结束该组成成分的产生，是一个组成成分的结束符

上述描述可能有点抽象，让我们来看一个具体的例子

2.2.2 Example 例子

假如我们要对”deep learning is vert powerful“进行成分句法分析：
首先，对于 Stack 栈而言，它为空。对于 Buffer 缓存区而言，它由“deep，learning，is，vert，powerful”组成，是一个列表。对于Action命令，它始终由上述三个命令组成：CREATE、SHIFT、REDUCE。
接下来，命令CREATE （S），代表开始生成句子，这是成分句法分析的初始字符，并把这个(S放到 Stack 栈里面。再针对Stack 栈和 Buffer 缓存区进行操作，CREATE （NP）代表我们要创建一个名词短语，同样把（NP放到Stack 栈里。
然后，根据Buffer 缓存区里的值，得到命令：SHIFT，代表要将Buffer里的一个值放到栈里，即deep，同样再来一个SHIFT代表要将learning放到栈里。此时这个 NP 名词短语已经读入完成，将）放到栈中表示该名词短语读入结束。
同样，命令CREATE （VP），将（VP 放入栈中，代表开始产生动词短语，与上面同样的操作直至动词短语读入结束。
最后，经过上述操作后，记录下我们所使用的命令，我们的输入句“deep learning is vert powerful”的成分句法分析就可以变成一个由三种命令组成的序列，这个命令序列便是代表该句的成分句法分析的结果。

如果你还是没懂，你可以这样理解，“deep learning is vert powerful”的句法分析结果我们是知道的，那怎么用一串序列来表示这个结果呢？其实表示方法也是有很多种的，上述只是其中一种方法。

在我们可以通过命令序列表示这个成分句法分析结果后，我们便可以把这个成分句法分析任务抽象化为seq2seq问题，输入一串文字序列，输出一串命令序列。

那么Transition-based Approach 基于转变的方法的重点就是怎么决定何时要采取哪一种Action，如果不用基于规则的方法，我们显然需要一个用深度学习的模型来解决这个问题。

2.2.3 RNN Grammar 一种深度学习模型决定命令

RNN Grammar 用RNN来决定何时采取哪一个命令，我们分别用RNN读取 Stack 栈和 Buffer 缓存区，以及之前采取过的命令也用RNN读过去，RNN都把最后一层的输出拿出来丢给一个网络，最终由这个网路来决定采取哪一个命令。

在此，你可能会觉得这种采取何种命令的训练方式应该会需要用到RL强化学习的方式去训练，其实不然，我们并不需要强化学习的方法。

2.2.4 RNN Grammar training 训练方式

因为我们在训练时，是已经有正确答案了，我们知道在每一个状况下应该要采取什么命令才是对的，其实这仅仅是个不断进行多分类的任务而已。

2.2.5 Grammar as a Foreign Language 将语法视为一种语言

还有另外一种方法， Grammar as a Foreign Language 将语法视为一种语言的方法，老师将这种方法也归结为 Transition-based Approach 基于转变的方法，两者大同小异，只是讲法略有不同而已。这个方法就是直接用一个seq2seq模型”硬train一发“，把这种成分句法分析任务当作翻译任务来做。而为什么是翻译任务，因为在15年seq2seq模型主要还是应用于翻译上，也因此取了上图的论文题目。

这种方法将树状结构表示成序列语言方法如上图，当然，这也是表示树的一种方法。

这种表示法的原则是从上到下，从左及右：
首先，对最上面的根节点S处理，表示为(S
之后，对根节点S的左子树NP处理，表示为（NP。同样在左子树NP中，对左叶子deep处理，表示为deep。对右叶子learning处理，表示为learning。左子树NP处理完成后，以）为结束。
然后，对根节点S的右子树VP处理，表示为（VP。同样在右子树VP中，对左叶子is处理，表示为is。对VP的右子树ADJV处理，表示为（ADJV。对右子树ADJV的左叶子very处理，表示为very。对右子树ADJV的右叶子powerful处理，表示为powerful。VP的右子树ADJV处理完毕，以）为结束。对根节点S的右子树VP处理完毕，以）为结束。
最后，根节点处理完毕，以）为结束。

上述表示结束后，就得到了如上图所示的这串序列语言。此时，我们仅仅需要一个seq2seq模型将成分句法分析想成翻译任务解决即可。

其实这种seq2seq想法和上面的RNN Grammar方法没有什么不同，都是一一对应处理的序列问题，只是说法略有不同。值得注意的是，这种seq2seq方法并不会出现成分序列不全的现象，就是说会不会出现生成的）少了一个这类的问题，实验上表明98%的可能性是不会的。

至此，句法分析其中的一种成分句法分析，把句子组织成短语的形式的有关内容到底结束。下一篇将讲解句法分析的另一部分，依存句法分析：找出句子中词的依赖关系。

这也是一种爱财商思维学习
昏暗的灯火下一对父子正在吃饭，安静的饭桌上父亲面无表情，静静地吃着碗里的饭。儿子小心翼翼地观察着自己的父亲，不远处的书包里静静地躺着这次测验的卷子，79分的卷子既不能算好也不算太差，但是对一向成绩优秀的儿子来说就有点失水准了。“这次成绩怎么样了？”良久，沉默是金的父亲终于发话了。“7……79分。”无法从父亲的语气中感受到任何的感情的儿子小心回答了父亲的疑问，并紧紧盯着父亲好像磐石般坚毅的脸。没有表
2023-06-03 Eltonpeople
今日启发：Elton:《兰花与蒲公英》(Ⅲ)[美]W.托马斯·博伊斯人类大脑内的两大主要应激神经系统：皮质醇系统和战斗-逃跑系统。皮质醇系统当人感受到压力之后，脑垂体会分泌促肾上腺皮质激素，然后促肾上腺皮质激素顺着血液流到肾上腺，肾上腺再分泌出皮质醇。皮质醇这种物质会提高血糖、血压，当血糖升高的时候，抵达脑部的养分也会增加，有利于我们思考，而血压升高的时候，心脏向身体各处泵氧的能力也增加了，有利于
2—21天听课打卡第13天郭小郭0830
[课程分享]如何才能收获浓浓的亲子情感（邰秀芬）父母是父母，老师才是老师。帮助孩子和老师合理的解决不良行为表现。三步处理法1，老师说我们说得对呀。‘我们’有妈妈有宝宝。距离与孩子拉近了2，你看我们上课的时候，没有注意听的话我们在做什么呢？作业就不会写，老师就会着急，就会批评我们？妈妈就会难受，宝宝也不开心……引导情景3，探讨说起自己小时候的经历发现问题，帮助孩子去解决，共同探讨方法沟通方法。拒绝利
网课感想我的耗子跑掉了ei
这是我大学的第一个寒假，本来有好多计划的，没想到一场灾难从天而降，打乱了所有人的计划，开学也因此延期了。而我也实现了我曾经最想实现的梦想—在床上上课。高中时不知道说了多少次想把床搬到教室里上，没想到还真能在床上上课。说起网课我还是蛮期待的，从来没有上过，也很好奇，我朋友高三，她早就开始上课了，感觉挺轻松的，她们是在腾讯课堂里上，是直播，我们是在学习通里看老师们安排的课程，这和我想的有点出入，不过仔
自然的启示陌上繁花江南落
文/杜丽敏自然神秘莫测,一花一草,一树一叶总代给人们无限遐想,引发无数文人热议;陶渊明说:木欣欣以向荣,泉涓涓而始流.,他从自然繁荣滋长的景象中感叹时光的流逝,人生的短暂.总之,人们从大自然中获得了许许多多的真理,给予人们生活,学习以重大的影响.从屋檐下滴落的，经过长年累月的拍打，能够穿破坚硬的石头；古人从这简单的自然现象中感悟到了一个道理：做事要有持之以恒，坚持不懈的精神，不要轻易放弃；从月的圆
犀水家族办公室理财入门课程七：为什么我的基金一买进去就亏？犀水家族办公室
嗨大家好，老宋又来了，今天我们聊得深入一点，我们只聊一个问题，为什么你的基金一买就亏。很多小伙伴很爱学习，又是买书又是百度又是看视频，学习了很多筛选基金的办法，这指标那指标，什么三个月、半年、三年表现，阿尔法、贝塔一起上，自己在电脑面前精挑细选了一只基金，满怀希望买进去，结果一买进去就蹭蹭蹭下跌？是我智商有问题？其实乱买基金就是自己往火坑里面跳！什么？个股到处是坑，基金也有坑？大了去了，以前没听说
【周检视】20200824迎来72变的相聚口腔护士小罗
引子：今年的72变的相聚，我提早一个月告知是安排在8月19日，提早邀请陈老师来和我们讲一堂心理方面的课程，晚上8:00我们如约而至，并邀请到咖啡老师、桃子、江老师、静淑姐的朋友参加，静淑姐提供的场地太舒服了，陈老师和我们讲《改善亲子关系的秘诀》，全程大家都聚焦的陈老师的身子，陈老师讲得很精彩，也把大家提出的问题一一解答，当时的感觉又把我拉回了2015年和大家践行的90天，90天的每一个现场小组会都
实现大语言模型与应用的无缝对接 meslog 技术分享语言模型 microsoft 人工智能
在当今人工智能快速发展的时代，大语言模型（LLMs）已经成为众多应用的核心驱动力。然而，如何让这些强大的模型与各种数据源和工具进行有效集成，仍然是一个挑战。ModelContextProtocol（MCP）正是为解决这一问题而设计的开放协议，它标准化了应用程序如何向大语言模型提供上下文信息。本文将介绍MCP的基本概念，并通过C#SDK展示如何实现客户端和服务器端的交互。什么是MCP？ModelCo
VSCode使用Jupyter完整指南配置机器学习环境 z日火校招学习日记 vscode jupyter 机器学习
接下来开始机器学习部分第一步配置环境：VSCode使用Jupyter完整指南1.安装必要的扩展打开VSCode，按Ctrl+Shift+X打开扩展市场，搜索并安装以下扩展：必装扩展：Python(Microsoft官方)-Python语言支持Jupyter(Microsoft官方)-Jupyternotebook支持Pylance(Microsoft官方)-Python智能提示和语法检查推荐扩展：
CAN-位填充
位填充定义（BitStuffing）当CAN节点发送逻辑电平（显性dominant或隐性recessive）为持续相同的5位时，它必须添加一位反向电平。CAN接收节点会自动删除这个新增的额外电平位。位填充作用1---位填充是为了防止突发错误而设定的功能。当某一个节点发生主动错误时，将把总线拉低6个bit宽度的显性电平“0”，及时向总线上其他单元汇报错误。2---位填充是为了缩短从同步周期。重同步机
如何调整优化器的参数来优化神经网络性能？ Idividuals 深度学习神经网络机器学习 python scikit-learn
不同优化器有不同的可调整参数，下面以常见的优化器为例，讲解如何调整其参数来优化神经网络性能：Adam优化器Adam优化器有几个关键参数：learning_rate（学习率）、beta_1、beta_2和epsilon。1.学习率(learning_rate)-作用：控制每次参数更新的步长。学习率过大，模型可能无法收敛，在最优解附近振荡甚至发散；学习率过小，训练速度会非常缓慢。-调整方法：通常初始值
养老院管理系统基于SpringBoot的养老院管理系统系统设计与实现（源码+论文+部署讲解等）
博主介绍：✌全网粉丝60W+,csdn特邀作者、Java领域优质创作者、csdn/掘金/哔哩哔哩/知乎/道客/小红书等平台优质作者，计算机毕设实战导师，目前专注于大学生项目实战开发,讲解,毕业答疑辅导，欢迎高校老师/同行前辈交流合作✌技术栈范围：SpringBoot、Vue、SSM、Jsp、HLMT、Nodejs、Python、爬虫、数据可视化、小程序、安卓app、大数据、物联网、机器学习、单片机
普法资讯：冒名贷款导致名义贷款人征信不良，怎么办？静宁魏兴宁
兰州魏兴宁律师表示，如冒用他人名义在银行处贷款，导致名义贷款人征信不良，名义贷款人可向人民法院起诉，要求关联银行向中国人民银行申请更正中国人民银行征信系统中名义贷款人名下的不良征信记录。原告诉称：张某向法院提出诉讼请求：请求判令被告某银行立即逐级删除原告借款挂账未处理的信息，并恢复原状。事实与理由：原告因经济需要向银行申请贷款，谁料在被告处有未还借款18518元，导致原告无法申请他行贷款。原告于2
TCP 粘包/拆包的原因及解决方法青城楼主
avaNIO学习时，发现，如果客户端连续不断的向服务端发送数据包时，服务端接收的数据会出现两个数据包粘在一起的情况，这就是TCP协议中经常会遇到的粘包以及拆包的问题。发生TCP粘包或拆包有很多原因，现列出常见的几点，可能不全面，欢迎补充，1、要发送的数据大于TCP发送缓冲区剩余空间大小，将会发生拆包。2、待发送数据大于MSS（最大报文长度），TCP在传输前将进行拆包。3、要发送的数据小于TCP发送
GPT-4o mini TTS：领先的文本转语音技术桂花饼 AIGC GPT-4o o4-mini 语音识别人工智能 GPT-4o
什么是GPT-4ominiTTS？GPT-4ominiTTS是OpenAI推出的全新一代文本转语音（TTS）技术，能够以自然、流畅的方式将普通文本转换为语音。依托先进的神经网络架构，GPT-4ominiTTS在语音合成中避免了传统TTS的生硬与机械感，能够生成富有情感和个性化表达的高质量语音。该技术支持多语言与多口音，是视频、播客、电子学习等场景的理想选择。核心特点自然流畅，接近真人GPT-4om
知识直接转成金钱的地方芈月2号
昨天美股继续下跌，周四缩量下跌，高位股大面积下跌，注意风险控制仓位降低到五成，毕竟涨了400点，加上美丽国马上进入加息时间，有可能短期对市场造成影响，好的现象是北向资金连续加仓，大浪淘沙，国际原油大涨，化工板块涨价预期强烈有望启动重点关注湖北宜化，云天化，低位券商启动，重点光注中银证券，东方财富。国资委改革短线热点，重点关注宝胜股份。锂电池重点关注固态电池新技术的中线牛股国轩高科、西藏矿业五日线低
AI产品经理成长记《零号列车》第一集邂逅0XAI列车黑客思维者 AI产品经理养成人工智能 AI产品经理大模型智能体
《零号列车》绝非传统意义上的AI产品经理教程——它是我沉淀二十多年跨行业数字化转型与工业4.0实战经验后，首创的100集大型小说体培养指南。那些曾在千行百业验证过的知识与经验，不再是枯燥的文字堆砌，而是化作一场沉浸式的学习旅程。这里没有生硬的理论灌输，而是用跌宕起伏的故事情节，串联起AI技术的底层逻辑。你会跟着角色的脚步推进剧情，在不知不觉中吃透机器学习、大模型应用等专业概念；更有深入浅出的技术拆
人工智能时代下的数据新职业：新兴工作岗位版图研究司南锤 economics 人工智能
目录摘要第一章：AI驱动的数据价值链重构1.1从“沉睡金矿”到“流动的血液”：数据作为核心经济资产的激活1.2知识的新经济学：零边际成本革命1.3AI作为新的“操作系统”：重塑产业竞争格局第二章：基石层：数据准备与质量保障中的角色2.1数据标注与标签领导力：数据标注经理/主管2.2“地面真实”的守护者：AI数据质量专家第三章：技术核心层：构建AI与机器学习全生命周期的工程角色3.1AI生产线架构师
python集合常用函数 Lo-Y-eH python
Python集合是一种无序、可变且不重复的数据类型，常用于处理一组唯一的数据。下面是常用的Python集合函数及其用法：add()：向集合添加一个元素。s=set()s.add(1)s.add(2)s.add(3)print(s)#输出{1,2,3}clear()：移除集合中的所有元素。s=set([1,2,3])s.clear()print(s)#输出set()copy()：返回集合的一个浅拷贝
【开源推荐】AI-PROXY：一站式多厂商AI API代理网关，帮你解决因网络无法请求的问题
【开源推荐】AI-PROXY：一站式多厂商AIAPI代理网关，帮你解决因网络无法请求的问题在AI技术飞速发展的当下，开发者们往往需要与多家AI厂商的API进行交互，这不仅涉及到复杂的API管理，还可能面临网络限制和安全隐患。今天，我将向大家隆重推荐一款专为解决这些痛点而生的开源项目——AI-PROXY，体验地址：https://aceproxy.xyz。一、项目简介AI-PROXY是一款开箱即用的
创客匠人：你做了那么多内容，为什么用户一来就走？老蒋新思维创始人IP 内容运营知识变现知识付费
上周看到一条新闻让我陷入沉思OpenAI联合微软和美国教师联盟，投资超过2亿美元，培训40万名老师如何使用AI做教学设计、内容评估、互动反馈。很多教育工作者因此实现了效率大幅提升，甚至可以在一周内设计出完整的教学路径。可你有没有发现，同样的“AI+内容”的浪潮，正在逼近我们这些做知识付费的人。你可能花了几个月时间搭建课程体系，录了几十个视频，也做了海报、社群、预热活动。你说：“我真的很努力了。”但
Python领域制造业的Python应用 Python编程之道 Python编程之道 python 开发语言 ai
Python在制造业中的应用：从自动化到智能制造关键词：Python、制造业、工业自动化、数据分析、机器学习、物联网、智能制造摘要：本文深入探讨Python编程语言在制造业中的广泛应用。从基础的自动化脚本到复杂的智能制造系统，Python凭借其丰富的库生态系统和易用性，正在重塑现代制造业。我们将分析Python在制造业中的核心应用场景，包括设备监控、质量控制、预测性维护和供应链优化等，并通过实际案
【机器学习】探索未来科技的前沿：人工智能、机器学习与大模型 AIGC零基础入门小白 AI大模型大模型教程人工智能机器学习科技 AI大模型 AIGC AI教程大模型教程
文章目录引言一、人工智能：从概念到现实1.1人工智能的定义1.2人工智能的发展历史1.3人工智能的分类1.4人工智能的应用二、机器学习：人工智能的核心技术2.1机器学习的定义2.2机器学习的分类2.3机器学习的实现原理2.4机器学习的应用2.5机器学习的示例代码2.6解释代码三、大模型：推动AI前沿发展的关键技术3.1大模型的定义3.2大模型的发展历程3.3深度学习与神经网络3.4大模型的优势与挑
2018-06-02开始有计划的每天生活陳境墨
2018年6月2日星期六晴每日必做事：晨修念佛：完成五点听早课：在听掌门直播相关事项边准备早餐，今天易经课程没听跟音频读经典3样：跟读《伤寒论》《神农百草经》《难经》各一节诵读《无量寿经》：上卷看书：看《好妈妈胜过好老师》第168页到173页。看书心得：现在很多小学生做作业是为了老师，为了家长而做。作业是为了学会，巩固知识点而做的，但是现在很多老师会使用“暴力作业”，动不动就要抄几遍几遍。许多家长
基于YOLOv8的火灾智能检测系统设计与实现斟的是酒中桃深度学习人工智能 pyqt yolo
在各类安全事故中，火灾因其突发性强、破坏力大，一直是威胁人们生命财产安全的重大隐患。传统的火灾检测方式多依赖烟雾传感器、温度传感器等，存在响应滞后、易受环境干扰等问题。随着深度学习技术的飞速发展，基于计算机视觉的火灾检测方法凭借其实时性强、检测范围广等优势，逐渐成为研究热点。本文将简单介绍一款基于深度学习的火灾智能检测系统的设计与实现过程。一、系统整体设计本火灾智能检测系统旨在通过深度学习技术实现
人工智能入门指南：从基础概念到实际应用
前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站。https://www.captainbed.cn/north文章目录1.**人工智能的基本概念**1.1什么是人工智能？1.2人工智能的分类2.**人工智能的核心技术**2.1机器学习（MachineLearning）2.1.1机器学习的类型2.1.2机器学习流程2.2深度学习（DeepLearni
巜燃野少年的天空》观后感蓝色之光
很久没有去影院看电影了，闺蜜向姐头一天晚上就买好了票约我这次一定要陪她一起去看场电影。最主要的是为了让我开心，本不想出门，因为长沙的天热实在太热。但听到她的用心，毫不犹豫地第二天清晨就出门了。青春朝气活力梦想影片主要讲述了一群臭味相投的“咸鱼少年”和一群参差不齐的“杂草少女”打破偏见与隔阂、一起热舞的青春故事。让我印象最深刻感动的是剧中女主角小黄的爸爸，为了鼓励女儿跳舞编造了一个长达十八年的童话，
身无分文怎么快速搞到钱（分享3款身无分文怎么快速搞到钱的软件）帮忙赚赏金
身无分文怎么快速搞到钱（分享3款身无分文怎么快速搞到钱的软件）近年来，随着互联网的迅猛发展，越来越多的人开始关注如何在身无分文的情况下快速获得财富。虽然没有一劳永逸的钱财方法，但是借助一些创新的软件，我们或许能够找到一些有助于改善经济状况的途径。在本文中，我将向大家分享3款帮助身无分文快速搞到钱的软件，希望对大家有所帮助。第一款软件：“乐赚"“乐赚”是一款基于任务奖励的手机应用。使用该软件的用户可
Java与机器学习的邂逅：Weka框架入门指南墨夶 Java学习资料1 java 机器学习数据挖掘
在这个数据驱动的时代，机器学习已经成为各行业创新和优化的关键技术。而Java，作为一门成熟且广泛应用的编程语言，在企业级应用开发中占据着重要地位。将二者结合起来，利用Java实现机器学习算法，不仅可以充分发挥其强大的生态系统优势，还能为开发者提供一个高效、稳定的开发环境。今天，我们将带您走进Java与机器学习的世界，探索如何使用Weka这一著名的机器学习库来开启您的智能之旅。Weka简介及其优势什
（C++）list，vector，set，map四种容器的应用——教务管理系统（测试版）（list基础教程）（vector基础教程）（set基础教程）（map基础教程）（STL库教程）双叶836 STL C++C++基础教学 C++项目 c++list 开发语言数据结构 c语言
目录源代码：代码详解：第1步：搭建基础框架和数据结构目标：定义数据结构和全局容器练习任务：第2步：实现学生管理功能（使用map）目标：添加学生和显示学生列表练习任务：第3步：实现课程管理功能（使用vector）目标：添加课程和显示课程列表练习任务：第4步：实现选课功能（使用list）目标：学生选课和退课功能练习任务：主函数：多说一点（重点代码解释）：一.list>enrollments;代码详解1
插入表主键冲突做更新 a-john
有以下场景：用户下了一个订单，订单内的内容较多，且来自多表，首次下单的时候，内容可能会不全（部分内容不是必须，出现有些表根本就没有没有该订单的值）。在以后更改订单时，有些内容会更改，有些内容会新增。问题：如果在sql语句中执行update操作，在没有数据的表中会出错。如果在逻辑代码中先做查询，查询结果有做更新，没有做插入，这样会将代码复杂化。解决： mysql中提供了一个sql语
Android xml资源文件中@、@android:type、@*、？、@+含义和区别 Cb123456 @+@?@*
一.@代表引用资源 1.引用自定义资源。格式：@[package:]type/name android：text="@string/hello" 2.引用系统资源。格式：@android:type/name android:textColor="@android:color/opaque_red"
数据结构的基本介绍天子之骄数据结构散列表树、图线性结构价格标签
数据结构的基本介绍数据结构就是数据的组织形式，用一种提前设计好的框架去存取数据，以便更方便，高效的对数据进行增删查改。正确选择合适的数据结构，对软件程序的高效执行的影响作用不亚于算法的设计。此外，在计算机系统中数据结构的作用也是非同小可。例如常常在编程语言中听到的栈，堆等，就是经典的数据结构。经典的数据结构大致如下：一：线性数据结构 (1)：列表 a
通过二维码开放平台的API快速生成二维码一炮送你回车库 api
现在很多网站都有通过扫二维码用手机连接的功能，联图网(http://www.liantu.com/pingtai/)的二维码开放平台开放了一个生成二维码图片的Api,挺方便使用的。闲着无聊，写了个前台快速生成二维码的方法。 html代码如下:(二维码将生成在这div下) ? 1 &nbs
ImageIO读取一张图片改变大小 3213213333332132 java IO image BufferedImage
package com.demo; import java.awt.image.BufferedImage; import java.io.File; import java.io.IOException; import javax.imageio.ImageIO; /** * @Description 读取一张图片改变大小 * @author FuJianyon
myeclipse集成svn（一针见血） 7454103 eclipse SVN MyEclipse
&n
装箱与拆箱----autoboxing和unboxing darkranger J2SE
4.2　自动装箱和拆箱基本数据(Primitive)类型的自动装箱(autoboxing)、拆箱(unboxing)是自J2SE 5.0开始提供的功能。虽然为您打包基本数据类型提供了方便，但提供方便的同时表示隐藏了细节，建议在能够区分基本数据类型与对象的差别时再使用。 4.2.1　autoboxing和unboxing 在Java中，所有要处理的东西几乎都是对象(Object)
ajax传统的方式制作ajax aijuans Ajax
//这是前台的代码 <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <% String path = request.getContextPath(); String basePath = request.getScheme()+
只用jre的eclipse是怎么编译java源文件的？ avords java eclipse jdk tomcat
eclipse只需要jre就可以运行开发java程序了，也能自动编译java源代码，但是jre不是java的运行环境么，难道jre中也带有编译工具？还是eclipse自己实现的？谁能给解释一下呢问题补充：假设系统中没有安装jdk or jre，只在eclipse的目录中有一个jre，那么eclipse会采用该jre，问题是eclipse照样可以编译java源文件，为什么呢？ &nb
前端模块化 bee1314 模块化
背景：前端JavaScript模块化，其实已经不是什么新鲜事了。但是很多的项目还没有真正的使用起来，还处于刀耕火种的野蛮生长阶段。 JavaScript一直缺乏有效的包管理机制，造成了大量的全局变量，大量的方法冲突。我们多么渴望有天能像Java（import），Python (import)，Ruby(require)那样写代码。在没有包管理机制的年代，我们是怎么避免所
处理百万级以上的数据处理 bijian1013 oracle sql 数据库大数据查询
一.处理百万级以上的数据提高查询速度的方法： 1.应尽量避免在 where 子句中使用!=或<>操作符，否则将引擎放弃使用索引而进行全表扫描。 2.对查询进行优化，应尽量避免全表扫描，首先应考虑在 where 及 o
mac 卸载 java 1.7 或更高版本征客丶 java OS
卸载 java 1.7 或更高 sudo rm -rf /Library/Internet\ Plug-Ins/JavaAppletPlugin.plugin 成功执行此命令后，还可以执行 java 与 javac 命令 sudo rm -rf /Library/PreferencePanes/JavaControlPanel.prefPane 成功执行此命令后，还可以执行 java
【Spark六十一】Spark Streaming结合Flume、Kafka进行日志分析 bit1129 Stream
第一步，Flume和Kakfa对接，Flume抓取日志，写到Kafka中第二部，Spark Streaming读取Kafka中的数据，进行实时分析本文首先使用Kakfa自带的消息处理（脚本）来获取消息，走通Flume和Kafka的对接 1. Flume配置 1. 下载Flume和Kafka集成的插件，下载地址：https://github.com/beyondj2ee/f
Erlang vs TNSDL bookjovi erlang
TNSDL是Nokia内部用于开发电信交换软件的私有语言，是在SDL语言的基础上加以修改而成，TNSDL需翻译成C语言得以编译执行，TNSDL语言中实现了异步并行的特点，当然要完整实现异步并行还需要运行时动态库的支持，异步并行类似于Erlang的process（轻量级进程），TNSDL中则称之为hand，Erlang是基于vm(beam)开发，
非常希望有一个预防疲劳的java软件, 预防过劳死和眼睛疲劳,大家一起努力搞一个 ljy325 企业应用
　非常希望有一个预防疲劳的java软件，我看新闻和网站，国防科技大学的科学家累死了，太疲劳，老是加班，不休息，经常吃药，吃药根本就没用，根本原因是疲劳过度。我以前做java,那会公司垃圾，老想赶快学习到东西跳槽离开，搞得超负荷，不明理。深圳做软件开发经常累死人，总有不明理的人，有个软件提醒限制很好，可以挽救很多人的生命。相关新闻：（1）IT行业成五大疾病重灾区：过劳死平均37.9岁
读《研磨设计模式》-代码笔记-原型模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * Effective Java 建议使用copy constructor or copy factory来代替clone()方法： * 1.public Product copy(Product p){} * 2.publi
配置管理---svn工具之权限配置 chenyu19891124 SVN
今天花了大半天的功夫，终于弄懂svn权限配置。下面是今天收获的战绩。安装完svn后就是在svn中建立版本库，比如我本地的是版本库路径是C:\Repositories\pepos。pepos是我的版本库。在pepos的目录结构 pepos component webapps 在conf里面的auth里赋予的权限配置为 [groups]
浅谈程序员的数学修养 comsci 设计模式编程算法面试招聘
浅谈程序员的数学修养
批量执行 bulk collect与forall用法 daizj oracle sql bulk collect forall
BULK COLLECT 子句会批量检索结果，即一次性将结果集绑定到一个集合变量中，并从SQL引擎发送到PL/SQL引擎。通常可以在SELECT INTO、 FETCH INTO以及RETURNING INTO子句中使用BULK COLLECT。本文将逐一描述BULK COLLECT在这几种情形下的用法。有关FORALL语句的用法请参考：批量SQL之 F
Linux下使用rsync最快速删除海量文件的方法 dongwei_6688 OS
1、先安装rsync：yum install rsync 2、建立一个空的文件夹：mkdir /tmp/test 3、用rsync删除目标目录：rsync --delete-before -a -H -v --progress --stats /tmp/test/ log/这样我们要删除的log目录就会被清空了，删除的速度会非常快。rsync实际上用的是替换原理，处理数十万个文件也是秒删。
Yii CModel中rules验证规格 dcj3sjt126com rules yii validate
Yii cValidator主要用法分析： yii验证rulesit 分类： Yii yii的rules验证 cValidator主要属性 attributes ,builtInValidators,enableClientValidation,message,on,safe,skipOnError
基于vagrant的redis主从实验 dcj3sjt126com vagrant
平台: Mac 工具: Vagrant 系统: Centos6.5 实验目的: Redis主从实现思路制作一个基于sentos6.5, 已经安装好reids的box, 添加一个脚本配置从机, 然后作为后面主机从机的基础box 制作sentos6.5+redis的box mkdir vagrant_redis cd vagrant_
Memcached(二)、Centos安装Memcached服务器 frank1234 centos memcached
一、安装gcc rpm和yum安装memcached服务器连接没有找到，所以我使用的是make的方式安装，由于make依赖于gcc，所以要先安装gcc 开始安装，命令如下，[color=red][b]顺序一定不能出错[/b][/color]：建议可以先切换到root用户，不然可能会遇到权限问题：su root 输入密码...... rpm -ivh kernel-head
Remove Duplicates from Sorted List hcx2013 remove
Given a sorted linked list, delete all duplicates such that each element appear only once. For example,Given 1->1->2, return 1->2.Given 1->1->2->3->3, return&
Spring4新特性——JSR310日期时间API的支持 jinnianshilongnian spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
浅谈enum与单例设计模式 247687009 java 单例
在JDK1.5之前的单例实现方式有两种(懒汉式和饿汉式并无设计上的区别故看做一种)，两者同是私有构造器，导出静态成员变量，以便调用者访问。第一种 package singleton; public class Singleton { //导出全局成员 public final static Singleton INSTANCE = new S
使用switch条件语句需要注意的几点 openwrt c break switch
1. 当满足条件的case中没有break，程序将依次执行其后的每种条件（包括default）直到遇到break跳出 int main() { int n = 1; switch(n) { case 1: printf("--1--\n"); default: printf("defa
配置Spring Mybatis JUnit测试环境的应用上下文 schnell18 spring mybatis JUnit
Spring-test模块中的应用上下文和web及spring boot的有很大差异。主要试下来差异有：单元测试的app context不支持从外部properties文件注入属性 @Value注解不能解析带通配符的路径字符串解决第一个问题可以配置一个PropertyPlaceholderConfigurer的bean。第二个问题的具体实例是：
Java 定时任务总结一 tuoni java spring timer quartz timertask
Java定时任务总结一.从技术上分类大概分为以下三种方式： 1.Java自带的java.util.Timer类，这个类允许你调度一个java.util.TimerTask任务; 说明： java.util.Timer定时器，实际上是个线程，定时执行TimerTask类 &
一种防止用户生成内容站点出现商业广告以及非法有害等垃圾信息的方法 yangshangchuan rank 相似度计算文本相似度词袋模型余弦相似度
本文描述了一种在ITEYE博客频道上面出现的新型的商业广告形式及其应对方法，对于其他的用户生成内容站点类型也具有同样的适用性。最近在ITEYE博客频道上面出现了一种新型的商业广告形式，方法如下： 1、注册多个账号（一般10个以上）。 2、从多个账号中选择一个账号，发表1-2篇博文