开放知识图谱

东南大学王萌｜ “神经+符号”学习与多模态知识发现

转载公众号 | DataFunTalk

分享嘉宾｜王萌博士东南大学助理教授

编辑整理｜盛泳潘重庆大学助理研究员

导读：近年来，多模态一词在知识图谱、计算机视觉、机器学习等领域逐渐引起越来越多的关注。从认知科学角度看，个体感知、认知外界多模态信息进而形成知识的过程，通常是多种感官同时对信息进行处理和融合，这也对应着神经网络与符号知识两类人工智能方法。本文将介绍东南大学认知智能研究所在多模态知识发现的最新工作，并介绍神经网络方法与传统的符号知识结合相关研究进展。

具体将围绕以下几部分展开：

引言——两个例子
为什么符号知识很重要
“神经”+“符号”学习
多模态知识发现

引言——两个例子

首先按照我自己的风格，先举两个和本次分享主题相关的例子。

第1个例子是现在非常火的GPT-3（据相关报道，GPT-3已开源，大家可以用其提供的预训练语料与计算资源所学习到的浅层知识）。这个例子是去年在KR 2020会议上Marcus所举的。“一个人倒了一杯蔓越莓汁，然后漫无目的地用汤勺去搅拌了一些葡萄汁在里面，它看起来不错。你尝试去闻，因为你感冒了，所以闻不到任何味道。因为你非常渴，所以你喝了它。”之后紧跟着一句话，“你现在死了”。对应上图中的黑色字体，是GPT-3自动生成的。

这个例子很有意思，GPT-3从上面这段文本中学习到/认为的新的知识是：葡萄汁是有毒的。实际中，一个零经验的人都可以从网上或自身的历史经验中得到一个结论：蔓越莓/葡萄汁是没有毒的，你之所以闻不到它们是因为你感冒了。从中我们看到，被视为异常强大的GPT-3在这样一个简单的生物医学的推理场景下依然会犯很低级的错误。这还是给我们带来了很多思考：符号知识/知识表示在神经学习系统中是非常重要的。

第2个例子是和多模态相关的，谈到神经和符号，我们知道神经系统在视觉以及一些非结构化的文本任务上取得了长足的进步。这个例子来源于NeurIPS’2020，Facebook公司提出的一个任务，说明在很多时候我们都需要多种模态的数据来共同处理。

为什么符号知识很重要

Bengio在2020年的ICLR上做了一个keynote，包括国内的唐杰老师、肖仰华老师，都在提系统1到系统2的转变，如上图（左）。上图（右），我们追溯至1986年Marvin Minsky（图灵奖获得者）的《社会心智》这本书，他在这本书中同样提到了人类大脑中的不同认知结构，它们对于外界所传达信息的接收能力与反应方式也是不同的。

对上述内容感兴趣的同学或朋友们，我建议大家可以看看以上三本书。中间这本书是一个诺贝尔经济学奖获得者写的一本关于认知科学理论的书，其中有一些很有意思的题目让你去做，你会发现人脑在处理这些相同或类似的任务时，所产生的差异也是非常明显的。哪怕是非常接近的任务，有的任务你可能需要思考很长的时间才能完成，有的任务你可能在直觉上一下子就能判断出来。我想这可能也对应现实世界中的一些应用场景，可以帮助你找到答案。

从本质上来讲，Bengio还是从认知学的理论去讨论我们应该用哪一种系统学习的机制。从知识图谱/语义网络的角度来看，毫无疑问，现有的神经系统特别擅长处理特定场景的问题，如车牌识别、语义识别、机器翻译、图像分析等等，并且对于数据噪声的鲁棒性也比较高，这也是神经系统能够识别“千变万化”的手写体数字的优势之所在。但是，它很难去解释或做原子级的操作，以及很难利用传统的背景知识。传统的符号系统很难处理机器学习问题，对于数据噪声的容忍性低，但是它很容易被理解并且被人所评估，以及融入表现背景知识的设计。

从本质上讲，神经系统和符号系统的目标都是一致的，即输入一个问题（Input（Question）），产生一个答案（Goal（Answer））。区别在于它们擅长处理的数据类型不一样，神经系统可能擅长于处理非结构化的文本、语音、图片等，通常采用的是端到端的方式；符号系统擅长处理数据库以及定义的模式/语义规则/推理规则、图数据库、图谱等等。但是从任务的输入、输出的角度来讲，它们都是一致的。

基于此，我们会发现这两种系统各有特点。上图（右）是一个视觉问答（VQA）的例子，针对“图中有几只长颈鹿？”这一问题，可以回答：图中有两只长颈鹿，但是如果问：“长颈鹿和斑马的关系？”这一问题，如果仅通过从大量的样本中来学习，我相信是很难得到“它们都是非洲草原上的草食类动物”这一事实。上图（左）是一个经典的手写体识别例子，如果我们只用神经系统去训练，我们只能判断新样本中4<5，5<6这样从来没有见过的手写体和它们之间的比较。但是对于符号之间的运算，却很难推断出4<6这个运算过程。而对于符号系统而言，它的泛化能力是非常强的，你只需要写一个运算符的传递性规则，便可以得到想要的运算答案。

这里提到的“神经”+“符号”并不是说它们两者是对立的。我一直在跟踪前沿的工作，我不是想说“符号系统”有多么的好，而是说我们现在需要的是找到所有可能的方式去补充深度学习目前所出现的问题。这也是我本次分享的核心出发点。从上图中可知，目前现有的神经系统模型主要还是集中在感知或语言方面，而人类的符号知识包含了大量的常识，我们如何能够将它们用在神经系统里面，这方面的研究具有无限的潜力。

到底什么是符号/符号知识？在浙江大学陈华钧老师的演讲中提到，符号推理的四种类型是：演绎（Deductive reasoning）、归纳（Inductive reasoning）、溯因（Abductive reasoning）、类比（Analogical reasoning）。

G．Marcus在2020年的KR会议上也对符号知识进行了概括，他说符号知识可以分为几类，例如变量、实例，在变量/实例上的操作，以及绑定（binding）。符号知识的泛化能力从何而来？根据Gary F．Marcus这本书中提出的观点，这主要得益于变量的强大之处，也就是说，当我们能在一个符号系统中定义有代表性的变量时，它其实是永无止境的泛化（open-ended generalization）。

哪些知识是可以形式化出来的，像上述提到的变量、实例是可以定义出来的，哪些又是很难去描述的。我们知道，人类知识中其实有很多“本能”信息（innate），例如喜怒哀乐，它从某种程度上来说也是一种知识。但是它们很难用我们的符号体系去概括，这就涉及到一些心理学上的知识。这里我也给大家一个参考，Elizabeth Spelke是哈佛大学一个长期从事计算机科学与心理科学研究的教授，如果你想找到答案，也可以从他的研究中获取到一些资源。

概括而言，符号知识包括：对一类对象的表示（Representationsof objects），一些结构化的代数层级的表示（Structured, algebraicrepresentations），定义在变量上的运算（Operations over variables），一些单词级别的区别（A type-token distinction），对于集合、地点、路径、轨迹、障碍物以及一些持久性质个体的表达能力（A capacity to represent sets, locations, paths, trajectories，obstacles and enduring individuals），一种表示对象属性的方式（A way of representing the affordances of objects），大量的时空信息（Spatiotemporal contiguity/conservation of mass），因果关系（Causality），平均变量（Translational invariance）和成本效益分析能力（Capacity for cost-benefit analysis）。以上可视为对常见的符号知识的系统性的总结。大家可以思考下，根据自己的背景知识，是否可以将上述中的每一类嵌入到神经学习系统中来。

说的再远一些，还有一些很难去定义的符号知识，例如一些习惯的选择（Habitat selection），对危险、恐惧的反应，以及正义（Justice），性别以及一些传统意义上的人类的本能。当然，致力于知识表示的科学家们还一直在探索。我们需要思考现有的知识表示是否还有缺陷，在S.Pinker 1994年出版的一本书中提到这样一句话“人类在解决任何一个现实世界中的问题时，上图中所列出的机制/知识/本能至少要用到其中五种”。这引发了我们的思考，启发我们根据上述知识列表去神经系统中探索还缺乏哪些知识，以及如何更好地引入它们。

符号系统不单单是表示问题，符号知识也是与方法相关的。但现在为止，AI系统已经有很多种类型了，我们在选择知识表达时应紧密联系实际场景，一个核心的问题是，在一个“神经”+“符号”的结合系统中，面向一个给定的问题，或是一个给定的人来选择一个最合适的知识表达，这样最终可以实现两个目的：一是帮助研究者跳出传统的知识图谱/知识表示的思维，进而帮助其获得全新的知识理解（New understanding/ insights）；二是让研究者的神经系统更加个性化（Personalizationof system）。

这里举个例子，对于在医疗领域中诊断高血压的问题：“人群中大概有0.04的人，一个患慢性病的老人患高血压的概率为0.95等等”，在上图中，可以分别从贝叶斯公式、代数层级的面积求法、邻接列表、决策树模型的层面给出了这一预测问题的知识表示形式。因此，我们不应该将知识表示固化于三元组，而要看解决问题时所采用的方法。换句话而言，在神经网络中有很多种方法，对于每种方法都应该设计它对应的知识表示。

基于上述设计思想，我们可以充分利用人类世界中的不同知识，这些知识上的不同操作方式，不同个体对于该问题的不同思考，核心的目的是能够根据不同的人，不同的任务选择相应的符号知识与推理规则，最后将知识嵌入到模型之中（With symbols model use, inferences model enable, and knowledge modelencode）。

在知识表示学习的会议ICLR上，每年都会有精彩的分享。在2020年，其中一个令我印象深刻的报告是关于社交符号知识（Social SymbolicKnowledge）的。在很多神经系统中都应考虑到社会知识的作用，这一方面已经有了一些工作，但是对于做“神经”+“符号”的研究者而言，我觉得在社交符号知识方面的研究还是比较空缺的。现在更多的研究还是集中在事实类的知识，例如姚明的身高是多少，美国总统是拜登等。然而在表情识别等情感分析任务中存在大量的社会常识/知识，在ICLR的这个报告中，给我们详细说明了在哪些场景中，我们可以将哪些社会上的浅规则/知识来嵌入到神经学习的系统中。再者，对于知识图谱构建，我们是否能提出一个基于社会常识的知识图谱构建框架，这也是一个值得去探索的方向。

总结一下，我们期望的目标是能够实现一个“神经”+“符号”的系统，在这个系统中，我们可以集成“神经”+“符号”的所有优点，最终来完成既定的任务。在IJCAI 2018的一个辅导报告（tutorial）中，专门介绍了如何来结合“神经”+“符号”，本质上这是一个循环的过程。

“神经”+“符号”学习

下面，我将给大家介绍“神经”+“符号”的学习方法。

我在IJCAI 2018辅导报告的基础上，进一步总结了“神经”+“符号”学习方法的演化过程。现在还没有任何一个系统敢宣称：我的系统集合了“神经”+“符号”的全部优势，大家更多的是在自己的任务上借鉴或是利用另外一个系统某一个环节的优点，这导致现有的“神经”+“符号”学习都是侧重一方而忽略另一方的。

纵观这一研究的历史，从2010年开始，图灵奖获得者Leslie Valiant就是在做“神经”+“符号”的整合学习，也出版了一系列的、可称为“Relational Learning”的专著；再往上走，就是马尔科夫逻辑网络（MarkovLogic Network），它其实是将一些神经的方法嵌入到传统的马尔科夫网络的构建过程中；2013-2017年，知识图谱表示学习是一个非常火热的方向，至今仍有很多研究者在从事相关研究，其在本质上更侧重于神经系统方法，但同时也引入了很多符号知识；2016-2018年，牛津大学的Georg Gottlob等人提出敏捷逻辑（Swift Logic）的相关概念，在深度学习框架下嵌入了很多可推理的组件（DeductiveReasoning with DL）；Yoshua Bengio所倡导的Deep Learning 2，以及我所介绍的多模态知识图谱都属于这个领域。

详细来说，第一类将神经系统直接应用于推理任务中的方法就是表示学习，它其实是在用神经的方法解决浅层的关系预测问题（在符号系统中，它们本质就是简单的推理问题），但是我们知道，在知识图谱表示学习中，基本上全部都是用神经网络或统计学习的方法去解决这个任务。还有现在流行的图神经网络，如GCN,GNN等，它们都是在用神经的方法去解决浅层的推理问题。但是我想说的是，这里的推理更多侧重的是统计上的推理，而不是逻辑上的演绎推理。所以这里值得我们做更深层的探讨，是否可以让神经系统去做更高级别的推理。

再比如多跳问答，相比而言，单跳问答是一个复杂的推理或复杂的问题，然而在传统的符号知识领域中，它依然是一个浅层的推理。在多跳问答中，常使用循环神经网络+注意力机制（RNN+Attention）或层次图卷积网络（Hierarchical GCN）来解决这一问题。

还有一种思路是通过改进神经网络方法，使其能够更好地嵌入到推理问题中。上文中提到的敏捷逻辑（Swift logic），逻辑张量网络（Logic Tensor Network），以及错误容忍的RDF推理（noise-tolerant RDF reasoning）。这些工作极具代表性，它们并不是直接将神经网络与符号相互分离，而是尝试在某些环节，如数据不完整性、张量网络的规则学习过程中引入一些神经的方法，但是在本质上它们还是符号推理系统。

还有一类方法主要还是在做神经系统面临的问题，主要是通过引入符号知识来提升神经网络的效果。其中具有代表性的问题包括：信息编审问题，如知识蒸馏（有老师网络和学生网络的过程，在这些过程中就可以嵌入一些逻辑的规则），远程监督（在自然语言处理的过程中将知识图谱作为监督信息，并且在这其中去思考降噪的问题）。在计算机视觉领域，本质上还是在用符号知识的迁移去解决一些小样本、零样本的问题。

在NLP场景中嵌入知识的三种常见方法：

第一个是韩先培老师组的一个工作，他们将WordNet、Wikipedia、脚本知识（script knowledge）、相关性（relatedness）这些统称为符号知识。第一步是在一个自然语言任务中（如故事结尾预测任务）找出相关的规则或推断，然后去学习是否满足特定规则的得分函数，最后通过注意力机制去学习所有得分函数的聚合，得以对句子进行推断或故事结尾的预测（请见《Reasoning with Heterogeneous Knowledge for Commonsense MachineComprehension》一文）。这里总结一下：这类方法先去发现一些规则，然后从损失函数的级别去判断这些规则是否都有效，最后结合注意力机制进行选择。

第二类方法是将问题抽象为多任务学习（multi-tasklearning）的任务（请见《Incorporating Relation Knowledge intoCommonsense Reading Comprehension with Multi-task Learning》一文）。这篇文章的最大贡献在于：作者提出了一个概念网络（ConceptNet）。作者认为在整合多类型的知识时会有多个整合的损失函数（lossfunction），因此提出了一个全新的符号知识，称为ConceptNet，最后将其抽象为一个多任务学习的过程。

第三个工作也比较有代表性（请见《Knowledge-AwareGraph Networks for Commonsense Reasoning》一文），它类似于自监督学习的过程，并结合最近流行的图神经网络（GNN）来做常识知识推理。上述三类方法是目前做的比较好的，说明如何在神经系统中嵌入符号知识的方法。

此外，符号知识还能帮助我们更好地解释神经网络的输出结果，以及提供更好的可解释性。这些都是“神经”+“符号”学习的特点。

现有的“神经”+“符号”网络也存在一些缺陷：

我们现在所定义或拥有的知识是不完整的，即我们嵌入到模型中的实际上是很缺失的知识。我们真实的世界往往服从开放世界假设，那么我们会面临嵌入的知识是不存在、不正确，还是因为构建过程而导致的缺失问题。
嵌入的知识也不一定是百分之百正确的。
我们可以嵌入一些简单的资源，但是这些资源的表达能力是比较弱的，例如其依然受限于三元组形式的表达能力。

多模态知识发现

“神经”+“符号”学习也是未来多模态知识发现中的一个探索。

1. 多模态知识图谱

在今年的NLPCC上我已经对多模态知识图谱做过相应的介绍，下面我做一些简单的回顾。

首先多模态知识发现与多模态知识图谱不是一个新的问题，从2004到2019年，在每一个阶段，研究者都有不同的定义。

其中具有代表性的工作包括，Heng Ji等老师率先提出了到底什么是多模态知识和多模态知识图谱。他们对多模态知识图谱的节点和关系给出了自己的定义。

他们总结了在将文本知识与场景知识融合过程中所面临的一些挑战。专门提到了不同模态知识的精准对齐是多模态知识发现中的一个核心问题。

在去年的ACL会议上，他们详细介绍了一个多模态知识发现的系统。

上图为该系统的主要架构，我们可以发现：多模态知识发现其实是一个庞大的工程，因为每种模态的知识都有不同的抽取方法，不同模态的知识还涉及对齐以及联合学习等核心问题。

大家可以顺着去发现在推荐系统（请见《Multi-modalKnowledge Graphs for Recommender Systems》一文）、旅游场景（请见《Constructionof Multi-modal Chinese Tourism Knowledge Graph》一文）、软件工程（请见《Multimodal Knowledge Graph for Deep Learning Papers and Code》一文）以及个人生活场景（请见《Multimodal joint learning for personal knowledge base constructionfrom Twitter-based lifelogs》一文），都可以发现多模态知识发现和多模态知识图谱过程中不同知识和神经系统相结合的一些探索。

以及在多模态知识的表征学习方面，都可以看到各有侧重的方法（请见《HGMF：Heterogeneous Graph-based Fusion forMultimodal Data with Incompleteness》一文）。

这里总结一下，我借鉴Dong老师等人的表达，上图所示为商品知识图谱。多模态知识图谱的发展最终会向上图中所总结的情况一样，在开始时（2016-2017年），多模态知识图谱只是传统知识图谱中的一个小块（如图（A）），大家刚刚开始关注这个问题；到2020年，我们发现传统知识图谱和多模态知识图谱逐渐成为并列关系（如图（B））；未来，我相信多模态知识图谱必定是包含了传统知识图谱（如图（D））。

2. 我们的多模态知识图谱

现在我简单介绍一下我们的相关工作。作为一个研究知识表示出生的团队，我们主要还是立足于我们已有的知识图谱，并不断扩展多模态的信息。然后对于给定的场景，如场景图分析、人脸识别问题，我们进行一些神经抽取。最后我们将由神经系统抽取的粗粒度类别信息与我们已有的符号信息相结合，并应用于一些实体级别的任务上。上图（右）表示我们对于多模态知识的建模，包括多模态知识图谱的“样子”，以及基于场景的多模态发现（类似于场景图）。

对于上图中的每个部分，我们都有相应的论文。

这里也做一个广告。由于多模态数据/知识图谱还是一个初级的研究领域，相信今天在座的各位同学和老师都有自己的多模态资源，我们今年在CCKS的论文征集中将有一个全新的模块，即Resource Track。欢迎大家将自己的数据都投稿至这个模块，同时它也是被正文录取的。希望大家能够在整个知识图谱与语义计算的社群中乐于分享自己的数据。

以上是我们对于场景的理解。

例如，我们在符号层级是如何求解这个问题的。

例如在符号层级，我们如何利用拥有的知识去解决尾部关系类型很少的实体抽取。

最后我们实现的效果是将传统意义上的粗粒度的场景图映射为一个实例级别的场景分析上。

以上为该模型的整体框架，以及相应的实验结果。

3. 其它多模态发现任务

首先是多模态知识的补全，如上图所示。

还有如何从无标签视频中抽取我们常见的知识。

那么多模态是否真的有用呢？

上图是多模态机器翻译的对抗性评价。

多模态知识图谱在2019年ESWC这个会议上发表了一个被广泛关注的数据集，即MMKG（multi-modal knowledge graphs）。在去年的KSEM上，中科大徐童老师也在这个数据集的基础上提出了自己的模型。但是，如果你自己分析过这个数据集，就会发现其中包含大量的噪声，例如阿司匹林这个药，我们在对齐两个知识图谱上的阿司匹林数据时，如果使用单模态的知识图谱去完成对齐，我们发现已经能够取得不错的效果。但是，如果加入照片信息，会发现模型的效果会降低。我们发现产生上述问题的原因在于，其中一个知识图谱中的阿司匹林是一个药盒，另外一个知识图谱中的阿司匹林是一个分子结构。在这种情况下，实际上多模态信息起的是一种反作用。到底什么场景下的多模态联合信息是有作用的，什么场景下的多模态信息是起反作用的，这也是接下来我们值得关注的问题。

接下来，我总结了多模态数据/知识图谱中的真实挑战：

是否真正有多模态的数据，如知识图谱、文本数据、图像和视频等；
在符号层级，我们需要去思考多模态知识/符号知识应该如何去表达；
在神经网络层级，我们需要去探索多模态预训练语言模型，是否有不同模态基准的对齐，以及是否有强大的计算资源。

最后谈一下不同模态的知识，不同的研究者有不同的见解。大家一定不要把多模态想象成图片、文本、音频、视频，以及非结构化的知识。例如在照片层级，我们有cp图像，也有核磁共振图像，超声图像，其实这些都是多模态的数据；在文本层级，也可以定义出属于自己的多模态信息。

上图给出了这个领域未来的浅层研究方向，大家可以去探讨。

今天的分享就到这里，谢谢大家。

分享嘉宾：

OpenKG

OpenKG（中文开放知识图谱）旨在推动以中文为核心的知识图谱数据的开放、互联及众包，并促进知识图谱算法、工具及平台的开源开放。

点击阅读原文，进入 OpenKG 网站。

你可能感兴趣的:(神经网络,大数据,算法,编程语言,python)

系统学习Python——并发模型和异步编程：进程、线程和GIL
分类目录：《系统学习Python》总目录在文章《并发模型和异步编程：基础知识》我们简单介绍了Python中的进程、线程和协程。本文就着重介绍Python中的进程、线程和GIL的关系。Python解释器的每个实例都是一个进程。使用multiprocessing或concurrent.futures库可以启动额外的Python进程。Python的subprocess库用于启动运行外部程序（不管使用何种
C++11堆操作深度解析：std::is_heap与std::is_heap_until原理解析与实践
文章目录堆结构基础与函数接口堆的核心性质函数签名与核心接口std::is_heapstd::is_heap_until实现原理深度剖析std::is_heap的验证逻辑std::is_heap_until的定位策略算法优化细节代码实践与案例分析基础用法演示自定义比较器实现最小堆检查边缘情况处理性能分析与实际应用时间复杂度对比典型应用场景与手动实现的对比注意事项与最佳实践迭代器要求比较器设计C++标
Flask框架入门：快速搭建轻量级Python网页应用「已注销」 python-AI python基础网站网络 python flask 后端
转载：Flask框架入门：快速搭建轻量级Python网页应用1.Flask基础Flask是一个使用Python编写的轻量级Web应用框架。它的设计目标是让Web开发变得快速简单，同时保持应用的灵活性。Flask依赖于两个外部库：Werkzeug和Jinja2，Werkzeug作为WSGI工具包处理Web服务的底层细节，Jinja2作为模板引擎渲染模板。安装Flask非常简单，可以使用pip安装命令
Python Flask 框架入门：快速搭建 Web 应用的秘诀 Python编程之道 Python人工智能与大数据 Python编程之道 python flask 前端 ai
PythonFlask框架入门：快速搭建Web应用的秘诀关键词Flask、微框架、路由系统、Jinja2模板、请求处理、WSGI、Web开发摘要想快速用Python搭建一个灵活的Web应用？Flask作为“微框架”代表，凭借轻量、可扩展的特性，成为初学者和小型项目的首选。本文将从Flask的核心概念出发，结合生活化比喻、代码示例和实战案例，带你一步步掌握：如何用Flask搭建第一个Web应用？路由
冒泡、选择、插入排序：三大基础排序算法深度解析（C语言实现） xienda 算法排序算法数据结构
在算法学习道路上，排序算法是每位程序员必须掌握的基石。本文将深入解析冒泡排序、选择排序和插入排序这三种基础排序算法，通过C语言代码实现和对比分析，帮助读者彻底理解它们的差异与应用场景。算法原理与代码实现1.冒泡排序（BubbleSort）工作原理：通过重复比较相邻元素，将较大元素逐步"冒泡"到数组末尾。voidbubbleSort(intarr[],intn){ for(inti=0;iarr[
Leetcode 148. 排序链表
文章目录前引题目代码（首刷看题解）代码（8.9二刷部分看解析）代码（9.15三刷部分看解析）前引综合性比较强的一道题，要求时间复杂度必须O(logn)才能通过，最适合链表的排序算法就是归并。这里采用自顶向下的方法步骤：找到链表中点（双指针）对两个子链表排序(递归，直到只有一个结点，记得将子链表最后指向nullptr）归并（引入dummy结点）题目Leetcode148.排序链表代码（首刷看题解）c
python_虚拟环境阿_焦 python
第一、配置虚拟环境：virtualenv（1）pipvirtualenv>安装虚拟环境包（2）pipinstallvirtualenvwrapper-win>安装虚拟环境依赖包（3）c盘创建虚拟目录>C:\virtualenv>配置环境变量【了解一下】：（1）如何使用virtualenv创建虚拟环境a、cd到C:\virtualenv目录下：b、mkvirtualenvname>创建虚拟环境nam
全面触摸屏输入法设计与实现长野君
本文还有配套的精品资源，点击获取简介：触摸屏输入法是针对触摸设备优化的文字输入方案，包括虚拟键盘、手写、语音识别和手势等多种输入方式。本方案通过提供主程序文件、用户手册、界面截图、示例图、说明文本和音效文件，旨在为用户提供一个完整的、多样的文字输入体验。开发者通过持续优化算法和用户界面，使用户在无物理键盘环境下也能高效准确地进行文字输入。1.触摸屏输入法概述简介在现代信息技术飞速发展的今天，触摸屏
FPGA小白到项目实战：Verilog+Vivado全流程通关指南（附光学类岗位技能映射）阿牛的药铺算法移植部署 fpga开发 verilog
FPGA小白到项目实战：Verilog+Vivado全流程通关指南（附光学类岗位技能映射）引言：为什么这个FPGA入门路线能帮你快速上岗？本文设计了一条**"Verilog语法→工具链操作→光学项目实战→岗位技能对标"的阶梯式学习路径。不同于泛泛而谈的FPGA教程，我们聚焦光学类产品开发**核心能力（时序接口设计、图像处理算法移植、高速接口应用），通过3个递进式项目（从LED闪烁到图像边缘检测），
PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
Python爱心光波
系列文章序号直达链接Tkinter1Python李峋同款可写字版跳动的爱心2Python跳动的双爱心3Python蓝色跳动的爱心4Python动漫烟花5Python粒子烟花Turtle1Python满屏飘字2Python蓝色流星雨3Python金色流星雨4Python漂浮爱心5Python爱心光波①6Python爱心光波②7Python满天繁星8Python五彩气球9Python白色飘雪10Pyt
Python流星雨 Want595 python 开发语言
文章目录系列文章写在前面技术需求完整代码代码分析1.模块导入2.画布设置3.画笔设置4.颜色列表5.流星类(Star)6.流星对象创建7.主循环8.流星运动逻辑9.视觉效果10.总结写在后面系列文章序号直达链接表白系列1Python制作一个无法拒绝的表白界面2Python满屏飘字表白代码3Python无限弹窗满屏表白代码4Python李峋同款可写字版跳动的爱心5Python流星雨代码6Python
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
Python之七彩花朵代码实现 PlutoZuo Python python 开发语言
Python之七彩花朵代码实现文章目录Python之七彩花朵代码实现下面是一个简单的使用Python的七彩花朵。这个示例只是一个简单的版本，没有很多高级功能，但它可以作为一个起点，你可以在此基础上添加更多功能。importturtleastuimportrandomasraimportmathtu.setup(1.0,1.0)t=tu.Pen()t.ht()colors=['red','skybl
算法学习笔记：15.二分查找 ——从原理到实战，涵盖 LeetCode 与考研 408 例题呆呆企鹅仔算法学习算法学习笔记考研二分查找
在计算机科学的查找算法中，二分查找以其高效性占据着重要地位。它利用数据的有序性，通过不断缩小查找范围，将原本需要线性时间的查找过程优化为对数时间，成为处理大规模有序数据查找问题的首选算法。二分查找的基本概念二分查找（BinarySearch），又称折半查找，是一种在有序数据集合中查找特定元素的高效算法。其核心原理是：通过不断将查找范围减半，快速定位目标元素。与线性查找逐个遍历元素不同，二分查找依赖
Python 脚本最佳实践2025版
前文可以直接把这篇文章喂给AI,可以放到AI角色设定里,也可以直接作为提示词.这样,你只管提需求,写脚本就让AI来.概述追求简洁和清晰：脚本应简单明了。使用函数(functions)、常量(constants)和适当的导入(import)实践来有逻辑地组织你的Python脚本。使用枚举(enumerations)和数据类(dataclasses)等数据结构高效管理脚本状态。通过命令行参数增强交互性
（Python基础篇）了解和使用分支结构 EternityArt 基础篇 python
目录一、引言二、Python分支结构的类型与语法（一）if语句（单分支）（二）if-else语句（双分支）（三）if-elif-else语句（多分支）三、分支结构的应用场景（一）提示用户输入用户名，然后再提示输入密码，如果用户名是“admin”并且密码是“88888”则提示正确，否则，如果用户名不是admin还提示用户用户名不存在,（二）提示用户输入用户名，然后再提示输入密码，如果用户名是“adm
（Python基础篇）循环结构 EternityArt 基础篇 python
一、什么是Python循环结构？循环结构是编程中重复执行代码块的机制。在Python中，循环允许你：1.迭代处理数据：遍历列表、字典、文件内容等。2.自动化重复任务：如批量处理数据、生成序列等。3.控制执行流程：根据条件决定是否继续或终止循环。二、为什么需要循环结构？假设你需要打印1到100的所有偶数：没有循环：需手动编写100行print()语句。print(0)print(2)print(4)
（Python基础篇）字典的操作 EternityArt 基础篇 python 开发语言
一、引言在Python编程中，字典（Dictionary）是一种极具灵活性的数据结构，它通过“键-值对”（key-valuepair）的形式存储数据，如同现实生活中的字典——通过“词语（键）”快速查找“释义（值）”。相较于列表和元组的有序索引访问，字典的优势在于基于键的快速查找，这使得它在处理需要频繁通过唯一标识获取数据的场景中极为高效。掌握字典的操作，能让我们更高效地组织和管理复杂数据，是Pyt
LeetCode算法题：电话号码的字母组合吱屋猪_ 算法 leetcode java
题目描述：给定一个仅包含数字2-9的字符串，返回所有它能表示的字母组合。答案可以按任意顺序返回。给出数字到字母的映射如下（与电话按键相同）。注意1不对应任何字母。2->"abc"3->"def"4->"ghi"5->"jkl"6->"mno"7->"pqrs"8->"tuv"9->"wxyz"例如，给定digits="23"，返回["ad","ae","af","bd","be","bf","cd
Python七彩花朵 Want595 python 开发语言
系列文章序号直达链接Tkinter1Python李峋同款可写字版跳动的爱心2Python跳动的双爱心3Python蓝色跳动的爱心4Python动漫烟花5Python粒子烟花Turtle1Python满屏飘字2Python蓝色流星雨3Python金色流星雨4Python漂浮爱心5Python爱心光波①6Python爱心光波②7Python满天繁星8Python五彩气球9Python白色飘雪10Pyt
霍夫变换（Hough Transform）算法原来详解和纯C++代码实现以及OpenCV中的使用示例点云SLAM 算法图形图像处理算法 opencv 图像处理与计算机视觉算法直线提取检测目标检测霍夫变换算法
霍夫变换（HoughTransform）是一种经典的图像处理与计算机视觉算法，广泛用于检测图像中的几何形状，例如直线、圆、椭圆等。其核心思想是将图像空间中的“点”映射到参数空间中的“曲线”，从而将形状检测问题转化为参数空间中的峰值检测问题。一、霍夫变换基本思想输入：边缘图像（如经过Canny边缘检测）输出：一组满足几何模型的形状（如直线、圆）关键思想：图像空间中的一个点→参数空间中的一个曲线参数空
用OpenCV标定相机内参应用示例（C++和Python）
下面是一个完整的使用OpenCV进行相机内参标定（CameraCalibration）的示例，包括C++和Python两个版本，基于棋盘格图案标定。一、目标：相机标定通过拍摄多张带有棋盘格图案的图像，估计相机的内参：相机矩阵（内参）K畸变系数distCoeffs可选外参（R,T）标定精度指标（如重投影误差）二、棋盘格参数设置（根据自己的棋盘格设置）：棋盘格角点数：9x6（内角点，9列×6行）；每个
Anaconda 详细下载与安装教程
Anaconda详细下载与安装教程1.简介Anaconda是一个用于科学计算的开源发行版，包含了Python和R的众多常用库。它还包括了conda包管理器，可以方便地安装、更新和管理各种软件包。2.下载Anaconda2.1访问官方网站首先，打开浏览器，访问Anaconda官方网站。2.2选择适合的版本在页面中，你会看到两个主要的下载选项：AnacondaIndividualEdition：适用于
python中 @注解及内置注解的使用方法总结以及完整示例慧一居士 Python python
在Python中，装饰器（Decorator）使用@符号实现，是一种修改函数/类行为的语法糖。它本质上是一个高阶函数，接受目标函数作为参数并返回包装后的函数。Python也提供了多个内置装饰器，如@property、@staticmethod、@classmethod等。一、核心概念装饰器本质：@decorator等价于func=decorator(func)执行时机：在函数/类定义时立即执行装饰
Python中的静态方法和类方法详解
在Python中，`@staticmethod`和`@classmethod`是两种装饰器，它们用于定义类中的方法，但是它们的行为和用途有所不同。###@staticmethod`@staticmethod`装饰器用于定义一个静态方法。静态方法不接收类或实例的引用作为第一个参数，因此它不能访问类的状态或实例的状态。静态方法可以看作是与类关联的普通函数，但它们可以通过类名直接调用。classMath
Python中类静态方法：@classmethod/@staticmethod详解和实战示例
在Python中，类方法(@classmethod)和静态方法(@staticmethod)是类作用域下的两种特殊方法。它们使用装饰器定义，并且与实例方法(deffunc(self))的行为有所不同。1.三种方法的对比概览方法类型是否访问实例(self)是否访问类(cls)典型用途实例方法✅是❌否访问对象属性类方法@classmethod❌否✅是创建类的替代构造器，访问类变量等静态方法@stati
Python多版本管理与pip升级全攻略：解决冲突与高效实践码界奇点 Python python pip 开发语言 python3.11 源代码管理虚拟现实依赖倒置原则
引言Python作为最流行的编程语言之一，其版本迭代速度与生态碎片化给开发者带来了巨大挑战。据统计，超过60%的Python开发者需要同时维护基于Python3.6+和Python2.7的项目。本文将系统解决以下核心痛点：如何安全地在同一台机器上管理多个Python版本pip依赖冲突的根治方案符合PEP标准的生产环境最佳实践第一部分：Python多版本管理核心方案1.1系统级多版本共存方案Wind
基于Python的健身数据分析工具的搭建流程day1 weixin_45677320 python 开发语言数据挖掘爬虫
基于Python的健身数据分析工具的搭建流程分数据挖掘、数据存储和数据分析三个步骤。本文主要介绍利用Python实现健身数据分析工具的数据挖掘部分。第一步：加载库加载本文需要的库，如下代码所示。若库未安装，请按照python如何安装各种库（保姆级教程）_python安装库-CSDN博客https://blog.csdn.net/aobulaien001/article/details/133298
数字孪生技术为UI前端注入新活力：实现产品设计的沉浸式体验 ui设计前端开发老司机 ui
hello宝子们...我们是艾斯视觉擅长ui设计、前端开发、数字孪生、大数据、三维建模、三维动画10年+经验!希望我的分享能帮助到您!如需帮助可以评论关注私信我们一起探讨!致敬感谢感恩!一、引言：从“平面交互”到“沉浸体验”的UI革命当用户在电商APP中翻看3D家具模型却无法感知其与自家客厅的匹配度，当设计师在2D屏幕上绘制汽车内饰却难以预判实际乘坐体验——传统UI设计的“平面化、静态化、割裂感”
基本数据类型和引用类型的初始值 3213213333332132 java基础
package com.array; /** * @Description 测试初始值 * @author FuJianyong * 2015-1-22上午10:31:53 */ public class ArrayTest { ArrayTest at; String str; byte bt; short s; int i; long
摘抄笔记--《编写高质量代码：改善Java程序的151个建议》白糖_ 高质量代码
记得3年前刚到公司，同桌同事见我无事可做就借我看《编写高质量代码：改善Java程序的151个建议》这本书，当时看了几页没上心就没研究了。到上个月在公司偶然看到，于是乎又找来看看，我的天，真是非常多的干货，对于我这种静不下心的人真是帮助莫大呀。看完整本书，也记了不少笔记
【备忘】Django 常用命令及最佳实践 dongwei_6688 django
注意：本文基于 Django 1.8.2 版本生成数据库迁移脚本（python 脚本） python manage.py makemigrations polls 说明：polls 是你的应用名字，运行该命令时需要根据你的应用名字进行调整查看该次迁移需要执行的 SQL 语句（只查看语句，并不应用到数据库上）： python manage.p
阶乘算法之一N! 末尾有多少个零周凡杨 java 算法阶乘面试效率
&n
spring注入servlet g21121 Spring注入
传统的配置方法是无法将bean或属性直接注入到servlet中的，配置代理servlet亦比较麻烦，这里其实有比较简单的方法，其实就是在servlet的init()方法中加入要注入的内容： ServletContext application = getServletContext(); WebApplicationContext wac = WebApplicationContextUtil
Jenkins 命令行操作说明文档 510888780 centos
假设Jenkins的URL为http://22.11.140.38:9080/jenkins/ 基本的格式为 java 基本的格式为 java -jar jenkins-cli.jar [-s JENKINS_URL] command [options][args] 下面具体介绍各个命令的作用及基本使用方法 1. &nb
UnicodeBlock检测中文用法布衣凌宇 UnicodeBlock
/** * 判断输入的是汉字 */ public static boolean isChinese(char c) { Character.UnicodeBlock ub = Character.UnicodeBlock.of(c);
java下实现调用oracle的存储过程和函数 aijuans java orale
1.创建表：STOCK_PRICES 2.插入测试数据： 3.建立一个返回游标： PKG_PUB_UTILS 4.创建和存储过程：P_GET_PRICE 5.创建函数： 6.JAVA调用存储过程返回结果集 JDBCoracle10G_INVO
Velocity Toolbox antlove 模板 tool box velocity
velocity.VelocityUtil package velocity; import org.apache.velocity.Template; import org.apache.velocity.app.Velocity; import org.apache.velocity.app.VelocityEngine; import org.apache.velocity.c
JAVA正则表达式匹配基础百合不是茶 java 正则表达式的匹配
正则表达式;提高程序的性能,简化代码,提高代码的可读性,简化对字符串的操作正则表达式的用途; 字符串的匹配字符串的分割字符串的查找字符串的替换正则表达式的验证语法 [a] //[]表示这个字符只出现一次 ,[a] 表示a只出现一
是否使用EL表达式的配置 bijian1013 jsp web.xml EL EasyTemplate
今天在开发过程中发现一个细节问题，由于前端采用EasyTemplate模板方法实现数据展示，但老是不能正常显示出来。后来发现竟是EL将我的EasyTemplate的${...}解释执行了，导致我的模板不能正常展示后台数据。网
精通Oracle10编程SQL(1-3)PLSQL基础 bijian1013 oracle 数据库 plsql
--只包含执行部分的PL/SQL块 --set serveroutput off begin dbms_output.put_line('Hello,everyone!'); end; select * from emp; --包含定义部分和执行部分的PL/SQL块 declare v_ename varchar2(5); begin select
【Nginx三】Nginx作为反向代理服务器 bit1129 nginx
Nginx一个常用的功能是作为代理服务器。代理服务器通常完成如下的功能：接受客户端请求将请求转发给被代理的服务器从被代理的服务器获得响应结果把响应结果返回给客户端实例本文把Nginx配置成一个简单的代理服务器对于静态的html和图片，直接从Nginx获取对于动态的页面，例如JSP或者Servlet，Nginx则将请求转发给Res
Plugin execution not covered by lifecycle configuration: org.apache.maven.plugin blackproof maven 报错
转：http://stackoverflow.com/questions/6352208/how-to-solve-plugin-execution-not-covered-by-lifecycle-configuration-for-sprin maven报错： Plugin execution not covered by lifecycle configuration:
发布docker程序到marathon ronin47 docker 发布应用
1 发布docker程序到marathon 1.1 搭建私有docker registry 1.1.1 安装docker regisry docker pull docker-registry docker run -t -p 5000:5000 docker-registry 下载docker镜像并发布到私有registry docker pull consol/tomcat-8.0
java-57-用两个栈实现队列&&用两个队列实现一个栈 bylijinnan java
import java.util.ArrayList; import java.util.List; import java.util.Stack; /* * Q 57 用两个栈实现队列 */ public class QueueImplementByTwoStacks { private Stack<Integer> stack1; pr
Nginx配置性能优化 cfyme nginx
转载地址：http://blog.csdn.net/xifeijian/article/details/20956605 大多数的Nginx安装指南告诉你如下基础知识——通过apt-get安装，修改这里或那里的几行配置，好了，你已经有了一个Web服务器了。而且，在大多数情况下，一个常规安装的nginx对你的网站来说已经能很好地工作了。然而，如果你真的想挤压出Nginx的性能，你必
[JAVA图形图像]JAVA体系需要稳扎稳打,逐步推进图像图形处理技术 comsci java
对图形图像进行精确处理，需要大量的数学工具，即使是从底层硬件模拟层开始设计，也离不开大量的数学工具包，因为我认为，JAVA语言体系在图形图像处理模块上面的研发工作，需要从开发一些基础的，类似实时数学函数构造器和解析器的软件包入手，而不是急于利用第三方代码工具来实现一个不严格的图形图像处理软件...... &nb
MonkeyRunner的使用 dai_lm android MonkeyRunner
要使用MonkeyRunner，就要学习使用Python，哎先抄一段官方doc里的代码作用是启动一个程序（应该是启动程序默认的Activity），然后按MENU键，并截屏 # Imports the monkeyrunner modules used by this program from com.android.monkeyrunner import MonkeyRun
Hadoop-- 海量文件的分布式计算处理方案 datamachine mapreduce hadoop 分布式计算
csdn的一个关于hadoop的分布式处理方案，存档。原帖：http://blog.csdn.net/calvinxiu/article/details/1506112。 Hadoop 是Google MapReduce的一个Java实现。MapReduce是一种简化的分布式编程模式，让程序自动分布到一个由普通机器组成的超大集群上并发执行。就如同ja
以資料庫驗證登入 dcj3sjt126com yii
以資料庫驗證登入由於 Yii 內定的原始框架程式, 採用綁定在UserIdentity.php 的 demo 與 admin 帳號密碼: public function authenticate() { $users=array( &nbs
github做webhooks：[2]php版本自动触发更新 dcj3sjt126com github git webhooks
上次已经说过了如何在github控制面板做查看url的返回信息了。这次就到了直接贴钩子代码的时候了。工具/原料 git github 方法/步骤在github的setting里面的webhooks里把我们的url地址填进去。钩子更新的代码如下： error_reportin
Eos开发常用表达式蕃薯耀 Eos开发 Eos入门 Eos开发常用表达式
Eos开发常用表达式 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2014年8月18日 15:03:35 星期一 &
SpringSecurity3.X--SpEL 表达式 hanqunfeng SpringSecurity
使用 Spring 表达式语言配置访问控制，要实现这一功能的直接方式是在<http>配置元素上添加 use-expressions 属性： <http auto-config="true" use-expressions="true"> 这样就会在投票器中自动增加一个投票器：org.springframework
Redis vs Memcache IXHONG redis
1. Redis中，并不是所有的数据都一直存储在内存中的，这是和Memcached相比一个最大的区别。 2. Redis不仅仅支持简单的k/v类型的数据，同时还提供list，set，hash等数据结构的存储。 3. Redis支持数据的备份，即master-slave模式的数据备份。 4. Redis支持数据的持久化，可以将内存中的数据保持在磁盘中，重启的时候可以再次加载进行使用。 Red
Python - 装饰器使用过程中的误区解读 kvhur JavaScript jquery html5 css
大家都知道装饰器是一个很著名的设计模式，经常被用于AOP(面向切面编程)的场景，较为经典的有插入日志，性能测试，事务处理，Web权限校验， Cache等。原文链接：http://www.gbtags.com/gb/share/5563.htm Python语言本身提供了装饰器语法（@），典型的装饰器实现如下： @function_wrapper de
架构师之mybatis-----update 带case when 针对多种情况更新 nannan408 case when
1.前言. 如题. 2. 代码. <update id="batchUpdate" parameterType="java.util.List"> <foreach collection="list" item="list" index=&
Algorithm算法视频教程栏目记者 Algorithm 算法
课程：Algorithm算法视频教程百度网盘下载地址： http://pan.baidu.com/s/1qWFjjQW 密码: 2mji 程序写的好不好,还得看算法屌不屌！Algorithm算法博大精深。一、课程内容：课时1、算法的基本概念 + Sequential search 课时2、Binary search 课时3、Hash table 课时4、Algor
C语言算法之冒泡排序 qiufeihu c 算法
任意输入10个数字由小到大进行排序。代码： #include <stdio.h> int main() { int i,j,t,a[11]; /*定义变量及数组为基本类型*/ for(i = 1;i < 11;i++){ scanf("%d",&a[i]); /*从键盘中输入10个数*/ } for
JSP异常处理 wyzuomumu Web jsp
1.在可能发生异常的网页中通过指令将HTTP请求转发给另一个专门处理异常的网页中: <%@ page errorPage="errors.jsp"%> 2.在处理异常的网页中做如下声明： errors.jsp: <%@ page isErrorPage="true"%>，这样设置完后就可以在网页中直接访问exc

东南大学王萌 ｜ “神经+符号”学习与多模态知识发现

你可能感兴趣的:(神经网络,大数据,算法,编程语言,python)

东南大学王萌｜ “神经+符号”学习与多模态知识发现