开放知识图谱

陈华钧 | 知识图谱构建，将成为智能金融的突破口

本文转载自公众号：恒生技术之眼。

“

我们太容易被机器下棋这样的事所吸引，以至于现在谈到人工智能就基本都是在说机器学习和深度学习，而相对忽视了与人工智能相关的另外一个重要的方向：知识图谱。

——陈华钧

”

尽管人工智能依靠机器学习技术的进步取得了巨大的进展，例如，AlphaGoZero不依赖人类知识的监督，通过自我强化学习获得极高的棋力，但人工智能在很多方面，如语言理解、视觉场景理解、决策分析等，仍然举步维艰。关键问题在于，机器必须要掌握大量的知识，特别是常识知识才能实现真正类人的智能。

人类知识与机器知识

哲学家柏拉图把知识（Knowledge）定义为“Justified True Belief”，即知识需要满足三个核心要素：合理性（Justified）、真实性（True）、被相信（Believed）。简单而言，知识是人类通过观察、学习和思考有关客观世界的各种现象而获得和总结出的所有事实（Facts）、概念（Concepts）、规则或原则（Rules & Principles）的集合。人类发明了各种手段来描述、表示和传承知识，如自然语言、绘画、音乐、数学语言、物理模型、化学公式等。具有获取、表示和处理知识的能力是人类心智区别于其它物种心智的重要特征。人工智能的核心也是研究怎样用计算机易于处理的方式表示、学习和处理各种各样的知识。知识表示是现实世界的可计算模型 (Computable Model of Reality)，广义的讲，神经网络也是一种知识表示形式。

在人工智能的早期发展流派中，符号派（Symbolism）侧重于模拟人的心智，研究怎样用计算机符号来表示人脑中的知识和模拟心智的推理过程；连接派（Connectionism）侧重于模拟人脑的生理结构，即人工神经网络。符号派一直以来都处于人工智能研究的核心位置。近年来，随着数据的大量积累和计算能力大幅提升，深度学习在视觉、听觉等感知处理中取得突破性进展，进而又在围棋等博弈类游戏、机器翻译等领域获得成功，使得人工神经网络和机器学习获得了人工智能研究的核心地位。深度学习在处理感知、识别和判断等方面表现突出，能帮助构建聪明的AI，但在模拟人的思考过程、处理常识知识和推理，以及理解人的语言方面仍然举步维艰。

符号派关注的核心是知识的表示和推理（KRR：Knowledge Representation and Reasoning）。早在1960年，认知科学家Allan M. Collins提出用语义网络（Semantic Network）来研究人脑的语义记忆。WordNet是典型的语义网络，它定义了名词、动词、形容词和副词之间的语义关系，例如动词之间的蕴含关系（如：“打鼾”蕴含着“睡眠”）等。WordNet被广泛应用于语义消歧等自然语言处理领域。

从“知识库”到“推理机”

1970年，随着专家系统的提出和商业化发展，知识库构建和知识表示更加得到重视。专家系统的基本想法是：专家是基于大脑中的知识来进行决策，因此，人工智能的核心应该是用计算机符号来表示这些知识，并通过推理机模仿人脑对知识进行处理。依据专家系统的观点，计算机系统应该由知识库和推理机两部分组成，而不是由函数等过程性代码组成。早期专家系统最常用的知识表示方法包括基于框架的语言（Frame-based Languages）和产生式规则（Production Rules）等。框架语言主要用于描述客观世界的类别、个体、属性及关系等，较多的被应用于辅助自然语言理解。产生式规则主要用于描述类似于IF-THEN的逻辑结构，适合于刻画过程性知识。

经常与知识表示并提的另外一个重要概念是机器推理，实际上推理相比于机器学习对于高层AI的实现来说可能更加重要。目前AI比较前沿的研究方向都是在考虑怎样把连接主义所推动的机器学习能力与传统符号主义所关注的机器推理问题相结合，以实现感知到认知层的跨越。

让机器像人类一样认知世界

知识图谱说yes

知识图谱的早期理念来自于Web之父Tim Berners Lee于1998年提出的Semantic Web，其最初理想是把基于文本链接的万维网转化成基于实体链接的语义网。语义网十余年的发展积累了大量语义知识库，如：Freebase、DBpedia、Yago、WikiData等。谷歌在吸收语义网相关成果基础上于2012年推出了基于其称之为知识图谱的搜索引擎产品。随后，知识图谱逐步在语义搜索、智能问答、辅助语言理解、辅助大数据分析等很多领域发挥出越来越重要的作用。

1989年，万维网之父、图灵奖获得者Tim Berners-Lee提出构建一个全球化的以“链接”为中心的信息系统（Linked Information System）。任何人都可以通过添加链接把自己的文档链入其中。他认为以链接为中心和基于图的组织方式，比起基于树的层次化组织方式，更加适合于互联网这种开放的系统。这一思想逐步被人们实现，并演化发展成为今天的World Wide Web。

1994年，Tim Berners-Lee 又提出，Web不应该仅仅只是网页之间的互相链接。实际上，网页中所描述的都是现实世界中的实体和人脑中的概念。网页之间的链接实际包含有语义，即这些实体或概念之间的关系，然而机器却无法有效的从网页中识别出其中蕴含的语义。他于1998年提出了Semantic Web（语义互联网）的概念。Semantic Web仍然基于图和链接的组织方式，只是图中的节点代表的不只是网页，而是实体（如：人、机构、地点等），而超链接也被增加了语义描述，具体标明实体之间的关系（如：出生地是、创办人是等）。相对于传统的网页互联网，Semantic Web的本质是知识的互联网或语义互联网。

在语义互联网被提出之后，出现了一大批新兴的语义知识库。如作为谷歌知识图谱后端的Freebase，作为IBM Waston后端的DBPedia和Yago，作为Amazon Alexa后端的True Knowledge，作为苹果Siri后端的Viv等。尤其值得一提的是，2010年谷歌收购了早期语义网公司MetaWeb，并以其开发的Freebase为数据基础之一，于2012年正式推出了称为知识图谱的搜索引擎服务。谷歌知识图谱的宣传口号是：“Things, Not Strings!”。所解决的核心问题是把对文本（String）的网页搜索转化为的对事物（Things）的语义搜索，可以看做是语义互联网的一种商业化实现。

从“后备”到“前锋”，现代知识图谱遇难题

知识图谱并非突然出现的新技术，而是历史上很多相关技术相互影响和继承发展的结果，这包括语义网络、知识表示、本体论、Semantic Web、自然语言处理等，有着来自Web、人工智能和自然语言处理等多方面的技术基因。

从早期的人工智能发展历史来看，Semantic Web是传统人工智能与Web融合发展的结果，是知识表示与推理在Web中的应用；RDF/OWL都是面向Web设计实现的标准化的知识表示语言；而知识图谱则可以看做是Semantic Web的一种简化后的商业实现。

但我们要强调知识图谱与传统专家系统时代的知识工程有显著的不同。首先，传统专家系统的知识库构建大多以实现高端的决策智能为目标，而知识图谱虽然也被用来实现大数据决策分析（如Plantir），其首要的应用目标是辅助搜索和智能问答。另外一方面，与传统专家系统时代主要依靠专家手工获取知识不同，现代知识图谱的显著特点是规模巨大，无法单一依靠人工和专家构建。传统的知识库，如由Douglas Lenat从1984年开始创建的常识知识库Cyc仅包含700万条的事实描述（Assertion），最新的ConceptNet 5.0也仅包含2800万RDF三元组关系描述，而现代知识图谱已经包含超过千亿级别的三元组。

知识图谱的规模化发展

现代知识图谱对知识规模的要求源于“知识完备性”难题。冯诺依曼曾估计单个个体的大脑中的全量知识需要2.4*10²⁰个bits来存储。客观世界拥有不计其数的实体，人的主观世界更加包含有无法统计的概念，这些实体和概念之间又具有更多数量的复杂关系，导致大多数知识图谱都面临知识不完全的困境。在实际的领域应用场景中，知识不完全也是困扰大多数语义搜索、智能问答、知识辅助的决策分析系统的首要难题。

此专家非彼专家

领域知识图谱变身“百事通”

领域知识图谱是相对于通用知识图谱（如DBPedia、Yago、Wikidata等）而言，面向特定领域的知识图谱，如电商、金融、医疗等。相比较而言，领域知识图谱知识来源更多、规模化扩展要求更迅速、知识结构更加复杂、知识质量要求更高、知识的应用形式也更加广泛。

通用知识图谱与领域知识图谱的比较

以比较有代表性的金融领域为例。在金融领域，围绕金融的本体知识建模一直都有不少人在做。在大约10多年前，就有一批做金融信息的结构化描述的人在尝试构建整个金融领域的本体知识模型，其中一直延续到现在的一项工作是FIBO。他们的目标就是希望能够定义整个金融域的规则，并且是采用Top-Down的做法，这是成本非常高昂的工作，而我们现在更多的强调领域知识图谱的构建应该从大量数据中去挖掘和总结。

金融领域比较典型的例子如Kensho采用知识图谱辅助投资顾问和投资研究，国内以恒生电子为代表的金融科技机构以及不少银行、证券机构等也都在开展金融领域的知识图谱构建工作。金融知识图谱构建主要来源于机构已有的结构化数据和公开的公报、研报及新闻的联合抽取等。在知识表示方面，金融概念也具有较高的复杂性和层次性，并较多的依赖规则型知识进行投资因素的关联分析。在应用形式方面，则主要以金融问答和投顾投研类决策分析型应用为主。金融知识图谱的一个显著特点是高度动态性，且需要考虑知识的时效性，对金融知识的时间维度进行建模。

金融知识图谱特点（细化到具体层面论述）

此外金融领域还有一些比较适合于做知识图谱的特点，如文本资源非常丰富，且动态性非常高。大量高度动态的新闻、公报、研报都是自动化获取知识图谱的有力来源，在这方面，我们可以较为深入应用实体识别、大规模自动化词库构建、结合远程监督和深度学习的关系抽取等多方面的图谱构建技术。只要一点一点积累高质量的知识图谱，结合深度学习和自然语言处理等领域的最新进展，金融知识图谱会发挥出门槛式的重大价值。

结语

互联网促成了大数据的集聚，大数据进而促进了人工智能算法的进步。新数据和新算法为规模化知识图谱构建提供了新的技术基础和发展条件，使得知识图谱构建的来源、方法和技术手段都发生极大的变化。知识图谱作为知识的一种形式，已经在语义搜索、智能问答、数据分析、自然语言理解、视觉理解、物联网设备互联等多个方面发挥出越来越大的价值。AI浪潮愈演愈烈，而作为底层支撑的知识图谱赛道也从鲜有问津到缓慢升温，虽然还谈不上拥挤，但作为通往未来的必经之路，注定会走上风口。

OpenKG.CN

中文开放知识图谱（简称OpenKG.CN）旨在促进中文知识图谱数据的开放与互联，促进知识图谱和语义技术的普及和广泛应用。

点击阅读原文，进入 OpenKG 博客。

常州 d8 Rikka's_qwq 算法 c++学习
好难啊哈哈哈大家考得好像都不是很好中午刚出成绩就发了动态了我也真是被自己无语到了t1测试样例时输出的数据没注释掉爆零t2freopen注释掉了爆零啊哈哈t1虽然我写的是最朴素的做法...但好歹能骗40分呢给我炸了正解是这样的#include#defineintlonglong#definedoublelongdouble#definephi(sqrt(5)+1)/2usingnamespacest
hive 使用oracle数据库 sardtass hadoop hive 开源项目
hive使用oracle作为数据源，导入数据使用sqoop或kettle或自己写代码（淘宝的开源项目中有一个xdata就是淘宝自己写的）。感觉sqoop比kettle快多了，淘宝的xdata没用过。hive默认使用derby作为存储表信息的数据库，默认在哪启动就在哪建一个metadata_db文件放数据，可以在conf下的hive-site.xml中配置为一个固定的位置，这样不论在哪启动都可以了。
5个冷门的Adobe系列软件小技巧 reddingtons adobe
在当今数字化时代，许多学生和教育工作者可以利用教育邮箱免费访问Adobe全系列软件。这意味着您不仅可以使用Photoshop、Illustrator等热门软件，还可以体验Adobe的其他强大工具。由于这些技巧涉及到一些收费软件，因此免费用户可能无法使用。接下来，我们将分享五个冷门的Adobe系列软件小技巧，希望能帮助您更好地利用这些工具。1.在AdobeAcrobat中添加水印在处理PDF文件时，
补偿算法之相位补偿算法傻童:CPU Qt 自动控制理论算法 android
补偿算法之相位补偿算法相位补偿算法：在一些控制系统中，系统的相位裕度可能不足，导致系统稳定性变差。相位补偿算法通过增加或减少特定频率下的相角来调整系统的相位特性。例如，在电机调速系统中，为了提高系统在高速运行时的稳定性，可能会采用相位超前补偿算法，通过在控制回路中添加适当的滤波器或控制器结构，使系统在高频段的相位提前，从而增加相位裕度，防止系统出现振荡或失稳现象。相位补偿算法的核心目标是对信号或系
leetcode刷题（javaScript）——栈、单调栈相关场景题总结三月的一天 Leetcode刷题技巧总结 javascript leetcode linux
在LeetCode刷题中，栈是一个常用的数据结构，可以帮助解决很多问题。以下是一些需要使用栈的方法，以及单调栈的应用场景：栈的使用技巧：栈常用于解决与括号匹配相关的问题，如括号序列的有效性、最长有效括号等。栈也常用于解决逆波兰表达式、表达式求值等与计算相关的问题。栈可以用于解决深度优先搜索（DFS）中的回溯问题，如组合、排列等。栈还可以用于解决某些需要“后进先出”（LIFO）特性的问题，如某些遍历
【图论】数组模拟邻接表存储(链式前向星) ars4me 图论数据结构图论邻接表前向星
图的邻接表存储法又叫链式存储法可以用数组模拟定义structedge{intnext;//下一条边的编号intto;//这条边到达的点intdis;//这条边的长度}edge[size];//COYG核心代码加入一条从from到to距离为dis的单向边inlinevoidadd(intfrom,intto,intdis){edge[++num].next=head[from];edge[num].
Netty源码—2.Reactor线程模型一东阳马生架构 Netty应用与源码 Netty Reactor线程模型
大纲1.关于NioEventLoop的问题整理2.理解Reactor线程模型主要分三部分3.NioEventLoop的创建4.NioEventLoop的启动1.关于NioEventLoop的问题整理一.默认下Netty服务端起多少线程及何时启动？答：默认是2倍CPU核数个线程。在调用EventExcutor的execute(task)方法时，会判断当前线程是否为Netty的Reactor线程，也就
src小白入门简介吃饱饭，练球安全网络安全 src
隐雾src01为什么别人挖得到洞你挖不到？相信有很多师傅都有在网上看过不少别人发的挖洞的文章为什么你看完之后感觉自己懂了，但真正去实战的时候却挖不到？这就涉及到一个知识转化率的问题在读完这篇文章之后你有没有抓住细节、抓住该学习的点呢？以前怎么样不重要，现在教你们怎么去读一篇文章，然后学习到自己想要的这里我拿北山的一篇文章做例子：https://mp.weixin.qq.com/s?__biz=Mz
Starrocks使用中一些总结 WYRM_GOLD Starrocks 数据库数据仓库数据库开发
1、实时写入的注意事项数据表如果是每天写入，要创建分区(推荐按天分区)。表模型选择更新模型查询的维度列，整数类型列放在前面，有利于快速的查询表分区要设置过期时间，尽可能保留最近一年的数据。总结：1、分区是为了分区内数据查询时扫描的数据量减少，提高查询效率2、更新模型比组件模型更适合实时数据的写入，使用更新模型后IO和CPU使用都会有明显的下降。3、对应上述第三项中会提高查询效率，字符的扫描没有数值
python爬虫之scrapy框架入门，万字教学，从零开始到实战演练，超详细！！！（21）盲敲代码的阿豪 python之爬虫系统教学 python 爬虫 scrapy
文章目录前言1、scrapy的概念和流程1.1学习目标1.2scrapy的概念1.3scrapy框架的作用1.4scrapy的工作流程1.5总结2、scrapy的入门使用2.1学习目标2.2安装scrapy框架2.3scrapy项目开发流程2.4创建项目2.5创建爬虫文件2.6scrapy项目文件说明2.7案例演示2.8实战案例（抓取链家租房信息，存入本地）2.8.1修改items.py文件，在这
人工智能之数学基础：矩阵的范数每天五分钟玩转人工智能机器学习深度学习之数学基础人工智能矩阵算法线性代数范数
本文重点在前面课程中，我们学习了向量的范数，在矩阵中也有范数，本文来学习一下。矩阵的范数对于分析线性映射函数的特性有重要的作用。矩阵范数的本质矩阵范数是一种映射，它将一个矩阵映射到一个非负实数。矩阵的范数前面我们学习了向量的范数，只有当满足几个条件的时候，此时才可以，那么矩阵也是一样的，当满足下面的条件的时候，才可以定义||A||为矩阵A的范数矩阵范数的性质连续性矩阵范数是连续的函数。即如果矩阵序
【ai】mocap：conda 安装python3.8+ cuda+ pytorch+torchaudio、torchvision 等风来不如迎风去 AI入门与实战人工智能 ubuntu conda
MotionCapubuntu18.04不知道为啥会依赖于ffmpeg、xorg渲染？安装pytorch就是会带上cudacudnn啥的pytorch【ai】tx2nx：安装torch、torchvisionforyolov5这里就发现pytorch和torchvision有依赖关系的，还涉及到rapidjson所以python的环境隔离很重要。核心库-cudatoolkit=11.3-pytor
32.代码随想录算法训练营第三十二天|509. 斐波那契数,70. 爬楼梯，746. 使用最小花费爬楼梯白鹭鸣鸣！算法 java dp
32.代码随想录算法训练营第三十二天|509.斐波那契数,70.爬楼梯，746.使用最小花费爬楼梯DP数组的定义以及下标的含义递推公式动态规划的初始化是很重要的遍历顺序打印数组509.斐波那契数-力扣（LeetCode）斐波那契数（通常用F(n)表示）形成的序列称为斐波那契数列。该数列由0和1开始，后面的每一项数字都是前面两项数字的和。也就是：F(0)=0，F(1)=1F(n)=F(n-1)+F(
西门子PLC S7-1200实例详解：涉及安川机器人通信、伺服电机控制及传感器数据轮询 DMQAfdLc 机器人大数据
西门子PLCS7-1200程序实例解析：电气编程者的技术之旅随着科技的飞速发展，工业自动化已成为现代制造业的核心。西门子PLC以其卓越的性能和广泛的应用，成为了工业控制领域的佼佼者。在本次技术博客中，我们将深入探讨西门子PLCS7-1200在博图版本V15下的应用实例，为电气编程者提供宝贵的学习借鉴。一、西门子PLC与安川机器人TCPIP通讯在工业自动化领域，PLC与机器人之间的通讯至关重要。西门
每日一题——二叉树的深度 tt555555555555 面经 C语言算法题算法数据结构
二叉树的最大深度问题描述示例方法一：递归法代码实现代码解析方法二：层次遍历（广度优先搜索）代码实现代码解析总结问题描述给定一个二叉树的根节点root，返回其最大深度。二叉树的最大深度是指从根节点到最远叶子节点的最长路径上的节点数。示例示例1输入：root=[3,9,20,null,null,15,7]输出：3解释：从根节点到最远叶子节点的最长路径为3->20->15或3->20->7，路径长度为3
python 数据可视化matplotib库安装与使用范哥来了信息可视化 python 开发语言
要使用matplotlib库进行数据可视化，首先你需要确保已经安装了该库。如果你还没有安装，可以通过Python的包管理器pip来安装它。在你的命令行工具中运行以下命令来安装matplotlib：pipinstallmatplotlib安装完成后，你就可以开始使用matplotlib来创建图表了。下面是一个简单的例子，演示如何使用matplotlib绘制一个基本的折线图。这个例子可以被添加到你当前
python读取配置参数的多种方式 WYRM_GOLD python
使用多个配置文件：根据不同的环境（如开发、测试、生产）使用不同的配置文件。使用环境变量：利用操作系统的环境变量来获取参数。使用命令行参数：根据传入的命令行参数选择配置。使用JSON或YAML文件：配置文件可以使用JSON或YAML格式，支持多种环境的变量。方法1、使用多个配置文件假设有两个配置文件：config_dev.ini和config_prod.ini。config_dev.ini:[DEF
HiveMetastore 的架构简析 houzhizhen hive hive
HiveMetastore的架构简析HiveMetastore是Hive元数据管理的服务。可以把元数据存储在数据库中。对外通过api访问。hive_metastore.thrift对外提供的Thrift接口定义在文件standalone-metastore/src/main/thrift/hive_metastore.thrift中。内容包括用到的结构体和枚举，和常量，和rpcService。如分
【微信小程序（云开发模式）变通实现DeepSeek支持语音】技术与健康微信小程序 notepad++小程序
整体架构前端（微信小程序）：使用微信小程序云开发能力，实现录音功能。将录音文件上传到云存储。调用云函数进行语音识别和DeepSeek处理。界面模仿DeepSeek，支持文本编辑。后端（云函数+Node.js）：使用云函数调用腾讯云语音识别（ASR）服务。调用DeepSeekAPI处理文本。步骤1：初始化云开发环境在微信开发者工具中创建小程序项目，并开通云开发。在project.config.jso
为了拯救minerU镜像制作过程给大家带来的痛苦，我决定放一个备份到阿里云上几道之旅人工智能智能体及数字员工人工智能
文章目录第零步，如果你只是想用这个镜像，那你后面的都不用看。第一步，搜索阿里云，并进入官网第二步，把光标放在产品上，就会出现所有的产品目录第三步容器中，选择容器镜像服务第四步，点击“免费试用，就会让你登录”第五步，点击管理控制台第六步，示例列表中，选择个人版第七步，访问凭证中，设置固定密码第八步，在命名空间中，创建命名空间第九步：创建一个镜像仓库第十步，它会直接跳转到一个说明文档，告诉你具体该怎么
synchronized 的特性与机制坚持拒绝熬夜 java 开发语言笔记
目录1.synchronized的特性锁策略(1)既是乐观锁也是悲观锁(2)既是轻量级锁,也是重量级锁(3)轻量级锁基于自旋实现,重量级锁基于挂起等待实现(4)不是读写锁(5)是可重入锁(6)是非公平锁2.synchronized的使用3.synchronized的锁机制偏向锁自旋锁和重量级锁4.synchronized的优化策略1.锁的消除2.锁的粗化1.synchronized的特性(1)既是
react-11（自定义hook、useRef）我只是想饮一杯奶茶 react JavaScript react.js javascript 前端 typescript
自定义hook主要是我们利用已有的hook,实现hook的效果，并在其他地方引用。（感觉像是封装了一个方法）//定义constfetchHook=(url)=>{const[data,setData]=useState({})const[loading,setLoading]=useState('')useEffect(()=>{setLoading('loading')axios.get(url
QMap 多重嵌套金色暖阳 qt 算法 QMap 数据结构
QMap多重嵌套，通过迭代器修改内层的mapQMapmap_id;map_id.insert(1,22);map_id.insert(2,44);map_id.insert(5,55);if(map_id.contains(2)){qDebug()>map_test;map_test.insert(1,map_id);qDebug()>::iteratorit=map_test.begin();f
TCP 客户端 - 服务器通信程序搭建 Oracle_666 网络服务器 tcp/ip
一、概述本文档针对TCP客户端程序和TCP服务器程序。客户端程序会连接到服务器并发送带有自定义协议格式的数据，而服务器程序则负责监听客户端连接，接收并处理这些数据。自定义协议格式为：先发送2字节网络字节序的长度头，随后是变长的数据负载。二、客户端程序2.1代码结构#include#include#include#include#include#include#definePORT8080//定义服
高云FPGA的管脚约束文件的复制在岸上走的鱼 fpga开发嵌入式硬件硬件架构
问：Gowin里面能不能直接拷贝一个管脚约束文件进去用？答：可以直接拷贝，但是拷贝前后两个工程对应的芯片必须要是同一个芯片拷贝方法:第一步：按照被拷贝约束文件对应的芯片新建一个工程，然后将原工程文件夹“src”里面的“.cst”文件拷到新建工程的相同目录下，第二步：回到新建工程目录下，点击芯片名右击，如下图：将“.V”文件和“.cst”文件一同加入这个工程，最后综合，布局布线就可以了，注意：有时拷
区块链驱动金融第四章——比特币实用指南：存储与使用全解析小DuDu 区块链金融
在比特币的世界里，存储和使用比特币是每个参与者都必须面对的重要环节。第四章围绕这两个关键方面展开了详细的阐述，为我们提供了全面而深入的见解。现在，就让我们一起走进这一章，探索如何安全、便捷地存储和使用比特币。比特币的存储方式：多样选择，各有优劣简单本地储存：便捷与风险并存把比特币存储在本地设备上是最直接的方式，就像把钱放在钱包里一样方便。人们通常会使用比特币钱包软件来管理比特币和私钥，通过这些软件
让你的 Git 历史更直观 —— 体验 VS Code 的 Interactive Git Log 插件小DuDu 工具 git vscode
在日常开发中，我们离不开Git。但原生的gitlog命令虽然强大，却不够直观，查看历史记录时往往需要一遍遍地翻阅命令行输出，效率并不高。今天，就来介绍一款让你的Git历史更加可视化的VSCode插件——InteractiveGitLog！✨为什么选择InteractiveGitLog？Git版本管理的核心是commit记录，但传统的gitlog命令行方式过于“朴素”，让我们在查找某个特定提交时非常
FlinkCDC实战：将 MySQL 数据同步至 ES 小DuDu flink mysql
当前需要处理的业务场景:将订单表和相关联的表(比如:商品表、子订单表、物流信息表)组织成宽表,放入到ES中,加速订单数据的查询.同步数据到es.概述1.什么是CDC2.什么是FlinkCDC3.FlinkCDCConnectors和Flink的版本映射实战1.宽表查询1.1创建mysql表1.2启动Flink集群和FlinkSQLCLI1.3在FlinkSQLCLI中使用FlinkDDL创建表1.
Spring Boot 3.4.0 发布：功能概览与示例小DuDu Java spring boot java
SpringBoot3.4.0带来了许多增强功能，使现代应用开发更加高效、便捷和强大。以下是最新功能的完整概述，以及一些帮助您快速入门的代码示例。1.应用程序版本管理SpringBoot引入了spring.application.version属性，方便开发者设置和访问应用程序版本。示例在application.properties中：spring.application.version=1.2.
NLU-预训练模型-2018：Bert（二）【“Masked LM”缺点：①预训练与微调不一致；②忽略了掩码位置间的依赖关系】【复杂度：O(n^2·d)；n：输入序列长度（规定最长512）】 u013250861 #NLP/词向量_预训练模型 bert 人工智能深度学习
五、BERT中的词嵌入1、为什么要使用BERT的嵌入使用BERT从文本数据中提取特征，即单词和句子的嵌入向量。我们可以用这些词和句子的嵌入向量做什么？首先，这些嵌入对于关键字/搜索扩展、语义搜索和信息检索非常有用。例如，如果你希望将客户的问题或搜索与已经回答的问题或文档化的搜索相匹配，这些表示将帮助准确的检索匹配客户意图和上下文含义的结果，即使没有关键字或短语重叠。其次，或许更重要的是，这些向量被
插入表主键冲突做更新 a-john
有以下场景：用户下了一个订单，订单内的内容较多，且来自多表，首次下单的时候，内容可能会不全（部分内容不是必须，出现有些表根本就没有没有该订单的值）。在以后更改订单时，有些内容会更改，有些内容会新增。问题：如果在sql语句中执行update操作，在没有数据的表中会出错。如果在逻辑代码中先做查询，查询结果有做更新，没有做插入，这样会将代码复杂化。解决： mysql中提供了一个sql语
Android xml资源文件中@、@android:type、@*、？、@+含义和区别 Cb123456 @+@?@*
一.@代表引用资源 1.引用自定义资源。格式：@[package:]type/name android：text="@string/hello" 2.引用系统资源。格式：@android:type/name android:textColor="@android:color/opaque_red"
数据结构的基本介绍天子之骄数据结构散列表树、图线性结构价格标签
数据结构的基本介绍数据结构就是数据的组织形式，用一种提前设计好的框架去存取数据，以便更方便，高效的对数据进行增删查改。正确选择合适的数据结构，对软件程序的高效执行的影响作用不亚于算法的设计。此外，在计算机系统中数据结构的作用也是非同小可。例如常常在编程语言中听到的栈，堆等，就是经典的数据结构。经典的数据结构大致如下：一：线性数据结构 (1)：列表 a
通过二维码开放平台的API快速生成二维码一炮送你回车库 api
现在很多网站都有通过扫二维码用手机连接的功能，联图网(http://www.liantu.com/pingtai/)的二维码开放平台开放了一个生成二维码图片的Api,挺方便使用的。闲着无聊，写了个前台快速生成二维码的方法。 html代码如下:(二维码将生成在这div下) ? 1 &nbs
ImageIO读取一张图片改变大小 3213213333332132 java IO image BufferedImage
package com.demo; import java.awt.image.BufferedImage; import java.io.File; import java.io.IOException; import javax.imageio.ImageIO; /** * @Description 读取一张图片改变大小 * @author FuJianyon
myeclipse集成svn（一针见血） 7454103 eclipse SVN MyEclipse
&n
装箱与拆箱----autoboxing和unboxing darkranger J2SE
4.2　自动装箱和拆箱基本数据(Primitive)类型的自动装箱(autoboxing)、拆箱(unboxing)是自J2SE 5.0开始提供的功能。虽然为您打包基本数据类型提供了方便，但提供方便的同时表示隐藏了细节，建议在能够区分基本数据类型与对象的差别时再使用。 4.2.1　autoboxing和unboxing 在Java中，所有要处理的东西几乎都是对象(Object)
ajax传统的方式制作ajax aijuans Ajax
//这是前台的代码 <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <% String path = request.getContextPath(); String basePath = request.getScheme()+
只用jre的eclipse是怎么编译java源文件的？ avords java eclipse jdk tomcat
eclipse只需要jre就可以运行开发java程序了，也能自动编译java源代码，但是jre不是java的运行环境么，难道jre中也带有编译工具？还是eclipse自己实现的？谁能给解释一下呢问题补充：假设系统中没有安装jdk or jre，只在eclipse的目录中有一个jre，那么eclipse会采用该jre，问题是eclipse照样可以编译java源文件，为什么呢？ &nb
前端模块化 bee1314 模块化
背景：前端JavaScript模块化，其实已经不是什么新鲜事了。但是很多的项目还没有真正的使用起来，还处于刀耕火种的野蛮生长阶段。 JavaScript一直缺乏有效的包管理机制，造成了大量的全局变量，大量的方法冲突。我们多么渴望有天能像Java（import），Python (import)，Ruby(require)那样写代码。在没有包管理机制的年代，我们是怎么避免所
处理百万级以上的数据处理 bijian1013 oracle sql 数据库大数据查询
一.处理百万级以上的数据提高查询速度的方法： 1.应尽量避免在 where 子句中使用!=或<>操作符，否则将引擎放弃使用索引而进行全表扫描。 2.对查询进行优化，应尽量避免全表扫描，首先应考虑在 where 及 o
mac 卸载 java 1.7 或更高版本征客丶 java OS
卸载 java 1.7 或更高 sudo rm -rf /Library/Internet\ Plug-Ins/JavaAppletPlugin.plugin 成功执行此命令后，还可以执行 java 与 javac 命令 sudo rm -rf /Library/PreferencePanes/JavaControlPanel.prefPane 成功执行此命令后，还可以执行 java
【Spark六十一】Spark Streaming结合Flume、Kafka进行日志分析 bit1129 Stream
第一步，Flume和Kakfa对接，Flume抓取日志，写到Kafka中第二部，Spark Streaming读取Kafka中的数据，进行实时分析本文首先使用Kakfa自带的消息处理（脚本）来获取消息，走通Flume和Kafka的对接 1. Flume配置 1. 下载Flume和Kafka集成的插件，下载地址：https://github.com/beyondj2ee/f
Erlang vs TNSDL bookjovi erlang
TNSDL是Nokia内部用于开发电信交换软件的私有语言，是在SDL语言的基础上加以修改而成，TNSDL需翻译成C语言得以编译执行，TNSDL语言中实现了异步并行的特点，当然要完整实现异步并行还需要运行时动态库的支持，异步并行类似于Erlang的process（轻量级进程），TNSDL中则称之为hand，Erlang是基于vm(beam)开发，
非常希望有一个预防疲劳的java软件, 预防过劳死和眼睛疲劳,大家一起努力搞一个 ljy325 企业应用
　非常希望有一个预防疲劳的java软件，我看新闻和网站，国防科技大学的科学家累死了，太疲劳，老是加班，不休息，经常吃药，吃药根本就没用，根本原因是疲劳过度。我以前做java,那会公司垃圾，老想赶快学习到东西跳槽离开，搞得超负荷，不明理。深圳做软件开发经常累死人，总有不明理的人，有个软件提醒限制很好，可以挽救很多人的生命。相关新闻：（1）IT行业成五大疾病重灾区：过劳死平均37.9岁
读《研磨设计模式》-代码笔记-原型模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * Effective Java 建议使用copy constructor or copy factory来代替clone()方法： * 1.public Product copy(Product p){} * 2.publi
配置管理---svn工具之权限配置 chenyu19891124 SVN
今天花了大半天的功夫，终于弄懂svn权限配置。下面是今天收获的战绩。安装完svn后就是在svn中建立版本库，比如我本地的是版本库路径是C:\Repositories\pepos。pepos是我的版本库。在pepos的目录结构 pepos component webapps 在conf里面的auth里赋予的权限配置为 [groups]
浅谈程序员的数学修养 comsci 设计模式编程算法面试招聘
浅谈程序员的数学修养
批量执行 bulk collect与forall用法 daizj oracle sql bulk collect forall
BULK COLLECT 子句会批量检索结果，即一次性将结果集绑定到一个集合变量中，并从SQL引擎发送到PL/SQL引擎。通常可以在SELECT INTO、 FETCH INTO以及RETURNING INTO子句中使用BULK COLLECT。本文将逐一描述BULK COLLECT在这几种情形下的用法。有关FORALL语句的用法请参考：批量SQL之 F
Linux下使用rsync最快速删除海量文件的方法 dongwei_6688 OS
1、先安装rsync：yum install rsync 2、建立一个空的文件夹：mkdir /tmp/test 3、用rsync删除目标目录：rsync --delete-before -a -H -v --progress --stats /tmp/test/ log/这样我们要删除的log目录就会被清空了，删除的速度会非常快。rsync实际上用的是替换原理，处理数十万个文件也是秒删。
Yii CModel中rules验证规格 dcj3sjt126com rules yii validate
Yii cValidator主要用法分析： yii验证rulesit 分类： Yii yii的rules验证 cValidator主要属性 attributes ,builtInValidators,enableClientValidation,message,on,safe,skipOnError
基于vagrant的redis主从实验 dcj3sjt126com vagrant
平台: Mac 工具: Vagrant 系统: Centos6.5 实验目的: Redis主从实现思路制作一个基于sentos6.5, 已经安装好reids的box, 添加一个脚本配置从机, 然后作为后面主机从机的基础box 制作sentos6.5+redis的box mkdir vagrant_redis cd vagrant_
Memcached(二)、Centos安装Memcached服务器 frank1234 centos memcached
一、安装gcc rpm和yum安装memcached服务器连接没有找到，所以我使用的是make的方式安装，由于make依赖于gcc，所以要先安装gcc 开始安装，命令如下，[color=red][b]顺序一定不能出错[/b][/color]：建议可以先切换到root用户，不然可能会遇到权限问题：su root 输入密码...... rpm -ivh kernel-head
Remove Duplicates from Sorted List hcx2013 remove
Given a sorted linked list, delete all duplicates such that each element appear only once. For example,Given 1->1->2, return 1->2.Given 1->1->2->3->3, return&
Spring4新特性——JSR310日期时间API的支持 jinnianshilongnian spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
浅谈enum与单例设计模式 247687009 java 单例
在JDK1.5之前的单例实现方式有两种(懒汉式和饿汉式并无设计上的区别故看做一种)，两者同是私有构造器，导出静态成员变量，以便调用者访问。第一种 package singleton; public class Singleton { //导出全局成员 public final static Singleton INSTANCE = new S
使用switch条件语句需要注意的几点 openwrt c break switch
1. 当满足条件的case中没有break，程序将依次执行其后的每种条件（包括default）直到遇到break跳出 int main() { int n = 1; switch(n) { case 1: printf("--1--\n"); default: printf("defa
配置Spring Mybatis JUnit测试环境的应用上下文 schnell18 spring mybatis JUnit
Spring-test模块中的应用上下文和web及spring boot的有很大差异。主要试下来差异有：单元测试的app context不支持从外部properties文件注入属性 @Value注解不能解析带通配符的路径字符串解决第一个问题可以配置一个PropertyPlaceholderConfigurer的bean。第二个问题的具体实例是：
Java 定时任务总结一 tuoni java spring timer quartz timertask
Java定时任务总结一.从技术上分类大概分为以下三种方式： 1.Java自带的java.util.Timer类，这个类允许你调度一个java.util.TimerTask任务; 说明： java.util.Timer定时器，实际上是个线程，定时执行TimerTask类 &
一种防止用户生成内容站点出现商业广告以及非法有害等垃圾信息的方法 yangshangchuan rank 相似度计算文本相似度词袋模型余弦相似度
本文描述了一种在ITEYE博客频道上面出现的新型的商业广告形式及其应对方法，对于其他的用户生成内容站点类型也具有同样的适用性。最近在ITEYE博客频道上面出现了一种新型的商业广告形式，方法如下： 1、注册多个账号（一般10个以上）。 2、从多个账号中选择一个账号，发表1-2篇博文

陈华钧 | 知识图谱构建，将成为智能金融的突破口

你可能感兴趣的:(陈华钧 | 知识图谱构建，将成为智能金融的突破口)