小虎viito

知识图谱商业应用、介绍

文章目录
@[toc]
一、知识图谱商业应用
01 唯品金融大数据
02 PlantData知识图谱数据智能平台
03 拍拍贷图数据库技术
04 CN-DBpedia
05 OpenKG.CN——开放的中文知识图谱
06 楚辞
07 海致大数据
08 腾讯云星图
09 网感至察
10 慧科技术 - 商业AI（NLP + 品牌Logo识别）
二、相关科研机构与算法框架
2.1 复旦大学 Knowledge Works
2.1.1 开源库：FudanDNN 基于深度学习的中文自然语言处理工具。
2.1.2 CN-DBpedia接口——解释型
2.1.3 Probaseplus API接口
2.1.4 CN-Probase接口——概念型
2.1.5 Shorttext Parsing API，短文本依存分析接口
2.1.6 Entity Understanding API接口
2.1.7 数眼科技
2.1.8 额外
2.2 思知（OwnThink）
2.3 Zhishi.me
2.4 交大的Acenap
2.5 清华大学的openKE
2.6 自然语言处理工具包HanLP
2.7 scikit-kge: MIT知识图谱embedding工具包
2.8 RDFox: 牛津大学的知识库推理工具（推荐）
2.9 中国知网
延伸：语知科技的接口非常丰富！
2.10 浙江大学：创新设计产品库
2.11 中草药知识服务系统
2.12 中国工程科技知识中心
2.13 NLPIR
2.14 开放域中文知识图谱《大词林》
2.15 北航 - 中文知识图谱
延伸一：一文揭秘！自底向上构建知识图谱全过程
一、知识图谱商业应用
01 唯品金融大数据
使用的是OrientDB，Orientdb提供了大量的接口，其中最常用的就是Gremlin和sql。

Gremlin是Apache TinkerPop 框架下的图遍历语言。Gremlin是一种函数式数据流语言，可以使得用户使用简洁的方式表述复杂的图的遍历或查询，大部分图数据库都支持Gremlin。示例图总共拥有12个节点（Vertex） 11条边（Edge）。1521537893115977.png

唯品金融在使用Orientdb的开发过程中遇到的最大问题，是数据库初始化时的批量写入速度较慢，由于Vertex和Edge数量在10亿数量级，在没有优化的情况下，单台服务器写入完整数据需要几天。

02 PlantData知识图谱数据智能平台
地址：http://www.hiekn.com/KGIndex/index.html

PlantData是一个用知识图谱技术解决数据关联、数据语义、数据智能的平台。

自主研发的PlantData图谱数据智能平台，致力于推进知识图谱在产业界的落地发展，让数据智能更好的支撑商业智能和人工智能。

多源异构数据，其中非结构化数据有一定比例；

数据中存在一定数量不同类别的实体；

业务上更加关注数据中实体的关联，而不仅仅是数据本身…

03 拍拍贷图数据库技术
目前将用户信息，设备信息及社交关系构建了一个异构网络，并将该异构网络图应用在用户关联分析及反欺诈检测场景。

传统的方式上，我们的数据都是存储在RDMS上，要查询用户的关联关系的时候，都是通过关联多张表来实现。但是这种方式存在很多的问题：

a. 这些表相应都较大，在做表关联的时候效率非常低下；
b. 对于关系的层次支持非常有限，出入度很大的结点，产生的中间结果会非常大；
c. 对于图上的查询不够灵活。
这些都极大地限制了我们分析能力和分析效率。出于以上这些痛点，我们引入了titan图形数据库。每天会通过改写的Titan Bulkload将10亿+结点信息和500亿+左右的关系数据导入Titan后台HBase生成一张包含13类节点和15类边的复杂异构网络。通过该网络，可以方便快速地回答以下类似问题：1) 和用户A关联的用户有哪些；2) 和用户A关联的用户有什么特征；3) 用户A和用户B怎么关联在一起的。

下图是我们将图数据库应用于反欺诈中的示例图：

根据原始的数据图我们可以对用户做以下调查分析，来确定特定的用户是不是欺诈用户或者是不是与欺诈用户有关联：

通过特定规则筛选可疑用户
查看与可疑用户有特定关联的用户
查看与可疑用户有特定关联的所有用户组成的子网的网络特征及用户特征
分析特定用户可以通过什么样的关联关系关联在一起
最多可分析6层关联关系的数据
通过该方式，我们大大减少了调查过程中的工作量，整体效率提升了25%+。

04 CN-DBpedia
样例数据文件是txt格式，每行一条数据，每条数据是一个(实体名称，属性名称，属性值)的三元组，中间用tab分隔，具体如下所示。

【复旦大学简称复旦】

包含900万+的百科实体以及6700万+的三元组关系。其中mention2entity信息110万+，摘要信息400万+，标签信息1980万+，infobox信息4100万+

该数据仅供学术研究使用，商用请联系我们获取授权

http://kw.fudan.edu.cn/cndbpedia/download/

05 OpenKG.CN——开放的中文知识图谱
中文开放知识图谱（简称OpenKG.CN）旨在促进中文知识图谱数据的开放与互联，促进知识图谱和语义技术的普及和广泛应用。

知识图谱旨在通过建立数据之间的关联链接，将碎片化的数据有机的组织起来，让数据更加容易被人和机器理解和处理，并为搜索、挖掘、分析等提供便利，为人工智能的实现提供知识库基础。知识图谱涉及的技术领域包括：知识表示、自然语言理解、智能问答、知识抽取、链接数据、图数据库、图挖掘、常识推理等。

06 楚辞
楚辞以语义网为理论基础，致力于建设中文语义知识库，解决歧义问题，把知识嵌入到各类信息中。

知识结构中有：

项目描述（DOAP）词汇集
项目描述（DOAP）词汇集使用了W3C的RDF和网络本体语义进行描述。

Muninn坟墓本体
Muninn坟墓本体的意思是用于处理人类的遗体。

还有比较好玩的：

关于功夫、功法的本体、关于能力、技能的本体、有关五行的基础本体、有关感觉的基础本体、有关症状的本体、有关商业模式画布的本体

联谊的nodes,还有几个方向，不过好像里面没货

07 海致大数据
http://www.haizhi.com/solution.html

海致大数据核心团队在参与研发了全球第一个中文通用知识图谱平台之后，致力于将这一大数据时代的核心技术向金融产业进行垂直化研发，推出了业界首个金融领域知识图谱平台——海致智能金融知识图谱1.0，其具备强大的自然语言处理能力，包括模板识别、实体识别、情感分析等，也具备领先的关系挖掘算法引擎，是海致大数据多年研发与客户服务的最新成果。

08 腾讯云星图

是一个图数据库和图计算引擎的一体化平台：融合治理异构异质数据；提供关联查询、可视化图分析、图挖掘、机器学习和规则引擎；支持万亿关联关系数据的快速检索、查找和浏览；挖掘隐藏关系并模型化业务经验。作为金融AI风控等泛安全领域知识图谱解决方案，星图增强企业业务，催新商业模式。

金融
星图智能平台运用大数据、知识图谱、人工智能等技术，并围绕监管科技服务于金融行业，可提升金融机构合规和风控能力，从而帮助实现行业人工智能，为金融环境快速而稳健的发展贡献前沿科技的力量。在对公业务中，星图可深耕大数据，帮助金融合作伙伴存储其商业客户大数据，梳理客户关系以高效挖掘潜在商业价值；在对私业务方面，星图可在预测新客户的潜在风险和检测恶意用户团伙等方面提供精准服务。
泛安全
星图智能平台从大数据中深度挖掘关联关系，可准实时分析多至万亿级海量关系数据，转化为关系图谱数据，编织线上线下社交的泛安全专属知识图谱。结合专属的图计算引擎、机器学习技术和业务专家经验打造泛安全人工智能：线上可帮助新兴互联网公司梳理用户关系实现精准营销等，线下可有力支撑公安机关展开情报研判分析、犯罪团伙跟踪以及重大事情预警等。
09 网感至察

10 慧科技术 - 商业AI（NLP + 品牌Logo识别）
https://www.wisers.com.cn/

二、相关科研机构与算法框架
2.1 复旦大学 Knowledge Works
http://kw.fudan.edu.cn/

开源库、开源工具、创业项目（数眼科技）

2.1.1 开源库：FudanDNN 基于深度学习的中文自然语言处理工具。
复旦深度网络中文自然语言处理工具FudanDNN-NLP4.0（在3.0的基础上新增上下文相关问答。分为两种情况：第一种情况处理类似上一句问“今天北京天气如何？”，然后追问“上海呢？”的情况；另一种情况是根据对话主题展开、转换和递进给出合适的回答；多轮对话。处理类似订购机票的场景。不同场景可以根据对话进展自由切换，并且期间可插入其他问答；海量自定义问答对的高效检索。检索匹配时考虑同义词替换，可根据发音相似性纠正可能的错误，并且支持一次提问包括多个问题的情况；可为每一位用户定义各自的上下文信息；图形客户端用于系统演示和调试，支持本地或服务器快速部署；问答过程中检测禁用词功能）
C++所写，专门用于商业环境
github：https://github.com/FudanDNN/FudanDNN
blog:http://homepage.fudan.edu.cn/zhengxq/deeplearning/

2.1.2 CN-DBpedia接口——解释型
提供全套API，并且免费开放使用。如需大规模调用请联系[email protected]索取APIKEY。

（1） api/cndbpedia/ment2ent
输入实体指称项名称(mention name)，返回对应实体(entity)的列表，json格式。

{"status": "ok", "ret": ["红楼梦（中国古典四大名著之一）", "红楼梦（2010年李少红执导的古装情感剧）", "红楼梦（1987年陈晓旭、欧阳奋强主演央视版电视剧）"}
1
（2） api/cndbpedia/avpair
输入实体名，返回实体全部的三元组知识

{"status": "ok", "ret": [["中文名", "复旦大学"], ["英文名称", "Fudan University"], ["简称", "复旦·FUDAN"], ["创办时间", "1905年09月14日"], ["类别", "公立大学"], ["学校类型", "综合"]}
1
（3） api/cndbpedia/value
给定实体名和属性名，返回属性值

{"status": "ok", "ret": ["Fudan University"]}
1
2.1.3 Probaseplus API接口
pbapi/getconcepts
输入一个英文或中文的实体或概念名，返回其概念列表，返回格式为json格式。

查询航空母舰的第1-50个概念（第一页）
http://knowledgeworks.cn:20314/probaseplus/pbapi/getconcepts?kw=航空母舰&start=0
返回值：{"numcon": 73, "concept": [["船", 15], ...]}
表示航空母舰在CN-Probase中有73个概念，最具有代表性的概念是船。
1
2
3
4
点评：该接口专用于多义词

pbapi/getentities
输入一个英文或中文的概念名，返回其包含的实体列表，返回格式为json格式。

查询水果的第1-50个实体（第一页）
http://knowledgeworks.cn:20314/probaseplus/pbapi/getentities?kw=水果&start=0
返回值：{"entity": [["苹果", 2100], ["香蕉", 1321], ...], "nument": 1060}
表示水果在CN-Probase中有1060个实体，如苹果，香蕉等。
1
2
3
4
点评：该接口专门用于寻找一个实体词的下属词

2.1.4 CN-Probase接口——概念型
中文概念图谱和概念分类体系

api/mention2entity

{“status”: “ok”, “ret”: [“刘德华（中国香港男演员、歌手、词作人）”, “刘福荣（刘德华别名）”, “刘德华（清华大学教授）”}

跟CN-DBpedia中的ment2ent类似，返回实体词解释。

api/getConcept
输入实体，返回实体对应概念列表，json格式。

http://shuyantech.com/api/cnprobase/concept?q=刘德华
{"status": "ok", "ret": [["人物", 1299103], ["演员", 59658], ["娱乐人物", 25299], ["歌手", 15884], ["电影人", 88], ["填词人", 64]], "count": 6, "pagesize": 50}
1
2
count：概念数量；pagesize：每次请求最多返回的概念数量
点评：返回了实体词的属性，跟CN-DBpedia中的avpair，有点类似

api/getEntity
输入概念，返回概念对应实体列表，json格式。默认返回前50个。

{"status": "ok", "ret": [["乔振宇（中国内地男演员）", 321795144], ["霍建华（中国台湾男演员）", 104187122], ["杨洋（中国内地男演员）", 87598713]}
1
count：实体数量;pagesize：每次请求最多返回的实体数量

2.1.5 Shorttext Parsing API，短文本依存分析接口
输入英文字符串，返回短文本解析的json
目前比较支持英文

2.1.6 Entity Understanding API接口
输入中文文本，输出分词后的文本，以及识别的实体，json格式。

http://shuyantech.com/api/entitylinking/cutsegment?q=打球的李娜和唱歌的李娜不是同一个人
{"cuts": ["打球", "的", "李娜", "和", "唱歌", "的", "李娜", "不是", "同一个", "人"], "entities": [[[3, 5], "李娜（中国女子网球名将）"], [[9, 11], "李娜（流行歌手、佛门女弟子）"]]}
1
2
输入一段话，输出话中的实体词 + 实体词的位置信息

2.1.7 数眼科技
爬虫模块（分布式、企业级的爬虫任务）
知识图谱与概念图谱，基于知识工场
中文QA（输入一段话然后返回内容）、[实体链接][4]
未来开放：企业级图数据库解决方案（还没开发完全）

2.1.8 额外
金融新闻Bots，金融类监控，根据关键词筛选，新闻、网站、软文；理财产品问答系统
拼音转汉字服务

2.2 思知（OwnThink）
开放项目：问答机器人、知识库
跟复旦的Knowledge Works有点相似，估计没那个全面，开源的聊天机器人也弱爆了。。
获取歧义关系（mention -> entity）

https://api.ownthink.com/ambiguous?mention=苹果
{
"message": "success",
"data": [
{
"蔷薇科苹果属果实": [
"苹果（蔷薇科苹果属果实）",
10929205
]
},
{
"韩国2008年康理贯执导电影": [
"苹果（韩国2008年康理贯执导电影）",
7589732
]
}
}
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
获取全部知识（entity -> knowledge）
更详细的信息
https://api.ownthink.com/kg?entity=苹果（蔷薇科苹果属果实）
{
“message”: “success”,
“data”: {
“item”: “苹果（2007年李玉执导电影）”,
“desc”: “《苹果》是由李玉执导，范冰冰、佟大为、梁家辉、金燕玲领衔主演的黑色幽默剧情电影。”,
“eav”: [
{
“entity”: “苹果（2007年李玉执导电影）”,
“value”: “苹果”,
“attribute”: “中文名”
关联图谱

https://api.ownthink.com/assmap?entity=苹果
关联图谱暂时不对外直接开放（由于某种原因将于2018年8月开放）
1
2
2.3 Zhishi.me
王昊奋，Zhishi.me 通过从开放的百科数据中抽取结构化数据，首次尝试构建中文通用知识图谱。目前，已融合了三大中文百科，百度百科，互动百科以及维基百科中的数据。

2.4 交大的Acenap
官方主页，http://acemap.sjtu.edu.cn/
主要做学术论文、人群的知识图谱

公开了多款算法（http://acemap.sjtu.edu.cn/acenap），有不同的软件版本，python/matlab
公开了多个可视化的方案与算法，http://acemap.sjtu.edu.cn/acenap/algorithms
提到了几个公开的数据源：社交媒体数据源 + 人人网爬取的人物关系数据源
社交媒体数据源：
MovieLens This dataset is collected from the MovieLens dataset
available at https://grouplens.org/datasets/movielens/. In the
original dataset, the edge weights between users and items, namely
the users’ ratings on items are decimal ratings in (0,5]. In our
modified dataset, we map the decimal ratings to interger ratings in
range [1,10].
AudioSrobbler This dataset is collected from the AudioSrobbler
dataset available at
http://www-etud.iro.umontreal.ca/~bergstrj/audioscrobbler_data.html.
In the original dataset we are provided with users’ play counts for
each music artist they have listened to. In our modified dataset, we
mapped play counts to bounded edge weights between users and items
i.e. users’ ratings as integers in [1,5].
BookCrossing This dataset is collected from the BookCrossing dataset
available at http://www2.informatik.uni-freiburg.de/~cziegler/BX/. In
the original dataset, we are provided with the users’ implicit and
explicit ratings on books. In our modified dataset, we use integers
in [1,10] to present the explicit user ratings and exculde ratings of
0, which denote implicit ratings.
2.5 清华大学的openKE
由 THUNLP 基于 TensorFlow 工具包开发

该框架有如下特征：

拥有配置多种训练环境和经典模型的简易接口；
对高性能 GPU 训练进行加速和内存优化；
高效轻量级的 C++实现，用于快速部署和多线程加速；
现有大规模知识图谱的预训练嵌入，可用于多种相关任务；
长期维护以修复 bug，满足新需求。
TransE 、TransH、TransR、TransD、RESCAL、DistMult、HolE、ComplEx等算法的统一接口的高效实现；
面向WikiData和Freebase两大通用KG全量数据的预训练好的知识表示模型下载，不需要大家再费心重复训练

2.6 自然语言处理工具包HanLP
HanLP是由一系列模型与算法组成的NLP工具包，目标是普及自然语言处理在生产环境中的应用。HanLP具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。

有py和java版本的，分别是：
pyhanlp: Python interfaces for HanLP
HanLP: Han Language Processing

从分词、词性标注、命名实体识别、关键词提取、短语提取、文本推荐（语义推荐、拼音推荐、字词推荐）、依存句法分析等功能，很全面。

2.7 scikit-kge: MIT知识图谱embedding工具包
地址：https://github.com/mnick/scikit-kge
此工具包是有麻省理工大学( MIT )开发的python库，可用不同方法训练得到知识图谱的分布式表示结果，包含的知识图谱表示学习方法有：
Holographic Embeddings (HolE)
RESCAL
TransE
TransR
ER-MLP

2.8 RDFox: 牛津大学的知识库推理工具（推荐）
OpenKG搜集和整理知识图谱相关的技术工具，并将组织开展技术评测。

RDFox是一个高度可扩展的内存RDF三元组存储，支持共享内存并行OWL 2 RL推理。它是用C ++编写的跨平台软件，带有一个Java包装器，允许与任何基于Java的解决方案（包括OWL API）轻松集成。

2.9 中国知网
同时，知网内的NLP结构也非常复杂，参考:http://www.keenage.com/zhiwang/c_zhiwang.html
知网描述了下列各种关系：

(a) 上下位关系 (由概念的主要特征体现，请参看《知网管理工具》)

(b) 同义关系（可通过《同义、反义以及对义组的形成》获得）

(d) 对义关系（可通过《同义、反义以及对义组的形成》获得）

(e) 部件-整体关系（由在整体前标注 % 体现，如"心"，"CPU"等）

(f) 属性-宿主关系（由在宿主前标注 & 体现，如"颜色"，"速度"等）

(g) 材料-成品关系（由在成品前标注 ? 体现，如"布"，"面粉"等）

(h) 施事/经验者/关系主体-事件关系（由在事件前标注 * 体现，如"医生"，"雇主"等）

(i) 受事/内容/领属物等-事件关系（由在事件前标注 $ 体现，如"患者"，"雇员"等）

(j) 工具-事件关系（由在事件前标注 * 体现，如"手表"，"计算机"等）

(k) 场所-事件关系（由在事件前标注 @ 体现，如"银行"，"医院"等）

(l) 时间-事件关系（由在事件前标注 @ 体现，如"假日"，"孕期"等）

(m) 值-属性关系（直接标注无须借助标识符，如"蓝"，"慢"等）

(n) 实体-值关系（直接标注无须借助标识符，如"矮子"，"傻瓜"等）

(o) 事件-角色关系（由加角色名体现，如"购物"，"盗墓"等）

§ 相关关系（由在相关概念前标注 # 体现，如"谷物"，"煤田"等）

同时还有API：介绍知网知识库的 API 参数与调用过程，当日调用接口的次数不得超过5000次
词语相似度检测/中文分析/英文分析/词语相关性检测
知网的api是在一个语知的平台:http://yuzhinlp.com/chnParse.html

知网内容期刊查询的时候，也支持知识图谱：

延伸：语知科技的接口非常丰富！
有关系抽取接口：判案要素抽取、金融事件抽取、公司以及机构名抽取（在更新）
文本语义解析接口、词语相关、句子相关性、篇章相关性；
基础接口：词语拼音、词性判定、自动分词、词性标注、英文释义（机器翻译？）
每天有5000次免费调用额度

语知科技在语义分析方面优势明显，它可以处理的文本可以是超句的段落或篇章，并且系统的分析结果可揭示五种类型的内容：词语之间的句法关系，词语之间的逻辑语义关系，词语之间的深层逻辑语义关系，通过逻辑语义角色转换得到的深层理解，以及各个词语的词性、义项、拼音及其对应的英语译文。

可参考：基于HowNet的NLP技术，语知科技打造新型语言理解技术服务平台

2.10 浙江大学：创新设计产品库
url：http://120.55.82.39:8080/index.html

2.11 中草药知识服务系统
http://zcy.ckcest.cn/tcm/

好厉害，有知识图谱，有KGQA问答系统，还有主题建模，各种专业分词工具。
还有以图搜图功能，尼玛，逆天！！

2.12 中国工程科技知识中心
http://www.ckcest.cn/portal/hotspotdetail18
依据时间，关键词等信息对内容进行展示

2.13 NLPIR
http://ictclas.nlpir.org/nlpir/
基于词语的多度传播，简单的词关联逻辑。

2.14 开放域中文知识图谱《大词林》
http://www.bigcilin.com/hypernym/?q=女仆咖啡厅

2.15 北航 - 中文知识图谱
http://www.actkg.com/linking/

延伸一：一文揭秘！自底向上构建知识图谱全过程
知识图谱的构建技术主要有自顶向下和自底向上两种。其中自顶向下构建是指借助百科类网站等结构化数据源，从高质量数
据中提取本体和模式信息，加入到知识库里。而自底向上构建，则是借助一定的技术手段，从公开采集的数据中提取出资源模式，选择其中置信度较高的信息，加入到知识库中。
本篇文章很基础的解释了知识图谱的底层结构，很赞！

https://blog.csdn.net/sinat_26917383/article/details/66473253

【原创】下雨天要游泳饶金霞家庭教育心理咨询
下午，我照着昨天与小儿的约定，在四点半，就来到幼儿园门口接孩子。老师打开大门，孩子从教室里走出来，一见到我就问:“老妈，泳衣准备好了吗？”我半蹲下来拥抱他说：“都放在车上啦！”儿子在我额头上亲一口说：“你真是世界上最讲信用的好妈妈！”我有点怀疑我这儿子有NLP的基因，总是能及时地给沟通者作出良好的回应，而且还会用米尔顿。其实看着这满天的乌云，我心里还在嘀咕，这场大雨可能不会等到我们去游泳场。果不其
LLM系统性学习完全指南（初学者必看系列） GA琥珀 LLM 学习人工智能语言模型
前言这篇文章将系统性的讲解LLM（LargeLanguageModels,LLM）的知识和应用。我们将从支撑整个领域的数学与机器学习基石出发，逐步剖析自然语言处理（NLP）的经典范式，深入探究引发革命的Transformer架构，并按时间顺序追溯从BERT、GPT-2到GPT-4、Llama及Gemini等里程碑式模型的演进。随后，我们将探讨如何将这些强大的基础模型转化为实用、安全的应用，涵盖对齐
AI数字人系统开发上线全攻略：从0到1全流程解析 v_qutudy 人工智能 AI系统开发 AI数字人开发
一、需求分析：定义数字人核心能力1.1功能规划矩阵模块基础功能进阶功能形象生成2D/3D建模实时表情捕捉与驱动语音交互TTS语音合成情感识别与应激反应动作系统预设动作库骨骼动画与物理引擎智能决策规则引擎强化学习驱动决策多模态交互文本/语音输入AR/VR空间交互1.2非功能性指标实时性：唇形同步延迟B[语音识别]A-->C[姿态检测]A-->D[文本理解]B-->E[NLP引擎]C-->F[动作解析
AI产品经理面试宝典第30天：AI+教育个性化学习与知识图谱相关面试题的解答指导 TGITCIC AI产品经理一线大厂面试题人工智能产品经理 AI产品经理面试大模型产品经理面试 AI面试大模型面试
自适应学习系统如何实现千人千面？面试官：请用产品视角解释AI自适应学习系统的核心逻辑你的回答：自适应学习系统本质是构建"数据-模型-决策"的闭环。以沪江Hitalk为例，其通过12级能力评估体系采集学员的听、说、读、写数据，利用知识图谱建立知识点关联网络。当学员完成"实景演练-诊断反馈-学习包推送"的完整链路时，系统会动态调整知识图谱权重，形成个性化学习路径。面试官追问：如何验证个性化效果？回答：
Java NLP炼金术：从词袋到深度学习，构建AI时代的语言魔方墨夶 Java学习资料人工智能 java 自然语言处理
一、JavaNLP的“三剑客”：框架与工具链1.1ApacheOpenNLP：传统NLP的“瑞士军刀”目标：用词袋模型实现文本分类与实体识别代码实战：文档分类器的“炼成术”//OpenNLP文档分类器（基于词袋模型）importopennlp.tools.doccat.*;importopennlp.tools.util.*;publicclassDocumentClassifier{//训练模型
深度学习模型表征提取全解析 ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python 深度学习人工智能 python embedding 语言模型
模型内部进行表征提取的方法在自然语言处理（NLP）中，“表征（Representation）”指将文本（词、短语、句子、文档等）转化为计算机可理解的数值形式（如向量、矩阵），核心目标是捕捉语言的语义、语法、上下文依赖等信息。自然语言表征技术可按“静态/动态”“有无上下文”“是否融入知识”等维度划分一、传统静态表征（无上下文，词级为主）这类方法为每个词分配固定向量，不考虑其在具体语境中的含义（无法解
【AI大模型】LLM模型架构深度解析：BERT vs. GPT vs. T5 我爱一条柴ya 学习AI记录 ai 人工智能 AI编程 python
引言Transformer架构的诞生（Vaswanietal.,2017）彻底改变了自然语言处理（NLP）。在其基础上，BERT、GPT和T5分别代表了三种不同的模型范式，主导了预训练语言模型的演进。理解它们的差异是LLM开发和学习的基石。一、核心架构对比特性BERT(BidirectionalEncoder)GPT(GenerativePre-trainedTransformer)T5(Text
NLP_知识图谱_大模型——个人学习记录 macken9999 自然语言处理知识图谱大模型自然语言处理知识图谱学习
1.自然语言处理、知识图谱、对话系统三大技术研究与应用https://github.com/lihanghang/NLP-Knowledge-Graph深度学习-自然语言处理(NLP)-知识图谱：知识图谱构建流程【本体构建、知识抽取（实体抽取、关系抽取、属性抽取）、知识表示、知识融合、知识存储】-元気森林-博客园https://www.cnblogs.com/-402/p/16529422.htm
数据安全审计平台的三大关键技术：日志分析、行为监测与智能告警 KKKlucifer 安全算法
在数字化浪潮中，数据安全审计是企业守护核心资产的“瞭望塔”。通过日志分析、行为监测、智能告警三大技术，数据安全审计平台构建起“全流程监控-异常识别-快速响应”的闭环，为数据安全筑牢防线。以下从技术原理、实践价值与行业应用展开解析。日志分析：数据安全的“DNA图谱”1.多源日志融合技术实现：通过Agent采集操作系统、数据库、网络设备等200+日志源，利用正则表达式、NLP技术解析非结构化日志（如“
【论文阅读笔记】TimesURL: Self-supervised Contrastive Learning for Universal Time Series 少写代码少看论文多多睡觉 #论文阅读笔记论文阅读笔记
TimesURL:Self-supervisedContrastiveLearningforUniversalTimeSeriesRepresentationLearning摘要学习适用于多种下游任务的通用时间序列表示，并指出这在实际应用中具有挑战性但也是有价值的。最近，研究人员尝试借鉴自监督对比学习（SSCL）在计算机视觉（CV）和自然语言处理（NLP）中的成功经验，以解决时间序列表示的问题。
从数据到智慧：AI原生知识库构建的完整技术栈解析 AI天才研究院 Agentic AI 实战 AI大模型企业级应用开发实战 AI人工智能与大数据 AI-native 大数据 ai
从数据到智慧：AI原生知识库构建的完整技术栈解析关键词AI原生知识库、知识图谱、向量数据库、大语言模型、RAG技术、知识工程、智能问答系统摘要在人工智能飞速发展的今天，构建能够真正理解、组织和应用知识的系统已成为企业数字化转型的核心竞争力。本文将深入剖析AI原生知识库的完整技术栈，从数据采集与预处理，到知识表示与建模，再到存储架构与检索增强生成技术，全方位解读如何将原始数据转化为可行动的智慧。我们
NLP-D7-李宏毅机器学习---X-Attention&&GAN&BERT&GPT 甄小胖机器学习自然语言处理机器学习 bert
—0521今天4:30就起床了！真的是迫不及待想看新的课程！！！昨天做人脸识别系统的demo查资料的时候，发现一个北理的大四做cv的同学，差距好大！！！我也要努力呀！！不是比较，只是别人可以做到这个程度，我也一定可以！！！要向他学习！！！开始看课程啦！-----0753看完了各种attention，由于attention自己计算的限制，当N很大的时候会产生计算速度问题，从各种不同角度（人工知识输入
PyTorch 在 Python 自然语言处理中的运用 Python编程之道 Python编程之道 python pytorch 自然语言处理 ai
PyTorch在Python自然语言处理中的运用关键词：PyTorch，Python，自然语言处理，深度学习，文本分类，情感分析摘要：本文全面探讨了PyTorch在Python自然语言处理（NLP）领域的运用。首先介绍了相关背景知识，包括目的范围、预期读者等内容。接着详细阐述了核心概念，如词嵌入、循环神经网络等，并给出了相应的原理示意图和流程图。深入讲解了核心算法原理，结合Python代码进行详细
VIT视觉妄想成为master opencv 目标检测机器学习数据挖掘语音识别人工智能计算机视觉
VisionTransformer视觉和语言(Vision-Language)NLPrompt:Noise-LabelPromptLearningforVision-LanguageModelsPaper:https://arxiv.org/abs/2412.01256Code:GitHub-qunovo/NLPromptPhysVLM:EnablingVisualLanguageModelsto
Spring Data Neo4j 与后端人工智能算法的数据交互 AI大模型应用实战 spring neo4j 人工智能 ai
SpringDataNeo4j与后端人工智能算法的数据交互关键词：SpringDataNeo4j、图数据库、人工智能算法、数据交互、知识图谱、图神经网络、数据集成摘要：本文深入探讨了如何利用SpringDataNeo4j框架实现后端人工智能算法与图数据库的高效数据交互。文章首先介绍了图数据库和人工智能算法的基本概念，然后详细解析了SpringDataNeo4j的核心架构和原理。接着，通过实际代码示
RAG实战指南 Day 11：文本分块策略与最佳实践在未来等你 RAG实战指南 RAG 检索增强生成文本分块语义分割文档处理 NLP 人工智能
【RAG实战指南Day11】文本分块策略与最佳实践文章标签RAG,检索增强生成,文本分块,语义分割,文档处理,NLP,人工智能,大语言模型文章简述文本分块是RAG系统构建中的关键环节，直接影响检索准确率。本文深入解析5种主流分块技术：1)固定大小分块的实现与调优技巧；2)基于语义的递归分割算法；3)文档结构感知的分块策略；4)LLM增强的智能分块方法；5)多模态混合内容处理方案。通过电商知识库和科
知识图谱系列（2）：知识图谱的技术架构与组成要素程序员查理 #知识图谱知识图谱架构人工智能 AI Agent RAG
1.引言知识图谱作为一种强大的知识表示和组织方式，已经在搜索引擎、推荐系统、智能问答等多个领域展现出巨大的价值。在之前的上一篇文章中，我们介绍了知识图谱的基础概念与发展历程，了解了知识图谱的定义、核心特征、发展历史以及在AI发展中的地位与作用。要深入理解和应用知识图谱，我们需要进一步探索其内部的技术架构和组成要素。知识图谱不仅仅是一个简单的数据结构，而是一个复杂的技术体系，涉及知识的表示、存储、查
中文大模型的技术债问题大鹏的NLP博客大模型 transformer 大模型
中文大模型的技术债问题摘要随着中文大语言模型（LargeLanguageModels,LLMs）在自然语言处理（NLP）领域的广泛应用，其研发和部署过程中积累的“技术债”（TechnicalDebt）问题日益突出。本文系统性地分析了中文大模型在数据采集、预训练、微调、评估与部署等生命周期各阶段产生的技术债类型，包括代码复杂性、数据隐患、训练流程依赖、工具链碎片化、模型解释性差、隐性资源耦合等问题，
AI 正在深度重构软件开发的底层逻辑和全生命周期，从技术演进、流程重构和未来趋势三个维度进行系统性分析
AI正在深度重构软件开发的底层逻辑和全生命周期，从需求分析到运维维护的每个环节都产生了范式级变革。以下从技术演进、流程重构和未来趋势三个维度进行系统性分析：一、AI重构软件开发全栈的技术图谱需求工程智能化NLP驱动的需求解析：GPT-4架构实现用户访谈转录自动转化为UML用例图，准确率达89%（微软2023内部数据）情感计算应用：基于BERT的意图识别模型可捕捉用户需求中的隐性情绪，需求变更预测准
新手向:中文语言识别的进化之路
自然语言处理（NLP）技术正在以前所未有的速度改变我们与机器的交互方式，而中文作为世界上使用人数最多的语言，其处理技术面临着独特的挑战与机遇。本文将全面剖析中文自然语言识别模型的发展历程、核心技术原理、当前应用现状以及未来发展趋势，带您深入了解这一改变人机交互方式的关键技术。一、中文NLP的特殊挑战：为什么中文处理如此困难？中文自然语言处理面临着一系列西方语言所不具备的特殊挑战，这些挑战直接影响了
Python爬虫实战：爬取百度学术摘要信息全流程详解与代码示例 Python爬虫项目 2025年爬虫实战项目 python 爬虫开发语言 scrapy 学习 dubbo 百度
1.前言随着学术资源数字化的普及，百度学术成为学者们常用的论文搜索平台。获取大量论文摘要信息对于文献综述、知识图谱构建等研究极为重要。本文将系统讲解如何利用Python编写爬虫，批量抓取百度学术上的论文摘要。我们将结合最新Python爬虫技术，涵盖基础同步爬虫、异步爬虫、多线程，全面实战演示。2.项目背景与目标百度学术支持通过关键词搜索论文，展示论文标题、作者、期刊、摘要等信息。目标是：根据关键词
AI驱动下的企业学习平台，如何重构员工发展与HR角色 weixin_54980836 人工智能学习重构
近期，JoshBersin官方网站分享了一篇关于L&D领域AI深度变革的文章，文章所描绘的并非仅仅是新工具的涌现，而是一场触及L&D本质与HR战略价值的深刻革命。当Docebo坚定走向“AI原生”，当Sana以知识图谱重构组织智慧，它们揭示的正是我们HR从业者必须直面的未来——AI驱动的学习已不再是效率的提升，而是组织能力与人才价值创造方式的根本性进化。一、超越自动化：AI原生平台对学习本质的重构
深入详解 AI 与深度学习：从零开始掌握 BERT 模型架构拉不拉斯AICoding 技术探索人工智能深度学习 bert
深入详解AI与深度学习：从零开始掌握BERT模型架构引言在自然语言处理（NLP）领域，BERT（BidirectionalEncoderRepresentationsfromTransformers）是近年来最具影响力的模型之一。它通过双向上下文理解彻底改变了NLP任务的处理方式。本文将从基础概念到核心原理、应用场景和实践技巧，深入浅出地讲解BERT，帮助初学者快速掌握这一技术。一、BERT的核心
Transformer模型架构深度讲解
Transformer是一种在自然语言处理（NLP）和深度学习中非常重要的模型架构。它首次由Vaswani等人于2017年提出，主要应用于序列到序列的任务（如机器翻译、文本生成、摘要生成等）。Transformer模型与传统的RNN（循环神经网络）和LSTM（长短时记忆网络）不同，它不依赖于时间步的顺序处理，而是完全基于“注意力机制”进行计算，这使得它在训练速度、并行化能力和长期依赖问题的处理上具
GNN--知识图谱（逐步贯通基础到项目实践）峙峙峙图神经网络知识图谱人工智能
原文仓库链接：知识图谱–贯通已有知识地图记录知识关系图谱和跨学科碰撞新启发知识图谱mermaid可能需要下载插件才能渲染线性代数神经网络深度学习框架硬件加速图论GNN框架交叉理解前向理解定义：前向理解：A–>B，A为B的基础铺垫知识，通过深入学习A对B有更好的理解01.LinearAlgebraforLinearLayerofNN从线性代数行列变换的角度看神经网络中的线性层线性代数矩阵乘法，可以理
AI人工智能浪潮中，GPT的技术优势凸显 AI学长带你学AI 人工智能 gpt ai
AI人工智能浪潮中，GPT的技术优势凸显关键词：人工智能、GPT、自然语言处理、深度学习、Transformer、大语言模型、技术优势摘要：本文深入探讨了在人工智能浪潮中GPT(GenerativePre-trainedTransformer)系列模型的技术优势。我们将从GPT的核心架构出发，分析其独特的技术特点，包括自注意力机制、预训练-微调范式、零样本学习能力等。通过与传统NLP方法的对比，揭
自然语言处理-基于预训练模型的方法-笔记
自然语言处理-基于预训练模型的方法-笔记【下载地址】自然语言处理-基于预训练模型的方法-笔记《自然语言处理-基于预训练模型的方法》由哈尔滨工业大学出版，深入探讨了NLP领域的前沿技术与预训练模型的应用。本书系统介绍了预训练模型的基本概念、发展历程及常见模型的原理，并通过丰富的实践案例与代码实现，帮助读者掌握这些技术在自然语言处理任务中的实际应用。无论是初学者、研发人员，还是希望提升NLP能力的研究
DeepSeek在智能教育评估中的应用：试题检索 AIGC应用创新大全 AI大模型与大数据技术 AI人工智能与大数据应用开发 MCP&Agent 云算力网络 easyui 前端 javascript ai
DeepSeek在智能教育评估中的应用：试题检索关键词：DeepSeek、智能教育、试题检索、自然语言处理、知识图谱、个性化学习、评估系统摘要：本文探讨了DeepSeek大模型在智能教育评估系统中的试题检索应用。我们将深入分析如何利用先进的自然语言处理技术和知识图谱构建高效的试题检索系统，实现个性化学习路径推荐和精准评估。文章将从核心概念、技术原理到实际应用场景，全面解析这一创新教育技术解决方案。
知识图谱的个性化智能教学推荐系统(论文+源码) 毕设工作室_wlzytw python论文项目知识图谱人工智能
目录摘要Abstract目录第1章绪论1.1研究背景及意义1.2国内外研究现状1.2.1知识图谱1.2.2个性化推荐系统1.3本文研究内容及创新点1.4全文组织结构第2章相关理论与技术概述2.1知识图谱2.1.1知识图谱的介绍与发展2.1.2知识图谱的构建2.3协同过滤推荐算法2.2.1推荐算法概述2.2.2Pearson相关系数2.2.3Spearman相关系数2.4Bert模型和Albert模
大语言模型应用指南：ReAct 框架 AI大模型应用实战 java python javascript kotlin golang 架构人工智能
大语言模型应用指南：ReAct框架关键词：大语言模型,ReAct框架,自然语言处理(NLP),模型融合,多模态学习,深度学习,深度学习框架1.背景介绍1.1问题由来近年来，深度学习技术在自然语言处理(NLP)领域取得了显著进展。尤其是大语言模型(LargeLanguageModels,LLMs)，如BERT、GPT系列等，通过在大规模无标签数据上进行预训练，获得了强大的语言理解和生成能力。然而，预
jQuery 跨域访问的三种方式 No 'Access-Control-Allow-Origin' header is present on the reque qiaolevip 每天进步一点点学习永无止境跨域众观千象
XMLHttpRequest cannot load http://v.xxx.com. No 'Access-Control-Allow-Origin' header is present on the requested resource. Origin 'http://localhost:63342' is therefore not allowed access. test.html:1
mysql 分区查询优化 annan211 java 分区优化 mysql
分区查询优化引入分区可以给查询带来一定的优势，但同时也会引入一些bug. 分区最大的优点就是优化器可以根据分区函数来过滤掉一些分区，通过分区过滤可以让查询扫描更少的数据。所以，对于访问分区表来说，很重要的一点是要在where 条件中带入分区，让优化器过滤掉无需访问的分区。可以通过查看explain执行计划，是否携带 partitions
MYSQL存储过程中使用游标 chicony Mysql存储过程
DELIMITER $$ DROP PROCEDURE IF EXISTS getUserInfo $$ CREATE PROCEDURE getUserInfo(in date_day datetime)-- -- 实例-- 存储过程名为：getUserInfo-- 参数为：date_day日期格式:2008-03-08-- BEGINdecla
mysql 和 sqlite 区别 Array_06 sqlite
转载： http://www.cnblogs.com/ygm900/p/3460663.html mysql 和 sqlite 区别 SQLITE是单机数据库。功能简约，小型化，追求最大磁盘效率 MYSQL是完善的服务器数据库。功能全面，综合化，追求最大并发效率 MYSQL、Sybase、Oracle等这些都是试用于服务器数据量大功能多需要安装，例如网站访问量比较大的。而sq
pinyin4j使用 oloz pinyin4j
首先需要pinyin4j的jar包支持；jar包已上传至附件内方法一:把汉字转换为拼音；例如：编程转换后则为biancheng /** * 将汉字转换为全拼 * @param src 你的需要转换的汉字 * @param isUPPERCASE 是否转换为大写的拼音； true:转换为大写；fal
微博发送私信随意而生微博
在前面文章中说了如和获取登陆时候所需要的cookie，现在只要拿到最后登陆所需要的cookie，然后抓包分析一下微博私信发送界面 http://weibo.com/message/history?uid=****&name=**** 可以发现其发送提交的Post请求和其中的数据，让后用程序模拟发送POST请求中的数据，带着cookie发送到私信的接入口，就可以实现发私信的功能了。
jsp 香水浓 jsp
JSP初始化容器载入JSP文件后，它会在为请求提供任何服务前调用jspInit()方法。如果您需要执行自定义的JSP初始化任务，复写jspInit()方法就行了 JSP执行这一阶段描述了JSP生命周期中一切与请求相关的交互行为，直到被销毁。当JSP网页完成初始化后
在 Windows 上安装 SVN Subversion 服务端 AdyZhang SVN
在 Windows 上安装 SVN Subversion 服务端2009-09-16高宏伟哈尔滨市道里区通达街291号最佳阅读效果请访问原地址：http://blog.donews.com/dukejoe/archive/2009/09/16/1560917.aspx 现在的Subversion已经足够稳定，而且已经进入了它的黄金时段。我们看到大量的项目都在使
android开发中如何使用 alertDialog从listView中删除数据？ aijuans android
我现在使用listView展示了很多的配置信息，我现在想在点击其中一条的时候填出 alertDialog,点击确认后就删除该条数据，（ ArrayAdapter ，ArrayList，listView 全部删除），我知道在下面的onItemLongClick 方法中参数 arg2 是选中的序号，但是我不知道如何继续处理下去 1 2 3
jdk-6u26-linux-x64.bin 安装 baalwolf linux
1.上传安装文件(jdk-6u26-linux-x64.bin) 2.修改权限 [root@localhost ~]# ls -l /usr/local/jdk-6u26-linux-x64.bin 3.执行安装文件 [root@localhost ~]# cd /usr/local [root@localhost local]# ./jdk-6u26-linux-x64.bin&nbs
MongoDB经典面试题集锦 BigBird2012 mongodb
1.什么是NoSQL数据库？NoSQL和RDBMS有什么区别？在哪些情况下使用和不使用NoSQL数据库？ NoSQL是非关系型数据库，NoSQL = Not Only SQL。关系型数据库采用的结构化的数据，NoSQL采用的是键值对的方式存储数据。在处理非结构化/半结构化的大数据时；在水平方向上进行扩展时；随时应对动态增加的数据项时可以优先考虑使用NoSQL数据库。在考虑数据库的成熟
JavaScript异步编程Promise模式的6个特性 bijian1013 JavaScript Promise
Promise是一个非常有价值的构造器，能够帮助你避免使用镶套匿名方法，而使用更具有可读性的方式组装异步代码。这里我们将介绍6个最简单的特性。在我们开始正式介绍之前，我们想看看Javascript Promise的样子： var p = new Promise(function(r
[Zookeeper学习笔记之八]Zookeeper源代码分析之Zookeeper.ZKWatchManager bit1129 zookeeper
ClientWatchManager接口 //接口的唯一方法materialize用于确定那些Watcher需要被通知 //确定Watcher需要三方面的因素1.事件状态 2.事件类型 3.znode的path public interface ClientWatchManager { /** * Return a set of watchers that should
【Scala十五】Scala核心九：隐式转换之二 bit1129 scala
隐式转换存在的必要性，在Java Swing中，按钮点击事件的处理，转换为Scala的的写法如下： val button = new JButton button.addActionListener( new ActionListener { def actionPerformed(event: ActionEvent) {
Android JSON数据的解析与封装小Demo ronin47
转自：http://www.open-open.com/lib/view/open1420529336406.html package com.example.jsondemo; import org.json.JSONArray; import org.json.JSONException; import org.json.JSONObject; impor
[设计]字体创意设计方法谈 brotherlamp UI ui自学 ui视频 ui教程 ui资料
从古至今，文字在我们的生活中是必不可少的事物，我们不能想象没有文字的世界将会是怎样。在平面设计中，UI设计师在文字上所花的心思和功夫最多，因为文字能直观地表达UI设计师所的意念。在文字上的创造设计，直接反映出平面作品的主题。如设计一幅戴尔笔记本电脑的广告海报，假设海报上没有出现“戴尔”两个文字，即使放上所有戴尔笔记本电脑的图片都不能让人们得知这些电脑是什么品牌。只要写上“戴尔笔
单调队列-用一个长度为k的窗在整数数列上移动，求窗里面所包含的数的最大值 bylijinnan java 算法面试题
import java.util.LinkedList; /* 单调队列滑动窗口单调队列是这样的一个队列：队列里面的元素是有序的，是递增或者递减题目：给定一个长度为N的整数数列a(i),i=0,1,...,N-1和窗长度k. 要求：f(i) = max{a(i-k+1),a(i-k+2),..., a(i)},i = 0,1,...,N-1 问题的另一种描述就
struts2处理一个form多个submit chiangfai struts2
web应用中，为完成不同工作，一个jsp的form标签可能有多个submit。如下代码： <s:form action="submit" method="post" namespace="/my"> <s:textfield name="msg" label="叙述：">
shell查找上个月，陷阱及野路子 chenchao051 shell
date -d "-1 month" +%F 以上这段代码，假如在2012/10/31执行，结果并不会出现你预计的9月份，而是会出现八月份，原因是10月份有31天，9月份30天，所以-1 month在10月份看来要减去31天，所以直接到了8月31日这天，这不靠谱。野路子解决：假设当天日期大于15号
mysql导出数据中文乱码问题 daizj mysql 中文乱码导数据
解决mysql导入导出数据乱码问题方法：１、进入mysql，通过如下命令查看数据库编码方式： mysql> show variables like 'character_set_%'; +--------------------------+----------------------------------------+ | Variable_name&nbs
SAE部署Smarty出现：Uncaught exception 'SmartyException' with message 'unable to write dcj3sjt126com PHP smarty sae
对于SAE出现的问题：Uncaught exception 'SmartyException' with message 'unable to write file...。官方给出了详细的FAQ：http://sae.sina.com.cn/?m=faqs&catId=11#show_213 解决方案为： 01 $path
《教父》系列台词 dcj3sjt126com
Your love is also your weak point. 你的所爱同时也是你的弱点。 If anything in this life is certain, if history has taught us anything, it is that you can kill anyone. 不顾家的人永远不可能成为一个真正的男人。 &
mongodb安装与使用 dyy_gusi mongo
一.MongoDB安装和启动,widndows和linux基本相同 1.下载数据库, linux:mongodb-linux-x86_64-ubuntu1404-3.0.3.tgz 2.解压文件,并且放置到合适的位置 tar -vxf mongodb-linux-x86_64-ubun
Git排除目录 geeksun git
在Git的版本控制中，可能有些文件是不需要加入控制的，那我们在提交代码时就需要忽略这些文件，下面讲讲应该怎么给Git配置一些忽略规则。有三种方法可以忽略掉这些文件，这三种方法都能达到目的，只不过适用情景不一样。 1. 针对单一工程排除文件这种方式会让这个工程的所有修改者在克隆代码的同时，也能克隆到过滤规则，而不用自己再写一份，这就能保证所有修改者应用的都是同一
Ubuntu 创建开机自启动脚本的方法 hongtoushizi ubuntu
转载自： http://rongjih.blog.163.com/blog/static/33574461201111504843245/ Ubuntu 创建开机自启动脚本的步骤如下： 1) 将你的启动脚本复制到 /etc/init.d目录下以下假设你的脚本文件名为 test。 2) 设置脚本文件的权限 $ sudo chmod 755
第八章流量复制/AB测试/协程 jinnianshilongnian nginx lua coroutine
流量复制在实际开发中经常涉及到项目的升级，而该升级不能简单的上线就完事了，需要验证该升级是否兼容老的上线，因此可能需要并行运行两个项目一段时间进行数据比对和校验，待没问题后再进行上线。这其实就需要进行流量复制，把流量复制到其他服务器上，一种方式是使用如tcpcopy引流；另外我们还可以使用nginx的HttpLuaModule模块中的ngx.location.capture_multi进行并发
电商系统商品表设计 lkl
DROP TABLE IF EXISTS `category`; -- 类目表 /*!40101 SET @saved_cs_client = @@character_set_client */; /*!40101 SET character_set_client = utf8 */; CREATE TABLE `category` ( `id` int(11) NOT NUL
修改phpMyAdmin导入SQL文件的大小限制 pda158 sql mysql
　用phpMyAdmin导入mysql数据库时，我的10M的数据库不能导入，提示mysql数据库最大只能导入2M。　　 phpMyAdmin数据库导入出错：　　You probably tried to upload too large file. Please refer to documentation for ways to workaround this limit.
Tomcat性能调优方案 Sobfist apache jvm tomcat 应用服务器
一、操作系统调优对于操作系统优化来说，是尽可能的增大可使用的内存容量、提高CPU的频率，保证文件系统的读写速率等。经过压力测试验证，在并发连接很多的情况下，CPU的处理能力越强，系统运行速度越快。。【适用场景】任何项目。二、Java虚拟机调优应该选择SUN的JVM，在满足项目需要的前提下，尽量选用版本较高的JVM，一般来说高版本产品在速度和效率上比低版本会有改进。 J
SQLServer学习笔记 vipbooks 数据结构 xml
1、create database school 创建数据库school 2、drop database school 删除数据库school 3、use school 连接到school数据库，使其成为当前数据库 4、create table class(classID int primary key identity not null) 创建一个名为class的表，其有一

知识图谱商业应用 、介绍

你可能感兴趣的:(nlp,nlp,知识图谱)

知识图谱商业应用、介绍