星川皆无恙

大数据知识图谱之深度学习——基于BERT+LSTM+CRF深度学习识别模型医疗知识图谱问答可视化系统

文章目录

大数据知识图谱之深度学习——基于BERT+LSTM+CRF深度学习识别模型医疗知识图谱问答可视化系统
- 一、项目概述
- 二、系统实现基本流程
- 三、项目工具所用的版本号
- 四、所需要软件的安装和使用
- 五、开发技术简介
- - Django技术介绍
  - Neo4j数据库
  - Bootstrap4框架
  - Echarts简介
  - Navicat Premium 15简介
  - Layui简介
  - Python语言介绍
  - MySQL数据库
  - 深度学习
- 六、核心理论
- - 贪心算法
  - Aho-Corasick算法
  - BERT（Bidirectional Encoder Representations from Transformers）
  - 长短时记忆网络（Long Short-Term Memory，LSTM）
  - 条件随机场（Conditional Random Field，CRF）
  - 命名实体识别
  - 实体对齐
  - 语义知识库问答
- 七、系统实现
- 八、结语

大数据知识图谱之深度学习——基于BERT+LSTM+CRF深度学习识别模型医疗知识图谱问答可视化系统

一、项目概述

知识图谱是将知识连接起来形成的一个网络。由节点和边组成，节点是实体，边是两个实体的关系，节点和边都可以有属性。知识图谱除了可以查询实体的属性外，还可以很方便的从一个实体通过遍历关系的方式找到相关的实体及属性信息。

BERT是一种基于Transformer 架构的预训练语言模型，能够捕捉双向上下文信息。BERT 模型在大规模语料上进行预训练，然后可以通过微调来适应特定任务,BERT 可用于处理输入文本，提取丰富的语义信息。它可以用于文本的编码和表征学习，以便更好地理解医学问答中的问题和回答。LSTM 是一种递归神经网络（RNN）的变体，专门设计用于处理序列数据。它通过使用门控机制来捕捉长期依赖关系，适用于处理时间序列和自然语言等序列数据。 LSTM 可以用于处理医学文本中的序列信息，例如病历、症状描述等。它有助于保留文本中的上下文信息，提高模型对长文本的理解能力。CRF 是一种用于标注序列数据的统计建模方法。在序列标注任务中，CRF 能够考虑标签之间的依赖关系，从而更好地捕捉序列结构。在医学文本中，CRF 可以用于命名实体识别（NER）任务，例如识别疾病、药物、实验室结果等实体。通过引入CRF层，可以提高标签之间的一致性和整体序列标注的准确性。

基于BERT+LSTM+CRF深度学习识别模型医疗知识图谱问答可视化系统通过构建医疗领域的知识图谱来实现计算机的深度学习，并且能够实现自动问答的功能。本次的内容研究主要是通过以Python技术来对医疗相关内容进行数据的爬取，通过爬取足量的数据来进行知识图谱的的搭建，基于Python语言通过echarts、Neo4j来实现知识图谱的可视化。通过智慧问答的方式构建出以BERT+LSTM+CRF的深度学习识别模型，从而完成对医疗问句主体的识别，构建出数据集以及实现文本的训练。通过Django来进行web网页的开发，通过面向用户的网页端开发使用来满足用户医疗问答的需要。

二、系统实现基本流程

配置好所需要的环境（jdk1.8,neo4j,pycharm,python等）
爬取所需要的医学数据，获取所需基本的医疗数据。
对医疗数据进行数据清洗处理。
关系抽取定义与实体识别等。
基于BERT+LSTM+CRF深度学习知识图谱建模。
数据可视化、深度学习问答、问句分析可视化、知识图谱可视化等。
知识问句分析管理、系统用户管理等功能完善做出一个完整的基于BERT+LSTM+CRF深度学习识别模型医疗知识图谱问答可视化系统。

三、项目工具所用的版本号

Neo4j版本：Neo4j Desktop1.5.6或者neo4j-community-3.1.0都可以;

neo4j里面医疗系统数据库版本：3.1.0;

Pycharm版本：2021.2.1;

JDK版本：jdk1.8.0_211;

MongoDB版本：MongoDB-windows-x86_64-5.0.14;

Django版本:3.2.8

四、所需要软件的安装和使用

(一)安装JAVA
1.下载java安装包：
官网下载链接：https://www.oracle.com/java/technologies/javase-downloads.html
配置的话这里不再过多描述，之前写过详细的JDK配置，可以看一下
附链接：
JDK的环境配置（超级详细教程）

neo4j数据库所用的是neo4j-community-3.1.0版本，目录参数信息如下：

五、开发技术简介

Django技术介绍

Django是一个开放源代码的Web应用框架，由Python写成。采用了MVC的软件设计模式，即模型M，视图V和控制器C。Django 框架的核心组件有：

用于创建模型的对象关系映射
为最终用户设计的完美管理界面
一流的 URL 设计
设计者友好的模板语言
缓存系统。

在Django中，控制器接受用户输入的部分由框架自行处理，所以 Django 里更关注的是模型（Model）、模板(Template)和视图（Views），称为 MTV模式。它们各自的职责如下：

层次
模型（Model），即数据存取层
模板(Template)，即表现层
视图（View），即业务逻辑层

模型（Model），即数据存取层处理与数据相关的所有事务：如何存取、如何验证有效性、包含哪些行为以及数据之间的关系等。

模板(Template)，即表现层处理与表现相关的决定：如何在页面或其他类型文档中进行显示。

视图（View），即业务逻辑层存取模型及调取恰当模板的相关逻辑。模型与模板之间的桥梁。

Django 视图不处理用户输入，而仅仅决定要展现哪些数据给用户，而Django 模板仅仅决定如何展现Django视图指定的数据。或者说, Django将MVC中的视图进一步分解为 Django视图和 Django模板两个部分，分别决定 “展现哪些数据” 和 “如何展现”，使得Django的模板可以根据需要随时替换，而不仅仅限制于内置的模板。

Django的主要目的是简便、快速的开发数据库驱动的网站。它强调代码复用,多个组件可以很方便的以“插件”形式服务于整个框架，Django有许多功能强大的第三方插件，你甚至可以很方便的开发出自己的工具包。这使得Django具有很强的可扩展性。它还强调快速开发和DRY(Do Not Repeat Yourself)原则。

1.对象关系映射 (ORM,object-relational mapping)：以Python类形式定义你的数据模型，ORM将模型与关系数据库连接起来，你将得到一个非常容易使用的数据库API，同时你也可以在Django中使用原始的SQL语句。

2.URL 分派：使用正则表达式匹配URL，你可以设计任意的URL，没有框架的特定限定。像你喜欢的一样灵活

3.模版系统：使用Django强大而可扩展的模板语言，可以分隔设计、内容和Python代码。并且具有可继承性。

4.表单处理：你可以方便的生成各种表单模型，实现表单的有效性检验。可以方便的从你定义的模型实例生成相应的表单。

5.Cache系统：可以挂在内存缓冲或其它的框架实现超级缓冲－－实现你所需要的粒度。

6.会话(session)，用户登录与权限检查，快速开发用户会话功能。

7.国际化：内置国际化系统，方便开发出多种语言的网站。

8.自动化的管理界面：不需要你花大量的工作来创建人员管理和更新内容。Django自带一个ADMIN site,类似于内容管理系统。

Neo4j数据库

Neo4j数据库是一个轻量级的、高性能的图形数据库，该数据库也被称之为是图片引擎，能够同面向对象的方式来进行数据的处理。该技术能够通过嵌入式的开发实现java持久化引擎的应用。该技术也是开源的技术，截止目前已经有一亿多个节点，其可以满足绝大多数的用户需求。作为一个高性能的,NOSQL图形数据库，它将结构化数据存储在网络上而不是表中。它是一个嵌入式的、基于磁盘的、具备完全的事务特性的Java持久化引擎，但是它将结构化数据存储在网络(从数学角度叫做图)上而不是表中。Neo4j也可以被看作是一个高性能的图引擎，该引擎具有成熟数据库的所有特性。程序员工作在一个面向对象的、灵活的网络结构下而不是严格、静态的表中——但是他们可以享受到具备完全的事务特性、企业级的数据库的所有好处。

Bootstrap4框架

Bootstrap是一个流行的开源前端框架，用于快速开发响应式和移动优先的网站。Bootstrap 4是Bootstrap框架的第四个主要版本，它引入了许多新的特性和改进。Bootstrap 4框架的详细介绍及优势：

响应式设计： Bootstrap 4是一个响应式设计的框架，可以确保网站在各种设备上都能够良好显示，包括桌面、平板和手机。

网格系统： Bootstrap的网格系统是其核心组件之一，它允许开发人员创建灵活的布局。网格系统基于12列，可以轻松地创建多列布局，适应不同屏幕大小。

移动优先： Bootstrap 4采用移动优先的设计理念，使得在设计和开发时首先考虑移动设备的体验。这有助于确保网站在小屏幕上的良好表现。

CSS预处理器支持： Bootstrap 4使用Sass（Syntactically Awesome Stylesheets）作为其默认的CSS预处理器，使得定制样式变得更加灵活和方便。

组件： Bootstrap 4提供了许多内置的UI组件，如导航栏、表单、按钮、模态框、轮播等，可以在项目中轻松使用这些组件，减少开发时间。

升级的表格和表单： Bootstrap 4引入了一些改进，使得表格和表单的样式更加现代化和易于定制。

新的插件系统： Bootstrap 4引入了一种称为Popper.js的新的插件系统，用于处理弹出框和工具提示等交互式组件。

重新设计的文档： Bootstrap 4的文档经过重新设计，更加清晰易读，提供了丰富的示例和文档说明，方便开发人员使用和学习。

定制主题： Bootstrap 4允许开发人员通过使用Sass变量和mixin来轻松定制主题，以满足项目的特定需求。

浏览器支持： Bootstrap 4支持所有主流的现代浏览器，并提供了对Flexbox布局的良好支持。

总体而言，Bootstrap 4是一个功能强大且灵活的前端框架，适用于各种Web开发项目。它的广泛应用和强大的社区支持使得开发人员能够快速构建美观、响应式的网站。

Echarts简介

ECharts是一款基于JavaScript的开源可视化库，专注于提供直观、交互丰富的图表展示效果。它由百度前端开发团队开发和维护，具有灵活的配置项和丰富的图表类型，适用于各种数据可视化场景。
在本系统中，ECharts在可视化分析方面发挥着重要作用。首先，ECharts提供了丰富多样的图表类型，包括折线图、柱状图、饼图、地图等，可以满足系统对不同类型的数据进行展示的需求。通过使用ECharts，系统能够以直观、易懂的方式展示数据、历史数据。用户可以通过交互式的图表进行数据的探索和分析，从中获取有价值的信息。其次，ECharts提供了丰富的配置项和交互功能，使得系统能够灵活地定制图表展示效果和用户交互体验。此外，ECharts还提供了丰富的扩展能力和插件支持，使得系统能够根据需要定制和扩展特定的功能。例如，ECharts提供了地图可视化的支持，可以将数据以地理位置为基础展示在地图上，使用户能够直观地了解不同地区的情况。同时，ECharts还支持数据的动画效果、数据的渐变展示等，增加了图表的可视化效果和吸引力。
总之，ECharts作为一款功能强大的可视化库，在本系统中扮演着重要的角色。它通过丰富的图表类型和配置项，使系统能够以直观、交互丰富的方式展示数据。同时，ECharts的扩展能力和插件支持为系统的定制和功能扩展提供了便利。通过ECharts的应用，本系统能够提供直观、灵活的数据可视化分析功能，帮助用户更好地理解和利用数据。

Navicat Premium 15简介

Navicat Premium 15是一款功能强大且广泛使用的数据库管理工具。它提供了一个集成的开发环境，适用于不同类型的数据库，如MySQL、Oracle、SQL Server、PostgreSQL等。Navicat Premium 15具有直观的用户界面和丰富的功能，使数据库管理变得更加高效和便捷。

Navicat Premium 15作为一款强大的数据库管理工具，在本系统中发挥着重要的作用。它提供了直观的界面和丰富的功能，使用户能够方便地管理和操作MYSQL数据库。同时，它还为系统开发人员提供了便捷的开发和调试环境，加快了系统的开发进程。通过Navicat Premium 15的支持，本系统能够更好地实现天气数据的自动获取与可视化分析。

Layui简介

Layui 是一套开源免费的 Web UI 组件库，采用自身轻量级模块化规范，遵循原生态的 HTML/CSS/JavaScript 开发模式，非常适合网页界面的快速构建。Layui 区别于一众主流的前端框架，它更多是面向于后端开发者，即无需涉足各类构建工具，只需面向浏览器本身，便可将页面所需呈现的元素与交互信手拈来。Layui采用模块化的设计理念，将各个功能划分为独立的模块，每个模块都有清晰的责任和接口。这种设计使得开发者可以根据需要选择性地引入和使用不同的模块，从而减小项目体积，提高加载速度。此外，提供了大量常用的界面组件，包括但不限于按钮、表单、表格、导航、弹层、进度条等。这些组件风格简洁、统一，可以方便地进行定制和扩展，满足不同项目的需求。Layui的API设计简单易用，使得开发者无需深入研究复杂的前端技术，即可快速上手。它提供了丰富的文档和示例，方便开发者查阅和学习。在扩展性方面， Layui具有良好的扩展性，开发者可以根据项目需要编写自定义的模块或插件，并集成到Layui框架中，实现特定功能的定制化开发。

Python语言介绍

Python语言是现在最为常用的一款脚本语言技术，该语言的特点在于编程过程简单，语法平易近人。该语言的编程过程如同在进行一项语言的学习，通过符合人们日常生活使用语言的习惯来进行编程开发可以有效的提升系统编程的效率，并且在整个系统的开发过程中，该技术也能有着非常多的框架和类库可提供使用，包括django框架、flask框架等，都是Python在web端开发所经常使用的开发框架。该语言继承了C语言的编程特点，并且有着很好的跨平台使用特点，实现了一次编译，多处运行的效果。

MySQL数据库

本次的数据库选择了MySQL，该数据库是当下最为常用的一款标准SQL语言下的数据库管理工具。该数据库能够通过SQL layer以及storage engine layer来快速的对数据信息进行完整的解析与存储，通过多线程的数据服务来加快数据传输的效率，并且该数据库也支持多种开发语言，能够在不同的操作平台中均实现凯苏运行。该数据库对于硬盘内存的占用非常低，可以实现安全的数据存储，整个数据库具备了开源的特点，可以为用户的数据存储服务提供个性化的图表编辑，通过数据库表格的方式来进一步的提高数据存储的逻辑性，确保数据关系准确。

深度学习

深度学习是一种机器学习的方法，其中模型通过多层神经网络学习从输入数据中提取高层次抽象特征。深度学习模型通常包含多个层次，这些层次构成了深层结构，这也是“深度”学习一词的由来。深度学习是针对机器训练和学习的一个全新的研究方向，希望能够通过该学习方式来实现人工智能的目标。深度学习是对样本数据的学习，在对样本数据中所存在的逻辑关系、数据实体等进行解释和记录，让计算机可以通过广泛的内容学习来具备一定的分析能力、判断和识别能力，深度学习在搜索引擎、机器学习、自然语言等多个方面都形成非常好的应用效果，能够通过该学习方式来解决人工智能领域遇到的一些困难。
BERT是一种基于Transformer 架构的预训练语言模型，能够捕捉双向上下文信息。BERT 模型在大规模语料上进行预训练，然后可以通过微调来适应特定任务,BERT 可用于处理输入文本，提取丰富的语义信息。它可以用于文本的编码和表征学习，以便更好地理解医学问答中的问题和回答。LSTM 是一种递归神经网络（RNN）的变体，专门设计用于处理序列数据。它通过使用门控机制来捕捉长期依赖关系，适用于处理时间序列和自然语言等序列数据。 LSTM 可以用于处理医学文本中的序列信息，例如病历、症状描述等。它有助于保留文本中的上下文信息，提高模型对长文本的理解能力。CRF 是一种用于标注序列数据的统计建模方法。在序列标注任务中，CRF 能够考虑标签之间的依赖关系，从而更好地捕捉序列结构。在医学文本中，CRF 可以用于命名实体识别（NER）任务，例如识别疾病、药物、实验室结果等实体。通过引入CRF层，可以提高标签之间的一致性和整体序列标注的准确性。
在医疗数据中，CRF可以用于命名实体识别（NER）任务，例如识别疾病、药物、实验室结果等实体。通过引入CRF层，可以提高标签之间的一致性和整体序列标注的准确性。意图识别可以看做是一个分类问题，针对于垂直产品的特点，定义不同的查询意图类别。通过该系统设计一个强大的问答模块，能够接受用户输入的自然语言问题，并基于BERT、LSTM、CRF等算法模型生成准确的、语义一致的回答。

六、核心理论

贪心算法

贪心算法（又称贪婪算法）是指，在对问题求解时，总是做出在当前看来是最好的选择。也就是说，不从整体最优上加以考虑，他所做出的仅是在某种意义上的局部最优解。贪心算法不是对所有问题都能得到整体最优解，但对范围相当广泛的许多问题他能产生整体最优解或者是整体最优解的近似解。

贪婪算法(Greedy algorithm)是一种对某些求最优解问题的更简单、更迅速的设计技术。用贪婪法设计算法的特点是一步一步地进行，常以当前情况为基础根据某个优化测度作最优选择，而不考虑各种可能的整体情况，它省去了为找最优解要穷尽所有可能而必须耗费的大量时间，它采用自顶向下，以迭代的方法做出相继的贪心选择，每做一次贪心选择就将所求问题简化为一个规模更小的子问题，通过每一步贪心选择，可得到问题的一个最优解，虽然每一步上都要保证能获得局部最优解，但由此产生的全局解有时不一定是最优的，所以贪婪法不要回溯。

贪婪算法是一种改进了的分级处理方法。其核心是根据题意选取一种量度标准。然后将这多个输入排成这种量度标准所要求的顺序，按这种顺序一次输入一个量。如果这个输入和当前已构成在这种量度意义下的部分最佳解加在一起不能产生一个可行解，则不把此输入加到这部分解中。这种能够得到某种量度意义下最优解的分级处理方法称为贪婪算法。

对于一个给定的问题，往往可能有好几种量度标准。初看起来，这些量度标准似乎都是可取的，但实际上，用其中的大多数量度标准作贪婪处理所得到该量度意义下的最优解并不是问题的最优解，而是次优解。因此，选择能产生问题最优解的最优量度标准是使用贪婪算法的核心。

Aho-Corasick算法

Aho-Corasick算法是多模式匹配中的经典算法，目前在实际应用中较多。Aho-Corasick算法对应的数据结构是Aho-Corasick自动机，简称AC自动机Automaton。该算法能够识别出一个给定的语句中包含了哪些词典库中特定的词语，具有很有的模式匹配作用。
算法主要分为以下三个部分：

构造Goto表：成功转移到另一个状态
构造Failture指针：如果某状态发生匹配失败，需要跳转到一个特定的节点
匹配：匹配成功某一字符串

我们构建一个基于Aho-Corasick算法的trie树，用于加速过滤敏感词汇或关键词。

'''构造actree，加速过滤'''
def build_actree(self, wordlist):
    actree = ahocorasick.Automaton() # 初始化trie树，ahocorasick 库 ac自动化 自动过滤违禁数据
    for index, word in enumerate(wordlist):
        actree.add_word(word, (index, word))   # 向trie树中添加单词
    actree.make_automaton()   # 将trie树转化为Aho-Corasick自动机
    return actree

使用Aho-Corasick自动机的目的是在输入文本中高效地检测和过滤多个关键词。这种数据结构的优势在于，它能够同时匹配多个关键词而无需多次扫描输入文本，因此在过滤大量文本时性能较高。

BERT（Bidirectional Encoder Representations from Transformers）

BERT（Bidirectional Encoder Representations from Transformers）属于深度学习模型。它是一种基于变压器（Transformer）架构的预训练模型，通过在大规模文本数据上进行无监督的预训练来学习语言表示。BERT在处理自然语言处理（NLP）任务时取得了很大的成功，包括文本分类、命名实体识别、语义角色标注等。BERT 模型在大规模语料上进行预训练，然后可以通过微调来适应特定任务,BERT 可用于处理输入文本，提取丰富的语义信息。它可以用于文本的编码和表征学习，以便更好地理解医学问答中的问题和回答。BERT的关键创新之一是使用了双向（bidirectional）的注意力机制，使模型能够同时考虑一个词的上下文信息，而传统的语言模型通常是从左到右或从右到左单向考虑上下文。
BERT建立在Transformer架构上，这是一种基于自注意力机制的深度学习模型。Transformer被广泛应用于自然语言处理任务，取得了显著的成功。它允许模型在并行计算的基础上有效地捕捉长距离依赖关系。总的来说，BERT代表了深度学习在自然语言处理领域的巨大进展，为多种NLP任务提供了先进的性能。

长短时记忆网络（Long Short-Term Memory，LSTM）

长短时记忆网络（Long Short-Term Memory，LSTM）是一种深度学习模型中的一种特殊类型的循环神经网络（Recurrent Neural Network，RNN）。LSTM专门设计用来解决传统RNN中遇到的梯度消失和梯度爆炸的问题，使得网络能够更好地捕捉和记忆长距离依赖关系。
LSTM 是一种递归神经网络（RNN）的变体，专门设计用于处理序列数据。它通过使用门控机制来捕捉长期依赖关系，适用于处理时间序列和自然语言等序列数据。 LSTM 可以用于处理医学文本中的序列信息，例如病历、症状描述等。它有助于保留文本中的上下文信息，提高模型对长文本的理解能力。

条件随机场（Conditional Random Field，CRF）

CRF是一种判别式概率图模型，用于建模标签序列的联合概率分布。在序列标注任务中，CRF可以捕捉标签之间的依赖关系，特别是相邻标签之间的依赖。这对于诸如命名实体识别、词性标注等序列标注任务非常重要。为了更好地捕捉标签之间的关系，CRF经常被用作深度学习模型的输出层。具体来说，深度学习模型可以学习输入序列的表示，然后使用CRF层对这些表示进行解码，考虑标签之间的依赖关系，从而生成最终的标签序列。
这种结合CRF和深度学习的方法在自然语言处理任务中广泛应用，包括命名实体识别、词性标注、分块等。通过结合深度学习的表示学习和CRF的序列建模能力，模型在序列标注任务上取得了更好的性能。在医学文本中，CRF 可以用于命名实体识别（NER）任务，例如识别疾病、药物、实验室结果等实体。通过引入CRF层，可以提高标签之间的一致性和整体序列标注的准确性。

命名实体识别

命名实体识别是一种可以在非结构化的文本中，通过特定的实体来进行文本的识别，是一种专名的识别。该识别方式是在特定的领域中，通过对领域中的实体类型进行精准的定义，例如在医疗领域中，针对与医疗相关的疾病、症状、药物、问诊等内容进行系统性的内容定义，也能够通过命名实体识别来对药剂、价格、收款等内容进行定义，这种定义的方式可以通过精准匹配的方式来进行实体边界的识别，并且可以实现对边界的正确标记。命名实体识别的方法主要有三种方式，第一种是通过利用规则法来进行规则的人工编写；第二种是通过HMM、CRF等模型来进行机器学习模板订制；第三种是通过神经网络的方式以LSTM、RNN等算法来进行特征的提取。

实体对齐

知识图谱与问答系统的应用结合已经非常的广泛，将不同的知识图谱进行对接可以实现有效的数据互补，形成一个更大的知识图谱。而知识图谱越大，其中包含的实体内容就越多，就越需要解决实体对齐的问题。实体对其主要包括了成对的实体对齐、集体实体对其等，通过不同的算法使用能够很好的完成不同知识图谱之间的相同数据对象表示的对齐问题解决。

语义知识库问答

语义解析是一种应用在知识库中非常常见的语言解析方式，可以将自然语言进行逻辑的转换，从而让自然语言被转换为可执行的查询语言。而语义知识库是先通过语义的解析，再通过搜索引擎的处理来进行逻辑判断并最终实现查询结果的获取。语义知识库可通过可解释性的方式来提升知识问答的精准度，最终实现面向知识图谱的自然语言问答环境的生成。

七、系统实现

数据爬取与清洗不再过多描述，具体看
大数据知识图谱——基于知识图谱+深度学习的大数据(KBQA)NLP医疗知识问答系统（全网最详细讲解及源码/建议收藏）

部分核心代码：

一小部分截图展示，其它内容这里不再过多描述。

系统登录界面
通过首页登录名及密码信息的录入实现系统平台的登录使用，对于没有系统账号的用户可以通过注册页面实现在线的用户注册，系统界面的内容呈现相对简洁，具体界面呈现内容如下：

系统首页
进入到识别系统后台，系统首页界面主要介绍了知识图谱的概述，同时通过首页导航意图识别、问句管理以及问句分析功能模块的内容实现在线问答，结合医疗领域的问句管理及问句分析可以对系统端的问句内容进行整理和数据统计，系统用户可以通过修改密码以及用户管理实现识别系统登录及个人信息的维护，具体系统首页内容呈现如下图所示：

深度学习问答界面
基于BERT+LSTM+CRF深度学习识别模型医疗知识图谱问答可视化系统的主要功能模块为深度学习问答模块，用户可以通过该功能模块实现在线问答，通过界面下方的输入栏实现医疗领域相关问题的录入，通过点击发送实现在线提问，系统会结合用户端的问题进行意图分析并反馈问题答复内容，具体意图识别界面的主要功能栏内容呈现如下：

知识问句管理
知识问句管理是对系统用户提出的问题信息进行统一的管理和查询，主要呈现了系统用户提出的问题信息、答案信息以及提出问题用户的个人信息及提问时间等内容，可以对于重复的问题内容进行在线的删除操作，同时也可以结合问题内容进行搜索和查找，具体知识问句管理界面内容呈现如下图所示：

问句分析可视化界面
问句分析可视化主要是对于系统平台的问题内容进行关键字及查询次数内容的统计，通过该界面进行可视化呈现了医疗领域问题的内容以及提出问题的次数，结合问句分析对高频词的问题内容进行分析和统计，具体问句分析界面呈现如下：

用户修改密码界面
用户可以通过修改密码模块实现登录密码的修改，通过录入新密码和复核录入来实现密码的修改，具体密码修改页面内容如下：

系统用户管理界面
通过系统用户管理界面可以实现用户的新增以及用户基本信息的修改，只需要录入用户姓名、密码以及手机号就可以实现在线用户新增，这里手机号必须为11位数字，具体用户新增界面信息内容录入如下图所示：

知识图谱可视化界面
通过系统知识图谱可视化界面通常一种图形化的表示方式，用于展示知识图谱中的实体（节点）以及它们之间的关系（边）。这样的界面有助于用户更直观地理解和探索复杂的知识结构。具体知识图谱可视化界面界面信息如下图所示：

八、结语

通过该系统设计一个强大的问答模块，能够接受用户输入的自然语言问题，并基于Aho-Corasick算法、贪心算法及深度学习模型BERT、LSTM、CRF等算法模型生成准确的、语义一致的回答。同时结合系统的问句分析和管理来帮助统计系统的问句管理信息，实现便捷的信息查询与管理。基于此次医疗领域深度学习用户问答系统的研究，在系统开发和结构搭建上还存在一定的改进和优化空间，因当前对中文临床医疗领域的知识图谱数据信息相对缺乏，在构建医疗知识图谱的基础上还需要各方资源的整合，还需要对知识库进行不断的信息扩充和维护，同时对单实体多关系复杂情况的问题反馈，未来仍需要在知识的抽取上还需要不断完善，在数据库语料构建以及知识库的扩充上做更加深入的研究。

所有项目非开源,需项目源码资料/商业合作/交流探讨等可以评论留言并添加文末下面个人名片，后面有时间和精力也会分享更多关于大数据领域方面的优质内容，喜欢的小伙伴可以点赞关注收藏，感谢各位的喜欢与支持！

你可能感兴趣的:(机器学习与深度学习,知识图谱,自然语言处理,深度学习,大数据,知识图谱,神经网络,机器学习,bert,lstm)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
使用Apify加载Twitter消息以进行微调的完整指南 nseejrukjhad twitter easyui 前端 python
#使用Apify加载Twitter消息以进行微调的完整指南##引言在自然语言处理领域，微调模型以适应特定任务是提升模型性能的常见方法。本文将介绍如何使用Apify从Twitter导出聊天信息，以便进一步进行微调。##主要内容###使用Apify导出推文首先，我们需要从Twitter导出推文。Apify可以帮助我们做到这一点。通过Apify的强大功能，我们可以批量抓取和导出数据，适用于各类应用场景。
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
ES聚合分析原理与代码实例讲解光剑书架上的书大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
ES聚合分析原理与代码实例讲解1.背景介绍1.1问题的由来在大规模数据分析场景中，特别是在使用Elasticsearch（ES）进行数据存储和检索时，聚合分析成为了一个至关重要的功能。聚合分析允许用户对数据集进行细分和分组，以便深入探索数据的结构和模式。这在诸如实时监控、日志分析、业务洞察等领域具有广泛的应用。1.2研究现状目前，ES聚合分析已经成为现代大数据平台的核心组件之一。它支持多种类型的聚
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
自然语言处理_tf-idf _feivirus_ 算法机器学习和数学自然语言处理 tf-idf 逆文档频率词频
importpandasaspdimportmath1.数据预处理docA="Thecatsatonmyface"docB="Thedogsatonmybed"wordsA=docA.split("")wordsB=docB.split("")wordsSet=set(wordsA).union(set(wordsB))print(wordsSet){'on','my','face','sat',
BART&BERT Ambition_LAO 深度学习
BART和BERT都是基于Transformer架构的预训练语言模型。模型架构：BERT(BidirectionalEncoderRepresentationsfromTransformers)主要是一个编码器（Encoder）模型，它使用了Transformer的编码器部分来处理输入的文本，并生成文本的表示。BERT特别擅长理解语言的上下文，因为它在预训练阶段使用了掩码语言模型（MLM）任务，即
遥感影像的切片处理 sand&wich 计算机视觉 python 图像处理
在遥感影像分析中，经常需要将大尺寸的影像切分成小片段，以便于进行详细的分析和处理。这种方法特别适用于机器学习和图像处理任务，如对象检测、图像分类等。以下是如何使用Python和OpenCV库来实现这一过程，同时确保每个影像片段保留正确的地理信息。准备环境首先，确保安装了必要的Python库，包括numpy、opencv-python和xml.etree.ElementTree。这些库将用于图像处理
WebMagic：强大的Java爬虫框架解析与实战 Aaron_945 Java java 爬虫开发语言
文章目录引言官网链接WebMagic原理概述基础使用1.添加依赖2.编写PageProcessor高级使用1.自定义Pipeline2.分布式抓取优点结论引言在大数据时代，网络爬虫作为数据收集的重要工具，扮演着不可或缺的角色。Java作为一门广泛使用的编程语言，在爬虫开发领域也有其独特的优势。WebMagic是一个开源的Java爬虫框架，它提供了简单灵活的API，支持多线程、分布式抓取，以及丰富的
免费的GPT可在线直接使用（一键收藏） kkai人工智能 gpt
1、LuminAI（https://kk.zlrxjh.top）LuminAI标志着一款融合了星辰大数据模型与文脉深度模型的先进知识增强型语言处理系统，旨在自然语言处理（NLP）的技术开发领域发光发热。此系统展现了卓越的语义把握与内容生成能力，轻松驾驭多样化的自然语言处理任务。VisionAI在NLP界的应用领域广泛，能够胜任从机器翻译、文本概要撰写、情绪分析到问答等众多任务。通过对大量文本数据的
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
AI论文题目生成器怎么用？9款论文写作网站简单3步搞定小猪包333 写论文人工智能深度学习计算机视觉
在当今信息爆炸的时代，AI写作工具的出现极大地提高了写作效率和质量。本文将详细介绍9款优秀的论文写作网站，并重点推荐千笔-AIPassPaper。一、千笔-AIPassPaper千笔-AIPassPaper是一款功能强大的AI论文生成器，基于最新的自然语言处理技术，能够一键生成高质量的毕业论文、开题报告等文本内容。它不仅提供智能选题、文献推荐和论文润色等功能，还具有较高的用户评价。其文献综述生成功
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
如何利用大数据与AI技术革新相亲交友体验 h17711347205 回归算法安全系统架构交友小程序
在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
ai绘画工具midjourney怎么下载？附作品管理教程设计师早上好
Midjourney是一款功能强大的AI绘画工具，它使用机器学习技术和深度神经网络等算法，可以生成各种艺术风格的绘画作品。在创意设计、广告宣传等方面有着广泛的应用前景。那么，ai绘画工具midjourney怎么下载？本文将为您介绍Midjourney的下载以及作品的相关管理。一、Midjourney下载Midjourney的下载非常简单，只需打开Midjourney官网（点击“GetMidjour
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
[实践应用] 深度学习之优化器 YuanDaima2048 深度学习工具使用 pytorch 深度学习人工智能机器学习 python 优化器
文章总览：YuanDaiMa2048博客文章总览深度学习之优化器1.随机梯度下降（SGD）2.动量优化（Momentum）3.自适应梯度（Adagrad）4.自适应矩估计（Adam）5.RMSprop总结其他介绍在深度学习中，优化器用于更新模型的参数，以最小化损失函数。常见的优化函数有很多种，下面是几种主流的优化器及其特点、原理和PyTorch实现：1.随机梯度下降（SGD）原理:随机梯度下降通过
机器学习-聚类算法不良人龍木木机器学习机器学习算法聚类
机器学习-聚类算法1.AHC2.K-means3.SC4.MCL仅个人笔记，感谢点赞关注！1.AHC2.K-means3.SC传统谱聚类：个人对谱聚类算法的理解以及改进4.MCL目前仅专注于NLP的技术学习和分享感谢大家的关注与支持！
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
吴恩达深度学习笔记(30)-正则化的解释极客Array
正则化（Regularization）深度学习可能存在过拟合问题——高方差，有两个解决方法，一个是正则化，另一个是准备更多的数据，这是非常可靠的方法，但你可能无法时时刻刻准备足够多的训练数据或者获取更多数据的成本很高，但正则化通常有助于避免过拟合或减少你的网络误差。如果你怀疑神经网络过度拟合了数据，即存在高方差问题，那么最先想到的方法可能是正则化，另一个解决高方差的方法就是准备更多数据，这也是非常
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
Hadoop架构 henan程序媛 hadoop 大数据分布式
一、案列分析1.1案例概述现在已经进入了大数据(BigData)时代，数以万计用户的互联网服务时时刻刻都在产生大量的交互，要处理的数据量实在是太大了，以传统的数据库技术等其他手段根本无法应对数据处理的实时性、有效性的需求。HDFS顺应时代出现，在解决大数据存储和计算方面有很多的优势。1.2案列前置知识点1.什么是大数据大数据是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的大量数据集合，
python中zeros用法_Python中的numpy.zeros()用法江平舟 python中zeros用法
numpy.zeros()函数是最重要的函数之一,广泛用于机器学习程序中。此函数用于生成包含零的数组。numpy.zeros()函数提供给定形状和类型的新数组,并用零填充。句法numpy.zeros(shape,dtype=float,order='C'参数形状：整数或整数元组此参数用于定义数组的尺寸。此参数用于我们要在其中创建数组的形状,例如(3,2)或2。dtype：数据类型(可选)此参数用于
[转载] NoSQL简介 weixin_30325793 大数据数据库运维
摘自“百度百科”。NoSQL，泛指非关系型的数据库。随着互联网web2.0网站的兴起，传统的关系数据库在应付web2.0网站，特别是超大规模和高并发的SNS类型的web2.0纯动态网站已经显得力不从心，暴露了很多难以克服的问题，而非关系型的数据库则由于其本身的特点得到了非常迅速的发展。NoSQL数据库的产生就是为了解决大规模数据集合多重数据种类带来的挑战，尤其是大数据应用难题。虽然NoSQL流行语
java责任链模式 3213213333332132 java 责任链模式村民告县长
责任链模式，通常就是一个请求从最低级开始往上层层的请求，当在某一层满足条件时，请求将被处理，当请求到最高层仍未满足时，则请求不会被处理。就是一个请求在这个链条的责任范围内，会被相应的处理，如果超出链条的责任范围外，请求不会被相应的处理。下面代码模拟这样的效果：创建一个政府抽象类,方便所有的具体政府部门继承它。 package 责任链模式; /** *
linux、mysql、nginx、tomcat 性能参数优化 ronin47
一、linux 系统内核参数 /etc/sysctl.conf文件常用参数 net.core.netdev_max_backlog = 32768 #允许送到队列的数据包的最大数目 net.core.rmem_max = 8388608 #SOCKET读缓存区大小 net.core.wmem_max = 8388608 #SOCKET写缓存区大
php命令行界面 dcj3sjt126com PHP cli
常用选项 php -v php -i PHP安装的有关信息 php -h 访问帮助文件 php -m 列出编译到当前PHP安装的所有模块执行一段代码 php -r 'echo "hello, world!";' php -r 'echo "Hello, World!\n";' php -r '$ts = filemtime("
Filter&Session 171815164 session
Filter HttpServletRequest requ = (HttpServletRequest) req; HttpSession session = requ.getSession(); if (session.getAttribute("admin") == null) { PrintWriter out = res.ge
连接池与Spring,Hibernate结合 g21121 Hibernate
前几篇关于Java连接池的介绍都是基于Java应用的，而我们常用的场景是与Spring和ORM框架结合，下面就利用实例学习一下这方面的配置。 1.下载相关内容： &nb
[简单]mybatis判断数字类型 53873039oycg mybatis
昨天同事反馈mybatis保存不了int类型的属性,一直报错，错误信息如下: Caused by: java.lang.NumberFormatException: For input string: "null" at sun.mis
项目启动时或者启动后ava.lang.OutOfMemoryError: PermGen space 程序员是怎么炼成的 eclipse jvm tomcat catalina.sh eclipse.ini
在启动比较大的项目时，因为存在大量的jsp页面，所以在编译的时候会生成很多的.class文件，.class文件是都会被加载到jvm的方法区中，如果要加载的class文件很多，就会出现方法区溢出异常 java.lang.OutOfMemoryError: PermGen space. 解决办法是点击eclipse里的tomcat，在
我的crm小结 aijuans crm
各种原因吧，crm今天才完了。主要是接触了几个新技术： Struts2、poi、ibatis这几个都是以前的项目中用过的。 Jsf、tapestry是这次新接触的，都是界面层的框架，用起来也不难。思路和struts不太一样，传说比较简单方便。不过个人感觉还是struts用着顺手啊，当然springmvc也很顺手，不知道是因为习惯还是什么。jsf和tapestry应用的时候需要知道他们的标签、主
spring里配置使用hibernate的二级缓存几步 antonyup_2006 java spring Hibernate xml cache
．在spring的配置文件中 applicationContent.xml，hibernate部分加入 xml 代码 <prop key="hibernate.cache.provider_class">org.hibernate.cache.EhCacheProvider</prop> <prop key="hi
JAVA基础面试题百合不是茶抽象实现接口 String类接口继承抽象类继承实体类自定义异常
/* * 栈（stack）：主要保存基本类型（或者叫内置类型）（char、byte、short、 *int、long、 float、double、boolean）和对象的引用，数据可以共享，速度仅次于 * 寄存器（register），快于堆。堆（heap）：用于存储对象。 */ &
让sqlmap文件 "继承" 起来 bijian1013 java ibatis sqlmap
多个项目中使用ibatis , 和数据库表对应的 sqlmap文件（增删改查等基本语句)，dao, pojo 都是由工具自动生成的, 现在将这些自动生成的文件放在一个单独的工程中，其它项目工程中通过jar包来引用，并通过"继承"为基础的sqlmap文件，dao,pojo 添加新的方法来满足项
精通Oracle10编程SQL(13)开发触发器 bijian1013 oracle 数据库 plsql
/* *开发触发器 */ --得到日期是周几 select to_char(sysdate+4,'DY','nls_date_language=AMERICAN') from dual; select to_char(sysdate,'DY','nls_date_language=AMERICAN') from dual; --建立BEFORE语句触发器 CREATE O
【EhCache三】EhCache查询 bit1129 ehcache
本文介绍EhCache查询缓存中数据，EhCache提供了类似Hibernate的查询API，可以按照给定的条件进行查询。要对EhCache进行查询，需要在ehcache.xml中设定要查询的属性数据准备 @Before public void setUp() { //加载EhCache配置文件 Inpu
CXF框架入门实例白糖_ spring Web 框架 webservice servlet
CXF是apache旗下的开源框架，由Celtix + XFire这两门经典的框架合成，是一套非常流行的web service框架。它提供了JAX-WS的全面支持，并且可以根据实际项目的需要，采用代码优先（Code First）或者 WSDL 优先（WSDL First）来轻松地实现 Web Services 的发布和使用，同时它能与spring进行完美结合。在apache cxf官网提供
angular.equals boyitech AngularJS AngularJS API AnguarJS 中文API angular.equals
angular.equals 描述: 比较两个值或者两个对象是不是相等。还支持值的类型，正则表达式和数组的比较。两个值或对象被认为是相等的前提条件是以下的情况至少能满足一项：两个值或者对象能通过=== （恒等）的比较两个值或者对象是同样类型，并且他们的属性都能通过angular
java-腾讯暑期实习生-输入一个数组A[1,2,...n]，求输入B，使得数组B中的第i个数字B[i]=A[0]*A[1]*...*A[i-1]*A[i+1] bylijinnan java
这道题的具体思路请参看何海涛的微博：http://weibo.com/zhedahht import java.math.BigInteger; import java.util.Arrays; public class CreateBFromATencent { /** * 题目：输入一个数组A[1,2,...n]，求输入B，使得数组B中的第i个数字B[i]=A
FastDFS 的安装和配置修订版 Chen.H linux fastDFS 分布式文件系统
FastDFS Home:http://code.google.com/p/fastdfs/ 1. 安装 http://code.google.com/p/fastdfs/wiki/Setup http://hi.baidu.com/leolance/blog/item/3c273327978ae55f93580703.html 安装libevent (对libevent的版本要求为1.4.
[强人工智能]拓扑扫描与自适应构造器 comsci 人工智能
当我们面对一个有限拓扑网络的时候,在对已知的拓扑结构进行分析之后,发现在连通点之后,还存在若干个子网络,且这些网络的结构是未知的,数据库中并未存在这些网络的拓扑结构数据....这个时候,我们该怎么办呢? 那么,现在我们必须设计新的模块和代码包来处理上面的问题
oracle merge into的用法 daizj oracle sql merget into
Oracle中merge into的使用 http://blog.csdn.net/yuzhic/article/details/1896878 http://blog.csdn.net/macle2010/article/details/5980965 该命令使用一条语句从一个或者多个数据源中完成对表的更新和插入数据. ORACLE 9i 中，使用此命令必须同时指定UPDATE 和INSE
不适合使用Hadoop的场景 datamachine hadoop
转自：http://dev.yesky.com/296/35381296.shtml。　　Hadoop通常被认定是能够帮助你解决所有问题的唯一方案。当人们提到“大数据”或是“数据分析”等相关问题的时候，会听到脱口而出的回答：Hadoop! 实际上Hadoop被设计和建造出来，是用来解决一系列特定问题的。对某些问题来说，Hadoop至多算是一个不好的选择，对另一些问题来说，选择Ha
YII findAll的用法 dcj3sjt126com yii
看文档比较糊涂，其实挺简单的： $predictions=Prediction::model()->findAll("uid=:uid",array(":uid"=>10)); 第一个参数是选择条件：”uid=10″。其中:uid是一个占位符，在后面的array(“:uid”=>10)对齐进行了赋值；更完善的查询需要
vim 常用 NERDTree 快捷键 dcj3sjt126com vim
下面给大家整理了一些vim NERDTree的常用快捷键了，这里几乎包括了所有的快捷键了，希望文章对各位会带来帮助。切换工作台和目录 ctrl + w + h 光标 focus 左侧树形目录ctrl + w + l 光标 focus 右侧文件显示窗口ctrl + w + w 光标自动在左右侧窗口切换ctrl + w + r 移动当前窗口的布局位置 o 在已有窗口中打开文件、目录或书签，并跳
Java把目录下的文件打印出来蕃薯耀列出目录下的文件文件夹下面的文件目录下的文件
Java把目录下的文件打印出来 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月11日 11:02:
linux远程桌面----VNCServer与rdesktop hanqunfeng Desktop
windows远程桌面到linux，需要在linux上安装vncserver，并开启vnc服务，同时需要在windows下使用vnc-viewer访问Linux。vncserver同时支持linux远程桌面到linux。 linux远程桌面到windows，需要在linux上安装rdesktop，同时开启windows的远程桌面访问。下面分别介绍，以windo
guava中的join和split功能 jackyrong java
guava库中，包含了很好的join和split的功能，例子如下： 1）将LIST转换为使用字符串连接的字符串 List<String> names = Lists.newArrayList("John", "Jane", "Adam", "Tom");
Web开发技术十年发展历程 lampcy android Web 浏览器 html5
回顾web开发技术这十年发展历程： Ajax 03年的时候我上六年级，那时候网吧刚在小县城的角落萌生。传奇，大话西游第一代网游一时风靡。我抱着试一试的心态给了网吧老板两块钱想申请个号玩玩，然后接下来的一个小时我一直在，注，册，账，号。彼时网吧用的512k的带宽，注册的时候，填了一堆信息，提交，页面跳转，嘣，”您填写的信息有误，请重填”。然后跳转回注册页面，以此循环。我现在时常想，如果当时a
架构师之mima-----------------mina的非NIO控制IOBuffer(说得比较好) nannan408 buffer
1.前言。如题。 2.代码。 IoService IoService是一个接口，有两种实现：IoAcceptor和IoConnector；其中IoAcceptor是针对Server端的实现，IoConnector是针对Client端的实现；IoService的职责包括： 1、监听器管理 2、IoHandler 3、IoSession
ORA-00054:resource busy and acquire with NOWAIT specified Everyday都不同 oracle session Lock
[Oracle] 今天对一个数据量很大的表进行操作时，出现如题所示的异常。此时表明数据库的事务处于“忙”的状态，而且被lock了，所以必须先关闭占用的session。 step1，查看被lock的session： select t2.username, t2.sid, t2.serial#, t2.logon_time from v$locked_obj
javascript学习笔记 tntxia JavaScript
javascript里面有6种基本类型的值:number、string、boolean、object、function和undefined。number：就是数字值，包括整数、小数、NaN、正负无穷。string:字符串类型、单双引号引起来的内容。boolean:true、false object:表示所有的javascript对象，不用多说function:我们熟悉的方法，也就是
Java enum的用法详解 xieke90 enum 枚举
Java中枚举实现的分析：示例： public static enum SEVERITY{ INFO,WARN,ERROR } enum很像特殊的class，实际上enum声明定义的类型就是一个类。而这些类都是类库中Enum类的子类 (java.l