Ultipa

图观 | ChatGTP是如何通过知识图谱回答问题的？

文/Emma Z

1950年，图灵发表了具有里程碑意义的论文《计算机器与智能》（Computing Machinery and Intelligence），提出了一个关于机器人的著名判断原则——图灵测试，也被称为图灵判断，它指出如果第三者无法辨别人类与AI机器反应的差别，则可以论断该机器具备人工智能。

2008年，漫威《钢铁侠》中的AI管家贾维斯，让人们知道了AI是如何精准地帮助人类（托尼）解决丢过来的各种事务的……

图1：AI管家贾维斯（图片来源网络）

2023年初，以2C的方式从科技界火爆破圈的免费聊天机器人ChatGPT浪翻全球。

据瑞银的研报，其月活用户在1月份就达到了1亿，目前还在增长着，它已成为史上增长最快的消费者应用。此外，其东家OpenAI继前期发布了每月42美元的专业版Pro后，马上就要推出Plus版，据说每月20美元左右。

当一件新事物，月活上亿，流量上来，并且开启商业变现之后，你是否对它背后的各种技术感到好奇？比如，聊天机器人是如何处理和查询海量数据的？

体验过ChatGPT的朋友都有同感，它显然比天猫精灵或小爱童鞋要更加智能——是一个“有着无敌话术”聊天机器人，一个自然语言处理工具，一个大型语言模型，也是一个人工智能应用。它可以根据提问素材的上下文与人类互动，可以进行推理和创作，甚至还会拒绝（它认为）不当的问题，不只是完成拟人化的交流。

虽然目前对它的评价褒贬不一，但从技术发展的视角来说，它甚至有可能通过图灵测试。试问，在我们与它交流的时候，其（对于小白而言）广博的知识，可甜可油的回答，如果在我们完全不知情的前提下，是很难辨别出对方是人类还是机器（或许这才是它危险的地方——ChatGPT 的内核依然是属于深度学习范畴，存在大量黑盒与不可解释性！）。

那么，聊天机器人是怎么做到将来自3000 亿单词的训练语料库和 1750 亿的参数，快速地进行整理和输出的呢，同时还能做到结合上下文，根据它“掌握”的知识，自由应对与人类的交流的呢？其实，聊天机器人也有大脑，它跟我们人类一样，需要学习+训练。

图2：ChatGPT 学习训练图（来源官网）

它将海量的文本、图片等等非结构化的文件，通过NLP（自然语言处理）、目标识别、多模态识别等，按其语义结构化成知识图谱，这个知识图谱就是聊天机器人的大脑了。

图3：以医疗为例，人工智能将多来源的数据转化在问答、搜索、药物研发等场景的知识图谱中

知识图谱是由什么组成的呢？它是由点（实体）和边（关系）组成的，能够将人、事、物等相关信息进行整合，形成一个全面的图，如下图。

图4：由人物的点和属性边构成的图谱（子图）

当提问“OpenAI 的创始人是谁呀？”，聊天机器人的大脑就开始迅速地在自己的知识库里搜索、查找，先从用户的问句中，锁定目标点“penAI”，再根据用户的提问，连锁出另一个点——创始人“山姆·阿尔特曼”。

图5：从点“OpenAI”通过一条边连接到另一个点“山姆·阿尔特曼”

其实，当我们在提“OpenAI的创始人是谁"的时候，聊天机器人就会在自己的知识库中，把所有围绕该点的图都关联出来。所以，当我们问及相关问题的时候，它其实早已预判了我们的预判。比如当我们问：“马斯克是OpenAI的创始团队成员吗？”仅仅一个命令的发出，它已经将所有的成员都查询了（举千反一），见下图。

图6：由点“OpenAI”关联到其他人物

此外，在它的库里如果还收录过其他的“学习资料”，那么在其的“大脑”中还会关联着诸如“人工智能机器人的产品有哪些？”等相关的图，如下图。

图7：常见的AI机器人产品图谱

当然，聊天机器人和人一样，回答问题会受到自身知识储备的局限，如见下图：

我们知道，决定一个人大脑快不快、聪明不聪明的判断是什么呢？从人类的视角来看，最简单的一个标准就是是否具备举一反三的能力。

子曰：“不愤不启，不悱不发，举一隅不以三隅反，则不复也。”——论语·述而篇

早在两千年前，孔子就强调过善于举一反三、由此及彼、触类旁通的重要性。而对于聊天机器人来说，其答案的质量取决于构建知识图谱的算力。

我们知道，通用的知识图谱的建设在很长一段时间内都着重在 NLP和可视化呈现等方面，但忽略了计算时效性、数据建模灵活性、查询（计算）过程与结果可解释性等问题。尤其是在整个世界从大数据时代向深数据时代转型的当下，过去传统的基于SQL或 NoSQL构建的图谱的缺陷，已无法高效去处理海量、复杂、动态的数据的能力，更何谈进行关联、挖掘和分析的洞察力？

那么，传统知识图谱面临的挑战都有什么特性呢？

一是，低算力（低效）。采用SQL 或 NoSQL 数据库系统构建的知识图谱底层架构效率低下，无法高速地处理高维数据。

二是，灵活性差。基于关系型数据库、文档数据库或低性能图数据库构建的知识图谱通常受制于底层架构而无法高效地还原实体间的真实关系。诸如，它们有些只支持简单图，录入多边图数据时要么信息容易丢失，要么花高代价来构图。

三是，徒有其表。在2020 年之前，极少有人真正关注底层算力，几乎所有的知识图谱系统建设，都仅仅是围绕 NLP 和可视化这两部分。而没有底层算力支撑的知识图谱，只是在本体与三元组的抽取和构建，并不具备解决深度的查询、速度和可解释性等问题的能力。【注：在这里，我们不展开讲传统关系型数据库与图数据库之间的性能对比，感兴趣的读者可阅读：图数据库与关系型数据库的区别？和图数据库解决了什么问题？】行文至此，我们已经从聊天机器人的智能知识图谱话题，聊到了另一个前沿技术——图数据库（图计算）技术领域了。

图数据库【见参考资料1】是一种应用图理论，可以存储实体的属性信息和实体之间的关系信息，在定义方面，图（Graph）是以节点【见参考资料2】和边【见参考资料2】定义的数据结构。

图是知识图谱存储与应用服务的基础，拥有强大的数据关联及知识表达能力，因此倍受学术界和工业界的推崇。

图8：图数据库与知识图谱在市场营销、犯罪调查、金融监管、教育生态、公共卫生和能源等领域中的应用场景

如上图所示，我们看到，在实时图数据库（图计算）引擎的帮助下，产业界可以实时地在不同数据间找到深度关联的各种关系，甚至可以找到最优的、人脑都无法企及的智能途径——这就是源于图数据库的高维性。何为高维性？图不仅仅作为一种符合人类大脑思维习惯、能对现实世界进行直观建模的工具，同时能够建立起深刻的洞察（深图遍历）力。诸如大家都知道“蝴蝶效应”，就是在海量的数据和信息的中，去捕捉看似毫无关系的两个以上的实体之间的微妙关系，这从数据处理架构的角度来看，如果没有图数据库（图计算）技术的帮助是极难实现的。【注：对图数据库与图计算到底如何区分的话题，此处不展开，感兴趣的朋友可阅读：来自“图”的挑战是什么？如何区分图数据库与图计算？一文速解】

图9：过去40年来，数据处理技术的发展趋势是从关系型到大数据再到图数据

风控就是典型的场景之一。2008年的金融危机，其导火索仅仅是美国第四大投行雷曼兄弟倒闭了，但谁也没有料到，一家拥有158年历史的投行的倒闭，会引起国际银行业后续的一系列倒闭风潮……其影响之广、范围之大，让人始料未及；而实时图数据库（图计算）技术，就可以找到关于风险的所有关键的节点、风险因子，风险传播路径……进而对整个金融风险进行提前预警。

图10：雷曼兄弟（Lehman Brothers）破产传播路径以及风险客群图谱

【注：以上构图，均在Ultipa Manager上完成。愿意进一步学习和探索的朋友，可以阅读系列文章之一：走进 Ultipa Manager之高可视化】

需要指出的是，时下，尽管很多厂家都可以构造知识图谱，但现实是每 100 家图谱公司中，用（高性能）图数据库来做算力支撑的不足 5 家（低于 5%）。Ultipa嬴图数据库是目前全球唯一的第四代实时图数据库，通过高密度并发、动态剪枝、多级存储计算加速等创新性的专利技术实现了对任意量级数据集的超深度实时下钻。【感兴趣的朋友可扩展阅读：为什么选择 Ultipa？以及专家观察 | 高并发图数据库系统如何实现？】

一是，高算力。以查找企业最终受益人（又名实际控制人、大股东）为例。此类问题的挑战在于，现实世界中，最终受益人与被检查公司实体之间，经常相隔许多节点（空壳公司实体），又或者多个自然人或公司实体之间通过多条投资、参股路径对其它公司进行控制。传统的关系型数据库或文档数据库，甚至多数的图数据库，都无法实时解决这类图谱穿透问题。Ultipa嬴图实时图数据库系统解决了以上诸多挑战。其高并发数据结构和高性能计算与存储引擎，相较于其他图系统能以 100 倍甚至更快的速度进行深度挖掘，实时（微秒级以内）找到最终受益人或发现一个庞大的投资关系网络。另一方面，微秒级的时延意味着更高的并发性和系统吞吐量，相比于那些宣称毫秒级延迟的系统，这是 1000 倍的性能提升！以现实场景为例，原中信银行行长孙德顺利用开设多个“影子公司”的方式，借助金融手段来完成利益输送。

图11：孙德顺设计了结构极为复杂的重重“防火墙”，多层影子公司层层嵌套，以规避监管，获取利益

图12：关联：孙德顺——中信银行——企业老板——（空壳公司）投资平台公司——孙德顺

如上图所示，孙德顺利用中信银行的公权力为企业老板批贷款；与此对应，企业老板们或以投资名义或送上优质的投资项目、投资机会等等方式；双方通过各自成立的空壳公司完成直接交易；或者企业老板将巨资注入孙德顺实控的投资平台公司，然后平台公司再用这些资金投到老板提供的项目内，从而以钱生钱，大家共同获利分红，最终形成利益共同体。

Ultipa嬴图实时图数据库系统，通过白盒穿透的方式，挖掘出层层错综的人与人、人与企业、企业与企业之间的复杂关系，并实时锁定最终的幕后人。

二是，灵活性。图谱系统的灵活性可以是个非常广泛的话题，大体包含数据建模、查询与计算逻辑、结果呈现、接口支持、可扩展性等几个部分。

数据建模是所有关系图谱的基础，与图系统（图数据库）的底层能力息息相关。例如，基于ClickHouse 这种列数据库构建的图数据库系统，根本无法承载金融交易图谱，因为交易网络最典型的特征就是两个账户间存在多次转账，但 ClickHouse 倾向于将多次转账合并为一，这种不合理的做法会导致数据混淆（失真）。有些基于单边图理念构建的图数据库系统，则倾向于用顶点（实体）来表达交易，结果是数据量被放大（存储浪费），并且造成图谱查询的复杂度指数级增大（时效性变差）。

接口支持层面则与用户体验相关。举个简单的例子，如果一个生产环境下的图系统仅支持CSV格式，那么所有的数据格式都要先转换为CSV格式才能入图，效率显然太低，然而这在很多图谱系统中却是真实存在的。

查询与计算逻辑的灵活性又如何呢？我们仍以“蝴蝶效应”为例：图谱中任意两个人、事或物之间是否存在某种冥冥中的因果（强关联）效应？如果只是简单的 1 步关联，任何传统的搜索引擎、大数据 NoSQL 框架甚至关系型数据库都可以解决，但如果是深度的关联关系，例如牛顿和成吉思汗之间有什么关联关系，这又该如何计算呢？

Ultipa嬴图实时图数据系统，可以提供不止一种方法来解决以上问题。比如点到点的深度路径搜索、多点间的组网搜索、基于某种模糊搜索条件的模板匹配搜索，还有类似于Web搜索引擎的面向图谱的模糊文本路径搜索。

图13：某大图中实时组网的可视化结果（形成子图）搜索深度≥ 6跳

图谱上还有其它很多必须依赖高灵活性与算力才可以完成的工作，比如依据灵活的过滤条件寻找点、边、路径；模式识别，社区、客群发现；寻找节点的全部或特定邻居（或递归地发现更深的邻居）；找到图中具有相似属性的实体或关联关系……总之，没有图算力支撑的知识图谱就像是没有灵魂的躯壳，空有其表。无法完成种种具有挑战性、深度搜索能力的事务。

三是，低代码，所见即所得。图谱系统除了上面提到的高算力与灵活性以外，还需要有白盒化（可解释性）、表单化（低代码、无代码）以及以所见即所得的方式赋能业务的能力。

图14：零代码一键查找，仅需填入搜索范围的数值即可，且2D、3D 、列表、表格甚至是异构数据融合的多种可视模式灵活转化

在Ultipa嬴图实时图数据库系统中，开发人员只需敲1句 Ultipa GQL就可以完成操作，而业务人员则是使用预置的表单化插件通过零代码的方式就可以实现对业务的查询。这种方式，极大地助力员工提高了工作效率，同时赋能机构降低了运营成本，并打通了部门之间的沟通壁垒。

综上所述，知识图谱与图数据库的结合将会帮助各行各业加速实现数据中台的业务建设，但诸如金融行业这种需要专业性、安全性、稳定性、实时性、精准性的行业，采用关系型数据库来支撑上层应用并不能提供良好的数据处理性能，甚至无法完成数据处理任务，因此只有实现具有实时、全面、深度穿透、逐笔追溯、精准计量的监测和预警性能的图数据库（图计算）技术，才可能赋能组织更好地运筹帷幄且决胜千里！

行文至此，突然想起了热播的《三体》，其中提到了一个非常有意思的点——智子锁死。大概意思是说，三体文明为了防止地球科技超过它，就通过锁死人类基础科学的方式进行各种阻碍。因为人类文明的飞跃，取决于基础科学的发展和重大突破，锁死人类的基础科学就等于堵塞住了地球提升文明等级的道路……当然，笔者想告诉大家的是，图技术就属于人工智能的基础设施之一，准确的说是图技术=增强智能+可解释 AI，它是 AI 与大数据发展过程中融合的必然产物。

图15：图数据库（图计算）技术，属于人工智能基础设施

[1] 图数据https://www.ultipa.cn/document/ultipa-graph-query-language/basic-concepts/v4.0库;

[2] 什么是点; https://www.ultipa.cn/document/ultipa-graph-query-language/basic-concepts/v4.0

[3] 什么是边：https://www.ultipa.cn/document/ultipa-graph-query-language/basic-concepts/v4.0

{4]《图数据库原理、架构与应用》; 孙宇熙，嬴图团队；2022-8；机械工业出版社.

《图数据库原理、架构与应用》是国内第一本全面系统地详解有关图数据库、图计算技术的专著。全书围绕8大维度以帮助技术爱好者、从业者及高校师生快速实现对图数据库技术的入门、认知与实践指导。

·专家观察 | 高并发图数据库系统是如何实现的？

·图数据库知识点 | 图数据库与关系型数据库的区别

·专家观察 | 图计算引发银行流动性风险管理变

·文库 | 为什么选择 Ultipa？

·嬴图系列之一：走进 Ultipa Manager之高可视化

·CNBC专访 | Ultipa Graph,构建全球主流图数据库市场的底层系统

关于嬴图数据库（Ultipa Graph)

嬴图实时图数据库是第四代图数据库产品。通过一系列技术创新实现了对动态、海量数据的深下钻、科学计量、多维度归因分析。数据加载、更新、查询、分析、聚合、计算等维度，通过构建应用产品，深度赋能客户。相比与传统的关系型数据库或数仓、数湖产品，嬴图数据库在数据建模的灵活性、计算时效性、充分满足业务需求等多个维度。更多关于嬴图数据库的探索，请关注www.ultipa.cn

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
Goolge earth studio 进阶4——路径修改与平滑陟彼高冈yu Google earth studio 进阶教程旅游
如果我们希望在大约中途时获得更多的城市鸟瞰视角。可以将相机拖动到这里并创建一个新的关键帧。camera_target_clip_7EarthStudio会自动平滑我们的路径，所以当我们通过这个关键帧时，不是一个生硬的角度，而是一个平滑的曲线。camera_target_clip_8路径上有贝塞尔控制手柄，允许我们调整路径的形状。右键单击，我们可以选择“平滑路径”，这是默认的自动平滑算法，或者我们可
Google earth studio 简介陟彼高冈yu 旅游
GoogleEarthStudio是一个基于Web的动画工具，专为创作使用GoogleEarth数据的动画和视频而设计。它利用了GoogleEarth强大的三维地图和卫星影像数据库，使用户能够轻松地创建逼真的地球动画、航拍视频和动态地图可视化。网址为https://www.google.com/earth/studio/。GoogleEarthStudio是一个基于Web的动画工具，专为创作使用G
基于社交网络算法优化的二维最大熵图像分割智能算法研学社（Jack旭）智能优化算法应用图像分割算法 php 开发语言
智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码文章目录智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码1.前言2.二维最大熵阈值分割原理3.基于社交网络优化的多阈值分割4.算法结果：5.参考文献：6.Matlab代码摘要：本文介绍基于最大熵的图像分割，并且应用社交网络算法进行阈值寻优。1.前言阅读此文章前，请阅读《图像分割：直方图区域划分及信息统计介绍》htt
关于提高复杂业务逻辑代码可读性的思考编程经验分享开发经验 java 数据库开发语言
目录前言需求场景常规写法拆分方法领域对象总结前言实际工作中大部分时间都是在写业务逻辑，一般都是三层架构，表示层（Controller）接收客户端请求，并对入参做检验，业务逻辑层（Service）负责处理业务逻辑，一般开发都是在这一层中写具体的业务逻辑。数据访问层（Dao）是直接和数据库交互的，用于查数据给业务逻辑层，或者是将业务逻辑层处理后的数据写入数据库。简单的增删改查接口不用多说，基本上写好一
SQL Server_查询某一数据库中的所有表的内容 qq_42772833 SQL Server 数据库 sqlserver
1.查看所有表的表名要列出CrabFarmDB数据库中的所有表（名），可以使用以下SQL语句：USECrabFarmDB;--切换到目标数据库GOSELECTTABLE_NAMEFROMINFORMATION_SCHEMA.TABLESWHERETABLE_TYPE='BASETABLE';对这段SQL脚本的解释：SELECTTABLE_NAME：这个语句的作用是从查询结果中选择TABLE_NAM
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
121. 买卖股票的最佳时机薄荷糖的味道_fb40
给定一个数组，它的第i个元素是一支给定股票第i天的价格。如果你最多只允许完成一笔交易（即买入和卖出一支股票），设计一个算法来计算你所能获取的最大利润。注意你不能在买入股票前卖出股票。示例1:输入:[7,1,5,3,6,4]输出:5解释:在第2天（股票价格=1）的时候买入，在第5天（股票价格=6）的时候卖出，最大利润=6-1=5。注意利润不能是7-1=6,因为卖出价格需要大于买入价格。示例2:输入:
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
每日算法&面试题，大厂特训二十八天——第二十天（树）肥学 ⚡算法题⚡面试题每日精进 java 算法数据结构
目录标题导读算法特训二十八天面试题点击直接资料领取导读肥友们为了更好的去帮助新同学适应算法和面试题，最近我们开始进行专项突击一步一步来。上一期我们完成了动态规划二十一天现在我们进行下一项对各类算法进行二十八天的一个小总结。还在等什么快来一起肥学进行二十八天挑战吧！！特别介绍小白练手专栏，适合刚入手的新人欢迎订阅编程小白进阶python有趣练手项目里面包括了像《机器人尬聊》《恶搞程序》这样的有趣文章
MongoDB Oplog 窗口喝醉酒的小白 MongoDB 运维
在MongoDB中，oplog（操作日志）是一个特殊的日志系统，用于记录对数据库的所有写操作。oplog允许副本集成员（通常是从节点）应用主节点上已经执行的操作，从而保持数据的一致性。它是MongoDB副本集实现数据复制的基础。MongoDBOplog窗口oplog窗口是指在MongoDB副本集中，从节点可以用来同步数据的时间范围。这个窗口通常由以下因素决定：Oplog大小：oplog的大小是有限
回溯算法-重新安排行程 chirou_ 算法数据结构图论 c++图搜索
leetcode332.重新安排行程这题我还没自己ac过，只能现在凭着刚学完的热乎劲把我对题解的理解记下来。本题我认为对数据结构的考察比较多，用什么数据结构去存数据，去读取数据，都是很重要的。classSolution{private:unordered_map>targets;boolbacktracking(intticketNum,vector&result){//1.确定参数和返回值//2
python os 环境变量 CV矿工 python 开发语言 numpy
环境变量：环境变量是程序和操作系统之间的通信方式。有些字符不宜明文写进代码里，比如数据库密码，个人账户密码，如果写进自己本机的环境变量里，程序用的时候通过os.environ.get（）取出来就行了。os.environ是一个环境变量的字典。环境变量的相关操作importos"""设置/修改环境变量：os.environ[‘环境变量名称’]=‘环境变量值’#其中key和value均为string类
【PG】常见数据库、表属性设置江无羡数据库
PG的常见属性配置方法数据库复制、备份相关表的复制标识单表操作批量表操作链接数据库复制、备份相关表的复制标识单表操作通过ALTER语句单独更改一张表的复制标识。ALTERTABLE[tablename]REPLICAIDENTITYFULL;批量表操作通过代码块的方式，对某个schema中的所有表一起更新其复制标识。SELECTtablename,CASErelreplidentWHEN'd'TH
Faiss：高效相似性搜索与聚类的利器网络·魚大数据 faiss
Faiss是一个针对大规模向量集合的相似性搜索库，由FacebookAIResearch开发。它提供了一系列高效的算法和数据结构，用于加速向量之间的相似性搜索，特别是在大规模数据集上。本文将介绍Faiss的原理、核心功能以及如何在实际项目中使用它。Faiss原理：近似最近邻搜索：Faiss的核心功能之一是近似最近邻搜索，它能够高效地在大规模数据集中找到与给定查询向量最相似的向量。这种搜索是近似的，
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
insert into select 主键自增_mybatis拦截器实现主键自动生成 weixin_39521651 insert into select 主键自增 mybatis delete返回值 mybatis insert返回主键 mybatis insert返回对象 mybatis plus insert返回主键 mybatis plus 插入生成id
前言前阵子和朋友聊天，他说他们项目有个需求，要实现主键自动生成，不想每次新增的时候，都手动设置主键。于是我就问他，那你们数据库表设置主键自动递增不就得了。他的回答是他们项目目前的id都是采用雪花算法来生成，因此为了项目稳定性，不会切换id的生成方式。朋友问我有没有什么实现思路，他们公司的orm框架是mybatis，我就建议他说，不然让你老大把mybatis切换成mybatis-plus。mybat
k均值聚类算法考试例题_k均值算法(k均值聚类算法计算题) 寻找你83497 k均值聚类算法考试例题
?算法：第一步：选K个初始聚类中心，z1(1),z2(1)，…，zK(1)，其中括号内的序号为寻找聚类中心的迭代运算的次序号。聚类中心的向量值可任意设定，例如可选开始的K个.k均值聚类：---------一种硬聚类算法，隶属度只有两个取值0或1，提出的基本根据是“类内误差平方和最小化”准则；模糊的c均值聚类算法：--------一种模糊聚类算法，是.K均值聚类算法是先随机选取K个对象作为初始的聚类
关于Mysql 中 Row size too large (＞ 8126) 错误的解决和理解秋刀prince mysql mysql 数据库
提示：啰嗦一嘴，数据库的任何操作和验证前，一定要记得先备份！！！不会有错；文章目录问题发现一、问题导致的可能原因1、页大小2、行格式2.1compact格式2.2Redundant格式2.3Dynamic格式2.4Compressed格式3、BLOB和TEXT列二、解决办法1、修改页大小（不推荐）2、修改行格式3、修改数据类型为BLOB和TEXT列4、其他优化方式（可以参考使用）4.1合理设置数据
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
推荐算法_隐语义-梯度下降 _feivirus_ 算法机器学习和数学推荐算法机器学习隐语义
importnumpyasnp1.模型实现"""inputrate_matrix:M行N列的评分矩阵，值为P*Q.P:初始化用户特征矩阵M*K.Q:初始化物品特征矩阵K*N.latent_feature_cnt:隐特征的向量个数max_iteration:最大迭代次数alpha:步长lamda:正则化系数output分解之后的P和Q"""defLFM_grad_desc(rate_matrix,l
K近邻算法_分类鸢尾花数据集 _feivirus_ 算法机器学习和数学分类机器学习 K近邻
importnumpyasnpimportpandasaspdfromsklearn.datasetsimportload_irisfromsklearn.model_selectionimporttrain_test_splitfromsklearn.metricsimportaccuracy_score1.数据预处理iris=load_iris()df=pd.DataFrame(data=ir
数据结构 | 栈和队列 TT-Kun 数据结构与算法数据结构栈队列 C语言
文章目录栈和队列1.栈：后进先出（LIFO）的数据结构1.1概念与结构1.2栈的实现2.队列：先进先出（FIFO）的数据结构2.1概念与结构2.2队列的实现3.栈和队列算法题3.1有效的括号3.2用队列实现栈3.3用栈实现队列3.4设计循环队列结论栈和队列在计算机科学中，栈和队列是两种基本且重要的数据结构，它们在处理数据存储和访问顺序方面有着独特的规则和应用。本文将详细介绍栈和队列的概念、结构、实
[Python] 数据结构详解及代码 AIAdvocate 算法 python 数据结构链表
今日内容大纲介绍数据结构介绍列表链表1.数据结构和算法简介程序大白话翻译,程序=数据结构+算法数据结构指的是存储,组织数据的方式.算法指的是为了解决实际业务问题而思考思路和方法,就叫:算法.2.算法的5大特性介绍算法具有独立性算法是解决问题的思路和方式,最重要的是思维,而不是语言,其(算法)可以通过多种语言进行演绎.5大特性有输入,需要传入1或者多个参数有输出,需要返回1个或者多个结果有穷性,执行
Java爬虫框架（一）--架构设计狼图腾-狼之传说 java 框架 java 任务 html解析器存储电子商务
一、架构图那里搜网络爬虫框架主要针对电子商务网站进行数据爬取，分析，存储，索引。爬虫：爬虫负责爬取，解析，处理电子商务网站的网页的内容数据库：存储商品信息索引：商品的全文搜索索引Task队列：需要爬取的网页列表Visited表：已经爬取过的网页列表爬虫监控平台：web平台可以启动，停止爬虫，管理爬虫，task队列，visited表。二、爬虫1.流程1)Scheduler启动爬虫器，TaskMast
MongoDB知识概括 GeorgeLin98 持久层 mongodb
MongoDB知识概括MongoDB相关概念单机部署基本常用命令索引-IndexSpirngDataMongoDB集成副本集分片集群安全认证MongoDB相关概念业务应用场景：传统的关系型数据库（如MySQL），在数据操作的“三高”需求以及应对Web2.0的网站需求面前，显得力不从心。解释：“三高”需求：①Highperformance-对数据库高并发读写的需求。②HugeStorage-对海量数
Python算法L5：贪心算法小熊同学哦 Python算法算法 python 贪心算法
Python贪心算法简介目录Python贪心算法简介贪心算法的基本步骤贪心算法的适用场景经典贪心算法问题1.**零钱兑换问题**2.**区间调度问题**3.**背包问题**贪心算法的优缺点优点：缺点：结语贪心算法（GreedyAlgorithm）是一种在每一步选择中都采取当前最优或最优解的算法。它的核心思想是，在保证每一步局部最优的情况下，希望通过贪心选择达到全局最优解。虽然贪心算法并不总能得到全
Mongodb Error: queryTxt ETIMEOUT xxxx.wwwdz.mongodb.net 佛一脚 error react mongodb 数据库
背景每天都能遇到奇怪的问题，做个记录，以便有缘人能得到帮助！换了一台电脑开发nextjs程序。需要连接mongodb数据，对数据进行增删改查。上一台电脑好好的程序，新电脑死活连不上mongodb数据库。同一套代码，没任何修改，搞得我怀疑人生了，打开浏览器进入mongodb官网毫无问题，也能进入线上系统查看数据，网络应该是没问题。于是我尝试了一下手机热点，这次代码能正常跑起来，连接数据库了！！！是不
ztree设置禁用节点 3213213333332132 JavaScript ztree json setDisabledNode Ajax
ztree设置禁用节点的时候注意，当使用ajax后台请求数据,必须要设置为同步获取数据，否者会获取不到节点对象，导致设置禁用没有效果。 $(function(){ showTree(); setDisabledNode(); });
JVM patch by Taobao bookjovi java HotSpot
在网上无意中看到淘宝提交的hotspot patch，共四个，有意思，记录一下。 7050685：jsdbproc64.sh has a typo in the package name 7058036：FieldsAllocationStyle=2 does not work in 32-bit VM 7060619：C1 should respect inline and
将session存储到数据库中 dcj3sjt126com sql PHP session
CREATE TABLE sessions ( id CHAR(32) NOT NULL, data TEXT, last_accessed TIMESTAMP NOT NULL, PRIMARY KEY (id) ); <?php /** * Created by PhpStorm. * User: michaeldu * Date
Vector 171815164 vector
public Vector<CartProduct> delCart(Vector<CartProduct> cart, String id) { for (int i = 0; i < cart.size(); i++) { if (cart.get(i).getId().equals(id)) { cart.remove(i);
各连接池配置参数比较 g21121 连接池
排版真心费劲，大家凑合看下吧，见谅~ Druid DBCP C3P0 Proxool 数据库用户名称 Username Username User 数据库密码 Password Password Password 驱动名
[简单]mybatis insert语句添加动态字段 53873039oycg mybatis
mysql数据库,id自增,配置如下： <insert id="saveTestTb" useGeneratedKeys="true" keyProperty="id" parameterType=&
struts2拦截器配置云端月影 struts2拦截器
struts2拦截器interceptor的三种配置方法方法1. 普通配置法 <struts> <package name="struts2" extends="struts-default"> &
IE中页面不居中，火狐谷歌等正常 aijuans IE中页面不居中
问题是首页在火狐、谷歌、所有IE中正常显示，列表页的页面在火狐谷歌中正常，在IE6、7、8中都不中，觉得可能那个地方设置的让IE系列都不认识，仔细查看后发现，列表页中没写HTML模板部分没有添加DTD定义，就是<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3
String,int,Integer,char 几个类型常见转换 antonyup_2006 html sql .net
如何将字串 String 转换成整数 int? int i = Integer.valueOf(my_str).intValue(); int i=Integer.parseInt(str); 如何将字串 String 转换成Integer ? Integer integer=Integer.valueOf(str); 如何将整数 int 转换成字串 String ? 1.
PL/SQL的游标类型百合不是茶显示游标(静态游标)隐式游标游标的更新和删除 %rowtype ref游标(动态游标)
游标是oracle中的一个结果集,用于存放查询的结果; PL/SQL中游标的声明; 1,声明游标 2,打开游标(默认是关闭的); 3,提取数据 4,关闭游标注意的要点:游标必须声明在declare中,使用open打开游标,fetch取游标中的数据,close关闭游标隐式游标:主要是对DML数据的操作隐
JUnit4中@AfterClass @BeforeClass @after @before的区别对比 bijian1013 JUnit4 单元测试
一.基础知识 JUnit4使用Java5中的注解（annotation），以下是JUnit4常用的几个annotation： @Before：初始化方法对于每一个测试方法都要执行一次（注意与BeforeClass区别，后者是对于所有方法执行一次）@After：释放资源对于每一个测试方法都要执行一次（注意与AfterClass区别，后者是对于所有方法执行一次
精通Oracle10编程SQL(12)开发包 bijian1013 oracle 数据库 plsql
/* *开发包 *包用于逻辑组合相关的PL/SQL类型（例如TABLE类型和RECORD类型）、PL/SQL项（例如游标和游标变量）和PL/SQL子程序（例如过程和函数） */ --包用于逻辑组合相关的PL/SQL类型、项和子程序，它由包规范和包体两部分组成 --建立包规范：包规范实际是包与应用程序之间的接口，它用于定义包的公用组件，包括常量、变量、游标、过程和函数等 --在包规
【EhCache二】ehcache.xml配置详解 bit1129 ehcache.xml
在ehcache官网上找了多次，终于找到ehcache.xml配置元素和属性的含义说明文档了，这个文档包含在ehcache.xml的注释中！ ehcache.xml ： http://ehcache.org/ehcache.xml ehcache.xsd ： http://ehcache.org/ehcache.xsd ehcache配置文件的根元素是ehcahe ehcac
java.lang.ClassNotFoundException: org.springframework.web.context.ContextLoaderL 白糖_ java eclipse spring tomcat Web
今天学习spring+cxf的时候遇到一个问题：在web.xml中配置了spring的上下文监听器： <listener> <listener-class>org.springframework.web.context.ContextLoaderListener</listener-class> </listener> 随后启动
angular.element boyitech AngularJS AngularJS API angular.element
angular.element 描述: 包裹着一部分DOM element或者是HTML字符串，把它作为一个jQuery元素来处理。（类似于jQuery的选择器啦）如果jQuery被引入了，则angular.element就可以看作是jQuery选择器，选择的对象可以使用jQuery的函数；如果jQuery不可用，angular.e
java-给定两个已排序序列，找出共同的元素。 bylijinnan java
import java.util.ArrayList; import java.util.Arrays; import java.util.List; public class CommonItemInTwoSortedArray { /** * 题目：给定两个已排序序列，找出共同的元素。 * 1.定义两个指针分别指向序列的开始。 * 如果指向的两个元素
sftp 异常，有遇到的吗？求解 Chen.H java jcraft auth jsch jschexception
com.jcraft.jsch.JSchException: Auth cancel at com.jcraft.jsch.Session.connect(Session.java:460) at com.jcraft.jsch.Session.connect(Session.java:154) at cn.vivame.util.ftp.SftpServerAccess.connec
[生物智能与人工智能]神经元中的电化学结构代表什么? comsci 人工智能
我这里做一个大胆的猜想,生物神经网络中的神经元中包含着一些化学和类似电路的结构,这些结构通常用来扮演类似我们在拓扑分析系统中的节点嵌入方程一样,使得我们的神经网络产生智能判断的能力,而这些嵌入到节点中的方程同时也扮演着"经验"的角色.... 我们可以尝试一下...在某些神经
通过LAC和CID获取经纬度信息 dai_lm lac cid
方法1：用浏览器打开http://www.minigps.net/cellsearch.html，然后输入lac和cid信息(mcc和mnc可以填0)，如果数据正确就可以获得相应的经纬度方法2：发送HTTP请求到http://www.open-electronics.org/celltrack/cell.php?hex=0&lac=<lac>&cid=&
JAVA的困难分析 datamachine java
前段时间转了一篇SQL的文章（http://datamachine.iteye.com/blog/1971896），文章不复杂，但思想深刻，就顺便思考了一下java的不足，当砖头丢出来，希望引点和田玉。 -----------------------------------------------------------------------------------------
小学5年级英语单词背诵第二课 dcj3sjt126com english word
money 钱 paper 纸 speak 讲，说 tell 告诉 remember 记得，想起 knock 敲，击，打 question 问题 number 数字，号码 learn 学会，学习 street 街道 carry 搬运，携带 send 发送，邮寄，发射 must 必须 light 灯，光线，轻的 front
linux下面没有tree命令 dcj3sjt126com linux
centos p安装 yum -y install tree mac os安装 brew install tree 首先来看tree的用法 tree 中文解释：tree 功能说明：以树状图列出目录的内容。语　　法：tree [-aACdDfFgilnNpqstux][-I <范本样式>][-P <范本样式
Map迭代方式，Map迭代，Map循环蕃薯耀 Map循环 Map迭代 Map迭代方式
Map迭代方式，Map迭代，Map循环 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年
Spring Cache注解+Redis hanqunfeng spring
Spring3.1 Cache注解依赖jar包：  <dependency> <groupId>org.springframework.data</groupId> <artifactId>spring-data-redis</artifactId>
Guava中针对集合的 filter和过滤功能 jackyrong filter
在guava库中，自带了过滤器(filter)的功能，可以用来对collection 进行过滤，先看例子： @Test public void whenFilterWithIterables_thenFiltered() { List<String> names = Lists.newArrayList("John"
学习编程那点事 lampcy 编程 android PHP html5
一年前的夏天，我还在纠结要不要改行，要不要去学php？能学到真本事吗？改行能成功吗？太多的问题，我终于不顾一切，下定决心，辞去了工作，来到传说中的帝都。老师给的乘车方式还算有效，很顺利的就到了学校，赶巧了，正好学校搬到了新校区。先安顿了下来，过了个轻松的周末，第一次到帝都，逛逛吧！接下来的周一，是我噩梦的开始，学习内容对我这个零基础的人来说，除了勉强完成老师布置的作业外，我已经没有时间和精力去
架构师之流处理---------bytebuffer的mark,limit和flip nannan408 ByteBuffer
1.前言。如题，limit其实就是可以读取的字节长度的意思，flip是清空的意思，mark是标记的意思。 2.例子. 例子代码: String str = "helloWorld"; ByteBuffer buff = ByteBuffer.wrap(str.getBytes()); Sy
org.apache.el.parser.ParseException: Encountered " ":" ": "" at line 1, column 1 Everyday都不同 $转义 el表达式
最近在做Highcharts的过程中，在写js时，出现了以下异常：严重: Servlet.service() for servlet jsp threw exception org.apache.el.parser.ParseException: Encountered " ":" ": "" at line 1,
用Java实现发送邮件到163 tntxia java实现
/* 在java版经常看到有人问如何用javamail发送邮件？如何接收邮件？如何访问多个文件夹等。问题零散，而历史的回复早已经淹没在问题的海洋之中。本人之前所做过一个java项目，其中包含有WebMail功能，当初为用java实现而对javamail摸索了一段时间，总算有点收获。看到论坛中的经常有此方面的问题，因此把我的一些经验帖出来，希望对大家有些帮助。此篇仅介绍用
探索实体类存在的真正意义 java小叶檀 POJO
一. 实体类简述实体类其实就是俗称的POJO,这种类一般不实现特殊框架下的接口，在程序中仅作为数据容器用来持久化存储数据用的 POJO（Plain Old Java Objects）简单的Java对象它的一般格式就是 public class A{ private String id; public Str

图观 | ChatGTP是如何通过知识图谱回答问题的？

关于嬴图数据库（Ultipa Graph)

你可能感兴趣的:(知识图谱,人工智能,图论,算法,数据库)