白白的一团团

信贷风控三：如何搭建知识图谱，赋能信贷业务

- 一、如何构建知识图谱
- - 1、搭建知识图谱需要哪些数据
  - 2、如何设计知识图谱结构
  - - 2.1 隐性申请节点结构
    - 2.2 显性申请节点结构
    - 2.3 两种知识图谱结构的特点对比
- 二、知识图谱的优势
- - 1、提高聚集变量计算效率
  - 2、实现异常团簇的敏捷识别
  - 3、为关联关系的深度挖掘提供平台
- 三、知识图谱如何应用及常见问题
- - 1、图谱应用方式
  - 2、知识图谱回溯问题
  - 3、知识图谱防范团伙欺诈的及时性问题

脱胎于搜索引擎优化的知识图谱技术，本质上是一种揭示实体关系的信息网络，如今已广泛应用于各个领域。在信贷领域，知识图谱也经常被各家机构标榜为一种先进的大数据应用技术。在流量红利时代成为过去式后，信贷领域会越来越强调对客户的精细化运营，即对客户要做到千人千面的定制化服务和策略，这就要求信贷机构对客户要有360度全景式的把握，不仅要掌握客户的基本信息、行为偏好、金融特征，更要掌握客户间的关联关系和信贷申请行为的聚集性特征，而知识图谱在识别客户关系和聚集性特征方面就有着不可替代的优势。所以今天我们就简单聊一聊关于知识图谱的几个问题，一，如何构建一个契合信贷业务的知识图谱；二，知识图谱在信贷业务中的应用优势有哪些；三，如何应用这项技术去赋能信贷业务；以及四，知识图谱应用中需要注意的一些问题。

一、如何构建知识图谱

1、搭建知识图谱需要哪些数据

搭建知识图谱的目的之一在于完全挖掘出客户间各种错综复杂的关联关系，所以原则上就需要把各种有关联可能的数据都纳入进来。另一方面，我们同样需要把客户的身份标识数据、重要属性特征也纳入进来，便于后续我们对客户关系的分析、回溯及关联变量的加工。所以我们从关联数据、重要属性两个维度展开来讲。

关联数据主要包括这几个维度：

手机号码类：包括客户的注册手机号、用款手机号、紧急联系人手机号、配偶手机号、亲属手机号、公司电话、家庭电话、人行报告中近期曾使用电话，以及现在变得异常敏感的通讯录手机号、通话记录手机号等等。这些号码类数据放入知识图谱中便能将客户之间的亲属关系、同单位情况、平时联系紧密度情况反映出来。这些数据放入知识图谱前就要注意号码格式的对齐和脏数据的清洗。
银行卡数据：现在信贷业务都会进行n要素验证，一般银行卡都是本人使用，不会出现多人共用一张银行卡的情况，那为什么还要放银行卡数据呢？这要看怎么放，我们在以往的业务中发现了以这样一个团伙欺诈案例，团伙中的几人同时在同一银行各自新办了银行卡用于贷款发放，这就导致这几人申请时的银行卡号是连号的。如果我们将银行卡末几位去掉之后再放到知识图谱里，这种异常银行卡聚集特征就能显现在图谱中了。
设备类数据：主要包括注册申请设备和用款设备两类，当然也可以进一步细化到申请每个环节，包括注册首页设备、人脸识别设备、提交申请页设备等等。申请人共用设备是团伙欺诈的一种典型特征，所以是防范欺诈要关注的十分重要的一个维度。
单位类数据：包括申请时填写单位、配偶单位、公积金缴纳单位、人行报告中近期曾任职的单位等等，单位类数据虽然包含重要的关联信息，但综合考量也可以不放，主要是这样两个原因，一是内容多为手写，格式混乱，对齐难度很大；二是申请客户在单位上聚集很多不是异常，比如客户经理到一个大企业展业，一段时间搞定十几、几十个客户也很正常。
位置类数据：包括申请时的GPS打点位置、用款时的打点位置、单位地址位置、家庭地址位置等等。一般我们会将各种位置转化为同一坐标系下的经纬度，并使用geohash算法将经纬度转化为地理网格后在放入图谱，一般的网格大小为百米乘以百米量级，当然也要根据数据精度和业务需要来确定。
WIFI数据：包括申请、用款或各个环节埋点取到的WIFI信息，可以将WIFI的bssid做主键放入图谱。
IP数据：IP数据是否可用仍需调研，一是地址可以自由配置，二是用流量和用WIFI会发生IP变动也不能说明什么，三是之前调研过一些共IP的客户案例，发现并没有实际关联。所以IP可用与否有待考量。
其它还包括邮箱地址数据等。

重要属性数据主要包括：

身份信息及主键：包括身份证号、姓名、客户申请号、用款号等等。用于我们定位、查询每个客户。
时间信息：非常重要！！主要包括申请时间、用款时间。后期需要对图谱及关联变量进行回溯就是要依赖这些时间信息。
特征偏好信息：比如年龄、性别、职业、收入、爱好等各种画像标签等等。可用于刻画整个团簇的属性特征，比如一个团簇聚集的几个人都有午夜活跃、网络游戏的特征，那是不是值得我们特别关注一下呢。
逾期类信息：包括逾期天数、逾期笔数、当前是否逾期等等。是我们定性聚集团簇性质的重要维度。
申请状态及原因：包括通过、放弃、拒绝等状态以及拒绝原因，比如欺诈拒绝、多头拒绝、信用评分拒绝等等，也是刻画团簇性质的重要维度。
黑、灰名单信息：包括信用黑名单、营销黑名单、欺诈黑名单等等，维度包括手机号、身份证、设备，甚至WIFI、位置都可以。后期也可以根据知识图谱发现异常团簇去更新黑名单信息。

2、如何设计知识图谱结构

2.1 隐性申请节点结构

图谱三要素包括：节点、边和属性，所以设计知识图谱结构就是确定三个问题：哪些数据做节点、设计哪些关联边、哪些数据做属性放到哪些位置上。基本可以遵循这样一个原则：会产生关联关系的基本实体做节点，发生的动作作为关联边，补充信息做属性。比如张三用133445的手机号在3月12日提交了一笔申请，李四用188888的手机在3月15日进行了申请，填写的亲属手机号为133445。问题一，节点设置：这里张三、李四、申请手机号、亲属手机号都是基本实体，可以设计为节点；问题二，边设置：使用某某手机号申请，填写亲属手机号为某某是两个动作，可以设计为边，问题三，属性设置：申请时间是补充信息，可以作为属性，属性放到哪里呢，这里建议放到申请手机号的边上面，因为如果放到客户节点上，假如这个客户多次用不同手机号申请就容易产生混淆，由此我们就可以得到下图左边这样一个简单的图谱结构。依照这样的逻辑，代入所有数据，我们就能得到基本结构如下图右边所示的知识图谱。这种结构的图谱更强调的是客户——关联节点——客户这种关联关系的简洁呈现。对于客户的各种申请动作都通过增加边关系来表达，如果客户多次申请，就会如图中所示，使得每个节点对之间的关联边变得纷繁复杂，而且条关联边上面都应该带着时间属性，以对多次申请进行区分。

2.2 显性申请节点结构

想要不把节点对之间的关联边搞得这么复杂，而且期望将客户的申请动作表现得更清楚，我们还有第二种结构设计方案，即把客户的每次申请都用一个显性的节点表示出来，这种结构可以称为显性申请节点结构。按照这种结构将上面的知识图谱重构就得到了如下图所示的结构。这种结构下，节点对的边关系就简化了很多，像是申请时间、逾期状况等属性我们就都可以附加在申请节点上面，能更清晰地看到客户两次申请之间的差异。

2.3 两种知识图谱结构的特点对比

两种图谱结构各有优势，我们通过以下两个方面对比一下他们各自的特性：
一是契合不同的业务场景。有些信贷业务模式较为简单，没有循环额度，单次授信，单次用款，授信申请、用款申请不做明显区分。这样的业务场景就更适合于隐性申请结构的构建；而有些业务模式稍微复杂一些，设置循环额度，一次授信，后续可多次申请用款，这就导致客户的申请较为复杂，要区分授信申请和用款申请，如果再加之多渠道，多产品申请，客户的申请行为的复杂度就更甚，这个时候，用显性申请节点结构来构建知识图谱就能较为清楚地表现出客户的多次申请行为；其次，有了申请节点，就可以将很多属性只归纳到申请节点上，比如申请时间，从而将边上属性大大简化，最后，申请节点可以更具体地呈现每一次申请的不同属性状态，比如每次申请的逾期状态、用款笔数等等。
二是计算关联度数复杂程度不同。对于隐性申请节点结构，从一个客户关联到另一个客户最短只需要两度，即客户——关联节点——客户；而对于显性申请节点结构，从一个客户关联到另一个客户最少需要四度，即客户——申请——关联节点——申请——客户，这就导致在做图计算的时候两种结构有所差异。比如计算一个客户直接关联客户数、间接关联客户数，在隐性申请节点结构中只需要执行3度和5度的计算；而在显性申请节点结构中，则增加到4度和8度的计算，这也会直接导致计算资源和计算时间的差异。

最后，我们以显性申请节点结构为例，把一个较为完整的图谱架构总结如下：

最后，图谱放哪些数据，如何架构也要从更高的层面考虑。放眼整个数据产品体系，图谱也仅仅是其中的一环，所以很多业务信息有没有必要都放到图谱中值得商榷，图谱设计得大而全，就会一定程度上拖累其运算和使用速度。图谱的特点和优势在于聚集关系的发现和欺诈风险的防控，其它业务问题完全可以放到其它产品体系中去解决。最终的目的也是想要让图谱和整个数据体系中的其它产品形成良性互补，而非相互冗余。

二、知识图谱的优势

知识图谱可以被看做是一种数据存储方式，如果仅从数据存储的角度来看待它，那相较于传统的数据库，它并没有带来任何新的信息，只是将原有的信息换了一种更侧重关系的方式进行存储。正是基于这样的原因，我们在启动知识图谱项目的时候，往往会被质问，搭建知识图谱的必要性在哪里，业务中究竟遇到了什么样的困境，是传统数据库无法解决而一定要用到知识图谱的呢？我们就以一个实际的业务案例，对这个问题进行一个简单阐述。

上图展示的是我们在真实信贷业务中遇到的一个可疑团伙案例。18个客户之间通过用款设备、注册电话、公司电话、亲属电话、配偶电话等关系有着错综复杂的连接，形成一个关系紧密的小团体。18个客户之中有13个客户借款后发生了逾期，整个小团体的客户逾期率达到了72.2%。业务中，及时、全面地发现这样性质异常的团簇对于降低整个信贷业务欺诈率、保障资产质量都有着重要的意义。那仅使用传统数据库，能不能及时、有效地发现并阻拦这样的团簇呢？

1、提高聚集变量计算效率

首先，仅使用传统数据库，我们可以用一种更简化的方式来发现客户异常聚集行为，即开发聚集性变量，比如同设备不同申请客户数，同手机号不同申请客户数等等。对于这样关系确定且关联深度仅为一度的聚集性变量，使用传统数据库开发难度不大，很容易实现。但如果我们想要获得更深度的关联关系，那传统数据库实现起来就有些麻烦了，比如我们以上图中的O客户为例，想要获取从O的注册手机号出发，二度关联的逾期客户数，那使用传统数据库来计算，过程就如下图所示：

首先，从客户O出发，我们需要和全量申请信息表进行六次关联匹配运算，每次分别使用申请表中的注册手机号、亲属手机号、配偶手机号、紧急联系人手机号、公司电话、直系亲属电话和客户O的注册手机号进行匹配。在完成6次全量扫描匹配后，我们才能穷尽客户O申请手机号的共用关系，才能发掘出所有在手机号关系上和O有关联的客户（在此案例中即客户G），至此，我们完成了从客户O出发的一度关联关系的挖掘，第二步，二度关系挖掘，我们需要从客户G出发，遍历所有关联关系，找到与客户G一度关联的客户，为此，我们需要用客户G的注册电话和申请表的注册、亲属、配偶、紧急联系人…电话进行关联匹配，再用G的亲属手机号和申请表的注册、亲属、配偶、紧急联系人…电话进行关联匹配，以此类推，再用客户G的配偶手机号、紧急联系人手机号、公司…电话分别进行遍历，在完成36次遍历匹配后，客户G手机关系则就穷尽完了。但还没有结束，接下来，我们还需要对客户G的注册单位、公积金单位、配偶单位、各种地址、邮箱等关系进行遍历关联匹配，然后到埋点信息表中，对客户G的注册、登录、用款等设备，WIFI、IP、GPS等关系进行遍历匹配，当这些关系都遍历完成后，我们才完全穷尽了从客户G出发的一度关联关系，也就完成了从客户O注册手机号出发的二度关联关系，至此，我们也就找到了客户A、B、C、D、E、F，然后判断这些客户中有多少是逾期客户，也就实现了“通过注册手机号二度关联的逾期客户数”这样一个变量的运算。由此，我们也就可见一斑，在进行这样二度关联关系变量运算时，使用传统数据库是多么的冗长和繁复，对计算资源和时间是多么大的浪费。如果我们搭建了知识图谱这样一种基于关系的数据存储库，计算这样的二度关联变量就会非常简单省力，简单来说，计算时如图中所示，客户O伸展出来多少关联边，在运算中就只需要进行多少次基础运算，相对传统数据库来讲，效率可谓是革命性的提升。

2、实现异常团簇的敏捷识别

诚如刑侦破案一样，当我们锁定一个嫌疑人之后，我们希望通过这个嫌疑人及关联线索，能够把其背后的整个犯罪团伙全部揪出来。同样在信贷业务中，我们也希望能够看到每一个异常申请客户背后紧密关联的群体，及整个群体的特征性质。以此案为例，如果我们希望找到和客户I相关联的整个客户群，使用传统数据库要如何实现呢？

如图中所示，首先要从客户I出发，找到与之一度关联的所有客户，这就需要如前所述将整个申请表和埋点表用所有相关关系进行遍历，才能穷尽找到（此例中的H、J、K、L、E客户），然后再对每一个一度关联的客户，同样进行所有相关关系的遍历匹配，才能发现与客户I二度关联的所有申请客户（此例中的A、B、C、D、F、G），如此循环往复下去，直到所有客户都被找到。但在传统数据库中，如何确定这样的边界条件呢？即我们怎么知道要进行几次遍历匹配才能把和I相关的客户都找出来呢？这在传统数据库中是很难确定或很难实现的。而在知识图谱数据库中，基于关系找到紧密连接的团簇是很简单的事情，不仅运算量小，实现也极为方便，一些开源平台如neo4j直接提供了完整封装的图算法来实现，发现这样一个团簇，运算时间只有秒级。

3、为关联关系的深度挖掘提供平台

社区发现：有时，基于所有关联关系挖掘出的团簇对我们而言有些冗余，一些我们看来关系并不紧密的连接也被连带在里面。那除了业务上自定义紧密关系外，有没有一种技术手段，通过科学计算找到真正紧密连接的团簇呢？这种技术手段就是社区发现算法，比如louvain算法、label propagation算法等等，这些算法考虑边的权重，通过循环迭代能够找到真正紧密聚集的团簇。
中心度：业务中往往有通过中介进行团伙欺诈的案例，在一个维度全面的知识图谱中，中介在一个欺诈团伙中的核心关联位置就很容易凸显出现，那有没有一种算法能帮我们批量地，快速地找到所有管理核心节点，以便我们发现团伙中介呢？就可以使用中心度算法来实现，比如pagerank、article rank算法等等。
最短路径：业务中如果我们发现两个可疑客户，想要迅速定位出这两个可疑客户间有没有关联关系，如果有多种关联方式，那其中最紧密的关系，即两个节点间的最短关联路径是什么样的？这样的需求就可以使用最短路径算法来实现。
以上种种对客户关联关系的深度挖掘算法都需要首先基于知识图谱这样一个平台才能实现。而一旦有了这样一个知识图谱平台，这些算法都可以轻易实现，比如我们常用的开源平台neo4j就提供了整合这些图计算的算法包graph-data-science包，以上所有算法都高度封装，基本一句语句解决问题，这里放上算法包的开源网址供学习查阅：Neo4j Graph Data Science。

三、知识图谱如何应用及常见问题

1、图谱应用方式

知识图谱在信贷风控业务中的应用大体可以分为两种方式，如下图所示：

其中应用方式一对图谱的实时性要求不高，即便图谱按T+1时效更新，也不影响这种的应用方式，只是当天申请的团案客户没法防范。
应用方式二可以说是知识图谱的高阶用法，防范团案欺诈及时性高，但要求图谱要能做到实时更新和变量的实时计算和反馈。这就要求知识图谱、决策引擎、关系数据库三者之间能够实时互动，快速反馈，这对技术架构的能力要求还是不低的，很多机构对知识图谱的应用都难以达到这种程度。

2、知识图谱回溯问题

想要将图谱中计算出的团簇变量放入到贷前风控模型中进行实时决策，就要先训练一个带有图谱变量的风控模型，这就要求我们能够对图谱类变量进行回溯，即每个客户的图谱类变量应该是根据其申请时点的图谱状态计算出来的，而不是根据当前图谱状态去计算，我们举例来看：

比如3月15日，A客户和B客户通过手机号关联起来，形成一个小团簇，而D客户和E客户通过设备关联起来，形成另外一个团簇，两个团簇之间并没有任何关联。此时，如果我们要计算客户A在申请时刻所在团簇的客户数，我们只需要以客户A为起点，执行社区发现算法，找到所有与A关联的客户，再剔除这些关联客户中申请时间在A之后的客户即可，这时候很容易计算出A在申请时刻所在团簇的客户数为1（不含自身）。
但当到了3月16号，另外一个新申请客户C的出现将之前两个不相关的团簇联系起来了，让A、B、C、D、E客户聚集成了一个大团簇。此时，我们再想要回溯客户A在申请时刻所在团簇的客户数，那简单应用上述方法就有问题了：首先从A出发执行社区发现算法找打所有关联客户B、C、D、E，再剔除申请时间在A之后的客户C，得到变量值变为了3。明显这个方法得到的变量值3是错误的，因为在A申请时，他和客户D、E之间还没有联系。所以想要精准回溯客户A申请时刻的图谱状态及变量值，理论上需要从客户A出发，逐层扫描，扫描到申请时间在A之前客户，才继续向下一层扫描，扫描到申请时间在A之后的客户则需要切断该客户往外延伸的所有支路，依此方法穷尽找到所有关联节点，才能保证回溯的准确性，但这在技术实现上就要难一些。
另外一个难点是逾期状态的回溯，假如我们想要计算客户C申请时“所在团簇逾期30+人数占比”这样的变量，就需要对客户A、B、D、E在客户C申请前一天的逾期状态进行回滚，然后判断是否逾期30+。当然，如果我们有每个用款客户每日的逾期状态切片数据，那这个问题就可以解决，就是稍微麻烦些。

3、知识图谱防范团伙欺诈的及时性问题

虽然说知识图谱是防范团伙欺诈的一个利器，但也做不到将团伙欺诈消灭在摇篮里。比如假设我们分析找到一个非常有效的规则策略：团簇在5小时内成长到4人以上，则欺诈的概率超过50%，即便我们在风控中实时应用了这条策略，也不能将欺诈团伙中的前3个来申请的人防控下来，因为前3个客户来申请时还不足以触发这条策略。所以，知识图谱也具有普遍的局限性，需要和其它数字化风控产品相配合，形成一个完整、良性的风控闭环，才能尽量将风控反欺诈做到尽善尽美。

人工智能_大模型091_大模型工作流001_使用工作流的原因_处理复杂问题_多轮自我反思优化ReAct_COT思维链---人工智能工作笔记0236 添柴程序猿大模型开发&神经网络人工智能大模型工作流 COT思维链 ReAct自我反思优化大模型工作流开发
#清理环境信息，与上课内容无关importosos.environ["LANGCHAIN_PROJECT"]=""os.environ["LANGCHAIN_API_KEY"]=""os.environ["LANGCHAIN_ENDPOINT"]=""os.environ["LANGCHAIN_TRACING_V2"]=""#安装所需要使用的包!pipinstallopenailanggraphA
cv君独家视角 | AI内幕系列七：EfficientViT模型：基于多尺度线性注意力模块，实现高效的高分辨率密集预测 cv君 cv君独家视角 AI内幕系列原创项目级实战项目深度学习与计算机视觉精品 1024程序员节 EfficientViT 高分辨率密集预测任务高分辨率视觉模型 Transformer 人工智能计算机视觉
专题概况cv君独家视角|AI内幕系列是一个专注于人工智能领域的深度专题，旨在为读者揭开AI所有领域技术的神秘面纱，展示其背后的科学原理和实际应用。通过一系列精心策划的文章，我们将带您深入了解AI的各个领域，从计算机视觉到文本语音等多模态领域，从基础理论到前沿技术，从行业应用到未来趋势。无论您是AI领域的工程师或者专家，还是对这一领域充满好奇的读者，这个系列都将为您提供高价值的见解和启发，为您带来横
阿里巴巴发布 R1-Omni：首个基于 RLVR 的全模态大语言模型，用于情感识别新加坡内哥谈技术语言模型人工智能自然语言处理
每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同行！订阅：https://rengongzhineng.io/情感识别一直是AI领域的难题，尤其是视觉与音频信号的融合。单独依赖视觉或音频的模型，往往
认知科学：解决复杂问题的5个关键策略 AI天才研究院 AI大模型应用入门实战与进阶大数据人工智能语言模型 AI LLM Java Python 架构设计 Agent RPA
1.背景介绍认知科学是一门研究人类思维、认知和行为的科学。它涉及到大脑、神经科学、心理学、语言学、人工智能和计算机科学等多个领域。认知科学试图揭示人类如何理解和处理信息，以及如何进行决策和行动。在本文中，我们将探讨5个关键策略，这些策略可以帮助我们解决复杂问题。这些策略包括：模式识别规则抽取推理和逻辑推理知识表示和知识图谱多模态处理我们将在接下来的部分中详细讨论这些策略，并提供代码实例和数学模型公
人工智能：重塑未来生活与工作的科技力量 Geektec 问答专栏人工智能应用创新
方向一：介绍人工智能技术的发展历程和现状，指出它的应用领域和前景一、人工智能技术的发展历程人工智能（ArtificialIntelligence,AI）作为一门学科，其起源可以追溯到20世纪50年代。最初，AI的研究主要集中在逻辑推理、机器学习和自然语言处理等领域，目标是使机器能够模拟人类的智能行为。尽管在早期的探索中，AI遭遇了诸多挑战和瓶颈，但其发展潜力逐渐被认可，并在随后几十年中得到了迅速的
如何优化AI模型的Prompt：深度指南 Earth explosion 人工智能 prompt
随着人工智能（AI）技术的快速发展，AI模型在文本生成、翻译、问答等领域的应用越来越广泛。在使用这些模型时，**Prompt（提示）**的质量直接影响输出结果的好坏。优化Prompt不仅能提升生成文本的准确性，还能显著提高工作效率。作为一个希望提升AI应用效果的普通人，如何才能优化Prompt呢？本文将为你提供一份详细的指南，涵盖从基础知识到高级技巧的各个方面。一、什么是Prompt？1.1定义P
AI 行业发展趋势：科技创新引领未来变革我是阿萌畅聊AI 人工智能科技学习
在当今数字化时代，人工智能（AI）行业正以前所未有的速度蓬勃发展，深刻地改变着我们的生活、工作和社会格局。从基础技术的突破到广泛的应用场景拓展，AI展现出了一系列令人瞩目的发展趋势，预示着一个充满无限可能的未来。一、技术创新持续突破模型规模与性能提升AI模型正朝着更大规模、更复杂的方向发展。以GPT系列为代表的大语言模型，参数数量不断攀升，从GPT-2的15亿参数到GPT-4的万亿级参数，模型的语
前沿技术有哪些推动行业发展的新技术简介 jiemidashi 经验分享
现在有很多新东西正在改变的生活。比如人工智能。它能帮做很多事情。像写文章、画画还有处理数据。这些都很有用。再说说区块链。它让信息更安全。数据不容易被改掉。这对隐私很有帮助。还有5G网络。速度快得不得了。看视频玩游戏都特别顺畅。感觉和以前完全不一样。再就是新能源车。不用油了。用电就行。省钱又环保。开着还很安静。最后说说虚拟现实。戴上眼镜就能去别的世界。玩游戏或者学习都超级酷。这些东西都在慢慢走进的生
DeepSeek R1有什么不同新加坡内哥谈技术人工智能深度学习机器人科技
每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同行！订阅：https://rengongzhineng.io/深度思考实验室（DeepSeek）最近发布了全新的推理模型R1，声称该模型不仅性能超越目
基于RWA 与 AI-Agent 协同的企业数字化生态构建 leijiwen 人工智能
在当前数字经济高速发展的背景下，企业数字化转型已成为提升竞争力和创新能力的必由之路。以实体零售与文旅行业为代表的传统产业，正通过现实世界资产（RWA）数字化与人工智能代理（AI-Agent）的协同应用，构建全新的数字生态系统。正如“无数据不基础、无token不可信、无AI不产品、无产业不应用”这一理念所强调的，数字化生态的建立必须依托数据、信任机制、智能技术以及产业深度融合，才能实现真正的转型升级
Prompt工程：大模型沟通指南（人工智能到大模型） Harry技术 AI prompt 人工智能
文章目录人工智能到大模型机器学习深度学习大模型Prompt工程：大模型沟通的桥梁在人工智能的广袤领域中，大模型无疑是最为璀璨的明珠之一。它仿佛是一座连接人类与人工智能的桥梁，让我们能够更加深入地探索和利用人工智能的强大能力。而要实现与大模型的高效沟通，Prompt工程扮演着至关重要的角色。让我们一起走进Prompt工程的奇妙世界，探寻大模型沟通的奥秘。人工智能到大模型“人工智能是一种模拟人类智能的
科技创新：改变生活的力量与未来趋势 jiemidashi 科技生活人工智能经验分享
人工智能在智能客服中的应用越来越普遍。它改变了传统的客服模式。AI可以快速回答用户的问题，提高了客服效率和服务质量。首先，人工智能能够处理大量信息。智能客服可以在几秒钟内回应客户的请求。这比人工客服快得多。客户不需要等待很久就能得到答案。举个例子，某电商平台使用AI聊天机器人来处理用户咨询。这个机器人能够24小时工作，随时解决问题。这样，顾客体验得到了显著提升。其次，人工智能能提供个性化服务。通过
Cursor 终极使用指南：从零开始走向AI编程二川bro 智能AI 前端 AI编程
Cursor终极使用指南：从零开始走向AI编程问什么是cursor?mindmaproot(Cursor核心功能)智能编码代码生成自动补全错误修复项目管理多窗口布局版本控制终端集成个性设置主题定制快捷键配置插件扩展AI协作对话编程知识检索文档生成前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，可以分享一下给大家。点击跳转到网站。https://www.captainbed.cn/ccc
大语言模型（LLMs）全面学习指南（非常详细）零基础入门到精通，收藏这一篇就够了网络安全大白科技程序员人工智能语言模型人工智能自然语言处理
大语言模型（LLMs）作为人工智能（AI）领域的一项突破性发展，已经改变了自然语言处理（NLP）和机器学习（ML）应用的面貌。这些模型，包括OpenAI的GPT-4o和Google的gemini系列等，已经展现出了在理解和生成类人文本方面的令人印象深刻的能力，使它们成为各行各业的宝贵工具。如下这份指南将涵盖LLMs的基础知识、训练过程、用例和未来趋势……一.WhatareLargeLanguage
Gemma 3 发布：最强单 GPU/TPU 可运行模型，性能超 Llama-405B！新加坡内哥谈技术人工智能自然语言处理语言模型深度学习 copilot llama
每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同行！订阅：https://rengongzhineng.io/GoogleDeepMind再次掀起AI界的狂潮，正式推出Gemma3——一款轻量级但性
轻松掌握：Milvus向量数据库部署与RAG使用技巧威研威语人工智能数据库 milvus 数据库人工智能 RAG
Milvus简介Milvus是一款开源的向量数据库，由Zilliz开发并维护，适合用于机器学习和人工智能领域。是一款专为处理向量查询而设计的数据库，Milvus能够对万亿级向量进行索引。Milvus官网：https://milvus.io/Milvus中文文档：https://www.milvus-io.com/Milvus部署环境准备Linux操作系统Docker19.03或更高版本Docker
《深度剖析：鸿蒙系统下智能NPC与游戏剧情的深度融合》人工智能深度学习
在游戏开发领域，鸿蒙系统的崛起为开发者们带来了前所未有的机遇与挑战。尤其是在开发基于鸿蒙系统的人工智能游戏时，实现智能NPC的行为逻辑与游戏剧情紧密结合，成为了打造沉浸式游戏体验的关键。鸿蒙系统作为一款面向全场景的分布式操作系统，具有强大的多设备协同能力和出色的性能表现。这为人工智能游戏的开发提供了坚实的基础，使得游戏能够在不同设备上流畅运行，并且实现数据的无缝同步。而人工智能技术的融入，则为游戏
《解锁华为黑科技：MindSpore+鸿蒙深度集成奥秘》人工智能深度学习
在数字化浪潮汹涌澎湃的当下，人工智能与操作系统的融合已成为推动科技发展的核心驱动力。华为作为科技领域的先锋，其AI开发框架MindSpore与鸿蒙系统的深度集成备受瞩目，开启了智能生态的新篇章。华为MindSpore：AI框架的创新先锋MindSpore自2019年诞生以来，迅速在AI领域崭露头角。它以其独特的设计理念和先进的技术架构，为开发者提供了全场景的AI开发支持。从设计理念上看，MindS
Python API接口君王的羔羊 Python AI python
人工智能机器人EverydayWechat老李API图灵机器人：http://www.turingapi.com/（需求实名制认证，并每天免费数量只有100条）青云客智能聊天机器人：http://api.qingyunke.com/（无须申请，无数量限制，但有点智障，分手神器。分手神器，慎用）智能闲聊（腾讯）：https://ai.qq.com/product/nlpchat.shtml(申请使用
深度学习在医疗影像诊断中的应用与实现 Evaporator Core #DeepSeek快速入门人工智能 #深度学习深度学习人工智能
引言随着人工智能技术的快速发展，深度学习在医疗领域的应用日益广泛，尤其是在医疗影像诊断方面。医疗影像数据量大、复杂度高，传统的诊断方法往往依赖于医生的经验，容易受到主观因素的影响。而深度学习通过自动学习特征，能够从海量数据中提取出有用的信息，辅助医生进行更精准的诊断。本文将探讨深度学习在医疗影像诊断中的应用，并通过代码示例展示如何实现一个简单的医疗影像分类模型。深度学习在医疗影像诊断中的应用1.图
1985-2024年地级市人工智能专利数据经管数据库人工智能
《地级市人工智能专利数据（1985-2024）》于2025年1月完成最新更新。数据聚焦于中国各地级市，时间跨度设定为1985年至2024年。在数据整理过程中，参照《关键数字技术专利分类体系（2023）》，依据其中“人工智能”类技术的专利分类号，结合国家知识产权局所提供的信息，对各地每年的专利申请展开搜索与匹配。在此基础上，从众多专利申请中精准筛选出属于“人工智能”类别的专利，并进行数量统计，数据涵
金融风控可解释性算法安全优化实践智能计算研究中心其他
内容概要在金融风险控制领域，算法的可解释性与安全性已成为技术落地的核心挑战。本文从实际业务场景出发，系统性梳理可解释性算法与联邦学习、特征工程的协同框架，通过超参数优化与动态模型评估机制，构建透明化决策链路。在技术实现层面，重点解析支持向量机与随机森林的改进方案，结合数据清洗与标注的标准化流程，强化风险预测模型在准确率、F1值等关键指标的表现，同时兼顾合规性与安全边界的设计要求。提示：金融机构在部
python实现KNN算法的手写数字识别：深入解析与完整项目流程快撑死的鱼 Python算法精解算法
随着人工智能和机器学习的快速发展，图像识别技术在多个领域得到广泛应用。而手写数字识别作为图像识别的典型场景之一，已经成为研究者和开发者学习、应用机器学习算法的经典项目。本文将深入解析如何使用Python编程语言，结合KNN（K-最近邻）算法实现手写数字识别系统。文章不仅介绍了算法的核心原理，还从用户交互、图像处理、数据预处理等多个角度对整个项目进行了全方位的讲解。读者通过本文，可以全面掌握手写数字
《今日AI-人工智能-编程日报》小亦工作室人工智能
1.AI行业动态1.1Manus通用智能体初成型，开启AIAgent新时代中泰证券发布研报称，首款通用型AI智能体Manus已问世，能够将复杂任务拆解为可执行的步骤链，并在虚拟环境中灵活调用工具，标志着AI从“Reasoner”走向“Agent”阶段。Manus的成功引发了开源复现潮，DeepSeek模型已被整合到OWL项目中，并在GAIA基准测试中表现接近Manus。1.2DeepSeek-R2
1章5节：大模型术语解读与从生成到推理的演进 DAT｜R科学与人工智能人工智能
在人工智能的浩瀚宇宙中，大模型正以前所未有的速度演进，推动着科技变革的新浪潮。从多模态到通用模型，再到行业模型，人工智能的边界不断拓展，为各行各业带来了全新的机遇与挑战。本篇文章将深入剖析大模型相关的核心术语，探讨其内涵、应用及发展趋势，并回顾大模型从生成到推理的演进历程，解析全球科技巨头与国内前沿企业在这一领域的竞争与创新。让我们一同探索大模型的演进脉络，把握智能时代的发展脉搏。一、剖析大模型相
Microsoft Fabric 功能更新！更多智能优化，数据平台更强大
近期，微软MicrosoftFabric又更新了，大大增强了AI方面的功能。迅易科技作为微软13年来紧密的生态合作伙伴，为300+行业头部客户实施1000+项目。今天，我们带大家来看下，MicrosoftFabric有什么新玩法？一年前，微软正式推出了一款端到端数据平台，MicrosoftFabric（国际版）是一个集成一体化的平台，提供支持各种数据项目的人工智能驱动服务，帮助所有数据团队能够更快
数据分析及人工智能框架汇总 xihuanyuye 机器学习
一、数据分析二、人工智能1、Tensorflow1、简介TensorFlow是谷歌基于DistBelief进行研发的第二代人工智能学习系统，其命名来源于本身的运行原理。Tensor（张量）意味着N维数组，Flow（流）意味着基于数据流图的计算，TensorFlow为张量从流图的一端流动到另一端计算过程。TensorFlow是将复杂的数据结构传输至人工智能神经网中进行分析和处理过程的系统。Tenso
嵌入式人工智能应用- 第七章人脸识别数贾电子科技嵌入式人工智能应用人工智能
嵌入式人工智能应用`文章目录嵌入式人工智能应用1人脸识别1.1dlib介绍1.2dlib特点1.3dlib的安装与编译2人脸识别原理2.1ResNet3代码部署3.1安装[CUDAToolkit12.8](https://developer.nvidia.com/cuda-downloads?target_os=Linux&target_arch=x86_64&Distribution=Ubunt
2025 年最值得收听的 AI 播客推荐！助你轻松掌握人工智能前沿动态！真智AI 人工智能开发语言机器学习
如今，几乎每个人都被告知需要提升技能，而当前许多组织最看重的技能之一就是人工智能（AI）。学习AI相关技能通常涉及数学、统计学和机器学习，但除此之外，你还需要了解行业趋势、业内人士的观点以及各大公司的动态。然而，学习并不意味着时刻都要埋头苦读！有时候，你需要给大脑一个喘息的机会，同时依然能获取有价值的信息。而收听AI相关的播客，就是一个轻松高效的方式。以下是2025年你必须关注的AI播客！1.Th
人工智能概念 zhangpeng455547940 计算机人工智能
机器学习、深度学习、大模型机器学习提供框架，使得系统可以从数据中学习算法：线性回归、逻辑回归、支持向量机、决策树、随机森林、K近邻算法深度学习是实现这一目标的工具，模仿人脑，使用多层神经网络进行学习算法：多层感知器、卷积神经网络、循环神经网络、长短期记忆网络大模型指参数量巨大的深度学习模型人工智能应用：自然语言处理、图像识别与生成、语音识别、政务与企业服务...
用MiddleGenIDE工具生成hibernate的POJO（根据数据表生成POJO类） AdyZhang POJO eclipse Hibernate MiddleGenIDE
推荐:MiddlegenIDE插件, 是一个Eclipse 插件. 用它可以直接连接到数据库, 根据表按照一定的HIBERNATE规则作出BEAN和对应的XML ，用完后你可以手动删除它加载的JAR包和XML文件! 今天开始试着使用
.9.png Cb123456 android
“点九”是andriod平台的应用软件开发里的一种特殊的图片形式，文件扩展名为：.9.png 　　智能手机中有自动横屏的功能,同一幅界面会在随着手机(或平板电脑)中的方向传感器的参数不同而改变显示的方向,在界面改变方向后,界面上的图形会因为长宽的变化而产生拉伸,造成图形的失真变形。　　我们都知道android平台有多种不同的分辨率，很多控件的切图文件在被放大拉伸后，边
算法的效率天子之骄算法效率复杂度最坏情况运行时间大O阶平均情况运行时间
算法的效率效率是速度和空间消耗的度量。集中考虑程序的速度，也称运行时间或执行时间，用复杂度的阶(O)这一标准来衡量。空间的消耗或需求也可以用大O表示，而且它总是小于或等于时间需求。以下是我的学习笔记： 1.求值与霍纳法则，即为秦九韶公式。 2.测定运行时间的最可靠方法是计数对运行时间有贡献的基本操作的执行次数。运行时间与这个计数成正比。
java数据结构何必如此 java 数据结构
Java 数据结构 Java工具包提供了强大的数据结构。在Java中的数据结构主要包括以下几种接口和类：枚举（Enumeration）位集合（BitSet）向量（Vector）栈（Stack）字典（Dictionary）哈希表（Hashtable）属性（Properties）以上这些类是传统遗留的，在Java2中引入了一种新的框架-集合框架(Collect
MybatisHelloWorld 3213213333332132
//测试入口TestMyBatis package com.base.helloworld.test; import java.io.IOException; import org.apache.ibatis.io.Resources; import org.apache.ibatis.session.SqlSession; import org.apache.ibat
Java|urlrewrite|URL重写|多个参数 7454103 java xml Web 工作
个人工作经验！如有不当之处，敬请指点 1.0 web -info 目录下建立 urlrewrite.xml 文件类似如下： <?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE u
达梦数据库+ibatis darkranger sql mysql ibatis SQL Server
--插入数据方面如果您需要数据库自增... 那么在插入的时候不需要指定自增列. 如果想自己指定ID列的值, 那么要设置 set identity_insert 数据库名.模式名.表名; ----然后插入数据; example: create table zhabei.test( id bigint identity(1,1) primary key, nam
XML 解析四种方式 aijuans android
XML现在已经成为一种通用的数据交换格式,平台的无关性使得很多场合都需要用到XML。本文将详细介绍用Java解析XML的四种方法。 XML现在已经成为一种通用的数据交换格式,它的平台无关性,语言无关性,系统无关性,给数据集成与交互带来了极大的方便。对于XML本身的语法知识与技术细节,需要阅读相关的技术文献,这里面包括的内容有DOM(Document Object
spring中配置文件占位符的使用 avords
1.类 <?xml version="1.0" encoding="UTF-8"?><!DOCTYPE beans PUBLIC "-//SPRING//DTD BEAN//EN" "http://www.springframework.o
前端工程化-公共模块的依赖和常用的工作流 bee1314 webpack
题记：一个人的项目，还有工程化的问题嘛？我们在推进模块化和组件化的过程中，肯定会不断的沉淀出我们项目的模块和组件。对于这些沉淀出的模块和组件怎么管理？另外怎么依赖也是个问题？你真的想这样嘛？ var BreadCrumb = require(‘../../../../uikit/breadcrumb’); //真心ugly。
上司说「看你每天准时下班就知道你工作量不饱和」，该如何回应？ bijian1013 项目管理沟通 IT职业规划
问题：上司说「看你每天准时下班就知道你工作量不饱和」，如何回应正常下班时间6点，只要是6点半前下班的，上司都认为没有加班。 Eno-Bea回答，注重感受，不一定是别人的虽然我不知道你具体从事什么工作与职业，但是我大概猜测，你是从事一项不太容易出现阶段性成果的工作
TortoiseSVN，过滤文件征客丶 SVN
环境： TortoiseSVN 1.8 配置：在文件夹空白处右键选择 TortoiseSVN -> Settings 在 Global ignote pattern 中添加要过滤的文件：多类型用英文空格分开 *name ：过滤所有名称为 name 的文件或文件夹 *.name ：过滤所有后缀为 name 的文件或文件夹 --------
【Flume二】HDFS sink细说 bit1129 Flume
1. Flume配置 a1.sources=r1 a1.channels=c1 a1.sinks=k1 ###Flume负责启动44444端口 a1.sources.r1.type=avro a1.sources.r1.bind=0.0.0.0 a1.sources.r1.port=44444 a1.sources.r1.chan
The Eight Myths of Erlang Performance bookjovi erlang
erlang有一篇guide很有意思： http://www.erlang.org/doc/efficiency_guide 里面有个The Eight Myths of Erlang Performance： http://www.erlang.org/doc/efficiency_guide/myths.html Myth: Funs are sl
java多线程网络传输文件(非同步)-2008-08-17 ljy325 java 多线程 socket
利用 Socket 套接字进行面向连接通信的编程。客户端读取本地文件并发送；服务器接收文件并保存到本地文件系统中。使用说明:请将TransferClient, TransferServer, TempFile三个类编译，他们的类包是FileServer. 客户端: 修改TransferClient: serPort, serIP, filePath, blockNum,的值来符合您机器的系
读《研磨设计模式》-代码笔记-模板方法模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.sql.Connection; import java.sql.DriverManager; import java.sql.PreparedStatement; import java.sql.ResultSet;
配置心得 chenyu19891124 配置
时间就这样不知不觉的走过了一个春夏秋冬，转眼间来公司已经一年了，感觉时间过的很快，时间老人总是这样不停走，从来没停歇过。作为一名新手的配置管理员，刚开始真的是对配置管理是一点不懂，就只听说咱们公司配置主要是负责升级，而具体该怎么做却一点都不了解。经过老员工的一点点讲解，慢慢的对配置有了初步了解，对自己所在的岗位也慢慢的了解。做了一年的配置管理给自总结下： 1.改变从一个以前对配置毫无
对“带条件选择的并行汇聚路由问题”的再思考 comsci 算法工作软件测试嵌入式领域模型
2008年上半年，我在设计并开发基于”JWFD流程系统“的商业化改进型引擎的时候，由于采用了新的嵌入式公式模块而导致出现“带条件选择的并行汇聚路由问题”(请参考2009-02-27博文)，当时对这个问题的解决办法是采用基于拓扑结构的处理思想，对汇聚点的实际前驱分支节点通过算法预测出来，然后进行处理，简单的说就是找到造成这个汇聚模型的分支起点，对这个起始分支节点实际走的路径数进行计算，然后把这个实际
Oracle 10g 的clusterware 32位下载地址 daizj oracle
Oracle 10g 的clusterware 32位下载地址 http://pan.baidu.com/share/link?shareid=531580&uk=421021908 http://pan.baidu.com/share/link?shareid=137223&uk=321552738 http://pan.baidu.com/share/l
非常好的介绍：Linux定时执行工具cron dongwei_6688 linux
Linux经过十多年的发展，很多用户都很了解Linux了，这里介绍一下Linux下cron的理解，和大家讨论讨论。cron是一个Linux 定时执行工具，可以在无需人工干预的情况下运行作业，本文档不讲cron实现原理，主要讲一下Linux定时执行工具cron的具体使用及简单介绍。新增调度任务推荐使用crontab -e命令添加自定义的任务（编辑的是/var/spool/cron下对应用户的cr
Yii assets目录生成及修改 dcj3sjt126com yii
assets的作用是方便模块化，插件化的，一般来说出于安全原因不允许通过url访问protected下面的文件，但是我们又希望将module单独出来，所以需要使用发布，即将一个目录下的文件复制一份到assets下面方便通过url访问。 assets设置对应的方法位置 \framework\web\CAssetManager.php assets配置方法在m
mac工作软件推荐 dcj3sjt126com mac
mac上的Terminal + bash ＋ screen组合现在已经非常好用了，但是还是经不起iterm＋zsh＋tmux的冲击。在同事的强烈推荐下，趁着升级mac系统的机会，顺便也切换到iterm＋zsh＋tmux的环境下了。我为什么要要iterm2 切换过来也是脑袋一热的冲动，我也调查过一些资料，看了下iterm的一些优点： * 兼容性好，远程服务器 vi 什么的低版本能很好兼
Memcached(三)、封装Memcached和Ehcache frank1234 memcached ehcache spring ioc
本文对Ehcache和Memcached进行了简单的封装，这样对于客户端程序无需了解ehcache和memcached的差异，仅需要配置缓存的Provider类就可以在二者之间进行切换，Provider实现类通过Spring IoC注入。 cache.xml <?xml version="1.0" encoding="UTF-8"?>
Remove Duplicates from Sorted List II hcx2013 remove
Given a sorted linked list, delete all nodes that have duplicate numbers, leaving only distinct numbers from the original list. For example,Given 1->2->3->3->4->4->5,
Spring4新特性——注解、脚本、任务、MVC等其他特性改进 jinnianshilongnian spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
MySQL安装文档 liyong0802 mysql
工作中用到的MySQL可能安装在两种操作系统中，即Windows系统和Linux系统。以Linux系统中情况居多。安装在Windows系统时与其它Windows应用程序相同按照安装向导一直下一步就即，这里就不具体介绍，本文档只介绍Linux系统下MySQL的安装步骤。 Linux系统下安装MySQL分为三种：RPM包安装、二进制包安装和源码包安装。二
使用VS2010构建HotSpot工程 p2p2500 HotSpot OpenJDK VS2010
1. 下载OpenJDK7的源码： http://download.java.net/openjdk/jdk7 http://download.java.net/openjdk/ 2. 环境配置 ▶
Oracle实用功能之分组后列合并 seandeng888 oracle 分组实用功能合并
1 实例解析由于业务需求需要对表中的数据进行分组后进行合并的处理，鉴于Oracle10g没有现成的函数实现该功能，且该功能如若用JAVA代码实现会比较复杂，因此，特将SQL语言的实现方式分享出来，希望对大家有所帮助。如下：表test 数据如下： ID,SUBJECTCODE,DIMCODE,VALUE 1&nbs
Java定时任务注解方式实现 tuoni java spring jvm xml jni
Spring 注解的定时任务，有如下两种方式：第一种： <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http
11大Java开源中文分词器的使用方法和分词效果对比 yangshangchuan word分词器 ansj分词器 Stanford分词器 FudanNLP分词器 HanLP分词器
本文的目标有两个： 1、学会使用11大Java开源中文分词器 2、对比分析11大Java开源中文分词器的分词效果本文给出了11大Java开源中文分词的使用方法以及分词结果对比代码，至于效果哪个好，那要用的人结合自己的应用场景自己来判断。 11大Java开源中文分词器，不同的分词器有不同的用法，定义的接口也不一样，我们先定义一个统一的接口： /** * 获取文本的所有分词结果, 对比

信贷风控三：如何搭建知识图谱，赋能信贷业务