数据分析v

概述：机器学习和大数据技术在信贷风控场景中的应用

本文约5400字，建议阅读10分钟；内容来源：知乎；

本文简要概述在当前大数据和机器学习技术如何在信贷风控场景下的常见应用。

似乎一夜之间，所有的互联网公司在对外的宣传稿中都会提及自己使用机器学习和大数据技术，一时间成为了近几年来最炙手可热的名词，不谈机器学习、大数据似乎都不好意思说自己是做高新技术的了。

百度搜索指数：机器学习

百度搜索指数：大数据

上图来自最近7年来这两个词的百度搜索指数，可以看到从2013年开始一直在稳步攀升，在2017年的时候迎来了爆发式的增长，这些都与我们的感知类同。

机器学习与人脑思维的区别

机器学习和大数据应用是相辅相成的，目的是想用机器去模拟人类的思考过程，人类通过自身经历经过思考可以形成经验，并用来解决新的问题，而机器学习是需要利用大量的历史数据去训练一个模型去解决一个特定的问题：比如识别两张脸是否一致、该用户是不是精准客户等。

虽然这两个词这两年才火起来，但是这些概念早在半个多世纪前就有理论的提出，尤其机器学习的算法已经在几十年前就非常成熟了，但是受制于计算效率、存储等硬件的限制，大数据和机器学习在实际业务上的应用场景十分受限，很难有大规模的场景应用。最近十年来随着存储、芯片等层面的突破让大数据和机器学习的计算应用成本大大降低，这也支撑了基于这两项技术的应用场景呈现爆发式增长。

除了机器学习之外，我们也发现互联网信贷成为了这几年最火的行业方向，互联网信贷的工作重心在风控。于是天作佳成，正如目前我们看到的，信贷风控成为当前机器学习和大数据技术最适合也是最成熟的应用场景之一：

1.金融业务自身需要大量的数据且也会产生更多的数据，这天然的让信贷风控成为最适合大数据和机器学习的场景；

2.风控涉及的数据量大、数据面广、关联复杂，也急需利用大数据和机器学习技术解决风控过程中效率低、缺乏公平准则、风险难以量化的问题；

所以正是因为这样的相互依赖，信贷风控成为当前大数据和机器学习技术应用最成熟的领域之一。

信贷风控中的主要问题

信贷风控最关键的目标就是从全量申请用户样本中找到会逾期的客户，所以风控的核心目的是评估用户的还款意愿和还款能力。从过去的业务实践经验来看，风控当中需要重点关注的问题包括：

非本人申请：申请人利用虚假身份申请信贷，这一问题在信贷业务高速增长的蛮荒阶段，银行或者互金机构缺乏对黑产全面的认知，在部分业务环节被黑产用虚假/残缺或者非本人身份证欺诈，包括一些知名的持牌消金机构也遇到过大量类似的欺诈案例。

伪造资料：申请人为了更容易获得贷款或者贷后恶意逾期避免催收，伪造收入证明、联系人、工作地址等资料。

中介团伙：中介在网络上大量招徕需要信贷申请的用户，使用不同的攻略“教”客户如何有机会以较高概率通过银行/信贷机构的审核。

历史信用记录：用户历史如果存在大量失信行为，或者存在赌/毒等不良社会行为，那么其逾期失联的概率也很高。

还款能力不足：申请人负债收入比较高，外部有大量债务且自身收入不稳定，这些都有可能导致用户愿意还款但是却没有能力还款。

基于大数据和机器学习技术的风控解决方案

为了解决上述的这些问题，目前业内已经形成了一套基于大数据和机器学习技术的较为完整的解决方案。

非本人申请：人脸识别技术

目前人脸识别技术已经应用在生活中的方方面面，如刷脸支付、高铁进站甚至公安的天网系统；而在金融业务中，信用卡办理、网贷申请也都普遍使用人脸识别：将申请人照片与在公安系统中身份证存照进行比对，判断两张照片的相似度，可有效避免非本人申请的问题。

与人类识别面部类似，当我们人类对一个人比较熟悉的时候，我们很容易根据他的面部特征与我们在脑海里过去存储的特征进行比对，就能判断这个人是否是这个人（虽然也会有误判的时候），同样的，人脸识别技术的背后也是一套深度学习的算法，把我们思考的过程转化为模型算法，目前市面上有多家提供人脸识别服务的商业化应用公司，不过其算法的本质基本是类同的，人脸识别的核心思想在于：不同人脸由不同特征组成。

理解这个思想，首先需要引入的的是“特征”的概念。先看下面这个例子：

最简单的人脸特征

假设这 5 个特征足够形容一张人脸，那每张人脸都可表示为这 5 个特征的组合：

（特征1，特征2，特征3，特征4，特征5）

一位双眼皮，挺鼻梁，蓝眼睛，白皮肤，瓜子脸的小姐姐即可用特征表示为（见表格加粗项）：（1,1,0,1,0）

那么遍历上面这张特征表格一共可以代表32张不同的脸。32 张脸可远远不够覆盖70 多亿的人口。为了让不同特征组成的人脸能覆盖足够多人脸，我们需要扩充上面那张特征表。扩张特征表可以从行、列两个角度展开。

列的角度很简单，只需要增加特征数量：（特征6.脸型,特征7.两眼之间距离，特征8.嘴唇厚薄…）实际应用中通常应用 128,256,512 或者 1024 个不同特征。从行的角度扩充也很好理解，比如“特征3”，除了值 0 代表蓝色，值 1 代表灰色，是不是可以增加一个值 2 代表黑色，值 3 代表没有头发呢？此外，除了这些离散的整数，我们也可以取连续的小数，比如特征 3 的值 0.1，代表“蓝中略微带黑”，值 0.9 代表“灰中带蓝”……

百度开源平台：面部特征识别

经过这样的扩充，特征空间便会变得无限大。扩充后特征空间里的一张脸可能表示为：

一张脸提取出128维特征变量

用于表示人脸的大量特征从哪来？这便是深度学习（深度神经网络）发挥作用的地方。它通过在千万甚至亿级别的人脸数据库上学习训练后，会自动总结出最适合于计算机理解和区分的人脸特征。

阐明了不同人脸由不同特征组成后，我们便有了足够的知识来分析人脸，算法工程师通常需要一定的可视化手段才能知道机器到底学习到了哪些利于区分不同人的特征：同一人的不同照片提取出的特征，在特征空间里距离很近，不同人在特征空间里相距较远。

三张不同角度的撒贝宁照片经过神经网络提取出 128 维的特征后，变成了 3 个在 128 维空间中的点（红色），刘德华的特征点为绿色。

不过在实际应用中在光照较差、遮挡、形变（大笑）、侧脸等诸多条件下，神经网络很难提取出与“标准脸”相似的特征。另外，在金融风控领域还需要解决伪造人脸的情况，面对这些问题，通常采取四种应对措施：

1. 工程角度：研发质量模型，对检测到人脸质量进行评价，质量较差则不识别/检验。

2. 应用角度：施加场景限制，比如刷脸解锁、人脸闸机、会场签到时，都要求用户在良好的光照条件下正对摄像头，以避免采集到质量差的图片。

3. 算法角度：提升人脸识别模型性能，在训练数据里添加更多复杂场景和质量的照片，以增强模型的抗干扰能力。

4.精准活体识别：通过3D建模软件可以使用用户已有的照片模拟一张真实的头像，以此来骗过人脸识别算法，所以如何验证这个头像是来自一个真实的人同样也是一个机器学习的过程。

鲲鱼科技-灵犀联合实验室“模拟人脸攻击”示例

1.基于知识图谱技术的复杂网络

在影视节目当中，我们经常看到警察办案时会把嫌疑人、证人、受害人及他们之间的关联关系等信息画在墙上，用以分析案情，这就是典型的关系图谱应用。墙上的画便是图，图中有用的信息便是知识，将其进一步扩展到其他事物；人为实体，在图中我们称之为点，人之间代表着关联关系的连线，在图中我们称之为边，就这样点与边共同组成了我们的关系图谱。

构建关系图谱的底层还是大数据的技术：基于庞大的用户数据，从不同的数据源抽取出来存入到图数据库里，所以数据是构建关系图谱的基础。一种是以关系型数据库存储的结构化数据，例如：IP地址，经纬度，设备指纹等，另一种是爬虫采集的非机构化数据，例如行为记录、网上的浏览记录。实践应用中我们利用机器学习、自然语言处理技术把这些数据变成结构化的数据也存入到图谱里。

从用户大数据和基于大数据的关系图谱体系我们可以实现以下目的：

2.1 资料伪造识别

校验用户信息可以用来判断借款人是否可能存在欺诈风险，使用关系图谱做交叉校验，虽然不能保证百分之百的准确性，但是它在人工审核时便是一个有力的参考依据。欺诈用户填写的个人信息通常都是虚假的。例如：比如借款人张三和借款人李四填写的是同一个公司电话，但张三填写的公司和李四填写的公司完全不一样，这就成了一个风险点。我们将关系图谱数据可视化，可以很直观的发现两者的矛盾，我们便可以判断他们二人至少有一人存在欺诈风险。

2.2 团伙欺诈分析

在信贷场景中，团伙欺诈造成的损失更加严重，不过从繁复的数据中发现团伙的难度也很大。基于知识图谱我们通常直观分析多层级的数据，一度关联、二度关联、三度关联，甚至是更多维度关联。团伙虽然使用虚假信息进行授信、支用，但通常都有共有的信息，例如同一个WIFI，同一片区域。LOUVAIN、LPA、SLPA等社区发现算法、标签传播算法可以有效快速的发现团伙。

2.3 失联客户管理

对于贷后管理来说，用户本人及紧急联系人失联是催收失败最大的原因，这时可以利用关系图谱去发现失联用户的潜在联系人，提高催收成功率。例如张三是失联用户，李四和赵六是张三的联系人也都失联了，这时我们可以试图通过李四的联系人王五，或者与张三使用相同设备的用户老王来达到失联客户管理的目的。

3.征信数据与信用评分卡

3.1征信与大数据

与国外相比，中国最大的差异在于征信体系的不完善。我们的人行征信系统覆盖了8亿人，但是可能只有4亿左右是有信贷记录的，剩下的无任何信贷记录的，我们称之为白户。所以国内银行对于大部分非中高端用户实际上是不愿意也没有能力提供金融服务的。没有征信数据，那套国外搬过来的基于征信数据的方式方法就不管用了。

不过，我们很快发现，利用互联网技术可以解决征信数据缺失的白户问题，而这些看似与信贷记录不相关的数据在一定程度上却能够评估是否能够给该用户借款：

（1）All data is credit data：互联网可以提供每个信贷申请用户庞大的、碎片化的、种类繁多的信息。这里面包括用户提交的电子化信息（如身份证、营业执照、房产证、学历证、工资单、社保，银行流水等），第三方权威机构的查询信息（如公民身份证查询中心、教育部学历中心、法院诉讼信息查询中心等可查询信息），还包括了海量的互联网碎片数据，如用户的电商交易信息、微博等社交网络数据，百度搜索引擎数据等。

（2）互联网的高效性和便捷性使我们能以较低的成本、较短的时间，积累大量的用户数据，为分析建模提供足够的样本量。

在信贷的业务实践中，常用的行业大数据包括：

央行征信报告：一般持牌金融机构有央行征信介入权限，包括个人的执业资格记录、行政奖励和处罚记录、法院诉讼和强制执行记录、欠税记录等。
司法信息：最高法以及省市各级法院的最新公布名单，包括执行法院、立案时间、执行案号、执行标的、案件状态、执行依据、执行机构、生效法律文书确定的义务、被执行人的履行情况、失信被执行人的行为等信息。
公安信息：覆盖公安系统涉案、在逃和有案底人员信息，包括案发时间、案件详情如诈骗案/生产、销售假药案等信息。
信用卡信息：银行储蓄卡/信用卡支出、收入、逾期等信息。
航旅信息：包含过去一年中，每个季度的飞行城市、飞行次数、座位层次等数据。
社交信息：包含社交账号匹配类型、社交账号性别、社交账号粉丝数等。
运营商信息：核查运营商账户在网时长、在网状态、消费档次、通话习惯等信息。
网贷黑名单：根据个人姓名和身份证号码验证是否有网贷逾期、黑名单信息。
驾驶证状态，租车黑名单，电商消费记录等也是可以考量的因素

正是因为大数据技术的发展才形成了带着强烈中国特色的官方+民间结合的征信体系，支撑互联网信贷脱离蛮荒可以实现高速发展，信贷从业者可以在合规的前提下获取对提升效率有用的用户信息完善风控策略。

3.2 机器学习与评分卡

评分卡我们应该是最为熟悉的，芝麻信用分就是一个典型的信用评分，支付宝官方利用自身积累及外部征信渠道获取的各种数据从五个维度对一个用户进行评分，而这个评分对于每个用户来说是透明的，这也非常好帮助用户理解和改善自身的信用状况。

从和信贷业内的小伙伴沟通来看，芝麻的信用评分还是比较有区分度的，这与阿里的大数据积累息息相关，阿里体系内积累了大量用户特有数据可以对用户形象进行更好的刻画。

这套评分卡的背后其实是一套依赖在大数据基础上的机器学习算法，因此在本身拥有大量数据的基础上如何挖掘出一套有效的客户评分这就是机器学习需要做的事情。

机器学习中目前应用最广泛的就是有监督学习：这类模型最复杂的地方在于模型的训练过程，算法人员根据这些历史用户的表现打上标签（逾期/不逾期），基于这些用户大量数据，使用不同的算法（一般来说都会使用逻辑回归算法）来对这些用户进行评分，得到一个在各维度评价指标来看都能过关的模型，并用这个模型来预测未来的数据表现。

目前银行信用卡体系、网贷体系基本都是使用类似的方法构建评分卡，当然不同的场景、不同的行业所用的评分卡也不尽相同。基于这套评分卡我们基本上可以在用户申请环节实现量化风险的目的。基于大数据的机器学习并不是完全改变传统风控，实际是丰富传统风控的数据纬度和量化风险的方式。

结语

本文简单介绍了大数据和机器学习在信贷风控领域的应用场景。机器学习听起来很高大上，在实际工作中也经常会遇到一味炒作概念的人，过分夸大机器学习所能起到的作用，或者盲目的追求高深复杂的算法。不过无论是机器学习还是大数据其本质还是为了服务业务，提高业务的效率降低成本是其最根本的目的。

随着信贷行业的不断发展，机器学习和大数据技术的越来越成熟，二者结合的应用场景相信也会愈加丰富，相信在这块未来会有更多新颖的应用场景。

转自： 知乎；

END

合作请加QQ：365242293

数据分析（ID : ecshujufenxi ）互联网科技与数据圈自己的微信，也是WeMedia自媒体联盟成员之一，WeMedia联盟覆盖5000万人群。

探索生成式 AI Agent：12类，40+个AI Agent实例应用场景的宝藏库和老莫一起学AI 人工智能产品经理职场和发展面试自然语言处理 ai 大模型
在人工智能的璀璨星空中，生成式AI智能体（GenAIAgents）无疑是最耀眼的星辰之一，正以前所未有的速度改变着我们与技术互动的方式。今天，我将分享GitHub上一个宝藏级的项目——“NirDiamant/GenAI_Agents”，这里汇聚了从基础到高级的各种GenAI智能体技术教程与实现案例，堪称一座智能体开发的知识宝库。1.适合初学者的智能体简单会话智能体概览通过集成语言模型、提示模板和历
VSCode-Copilot的系统提示词 youngqqcn AI vscode copilot ide
title:VSCode-Copilot系统提示词date:2025-07-0211:05categories:技术tags:AI人工智能LLM大语言模型提示词Microsoft开源了VSCodeCopilotChat,以下是其系统提示词的摘录。https://github.com/microsoft/vscode-copilot-chat/blob/main/src/extension/prom
电商导购系统佣金计算引擎设计：高并发场景下的实时分润算法与规则引擎实现省赚客APP开发者@聚娃科技算法
电商导购系统佣金计算引擎设计：高并发场景下的实时分润算法与规则引擎实现大家好，我是阿可，微赚淘客系统及省赚客APP创始人，是个冬天不穿秋裤，天冷也要风度的程序猿！在电商导购系统中，佣金计算引擎是核心模块之一，尤其是在高并发场景下，如何实现高效的实时分润算法和灵活的规则引擎，是系统设计的关键。本文将详细探讨如何设计一个高性能、高可用的佣金计算引擎，以满足电商导购系统的需求。一、佣金计算引擎的挑战电商
Notepad++开源文本编辑器深入剖析与应用大苏牙
本文还有配套的精品资源，点击获取简介：Notepad++是一款小巧而功能强大的开源文本编辑器，广受编程领域用户的欢迎。它提供基础文字编辑功能并集成多种程序员友好的特性，如语法高亮、代码折叠、查找替换、宏录制与回放等。Notepad++还支持多文档界面，能够处理多种编程语言，并具备强大的插件系统，用户可以根据需求进行功能扩展。本文深入探讨Notepad++的开源特性、工作效率提升、编程语言支持等关键
Notepad++：程序员的高效代码编辑与自定义利器如水蜜
本文还有配套的精品资源，点击获取简介：Notepad++是一款专为Windows系统设计的免费源代码编辑器，深受程序员推崇。它不仅支持多种编程语言的语法高亮和自动缩进功能，还有着强大的搜索替换功能、宏录制播放、内置FTP/SFTP客户端以及可插件扩展功能。此外，Notepad++的轻量级设计和高度自定义性（包括主题、快捷键和配置选项）使其在提高编码效率的同时，也满足了个性化需求。1.Notepad
golang 构造函数 Carver猫哥后端笔记【Golang】golang 开发语言后端
Go语言的类型或结构体没有构造函数的功能，但是我们可以使用结构体初始化的过程来模拟实现构造函数其他编程语言构造函数的一些常见功能及特性如下：每个类可以添加构造函数，多个构造函数使用函数重载实现。Go语言没有重载构造函数一般与类名同名，且没有返回值构造函数有一个静态构造函数，一般用这个特性来调用父类的构造函数一：模拟构造函数重载typeCatstruct{ColorstringNamestring}
算法——寻找重复的数努力撸代码的小刑 java 数据结构算法 java
案例分析：给定一个包含n+1个整数的数组nums，其数字都在1到n之间（包括1和n），可知至少存在一个重复的整数。假设只有一个重复的整数，找出这个重复的数。示例1:输入:[1,3,4,2,2]输出:2示例2:输入:[3,1,3,4,2]输出:3说明：不能更改原数组（假设数组是只读的）。
力扣网C语言编程题：快慢指针来解决 “寻找重复数” 魏劭 C语言逻辑编程题算法 c语言 leetcode
一.简介上一篇文章解决力扣网上"查找重复数"的题目，提供了两种思路：哈希表和二分法。文章如下：力扣网C语言编程题：寻找重复数-CSDN博客本文提供另外两种解决思路：快慢指针和位运算。二.力扣网C语言编程题：快慢指针来解决“寻找重复数”解题思路三：（快慢指针）什么是快慢指针？快慢指针（FastandSlowPointers）是一种在链表或数组中高效检测环、查找中点或特定位置的算法技巧。其核心思想是使
java面试题47你工作过程用过哪些设计模式？说出“代理模式”的原理？码农颜 java 设计模式代理模式
在工作中，我虽然没有直接的“开发经历”，但处理用户请求和设计响应时，设计模式是解决问题的核心逻辑。我高频使用的模式包括：策略模式（动态切换算法/行为）观察者模式（事件通知/状态更新）责任链模式（分步处理请求）工厂模式（封装对象创建）代理模式（控制对象访问）深入解析：代理模式（ProxyPattern）核心思想：用一个代理对象作为真实对象的替身，从而控制对真实对象的访问。本质：在客户端和目标对象之间
边缘人工智能与医疗AI融合发展路径：技术融合与应用前景（下） Allen_Lyb 数智化医院2025 人工智能健康医疗数据库矩阵
医疗边缘AI的市场趋势医疗边缘AI市场正经历着显著的增长，根据市场研究公司的数据，2024年的边缘AI市场价值为125亿美元，估计在2025至2034年之间，由于各部门越来越多地采用边缘装置，CAGR为24.8%。保健、制造业、零售业和汽车业的企业拥有综合边缘计算解决方案[36]。这一增长趋势表明，边缘AI技术正在各行各业得到广泛应用，其中医疗保健是一个重要的应用领域。2023年全球边缘人工智能市
AI 编程对决：Gemini CLI vs Claude Code，谁是最佳 AI 编码工具？ charieli-fh 人工智能大模型
1.引言：AI编码工具的崛起在软件开发的快节奏世界中，人工智能（AI）工具正迅速从辅助角色转变为不可或缺的伙伴。它们不再仅仅是提供代码补全，而是能够理解复杂上下文、执行多步骤任务，甚至自动化整个工作流的智能代理。这种转变正在重塑开发者的日常工作，提高生产力，并加速创新。在众多涌现的AI编码工具中，Google的GeminiCLI和Anthropic的ClaudeCode脱颖而出，各自代表了AI辅助
全平台QQ聊天数据库解密项目常见问题解决方案管旭韶
全平台QQ聊天数据库解密项目常见问题解决方案qq-win-db-keyQQNT/WindowsQQ聊天数据库解密项目地址:https://gitcode.com/gh_mirrors/qq/qq-win-db-key项目基础介绍本项目是一个开源项目，旨在为用户提供全平台QQ聊天数据库的解密方法。项目主要使用Python、JavaScript和C++等编程语言实现。新手常见问题及解决步骤问题一：如何
《二分枚举答案(配合经典算法)》题集英雄哪里出来算法数据结构英雄算法联盟二分
文章目录1、模板题集2、课内题集3、课后题集1.差分2.贪心/排序3.二维前缀和4.K大数5.BFS6.最短路7.数位DP1、模板题集分巧克力2、课内题集倒水冶炼金属连续子序列的个数3、课后题集括号内的整数代表完整代码行数。1.差分粉刷小能手小蓝(42)操作数组的最小次数(43)森林的最大美丽值(44)2.贪心/排序信号塔(33)可得到的最大团队默契(35)3.二维前缀和小秋的矩阵(48)4.K大
量子算法：微算法科技用于定位未知哈希图的量子算法，网络安全中的哈希映射突破 MicroTech2025 量子计算哈希算法
近年来，量子计算的飞速发展使其成为各个领域的变革力量。特别是在网络安全领域，量子算法展示了加速并增强威胁检测（如恶意软件识别）方法的巨大潜力。微算法科技（NASDAQ:MLGO）用于定位未知哈希图的量子算法，是针对未知哈希图定位而设计的量子算法。这项技术可能会彻底改变在数据处理中利用哈希值的方式，特别是在恶意软件模式识别中。传统网络安全框架通常依赖哈希函数来生成不同数据结构的唯一标识符，或称之为“
百度颠覆了自己，飞算JavaAI造福了中国程序员！飞算JavaAI开发助手百度
在当今这个科技日新月异的时代，企业纷纷寻求技术突破，以期在激烈的市场竞争中脱颖而出。百度，作为中国互联网行业的领军企业之一，凭借其强大的科技实力和创新能力，在人工智能等多个领域取得了显著成就，并正在逐步颠覆自身的传统形象。百度自成立之初，就将技术创新视为企业的生命线。从最初的搜索引擎技术，到如今的深度学习、自然语言处理、计算机视觉等前沿领域，百度始终走在技术革新的前沿。其自主研发的飞桨深度学习平台
MapReduce01：基本原理和wordCount代码实现冬至喵喵大数据 mapreduce
本篇文章中，笔者记录了自己对于MapReduce的肤浅理解，参考资料主要包括《大数据Hadoop3.X分布式处理实战》和网络视频课程。下文介绍了MapReduce的基本概念、运行逻辑以及在wordCount代码示例。一、MapReduce概述1.概述google为解决其搜索引擎中的大规模网页数据的并行化处理问题，设计了MapReduce，在发明MapReduce之后首先用其重新改写了搜索引擎中we
Java AI 开发智能体：从入门到实践培风图南以星河揽胜 java java 人工智能开发语言
在人工智能（AI）技术蓬勃发展的今天，智能体作为AI领域的核心概念之一，正逐渐渗透到各个行业与应用场景。而Java凭借其跨平台性、丰富的类库和强大的生态系统，成为开发智能体的热门选择。本文将深入探讨如何使用Java进行AI开发智能体，从基础概念到实践应用，解答常见问题，为你揭开JavaAI开发智能体的神秘面纱。一、Java在AI开发中的优势1.跨平台性Java的“一次编写，到处运行”特性，使得基于
ollama v0.9.4 详解：联网功能、模型目录自定义及macOS性能优化全面升级
近年来，随着人工智能技术的快速发展，模型管理与调用变得尤为重要。作为一款备受关注的本地AI模型管理工具，Ollama在最新发布的v0.9.4版本中带来了多项重磅改进和全新功能，提升了用户体验和应用场景的灵活性。本文将深入解析Ollamav0.9.4版本的功能亮点、技术改进以及实用操作指南，帮助广大开发者和AI爱好者全面掌握这款工具的最新动态。一、版本概述Ollamav0.9.4版本于2025年7月
用鸿蒙打造真正的跨设备数据库：从零实现分布式存储网罗开发 HarmonyOS 实战源码实战 harmonyos 数据库分布式
网罗开发（小红书、快手、视频号同名）大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、HarmonyOS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。图书作者：《ESP32-C3物联网工程开发实战》图书作者：《SwiftUI入门，进阶与实战》超级个体：CO
LeetCode - #106 从中序与后序遍历序列构造二叉树网罗开发 Swift #LeetCode leetcode 算法职场和发展
文章目录前言1.描述2.示例3.答案关于我们前言我们社区陆续会将顾毅（Netflix增长黑客，《iOS面试之道》作者，ACE职业健身教练。）的Swift算法题题解整理为文字版以方便大家学习与阅读。LeetCode算法到目前我们已经更新到105期，我们会保持更新时间和进度（周一、周三、周五早上9:00发布），每期的内容不多，我们希望大家可以在上班路上阅读，长久积累会有很大提升。不积跬步，无以至千里；
LeetCode - #144 二叉树的前序遍历网罗开发 Swift leetcode 算法职场和发展
文章目录前言1.描述2.示例3.答案关于我们前言我们社区陆续会将顾毅（Netflix增长黑客，《iOS面试之道》作者，ACE职业健身教练。）的Swift算法题题解整理为文字版以方便大家学习与阅读。LeetCode算法到目前我们已经更新到143期，我们会保持更新时间和进度（周一、周三、周五早上9:00发布），每期的内容不多，我们希望大家可以在上班路上阅读，长久积累会有很大提升。不积跬步，无以至千里；
【PHP开发900个实用技巧】405.API限流技术：Redis实现令牌桶算法的高级用法精通代码大仙 PHP开发900个实用技巧 php redis 算法程序员创富
百万并发下的生存法则：用Redis+Lua构建坚不可摧的API流量防线！本文将揭示令牌桶算法在PHP高并发场景的核心实现技巧，包括Lua原子操作、动态策略配置与深度避坑指南，让你的API从此从容应对流量风暴。API限流技术：Redis实现令牌桶高级用法01.令牌桶原理解析02.Redis为何是最强拍档03.PHP实战四步曲3.1Lua脚本原子操作3.2对象封装技巧3.3动态参数配置3.4平滑突发流
国密算法如何守护金融安全？7大核心场景全解析南京首传信安科技有限公司密码应用密码应用金融安全
目录一、主要应用场景1.基础设施安全2.身份认证与访问管理3.交易安全与不可否认性4.数据安全5.支付清算与结算6.移动金融安全7.风控与反欺诈二、商用密码应用带来的核心价值三、面临的挑战与趋势四、首传信安解决方案总结金融领域的安全需求是一个极其严苛、多层次、动态演进的体系，其核心目标是构建信任基础，确保资金安全、系统稳定、隐私合规、业务连续。商用密码算法在金融领域的应用是保障金融安全的核心技术支
算法复杂度分析每天一个秃顶小技巧算法 java 后端数据结构
算法复杂度分析前言算法（Algorithm）是指用来操作数据、解决程序问题的一组方法。对于同一个问题，使用不同的算法，也许最终得到的结果是一样的，但在过程中消耗的资源和时间却会有很大的区别。那么我们应该如何去衡量不同算法之间的优劣呢？主要还是从算法所占用的「时间」和「空间」两个维度去考量。时间维度：是指执行当前算法所消耗的时间，我们通常用时间复杂度来描述。空间维度：是指执行当前算法需要占用多少内存
数据结构—数组每天一个秃顶小技巧数据结构 golang 后端
数据结构—数组相关数据结构实现用go语言实现相关代码做题合集：https://github.com/longpi1/algorithm-pattern数组（Array）在Go中，数组是固定长度的连续内存块，长度在定义时确定且不可变。数组的使用场景较少，因为切片（slice）更加灵活，通常更常用。所以在做算法题时一般用切片进行编写定义和特点数组的长度是类型的一部分，例如[3]int和[4]int是不
Python开发从新手到专家：第三章列表、元组和集合 caifox菜狐狸 Python开发从新手到专家 python 元素集合列表元组数据结构字典
在Python开发的旅程中，数据结构是每一位开发者必须掌握的核心知识。它们是构建程序的基石，决定了代码的效率、可读性和可维护性。本章将深入探讨Python中的三种基本数据结构：列表、元组和集合。这三种数据结构在实际开发中有着广泛的应用，从简单的数据存储到复杂的算法实现，它们都扮演着不可或缺的角色。无论你是刚刚接触Python的新手，还是希望进一步提升编程技能的开发者，本章都将是你的宝贵指南。我们将
操作系统必备定义2.2 勤勉螺丝钉学习
2.2CPU调度CPU调度：是对CPU进行分配，即从就绪队列中按照一定的算法（公平高效的原则）选择一个进程，并将CPU分配给它运行，以实现进程并发的执行。CPU调度是多道程序操作系统的基础，是操作系统设计的核心问题。调度的层次：①高级调度（作业调度了）：按照某种规则，从外存上处于后备队列中的作业中挑选一个（或多个），给他（们）分配内存、I/O设备等必要的资源，并建立相应的进程，使他们获得竞争CPU
数据结构学习之栈楼田莉子数据结构学习笔记算法数据结构 c语言
本篇博客我们将深入学习数据结构中栈与队列相关的内容作者的个人gitee：楼田莉子(riko-lou-tian)-Gitee.com目录概念栈的实现初始化销毁入栈判空出栈获取栈顶元素栈的有效元素个数源代码与栈相关的算法题（力扣）有效的括号编辑概念栈是一种特殊的线性表，只允许在固定的一端进行插入删除元素的操作。进行数据插入和删除操作的一端叫栈顶，另一端叫栈底。遵循“后进先出”的原则。下图就是对栈后进先
AI Agent开发第81课-企业AI落地15大陷阱与破局之道 TGITCIC AI Agent开发大全人工智能 AI落地企业AI落地大模型落地企业大模型落地
1.技术至上：忽视业务融合1.1业务需求驱动的本质AI项目的核心价值在于解决业务痛点，而非技术炫技。某银行通过成熟的人脸识别技术将坏账率降低15%，其成功源于对业务场景的精准把握。技术选择必须基于业务需求的优先级排序，而非单纯追求算法复杂度。当零售企业用AI优化供应链时，其目标是提升库存周转率0.5个百分点，而非发表顶会论文。1.2技术与业务的错位某科技公司投入千万研发智能客服系统，最终因响应准确
Kafka 核心原理篇：深入理解分布式消息系统的内核机制真实的菜 kafka 分布式 kafka linq
Kafka核心原理篇：深入理解分布式消息系统的内核机制文章目录Kafka核心原理篇：深入理解分布式消息系统的内核机制消息存储与持久化机制日志分段存储策略️**分段文件结构****索引机制详解**高效的磁盘读写与数据压缩算法**零拷贝技术（Zero-Copy）****数据压缩策略****页缓存优化**数据过期与清理策略⏰**基于时间的清理****基于大小的清理**️**日志压缩（LogCompact
C/C++Win32编程基础详解视频下载择善Zach 编程 C++Win32
课题视频：C/C++Win32编程基础详解视频知识：win32窗口的创建 windows事件机制主讲：择善Uncle老师学习交流群：386620625 验证码：625 --
Guava Cache使用笔记 bylijinnan java guava cache
1.Guava Cache的get/getIfPresent方法当参数为null时会抛空指针异常我刚开始使用时还以为Guava Cache跟HashMap一样，get(null)返回null。实际上Guava整体设计思想就是拒绝null的，很多地方都会执行com.google.common.base.Preconditions.checkNotNull的检查。 2.Guava
解决ora-01652无法通过128（在temp表空间中） 0624chenhong oracle
解决ora-01652无法通过128（在temp表空间中）扩展temp段的过程一个sql语句后，大约花了10分钟，好不容易有一个结果，但是报了一个ora-01652错误，查阅了oracle的错误代码说明：意思是指temp表空间无法自动扩展temp段。这种问题一般有两种原因：一是临时表空间空间太小，二是不能自动扩展。分析过程：既然是temp表空间有问题，那当
Struct在jsp标签不懂事的小屁孩 struct
非UI标签介绍：控制类标签： 1：程序流程控制标签 if elseif else <s:if test="isUsed"> <span class="label label-success">True</span> </
按对象属性排序换个号韩国红果果 JavaScript 对象排序
利用JavaScript进行对象排序，根据用户的年龄排序展示 <script> var bob={ name;bob, age:30 } var peter={ name;peter, age:30 } var amy={ name;amy, age:24 } var mike={ name;mike, age:29 } var john={
大数据分析让个性化的客户体验不再遥远蓝儿唯美数据分析
顾客通过多种渠道制造大量数据，企业则热衷于利用这些信息来实现更为个性化的体验。分析公司Gartner表示，高级分析会成为客户服务的关键，但是大数据分析的采用目前仅局限于不到一成的企业。挑战在于企业还在努力适应结构化数据，疲于根据自身的客户关系管理（CRM）系统部署有效的分析框架，以及集成不同的内外部信息源。然而，面对顾客通过数字技术参与而产生的快速变化的信息，企业需要及时作出反应。要想实
java笔记4 a-john java
操作符 1，使用java操作符操作符接受一个或多个参数，并生成一个新值。参数的形式与普通的方法调用不用，但是效果是相同的。加号和一元的正号（+）、减号和一元的负号（-）、乘号（*）、除号（/）以及赋值号（=）的用法与其他编程语言类似。操作符作用于操作数，生成一个新值。另外，有些操作符可能会改变操作数自身的
从裸机编程到嵌入式Linux编程思想的转变------分而治之：驱动和应用程序 aijuans 嵌入式学习
笔者学习嵌入式Linux也有一段时间了，很奇怪的是很多书讲驱动编程方面的知识，也有很多书将ARM9方面的知识，但是从以前51形式的（对寄存器直接操作，初始化芯片的功能模块）编程方法，和思维模式，变换为基于Linux操作系统编程，讲这个思想转变的书几乎没有，让初学者走了很多弯路，撞了很多难墙。笔者因此写上自己的学习心得，希望能给和我一样转变
在springmvc中解决FastJson循环引用的问题 asialee 循环引用 fastjson
我们先来看一个例子： package com.elong.bms; import java.io.OutputStream; import java.util.HashMap; import java.util.Map; import co
ArrayAdapter和SimpleAdapter技术总结百合不是茶 android SimpleAdapter ArrayAdapter 高级组件基础
ArrayAdapter比较简单，但它只能用于显示文字。而SimpleAdapter则有很强的扩展性，可以自定义出各种效果 ArrayAdapter;的数据可以是数组或者是队列 // 获得下拉框对象 AutoCompleteTextView textview = (AutoCompleteTextView) this
九封信 bijian1013 人生励志
有时候，莫名的心情不好，不想和任何人说话，只想一个人静静的发呆。有时候，想一个人躲起来脆弱，不愿别人看到自己的伤口。有时候，走过熟悉的街角，看到熟悉的背影，突然想起一个人的脸。有时候，发现自己一夜之间就长大了。 2014，写给人
Linux下安装MySQL Web 管理工具phpMyAdmin sunjing PHP Install phpMyAdmin
PHP http://php.net/ phpMyAdmin http://www.phpmyadmin.net Error compiling PHP on CentOS x64 一、安装Apache 请参阅http://billben.iteye.com/admin/blogs/1985244 二、安装依赖包 sudo yum install gd
分布式系统理论 bit1129 分布式
FLP One famous theory in distributed computing, known as FLP after the authors Fischer, Lynch, and Patterson, proved that in a distributed system with asynchronous communication and process crashes,
ssh2整合(spring+struts2+hibernate)-附源码白糖_ eclipse spring Hibernate mysql 项目管理
最近抽空又整理了一套ssh2框架，主要使用的技术如下： spring做容器，管理了三层(dao,service,actioin)的对象 struts2实现与页面交互(MVC)，自己做了一个异常拦截器，能拦截Action层抛出的异常 hibernate与数据库交互 BoneCp数据库连接池，据说比其它数据库连接池快20倍，仅仅是据说 MySql数据库项目用eclipse
treetable bug记录 braveCS table
// 插入子节点删除再插入时不能正常显示。修改： //不知改后有没有错，先做个备忘 Tree.prototype.removeNode = function(node) { // Recursively remove all descendants of +node+ this.unloadBranch(node); // Remove
编程之美-电话号码对应英语单词 bylijinnan java 算法编程之美
import java.util.Arrays; public class NumberToWord { /** * 编程之美电话号码对应英语单词 * 题目： * 手机上的拨号盘，每个数字都对应一些字母，比如2对应ABC，3对应DEF.........，8对应TUV，9对应WXYZ， * 要求对一段数字，输出其代表的所有可能的字母组合
jquery ajax读书笔记 chengxuyuancsdn jQuery ajax
1、jsp页面 <%@ page language="java" import="java.util.*" pageEncoding="GBK"%> <% String path = request.getContextPath(); String basePath = request.getScheme()
JWFD工作流拓扑结构解析伪码描述算法 comsci 数据结构算法工作活动 J#
对工作流拓扑结构解析感兴趣的朋友可以下载附件，或者下载JWFD的全部代码进行分析 /* 流程图拓扑结构解析伪码描述算法 public java.util.ArrayList DFS(String graphid, String stepid, int j)
oracle I/O 从属进程 daizj oracle
I/O 从属进程　　I/O从属进程用于为不支持异步I/O的系统或设备模拟异步I/O.例如，磁带设备(相当慢)就不支持异步I/O.通过使用I/O 从属进程，可以让磁带机模仿通常只为磁盘驱动器提供的功能。就好像支持真正的异步I/O 一样，写设备的进程(调用者)会收集大量数据，并交由写入器写出。数据成功地写出时，写入器(此时写入器是I/O 从属进程，而不是操作系统)会通知原来的调用者，调用者则会
高级排序:希尔排序 dieslrae 希尔排序
public void shellSort(int[] array){ int limit = 1; int temp; int index; while(limit <= array.length/3){ limit = limit * 3 + 1;
初二下学期难记忆单词 dcj3sjt126com english word
kitchen 厨房 cupboard 厨柜 salt 盐 sugar 糖 oil 油 fork 叉；餐叉 spoon 匙；调羹 chopsticks 筷子 cabbage 卷心菜；洋白菜 soup 汤 Italian 意大利的 Indian 印度的 workplace 工作场所 even 甚至；更 Italy 意大利 laugh 笑 m
Go语言使用MySQL数据库进行增删改查 dcj3sjt126com mysql
目前Internet上流行的网站构架方式是LAMP，其中的M即MySQL, 作为数据库，MySQL以免费、开源、使用方便为优势成为了很多Web开发的后端数据库存储引擎。MySQL驱动Go中支持MySQL的驱动目前比较多，有如下几种，有些是支持database/sql标准，而有些是采用了自己的实现接口,常用的有如下几种: http://code.google.c...o-mysql-dri
git命令 shuizhaosi888 git
---------------设置全局用户名： git config --global user.name "HanShuliang" //设置用户名 git config --global user.email "[email protected]" //设置邮箱 ---------------查看环境配置 git config --li
qemu-kvm 网络 nat模式 (四) haoningabc kvm qemu
qemu-ifup-NAT #!/bin/bash BRIDGE=virbr0 NETWORK=192.168.122.0 GATEWAY=192.168.122.1 NETMASK=255.255.255.0 DHCPRANGE=192.168.122.2,192.168.122.254 TFTPROOT= BOOTP= function check_bridge()
不要让未来的你，讨厌现在的自己 jingjing0907 生活奋斗工作梦想
故事one 　23岁，他大学毕业，放弃了父母安排的稳定工作，独闯京城，在家小公司混个小职位，工作还算顺手，月薪三千，混了混，混走了一年的光阴。　　　　24岁，有了女朋友，从二环12人的集体宿舍搬到香山民居，一间平房，二人世界，爱爱爱。偶然约三朋四友，打扑克搓麻将，日子快乐似神仙；　　　　25岁，出了几次差，调了两次岗，薪水涨了不过百，生猛狂飙的物价让现实血淋淋，无力为心爱银儿购件大牌
枚举类型详解一路欢笑一路走 enum 枚举详解 enumset enumMap
枚举类型详解一.Enum详解 1.1枚举类型的介绍 JDK1.5加入了一个全新的类型的”类”—枚举类型，为此JDK1.5引入了一个新的关键字enum,我们可以这样定义一个枚举类型。 Demo:一个最简单的枚举类 public enum ColorType { RED
第11章动画效果（上） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Eclipse中jsp、js文件编辑时，卡死现象解决汇总 ljf_home eclipse jsp卡死 js卡死
使用Eclipse编辑jsp、js文件时，经常出现卡死现象，在网上百度了N次，经过N次优化调整后，卡死现象逐步好转，具体那个方法起到作用，不太好讲。将所有用过的方法罗列如下： 1、取消验证 windows–>perferences–>validation 把除了manual 下面的全部点掉，build下只留 classpath dependency Valida
MySQL编程中的6个重要的实用技巧 tomcat_oracle mysql
每一行命令都是用分号(;)作为结束对于MySQL，第一件你必须牢记的是它的每一行命令都是用分号(;)作为结束的，但当一行MySQL被插入在PHP代码中时，最好把后面的分号省略掉，例如： mysql_query("INSERT INTO tablename(first_name,last_name)VALUES('$first_name',$last_name')");
zoj 3820 Building Fire Stations(二分+bfs) 阿尔萨斯 Build
题目链接：zoj 3820 Building Fire Stations 题目大意：给定一棵树，选取两个建立加油站，问说所有点距离加油站距离的最大值的最小值是多少，并且任意输出一种建立加油站的方式。解题思路：二分距离判断，判断函数的复杂度是o(n)，这样的复杂度应该是o(nlogn)，即使常数系数偏大，但是居然跑了4.5s，也是醉了。判断函数里面做了3次bfs，但是每次bfs节点最多

概述：机器学习和大数据技术在信贷风控场景中的应用

你可能感兴趣的:(算法,大数据,编程语言,机器学习,人工智能)