jin_tmac

转载 -- 携程金融大数据风控算法实践

「数据中台」

模型亦是基于完善的技术平台的，携程金融数据中台可以抽象为三个层次，底层是基础数据层，中层业务抽象模型层，以及最上层的算法模型层。

Fig . 2 携程金融大数据中台的抽象结构

中台这个概念早期是由美军的作战体系演化而来的，技术上所说的“中台”主要是指学习这种高效、灵活和强大的指挥作战体系。比如电商领域，经过十几年的发展，组织庞大而复杂，业务不断细化拆分，也导致野蛮发展的系统越来越不可维护，开发和改造效率极低，也有很多新业务不得不重复造轮子，因此业界诞生了不少知名中台系统，最著名的是阿里云的数据中台建设。

在携程金融内部，大数据中台的目标是为了解决效率问题，同时降低创新成本。

中台的目标：减少沟通成本，提升协作效率；
中台的实现手段：制定标准/规范、提供高可用数据/算法/应用服务、提供统一、标准的数据研发工具；
中台的原则：数据资产的集中管控，分布式执行。

携程金融的数据中台收集了包括携程OTA整个生态环境数据，框架的最底层是计算与存储资源层，其上是数据准备层，融合多数据源，并对其做了抽取，清洗，能够提供在线与离线的服务，使其能够为用户画像，特征引擎提供基础数据，并应用于模型算法。基础数据、用户画像、特征集市、模型服务这些内容以数据资产的形式来管理。基于这些数据资产，可以为各个业务线-获客，准入，经营，留存的全生命周期提供各种服务，框架图如下：

Fig . 3 携程金融大数据中台全景

「风控模型体系」

消费金融的风险大体可分为可控风险及不可控风险，算法能解决的主要是可控风险。可控风险包含欺诈风险、信用风险及作业风险；其中，欺诈风险指的是客户在发起借款请求时即无意还款，按照人数可以分为团伙欺诈和个人欺诈，欺诈者往往通过伪造身份信息、联系方式信息、设备信息、资产信息等方式实施欺诈；信用风险指的是借款人因各种原因未能及时、足额偿还债务或银行贷款而违约的可能性。不可控风险包括市场风险、实质风险及名义风险。

Fig . 4 风险基本分类

风控模型贯穿获客、准入、经营、逾期的整个客户生命周期，根据用户生命周期的不同阶段，可将风控模型分为贷前信用风险模型、贷中行为风险模型、欺诈检测及贷后催收模型。事实上，抓住信贷审批管理就能控制80%的风险，一旦用户获得授信，后续的管理只能控制20%的风险。除此之外，贷前、贷中、贷后不同场景，可以从不同的观测粒度进行建模与抽象。拿携程金融的业务来讲，可以从每一笔交易角度来看，也可以从携程生态中用户账户来看，也可以从自然人概念为核心的客户级别来看。一个自然人客户与账号可以是一对多的关系，一个账号与交易也可以是一对多的关系。

Fig . 5 携程金融风控模型体系

如今在银行、消费金融公司等各种贷款业务机构，普遍使用信用评分，对客户实行打分制，以期对客户的风险水平有一个准确的判断，并作为风险定价的重要手段。行业内常用的是ABC三张评分卡。A卡、B卡、C卡分别表示：申请评分卡(Application Score Card)，行为评分卡(Behavior Score Card)，和催收评分卡(Collection Score Card)。

A卡：在获客过程中用到的信用风险模型。从模型的角度来看，它会对用户未来一定周期内的逾期风险作预测，即模型会在用户授权的情况下收集用户多维度的信息，以此来预测逾期概率。预测的逾期概率被用于风控策略或者转换成信用评分，比如国外经典的FICO评分，国内的蚂蚁信用评分、京东小白评分、携程金融的程信分等。A卡评分除了用于决定是否通过用户的信用申请，还用于风险定价，比如额度、利率等。

B卡：行为评分是指，用户拿到信用额度后，模型根据用户的贷中行为数据，进行风险水平的预测。本质上讲，这个模型是一个事件驱动的模型，在互联网金融领域，一般会比A卡的预测时间窗口要短，对用户的行为更为敏感。B卡除了可以用于高风险用户的拦截，也可以作为额度、利率调整的重要参考因素。

C卡：催收评分会判断，例如当用户出现逾期时，机构应该先催谁，或者哪些用户不用催，就自动会把钱还回来。催收模型一定程度节约催收成本，提高回催率。

「风控模型体系之贷前信用风险模型(A卡)」

贷前主要解决用户准入和风险定价问题，即面对一个新申请的进件用户，判断用户是否符合产品的放款条件及相应的放款额度、价格、期限等问题。主要包括三类问题：

反欺诈识别：根据用户提交的材料进行身份核实，确保用户不存在欺诈行为；
信用评级：与传统银行的信用评分卡原理类似，数据维度更加丰富，综合用户的社交数据、行为数据、收入数据等，判定用户的信用风险等级，评估用户的履约能力；
风险定价：根据用户的负债能力和收入稳定性，判断用户可承担的月供金额，确定用户的放款额度、偿还期限等，并根据用户风险等级确定用户的费率。这三个问题往往是互相影响、互为前提的。举个简单的例子，对一个月收入3000的用户来说，月供在1000左右，用户可能履约良好，信用等级良好；但如果月供提高到4000，严重超出了其收入水平，即便不是有意欺诈，也可能出现断供的情况，从而得到比较差的信用等级。

本节重点阐述携程金融在信用风险建模（A卡）上的演进和一些创新工作。

A卡建模目前包括如下几方面：

确保策略的一致性，尽量减少人工干预，并利用机器学习的优势提升决策效率；
准确反映并量化用户的风险级别，策略人员可以控制和减少风险损失，因此对评分卡等级的排序能力、稳定性要求会比较高。

好坏用户定义：这一点可能是A卡甚至是互金大部分风控模型的最基础最核心的工作。对样本标签的定义，需要与实际业务场景、策略目标相一致，并综合考虑不同定义下的样本量。比如在现金分期场景中，可以画一下用户回款率（或者滚动率）和逾期天数趋势分布曲线，用户逾期N天以后回款率或者滚动率便已经趋于稳定(梯度平稳)，则可以N天以上逾期作为筛选坏样本的依据。在某些场景下，如曾经的Payday Loan，由于整个业务周期只有半月或1个月，为加快模型迭代速度，有时甚至会定义7+甚至1+逾期用户为坏客户。在一些银行场景中，出于坏账计提考虑，可能定义90天以上逾期为坏客户。总之，好坏用户的定义不能纯靠人工经验，应该以场景的数据为基础，进行数据分析之后确定

样本规模与算法演进：携程金融的业务最早开始于2015年，模型进行了多个版本的迭代。下面的表格展示的是拿去花业务中，我们A卡模型的演进。业务初期，样本数据量极少，往往根据相关业务经验确定使用的特征和规则；随着数据的慢慢积累，开始采用部分精细特征，使用简单的机器学习算法训练；当样本数据量积累到百万级以上，我们尝试采用神经网络算法进行特征自动提取或者end-to-end的风控模型训练；从18年上半年开始，我们升级到更加先进的迁移学习体系，未来会持续落地更多的前沿算法。总之，携程金融的风控模型优化的过程，实质是紧随着业务从无到有、从小到大，数据量由少变多，特征由粗到细，模型由简单到复杂，效果由一般到突破的过程。

Fig . 6 携程金融拿去花业务A卡模型演进

模型的评估与监控：模型建立后，需要对模型的预测能力、稳定性进行评估。看模型效果不能只看KS，KS定义是从0-1概率之间好坏样本累计概率最大差值，实际应用中一般不会直接取这个阈值（cutoff）作为策略，因为在这种cutoff下，通过率可能会很低；风控不能不管业务，举个极端的例子，通过调整cutoff，风控几乎可以做到任意想要的逾期率，但这样通过率就很低了，业务规模可能只停留在极少数资质优秀的客户；所以评估模型时，基于风险的评估及基于业务的评估是必须的。因此，模型评估可分为三层：

第一层：机器学习模型评估指标。信用评分模型常用的评估指标为KS、AUC等。考虑到金融业务反馈周期长的特点，除了划分训练集、测试集外，通常会预留一段训练样本覆盖时间段之外的数据集，作为OOT（跨时间）测试集，以测量模型在时间上的稳定性；
第二层：风控层面，比如在不同bucket下，预测概率的排序性能；
第三层：业务层面的拦截率，通过率，逾期表现等。

基于上面的评估分层，我们的监控也做对应的分层监控，除了包含上述三个层面，还对输入到模型中的特征进行监控，比如特征的分布、波动率等。

「风控模型体系之贷前信用风险模型发展历程」

经历过了完全靠经验的规则模型，当积累了一定数据量时，便可以用少量的维度与数据开始训练了，当数据量较少时，使用简单的LR就能达到不错的效果。随着数据量的不断增加，慢慢构建起了身份属性、消费能力、用户关系、信用记录、出行记录等特征，GBDT+LR,RF，XGBOOOST，LightGBM等更复杂的算法便可以派上用场了。当数据达到一定规模时，采用深度学习来进行自动化表征学习或则end-to-end的风控模型学习，我们测试过DNN，这个算法在同等情况下，和GBDT之类的算法性能类似，并没有太明显的效果，一方面说明GBDT这类算法在处理非图像、语音、文本这类局部结构并不是特别明显的数据的优势，另一方面说明，不能直接将CV\NLP领域的算法拿来用，需要做一定的改造和优化，因此我们陆续使用和改造了ResNet、FractalNet等网络结构，相比于DNN和GBDT模型效果有比较明显的提升；再进一步，通过分析风控这个场景，我们发现，通过审批的用户与开放自然流量的数据分布差异比较明显，这一现象，基本打破了我们传统监督学习中训练集和预测集数据分布相似的假设。为解决这个问题，我们引入迁移学习框架，同等逾期条件下，通过率能明显的提升。

「风控模型体系之贷中反欺诈模型」

贷中反欺诈按粒度可分为两类，用户级与交易级。用户级粒度相对粗一些，即断定当前客户为欺诈客户，可能的策略就是不允许欺诈用户在平台上发生交易行为；交易级是较细粒度的，即根据交易上下文、IP、设备、地域判断当前交易是否为欺诈交易，如果是，即不允许客户进行此笔交易。

贷中反欺诈有3个难点：

长尾分布：欺诈用户其实是极少的
对抗性显著：欺诈用户会想办法找出系统及规则的漏洞
模仿正常行为：欺诈用户会利用伪造消费流水，前期正常还款等行为等，让金融公司放松警惕，当提额到一定程度后，便开始逾期。

在反欺诈领域，我们除了使用一般的机器学习模型，也构建了一套基于社交网络的模型体系。

「社交网络在风控模型中的应用」

基于社交网络的反欺诈，基本思想其实很简单，物以类聚，人以群分。比如一个欺诈分子，可能与其有关系（在Graph上表现为有直接的边连接，这种也称之为一阶亲密度；或者通过边的游走能够触达，这种称之为多阶亲密度），那么可能这些与之有关系的用户也是欺诈分子。如图所示，通过梳理携程生态内关键实体、关系，我们首先构建了一个庞大的异构社交网络，该网络包含10亿级别的顶点，50亿级别的边。接下来是通过算法，发现社区(Community)。由于社交网络的数据量相对来讲是比较大的，因此在算法层面，对运算效率要求也是比较高的，同时对于社区划分的稳定性有一定要求。在实际落地中采用LPA、改进的Louvain，实现T+1的社区发现。最后基于划分的社区，可以获得社区的各种属性统计，这个作为反欺诈策略的重要参考。当有一个用户到来的时候，看其属于哪个社区，根据改社区的属性确定该用户是否为欺诈用户。

目前在携程金融的实际应用中，基于社交网络的风控指标已经覆盖了贷中80%的贷款请求，同时通过社交网络，挖掘关系人一度或者多度关系，对严重的逾期行为，通过多度关系进行催收，提升回催率。

Fig . 12 携程金融关系网络

Fig . 13 社交网络应用的基本流程

内容来源: DataFun AI+ Talk
出品社区: DataFun

【新品发售】NVIDIA 发布全球最小个人 AI 超级计算机 DGX Spark segmentfault
GTC2025大会上，NVIDIA正式推出了搭载NVIDIAGraceBlackwell平台的个人AI超级计算机——DGXSpark。赞奇可接受预订，直接私信后台即刻预订！DGXSpark(前身为ProjectDIGITS)支持AI开发者、研究人员、数据科学家和学生，在台式电脑上对大模型进行原型设计、微调和推理。用户可以在本地运行这些模型，或将其部署在NVIDIADGXCloud或任何其他加速云或
如何用大模型评估大模型——PAI-Judge裁判员大语言模型的实现简介人工智能机器学习大模型llm
背景：为什么需要一个「裁判员大语言模型」？随着大模型（LLM）技术的爆发式应用，如何快速、客观评估模型回复质量成为行业痛点。对于回答客观问题的LLM，目前业内已经有比较成熟的数据集进行效果评测与模型打榜。但是如何对一个开放式生成LLM进行效果评估，尤其在知识问答、客服对话、内容合规、RAG（检索增强生成）等场景中，目前主流的评测方式仍存在一定的局限性：人工标注：成本高昂、效率低下；传统的自动化评估
13 异常处理的使用大全希望_睿智 C++基础知识精讲 c++windows c语言开发语言异常处理
概述异常是指程序在执行的过程中，没有按照预定的流程和逻辑去运行，从而导致数组越界、内存溢出、甚至程序崩溃等各种非正常的情况。在C++、Java和C#等高级语言中，都提供了对于异常的处理机制。异常处理，实际上是一种转移程序控制权的方式。当程序中抛出了异常时，我们可以捕获异常，进而进行相应的处理。处理模型一般有两种：一种是终止模型，表示该异常是致命的，无法恢复，会直接终止程序；另一种是恢复模型，表示该
Pydantic配置继承抽象基类模式
title:Pydantic配置继承抽象基类模式date:2025/3/21updated:2025/3/21author:cmdragonexcerpt:Pydantic模型配置系统支持通过嵌套Config类定义字段校验、序列化等行为。配置继承需显式指定父类Config，子类可覆盖或扩展配置项。动态配置管理允许运行时通过工厂函数创建带特定设置的模型，支持热更新验证规则。企业级架构中采用基类配置继
《深度剖析：BERT与GPT——自然语言处理架构的璀璨双星》人工智能深度学习
在自然语言处理（NLP）的广袤星空中，BERT（BidirectionalEncoderRepresentationsfromTransformers）与GPT（GenerativePretrainedTransformer）系列模型宛如两颗最为耀眼的星辰，引领着NLP技术不断迈向新的高度。它们基于独特的架构设计，以强大的语言理解与生成能力，彻底革新了NLP的研究与应用范式，成为学界和业界竞相探索
【FAQ】HarmonyOS SDK 闭源开放能力 —Push Kit（10）
1.问题描述：离线推送，锁屏的时候没有弹出消息，只有下拉在通知中心里面显示。请问是否是正常的？解决方案：检查一下是否存在图片风控：https://developer.huawei.com/consumer/cn/doc/harmonyos-refere...2.问题描述：1.请问纯鸿蒙系统的远程推送，自分配如何配置？2、纯鸿蒙系统的远程推送，有没有高透传？3、Android华为推送如果切到鸿蒙推送
SM系列密码算法在网络空间安全中的体系化应用研究安全
一、算法架构与技术特性解析1.1SM2椭圆曲线公钥算法基于Fp-256r1椭圆曲线构建，采用Weierstrass方程形式：y²≡x³+ax+b(modp)，其核心安全参数满足：素数模p：256位大素数基域Fp上椭圆曲线阶n满足n>2^191抗MOV约化攻击特性支持高效标量乘运算优化密钥协商协议采用改进的ECMQV机制，通过两步验证实现前向安全性，计算流程包含：临时密钥对生成：(d_A,P_A)←
密码学协议在SSL/TLS证书体系中的深度解析安全
摘要：本文从密码学协议演进视角，系统剖析SSL/TLS证书体系的实现机理与安全边界。聚焦TLS1.3协议标准，揭示椭圆曲线密码体制(ECC)与混合密钥交换机制的协同运作，探讨证书透明度(CT)系统的密码学验证模型，并构建后量子时代数字证书的迁移路径框架。一、SSL/TLS协议栈的密码学架构演进X.509证书的密码学基因由PKI体系决定，其信任锚点植根于CA机构的数字签名算法选择。TLS1.3协议废
基于MATLAB路径规划仿真轨迹规划，船舶轨迹跟踪控制，数学模 985计算机硕士仿真模型 matlab 开发语言
MATLAB路径规划仿真轨迹规划，船舶轨迹跟踪控制，数学模MATLAB路径规划仿真轨迹规划，船舶轨迹跟踪控制，数学模型基于两轮差速的小车模型，用PID环节对航向角进行控制，迫使小车走向目标，或用PID环节对航向角和距离进行控制，迫使小车走向目标LQR算法可自行小车起点坐标文章目录初始化环境定义PID控制函数运行仿真代码说明：代码示例代码说明：为了实现基于两轮差速模型的小车在MATLAB中的路径规划
基于Matlab_simulink仿真相关控制算法、优化算法相关帮助代做，原理讲解 985计算机硕士仿真模型 matlab 算法开发语言
Matlab/simulink仿真相关控制算法、优化算法相关帮助代做，原理讲解：1.优化算法相关：蚁群优化算法，遗传优化算法等2.控制器相关：ADRC控制，鲁棒控制，神经网络控制，MPC等3.神经网络相关：BP神经网络，RBF神经网络，LSTM神经网络等文章目录1.优化算法相关蚁群优化算法（ACO）2.控制器相关ADRC控制3.神经网络相关BP神经网络1.构建光伏系统模型1.1光伏电池模型1.2控
u-net系列算法㡽闧㔯人工智能算法
语义分割M整体结构：M概述就是编码解码过程简单但是很实用，应用广起初是做医学方向，现在也是U-net主要网络结构：还引入了特征拼接操作M以前我们都是加法，现在全都要这么简单的结构就能把分割任务做好U-net++整体网络结构：特征融合，拼接更全面其实跟densenet思想一致把能拼能凑的特征全用上就是升级版了U-net++DeepSupervision：也是很常见的事，多输出损失由多个位置计算，再更
RabbitMQ 与 Kafka：消息中间件的终极对比与选型指南海上彼尚 node.js rabbitmq kafka 分布式 node.js
引言在分布式系统架构中，消息中间件是异步通信的核心组件。RabbitMQ和Kafka作为两大主流技术，常被开发者拿来比较。本文深入解析两者的设计哲学、性能差异和典型场景，助你做出精准技术选型。目录引言一、核心设计差异1.定位与数据模型二、性能与架构对比1.吞吐量与延迟2.集群与扩展三、功能特性对决1.消息可靠性2.消息路由四、典型场景与选型决策1.优先选择Kafka的场景2.优先选择RabbitM
基于FPGA的DDS连续FFT 仿真验证 toonyhe FPGA开发 fpga开发 DDS FFT IFFT
基于FPGA的DDS连续FFT仿真验证1摘要本文聚焦AMDLogiCOREIPFastFourierTransform(FFT)核心，深入剖析其在FPGA设计中的应用。该FFT核心基于Cooley-Tukey算法，具备丰富特性，如支持多种数据精度、算术类型及灵活的运行时配置。文中详细介绍了其架构选项、端口设计、理论运算原理，以及在不同场景下的动态范围特性。同时，结合VivadoDesignSuit
Marker可以快速且准确地将PDF转换为markdown格式。星霜笔记开源关注简介免费源码 pdf
MarkerMarker可以快速且准确地将PDF转换为markdown格式。支持多种文档类型（针对书籍和科学论文进行了优化）支持所有语言移除页眉/页脚/其他杂质格式化表格和代码块提取并保存图像以及markdown将大多数方程转换为latex支持在GPU、CPU或MPS上运行工作原理Marker是一个由深度学习模型组成的管道：提取文本，必要时进行OCR处理（启发式算法，surya，tesseract
没有好的学历，Java开发未来的路应该怎么走？全干程序员demo 技术热文 java 开发语言
没有好的学历，Java开发未来的路应该怎么走？在当今数字化时代，技术发展日新月异，大模型应用、鸿蒙系统等新兴技术领域正在蓬勃发展，为Java开发者带来了新的机遇和挑战。即使没有高学历，Java开发者依然可以通过以下路径在这些新兴领域找到自己的发展方向，实现职业突破。一、拥抱新兴技术，拓宽技术边界（一）大模型应用：从开发到优化大模型技术正在重塑软件开发的各个环节。对于Java开发者来说，可以从以下几
DeepSeek带来服务器与显卡需求激增的核心逻辑 DeepSeek+NAS 人工智能服务器运维网络安全计算机网络
随着DeepSeek等开源AI模型的普及，个人开发者和小型企业正加速构建私有化AI服务器，以处理敏感数据和定制化任务。这种趋势不仅重构了算力需求的结构，更推动服务器和显卡市场进入新一轮增长周期。以下从技术迭代、行业需求、市场格局三个维度展开论述。一、私有化部署：从数据安全到算力自主的核心驱动力数据隐私与合规性需求公共AI平台的数据泄露风险促使企业选择本地化部署。例如，医疗机构的患者数据、金融企业的
Hugging Face预训练GPT微调ChatGPT（微调入门！新手友好！） y江江江江机器学习大模型 gpt chatgpt
HuggingFace预训练GPT微调ChatGPT（微调入门！新手友好！）在实战中，⼤多数情况下都不需要从0开始训练模型，⽽是使⽤“⼤⼚”或者其他研究者开源的已经训练好的⼤模型。在各种⼤模型开源库中，最具代表性的就是HuggingFace。HuggingFace是⼀家专注于NLP领域的AI公司，开发了⼀个名为Transformers的开源库，该开源库拥有许多预训练后的深度学习模型，如BERT、G
cherry-studio - 多模型支持的跨平台 AI 桌面助手小众AI AI开源人工智能 AI编程
GitHub：https://github.com/CherryHQ/cherry-studio更多AI开源软件：发现分享好用的AI工具、AI开源软件、AI模型、AI变现-小众AI一款支持多种大语言模型服务的跨平台桌面客户端，兼容Windows、Linux和macOS系统。它支持主流云端模型（如OpenAI、Anthropic等）以及本地模型（如Ollama、LMStudio），能够满足文本生成、
Open-Sora - 为所有人实现高效的视频制作大众化小众AI AI开源音视频人工智能 AI编程
GitHub：https://github.com/hpcaitech/Open-Sora更多AI开源软件：发现分享好用的AI工具、AI开源软件、AI模型、AI变现-小众AI这是一款开源的SOTA（State-of-the-Art）视频生成模型，仅用20万美元（224张GPU）就能训练出商业级11B参数的视频生成大模型。它采用Python语言和PyTorch深度学习框架开发，具有生成速度快、资源消
OWL - 优化劳动力学习的通用智能体小众AI AI开源学习人工智能 AI编程
GitHub：https://github.com/camel-ai/owl更多AI开源软件：发现分享好用的AI工具、AI开源软件、AI模型、AI变现-小众AIOWL是一个前沿的多智能体协作框架，推动任务自动化的边界，构建在CAMEL-AIFramework。愿景是彻底变革AI智能体协作解决现实任务的方式。通过利用动态智能体交互，OWL实现了跨多领域更自然、高效且稳健的任务自动化。OWL在GAIA
什么是MCP？看不懂你打我 X.Cristiano 深度学习 MCP
什么是MCP？MCP是一种协议，它实现了大模型资源调用的标准化。千百年来，随着人类社会的发展，标准化的进程不断推进。大模型与外部资源的对接同样需要标准化，MCP正是为此而生！接下来的文字，或许，将帮助你奶奶明白MCP对于她意味着什么。2011年，微信发布。想象一下，你奶奶刚开始用微信。那时，还没有小程序。她的体验或许是这样的：第一个月，她惊喜地发现微信能订电影票了！再过一个月，她发现微信又能约出租
算法基础——蓝桥杯（python实现，实际上大多数用c++更明白易懂）（第一部分，共12个小题） New_Teen 算法蓝桥杯 python
1.成绩统计问题描述:编写一个程序，建立一个字典，每个字典包含姓名、学号、英语成绩、数学成绩和C++成绩，并通过字典操作平均分最高的学生和平均分最低的学生并且输出。输入格式：输入n+1行，第一行输入一个正整数n，表示学生数量；接下来的n行每行输入5个数据，分别表示姓名、学号、英语成绩、数学成绩和C++成绩。注意成绩有可能会有小数。输出格式：输出两行，第一行输出平均成绩最高的学生姓名。第二行输出平均
【AI大模型应用开发】RAG-Fusion框架：忘掉 RAG，未来是 RAG-Fusion 同学小张大模型人工智能笔记 chatgpt agi embedding RAG prompt
大家好，我是同学小张，+v:jasper_8017一起交流，持续学习C++进阶、OpenGL、WebGL知识和AI大模型应用实战案例，持续分享，欢迎大家点赞+关注，共同学习和进步。RAG目前很火，但是也有一些不足的地方。有不足就有改进方法。本文我们来看一个方法：RAG-Fusion，理解其原理，并看一下其实现源码。文章目录0.RAG的不足1.RAG-Fusion原理概述2.步骤拆解与代码示例2.1
网络编程--服务器双客户端聊天疾跑哥布林升级版 java 算法开发语言
写一个服务器和客户端运行服务器和2个客户端，实现聊天功能客户端1和客户端2进行聊天，客户端1将聊天数据发送给服务器，服务器将聊天数据转发给客户端2要求：服务器使用select模型实现，客户端1使用poll模型实现，客户端2使用多线程实现服务器：#include//将client存入数组arr中的最后一个位置上，存完之后，arr数组的长度记得自增voidinsert_client(intarr[],
【C++】动态规划从入门到精通諰. 动态规划 c++
一、动态规划基础概念详解什么是动态规划动态规划（DynamicProgramming，DP）是一种通过将复杂问题分解为重叠子问题，并存储子问题解以避免重复计算的优化算法。它适用于具有以下两个关键性质的问题：最优子结构：问题的最优解包含子问题的最优解重叠子问题：不同决策序列会重复求解相同的子问题下面用一些例子（由浅入深）了解动态规划1.1斐波那契数列递归实现解析intfib(intn){if(n>d
rag-给一篇几百页的pdf，如何从中找到关键信息并汇总出关系图蒸土豆的技术细节人工智能
小思考对pdf肯定要做模糊chunk，能用模型切分就用模型切分，不能用模型就用规则，规则要尽可能保存连续文本，特殊数据格式（图、表格）必须完整保存，必须能被捕捉到。这些独立的表格or图数据，也要单独做embedding，以其中的title和行列title信息作embedding材料。也不能忘了传统搜索方法，基于搜索的、基于传统词频的、基于关键字的。。。假设已经找到了信息所在的目标，如果它是个表格，
AI赋能视频创作：蓝耘MaaS与海螺AI技术的深度融合云边有个稻草人热门文章人工智能音视频图片生成视频蓝耘智算蓝耘MaaS平台体验海螺AI 高效视频渲染和优化
云边有个稻草人-CSDN博客目录一、蓝耘MaaS平台概述（1）平台的模块化设计（2）蓝耘MaaS的灵活性与扩展性（3）蓝耘MaaS的安全性与隐私保护二、海螺AI视频模型简介（1）海螺AI的核心技术（2）海螺AI的视频生成流程（3）海螺AI的应用场景三、在蓝耘Maas平台如何使用海螺AI生成视频（1）注册蓝耘平台账号（2）点击MaaS平台（3）点击视觉模型并选择l2V-01视频模型（4）体验图片生成
机器学习课堂4线性回归模型+特征缩放木尘152132 机器学习线性回归 python
一、实验2-2，线性回归模型，计算模型在训练数据集和测试数据集上的均方根误差代码：#2-2线性回归模型importpandasaspdimportnumpyasnpimportmatplotlib.pyplotasplt#参数设置iterations=3000#迭代次数learning_rate=0.0001#学习率m_train=3000#训练样本的数量flag_plot_lines=False
【存储中间件】Redis核心技术与实战（六）：Redis的设计与实现（缓存淘汰算法、过期策略与惰性删除）道友老李 #Redis核心技术与实战架构师进阶-存储中间件缓存中间件 redis
文章目录Redis的设计与实现缓存淘汰算法maxmemoryNoevictionvolatile-lruvolatile-ttlvolatile-randomallkeys-lruallkeys-randomLRU算法近似LRU算法LFU算法为什么Redis要缓存系统时间戳过期策略和惰性删除过期惰性删除lazyfree个人主页：道友老李欢迎加入社区：道友老李的学习社区Redis的设计与实现缓存淘汰
风控算法（一）——数据测试月亮月亮要去太阳机器学习人工智能
下面的内容都是针对数据源测试的一些可能得问题：1、请描述你在开发和执行数据测试流程时的具体步骤。确定样本（对齐样本与时间，去除假样本）——确定特征（确认目前特征）——数据信息（返回的数据字典、收费方式、底层数据：特征、分数）——数据清洗（缺失值替换）——数据训练形成报告。2、如何确定数据产品在风险模型中的潜在价值和适用性的？AUC、IV、相关性、性价比、数据产品背景和领域3、请详细描述你负责的10
Enum用法不懂事的小屁孩 enum
以前的时候知道enum，但是真心不怎么用，在实际开发中，经常会用到以下代码: protected final static String XJ = "XJ"; protected final static String YHK = "YHK"; protected final static String PQ = "PQ";
【Spark九十七】RDD API之aggregateByKey bit1129 spark
1. aggregateByKey的运行机制 /** * Aggregate the values of each key, using given combine functions and a neutral "zero value". * This function can return a different result type
hive创建表是报错： Specified key was too long; max key length is 767 bytes daizj hive
今天在hive客户端创建表时报错，具体操作如下 hive> create table test2(id string); FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask. MetaException(message:javax.jdo.JDODataSto
Map 与 JavaBean之间的转换周凡杨 java 自省转换反射
最近项目里需要一个工具类，它的功能是传入一个Map后可以返回一个JavaBean对象。很喜欢写这样的Java服务，首先我想到的是要通过Java 的反射去实现匿名类的方法调用，这样才可以把Map里的值set 到JavaBean里。其实这里用Java的自省会更方便，下面两个方法就是一个通过反射，一个通过自省来实现本功能。 1：JavaBean类 1 &nb
java连接ftp下载 g21121 java
有的时候需要用到java连接ftp服务器下载，上传一些操作，下面写了一个小例子。 /** ftp服务器地址 */ private String ftpHost; /** ftp服务器用户名 */ private String ftpName; /** ftp服务器密码 */ private String ftpPass; /** ftp根目录 */ private String f
web报表工具FineReport使用中遇到的常见报错及解决办法（二）老A不折腾 finereport web报表 java报表总结
抛砖引玉，希望大家能把自己整理的问题及解决方法晾出来，Mark一下，利人利己。出现问题先搜一下文档上有没有，再看看度娘有没有，再看看论坛有没有。有报错要看日志。下面简单罗列下常见的问题，大多文档上都有提到的。 1、没有返回数据集：在存储过程中的操作语句之前加上set nocount on 或者在数据集exec调用存储过程的前面加上这句。当S
linux 系统cpu 内存等信息查看墙头上一根草 cpu 内存 liunx
1 查看CPU 　　1.1 查看CPU个数　　# cat /proc/cpuinfo | grep "physical id" | uniq | wc -l 　　2 　　**uniq命令：删除重复行;wc –l命令：统计行数** 　　1.2 查看CPU核数　　# cat /proc/cpuinfo | grep "cpu cores" | u
Spring中的AOP aijuans spring AOP
Spring中的AOP Written by Tony Jiang @ 2012-1-18 （转）何为AOP AOP，面向切面编程。在不改动代码的前提下，灵活的在现有代码的执行顺序前后，添加进新规机能。来一个简单的Sample: 目标类： [java] view plain copy print ? package&nb
placeholder(HTML 5) IE 兼容插件 alxw4616 JavaScript jquery jQuery插件
placeholder 这个属性被越来越频繁的使用. 但为做HTML 5 特性IE没能实现这东西. 以下的jQuery插件就是用来在IE上实现该属性的. /** * [placeholder(HTML 5) IE 实现.IE9以下通过测试.] * v 1.0 by oTwo 2014年7月31日 11:45:29 */ $.fn.placeholder = function
Object类,值域,泛型等总结(适合有基础的人看) 百合不是茶泛型的继承和通配符变量的值域 Object类转换
java的作用域在编程的时候经常会遇到,而我经常会搞不清楚这个问题,所以在家的这几天回忆一下过去不知道的每个小知识点变量的值域; package 基础; /** * 作用域的范围 * * @author Administrator * */ public class zuoyongyu { public static vo
JDK1.5 Condition接口 bijian1013 java thread Condition java多线程
Condition 将 Object 监视器方法（wait、notify和 notifyAll）分解成截然不同的对象，以便通过将这些对象与任意 Lock 实现组合使用，为每个对象提供多个等待 set （wait-set）。其中，Lock 替代了 synchronized 方法和语句的使用，Condition 替代了 Object 监视器方法的使用。条件（也称为条件队列或条件变量）为线程提供了一
开源中国OSC源创会记录 bijian1013 hadoop spark MemSQL
一.Strata+Hadoop World（SHW）大会是全世界最大的大数据大会之一。SHW大会为各种技术提供了深度交流的机会，还会看到最领先的大数据技术、最广泛的应用场景、最有趣的用例教学以及最全面的大数据行业和趋势探讨。二.Hadoop &nbs
【Java范型七】范型消除 bit1129 java
范型是Java1.5引入的语言特性，它是编译时的一个语法现象，也就是说，对于一个类，不管是范型类还是非范型类，编译得到的字节码是一样的，差别仅在于通过范型这种语法来进行编译时的类型检查，在运行时是没有范型或者类型参数这个说法的。范型跟反射刚好相反，反射是一种运行时行为，所以编译时不能访问的变量或者方法(比如private)，在运行时通过反射是可以访问的，也就是说，可见性也是一种编译时的行为，在
【Spark九十四】spark-sql工具的使用 bit1129 spark
spark-sql是Spark bin目录下的一个可执行脚本，它的目的是通过这个脚本执行Hive的命令，即原来通过 hive>输入的指令可以通过spark-sql>输入的指令来完成。 spark-sql可以使用内置的Hive metadata-store，也可以使用已经独立安装的Hive的metadata store 关于Hive build into Spark
js做的各种倒计时 ronin47 js 倒计时
第一种：精确到秒的javascript倒计时代码 HTML代码: <form name="form1"> <div align="center" align="middle"
java-37.有n 个长为m+1 的字符串，如果某个字符串的最后m 个字符与某个字符串的前m 个字符匹配，则两个字符串可以联接 bylijinnan java
public class MaxCatenate { /* * Q.37 有n 个长为m+1 的字符串，如果某个字符串的最后m 个字符与某个字符串的前m 个字符匹配，则两个字符串可以联接， * 问这n 个字符串最多可以连成一个多长的字符串，如果出现循环，则返回错误。 */ public static void main(String[] args){
mongoDB安装开窍的石头 mongodb安装基本操作
mongoDB的安装 1:mongoDB下载 https://www.mongodb.org/downloads 2:下载mongoDB下载后解压
[开源项目]引擎的关键意义 comsci 开源项目
一个系统，最核心的东西就是引擎。。。。。而要设计和制造出引擎，最关键的是要坚持。。。。。。现在最先进的引擎技术，也是从莱特兄弟那里出现的，但是中间一直没有断过研发的
软件度量的一些方法 cuiyadll 方法
软件度量的一些方法http://cuiyingfeng.blog.51cto.com/43841/6775/在前面我们已介绍了组成软件度量的几个方面。在这里我们将先给出关于这几个方面的一个纲要介绍。在后面我们还会作进一步具体的阐述。当我们不从高层次的概念级来看软件度量及其目标的时候，我们很容易把这些活动看成是不同而且毫不相干的。我们现在希望表明他们是怎样恰如其分地嵌入我们的框架的。也就是我们度量的
XSD中的targetNameSpace解释 darrenzhu xml namespace xsd targetnamespace
参考链接: http://blog.csdn.net/colin1014/article/details/357694 xsd文件中定义了一个targetNameSpace后，其内部定义的元素，属性，类型等都属于该targetNameSpace,其自身或外部xsd文件使用这些元素，属性等都必须从定义的targetNameSpace中找：例如：以下xsd文件，就出现了该错误，即便是在一
什么是RAID0、RAID1、RAID0+1、RAID5，等磁盘阵列模式? dcj3sjt126com raid
RAID 1又称为Mirror或Mirroring，它的宗旨是最大限度的保证用户数据的可用性和可修复性。 RAID 1的操作方式是把用户写入硬盘的数据百分之百地自动复制到另外一个硬盘上。由于对存储的数据进行百分之百的备份，在所有RAID级别中，RAID 1提供最高的数据安全保障。同样，由于数据的百分之百备份，备份数据占了总存储空间的一半，因而，Mirror的磁盘空间利用率低，存储成本高。 Mir
yii2 restful web服务快速入门 dcj3sjt126com PHP yii2
快速入门 Yii 提供了一整套用来简化实现 RESTful 风格的 Web Service 服务的 API。特别是，Yii 支持以下关于 RESTful 风格的 API：支持 Active Record 类的通用API的快速原型涉及的响应格式（在默认情况下支持 JSON 和 XML) 支持可选输出字段的定制对象序列化适当的格式的数据采集和验证错误
MongoDB查询(3)——内嵌文档查询（七） eksliang MongoDB查询内嵌文档 MongoDB查询内嵌数组
MongoDB查询内嵌文档转载请出自出处：http://eksliang.iteye.com/blog/2177301 一、概述有两种方法可以查询内嵌文档：查询整个文档；针对键值对进行查询。这两种方式是不同的，下面我通过例子进行分别说明。二、查询整个文档例如:有如下文档 db.emp.insert({ &qu
android4.4从系统图库无法加载图片的问题 gundumw100 android
典型的使用场景就是要设置一个头像，头像需要从系统图库或者拍照获得，在android4.4之前，我用的代码没问题，但是今天使用android4.4的时候突然发现不灵了。baidu了一圈，终于解决了。下面是解决方案： private String[] items = new String[] { "图库","拍照" }; /* 头像名称 */
网页特效大全 jQuery等 ini JavaScript jquery css html5 ini
HTML5和CSS3知识和特效 asp.net ajax jquery实例分享一个下雪的特效 jQuery倾斜的动画导航菜单选美大赛示例你会选谁 jQuery实现HTML5时钟功能强大的滚动播放插件JQ-Slide 万圣节快乐！！！向上弹出菜单jQuery插件 htm5视差动画 jquery将列表倒转顺序推荐一个jQuery分页插件 jquery animate
swift objc_setAssociatedObject block(version1.2 xcode6.4) 啸笑天 version
import UIKit class LSObjectWrapper: NSObject { let value: ((barButton: UIButton?) -> Void)? init(value: (barButton: UIButton?) -> Void) { self.value = value
Aegis 默认的 Xfire 绑定方式，将 XML 映射为 POJO MagicMa_007 java POJO xml Aegis xfire
Aegis 是一个默认的 Xfire 绑定方式，它将 XML 映射为 POJO, 支持代码先行的开发.你开发服务类与 POJO,它为你生成 XML schema/wsdl XML 和注解映射概览默认情况下，你的 POJO 类被是基于他们的名字与命名空间被序列化。如果
js get max value in (json) Array qiaolevip 每天进步一点点学习永无止境 max 纵观千象
// Max value in Array var arr = [1,2,3,5,3,2];Math.max.apply(null, arr); // 5 // Max value in Jaon Array var arr = [{"x":"8/11/2009","y":0.026572007},{"x"
XMLhttpRequest 请求 XML,JSON ,POJO 数据 Luob. POJO json Ajax xml XMLhttpREquest
在使用XMlhttpRequest对象发送请求和响应之前，必须首先使用javaScript对象创建一个XMLHttpRquest对象。 var xmlhttp； function getXMLHttpRequest(){ if(window.ActiveXObject){ xmlhttp:new ActiveXObject("Microsoft.XMLHTTP
jquery wuai jquery
以下防止文档在完全加载之前运行Jquery代码，否则会出现试图隐藏一个不存在的元素、获得未完全加载的图像的大小等等 $(document).ready(function(){ jquery代码; }); <script type="text/javascript" src="c:/scripts/jquery-1.4.2.min.js&quo