本文分上、下两篇,介绍各种风控与反欺诈相关的数据来源,包括其主要的数据维度和产品服务形态。上篇回顾:吐血整合!风控与反欺诈相关数据来源(上)
目录:
人行二代征信
持牌征信机构数据
司法大数据
航旅大数据
铁路大数据
税务大数据
交通大数据
电力大数据
保险大数据
人社大数据
航天信息股份有限公司(简称“航天信息”)成立于2000年11月1日,是中国航天科工集团有限公司控股、以信息安全为核心的国有科技型上市公司。2003年7月11日,在A股主板市场挂牌上市。
航天信息基于17年的税务数据沉淀,在2016年布局企业征信成立了爱信诺征信,是旗下企业信用评级、企业信用报告、同业合作及数据合作业务的主要对外出口。
航天信息主要提供的是税务及发票相关的数据,其中包含的发票相关数据维度有:
基础通用信息:包括发票代码、发票种类代码、发票号码、开票类型、开票日期、合计金额、合计税额、价税合计金额、代开标志、代开单位、清单标志。
红字发票信息:包括原发票代码、原发票号码、冲红原因。
销售方信息:包括销售方识别号、销售方名称、销售方电话、销售方地址、开户银行名称、开户银行账户。
购买方信息:包括购买方类型、购买方识别号、购买方名称、购买方电话、购买方地址、开户银行名称、开户银行账户。
开票项目信息:包括商品行性质、项目名称、规格型号、计量单位、含税标志、数量、单价、金额、税目、税率、税额,商品编码、优惠政策标识、优惠说明、零税率标识、扣除额。
安全信息:包括二维码、校验码、开票方电子签名、防伪密文。
发票状态标志信息:包括入账状态、冲红状态。
附加信息:包括开票人、收款人、复核人、查验URL。
发票关联信息:包括订单号、支付流水号、支付方式、支付平台名称、支付平台编码、物流运单号、物流平台名称、物流平台编码、发票开具服务平台名称、发票开具服务平台编码。
其主要的产品服务包括爱信融、企业金融信用报告、爱信诺企业服务平台、财税咨询等。
1.高速卡口:数据宝
贵州数据宝网络科技有限公司(简称:数据宝)是国内领先的数据要素市场化服务商,致力为国有数据资源方提供数据治理智能化、建模加工产品化、场景应用商品化、流通交易合规化等数据要素市场化全生命周期管理服务。
数据宝是国内少数同时具备“国资参股、政府监管扶持、市场化运作、大数据资产交易合法经营资质”的大数据“国家队”,同时也是国内少有的多源合规数据源授权运营服务机构,成立至今已连接超过50家部委、央企/国企数据、包括公安部、运营商、银联、工信部及交通运输部等。
2019年,数据宝通过与交通运输部合作,推动了高速大数据的开放共享,在保障国有数据安全的前提下,实现交通数据的安全流通和合法合规应用。交通运输部汇集了全国29个省级行政区(目前不包括西藏、海南、台湾、香港、澳门)、2亿台车、12000个高速出入口站点、25000多个ETC门架的数百亿级数据。
交通运输部高速卡口包含五大系统:
1)治超系统
2)支付系统
3)ETC门架系统
4)称重系统
5)OCR系统
高速卡口的各系统汇总数据又主要分为入口、出口及门架三大节点进行数据采集。
数据宝交通数据系列产品API已有数百种,细分的产品模块也有约数十种,包含全国车辆配置查验、货车行驶行为风险评估、货车车险风控评分模型、乘用车风险综合评估、物流金融解决方案等。
2.北斗卫星:中交兴路
全国道路货运车辆公共监管与服务平台(简称“货运平台”),由交通运输部、公安部、应急管理部推出,是12吨以上重载货车的国家级监管平台。中交兴路是货运平台的建设和运营单位,也是货运平台内北斗卫星相关数据的商业化企业。
中交兴路运营的货运平台的主要数据维度可以分为静态数据和动态数据,静态数据包含车辆基础信息、行驶证、运输许可证、车主信息、企业信息等,动态数据包含位置、方向、速度、运单信息等。
中交兴路的数据产品主要包括位置类信息产品、货车入网、车主真实性、套牌车、道路运输证等验证产品,以及企业运力、车辆运力、车辆信息等API查询产品,这里介绍两个在金融行业相对常用的:
车辆最新位置查询:根据输入的车牌号或车架号查询车辆的最新定位信息(当前具体位置、经纬度、当前速度、方向等),支持查询多车。
车辆轨迹查询:根据输入的车牌号或车架号查询车辆指定时间段内的轨迹信息(经纬度、GPS速度、时间、行驶里程数、海拔等)。
电力大数据的两个主要来源是国家电网和南方电网,二者除了覆盖城市不同外数据维度基本一致。
电力数据包括用电客户档案信息、电量信息、电费信息、业扩报装信息、用电检查信息等多种维度的数据,能够很好地反映企业生产经营的真实状况,蕴含巨大风控价值。
其主要的产品服务形态包括:
贷前——反欺诈:企业反欺诈模型是通过对企业的用电量、电费以及违约信息进行分析,通过与行业对应值进行对比来计算各项指标的信用得分,并综合输出加权总得分,来判断企业在用电行为上的欺诈可能性。数据验证维度包括:开工验证、停电反馈度、用电量差异度、用电量波动、电费缴纳水平、用电量增长率、违约用电等。
贷中——辅助授信:辅助授信模型着力于帮助金融机构解决贷款发放前的信息不对称问题,对还款积极性差、还款能力弱的高风险企业预先进行电力信用评价及筛查。模型涵盖数据维度包括:基础用电信息、用电量差异度、用电量波动、电量趋势水平、电费缴纳水平、违约用电等。
贷后——风险预警:贷后风险预警模型主要基于企业用电数据,构建五大类十八小类量化指标,通过时间序列、聚类、回归等分析算法,实行对企业各项指标的时间序列及行业水平比较,客观反映企业在贷后产生的生产经营异动,提前揭示企业运营风险。五大类风险维度包括:容量状态、用电水平、电费缴纳水平、违约用电、停电分析。
中国银行保险信息技术管理有限公司(简称“中国银保信”)成立于2013年7月,是经国务院批准,由中国银行保险监督管理委员会直接管理的金融基础设施运营管理单位。中国银保信主要负责建设和运营全国统一的银行业、保险业信息共享系统,提供交易支持、数据治理、风险管理、科技支撑和登记、验证、精算、咨询等服务。
中国银保信的车险数据维度涵盖保单主题和理赔主题,保单主题数据维度包括保单标的关系人信息、车险保单信息、车险保单标的责任信息、车险标的信息、车险代收车船税信息及车险批单。理赔主题数据维度包括车险查勘信息、车险立案信息、车险赔案信息、车险赔款计算书、车险车辆损失信息、车险财产损失信息、车险人员伤亡信息、车险追偿信息。
其主要的车辆贷款反欺诈产品服务形态包括:
风险信息监控:被保险人生存状态验证、车险反欺诈高风险人员名单、最高法失信被执行人数据验证、车辆历史拒赔情况、车辆反欺诈高风险车辆名单。
保单信息监控:车险保单中车辆基本信息、车险保单中承保险种信息、车险保单中人员基本信息、车险保单中人员变动信息。
理赔事故监控:统计指标监控、融合指标监控。
金保信社保卡科技有限公司(以下简称“金保信”)成立于2018年11月,是由人社部授权北京惟望科技发展企业作为政府方代表,会同社会资本以PPP方式联合组建的、提供以全国社保卡线上身份认证与支付结算平台服务为核心业务的互联网科技公司。
社保大数据包括:社会保障数据,如养老保险、失业保险、工伤保险、领取待遇情况、社保注销情况;人力资源数据,如劳动者基本信息、失业登记信息、就业登记信息、用人单位情况、高校生毕业情况。社保大数据可用的数据字段将近700,核心的数据维度包括基本信息、社保类型(缴存)、缴存记录、医疗保险结算记录等。
其主要的产品服务形态包括:
个人信用评价服务:基于社保十大维度(缴费单位信息、职工缴费信息、离退休信息、死亡信息、供养亲属、冒领信息、转移信息、参保地区信息、事业信息、工伤信息)数据,分析加工形成120多个有效特征,采用逻辑回归算法模型计算得出评分,评价自然人的还款能力和工作稳定性。
个人信息核验:包括个人基本信息核验、缴费城市核验、社保状态注销核验、个人缴费状态核验、实际缴费月数核验、城镇职工缴费基数/城乡居民档次核验。
本文内容整合自李可顺老师《金融数据风控:数据合规与应用逻辑》、各企业官方网站信息以及互联网公开资料。