FinTecher

从中国农业银行“雅典娜杯”数据挖掘大赛看金融行业数据分析与建模方法

【说在前面】本人博客新手一枚，象牙塔的老白，职业场的小白。以下内容仅为个人见解，欢迎批评指正，不喜勿喷！[握手][握手]
【再啰嗦一下】如果你对数据挖掘感兴趣，欢迎先浏览我的另一篇随笔：数据挖掘比赛/项目全流程介绍
【再啰嗦一下】如果你对金融科技感兴趣，欢迎浏览我的另一篇随笔：如果你想了解金融科技，不妨先了解金融科技有哪些可能？
【最后再说一下】本文结合了博主、内部赛优秀团队以及外部赛冠/亚/季军的方案分享！

如何进行金融行业数据分析与建模，是挖掘金融行业数据价值的重要手段。金融行业数据分析与建模方法主要包括七个重要环节，每个环节紧密相连。

1. 赛题介绍

1.1 赛题名称

贷款风险预测（逾期还款分三种情况：要么用户不愿意还款、要么没有钱还款、要么忘了还款）

1.2 问题描述

根据数据集中8万用户的相关信息，预测用户未来是否会逾期还款。

1.3 提供数据

用户基本信息、银行卡流水、信用卡账单信息以及用户行为数据，字段内容均为脱敏数据。

1.4 评估指标

Kolmogorov-Smirnov(KS)是风险评分领域常用的评估指标，反应模型对正负样本的辨识能力，KS越高表明模型对正负样本的辨识能力越强。
KS = max { | f(s|P) - f(s|N) | }
其中，f(s|P) 为正样本预测值的累计分布函数，f(s|N) 为负样本在预测值上的累计分布函数。

2. 数据探索

通过数据可视化查看数据样本的分布以及特征的统计规律。

正/负样本比例1：4（应该是人工采样过，实际业务中逾期样本比例很少）
训练集/测试集样本比例6w：8k
......

3. 数据预处理

主要包括数据的缺失值处理、异常值处理、拼接、去重等基本处理。同时，还有汇率转换和单位净值*份额等基本数据操作。

4. 特征工程

4.1 基本特征

根据类别型和数值型数据在标签上的分布进行预处理，包括标准化、归一化、离散化、平滑化、one-hot编码等。

4.2 时序变化特征

银行卡流水：计算用户在全局、特定条件下（交易类型，非工资收入/工资收入，支出/收入）的金额和时间的统计特征（sum/count/mean/median/std/min/max）
信用卡账单：计算用户在全局、特定条件下（银行标识，还款状态）的金额（上期账单金额，上期还款金额，本期账单余额，信用卡额度）和账单时间戳的统计信息
浏览行为：计算用户每天每种行为类型/子类型的count、浏览行为数和浏览时间的统计信息
日期的转换：根据上半年/下半年、季度、月份等时间维度，提取大量可能的日期特征衍生
滑动窗口处理：根据不同时间区间（近一个月、近两个月等），计算用户对应的银行流水、信用卡账单、浏览行为的基础特征/统计特征
屏蔽采样时间差异的特征：取前五条和最后五条处理等
......

4.3 交叉特征

除法：例如某浏览行为类型占总浏览的比例、工资收入/非工资收入等
减法：最大时间戳-最小时间戳（表示某种行为的时间跨度）等
拼接：例如行为类型-子类型1/2，拼接后计算特征等
用户的个人信息之间的交叉特征衍生
......

4.4 业务理解特征

上期未还款金额 = 上期账单金额 - 上期还款金额
相邻两期账单金额差 = 本期账单余额 - 上期账单金额
if 上期账单金额 > 信用卡额度，爆卡 = 1 else 爆卡 = 0
if 上期还款金额 < 上期账单金额，未足额还款 = 1 else 未足额还款 = 0
缺失副表的数量
......

5. 特征选择

删除相关性高的特征（例如取阈值0.98）
使用低成本特征选择算子，过滤掉不重要的特征（例如取50%）
使用预训练的lightgbm模型获得特征重要性（例如取top3500）

6. 模型选择及调参

经过实验选择了lightgbm模型
使用网格搜索/贝叶斯优化对其进行调参（调整叶子节点数、最大深度、行/列采样比例、正则项系数等）
通过KS指标/自定义评价函数，通过交叉验证，获取较为准确的模型迭代轮次

7. 模型融合

bagging
stacking
......

如果你对金融科技感兴趣，欢迎浏览我的另一篇博客：如果你想了解金融科技，不妨先了解金融科技有哪些可能？
如果您对数据挖掘感兴趣，欢迎浏览我的另一篇博客：数据挖掘比赛/项目全流程介绍
如果你对智能推荐感兴趣，欢迎先浏览我的另一篇随笔：智能推荐算法演变及学习笔记
如果您对人工智能算法感兴趣，欢迎浏览我的另一篇博客：人工智能新手入门学习路线和学习资源合集（含AI综述/python/机器学习/深度学习/tensorflow）
如果你是计算机专业的应届毕业生，欢迎浏览我的另外一篇博客：如果你是一个计算机领域的应届生，你如何准备求职面试？
如果你是计算机专业的本科生，欢迎浏览我的另外一篇博客：如果你是一个计算机领域的本科生，你可以选择学习什么？
如果你是计算机专业的研究生，欢迎浏览我的另外一篇博客：如果你是一个计算机领域的研究生，你可以选择学习什么？
之后博主将持续分享各大算法的学习思路和学习笔记：hello world: 我的博客写作思路

你可能感兴趣的:(从中国农业银行“雅典娜杯”数据挖掘大赛看金融行业数据分析与建模方法)

Keras、TensorFlow、PyTorch框架对比及服务器配置揭秘小深ai硬件分享人工智能深度学习服务器
深度学习框架：开启智能大门的钥匙在数字化浪潮中，深度学习如明星照亮众多领域。从智能安防的人脸识别，到医疗图像分析、电商商品推荐、智能语音助手等，其身影无处不在，改变着生活与工作方式。在深度学习领域，Keras、TensorFlow和PyTorch是主流框架，能助开发者构建强大智能模型。但这些框架要充分发挥作用，离不开合适的服务器配置，就像魔法师需要魔法棒和魔力，下面我们就来看看这些具体的框架吧:框
华为OD机试E卷 --英文输入法--24年OD统一考试（Java & JS & Python & C & C++）飞码创造者最新华为OD机试题库2024 华为od java javascript c语言 python
文章目录题目描述输入描述输出描述用例JS算法源码Java算法源码python算法源码c算法源码c++算法源码题目描述主管期望你来实现英文输入法单词联想功能。需求如下：•依据用户输入的单词前缀，从已输入的英文语句中联想出用户想输入的单词，按字典序输出联想到的单词序列，•如果联想不到，请输出用户输入的单词前缀。注意：英文单词联想时，区分大小写缩略形式如”don’t”，判定为两个单词，”don”和”t”
【Golang/gRPC/Nacos】在golang中将gRPC和Nacos结合使用 Rinai_R 微服务相关笔记学习经验分享微服务服务发现 golang Nacos
Nacos与gRPC前言关于这部分，前段时间我在看文档以及视频教程的时候，怎么都想不明白，到底为什么要用gRPC是什么，他在项目中应该充当什么样的角色？Nacos又是如何和他结合的？于是我就决定去看看一些小项目是如何实现的这个功能，现在将我最近学到的分享给大家。正文在正文开始之前，我们要先知道Nacos和gRPC在本篇内容中，会涉及到的作用：gRPCgRPC允许服务之间无缝通信，像调用本地函数一样
《Java核心技术卷II》HTTP客户端阿立聊全栈《Java核心技术II》Java Java核心II 服务器
HTTP客户端URLConnection是HTTP称为Web普通适用协议之前设计的，提供大量协议支持，但笨重。HttpClient提供了更便捷的API和HTTP/2的支持。HttpClient类HttpClient对象可以发出请求并接收响应，调用方法获取客户端：HttpClientclient=HttpClient.newHttpClient();需要配置客户端，如下构建器API:HttpClie
python+ollama本地大模型批量识别PDF，总结摘要以及关键词并输出EXCEL。月野难浔丶 python pdf 开发语言
现在市场上有很多PDF文件的识别，转化，等等。有些业务可能需要总结摘要和关键词等等一系列的操作。然而随着AI的兴起，本地大模型的部署，这些成为一种很方便的方法，接下来我将为各位介绍我所使用的方法。本篇文章旨在自动化处理PDF文档，提取并清理文本数据，然后使用一种大型模型生成摘要和关键词。最后，处理结果会被整理并输出到Excel文件中，便于后续分析和查看。人工智能（AI）是一种模拟人类智能的科技，它
vSAN对现代化医疗保健IT基础架构的优势国外VPS测评网站服务器数据库网络
vSAN对现代化医疗保健IT基础架构的优势随着技术的发展，其在帮助现代医疗机构提供关键患者护理方面的作用也在不断增强。快速、高效、安全地收集数据可加快诊断和治疗速度。因此，高可用性和可靠性对于医疗机构的云基础设施解决方案至关重要。高可用性、高可靠性的基础设施不仅从实用角度至关重要，而且从合规性角度也至关重要。随着技术的进步，HIPAA和PCIDSS的要求也在不断提高。这增加了对符合HIPAA和PC
CMake技术细节：解决未定义，提供参数初级代码游戏软件开发 cmake 未定义
初级代码游戏的专栏介绍与文章目录-CSDN博客我的github：codetoys，所有代码都将会位于ctfc库中。已经放入库中我会指出在库中的位置。这些代码大部分以Linux为目标但部分代码是纯C++的，可以在任何平台上使用。源码指引：github源码指引_初级代码游戏的博客-CSDN博客初用cmake，直接上“cmake..”，结果提示有东西未定义，很多时候是需要参数提供。参数提供的方法其实就是
文件传输协议FTP、SFTP与FTPS 对许 Linux 基础理论网络 sftp
FTP、SFTP与FTPS1、FTP（FileTransferProtocol）2、FTPS（FileTransferProtocolSecure）3、SFTP（SecureFileTransferProtocol）4、‌FTP、SFTP与FTPS的区别文件传送协议（FTP、SFTP与FTPS）是TCP/IP协议簇中的一个成员，是使用最为广泛的文件传送协议。‌FTP、SFTP与FTPS的主要区别在
深度学习｜表示学习｜卷积神经网络｜局部链接是什么？｜06 漂亮_大男孩表示学习深度学习学习 cnn
如是我闻：局部连接（LocalConnectivity），是卷积神经网络（CNN）中的一个关键特性。什么是局部连接（LocalConnectivity）？局部连接指的是：在卷积操作中，每个神经元（或输出单元）只与输入数据的一个局部区域相关联，而不是与整个输入数据相连。换句话说：全连接网络（FullyConnectedLayer）中，每个神经元会与上一层所有的神经元相连。卷积网络（Convoluti
Hadoop 与 Spark：大数据处理的比较王子良. 大数据经验分享 hadoop spark 大数据
欢迎来到我的博客！非常高兴能在这里与您相遇。在这里，您不仅能获得有趣的技术分享，还能感受到轻松愉快的氛围。无论您是编程新手，还是资深开发者，都能在这里找到属于您的知识宝藏，学习和成长。博客内容包括：Java核心技术与微服务：涵盖Java基础、JVM、并发编程、Redis、Kafka、Spring等，帮助您全面掌握企业级开发技术。大数据技术：涵盖Hadoop（HDFS）、Hive、Spark、Fli
@RabbitListener或@RabbitHandler使用出现死循环 Youmans_station java rabbitmq
异常1问题：为什么会找不到消费实现？@RabbitListener或@RabbitHandler配置出错很大原因是取决于content_type的配置和方法的形参。如果通过客户端放入队列中有个content_type为空的的消息，@RabbitListener只有形参为String的Handler，是无法对应上消费实现的。@RabbitHandler没有使用可选参数isDefault消费者找不到任
从Web2到Web3：区块链推动的数字进化之路清晨 web3 web3 去中心化人工智能隐私保护
互联网的演变从最初的Web1到如今的Web3，代表了技术和用户需求的深刻变化。Web3是一个基于区块链技术的全新互联网架构，旨在解决传统互联网（即Web2）中数据集中化和隐私保护等问题。通过去中心化的机制，Web3不仅能够增强数据安全性，还能够赋予用户更高的自主权。本文将从Web2和Web3的差异、区块链的作用以及Web3未来的潜力三个角度进行探讨。Web2：社交与互动的新时代Web2，也被称为社
Lambda表达式和匿名内部类 weixin_30787531 java
例1：无参函数的简写如果需要新建一个线程，一种常见的写法是这样：//JDK7匿名内部类写法newThread(newRunnable(){//接口名@Overridepublicvoidrun(){//方法名System.out.println("Threadrun()");}}).start();上述代码给Tread类传递了一个匿名的Runnable对象，重载Runnable接口的run()方法
多Agent框架之-CrewAI-人工智能代理团队的未来 WorkAgent 人工智能 ai langchain
CrewAI-aroleplayingAIAgentsgit地址：https://github.com/joaomdmoura/crewai#why-crewailangchain地址：CrewAIUnleashed:FutureofAIAgentTeamsAgent具有与另一个Agent联系的能力，以委派工作或提出问题。任务可以使用特定的代理工具覆盖，这些工具应该被使用，同时还可以指定特定的代理
JDK新特性飘飘渺渺渺红尘 Java Web Service java 开发语言
目录Java81、Interface2、Lambda2.1、替代匿名内部类RunnerableComparatorListener2.2、集合遍历3、Stream3.1、流类型3.2、常用方法4、Date-Time4.1、java.time主要类4.2、格式化4.3、字符串转日期4.4、日期计算4.5、获取指定日期4.6、时区小结Java91、G1成为默认垃圾回收器Java101、G1并行Full
Hive（11）：Transactional Tables事务表不死鸟.亚历山大.狼崽子 hive hive hadoop 数据仓库
1Hive事务背景知识Hive本身从设计之初时，就是不支持事务的，因为Hive的核心目标是将已经存在的结构化数据文件映射成为表，然后提供基于表的SQL分析处理，是一款面向分析的工具。且映射的数据通常存储于HDFS上，而HDFS是不支持随机修改文件数据的。这个定位就意味着在早期的Hive的SQL语法中是没有update，delete操作的，也就没有所谓的事务支持了，因为都是select查询分析操作。
string.join()方法 BLUE_SEVEN
JavaStringjoin()join()方法返回使用指定分隔符拼接一个字符串。在join()方法中，为每个元素添加了分隔符。如果为null元素，则添加“null”。从JDK1.8开始，Java字符串才包含join()方法。Java字符串中有两种join()方法。1语法publicstaticStringjoin(CharSequencedelimiter,CharSequence...elem
Debian常用命令梅见十柒软件工程 debian 运维
以下是完整的Linux命令大全，适用于Debian、Ubuntu及其衍生系统，涵盖系统管理、文件操作、磁盘管理、用户管理、网络调试、安全、进程管理等多个方面。目录基本命令关机与重启文件和目录管理文件搜索挂载文件系统磁盘空间管理用户和群组管理文件和目录权限文件的特殊属性打包和压缩文件DEB包管理查看文件内容文本处理字符设置和文件格式转换文件系统分析初始化文件系统SWAP文件系统备份与恢复光盘操作网络
虚拟机VMware Workstation Pro安装集群+hadoop+spark+scala 落枫兮 hadoop spark scala
参考资料：参考视频教程链接：大数据实验虚拟机安装Hadoop和Spark_哔哩哔哩_bilibiliup主：孤独时代的硕硕namenode安装选择镜像、路径、磁盘（最好不要c盘）、内存和处理器编辑名称与位置可点击此处自定义硬盘进行设置。选择语言、时区、软件、位置和网络
一直绕waf一直爽！利用 multipart/form-data 解析差异绕 WAF！！（全网最详细） Dest1ny（沉淀版） php 开发语言 web安全经验分享网络安全
、大家好，我是Dest1ny！今天是介绍利用multipart/form-data解析差异绕WAF！文中共介绍了八种绕过方法，基于对应的特征。1.multipart/form-data结合参数污染2.multipart/form-data参数覆盖3.multipart/form-data文件名覆盖4.multipart/form-dataContent-Disposition参数覆盖5.multi
税务门户网站系统：数据分析与税务政策传播 liuxin33445566 安全 java 开发语言数据库前端
2.1SSM框架介绍本课题程序开发使用到的框架技术，英文名称缩写是SSM，在JavaWeb开发中使用的流行框架有SSH、SSM、SpringMVC等，作为一个课题程序采用SSH框架也可以，SSM框架也可以，SpringMVC也可以。SSH框架是属于重量级别的框架，配置繁琐，不够灵活，修改程序需要修改好多个文件，并且运行起来也占用内存较高，CPU使用率相对也高，SpringMVC是Spring开发的
手机崩溃日志的查找与分析鹅肝手握高V五色 ios 网络
摘要本文介绍了一款名为克魔助手的iOS应用日志查看工具，该工具可以方便地查看iPhone设备上应用和系统运行时的实时日志和崩溃日志。同时还提供了崩溃日志的分析查看模块，可以对苹果崩溃日志进行符号化、格式化和分析，极大地简化了开发者的调试工作。引言在iOS应用开发过程中，调试日志和崩溃日志是开发者必不可少的工具。然而，使用XcodeConsole等工具查看日志可能不够方便，而且处理崩溃日志也相当繁琐
Zookeeper启动指定JDK版本费曼乐园 Zookeeper zookeeper
1.从官网下载jdk21版本。JavaDownloads|Oracle2.将下载的jdk-21_linux-x64_bin.tar.gz文件上传的主机/usr/java目录下面。3.在/usr/java目录下面解压文件。tar-zxvfjdk-21_linux-x64_bin.tar.gz4.修改zookeeper的bin目录下面的zkEnv.sh脚本，在关于获取JAVA_HOME的脚本行前面添加
Python百度搜索引擎API使用手册宫和举Esmeralda
Python百度搜索引擎API使用手册python-baidusearch自己手写的百度搜索接口的封装，pip安装，支持命令行执行。BaiduSearchunofficialAPIforPythonwithnoexternaldependencies项目地址:https://gitcode.com/gh_mirrors/py/python-baidusearch概览本文档将详细介绍如何安装与使用p
feign动态设置数据源（https请求）传智教育 https java 网络协议
feign动态设置数据源（https请求）1、背景在使用springboot-feign/spingcloud-feign时，需要在启动springboot的时候，注入的方式将feigncofing配置好，也就是说项目启动以后只能有一个数据源，且不能修改，在网上找了很多资料没有找到解决方案（网上应该有，只是我没有找到），后面只能是硬着头皮看源码，问题解决2、代码其实在这里用的原生的feign，并不
debian中文界面如何切换英文翻滚吧键盘 debian 运维
引言在日常使用中，中文界面下有着中文目录导致不是很方便操作（需要切中文输入法，输入英文单词命令穿插输入汉字容易输入错），并且在使用过程中遭遇报错时，通过搜索引擎并不能通过中文报错快速找到错误原因。切换方法如果是选择的中文安装，默认下其实是没有安装英文的，需要进入配置界面，按空格选择语言，Enter下一步。sudodpkg-reconfigurelocales#选择en_US.UTF-8locale
WPF 实现动态属性绑定与动态绑定详解 code_shenbing WPF wpf
在WPF开发中，动态属性绑定与动态绑定是十分强大的功能，它们为构建灵活、可交互的应用程序提供了有力支持。本文将深入探讨这两种技术，帮助开发者更好地理解和运用它们，提升WPF应用开发的效率与质量。一、动态属性绑定基础概念（一）什么是动态属性绑定动态属性绑定是指在运行时，根据程序的逻辑动态地改变绑定的属性路径或绑定源。与静态属性绑定不同，它不是在XAML编译阶段就确定好绑定关系，而是在程序运行过程中动
机器人学习的范式转变：从专用走向通用基础模型 XianxinMao 机器人
标题：机器人学习的范式转变：从专用走向通用基础模型文章信息摘要：机器人学习正经历从特定任务向通用基础模型的范式转变，这一演进路径与大语言模型相似。通过多机器人协作和跨任务泛化能力的成功，基础模型方向展现出实现通用人工智能的潜力。然而，这一转变面临两大关键挑战：机器人硬件的高昂成本限制了大规模部署和数据采集，以及获取足够规模和多样性的训练数据存在实际困难。突破这些瓶颈需要在制造工艺创新、数据共享生态
Java中的String.join方法详解 UtdPatch java python 开发语言
String.join方法是Java中的一个实用工具方法，用于将一组字符串连接成一个新的字符串。它提供了一种简洁而灵活的方式来处理字符串连接的需求。在本文中，我们将详细介绍String.join方法的功能、用法和示例代码。功能简介String.join方法的功能是将一组字符串连接成一个新的字符串，通过指定一个分隔符将它们分隔开。它接受两个参数：分隔符和一个可迭代的CharSequence（如字符串
Web3 与数据隐私：如何让用户掌控个人信息 Roun3 web3 web3 去中心化区块链隐私保护
随着数字化时代的快速发展，互联网已经渗透到我们生活的方方面面，个人数据的收集与使用也变得越来越普遍。与此同时，数据隐私问题逐渐成为全球关注的焦点。传统的互联网平台通常将用户的数据存储在中心化的服务器上，这意味着平台拥有对用户数据的完全控制权。然而，Web3的出现为我们提供了一个新的可能性，让用户能够重新掌控自己的个人信息，恢复数据隐私的主权。1.什么是Web3？Web3，也被称为去中心化的互联网，
Java实现的基于模板的网页结构化信息精准抽取组件：HtmlExtractor yangshangchuan 信息抽取 HtmlExtractor 精准抽取信息采集
HtmlExtractor是一个Java实现的基于模板的网页结构化信息精准抽取组件，本身并不包含爬虫功能，但可被爬虫或其他程序调用以便更精准地对网页结构化信息进行抽取。 HtmlExtractor是为大规模分布式环境设计的，采用主从架构，主节点负责维护抽取规则，从节点向主节点请求抽取规则，当抽取规则发生变化，主节点主动通知从节点，从而能实现抽取规则变化之后的实时动态生效。如
java编程思想 -- 多态百合不是茶 java 多态详解
一: 向上转型和向下转型面向对象中的转型只会发生在有继承关系的子类和父类中（接口的实现也包括在这里）。父类：人子类：男人向上转型： Person p = new Man() ; //向上转型不需要强制类型转化向下转型： Man man =
[自动数据处理]稳扎稳打,逐步形成自有ADP系统体系 comsci dp
对于国内的IT行业来讲,虽然我们已经有了"两弹一星",在局部领域形成了自己独有的技术特征,并初步摆脱了国外的控制...但是前面的路还很长.... 首先是我们的自动数据处理系统还无法处理很多高级工程...中等规模的拓扑分析系统也没有完成,更加复杂的
storm 自定义日志文件商人shang storm cluster logback
Storm中的日志级级别默认为INFO，并且，日志文件是根据worker号来进行区分的，这样，同一个log文件中的信息不一定是一个业务的，这样就会有以下两个需求出现： 1. 想要进行一些调试信息的输出 2. 调试信息或者业务日志信息想要输出到一些固定的文件中不要怕，不要烦恼，其实Storm已经提供了这样的支持，可以通过自定义logback 下的 cluster.xml 来输
Extjs3 SpringMVC使用 @RequestBody 标签问题记录 21jhf
springMVC使用 @RequestBody(required = false) UserVO userInfo 传递json对象数据，往往会出现http 415，400,500等错误，总结一下需要使用ajax提交json数据才行，ajax提交使用proxy，参数为jsonData，不能为params；另外，需要设置Content-type属性为json，代码如下：（由于使用了父类aaa
一些排错方法文强chu 方法
1、java.lang.IllegalStateException: Class invariant violation at org.apache.log4j.LogManager.getLoggerRepository(LogManager.java:199)at org.apache.log4j.LogManager.getLogger(LogManager.java:228) at o
Swing中文件恢复我觉得很难小桔子 swing
我那个草了！老大怎么回事，怎么做项目评估的？只会说相信你可以做的，试一下，有的是时间！用java开发一个图文处理工具，类似word，任意位置插入、拖动、删除图片以及文本等。文本框、流程图等，数据保存数据库，其余可保存pdf格式。ok,姐姐千辛万苦，
php 文件操作 aichenglong PHP 读取文件写入文件
1 写入文件 @$fp=fopen("$DOCUMENT_ROOT/order.txt", "ab"); if(!$fp){ echo "open file error" ; exit; } $outputstring="date:"." \t tire:".$tire."
MySQL的btree索引和hash索引的区别 AILIKES 数据结构 mysql 算法
Hash 索引结构的特殊性，其检索效率非常高，索引的检索可以一次定位，不像B-Tree 索引需要从根节点到枝节点，最后才能访问到页节点这样多次的IO访问，所以 Hash 索引的查询效率要远高于 B-Tree 索引。可能很多人又有疑问了，既然 Hash 索引的效率要比 B-Tree 高很多，为什么大家不都用 Hash 索引而还要使用 B-Tree 索引呢
JAVA的抽象--- 接口 --实现百合不是茶
抽象接口实现接口 //抽象类 ,方法 //定义一个公共抽象的类 ,并在类中定义一个抽象的方法体抽象的定义使用abstract abstract class A 定义一个抽象类例如： //定义一个基类 public abstract class A{ //抽象类不能用来实例化，只能用来继承 //
JS变量作用域实例 bijian1013 作用域
<script> var scope='hello'; function a(){ console.log(scope); //undefined var scope='world'; console.log(scope); //world console.log(b);
TDD实践（二） bijian1013 java TDD
实践题目：分解质因数 Step1：单元测试： package com.bijian.study.factor.test; import java.util.Arrays; import junit.framework.Assert; import org.junit.Before; import org.junit.Test; import com.bijian.
[MongoDB学习笔记一]MongoDB主从复制 bit1129 mongodb
MongoDB称为分布式数据库，主要原因是1.基于副本集的数据备份， 2.基于切片的数据扩容。副本集解决数据的读写性能问题，切片解决了MongoDB的数据扩容问题。事实上，MongoDB提供了主从复制和副本复制两种备份方式，在MongoDB的主从复制和副本复制集群环境中，只有一台作为主服务器，另外一台或者多台服务器作为从服务器。本文介绍MongoDB的主从复制模式，需要指明
【HBase五】Java API操作HBase bit1129 hbase
import java.io.IOException; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.hbase.HBaseConfiguration; import org.apache.hadoop.hbase.HColumnDescriptor; import org.apache.ha
python调用zabbix api接口实时展示数据 ronin47
zabbix api接口来进行展示。经过思考之后，计划获取如下内容： 1、获得认证密钥 2、获取zabbix所有的主机组 3、获取单个组下的所有主机 4、获取某个主机下的所有监控项
jsp取得绝对路径 byalias 绝对路径
在JavaWeb开发中，常使用绝对路径的方式来引入JavaScript和CSS文件，这样可以避免因为目录变动导致引入文件找不到的情况，常用的做法如下：一、使用${pageContext.request.contextPath} 　　代码” ${pageContext.request.contextPath}”的作用是取出部署的应用程序名，这样不管如何部署，所用路径都是正确的。
Java定时任务调度：用ExecutorService取代Timer bylijinnan java
《Java并发编程实战》一书提到的用ExecutorService取代Java Timer有几个理由，我认为其中最重要的理由是：如果TimerTask抛出未检查的异常，Timer将会产生无法预料的行为。Timer线程并不捕获异常，所以 TimerTask抛出的未检查的异常会终止timer线程。这种情况下，Timer也不会再重新恢复线程的执行了;它错误的认为整个Timer都被取消了。此时，已经被
SQL 优化原则 chicony sql
一、问题的提出　在应用系统开发初期，由于开发数据库数据比较少，对于查询SQL语句，复杂视图的的编写等体会不出SQL语句各种写法的性能优劣，但是如果将应用系统提交实际应用后，随着数据库中数据的增加，系统的响应速度就成为目前系统需要解决的最主要的问题之一。系统优化中一个很重要的方面就是SQL语句的优化。对于海量数据，劣质SQL语句和优质SQL语句之间的速度差别可以达到上百倍，可见对于一个系统
java 线程弹球小游戏 CrazyMizzz java 游戏
最近java学到线程，于是做了一个线程弹球的小游戏，不过还没完善这里是提纲 1.线程弹球游戏实现 1.实现界面需要使用哪些API类 JFrame JPanel JButton FlowLayout Graphics2D Thread Color ActionListener ActionEvent MouseListener Mouse
hadoop jps出现process information unavailable提示解决办法 daizj hadoop jps
hadoop jps出现process information unavailable提示解决办法 jps时出现如下信息： 3019 -- process information unavailable3053 -- process information unavailable2985 -- process information unavailable2917 --
PHP图片水印缩放类实现 dcj3sjt126com PHP
<?php class Image{ private $path; function __construct($path='./'){ $this->path=rtrim($path,'/').'/'; } //水印函数，参数：背景图，水印图，位置，前缀,TMD透明度 public function water($b,$l,$pos
IOS控件学习：UILabel常用属性与用法 dcj3sjt126com ios UILabel
参考网站： http://shijue.me/show_text/521c396a8ddf876566000007 http://www.tuicool.com/articles/zquENb http://blog.csdn.net/a451493485/article/details/9454695 http://wiki.eoe.cn/page/iOS_pptl_artile_281
完全手动建立maven骨架 eksliang java eclipse Web
建一个 JAVA 项目： mvn archetype:create -DgroupId=com.demo -DartifactId=App [-Dversion=0.0.1-SNAPSHOT] [-Dpackaging=jar] 建一个 web 项目： mvn archetype:create -DgroupId=com.demo -DartifactId=web-a
配置清单 gengzg 配置
1、修改grub启动的内核版本 vi /boot/grub/grub.conf 将default 0改为1 拷贝mt7601Usta.ko到/lib文件夹拷贝RT2870STA.dat到 /etc/Wireless/RT2870STA/文件夹拷贝wifiscan到bin文件夹，chmod 775 /bin/wifiscan 拷贝wifiget.sh到bin文件夹，chm
Windows端口被占用处理方法 huqiji windows
以下文章主要以80端口号为例，如果想知道其他的端口号也可以使用该方法..........................1、在windows下如何查看80端口占用情况?是被哪个进程占用?如何终止等. 这里主要是用到windows下的DOS工具,点击"开始"--"运行",输入&
开源ckplayer 网页播放器，跨平台(html5, mobile)，flv, f4v, mp4, rtmp协议. webm, ogg, m3u8 ！天梯梦 mobile
CKplayer，其全称为超酷flv播放器，它是一款用于网页上播放视频的软件，支持的格式有：http协议上的flv,f4v,mp4格式，同时支持rtmp视频流格式播放，此播放器的特点在于用户可以自己定义播放器的风格，诸如播放/暂停按钮，静音按钮，全屏按钮都是以外部图片接口形式调用，用户根据自己的需要制作出播放器风格所需要使用的各个按钮图片然后替换掉原始风格里相应的图片就可以制作出自己的风格了，
简单工厂设计模式 hm4123660 java 工厂设计模式简单工厂模式
简单工厂模式（Simple Factory Pattern）属于类的创新型模式，又叫静态工厂方法模式。是通过专门定义一个类来负责创建其他类的实例，被创建的实例通常都具有共同的父类。简单工厂模式是由一个工厂对象决定创建出哪一种产品类的实例。简单工厂模式是工厂模式家族中最简单实用的模式，可以理解为是不同工厂模式的一个特殊实现。
maven笔记 zhb8015 maven
跳过测试阶段： mvn package -DskipTests 临时性跳过测试代码的编译： mvn package -Dmaven.test.skip=true maven.test.skip同时控制maven-compiler-plugin和maven-surefire-plugin两个插件的行为，即跳过编译，又跳过测试。指定测试类 mvn test
非mapreduce生成Hfile，然后导入hbase当中 Stark_Summer map hbase reduce Hfile path实例
最近一个群友的boss让研究hbase，让hbase的入库速度达到5w+/s，这可愁死了，4台个人电脑组成的集群，多线程入库调了好久，速度也才1w左右，都没有达到理想的那种速度，然后就想到了这种方式，但是网上多是用mapreduce来实现入库，而现在的需求是实时入库，不生成文件了，所以就只能自己用代码实现了，但是网上查了很多资料都没有查到，最后在一个网友的指引下，看了源码，最后找到了生成Hfile
jsp web tomcat 编码问题王新春 tomcat jsp pageEncode
今天配置jsp项目在tomcat上，windows上正常，而linux上显示乱码，最后定位原因为tomcat 的server.xml 文件的配置，添加 URIEncoding 属性： <Connector port="8080" protocol="HTTP/1.1" connectionTi

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他