付付要努力呀

kaggle——信用卡欺诈检测项目实战

笔记

第一步：了解题目，确定任务
第二步：场景分析
第三步：数据预处理
- 看是否有缺失值
- 查看样本类别分布
- 数据不均衡解决办法
- 数据值标准化/归一化
第四步：特征工程
- 1）查看特征分布情况，把不同类别下特征分布相差不大的特征删除掉
- 2）特征缩放
- 3）特征重要性分析
第五步：模型训练
- 处理不平衡样本
- k折交叉验证或者网格搜索调优参数（grid search）求取最好的模型参数
第六步：模型评估
- 使用下采样数据训练与测试
- 使用下采样数据训练与测试（不同的阈值对结果的影响）
- 使用下采样数据训练，原始数据进行测试
- 原始数据进行K折交叉验证
- 使用原始数据进行训练和测试
- 查看ROC曲线
- 逻辑回归阈值选择
- 过采样
总结

第一步：了解题目，确定任务

信用卡欺诈是指故意使用伪造、作废的信用卡，冒用他人的信用卡骗取财物，或用本人信用卡进行恶意透支的行为。

常见信用卡欺诈使用的情况有：

1.失卡冒用：失卡一般有三种情况，一是发卡银行在向持卡人寄卡时丢失，即未达卡；二是持卡人自己保管不善丢失；三是被不法分子窃取。
2.假冒申请：利用他人资料申请信用卡，或是故意填写虚假资料申请，伪造身份证，填报虚假单位或家庭住址等
3.伪造信用卡：据统计，国际上信用卡诈骗案件中，有60%以上是伪造卡的诈骗，其特点是团伙性质，从盗取卡资料、制造假卡、贩卖假卡，到用假卡作案。伪造者经常利用一些最新的科技手段盗取真实的信用卡资料，有些是用微型测录机窃取信用卡资料，有些是伺机偷改授权机终端功能窃取信用卡资料，当窃取真实的信用卡资料后，便进行批量性的制造假卡，然后通过贩卖假卡大肆作案，牟取暴利。

本项目通过利用信用卡的历史交易数据，通过数据预处理，变量选择，建模分析预测等方法，构建简单的信用卡反欺诈预测模型，提前发现客户信用卡被盗刷的事件。

本项目通过利用信用卡的历史交易数据——进行机器学习，构建信用卡反欺诈预测模型——提前发现客户信用卡被盗刷的事件。

确定任务：即通过用户的历史信息，建立一个反欺诈预测模型，当有新的用户刷卡信息来的时候，模型能准确的预测出这是正常的刷卡行为还是盗刷行为即预测持卡人的信用卡是否被盗刷。

第二步：场景分析

**分析场景：**判断是否监督，二分类还是多分类。——场景不同，应用的算法也不同。
首先，我们拿到的数据是是有标签的，每个样本中表明了是不是盗刷行为的。无盗刷行为是0，有盗刷行为是1——所以确定了是一个监督学习的场景。
其次，持卡人是否发送盗刷是一个二分类问题——意味着可以通过二分类相关的算法来找到具体的解决办法。（比如用逻辑回归，逻辑回归就是一个二分类问题）
分析数据： 给我们的数据一共是31列。其中特征v1到v28是经过PCA处理的，我们不需要动。然后特征时间和消费金额，两个数据的值和其他特征数据值相差很大，所以我们需要做特征缩放，将特征缩放到同一规格。在数据质量方面，没有出现乱码或空字符的数据，最后一列特征class为我们的目标列，前30列为我们的特征列。

如何处理这份数据进行我们最后的验证：数据是全部打标好的数据，可以通过交叉验证的方法对训练集生成的模型进行评估。70%的数据进行训练，30%的数据进行预测和评估。

现对该业务场景进行总结如下：
1.根据历史记录数据学习并对信用卡持卡人是否会发生被盗刷进行预测，二分类监督学习场景，选择逻辑斯蒂回归（Logistic Regression）算法。
2.数据为结构化数据，不需要做特征抽象，是否需要做特征缩放有待后续观察

第三步：数据预处理

原始数据为个人交易记录，但是考虑数据本身的隐私性，已经对原始数据进行了类似PCA的处理，现在已经把特征数据提取好了，接下来的目的就是如何建立模型使得检测的效果达到最好，这里我们虽然不需要对数据做特征提取的操作，但是面对的挑战还是蛮大的。

它只包含作为PCA转换结果的数字输入变量。不幸的是，由于保密问题，我们无法提供有关数据的原始功能和更多背景信息。特征V1，V2，… V28是使用PCA获得的主要组件，没有用PCA转换的唯一特征是“时间”和“量”。特征’时间’包含数据集中每个事务和第一个事务之间经过的秒数。特征“金额”是交易金额，此特征可用于实例依赖的成本认知学习。特征’Class’是响应变量，如果发生被盗刷，则取值1，否则为0。一共为31列。共31个特征。

看是否有缺失值

无缺失值。如果有缺失值，可以用中位数或者平均数代替。

查看样本类别分布

看看样本的分布是如何的，是不是不平衡样本，也就是不同的类对应的数量相差极大。
正负样本数相差极大。

数据很不均衡：数据不均衡很可能导致我们模型预测结果‘0’时很准确，而预测‘1’时并不准确。

注意，在数据分析阶段，先不对数据样本数量进行调整，否则会干扰后续的特征工程。在模型训练阶段，用训练样本训练模型的时候，再进行样本不均衡调整。

数据不均衡解决办法

处理这个不平衡问题，可以从数据和算法两个层面入手。
1.数据
下采样（比较简单实现）：下采样——给我下去。不是两类数据不均衡吗，那我让你们同样少（也就是1有多少个 0就消减成多少个），这样不就均衡了吗。即把多的样本下去删除掉。

很简单的实现方法，在属于0的数据中，进行随机的选择，就选跟class为1的那类样本一样多就好了。让多的跟少的一样

过采样：让少的跟多的一样

1、数据层面：欠采样、过采样、欠采样和过采样结合
2、算法层面：集成学习、代价敏感、特征选择

改变评价标准，以下标准可以更加深入地洞察模型的准确率

混淆矩阵：将要预测的数据分到表里来显示正确的预测（对角线），并了解其不正确的预测的类型（哪些类被分配了不正确的预测）；
精度：一种分类准确性的处理方法；
召回率：一种分类完整性的处理方法；
F1分数（或F-分）：精度和召回率的加权平均。

使用不同的算法

数据值标准化/归一化

amount序列数值浮动比较大待会要做标准化或归一化，因为计算机对于数值较大的值会误认为该特征的权重大，要把数据的大小尽量均衡

第四步：特征工程

1）查看特征分布情况，把不同类别下特征分布相差不大的特征删除掉

1）先查看盗刷与正常刷卡的刷卡金额分布图
即查看不同类别的特征数值分布图
横轴是金额，纵轴是交易数量。
两者数据分布相差较大。不能删掉该特征。信用卡被盗刷发生的金额与信用卡正常用户发生的金额相比，比较小。这说明信用卡盗刷者为了不引起信用卡卡主的注意，更偏向选择小金额消费。

2）正常刷卡与盗刷时间分布

信用正常刷卡与盗刷时间分布从大体上看并没有太大差别，由此推测盗刷者为了减小被识别的风险，将盗刷时间放在正常刷卡时间集中区域。因此建立模型预测时，可以将该特征过滤。

3）查看其它特征分布

我们将选择在不同信用卡状态下的分布有明显区别的特征变量。因此剔除变量V8、V13 、V15 、V20 、V21 、V22、 V23 、V24 、V25 、V26 、V27 和V28变量这也与我们开始用相关性图谱观察得出结论一致，同时剔除变量Time。

2）特征缩放

可以明显看到金额特征的值和其他特征的值相差加大，所以进行特征缩放
为了消除不同量纲之间的影响，将‘Amount’特征标准化形成新的特征‘normAmount’，

3）特征重要性分析

利用随机森林的feature importance对特征的重要性进行排序
链接


用随机森林进行特征重要性排序时，会加大连续特征的重要性，比如索引号是连续值从0–100000，会加大它的重要性，但其实它和我们最终的目标没有任何关系。所以要具体分析。

第五步：模型训练

第一种：先划分训练集测试机，然后对训练集进行下采样/过采样，测试集是正常的样本。
第二种：先下采样，然后再进行训练集测试机划分，这样的测试集是采样后的，不能准确代表模型的能力

处理不平衡样本

1）简单的方法——下采样

上面我们可以看到我们制造的样本均衡的数据比较小，在做测试是测试集不足以代表样本的整体性，所以真正测试时还是用原来数据集的测试集比较符合原始数据的分布

2）使用SMOTE算法做数据过采样
SMOTE算法的基本思想是对少数类样本进行分析并根据少数类样本人工合成新样本添加到数据集中
只对训练集进行过采样。

说明：过采样明显减少了误杀的数量，所以在出现数据不均衡的情况下，较经常使用的是生成数据而不是减少数据，但是数据一旦多起来，运行时间也变长了。

k折交叉验证或者网格搜索调优参数（grid search）求取最好的模型参数

最好的取值为c=10

第六步：模型评估

不同的目标任务，对应着不同的模型指标。
在这里我们是要尽可能的把那些有欺诈行为的用户全都检测出来，所以使用召回率。

我们的目的是什么呢？是不是要检测出来那些异常的样本呀！
换个例子来说，假如现在医院给了我们一个任务要检测出来1000个病人中，有癌症的那些人。那么假设数据集中1000个人中有990个无癌症，只有10个有癌症，我们需要把这10个人检测出来。
假设我们用精度来衡量，那么即便这10个人没检测出来，也是有 990/1000 也就是99%的精度，但是这个模型却没任何价值！这点是非常重要的，

因为不同的评估方法会得出不同的答案，一定要根据问题的本质，去选择最合适的评估方法。

使用下采样数据训练与测试

使用下采样数据训练与测试（不同的阈值对结果的影响）

对于阈值，设置的太大不好，设置的太小也不好，所以阈值设定地越适当，才能使得模型拟合效果越好。
Recall metric in the testing dataset: 0.9727891156462585
Recall metric in the testing dataset: 0.9523809523809523
Recall metric in the testing dataset: 0.9319727891156463
Recall metric in the testing dataset: 0.9319727891156463
Recall metric in the testing dataset: 0.9319727891156463
Recall metric in the testing dataset: 0.9251700680272109
Recall metric in the testing dataset: 0.8979591836734694
Recall metric in the testing dataset: 0.8775510204081632
Recall metric in the testing dataset: 0.8639455782312925

使用下采样数据训练，原始数据进行测试

可以看到虽然召回率比较高，但是正确样本有8794个被分类错误。这也是下采样的缺点。把很多正确的分成了错误的。
说明：对于下采样得到的数据集，虽然召回率比较高，但是误杀还是比较多的。这个现象其实就是下采样策略本身的一个缺陷。

原始数据进行K折交叉验证

使用原始数据进行训练和测试

查看ROC曲线

Roc曲线：即接收者操作特征曲线(receiver operating characteristic curve)，反映了真阳性率（灵敏度）和假阳性率（1-特异度）之间的变化关系。Roc曲线越趋近于左上角，预测结果越准确。

逻辑回归阈值选择

对于逻辑回归算法来说，我们还可以指定这样一个阈值，也就是说最终结果的概率是大于多少我们把它当成是正或者负样本。不用的阈值会对结果产生很大的影响。

阈值较小，意味着我们的模型非常严格宁肯错杀也不肯放过，这样会使得绝大多数样本都被当成了异常的样本，recall很高，精度稍低

当阈值较大的时候我们的模型就稍微宽松些啦，这个时候会导致recall很低，精度稍高，

综上当我们使用逻辑回归算法的时候，还需要根据实际的应用场景来选择一个最恰当的阈值！

如何设置阈值没有固定的标准，更多的结合业务来判断（因为不同的阈值，对召回率和精确率是有影响的），就看我们的业务到底希望提升那个指标为参考。例如：信用卡欺诈这种业务，更希望召回率高些（意思就是把可能欺诈交易全部拦截）

如果是想要召回率高，就把阈值设置的低点，宁可错杀100，也不能放过1个。

过采样

总结

确定任务——分析场景（监督/无监督、二分类/多分类，采用什么算法）——数据预处理（看有没有缺失值，不同类别的数据量相差大不大，归一化标准化）——特征工程（删除不同类的特征数据分布相差不大的，构造新的特征类）——训练模型（先划分训练集测试集，在这里处理一下数据分布，如果遇到数据不均衡则考虑把训练集下采用，下采样会把很多正确的分成错误的。或过采样，然后训练集进行训练，利用k折交叉验证找到模型的最优参数）——评估模型（不同任务对应不同的评估指标，如该项目就是考虑召回率，有多少盗用信用卡的用户被我们检测到了）——评判结果（评估指标好，就说明可以了，模型可以用了。如果评估指标不好，想着其他解决办法，对于逻辑回归算法来说，取值不同的阈值对我们最终的结果也是有影响的。找到最佳阈值。如果找最佳阈值评估指标也不是很高，那么就尝试其他算法，改其他方法）

该项目也可以看作异常检测，用autoencoder来进行异常检测。

pip设置国内源：阿里云、腾讯云、清华大学源 [email protected] Python pip python
更换Python的pip源（尤其是默认源访问速度较慢时）是一个常见需求，可以显著提升安装Python包的速度。以下是如何为pip设置国内源的步骤，以阿里云、腾讯云、清华大学源为例：1.备份原有源配置（可选但推荐）在进行任何更改之前，备份现有的pip配置文件是一个好习惯。这样，如果遇到问题，你可以轻松恢复到初始状态。Bash1mkdir~/.pip_backup2cp~/.pip/pip.conf~
ubuntu 18.04系统的镜像源 weixin_45081353 ubunt 日常操作 ubuntu linux 运维
1国内可用的镜像源Ubuntu官方下载地址阿里云开源镜像站清华大学开源镜像站中国科技大学开源镜像站华为云开源镜像站2ubuntu18.04镜像说明Ubuntu18.04是一个广泛使用的Linux发行版，它有多个版本的镜像可供下载。在物理机上安装的镜像如带desktop字样的镜像，含桌面环境，适合办公如带server字样的镜像，无桌面环境，适合部署服务器在虚拟机中安装的镜像仅用于制作启动介质的镜像在
解锁阿里云ACK：开启Kubernetes容器化应用新时代云资源服务商阿里云云计算云原生
引言：云原生时代下的ACK在当今数字化飞速发展的时代，云原生技术正以前所未有的速度改变着软件开发和部署的格局。随着企业对应用敏捷性、弹性扩展以及成本优化的需求日益增长，云原生已成为众多企业实现数字化转型的关键路径。在云原生的技术体系中，容器编排技术无疑是核心之一，而阿里云Kubernetes版（ACK）则是这一领域的佼佼者，为企业提供了强大、高效且易于管理的容器编排解决方案。Kubernetes作
最新最全的阿里云服务器部署Django项目教程（2021）
阿里云Linux服务器以Nginx+uWSGI部署Django项目教程前言：本教程适用于以Windows和Linux系统环境开发Django项目的初学者，帮助其将第一个Django项目部署上线，同时包含了一部分的DeBug方案，供其参考。-作者本地环境是Django2.0+Python3.8.3+Sqlite，以virtualenv在本地建立的虚拟环境。-作者Web代理服务器使用的是uWSGI，反
【宝塔Linux面板】在阿里云服务器安装孤独本就常态 linux 运维阿里云
文章目录一、宝塔Linux面板是什么？二、宝塔Linux面板安装步骤1.下载Xshell2.远程连接服务器3.进入宝塔官网4.安装面板5.安装成功三、总结一、宝塔Linux面板是什么？宝塔Linux面板是提升运维效率的服务器管理软件，支持一键LAMP/LNMP/集群/监控/网站/FTP/数据库/JAVA等100多项服务器管理功能。有30个人的专业团队研发及维护，经过200多个版本的迭代，功能全，少
使用Qwen2.5-Max大模型海青橘散记人工智能
要使用Qwen2.5-Max，您可以按照以下步骤操作：建议使用第二种方法1.通过阿里云百炼平台调用APIQwen2.5-Max已在阿里云百炼平台上架。您可以通过阿里云的生成式AI开发平台ModelStudio访问并调用Qwen2.5-Max的API服务。步骤：登录阿里云官网（https://www.alibabacloud.com）。进入“模型开发”或“ModelStudio”页面。找到Qwen2
【本科计算机毕业设计选题】毕业设计选题汇总100套易过的精品毕设项目分享(建议收藏)✅ 会写代码的羊毕设选题课程设计专科毕设毕业设计计算机网络毕设题目毕设选题计算机外设
文章目录前言最新毕设选题（建议收藏起来）SpringBoot+Vue毕业设计选题汇总100套易过的精品毕设项目分享毕设作品推荐文未可免费咨询毕设相关问题，点赞留言可送系统源码前言2025全新毕业设计项目博主介绍：✌全网粉丝10W+,CSDN全栈领域优质创作者，博客之星、掘金/华为云/阿里云等平台优质作者。技术范围：SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Nodejs、Pyt
PHP+Web进销存管理系统源码部署教程：快速搭建企业级ERP软件 typescript
在数字化转型浪潮下，企业对高效管理进销存流程的需求愈发迫切。基于PHP+Web的进销存管理系统，凭借其开源性、灵活性和跨平台优势，成为众多企业搭建ERP软件的首选方案。本文将详细介绍该系统源码的部署流程，助你快速搭建适合企业需求的ERP软件。进销存源码及展示：c.csymzs.top一、部署前的准备工作（一）服务器环境准备1.服务器类型云服务器（推荐）：阿里云ECS、腾讯云CVM、AWSEC2：支
canal同步mysql到kafka_使用Canal同步MySQL数据到Kafka 得到的数据中sql字段无值-问答-阿里云开发者社区-阿里云... 又可乐
这个应该跟你的binlog记录模式有关系，binlog有3中模式，ROW(行模式),Statement(语句模式),Mixed(混合模式)三种模式的用法如下：ROW(行模式)：记录那条数据修改了，注意：记录的是这条记录的全部数据，即使只更新了一个字段，binlog里也会记录所有字段的数据优点：他不记录sql语句的上下文信息，日志内容会非常清楚的记录每条数据详细的变更细节，即使只更新了一个字段，bi
国内主流云服务商对比？阿里云、腾讯云、华为云怎么选？ NicolasLearner 服务器云服务器云主机云服务云服务器阿里云腾讯云华为云
随着中国企业云服务器使用率的不断提升，虽然与国外一些国家相比还有很大差距。但得益于政策红利和中国企业的数字化转型，市场潜力空间仍然很大，而作为互联网行业中的一员，我们也应当对云服务器的基础知识有一定的了解，利用具有较多优势的云服务平台，研发应用层人工智能产品提供决策辅助。一、什么是云服务器云服务器(ElasticComputeService,ECS)是一种简单高效、安全可靠、处理能力可弹性伸缩的计
web3云服务和传统云有啥区别 Jamie20190106 web3
Web3云服务VS传统云：阿里云领跑新一代互联网基建随着区块链、NFT和元宇宙等概念的兴起，Web3——下一代去中心化互联网——正从一个前沿理念迅速演变为塑造未来的核心力量。然而，支撑这些创新应用的基础设施，却面临着与Web2.0时代截然不同的挑战。传统云服务虽然强大，但在面对Web3的去中心化特性时，显得力不从心。这催生了一个全新的赛道：Web3云服务。在这场变革中，阿里云凭借其深厚的技术积淀和
GO OSS 前端直传 Presign 你的代码我的心 golang 前端开发语言
go服务端代码官方文档阿里云直传参考代码注意事项：header不需要传&oss.PutObjectRequest不要写成&oss.GetObjectRequesthandlerpackagehandlerimport("goshop-api/oss-web/utils""net/http""github.com/gin-gonic/gin")funcPresign(ctx*gin.Context)
JVM & Spring Boot 深入解析我是廖志伟 Java场景面试宝典 Java JVM Spring Boot
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、Spri
centos9安装docker Dify
CentOS|DockerDocsyum-yinstallgccgcc-c++yum-utilsDocker官方的YUM软件仓库配置文件到系统,设置存储库yum-config-manager--add-repohttps://download.docker.com/linux/centos/docker-ce.repo也可以从阿里云下(我选择上面的)yum-config-manager--add-
修改阿里云vps为自定义用户登录 mgx_718 服务器
win系统上找到控制面板-->用户账户-->更改账户类型点击更改账户类型，此时我们看到vps的默认管理员账户Administrator。为了防止vps被别人使用默认账户Administrator攻击，我们添加一个用户账户，点击添加用户账户。用户名建议奇葩点，可在用户名生成器-随机大全网页上随机生成用户名（该用户名要记录下来，避免忘记），按要求添加用户。添加好新的账户后，双击新增的用户Zyh6qtR
maven中settings.xml仓库配置苏开印印印
aliyunmaven*阿里云公共仓库https://maven.aliyun.com/repository/publicrepo1centralHumanReadableNameforthisMirror.https://repo1.maven.org/maven2/repo2centralHumanReadableNameforthisMirror.https://repo2.maven.or
DBeaver连接失败报错——resolving dependencies Maven artifact ‘maven
一、问题描述使用DBeaver连接Oracle数据库，需要下载驱动，但是下载都报错，如下：ErrorresolvingdependenciesMavenartifact‘maven:/com.oracle.database.jdbc:ojdbc8:RELEASE‘notfound二、解决【窗口】→【首选项】→【连接】→【驱动】→【Maven】→点击【添加】阿里云中央仓库地址：http://mave
阿里云Flink：开启大数据实时处理新时代云资源服务商阿里云大数据云计算
走进阿里云Flink在大数据处理的广袤领域中，阿里云Flink犹如一颗璀璨的明星，占据着举足轻重的地位。随着数据量呈指数级增长，企业对数据处理的实时性、高效性和准确性提出了前所未有的挑战。传统的数据处理方式逐渐难以满足这些严苛的需求，而阿里云Flink凭借其卓越的特性和强大的功能，成为众多企业实现数据价值挖掘与业务创新的关键技术。它不仅继承了开源Flink的优秀基因，还融入了阿里云自主研发的创新技
java毕业设计-基于java的电商网购平台，网购商城管理系统(源码+LW+部署文档+全bao+远程调试+代码讲解等) 程序猿八哥 spring boot vue jave java 课程设计开发语言
博主介绍：✌️码农一枚，专注于大学生项目实战开发、讲解和毕业文撰写修改等。全栈领域优质创作者，博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战✌️技术范围：：小程序、SpringBoot、SSM、JSP、Vue、PHP、Java、python、爬虫、数据可视化、大数据、物联网、机器学习等设计与开发。主要内容：免费功能设计，开题报告、任务书、全b
阿里云ECS(Ubuntu 20.04 64位)安装Python失败无艳影 python 阿里云开发语言
最近申请了一台阿里云ECS作为开发和部署环境，想用来作为Web后台服务器。操作系统选择了Ubuntu20.0464位版本，网站后台采用pythonFlask框架。由于后台程序需要处理大规模数据，因此配置环境时除需要安装python和Flask之外，还需要安装pandas和numpy等library。起初我下载了python3.9.15版本，安装python解释器后又依次安装flask和pandas
阿里云瑶池数据库 Data Agent for Meta 正式发布，让 AI 更懂你的业务！数据库人工智能知识资讯
背景随着生成式人工智能（GenerativeAI）从概念验证迈向规模化商业落地，AIAgent已成为企业核心业务流程的重要组成部分。然而，当模型调用日益便捷时，核心痛点已不再是模型本身，而是集中在一个关键要素上：数据。AIAgent的落地瓶颈已从技术能力转向高质量、高相关性、安全合规的数据供给。企业面临的核心挑战在于：数据孤岛导致知识库分散，通用大模型难以理解专业业务传统数据管理依赖人工开发维护，
基于SpringBoot+Vue+大学校园图书管理系统设计和实现(源码+LW+部署讲解) 阿勇学长大数据项目实战案例 Java精品毕业设计实例微信小程序项目实战案例 spring boot vue.js 后端大学校园图书管理系统 Java毕业设计
博主介绍：✌全网粉丝50W+,csdn特邀作者、博客专家、CSDN新星计划导师、Java领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和学生毕业项目实战,高校老师/讲师/同行前辈交流✌技术范围：SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、小程序、安卓app、大数据、物联网、机器学习等
Java JVM与Spring Boot深度解析 Java廖志伟 Java场景面试宝典 Java JVM Spring Boot
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、Spri
并发编程与MyBatis核心解析
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、Spri
JVM与Spring Boot核心解析 Java廖志伟 Java场景面试宝典 Java JVM Performance Optimization
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、Spri
阿里云搭建Nginx
前提：确认gccg++开发类库是否安装?安装make:yum-yinstallgccautomakeautoconflibtoolmake安装g++:yuminstallgccgcc-c++开始搭建Nginx一、选择nginx安装目录可以选择任意目录，个人习惯将所有自定义安装放在同一文件夹下便于管理，本文选择cd/usr/tools/cd/usr/tools二、安装PCRE库ftp://ftp.c
阿里云宝塔面板安装详细教程 vpssf Linux运维教程企业运维教程宝塔面板教程运维数据库
下面稍微介绍一下如何使用阿里云服务器安装宝塔面板。概述如果还有不了解宝塔面板怎么使用的小伙伴，可以看下我总结的系列教程，保证从新手变老鸟：【建站流程科普】个人和企业搭建网站基本流程及六个主要步骤常见的VPS主机运维面板汇总—网站运维面板云服务器，VPS，虚拟主机有什么不同？如何选择？【宝塔面板精选教程汇总】宝塔面板教程（1）基于云服务器搭建宝塔面板教程最全详解宝塔面板教程（2）宝塔面板添加Word
域名备案和接入备案有什么区别？应该怎么做域名备案，应该怎么做接入备案 MonkeyKing.sun 域名备案接入备案
一、“备案”和“接入备案”的区别类型域名备案（首次备案）接入备案（新增接入）名称首次备案/主备案新增接入/接入备案/变更接入目的将网站、域名的主体信息首次提交到国家工信部系统备案将已有备案号的域名接入另一个云服务商是否唯一只能选一个服务商进行首次备案可以接入多个服务商提交位置在你首次备案的云服务商平台提交（如阿里云备案系统）在你新想使用的云平台（如腾讯云）提交“接入备案”申请主体信息提交企业/个人
阿里云SelectDB：开启实时数仓新时代云资源服务商阿里云云计算数据库云原生
一、引言在当今大数据时代，数据如同企业的“石油”，蕴含着巨大的价值。随着数据量呈指数级增长，企业对于实时数据分析的需求愈发迫切。实时数据分析能够帮助企业及时捕捉市场动态，快速做出决策，从而在激烈的市场竞争中占据优势。无论是电商企业需要实时分析用户购买行为以进行精准营销，还是金融机构需要实时监测风险以保障资金安全，实时数据分析都发挥着关键作用。阿里云SelectDB作为一款专为实时数据分析打造的云原
解锁阿里云日志服务SLS：云时代的日志管理利器云资源服务商阿里云云计算服务器
引言：开启日志管理新篇在云计算时代，数据如同企业的血液，源源不断地产生并流动。从用户的每一次点击，到系统后台的每一个操作，数据都在记录着企业运营的轨迹。而在这些海量的数据中，日志数据占据着至关重要的地位，它不仅记录了系统的运行状态、用户的行为信息，还为企业的运维、安全、业务分析等提供了宝贵的依据。如何高效地处理这些日志数据，成为了企业在数字化转型过程中面临的关键挑战之一。阿里云日志服务SLS（Si
矩阵求逆（JAVA）利用伴随矩阵 qiuwanchi 利用伴随矩阵求逆矩阵
package gaodai.matrix; import gaodai.determinant.DeterminantCalculation; import java.util.ArrayList; import java.util.List; import java.util.Scanner; /** * 矩阵求逆(利用伴随矩阵) * @author 邱万迟
单例（Singleton）模式 aoyouzi 单例模式 Singleton
3.1 概述如果要保证系统里一个类最多只能存在一个实例时，我们就需要单例模式。这种情况在我们应用中经常碰到，例如缓存池，数据库连接池，线程池，一些应用服务实例等。在多线程环境中，为了保证实例的唯一性其实并不简单，这章将和读者一起探讨如何实现单例模式。 3.2
[开源与自主研发]就算可以轻易获得外部技术支持,自己也必须研发 comsci 开源
现在国内有大量的信息技术产品，都是通过盗版，免费下载，开源，附送等方式从国外的开发者那里获得的。。。。。。虽然这种情况带来了国内信息产业的短暂繁荣，也促进了电子商务和互联网产业的快速发展，但是实际上，我们应该清醒的看到，这些产业的核心力量是被国外的
页面有两个frame,怎样点击一个的链接改变另一个的内容 Array_06 UI XHTML
<a src="地址" targets="这里写你要操作的Frame的名字" />搜索然后你点击连接以后你的新页面就会显示在你设置的Frame名字的框那里 targerts="",就是你要填写目标的显示页面位置 ===================== 例如： <frame src=&
Struts2实现单个/多个文件上传和下载 oloz 文件上传 struts
struts2单文件上传：步骤01:jsp页面  　　<form action="fileUplo
推荐10个在线logo设计网站 362217990 logo
在线设计Logo网站。 1、http://flickr.nosv.org（这个太简单） 2、http://www.logomaker.com/?source=1.5770.1 3、http://www.simwebsol.com/ImageTool 4、http://www.logogenerator.com/logo.php?nal=1&tpl_catlist[]=2 5、ht
jsp上传文件香水浓 jsp fileupload
1. jsp上传 Notice： 1. form表单 method 属性必须设置为 POST 方法，不能使用 GET 方法 2. form表单 enctype 属性需要设置为 multipart/form-data 3. form表单 action 属性需要设置为提交到后台处理文件上传的jsp文件地址或者servlet地址。例如 uploadFile.jsp 程序文件用来处理上传的文
我的架构经验系列文章 - 前端架构 agevs JavaScript Web 框架 UI jQuer
框架层面：近几年前端发展很快，前端之所以叫前端因为前端是已经可以独立成为一种职业了，js也不再是十年前的玩具了，以前富客户端RIA的应用可能会用flash/flex或是silverlight，现在可以使用js来完成大部分的功能，因此js作为一门前端的支撑语言也不仅仅是进行的简单的编码，越来越多框架性的东西出现了。越来越多的开发模式转变为后端只是吐json的数据源，而前端做所有UI的事情。MVCMV
android ksoap2 中把XML(DataSet) 当做参数传递 aijuans android
我的android app中需要发送webservice ，于是我使用了 ksop2 进行发送，在测试过程中不是很顺利,不能正常工作.我的web service 请求格式如下 [html] view plain copy <Envelope xmlns="http://schemas.
使用Spring进行统一日志管理 + 统一异常管理 baalwolf spring
统一日志和异常管理配置好后，SSH项目中，代码以往散落的log.info() 和 try..catch..finally 再也不见踪影！统一日志异常实现类： [java] view plain copy package com.pilelot.web.util; impor
Android SDK 国内镜像 BigBird2012 android sdk
一、镜像地址： 1、东软信息学院的 Android SDK 镜像，比配置代理下载快多了。配置地址， http://mirrors.neusoft.edu.cn/configurations.we#android 2、北京化工大学的： IPV4:ubuntu.buct.edu.cn IPV4:ubuntu.buct.cn IPV6:ubuntu.buct6.edu.cn
HTML无害化和Sanitize模块 bijian1013 JavaScript AngularJS Linky Sanitize
一.ng-bind-html、ng-bind-html-unsafe AngularJS非常注重安全方面的问题，它会尽一切可能把大多数攻击手段最小化。其中一个攻击手段是向你的web页面里注入不安全的HTML，然后利用它触发跨站攻击或者注入攻击。考虑这样一个例子，假设我们有一个变量存
[Maven学习笔记二]Maven命令 bit1129 maven
mvn compile compile编译命令将src/main/java和src/main/resources中的代码和配置文件编译到target/classes中，不会对src/test/java中的测试类进行编译 MVN编译使用 maven-resources-plugin:2.6:resources maven-compiler-plugin:2.5.1:compile &nbs
【Java命令二】jhat bit1129 Java命令
jhat用于分析使用jmap dump的文件，，可以将堆中的对象以html的形式显示出来，包括对象的数量，大小等等，并支持对象查询语言。 jhat默认开启监听端口7000的HTTP服务，jhat是Java Heap Analysis Tool的缩写 1. 用法： [hadoop@hadoop bin]$ jhat -help Usage: jhat [-stack <bool&g
JBoss 5.1.0 GA:Error installing to Instantiated: name=AttachmentStore state=Desc ronin47
进到类似目录 server/default/conf/bootstrap，打开文件 profile.xml找到： Xml代码<bean name="AttachmentStore" class="org.jboss.system.server.profileservice.repository.AbstractAtta
写给初学者的6条网页设计安全配色指南 brotherlamp UI ui自学 ui视频 ui教程 ui资料
网页设计中最基本的原则之一是，不管你花多长时间创造一个华丽的设计，其最终的角色都是这场秀中真正的明星——内容的衬托我仍然清楚地记得我最早的一次美术课，那时我还是一个小小的、对凡事都充满渴望的孩子，我摆放出一大堆漂亮的彩色颜料。我仍然记得当我第一次看到原色与另一种颜色混合变成第二种颜色时的那种兴奋，并且我想，既然两种颜色能创造出一种全新的美丽色彩，那所有颜色
有一个数组，每次从中间随机取一个，然后放回去，当所有的元素都被取过，返回总共的取的次数。写一个函数实现。复杂度是什么。 bylijinnan java 算法面试
import java.util.Random; import java.util.Set; import java.util.TreeSet; /** * http://weibo.com/1915548291/z7HtOF4sx * #面试题#有一个数组，每次从中间随机取一个，然后放回去，当所有的元素都被取过，返回总共的取的次数。 * 写一个函数实现。复杂度是什么
struts2获得request、session、application方式 chiangfai application
1、与Servlet API解耦的访问方式。 a.Struts2对HttpServletRequest、HttpSession、ServletContext进行了封装，构造了三个Map对象来替代这三种对象要获取这三个Map对象，使用ActionContext类。 -----> package pro.action; import java.util.Map; imp
改变python的默认语言设置 chenchao051 python
import sys sys.getdefaultencoding() 可以测试出默认语言，要改变的话，需要在python lib的site-packages文件夹下新建： sitecustomize.py，这个文件比较特殊，会在python启动时来加载，所以就可以在里面写上： import sys sys.setdefaultencoding('utf-8') &n
mysql导入数据load data infile用法 daizj mysql 导入数据
我们常常导入数据！mysql有一个高效导入方法，那就是load data infile 下面来看案例说明基本语法： load data [low_priority] [local] infile 'file_name txt' [replace | ignore] into table tbl_name [fields [terminated by't'] [OPTI
phpexcel导入excel表到数据库简单入门示例 dcj3sjt126com PHP Excel
跟导出相对应的，同一个数据表，也是将phpexcel类放在class目录下，将Excel表格中的内容读取出来放到数据库中 <?php error_reporting(E_ALL); set_time_limit(0); ?> <html> <head> <meta http-equiv="Content-Type"
22岁到72岁的男人对女人的要求 dcj3sjt126com
22岁男人对女人的要求是：一，美丽，二，性感，三，有份具品味的职业，四，极有耐性，善解人意，五，该聪明的时候聪明，六，作小鸟依人状时尽量自然，七，怎样穿都好看，八，懂得适当地撒娇，九，虽作惊喜反应，但看起来自然，十，上了床就是个无条件荡妇。 32岁的男人对女人的要求，略作修定，是：一，入得厨房，进得睡房，二，不必服侍皇太后，三，不介意浪漫蜡烛配盒饭，四，听多过说，五，不再傻笑，六，懂得独
Spring和HIbernate对DDM设计的支持 e200702084 DAO 设计模式 spring Hibernate 领域模型
A：数据访问对象 DAO和资源库在领域驱动设计中都很重要。DAO是关系型数据库和应用之间的契约。它封装了Web应用中的数据库CRUD操作细节。另一方面，资源库是一个独立的抽象，它与DAO进行交互，并提供到领域模型的“业务接口”。资源库使用领域的通用语言，处理所有必要的DAO，并使用领域理解的语言提供对领域模型的数据访问服务。
NoSql 数据库的特性比较 geeksun NoSQL
Redis 是一个开源的使用ANSI C语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库，并提供多种语言的API。目前由VMware主持开发工作。 1. 数据模型作为Key-value型数据库，Redis也提供了键（Key）和值（Value）的映射关系。除了常规的数值或字符串，Redis的键值还可以是以下形式之一： Lists （列表） Sets
使用 Nginx Upload Module 实现上传文件功能 hongtoushizi nginx
转载自： http://www.tuicool.com/wx/aUrAzm 普通网站在实现文件上传功能的时候，一般是使用Python，Java等后端程序实现，比较麻烦。Nginx有一个Upload模块，可以非常简单的实现文件上传功能。此模块的原理是先把用户上传的文件保存到临时文件，然后在交由后台页面处理，并且把文件的原名，上传后的名称，文件类型，文件大小set到页面。下
spring-boot-web-ui及thymeleaf基本使用 jishiweili spring thymeleaf
视图控制层代码demo如下： @Controller @RequestMapping("/") public class MessageController { private final MessageRepository messageRepository; @Autowired public MessageController(Mes
数据源架构模式之活动记录 home198979 PHP 架构活动记录数据映射
hello!架构一、概念活动记录（Active Record）：一个对象，它包装数据库表或视图中某一行，封装数据库访问，并在这些数据上增加了领域逻辑。对象既有数据又有行为。活动记录使用直截了当的方法，把数据访问逻辑置于领域对象中。二、实现简单活动记录活动记录在php许多框架中都有应用，如cakephp。 <?php /** * 行数据入口类 *
Linux Shell脚本之自动修改IP pda158 linux centos Debian 脚本
作为一名 Linux SA，日常运维中很多地方都会用到脚本，而服务器的ip一般采用静态ip或者MAC绑定，当然后者比较操作起来相对繁琐，而前者我们可以设置主机名、ip信息、网关等配置。修改成特定的主机名在维护和管理方面也比较方便。如下脚本用途为：修改ip和主机名等相关信息，可以根据实际需求修改，举一反三！ #!/bin/sh #auto Change ip netmask ga
开发环境搭建独浮云 eclipse jdk tomcat
最近在开发过程中，经常出现MyEclipse内存溢出等错误，需要重启的情况，好麻烦。对于一般的JAVA+TOMCAT项目开发，其实没有必要使用重量级的MyEclipse，使用eclipse就足够了。尤其是开发机器硬件配置一般的人。 &n