嘛里嘛里哄

R语言数据科学分类预测（一）

数据科学与机器学习案例之客户的信用风险与预测

数据科学与机器学习之信用卡欺诈识别（严重类失衡数据建模)

数据科学与机器学习案例之汽车目标客户销售策略研究

数据科学与机器学习案例之WiFi定位系统的位置预测

数据科学与机器学习案例之Stacking集成方法对鸢尾花进行分类

数据科学案例之生存分析与二手车定价

R数据科学分类预测

Logistic regression
- all variable model
- some selected feature model
randomForest
- all variable model
- best variable model
svm
- all variable model and best variable model

Logistic regression

数据我们会在文章的末尾提供下载，我们使用此部分数据进行分类，此篇博客中我们使用了四种方法进行分类预测。
数据处理

. <- 'E:\\浏览器下载\\Code\\Code\\机器学习'

load('数据.RData')
str(df) #查看数据

library(ggplot2)
library(Rmisc)
library(caret)
library(randomForest)
library(e1071)
library(class)
library(gmodels)
library(kernlab)
library(ROCR)
library(RColorBrewer)

class.discrete <- c()
for(variable in colnames(df)){
   if(length(unique(df[[variable]])) <= 4) class.discrete <- c(class.discrete,variable)}

length(class)

class.continue <- colnames(df)[! colnames(df) %in% class.discrete]

factor.discrete <- function(class.discrete){
       for(variable in class.discrete){
           df[[variable]] <<- as.factor(df[[variable]])}}

scale.continue <- function(class.continue){
      for(variable in class.continue){
         df[[variable]] <<- scale(df[[variable]],T,T)}}

p <- vector(mode = 'list',3)
head(class.continue,3)
apply(df[,class.continue],2,range)
col <- brewer.pal(9, 'Blues')

p[[1]] <- ggplot(df,aes(x = age))+
geom_histogram(binwidth = 5,colour = 'black',fill = '#08306B')

p[[2]] <- ggplot(df,aes(x = credit.duration.months))+
geom_histogram(binwidth = 5,colour = 'black',fill = '#08519C')

p[[3]] <- ggplot(df,aes(x = credit.amount))+
geom_histogram(binwidth = 500,colour = 'black',fill = '#08519C')

multiplot(plotlist = p[1:3], layout = matrix(c(1,2,3,3), nrow = 2))

setwd('C:\\Users\\Pictures')
svg(file = 'p.svg',height = 10,width = 10)
multiplot(plotlist = p[1:3], layout = matrix(c(1,2,3,3), nrow = 2))
dev.off()

setwd(.)

factor.discrete(class.discrete)
scale.continue(class.continue)
str(df)

all variable model

num <- sample(1:nrow(df),size = 0.6 * nrow(df))
train <- df[num,]
table(df$credit.rating)
temp1 <- which(df$credit.rating == 0)
temp2 <- which(df$credit.rating == 1)
temp1 <- sample(temp1,0.4 * nrow(df) / 2)
temp2 <- sample(temp2,0.4 * nrow(df) / 2)
num.test <- c(temp1,temp2)
test <- df[num.test,] #划分训练集与测试集

fun <- function(data){#自编类似于py中的classification_report函数
         temp <- table(data[,1],data[,2])
         precision <- diag(temp) / apply(temp,2,sum)
         recall <- diag(temp) / apply(temp,1,sum)
         F1 = 2 / (1 / precision + 1 / recall)
         return(data.frame(F1,recall,precision))}

formula <- 'credit.rating ~.'
formula <- as.formula(formula)
lr.model.all <- glm(formula,train,family = 'binomial') #all variable lr model 
summary(lr.model.all)

lr.model.all.train.predictions <- predict(lr.model.all,train,type = 'response')
lr.model.all.train.predictions <- round(lr.model.all.train.predictions)
data <- data.frame(train[,1],lr.model.all.train.predictions)
fun(data)
lr.model.all.train.predictions <- predict(lr.model.all,train,type = 'response')
lr.model.all.train.predictions <- round(lr.model.all.train.predictions)
data <- data.frame(train[,1],lr.model.all.train.predictions)
fun(data)
lr.model.all.train.predictions <- predict(lr.model.all,train,type = 'response')
lr.model.all.train.predictions <- round(lr.model.all.train.predictions)
data <- data.frame(train[,1],lr.model.all.train.predictions)
fun(data) #训练集
         F1    recall precision
0 0.6109325 0.5337079 0.7142857
1 0.8638920 0.9099526 0.8222698

lr.model.all.predictions <- predict(lr.model.all,test,type = 'response')
lr.model.all.predictions <- round(lr.model.all.predictions)
data <- data.frame(test[,1],lr.model.all.predictions)
fun(data) #测试集
         F1 recall precision
0 0.5615142  0.445 0.7606838
1 0.7122153  0.860 0.6077739

some selected feature model

formula.lr.best <- 'credit.rating ~ account.balance + credit.duration.months + credit.amount + previous.credit.payment.status + savings + current.assets + age + guarantor + bank.credits + telephone'
formula.lr.best <- as.formula(formula.lr.best)
lr.model.best <- glm(formula.lr.best,train,family = 'binomial')
summary(lr.model.best)

lr.model.best.train.predictions <- predict(lr.model.best,train,type = 'response')
lr.model.best.train.predictions <- round(lr.model.best.train.predictions)
data <- data.frame(train[,1],lr.model.best.train.predictions)
fun(data) #训练集
         F1    recall precision
0 0.5102041 0.4213483 0.6465517
1 0.8410596 0.9028436 0.7871901

lr.model.best.predictions <- predict(lr.model.best,test,type = 'response')
lr.model.best.predictions <- round(lr.model.best.predictions)
data <- data.frame(test[,1],lr.model.best.predictions)
fun(data) #测试集
        F1 recall precision
0 0.5066667   0.38 0.7600000
1 0.7040000   0.88 0.5866667

ROC曲线

plot(lr.model.all.perf,col = '#E64B35FF',lty = 1,lwd = 2,main = "ROC曲线",xlab = "fpr",ylab = 'tpr')
lines(x = lr.model.best.perf@x.values[[1]],y = lr.model.best.perf@y.values[[1]],col = '#00A087FF',lty = 2,lwd = 2)
abline(0,1,col = 'black')
auc <- performance(lr.model.all.predictions,'auc')
auc <- unlist(slot(auc,'y.values'))
auc <- round(auc,2)
auc1 <- performance(lr.model.best.predictions,'auc')
auc1 <- unlist(slot(auc1,'y.values'))
auc1 <- round(auc1,2)
legend('topright',legend = c('auc',
       paste(c(auc,auc1))),col = c('#ffffff','#E64B35FF','#00A087FF'),
       lty = c(1,1,2))

randomForest

all variable model

formula.rf.all <- 'credit.rating ~.'
formula.rf.all <- as.formula(formula.rf.all)

rf.model.all <- randomForest(formula.rf.all,data = train,importance=T, proximity=T)
rf.model.all.train.predictions <- predict(rf.model.all,train,type = 'class')
data <- data.frame(train[,1],rf.model.all.train.predictions)
fun(data) #训练集
 F1 recall precision
0  1      1         1
1  1      1         1

rf.model.all.predictions <- predict(rf.model.all,test,type = 'class')
data <- data.frame(test[,1],rf.model.all.predictions)
fun(data) #测试集
         F1 recall precision
0 0.8034682  0.695 0.9520548
1 0.8502203  0.965 0.7598425

best variable model

formula.rf.best <- 'credit.rating ~ account.balance + credit.duration.months + credit.amount + previous.credit.payment.status + savings + current.assets + age + guarantor + bank.credits + telephone'
formula.rf.best <- as.formula(formula.rf.best)

rf.model.best <- randomForest(formula.rf.best,train,importance=T, proximity=T)
rf.model.best.train.predictions <- predict(rf.model.best,train,type = 'class')
data <- data.frame(train[,1],rf.model.best.train.predictions)
fun(data) #训练集
 F1 recall precision
0  1      1         1
1  1      1         1

rf.model.best.predictions <- predict(rf.model.best,test,type = 'class')
data <- data.frame(test[,1],rf.model.all.predictions)
fun(data) #测试集
        F1 recall precision
0 0.8034682  0.695 0.9520548
1 0.8502203  0.965 0.7598425


nodesize.vals <- c(2, 3, 4, 5)
ntree.vals <- c(200, 500, 1000, 2000)
tuning.results <- tune.randomForest(formula.rf.best, 
                             data = train,
                             mtry=3, 
                             nodesize=nodesize.vals,
                             ntree=ntree.vals) #寻找最优参数
print(tuning.results)

rf.model.best <- tuning.results$best.model

rf.model.best.train.predictions <- predict(rf.model.best,train,type = 'class')
data <- data.frame(train[,1],rf.model.best.train.predictions)
fun(data) #训练集
        F1    recall precision
0 0.9317507 0.8820225 0.9874214
1 0.9733488 0.9952607 0.9523810

rf.model.best.predictions <- predict(rf.model.best,test,type = 'class')
data <- data.frame(test[,1],rf.model.all.predictions)
fun(data)
        F1 recall precision
0 0.8034682  0.695 0.9520548
1 0.8502203  0.965 0.7598425

ROC曲线

plot(rf.model.all.perf,col = 'red',lty = 1,lwd = 2,main = "ROC曲线",xlab = "fpr",ylab = 'tpr')
lines(x = rf.model.best.perf@x.values[[1]],y = rf.model.best.perf@y.values[[1]],col = 'blue',lty = 2,lwd = 2)
abline(0,1,col = 'black')
auc <- performance(rf.model.all.predictions,'auc')
auc <- unlist(slot(auc,'y.values'))
auc <- round(auc,2)
auc1 <- performance(rf.model.best.predictions,'auc')
auc1 <- unlist(slot(auc1,'y.values'))
auc1 <- round(auc1,2)
legend('topright',legend = c('auc',
       paste(c(auc,auc1))),col = c('#ffffff','red','blue'),
       lty = c(1,1,2))

svm

all variable model and best variable model

formula.svm.all <- 'credit.rating ~. '
formula.svm.all <- as.formula(formula.svm.all)

svm.model.all <- svm(formula.svm.all,train,kernel="radial", cost=100, gamma=1)
svm.model.all.train.predictions <- predict(svm.model.all,train[,-1])
data <- data.frame(train[,1],svm.model.all.train.predictions)
fun(data)
  F1 recall precision
0  1      1         1
1  1      1         1

svm.model.predictions <- predict(svm.model.all,test[,-1])
data <- data.frame(test[,1],svm.model.predictions)
fun(data)
         F1 recall precision
0 0.7138264  0.555 1.0000000
1 0.8179959  1.000 0.6920415


formula.init <- "credit.rating ~ ."
formula.init <- as.formula(formula.init)
control <- trainControl(method="repeatedcv", number=10, repeats=2)
model <- train(formula.init, data=train, method="svmRadial", 
               trControl=control)
importance <- varImp(model, scale=FALSE)
plot(importance, cex.lab=0.5)

rownames(importance$importance)

formula.svm.best <- 'credit.rating ~ account.balance + credit.duration.months + previous.credit.payment.status + credit.purpose + credit.amount + savings + employment.duration + installment.rate + marital.status + guarantor'
formula.svm.best <- as.formula(formula.svm.best)

svm.model.best <- svm(formula.svm.best,train,kernel="radial", cost=100, gamma=1)
svm.model.best.train.predictions <- predict(svm.model.best,train[,-1])
data <- data.frame(train[,1],svm.model.best.train.predictions)

svm.model.best.predictions <- predict(svm.model.best,test[,-1])
data <- data.frame(test[,1],svm.model.best.predictions)
fun(data)

cost.weights <- c(0.1, 10, 100) #寻找最优参数
gamma.weights <- c(0.01, 0.25, 0.5, 1)
tuning.results <- tune(svm, formula.svm.best, 
                       data = train, kernel="radial", 
                       ranges=list(cost=cost.weights, gamma=gamma.weights))
svm.model.best <- tuning.results$best.model

svm.model.best.train.predictions <- predict(svm.model.best,train[,-1])
data <- data.frame(train[,1],svm.model.best.train.predictions)
fun(data)
      F1    recall precision
0 0.5204461 0.3977273 0.7526882
1 0.8614393 0.9457547 0.7909270

svm.model.best.predictions <- predict(svm.model.best,test[,-1],type = 'prob')
data <- data.frame(test[,1],svm.model.best.predictions)
fun(data)
        F1 recall precision
0 0.5460751  0.400 0.8602151
1 0.7376726  0.935 0.6091205

ROC曲线

svm.model.all.predictions <- predict(svm.model.all,test[,-1],decision.values = T)
svm.model.all.predictions.values <- attributes(svm.model.all.predictions)$decision.values
svm.model.all.predictions <- prediction(svm.model.all.predictions.values,test[,1])

svm.model.best.predictions <- predict(svm.model.best,test[,-1],decision.values = T)
svm.model.best.predictions.values <- attributes(svm.model.best.predictions)$decision.values
svm.model.best.predictions <- prediction(svm.model.best.predictions.values,test[,1])

svm.model.all.perf <- performance(svm.model.all.predictions,'tpr','fpr')
svm.model.best.perf <- performance(svm.model.best.predictions,'tpr','fpr')

plot(svm.model.all.perf,col = 'red',lty = 1,lwd = 2,main = "ROC曲线",xlab = "fpr",ylab = 'tpr')
lines(x = svm.model.best.perf@x.values[[1]],y = svm.model.best.perf@y.values[[1]],col = 'blue',lty = 2,lwd = 2)
abline(0,1,col = 'black')
auc <- performance(svm.model.all.predictions,'auc')
auc <- unlist(slot(auc,'y.values'))
auc <- round(auc,2)
auc1 <- performance(svm.model.best.predictions,'auc')
auc1 <- unlist(slot(auc1,'y.values'))
auc1 <- round(auc1,2)
legend('topright',legend = c('auc',
       paste(c(auc,auc1))),col = c('#ffffff','red','blue'),
       lty = c(1,1,2))

总结:相较于线性分类算法，集成学习方法可以获得更好的预测效果。
数据下载：整理好会传到GitHub数据下载

基于大模型的腮腺多形性腺瘤全周期诊疗方案研究报告 LCG元围术期危险因子预测模型研究人工智能
目录一、引言1.1研究背景与目的1.2研究现状与趋势二、大模型预测原理与方法2.1大模型概述2.2数据收集与预处理2.3模型训练与优化三、术前预测与评估3.1肿瘤特征预测3.2风险评估3.3案例分析四、术中方案制定与实施4.1手术方案选择4.2面神经保护策略4.3麻醉方案确定五、术后恢复与并发症预测5.1恢复情况预测5.2并发症风险预测5.3案例分析六、术后护理与康复6.1护理措施6.2康复训练6
【考研计算机网络】课堂笔记1 第一章概述刘鑫磊up #操作系统计算机网络计算机网络
文章目录：一：计算机网络的概述1.计算机网络的基本概念2.计算机网络的组成3.计算机网络的功能4.计算机网络的分类4.1分布范围分类4.2传输技术分类4.3按照拓扑结构分类4.4按照使用者分类4.5按照传输介质分类二：计算机网络的标准化工作及相关组织三：计算机网络的性能指标速率kb千Mb兆Gb吉Tb太的单位换算存储容量KBMBGBTB的单位换数四：网络分层五：计算机网络协议、接口、服务的概念1.协
【IDEA】IDEA常用快捷键（适应包括xml所有类型文件） Ctrl Z. intellij-idea xml java
IntellijIDEA快速编写代码sout等价于System.out.println();soutp等价于System.out.println(“”);soutv等价于System.out.println(“变量名=”+变量);soutm等价于System.out.println(“当前类名.当前方法”);psvm等价于publicstaticvoidmain(String[]args){}In
知识库在意图识别中扮演着**数据支撑**和**语义理解辅助**的双重角色 PersistDZ 大数据与AI 人工智能
知识库在意图识别中扮演着数据支撑和语义理解辅助的双重角色，而训练智能客服的意图识别Agent需要结合知识库的结构化数据与机器学习技术。以下是详细解析：一、知识库在意图识别中的作用1.提供标注数据意图标签定义：知识库中存储了预先定义的意图分类体系（如“订单查询”“退换货”“投诉”等），为模型提供明确的训练目标。标注样本：知识库包含大量用户对话历史及其对应的意图标签，是训练监督学习模型的核心数据源。2
Trae AI 上新 SSHremote：服务器 Python 接口日志排查实战指南芯作者 DD：日记人工智能深度学习机器学习
在当今的软件开发中，服务器端的稳定性和可靠性至关重要。然而，生产环境中的问题往往难以预测，尤其是接口返回502错误却无日志记录的情况，更是让开发者头疼不已。幸运的是，字节跳动推出的AI原生IDE——Trae，近期上线的SSHremote功能，为远程服务器日志排查提供了全新的解决方案。本文将结合实战案例，深入探讨如何利用TraeAI的SSHremote功能高效排查Python接口日志问题，并分享创新
主流区块链平台对 EVM 的依赖情况分类说明倒霉男孩区块链知识区块链
文章目录概要1.EVM兼容链BinanceSmartChain(BSC)Polygon(PoS链)AvalancheC-ChainFantomOptimism/Arbitrum2.非EVM链3.混合型链AvalanchePolygonSupernetsBNBChain概要1.EVM兼容链这些链直接支持以太坊虚拟机，开发者可用Solidity编写合约，并复用以太坊工具链：BinanceSmartCh
Web自动化测试（一）树的鲨鱼前端自动化功能测试
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档Web自动化测试（一）前言一、自动化相关理论1.什么是自动化以及它的好处2.什么是软件测试3.什么是自动化测试4.自动化测试能解决什么问题4.自动化测试分类5.什么Web项目适合做自动化测试6.Web自动化测试所属分类7.主流的Web自动化测试化工具二、Selenium1.特点2.发展历程3.环境搭建4.第一个案例三、Selenium
Moodle + Websoft9：创新教育的强大组合，助力教学与学习开源软件
Moodle+Websoft9：构建未来课堂的技术基石一、Moodle：开源生态的深度解析•模块化设计：支持超800个官方插件，如H5P交互内容创作、BigBlueButton虚拟课堂，满足个性化教学需求。•学习分析引擎：内置LearningAnalyticsAPI，可集成Python/R语言进行深度学习，预测学生学业风险。•移动优先战略：MoodleApp支持离线学习、扫码签到，2023年新增A
根据论文复现大模型方法以及出错处理技巧 Ai玩家hly 从0倒1 论文复现大模型复现 Ai大模型复现
复现一篇论文中的大模型搭建涉及以下几个关键步骤：理解论文的模型架构、数据集处理、超参数设置以及实验环境的搭建。这里给出一个基本的实现方法示例，假设我们选择复现一个图像分类任务中的经典模型，例如ResNet。实现步骤示例1.理解论文和模型架构选择一篇关于ResNet的论文作为示例，例如《DeepResidualLearningforImageRecognition》（Heetal.,2015）。2.
你准备好迎接它了吗？英伟达CEO黄仁勋预言：人形机器人将成为未来主流杰克尼机器人人工智能
在近日举行的“CadenceLIVE硅谷2024”大会上，英伟达公司的首席执行官黄仁勋与大会主办方Cadence公司的CEO进行了一场富有深度的对话。在这场引人瞩目的交流中，黄仁勋大胆预测，未来人形机器人将成为主流，引领科技发展的新潮流。你准备好迎接它了吗？英伟达CEO黄仁勋预言：人形机器人将成为未来主流©由18183手游网提供黄仁勋坚信，在不久的将来，我们所有人都都要制造的设备将会是人形机器人。
Matlab 基于最小二乘向量机 LSSVM + NSGAII 多目标优化算法的工艺参数优化前程算法屋私信获取源码工艺参数优化 matlab 算法多目标优化
Matlab基于最小二乘向量机LSSVM+NSGAII多目标优化算法的工艺参数优化一、引言1.1研究背景与意义在现代工业生产中，工艺参数优化占据着举足轻重的地位。它犹如工业生产的核心引擎，直接影响着企业的生产效率、产品质量以及成本控制。从生产效率角度看，优化工艺参数能够显著提升生产速度。合理的参数设置可使生产设备处于最佳运行状态，减少不必要的停机与等待时间，让生产流程更加顺畅。以汽车制造业为例，通
【MALTAB递归预测未来】VMD-Bayes-LSTM单变量时序预测-递归预测未来 (单输入单输出) 前程算法屋私信获取源码 lstm 人工智能 rnn
VMD-Bayes-LSTM单变量时序预测递归预测未来MALTAB代码一、引言1.1单变量时序预测的背景和意义在当今快速发展的社会中，数据无处不在，而时间序列数据作为其中一种重要类型，在众多领域发挥着不可替代的作用。单变量时序预测，即对单一变量随时间变化趋势的预测，在工业、经济等领域具有极其重要的意义。工业生产是国民经济的支柱产业，其稳定运行对整个社会经济发展至关重要。在制造业中，设备是生产的基础
java毕业设计，在线水果商城系统爱编程的小哥 java毕设 java 课程设计 spring boot vue
天天生鲜在线商城系统技术解密|SpringBoot+Vue3企业级实战（附高并发场景解决方案）一、系统全景解读该系统是生鲜电商全流程解决方案，采用SpringBoot3+Vue3+ElementPlus技术栈，覆盖商品管理、智能分类、订单处理、用户画像等核心场景，通过RBAC权限控制+OSS图片存储+高并发库存管理三大技术亮点，日均支撑5000+商品、10万+订单的电商需求。系统以蓝白清新界面+实
Matlab基于BP神经网络与NSGA-II的多目标工艺参数优化方法天天酷科研工艺参数优化 matlab 神经网络工艺参数优化
Matlab基于BP神经网络与NSGA-II的多目标工艺参数优化方法一、方法原理与框架BP神经网络的作用BP神经网络通过建立工艺参数与目标性能（如翘曲变形、收缩率、硬度等）之间的非线性映射关系，作为代理模型替代复杂的物理仿真或实验。其优势在于：能够处理多输入-多输出的复杂非线性关系，例如激光功率、扫描速度与熔覆层性能的关联。在注塑成型中，预测体积收缩率和翘曲变形的相对误差可控制在5%以内。通过正交
MySQL 面试题你曾经是少年 mysql 数据库
1.数据库基础问题：请解释数据库（DB）、数据库管理系统（DBMS）、SQL三者的区别。参考答案：DB：存储数据的结构化仓库DBMS：管理数据库的软件（如MySQL、Oracle）SQL：操作关系型数据库的标准化语言2.SQL分类问题：SQL分为哪几类？分别写出对应的关键字（至少3个）。参考答案：DDL：CREATE/DROP/ALTERDML：INSERT/UPDATE/DELETEDQL：SE
集成学习（Ensemble Learning）基础知识1 代码骑士 #机器学习集成学习机器学习人工智能
文章目录一、集成学习1、基本概念2、回顾:误差的偏差-方差分解3、为什么集成学习有效？4、基学习器：“好而不同”5、集成学习的两个基本问题（1）如何训练出具有差异性的多个基学习器？（2）如何将多个基学习器的预测结果集成为最终的强学习器预测结果？二、自助法（Bagging）1、Bagging2、BootstrapBootstrap采样的数学性质3、Bagging:集成学习的两个基本问题（1）如何训练
图像分割技术的应用不要不开心了计算机视觉 dash python
今天的内容为：图像分割技术与应用，以下是内容总结1.图像分割概述图像分割是指预测目标的轮廓，将不同的像素划分到不同的类别，属于非常细粒度的分类任务。其应用场景广泛，包括人像抠图、医学组织提取、遥感图像分析、自动驾驶、材料图像分析等。2.图像分割的前景与背景-物体（Things）：可数的前景目标，如行人、车辆等。-事物（Stuff）：不可数的背景，如天空、草地、路面等。3.图像分割的三层境界-语义分
202年充电计划——自学手册网络安全（黑客技术）网安康sir web安全安全网络 python linux
基于入门网络安全/黑客打造的：黑客&网络安全入门&进阶学习资源包前言什么是网络安全网络安全可以基于攻击和防御视角来分类，我们经常听到的“红队”、“渗透测试”等就是研究攻击技术，而“蓝队”、“安全运营”、“安全运维”则研究防御技术。如何成为一名黑客很多朋友在学习安全方面都会半路转行，因为不知如何去学，在这里，我将这个整份答案分为黑客（网络安全）入门必备、黑客（网络安全）职业指南、黑客（网络安全）学习
自学网络安全（黑客技术）2025年 —90天学习计划网安CILLE web安全学习安全网络网络安全
基于入门网络安全/黑客打造的：黑客&网络安全入门&进阶学习资源包前言什么是网络安全网络安全可以基于攻击和防御视角来分类，我们经常听到的“红队”、“渗透测试”等就是研究攻击技术，而“蓝队”、“安全运营”、“安全运维”则研究防御技术。如何成为一名黑客很多朋友在学习安全方面都会半路转行，因为不知如何去学，在这里，我将这个整份答案分为黑客（网络安全）入门必备、黑客（网络安全）职业指南、黑客（网络安全）学习
Python逆向爬取Tik Tok，MsToken,X-Bogus以及signature 才华是浅浅的耐心 python javascript 前端
自5月起，抖音正式开放Web接口，并不断升级风控机制。从最初的_signature参数，到增加滑块验证，再到如今的JSVM混淆处理，以及mstoken和x-bougs等参数的引入。分析发现，部分国内接口仅需提供Cookie即可访问，无需额外验签，而获取Cookie的方式多种多样，其中利用OpenCV识别滑块验证码是一种简单可行的方法。相比之下，TikTok的接口无需Cookie，但对签名的校验更加
uni-app——计时器和界面交互API 阿常11 uni-app移动应用开发 uni-app
API基本概要概念说明API（应用程序接口）是预先定义的方法集合，用于实现特定功能。在uni-app中，通过全局对象uni调用API，例如uni.getSystemInfoSync获取设备信息。API分类与调用规则事件监听型以on开头，如uni.onNetworkStatusChange监听网络变化。数据操作型获取数据：以get开头，如uni.getStorage读取本地缓存。设置数据：以set开
【高考志愿】数学大雨淅淅程序人生高考
目录一、数学专业概述1.1学科特点1.2课程设置1.3学习方法1.4数学专业的分类二、就业前景三、填报建议四、注意事项五、数学专业排名一、数学专业概述1.1学科特点数学专业作为一门基础学科，具有高度的抽象性、逻辑性和精确性。它要求学生具备良好的数学基础、逻辑思维能力和解决问题的能力。因此，选择数学专业的学生需要有较强的数学兴趣和扎实的数学基础。1.2课程设置数学专业的课程设置通常包括数学分析、高等
五、AIGC大模型_08Agent基础知识学不会lostfound AI 人工智能 agent 不同生命周期的知识用AI处理 AIGC
0、概述根据知识的生命周期分类，我们通常会采取不同的方法（微调、RAG、Agent）来将知识融入到AI中0.1长生命周期知识这类知识通常具有较高的稳定性和通用性，不会因时间的推移而轻易改变。它们是知识体系中的“基石”，在较长时间内保持有效性和价值。特点：稳定性强：如数学定理、物理公式等，这些知识经过长期验证，具有高度的确定性和普适性基础性强：往往是学习和研究其他知识的基础，例如教科书中的基础知识更
SMOTE算法的改进与扩展 Java 第一深情不平衡数据分类机器学习人工智能
一、SMOTE的改进算法1、Boderline-SMOTE只考虑分布在分类边界附近的少数类样本，并将其作为根样本首先通过k-NN方法将原始数据中的少数类样本划分成“Safe”、“Danger”和“Noise”3类，其中“Danger”类样本是指靠近分类边界的样本。对属于“Danger”类少数类样本进行过采样，可增加用于确定分类边界的少数类样本。这样做可以增加这些关键区域的少数类样本数量，使得模型在
字符函数和字符串函数很会做人算法
一、字符分类函数头文件是#include下面是函数的使用条件，有x的就代表只要符合体条件就返回真我们以islower为例写一段代码实现一下功能:将小写字符改成大写字符#define_CRT_SECURE_NO_WARNINGS#include#includeintmain(){inti=0;chararr[20]={"aJsfjsJsfH"};while(arr[i]!='\0'){if(islo
基于传感器数据的城市空气质量预测与污染源分类云端.代码农夫CloudFarmer 分类数据挖掘人工智能
项目名称：基于传感器数据的城市空气质量预测与污染源分类创新点：结合时间序列预测（回归）与污染源分类（多标签分类），使用公开API获取实时数据。项目目标预测未来6小时的空气质量指数（AQI）。根据传感器数据判断可能的污染源类型（如工业排放、交通尾气、扬尘等）。数据集来源数据获取：通过开放API实时抓取（如OpenAQ、AirNow或国内公开的城市空气质量平台）。特征示例：PM2.5、PM10、SO2
C# 正则表达式的详细使用说明生命不息-学无止境 C#理论知识 c#正则表达式
正则表达式基础概念正则表达式是一种用于匹配文本模式的工具。它是由普通字符（例如字母、数字）和特殊字符（称为元字符）组成的字符串模式。在C#中，主要通过System.Text.RegularExpressions命名空间来使用正则表达式。元字符表格显示：分类正则表达式字符描述示例字符类.匹配除换行符之外的任意单个字符a.b可匹配aab、acb等[abc]匹配字符a、b或c中的任意一个[abc]可匹配
力扣算法Hot100——75. 颜色分类飞奔的马里奥算法 leetcode java
解法1：当然可以冒泡排序，时间复杂度O(n2n^2n2)解法2：单指针循环两次，第一次循环将所有的0交换到前面；第二次循环将所有的1交换到0的后面classSolution{publicvoidsortColorsBySinglePointer(int[]nums){intzeroCnt=0,p=0;for(inti=0;i
一文搞懂大数据神器Spark，真的太牛了！ qq_23519469 大数据 spark 分布式
Spark是什么在如今这个大数据时代，数据量呈爆炸式增长，传统的数据处理方式已经难以满足需求。就拿电商平台来说，每天产生的交易数据、用户浏览数据、评论数据等，数量巨大且种类繁多。假如要对这些数据进行分析，比如分析用户的购买行为，找出最受欢迎的商品，预测未来的销售趋势等，用普通的单机处理方式，可能需要花费很长时间，甚至根本无法完成。这时，Spark就应运而生了。Spark是一个开源的、基于内存计算的
Mysql相关知识：存储引擎、sql执行流程、索引失效 Cachel wood sql语言 sql server +mysql mysql sql android ab测试算法人工智能前端框架
文章目录MySQL存储引擎一、MySQL存储引擎概述二、常见存储引擎对比三、核心引擎详解1.InnoDB2.MyISAM四、如何选择存储引擎？五、引擎操作命令1.查看表的存储引擎2.修改表的存储引擎3.引擎与性能优化六、示例对比场景：频繁更新的订单表vs只读的产品分类表七、总结索引失效1.索引列使用函数或表达式2.隐式类型转换3.范围查询右侧的索引列失效4.模糊查询以通配符开头5.OR条件导致索引
springmvc 下 freemarker页面枚举的遍历输出杨白白 enum freemarker
spring mvc freemarker 中遍历枚举 1枚举类型有一个本地方法叫values（），这个方法可以直接返回枚举数组。所以可以利用这个遍历。 enum public enum BooleanEnum { TRUE(Boolean.TRUE, "是"), FALSE(Boolean.FALSE, "否");
实习简要总结 byalias 工作
来白虹不知不觉中已经一个多月了，因为项目还在需求分析及项目架构阶段，自己在这段时间都是在学习相关技术知识，现在对这段时间的工作及学习情况做一个总结：（1）工作技能方面大体分为两个阶段，Java Web 基础阶段和Java EE阶段 1）Java Web阶段在这个阶段，自己主要着重学习了 JSP, Servlet, JDBC, MySQL，这些知识的核心点都过了一遍，也
Quartz——DateIntervalTrigger触发器 eksliang quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208559 一.概述 simpleTrigger 内部实现机制是通过计算间隔时间来计算下次的执行时间，这就导致他有不适合调度的定时任务。例如我们想每天的 1：00AM 执行任务，如果使用 SimpleTrigger，间隔时间就是一天。注意这里就会有一个问题，即当有 misfired 的任务并且恢复执行时，该执行时间
Unix快捷键 18289753290 unix Unix；快捷键;
复制，删除，粘贴： dd:删除光标所在的行 &nbs
获取Android设备屏幕的相关参数酷的飞上天空 android
包含屏幕的分辨率以及屏幕宽度的最大dp 高度最大dp TextView text = (TextView)findViewById(R.id.text); DisplayMetrics dm = new DisplayMetrics(); text.append("getResources().ge
要做物联网？先保护好你的数据蓝儿唯美数据
根据Beecham Research的说法，那些在行业中希望利用物联网的关键领域需要提供更好的安全性。在Beecham的物联网安全威胁图谱上，展示了那些可能产生内外部攻击并且需要通过快速发展的物联网行业加以解决的关键领域。 Beecham Research的技术主管Jon Howes说：“之所以我们目前还没有看到与物联网相关的严重安全事件，是因为目前还没有在大型客户和企业应用中进行部署，也就
Java取模（求余）运算随便小屋 java
整数之间的取模求余运算很好求，但几乎没有遇到过对负数进行取模求余，直接看下面代码： /** * * @author Logic * */ public class Test { public static void main(String[] args) { // TODO A
SQL注入介绍 aijuans sql注入
二、SQL注入范例这里我们根据用户登录页面 <form action="" > 用户名：<input type="text" name="username"><br/> 密码：<input type="password" name="passwor
优雅代码风格 aoyouzi 代码
总结了几点关于优雅代码风格的描述：代码简单：不隐藏设计者的意图，抽象干净利落，控制语句直截了当。接口清晰：类型接口表现力直白，字面表达含义，API 相互呼应以增强可测试性。依赖项少：依赖关系越少越好，依赖少证明内聚程度高，低耦合利于自动测试，便于重构。没有重复：重复代码意味着某些概念或想法没有在代码中良好的体现，及时重构消除重复。战术分层：代码分层清晰，隔离明确，
布尔数组百合不是茶 java 布尔数组
androi中提到了布尔数组; 布尔数组默认的是false, 并且只会打印false或者是true 布尔数组的例子; 根据字符数组创建布尔数组 char[] c = {'p','u','b','l','i','c'}; //根据字符数组的长度创建布尔数组的个数 boolean[] b = new bool
web.xml之welcome-file-list、error-page bijian1013 java web.xml servlet error-page
welcome-file-list 1.定义： <welcome-file-list> <welcome-file>login.jsp</welcome> </welcome-file-list> 2.作用：用来指定WEB应用首页名称。 error-page1.定义： <error-page&g
richfaces 4 fileUpload组件删除上传的文件 sunjing clear Richfaces 4 fileupload
页面代码 <h:form id="fileForm"> <rich:
技术文章备忘 bit1129 技术文章
Zookeeper http://wenku.baidu.com/view/bab171ffaef8941ea76e05b8.html http://wenku.baidu.com/link?url=8thAIwFTnPh2KL2b0p1V7XSgmF9ZEFgw4V_MkIpA9j8BX2rDQMPgK5l3wcs9oBTxeekOnm5P3BK8c6K2DWynq9nfUCkRlTt9uV
org.hibernate.hql.ast.QuerySyntaxException: unexpected token: on near line 1解决方案白糖_ Hibernate
文章摘自：http://blog.csdn.net/yangwawa19870921/article/details/7553181 在编写HQL时，可能会出现这种代码： select a.name,b.age from TableA a left join TableB b on a.id=b.id 如果这是HQL，那么这段代码就是错误的，因为HQL不支持
sqlserver按照字段内容进行排序 bozch 按照内容排序
在做项目的时候，遇到了这样的一个需求：从数据库中取出的数据集，首先要将某个数据或者多个数据按照地段内容放到前面显示，例如:从学生表中取出姓李的放到数据集的前面； select * fro
编程珠玑-第一章-位图排序 bylijinnan java 编程珠玑
import java.io.BufferedWriter; import java.io.File; import java.io.FileWriter; import java.io.IOException; import java.io.Writer; import java.util.Random; public class BitMapSearch {
Java关于==和equals chenbowen00 java
关于==和equals概念其实很简单，一个是比较内存地址是否相同，一个比较的是值内容是否相同。虽然理解上不难，但是有时存在一些理解误区，如下情况： 1、 String a = "aaa"; a=="aaa"; ==> true 2、 new String("aaa")==new String("aaa
[IT与资本]软件行业需对外界投资热情保持警惕 comsci it
我还是那个看法,软件行业需要增强内生动力,尽量依靠自有资金和营业收入来进行经营,避免在资本市场上经受各种不同类型的风险,为企业自主研发核心技术和产品提供稳定,温和的外部环境... 如果我们在自己尚未掌握核心技术之前,企图依靠上市来筹集资金,然后使劲往某个领域砸钱,然
oracle 数据块结构 daizj oracle 块数据块块结构行目录
oracle 数据块是数据库存储的最小单位，一般为操作系统块的N倍。其结构为：块头－－〉空行－－〉数据，其实际为纵行结构。块的标准大小由初始化参数DB_BLOCK_SIZE指定。具有标准大小的块称为标准块（Standard Block）。块的大小和标准块的大小不同的块叫非标准块（Nonstandard Block）。同一数据库中，Oracle9i及以上版本支持同一数据库中同时使用标
github上一些觉得对自己工作有用的项目收集 dengkane github
github上一些觉得对自己工作有用的项目收集技能类 markdown语法中文说明回到顶部全文检索 elasticsearch bigdesk elasticsearch管理插件回到顶部 nosql mapdb 支持亿级别map, list, 支持事务. 可考虑做为缓存使用 C
初二上学期难记单词二 dcj3sjt126com english word
dangerous 危险的 panda 熊猫 lion 狮子 elephant 象 monkey 猴子 tiger 老虎 deer 鹿 snake 蛇 rabbit 兔子 duck 鸭 horse 马 forest 森林 fall 跌倒；落下 climb 爬；攀登 finish 完成；结束 cinema 电影院；电影 seafood 海鲜；海产食品 bank 银行
8、mysql外键(FOREIGN KEY)的简单使用 dcj3sjt126com mysql
一、基本概念 1、MySQL中“键”和“索引”的定义相同，所以外键和主键一样也是索引的一种。不同的是MySQL会自动为所有表的主键进行索引，但是外键字段必须由用户进行明确的索引。用于外键关系的字段必须在所有的参照表中进行明确地索引，InnoDB不能自动地创建索引。 2、外键可以是一对一的，一个表的记录只能与另一个表的一条记录连接，或者是一对多的，一个表的记录与另一个表的多条记录连接。 3、如
java循环标签 Foreach shuizhaosi888 标签 java循环 foreach
1. 简单的for循环 public static void main(String[] args) { for (int i = 1, y = i + 10; i < 5 && y < 12; i++, y = i * 2) { System.err.println("i=" + i + " y="
Spring Security（05）——异常信息本地化 234390216 exception Spring Security 异常信息本地化
异常信息本地化 Spring Security支持将展现给终端用户看的异常信息本地化，这些信息包括认证失败、访问被拒绝等。而对于展现给开发者看的异常信息和日志信息（如配置错误）则是不能够进行本地化的，它们是以英文硬编码在Spring Security的代码中的。在Spring-Security-core-x
DUBBO架构服务端告警Failed to send message Response javamingtingzhao 架构 DUBBO
废话不多说，警告日志如下，不知道有哪位遇到过，此异常在服务端抛出(服务器启动第一次运行会有这个警告)，后续运行没问题，找了好久真心不知道哪里错了。 WARN 2015-07-18 22:31:15,272 com.alibaba.dubbo.remoting.transport.dispatcher.ChannelEventRunnable.run(84)
JS中Date对象中几个用法 leeqq JavaScript Date 最后一天
近来工作中遇到这样的两个需求 1. 给个Date对象，找出该时间所在月的第一天和最后一天 2. 给个Date对象，找出该时间所在周的第一天和最后一天需求1中的找月第一天很简单，我记得api中有setDate方法可以使用使用setDate方法前，先看看getDate var date = new Date(); console.log(date); // Sat J
MFC中使用ado技术操作数据库你不认识的休道人 sql mfc
1.在stdafx.h中导入ado动态链接库 #import"C:\Program Files\Common Files\System\ado\msado15.dll" no_namespace rename("EOF","end")2.在CTestApp文件的InitInstance()函数中domodal之前写::CoIniti
Android Studio加速 rensanning android studio
Android Studio慢、吃内存！启动时后会立即通过Gradle来sync & build工程。（1）设置Android Studio a) 禁用插件 File -> Settings... Plugins 去掉一些没有用的插件。比如：Git Integration、GitHub、Google Cloud Testing、Google Cloud
各数据库的批量Update操作 tomcat_oracle java oracle sql mysql sqlite
MyBatis的update元素的用法与insert元素基本相同，因此本篇不打算重复了。本篇仅记录批量update操作的 sql语句，懂得SQL语句，那么MyBatis部分的操作就简单了。　　注意：下列批量更新语句都是作为一个事务整体执行，要不全部成功，要不全部回滚。 MSSQL的SQL语句　WITH R AS（　　SELECT 'John' as name, 18 as
html禁止清除input文本输入缓存 xp9802 input
多数浏览器默认会缓存input的值，只有使用ctl+F5强制刷新的才可以清除缓存记录。如果不想让浏览器缓存input的值，有2种方法：方法一：在不想使用缓存的input中添加 autocomplete="off"; eg: <input type="text" autocomplete="off" name

R语言数据科学分类预测（一）

R数据科学分类预测

Logistic regression

all variable model

some selected feature model

randomForest

all variable model

best variable model

svm

all variable model and best variable model

你可能感兴趣的:(R语言,r语言,svm,逻辑回归,随机森林,分类预测)