Chasing_Shadows

2018天池比赛首战落幕

印象盐城·数创未来大数据竞赛 - 盐城汽车上牌量预测

从本次经历来看这份成绩我还是满意的。

毕竟我并没有像那些大佬们从数据的行列之间进行关联性分析，独立性检验之类的专业技术流操作。我只是个机器学习的小浪花。

通过这次比赛，我明白了要更多的联系社会实际生活的话，还是需要时间序列这块的理论知识和技能手段作支撑才能走的更远。

接下来分享一下大佬做比赛的思路流程，我只是复现。

寒武纪の盐城车牌预测数据初探之三

麻婆豆腐

第一步导入数据

#调包侠

importpandas as pd

importmatplotlib.pyplot as plt

#第一步导入数据

dir ='data/'

train =pd.read_table(dir + 'train_20171215.txt',engine='python')

test_A =pd.read_table(dir + 'test_A_20171225.txt',engine='python')

sample_A =pd.read_table(dir + 'sample_A_20171225.txt',engine='python',header=None)

先查看数据train和test_A的数据样式

print("train.info():")

print(train.info())

print("test_A.info():")

print(test_A.info())

train.info():

RangeIndex: 4773entries, 0 to 4772

Data columns (total 4columns):

date 4773 non-null int64

day_of_week 4773 non-null int64

brand 4773 non-null int64

cnt 4773 non-null int64

dtypes: int64(4)

memory usage: 149.2KB

None

test_A.info():

RangeIndex: 276entries, 0 to 275

Data columns (total 2columns):

date 276 non-null int64

day_of_week 276 non-null int64

dtypes: int64(2)

memory usage: 4.4 KB

None

这里呈现给我们的train和test中字段形式并不一样，test中缺少了品牌即brand和需要预测的数量cnt（这个是合理的，因为需要预测）

通过对题目的阅读，第一赛季只需要预测量而不需要预测具体品牌的量，这样可以理解为，无论白猫还是黑猫，在一起就是两只猫。之后，数据类型是int64，即这个题目给我们的都是数值型的数据。

其中date根据题目，为脱敏数据，brand和cnt也是脱敏，但是dayofweek的值是真是反应星期的数值，首先观察一下这个唯一一个相对而言是真实值的值的形式

print(train['day_of_week'].unique())

print(test_A['day_of_week'].unique())

[3 4 5 6 7 1 2]

[4 5 6 1 2 3 7]

dow(dayofweek)的范围是1-7，可以理解为对应的周一到周日，也就是monday到sunday。

第二步：找出目标值（即需要我们预测的值）

这里，我们需要去观察目标值的范围变化，看一下目标值的大体趋势如何，首先以箱型图去观察一下目标值的变化。

箱形图有5个参数：
下边缘（Q1），表示最小值；
下四分位数（Q2），又称“第一四分位数”，等于该样本中所有数值由小到大排列后第25%的数字；
中位数（Q3），又称“第二四分位数”等于该样本中所有数值由小到大排列后第50%的数字；
上四分位数（Q4），又称“第三四分位数”等于该样本中所有数值由小到大排列后第75%的数字；
上边缘（Q5），表述最大值。
第三四分位数与第一四分位数的差距又称四分位间距。

功能：

1.为了反映原始数据的分布情况，比如数据的聚散情况和偏态。看看《统计学》这本书的插图

2..箱型图有个功能就是可以检测这组数据是否存在异常值。.箱型图有个功能就是可以检测这组数据是否存在异常值。

plt.boxplot(train['cnt'])

plt.show()

根据这个图，结合1所示的例子，大概可以估计出数据是右偏分布，以正态分布的角度观察，异常值存在于大于1000的地方，之后，绘制一个分布图，观察一下数据的分布。

importseaborn as sns

color =sns.color_palette()

sns.set_style('darkgrid')

from scipyimport stats

fromscipy.stats import norm, skew

sns.distplot(train['cnt'],fit=norm)

源代码，但是自己就是得不到结果（下图是大佬原图）

通过绘制分布图，可以看出来数据分布确实符合右偏分布，这里大概初步了解数据的分布尺度在 0 到 2000 左右，且在0-500/1000的数量最密集。

第三步：找出与目标最相关的变量X（即非目标值中找到与目标最相关的值）

因为数据本身与时间相关，所以我们可以绘制一下随脱敏时间和星期的变化

plt.plot(train['date'],train['cnt'])

plt.show()

结合箱图和分布图，可以确定，密集区域集中中500，之后我们以具体的数字反应意思刚才的图的信息。

print(train['cnt'].describe())

count 4773.000000

mean 380.567358

std 252.720918

min 12.000000

25% 221.000000

50% 351.000000

75% 496.000000

max 2102.000000

Name: cnt, dtype: float64

2）预测结果以mean square error作为评判标准，具体公式如下：

这里，可以以统计数据去确定一下，这些统计数据，在评测函数的指标。

fromsklearn.metrics import mean_squared_error

train['25%']= 221

train['50%']= 351

train['75%']= 496

train['median']= train['cnt'].median()

train['mean']= train['cnt'].mean()

print(mean_squared_error(train['cnt'],train['25%']))

print(mean_squared_error(train['cnt'],train['50%']))

print(mean_squared_error(train['cnt'],train['75%']))

print(mean_squared_error(train['cnt'],train['median']))

print(mean_squared_error(train['cnt'],train['mean']))

89316.2231301

64728.7100356

77179.1761995

64728.7100356

63854.4813732

可以大概看出来，由于存在异常点较多，导致统计量在时间轴上的表现并不是那么理想。现在还可以用的信息，只剩下了星期了，救命稻草之星期信息。

开始对星期信息统计，分别分析周一周五的分布情况

monday =train[train['day_of_week']==1]

plt.plot(range(len(monday)),monday['cnt'])

plt.show()

很明显了，可以把1-5和6，7分为两组去分析

简单分析一下按照星期的评测分数

res =train.groupby(['day_of_week'],as_index=False).cnt.mean()

xx =train.merge(res,on=['day_of_week'])

print(xx.head())

print('mse:',mean_squared_error(xx['cnt_x'],xx['cnt_y']))

mse明显小于之前的结果，所以这里暂时可以估计，以星期去统计分布。

# 因为第一赛季只是预测与时间相关的cnt的数量

# 所以可以对数据以dat和dow进行数据合并

train =train.groupby(['date','day_of_week'],as_index=False).cnt.sum()

plt.plot(train['day_of_week'],train['cnt'],'*')

plt.show()

这样很明显，看到在合并品牌之后，观察星期的分布情况，这样的观察，是观察周1-7的cnt的分布情况，可以初步认为距离密集区域较远的为异常数据。

for i inrange(7):

tmp = train[train['day_of_week']==i+1]

plt.subplot(7, 1, i+1)

plt.plot(tmp['date'],tmp['cnt'],'*')

plt.show()

从上往下分别是1，2，3，4，5，6，7这样就很清楚的看见了。

训练集和测试集的分布

这样，我们首先要做的就是线下的验证机，模拟线上的数据。

此时的数据就是按星期聚类之后的数据集。

xx_train =train[train['date']<=756]

xx_test =train[train['date']>756]

print('testshape',xx_test.shape)

print('trainshape',xx_train.shape)

方案零：均值大法（原始数据验证）

# 线下统计每周的均值数据，不加权

xx_train =xx_train.groupby(['day_of_week'],as_index=False).cnt.mean()

xx_result =pd.merge(xx_test,xx_train,on=['day_of_week'],how='left')

print('xx_resultshape',xx_result.shape)

print(xx_result)

print(mean_squared_error(xx_result['cnt_x'],xx_result['cnt_y']))

查看周一到周日的情况，其mse得分如下所示

for i inrange(7):

tmp =xx_result[xx_result['day_of_week']==i+1]

print('周%d'%(i+1),mean_squared_error(tmp['cnt_x'],tmp['cnt_y']))

感觉好差，所以要进一步优化结果

查看一下我们划分的线下数据的方差情况，说明数据的波动很明显，又是是周日的数据，根据前面的图，可以看出，数据中的异常点分布，看起来规律并不明显。而且，周日的数据本身就存在缺失，这种情况下。根据图分布可以看出来。

方案一：加权平均大法

这个方案主要是采取历史纪录*一个权值（可选函数为反比例函数，指数函数和简单的递减函数）

最后以之前分析的星期为周期，进行权重融合，求得最后结果。

def xx(df):

df['w_cnt'] = (df['cnt'] * df['weight']).sum() / sum(df['weight'])

return df

xx_train =train[train['date']<=756]

xx_train['weight'] =((xx_train['date'] + 1) / len(xx_train)) ** 6

xx_train =xx_train.groupby(['day_of_week'],as_index=False).apply(xx).reset_index()

xx_test =train[train['date']>756]

print('test shape',xx_test.shape)

print('trainshape',xx_train.shape)

# #

from sklearn.metrics importmean_squared_error

# # 这里是加权的方案

xx_train =xx_train.groupby(['day_of_week'],as_index=False).w_cnt.mean()

xx_result =pd.merge(xx_test,xx_train,on=['day_of_week'],how='left')

print('xx_resultshape',xx_result.shape)

print(xx_result)

print(mean_squared_error(xx_result['cnt'],xx_result['w_cnt']))

test shape (276, 3)

train shape (756, 6)

xx_result shape (276,4)

date day_of_week cnt w_cnt

0 757 6 314 419.121951

1 758 1 3309 2593.503011

2 759 2 1948 2615.940149

3 760 3 1722 2285.466506

4 761 4 1520 1839.909973

5 762 5 2232 1928.241036

6 763 6 497 419.121951

7 764 1 2037 2593.503011

8 765 2 2246 2615.940149

9 766 3 1447 2285.466506

10 767 4 1478 1839.909973

11 768 5 1631 1928.241036

12 769 6 128 419.121951

13 770 1 2102 2593.503011

14 771 2 2114 2615.940149

15 772 3 1964 2285.466506

16 773 4 1427 1839.909973

17 774 5 1416 1928.241036

18 775 6 319 419.121951

19 776 1 2147 2593.503011

20 777 2 1925 2615.940149

21 778 3 1668 2285.466506

22 779 4 1692 1839.909973

23 780 5 1517 1928.241036

24 781 6 381 419.121951

25 782 1 2327 2593.503011

26 783 2 1926 2615.940149

27 784 3 1387 2285.466506

28 785 4 1533 1839.909973

29 786 5 1946 1928.241036

.. ... ... ... ...

246 1003 4 1618 1839.909973

247 1004 5 2259 1928.241036

248 1005 6 426 419.121951

249 1006 1 2203 2593.503011

250 1007 2 2344 2615.940149

251 1008 3 2392 2285.466506

252 1009 4 1870 1839.909973

253 1010 5 1772 1928.241036

254 1011 6 610 419.121951

255 1012 1 2437 2593.503011

256 1013 2 2326 2615.940149

257 1014 3 1954 2285.466506

258 1015 4 1569 1839.909973

259 1016 5 1777 1928.241036

260 1017 6 442 419.121951

261 1018 1 2476 2593.503011

262 1019 2 1934 2615.940149

263 1020 3 2048 2285.466506

264 1021 4 1586 1839.909973

265 1022 5 2268 1928.241036

266 1023 6 506 419.121951

267 1024 1 3439 2593.503011

268 1025 2 3208 2615.940149

269 1026 3 2277 2285.466506

270 1027 4 2144 1839.909973

271 1028 5 2519 1928.241036

272 1029 6 195 419.121951

273 1030 2 4003 2615.940149

274 1031 3 2513 2285.466506

275 1032 4 1306 1839.909973

[276 rows x 4columns]

828419.30779

可以发现，加权后的结果好于直接均值的效果，其思想考虑了近期影响大于远期影响。其实这个线下分数，只能算是一个开始，只要是模型的线下，理论应该会好于这个结果。

根据预测结果估计，可以预测到，每条数据的偏差应该在1000左右，其实这样而言，明显是差别很大。(⊙﹏⊙)接下来，要采取一些方案处理一下原始数据。

暂时这样吧，大概的两个过程是这样，应该还可以优化，如果有问题和意见可以留言，一起改善。现在看起来，需要补充一下数据，对周日的数据补充一下。暂时思路吧。80多万的mse，说明每条数据平均和真实值的差距在1000左右。

在大佬的思路支撑下，我就按照大佬的数据处理思路，对data和day_of_week，在日期上按照星期进行训练数据的聚类。

XGBT线下测试成绩是最好的，但是能力有限并没有解决模型不能测试的问题。

最后采用了lgm+gbdt的方法进行优化，从结果上有了不小的提升。

这次比赛自己收获了一些心得，期待以后能走的更远。

为了方便大家数据集百度网盘的链接

链接: https://pan.baidu.com/s/14clDc4O71L76rduwIeEZQA 提取码: gm1y

Oracle V$SESSION详解雨的遐想 oracle 数据库
V$SESSION是SYS用户下面对于SYS.V_$SESSION视图的同义词。在本视图中，每一个连接到数据库实例中的session都拥有一条记录。包括用户session及后台进程如DBWR，LGWR，arcchiver等等。1.V$SESSION中的常用列V$SESSION是基础信息视图，用于找寻用户SID或SADDR，及检查用户的动态：（1）SQL_HASH_VALUE，SQL_ADDRESS
Qt中文件的创建过程（本文以.log格式为例）日薪月亿 Qt学习笔记 qt
文章目录1.引言2.问题描述3.日志文件的创建过程3.1伪代码示例3.2关键函数解析3.3日志文件的创建点1.引言在开发过程中，日志文件是记录程序运行状态、调试信息和错误的重要工具。最近，我在实现业务逻辑时遇到了一个具体问题：需要将Console中获取的内容（content）写入到.log文件中。虽然我最终成功地创建了.log文件，但我不清楚具体是哪个函数完成了这一操作。这个问题让我对Qt的文件操
谁偷窥了你的隐私？穿透无痕模式，浏览器指纹正在泄露你的秘密。 qq251708339 浏览器指纹用户隐私无痕模式安全其他前端
前言大家可曾发现，只要app访问过的某宝，某多多，某东的商品，在PC端的浏览器里打开电商主页，就会获得精准的广告推送，平台为了提升转换率，采集了同一个账号，同一个网络访问的历史记录，进行了商品的定向推送，那么你关注的或者购买过甚至是浏览过的小秘密，也将暴露在公共的网络环境里，你的隐私在商家眼里一文不值。如何保护隐私清除所有的有可能网站存储打开开发者工具Application->Storage在每项
python 如何引入同一个文件夹下py方法 m0_68335176 eclipse
前言毕业快三年了，前后也待过几家公司，碰到各种各样的同事。见识过各种各样的代码，优秀的、垃圾的、不堪入目的、看了想跑路的等等，所以这篇文章记录一下一个优秀的后端Java开发应该有哪些好的开发习惯。拆分合理的目录结构受传统的MVC模式影响，传统做法大多是几个固定的文件夹controller、service、mapper、entity，然后无限制添加，到最后你就会发现一个service文件夹下面有几十
Manus：全球首款通用AI Agent的技术解析与未来展望努力改掉拖延症的小白大模型人工智能语言模型
2025年3月6日，AI行业迎来了具有历史意义的一天——Monica.im正式发布全球首款通用型AI智能体产品Manus。这一突破不仅刷新了GAIA基准测试的SOTA记录，更以“数字代理人”的定位重新定义了人机交互的边界。从处理15份简历的高效筛选，到跨国购房的智能决策；从股票趋势的深度分析，到个性化旅行手册的自动生成，Manus展现出超越传统工具的“类人思维”能力，标志着AI从被动响应向主动执行
大数据开发之Kubernetes篇----安装部署Kubernetes&dashboard 豆豆总 kubernetes
Kubernetes简介由于公司有需要，需要将外后的服务外加Tensorflow模型部署加训练全部集成到k8s上，所以特意记录下这次简单部署的过程。k8s安装部署首先，我们在部署任何大型的组件前都必须要做的事情就是关闭防火墙和设置hostname了vi/etc/hostsk8s001xxx.xxx.xxx.xxk8s002xxx.xxx.xxx.xx...systemctlstopfirewall
Failed to instantiate [org.springframework.data.redis.connection.jedis.JedisConnectionFactory实例化配置失败道阻且长-行则将至-行而不辍-未来可期 redis 缓存 spring boot spring
前言：主要最近重构升级底层依赖版本，导致原先的一个系统以及完全起不来了。原来的SpringBoot版本是2.0.3.RELEASE我这边给升级到SpringBoot版本：[2.3.12.RELEASE],Spring版本：[5.2.15.RELEASE]原来的一些配置都会失效，导致错误不断，用了一个星期左右来进行解决这些问题，问题很多但是记录下来的就这些吧，以供后来者学习一下，避免跳进这些坑。目录
Servlet 点击计数器 lsx202406 开发语言
Servlet点击计数器引言随着互联网的快速发展，Web应用程序已成为人们日常生活中不可或缺的一部分。Servlet作为Java平台上用于开发Web应用程序的重要技术之一，已经广泛应用于各种Web项目中。本文将详细介绍Servlet点击计数器的实现方法，帮助读者更好地理解Servlet技术在实际开发中的应用。Servlet点击计数器概述Servlet点击计数器是一种用于记录Web页面点击次数的组件
Git 使用指南 tonngw git
Git是一种分布式版本控制系统，可以追踪文件的变化并协助多人协作开发项目。下面是Git的基本概念和使用方式：仓库（Repository）：Git用来存储项目的地方，可以理解为项目的文件夹，包含项目的所有文件和历史记录。提交（Commit）：提交是指保存项目当前状态的操作，每次提交都会记录文件的变化，包括新增、修改和删除。分支（Branch）：分支是在仓库中独立存在的工作线，可以用来开发新功能、修复
SQL*LOADER错误总结春风剑客 Oracle
SQL*LOADER错误总结2015-12-0922:51by潇湘隐者,4900阅读,0评论,收藏,编辑在使用SQL*LOADER装载数据时，由于平面文件的多样化和数据格式问题总会遇到形形色色的一些小问题，下面是工作中累积、整理记录的遇到的一些形形色色错误。希望能对大家有些用处。（今天突然看到自己以前整理的这些资料，于是稍稍整理、归纳成这篇博客，后面如果碰到其他案例，会陆陆续续补充在此篇文章。）E
Oracle SQL*Loader 与 SQLULDR2 学习指南瑞琪姐 oracle sql 数据库
1.SQL*Loader(sqlldr)1.1概述作用：Oracle官方工具，用于将外部数据文件（如CSV、文本文件）高效加载到数据库表中。特点：支持多种数据格式（定长、变长、CSV）。支持直接路径加载（DirectPathLoad），绕过SQL引擎，提升性能。提供错误记录和丢弃无效数据的功能。1.2核心组件控制文件(ControlFile)：定义数据加载规则，包括数据文件路径、目标表、字段映射等
MYSQL8.0数据库误删除记录恢复 MYSQL8.0数据库崩溃恢复 MYSQL8.0数据库删除表恢复 caihuayuan5 面试题汇总与解析大数据 spring boot java 后端课程设计
数据类型MYSQL8.0数据大小242MB故障检测主机断电导致数据库崩溃,无法启动.修复结果收到文件后,修正不一致的地方，成功启动MYSQL8.0完成恢复客户验收数据成功。完成恢复。最新数据得以恢复.客户非常满意。友情提醒：重要数据一定要勤备份，遇到数据丢失数据损坏等问题，要第一时间联系专业人士。对于各类主流数据库，我们可以做最底层的数据恢复及数据修复，对于数据库的某些特定故障我们保证数据库100
LRU缓存刷题的应用 suohanfjiusbis 缓存
引言LRU（最近最少使用算法）：是最近最少使用的页面置换算法，选择最近最久未使用的页面予以淘汰。该算法是常见的页面置换算法，该算法赋予每个页面一个访问字段，用来记录一个页面自上次被访问以来所经历的时间t，当要淘汰一个页面时，选择现有页面中t最大的。举例说明LRU算法是针对内存不足时将最远最久未使用的踢出内存中，如该例中一开始7,0,1，内存中并没有所以就全部进入内存中，然后内存满的时候，有一个2，
MySQL：多表查询、笛卡尔积、内连接、外连接、子查询平安1113 MySQL mysql sql 数据库
多表查询同时查询多张表获取到需要的数据例如：查询到开发部有多少人，需要对部门表dept和员工表emp同时进行查询笛卡尔积对上图两张表进行查询select*fromemp,dept;左表中的数据分别和右表中的数据进行结合，查询出来的总记录为：左表记录数*右表记录数总记录数为6*3=18条清除笛卡尔积清除笛卡尔积需要使用等值连接，过滤掉不符合条件的数据select*fromemp,deptwhere<
[Unity] GPU动画实现（一）——介绍 Zhidai_ Unity unity 动画游戏引擎游戏开发
当谈到戴森球计划的时候，我师兄说里面的动画都是一个叫GPU动画的东西来实现的，几乎一切图形功能名字扯到GPU的时候，通常都是高性能的体现，让我不禁好奇GPU动画是什么东西。定义首先什么是GPU动画，GPU动画是将动画的顶点信息记录下来，通过Shader在顶点着色器阶段重新设置顶点的位置，从而渲染出动画。因此GPU动画是典型的空间换时间的方案。实现步骤本系列主要目标是实现GPU动画，围绕这个目标要做
一个简单的日志类Logger qinfen123456 单片机嵌入式硬件 c++学习笔记开发语言
实现一个C++简单日志类，具备以下特性：日志文件命名采用文件名前缀加上日期的格式，方便管理与识别。对单个日志文件大小进行限制，当文件大小达到20MB时，自动开启新的日志文件。具备过期文件清理机制，自动删除保留时间超过365天的日志文件，节省存储空间。该日志类是线程安全的，能够在多线程环境下稳定运行，避免日志记录冲突。支持使用format格式进行日志记录，方便灵活输出不同格式的日志信息。自动创建子目
《java面向对象（2）》＜不含基本语法＞ java小白板 java 开发语言
提示：本笔记基于黑马程序员java教程整理，仅供参考文章目录前言1.继承2.多态2.1对象多态2.2行为对象2.3多态的问题前言本文纯笔记，主要记录了java面向对象的高级方法继承与多态1.继承在创建多个对象类时，它们可能会有很多相似的属性，如姓名，身高，体重等，就会造成代码的重复，所以我们可以采用继承的思想，将它们相同的属性放在同一个父类中，而其它作为子类的都可以继承父类的属性，子类本身就只用定
Go 中间件学习 qq_17280559 golang 中间件学习 go
文章目录1.设计中间件接口2.创建中间件函数3.使用中间件4.中间件链5.使用第三方框架6.定义自定义中间件7.使用自定义中间件应用到整个路由组应用到单个路由8.访问上下文中的信息9.控制流程总结在Go中，中间件（Middleware）是一种设计模式，常用于在请求处理的各个阶段添加通用功能，如日志记录、身份验证、异常处理等。中间件通常应用于HTTP服务器（如net/http包或第三方框架如Gin）
django中间件说明 LCY133 #django项目实战2023 django 中间件 python
Django中间件是一种在请求和响应处理过程中介入的机制，允许你在视图处理请求之前或之后执行自定义代码。中间件适用于处理全局性任务，如身份验证、日志记录、内容修改等。以下是Django中间件的详细说明和使用方法：一、中间件的核心概念作用阶段：•请求阶段：在路由到视图之前处理请求（如身份验证）。•视图阶段：在调用视图前后执行操作（如权限检查）。•响应阶段：在返回响应前修改内容（如添加HTTP头）。•
InfluxDB写入测试 PascalMing 编程 influxdb java 读写测试
早几年测试时序库时，采集数据到kafka，然后用不同数据进行存储验证。Influxdb是花时间比较多的，它的数据建模方法、读写方法都需要使用特殊的API。时间久了自己也经常忘记，把当时的测试关键代码记录下来，也方便日后查找。代码基于java编写。1、接口数据定义，clientid+tag组合必须唯一publicclassKafkaInfo{//客户端idpublicStringclientid;/
MySQL0基础概念4 wqx951 mysql sql
MySQL体系结构概述1.MySQL系统的重要组件包括连接管理器、线程管理器、命令分发器。2.连接管理器负责接收用户请求，转交给线程管理器，验证用户访问。3.用户请求包括查询命令，这些命令由命令分发器处理，如交友、缓存、解析结果或记录用户行为。MySQL查询处理流程1.查询处理流程包括高速缓存查询、词法分析、语法分析、结果缓存检查和分析后结果处理。2.如果查询结果在缓存中，直接返回缓存结果；否则，
深度探索 Java 代码审计：筑牢安全防线的关键之路阿贾克斯的黎明 java java 安全开发语言
在当今高度数字化的时代，软件安全成为了至关重要的议题。对于众多使用Java语言进行开发的程序员而言，深入掌握Java代码审计技能，无疑是守护软件安全的核心手段。本文将围绕一本涵盖Java代码审计丰富知识的书籍目录，全面剖析Java代码审计的各个关键环节以及其在CTFAWD比赛中的重要应用。一、学习经验：开启Java代码审计的智慧之门Java代码审计之路并非坦途，需要有系统的学习方法和实践经验。书籍
SpringBoot 3.4.x踩坑记录及解决方案（持续更新） brrdg_sefg 面试学习路线阿里巴巴 spring boot 后端 java
废话最近使用JDK17+SpringBoot3.4.0做新项目遇到的一些坑，记录并且给出一些实际的解决方案一、集成MybatisPlus3.5.9的问题第一：不能只引入mybatis-plus-spring-boot3-starter依赖了，需要配合mybatis-plus-jsqlparsercom.baomidoumybatis-plus-spring-boot3-startercom.bao
HarmonyOS Next ohpm-repo自动化运维——日志、备份与监控 harmonyos
在HarmonyOSNext开发过程中，ohpm-repo作为私有仓库管理工具，其稳定运行对于项目的顺利推进至关重要。有效的自动化运维是保障ohpm-repo高效运行的关键，涵盖日志管理、仓库备份与恢复以及批量操作等多个方面。接下来，我们详细探讨这些自动化运维能力。如何管理ohpm-repo的日志？ohpm-repo有一个内置的日志记录器，定义了四种日志类型，分别是访问日志（access.log）
将自己的域名添加到 GitHub Pages Kissablecho github
转自我的博客，欢迎多多支持。将自己的域名添加到GitHubPages前言GitHubPages是一个方便的网站托管服务，可让用户轻松地创建和发布自己的网站。如果您想使用自己的域名来访问GitHubPages上的网站，本文将介绍如何添加自己的域名到GitHubPages。工具GitHub账号一个域名（请注意，您必须拥有该域名的所有权或者有权访问DNS记录以便修改域名配置。）步骤第一步：在GitHub
MarkDown常用命令 Leo来编程常用学习
markdown以md文件结尾的文件常用于说明，记录常用说明优先级格式语法示例说明1标题#一级标题##二级标题###三级标题用于定义文档的结构，优先级最高。2代码块pythonprint("Hello")用于显示多行代码，优先级高于普通文本。3行内代码`行内代码`用于在行内显示代码片段。4强调（粗体/斜体）**粗体**或__粗体__*斜体*或_斜体_用于强调文本，优先级高于普通文本。5链接和图片[
解决 Flutter Device Daemon 启动失败问题的实践记录又吹风_Bassy flutter Flutter Daemon file handles Daemon Crash AndroidStudio
解决FlutterDeviceDaemon启动失败问题的实践记录最近在使用Flutter开发时踩了一个坑。看似是个小问题，但折腾了好久，最终通过日志分析和查阅资料才找到了解决办法。这里记录一下整个问题的排查过程，希望能帮助到遇到类似问题的小伙伴。问题背景事情是这样的，我在启动AndroidStudio时突然弹出了一个错误窗口：提示Flutterdaemon启动失败，过了一会儿之后，又弹出下面的弹窗
错误记录: git 无法连接到github agctXY 错误记录 git github
错误记录:git无法连接到github今天,新建了一个github仓库,但从本地怎么都push不上去.并报错[email protected]:Permissiondenied(publickey).fatal:Couldnotreadfromremoterepository.Pleasemakesureyouhavethecorrectaccessrightsandtherepositoryexist
[QMT量化交易小白入门]-二十二、deepseek+cline+vscode,让小白使用miniQMT量化交易成为可能 python自动化工具 QMT量化交易小白入门 vscode ide 编辑器
本专栏主要是介绍QMT的基础用法，常见函数，写策略的方法，也会分享一些量化交易的思路，大概会写100篇左右。QMT的相关资料较少，在使用过程中不断的摸索，遇到了一些问题，记录下来和大家一起沟通，共同进步，自己淋过雨了，希望大家都有一把伞。文章目录相关阅读DeepSeek新用户注册cline集成指令测试相关阅读小白也能做量化：零门槛QMT、Ptrade免费送量化交易入门：如何在QMT中配置Pytho
一个简单的语音识别实现---百度在线语音识别REST API SDK（Python）简单使用 DerrickOzil 语音识别 python sdk 语音识别
百度在线语音识别RESTAPISDK（Python）简单使用首先申请开发者权限注册开发者信息完成注册创建新应用下载SDK并查看key在应用管理中，选择查看key，记录AppID、APIKey、SecretKey三个参数值。测试音频链接：http://pan.baidu.com/s/1o8Ue4B4密码：o5r1]注意事项音频格式限制pcm（不压缩）、wav、amr采样频率及位数支持评测8k/16k
312个免费高速HTTP代理IP（能隐藏自己真实IP地址） yangshangchuan 高速免费 superword HTTP代理
124.88.67.20:843 190.36.223.93:8080 117.147.221.38:8123 122.228.92.103:3128 183.247.211.159:8123 124.88.67.35:81 112.18.51.167:8123 218.28.96.39:3128 49.94.160.198:3128 183.20
pull解析和json编码百合不是茶 android pull解析 json
n.json文件: [{name:java,lan:c++,age:17},{name:android,lan:java,age:8}] pull.xml文件 <?xml version="1.0" encoding="utf-8"?> <stu> <name>java
[能源与矿产]石油与地球生态系统 comsci 能源
按照苏联的科学界的说法,石油并非是远古的生物残骸的演变产物,而是一种可以由某些特殊地质结构和物理条件生产出来的东西,也就是说,石油是可以自增长的.... 那么我们做一个猜想: 石油好像是地球的体液,我们地球具有自动产生石油的某种机制,只要我们不过量开采石油,并保护好
类与对象浅谈沐刃青蛟 java 基础
类，字面理解，便是同一种事物的总称，比如人类，是对世界上所有人的一个总称。而对象，便是类的具体化，实例化，是一个具体事物，比如张飞这个人，就是人类的一个对象。但要注意的是：张飞这个人是对象，而不是张飞，张飞只是他这个人的名字，是他的属性而已。而一个类中包含了属性和方法这两兄弟，他们分别用来描述对象的行为和性质（感觉应该是
新站开始被收录后，我们应该做什么？ IT独行者 PHP seo
新站开始被收录后，我们应该做什么？百度终于开始收录自己的网站了，作为站长，你是不是觉得那一刻很有成就感呢，同时，你是不是又很茫然，不知道下一步该做什么了？至少我当初就是这样，在这里和大家一份分享一下新站收录后，我们要做哪些工作。至于如何让百度快速收录自己的网站，可以参考我之前的帖子《新站让百
oracle 连接碰到的问题文强chu oracle
Unable to find a java Virtual Machine－－安装64位版Oracle11gR2后无法启动SQLDeveloper的解决方案作者：草根IT网来源：未知人气：813标签：导读：安装64位版Oracle11gR2后发现启动SQLDeveloper时弹出配置java.exe的路径，找到Oracle自带java.exe后产生的路径“C:\app\用户名\prod
Swing中按ctrl键同时移动鼠标拖动组件（类中多借口共享同一数据）小桔子 java 继承 swing 接口监听
都知道java中类只能单继承，但可以实现多个接口，但我发现实现多个接口之后，多个接口却不能共享同一个数据，应用开发中想实现：当用户按着ctrl键时，可以用鼠标点击拖动组件，比如说文本框。编写一个监听实现KeyListener,NouseListener,MouseMotionListener三个接口，重写方法。定义一个全局变量boolea
linux常用的命令 aichenglong linux 常用命令
1 startx切换到图形化界面 2 man命令:查看帮助信息 man 需要查看的命令,man命令提供了大量的帮助信息,一般可以分成4个部分 name:对命令的简单说明 synopsis:命令的使用格式说明 description:命令的详细说明信息 options:命令的各项说明 3 date:显示时间语法：date [OPTION]... [+FORMAT]
eclipse内存优化 AILIKES java eclipse jvm jdk
一基本说明在JVM中，总体上分2块内存区,默认空余堆内存小于 40%时，JVM就会增大堆直到-Xmx的最大限制；空余堆内存大于70%时，JVM会减少堆直到-Xms的最小限制。 1)堆内存(Heap memory):堆是运行时数据区域，所有类实例和数组的内存均从此处分配,是Java代码可及的内存，是留给开发人
关键字的使用探讨百合不是茶关键字
//关键字的使用探讨/*访问关键词private 只能在本类中访问public 只能在本工程中访问protected 只能在包中和子类中访问默认的只能在包中访问*//*final 类方法变量 final 类不能被继承 final 方法不能被子类覆盖，但可以继承 final 变量只能有一次赋值，赋值后不能改变 final 不能用来修饰构造方法*///this()
JS中定义对象的几种方式 bijian1013 js
1. 基于已有对象扩充其对象和方法(只适合于临时的生成一个对象)： <html> <head> <title>基于已有对象扩充其对象和方法(只适合于临时的生成一个对象)</title> </head> <script> var obj = new Object();
表驱动法实例 bijian1013 java 表驱动法 TDD
获得月的天数是典型的直接访问驱动表方式的实例，下面我们来展示一下： MonthDaysTest.java package com.study.test; import org.junit.Assert; import org.junit.Test; import com.study.MonthDays; public class MonthDaysTest { @T
LInux启停重启常用服务器的脚本 bit1129 linux
启动，停止和重启常用服务器的Bash脚本，对于每个服务器，需要根据实际的安装路径做相应的修改 #! /bin/bash Servers=(Apache2, Nginx, Resin, Tomcat, Couchbase, SVN, ActiveMQ, Mongo); Ops=(Start, Stop, Restart); currentDir=$(pwd); echo
【HBase六】REST操作HBase bit1129 hbase
HBase提供了REST风格的服务方便查看HBase集群的信息，以及执行增删改查操作 1. 启动和停止HBase REST 服务 1.1 启动REST服务前台启动（默认端口号8080） [hadoop@hadoop bin]$ ./hbase rest start 后台启动 hbase-daemon.sh start rest 启动时指定
大话zabbix 3.0设计假设 ronin47
What’s new in Zabbix 2.0? 去年开始使用Zabbix的时候，是1.8.X的版本，今年Zabbix已经跨入了2.0的时代。看了2.0的release notes，和performance相关的有下面几个： :: Performance improvements::Trigger related da
http错误码大全 byalias http协议 javaweb
响应码由三位十进制数字组成，它们出现在由HTTP服务器发送的响应的第一行。响应码分五种类型，由它们的第一位数字表示： 1）1xx：信息，请求收到，继续处理 2）2xx：成功，行为被成功地接受、理解和采纳 3）3xx：重定向，为了完成请求，必须进一步执行的动作 4）4xx：客户端错误，请求包含语法错误或者请求无法实现 5）5xx：服务器错误，服务器不能实现一种明显无效的请求
J2EE设计模式-Intercepting Filter bylijinnan java 设计模式数据结构
Intercepting Filter类似于职责链模式有两种实现其中一种是Filter之间没有联系，全部Filter都存放在FilterChain中，由FilterChain来有序或无序地把把所有Filter调用一遍。没有用到链表这种数据结构。示例如下： package com.ljn.filter.custom; import java.util.ArrayList;
修改jboss端口 chicony jboss
修改jboss端口 %JBOSS_HOME%\server\{服务实例名}\conf\bindingservice.beans\META-INF\bindings-jboss-beans.xml 中找到 <!-- The ports-default bindings are obtained by taking the base bindin
c++ 用类模版实现数组类 CrazyMizzz C++
最近c++学到数组类，写了代码将他实现，基本具有vector类的功能 #include<iostream> #include<string> #include<cassert> using namespace std; template<class T> class Array { public: //构造函数
hadoop dfs.datanode.du.reserved 预留空间配置方法 daizj hadoop 预留空间
对于datanode配置预留空间的方法为：在hdfs-site.xml添加如下配置 <property> <name>dfs.datanode.du.reserved</name> <value>10737418240</value>
mysql远程访问的设置 dcj3sjt126com mysql 防火墙
第一步: 激活网络设置你需要编辑mysql配置文件my.cnf. 通常状况，my.cnf放置于在以下目录： /etc/mysql/my.cnf (Debian linux) /etc/my.cnf （Red Hat Linux/Fedora Linux) /var/db/mysql/my.cnf (FreeBSD) 然后用vi编辑my.cnf，修改内容从以下行： [mysqld] 你所需要: 1
ios 使用特定的popToViewController返回到相应的Controller dcj3sjt126com controller
1、取navigationCtroller中的Controllers NSArray * ctrlArray = self.navigationController.viewControllers; 2、取出后，执行， [self.navigationController popToViewController:[ctrlArray objectAtIndex:0] animated:YES
Linux正则表达式和通配符的区别 eksliang 正则表达式通配符和正则表达式的区别通配符
转载请出自出处：http://eksliang.iteye.com/blog/1976579 首先得明白二者是截然不同的通配符只能用在shell命令中,用来处理字符串的的匹配。判断一个命令是否为bash shell(linux 默认的shell)的内置命令 type -t commad 返回结果含义 file 表示为外部命令 alias 表示该
Ubuntu Mysql Install and CONF gengzg Install
http://www.navicat.com.cn/download/navicat-for-mysql Step1: 下载Navicat ，网址：http://www.navicat.com/en/download/download.html Step2：进入下载目录，解压压缩包：tar -zxvf navicat11_mysql_en.tar.gz
批处理，删除文件bat huqiji windows dos
@echo off ::演示：删除指定路径下指定天数之前（以文件名中包含的日期字符串为准）的文件。 ::如果演示结果无误，把del前面的echo去掉，即可实现真正删除。 ::本例假设文件名中包含的日期字符串（比如：bak-2009-12-25.log） rem 指定待删除文件的存放路径 set SrcDir=C:/Test/BatHome rem 指定天数 set DaysAgo=1
跨浏览器兼容的HTML5视频音频播放器天梯梦 html5
HTML5的video和audio标签是用来在网页中加入视频和音频的标签，在支持html5的浏览器中不需要预先加载Adobe Flash浏览器插件就能轻松快速的播放视频和音频文件。而html5media.js可以在不支持html5的浏览器上使video和audio标签生效。 How to enable <video> and <audio> tags in
Bundle自定义数据传递 hm4123660 android Serializable 自定义数据传递 Bundle Parcelable
我们都知道Bundle可能过put****()方法添加各种基本类型的数据，Intent也可以通过putExtras(Bundle)将数据添加进去，然后通过startActivity()跳到下一下Activity的时候就把数据也传到下一个Activity了。如传递一个字符串到下一个Activity 把数据放到Intent
C＃：异步编程和线程的使用（.NET 4.5 ） powertoolsteam .net 线程 C#异步编程
异步编程和线程处理是并发或并行编程非常重要的功能特征。为了实现异步编程，可使用线程也可以不用。将异步与线程同时讲，将有助于我们更好的理解它们的特征。本文中涉及关键知识点 1. 异步编程 2. 线程的使用 3. 基于任务的异步模式 4. 并行编程 5. 总结异步编程什么是异步操作？异步操作是指某些操作能够独立运行，不依赖主流程或主其他处理流程。通常情况下，C＃程序
spark 查看 job history 日志 Stark_Summer 日志 spark history job
SPARK_HOME/conf 下: spark-defaults.conf 增加如下内容 spark.eventLog.enabled true spark.eventLog.dir hdfs://master:8020/var/log/spark spark.eventLog.compress true spark-env.sh 增加如下内容 export SP
SSH框架搭建 wangxiukai2015eye spring Hibernate struts
MyEclipse搭建SSH框架 Struts Spring Hibernate 1、new一个web project。 2、右键项目，为项目添加Struts支持。选择Struts2 Core Libraries -<MyEclipes-Library> 点击Finish。src目录下多了struts

2018天池比赛首战落幕

你可能感兴趣的:(比赛记录)