m0_73628491

Python网络爬虫——爬取和分析NBA球员排名及各项数据

一、选题的背景介绍（15分）

NBA受到世界各地极大多数人的喜爱，不分年龄，学生、员工、劳动工人等社会各界都有热爱篮球的人，也有各自喜欢信仰的球星，在NBA中国官方网站里他们更好的了解和清楚自己喜爱的球星和其它联盟里的球星的一些数据对比，知道他们近期的一些起伏和爆发，本次爬虫建立在这基础上，通过对网页数据的提取并进行可视化对比，更好地了解联盟里球员的排名和其余各项数据之间的关系来分析对球队的贡献好与坏。

二、数据可视化分析的步骤（60分）

1.爬虫名称：爬取NBA球员排名及各项数据

2.爬取内容：爬取NBA球员排名、场均得分、各项命中率、三分命中率等

3.方案概述：访问网页得到状态码200，分析网页源代码，找出所需要的的标签，逐个提取标签保存到相同路径csv文件中，读取该文件，进行数据清洗，数据模型分析，数据可视化处理，绘制排名与其余几项数据的关系图。

技术难点：

1.在爬取网页数据，提取数据成csv文件时，由于数据较为杂乱。

2. 做数据分析，即求回归系数，因为标题是文字，无法与数字作比较，需要把标题这一列删除才可。由于不明原因，输出结果经常会显示超出列表范围。

、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、

#预览数据

import pandas as pd

df = pd.read_csv('/Users/bigboss/Desktop/王受杰/qiuyuan.csv',encoding='utf-8')

print(df.head())

#查看空缺数据

df.info()

#查看异常值

df.describe()

mport pandas as pd

df = pd.read_csv('/Users/bigboss/Desktop/王受杰/qiuyuan.csv',encoding='utf-8')

#清洗命中率、三分命中率、罚球命中率

re = df['命中率']

list1 = []

for i in re:

a = i[:-1]

print(a)

list1.append(a)

re1 = df['三分命中率']

list2 = []

for i in re1:

a = i[:-1]

print(a)

list2.append(a)

list3 = []

re2 = df['罚球命中率']

for i in re2:

a = i[:-1]

print(a)

list3.append(a)

header = ['alter_hit_rate' , 'alter_three' , 'alter_faqiu']

df1 = pd.DataFrame({header[0]:list1})

dataframe1 = df.join(df1)

dataframe1.to_csv('/Users/bigboss/Desktop/王受杰/qiuyuan.csv', mode='w', sep=',')

df2 = pd.DataFrame({header[1]:list2})

dataframe2 = dataframe1.join(df2)

dataframe2.to_csv('/Users/bigboss/Desktop/王受杰/qiuyuan.csv', mode='w', sep=',')

df3 = pd.DataFrame({header[2]:list3})

dataframe3 = dataframe2.join(df3)

dataframe3.to_csv('/Users/bigboss/Desktop/王受杰/qiuyuan.csv', mode='w', sep=',')

print(df.head(5))

df = pd.read_csv('/Users/bigboss/Desktop/王受杰/qiuyuan.csv',encoding='utf-8')

plt.rcParams['font.sans-serif'] = ['Arial Unicode MS']

data = pd.DataFrame(list(df['场均得分'][:10]),

index=df['球员'][:10])

data.plot.bar(color='b')

plt.xticks(rotation = 45)

plt.xlabel('球员',fontsize = 15)

plt.ylabel('场均得分',fontsize = 15)

plt.title('前十球员的得分对比图',color = 'r',fontsize = 16)

plt.show()

此图可以看出整个球员谁的得分能力最强，可以看到东契奇，也是我很喜欢的一名球星，他的得分能力是最强的，在各大联盟之间也是很抢手的存在。

fig = plt.figure(figsize=(8, 6), dpi=100)

ax = plt.subplot(111, polar=True)

listk = []

listk.append(df['alter_hit_rate'][4])

listk.append(df['alter_three'][4])

listk.append(df['alter_faqiu'][4])

listd = []

listd.append(df['alter_hit_rate'][0])

listd.append(df['alter_three'][0])

listd.append(df['alter_faqiu'][0])

lists = ['命中率','三分命中率','罚球命中率']

results = [{lists[0]:listk[0],

lists[1]:listk[1],

lists[2]:listk[2]},

{lists[0]:listd[0],

lists[1]:listd[1],

lists[2]:listd[2]}]

data_length = len(results[0])

# 将极坐标根据数据长度进行等分

angles = np.linspace(0, 2*np.pi, data_length, endpoint=False)

labels = [key for key in results[0].keys()]

score = [[v for v in result.values()] for result in results]

# 使雷达图数据封闭

score_a = np.concatenate((score[0], [score[0][0]]))

score_b = np.concatenate((score[1], [score[1][0]]))

angles = np.concatenate((angles, [angles[0]]))

labels = np.concatenate((labels, [labels[0]]))

# 绘制雷达图

ax.plot(angles, score_a, color='g')

ax.plot(angles, score_b, color='b')

# 设置雷达图中每一项的标签显示

ax.set_thetagrids(angles*180/np.pi, labels)

# 设置雷达图的0度起始位置

ax.set_theta_zero_location('N')

# 设置雷达图的坐标刻度范围

ax.set_rlim(0, 100)

# 设置雷达图的坐标值显示角度，相对于起始角度的偏移量

ax.set_rlabel_position(270)

ax.set_title("球员能力率综合对比")

plt.legend(["库里", "东契奇"], loc='best')

plt.show()

这张图可以看出，库里在命中率方面和东契奇是不相上下的，但是在三分和罚球方面库里是要比东契奇好一点的，在综合得分能力上库里是稍强于东契奇的。

plt.rcParams['font.sans-serif'] = ['Arial Unicode MS']

sns.distplot(df['场均得分'])

plt.xlabel("得分",color = 'g',fontsize = 12)

plt.ylabel('百分占比',color = 'b' , fontsize = 12)

plt.title('得分分布图', fontsize = 15)

plt.show()

可以看出，nba各大联盟的各大球星中，场均得分均会稳定在20-25分之间，球员的得分能力都较为稳定。

x= np.arange(0,50)

y=np.array(df['alter_faqiu'])

labels=np.array(df['球员'])

fig=plt.figure(figsize=(10,6),dpi=80)

ax=fig.add_subplot(111)

markerline,stemlines,baseline=ax.stem(x,y,linefmt='--',markerfmt='o',label='TestStem',use_line_collection=True)

plt.setp(stemlines,lw=1)

plt.xlabel(u"",fontsize = 15,color='r')

plt.ylabel("",fontsize = 15,color = 'r')

plt.title("",fontsize = 15,color = 'b')

ax.set_xticks(x)

ax.set_xticklabels(labels,rotation=70)

plt.title('球员罚球命中率对比' , color = 'b')

plt.xlabel('球员')

plt.ylabel('罚球率%')

ax.set_ylim([0,100])

for temp_x,temp_y in zip(x,y):

ax.text(temp_x,temp_y+100,s='{}'.format(temp_y),ha='center',va='bottom',fontsize=12)

plt.show()

可以看到不一定排名越高，他的所有能力都会那么强，可以发现他们的罚球有高有低，但是整天看下来相差并不是很大。

plt.rcParams['font.sans-serif'] = ['Arial Unicode MS']

plt.plot(df['alter_three'], df['alter_faqiu'], linestyle='', marker='.')

plt.xlabel('三分命中率',size=12, color='g')

plt.ylabel('罚球命中率',size=12, color='r')

plt.title('三分和罚球命中率图',size=20)

plt.show()

可以看到三分命中率越高的话，罚球的命中率也会相对来说有提升，而且大部分球员的三分命中率在35-40之间，但是罚球命中率低的密集程度是高于罚球命中率高的，说明大部分球员还是对罚球并没有特别大的把握。

plt.rcParams['font.sans-serif'] = ['Arial Unicode MS']

sns.jointplot(x="失误",y="alter_hit_rate",data=df,kind='reg')

plt.xlabel('失误',size=12, color='g')

plt.ylabel('得分率',size=12, color='r')

plt.show()

根据图片可以看出，随着得分率的下降，失误率也会有所下降，但是幅度很小，可以看出，球员在有失误的情况下，也能把自己的真实水平发挥出来。

三、总结（15分）

通过一系列的数据分析及可视化可以发现，在爬取的这些球员之中，根据场均得分来进行的排名，事实上并不是能那么可靠地分析一个球员的好与坏，在场上不仅仅只有得分，还有其余的各项数据，投篮的命中率以及防守、进攻效率和对球队的1帮助很大程度上并不是根据场均得分来体现，得分高命中率低，可能会导致球队落后和失分。经过一系列数据对比我们可以的到此结论，达到了预期的目标。

四、附录（10分）

import csv

import requests

f = open('qiuyuan.csv', mode='a', encoding='utf8', newline='')

csv_write = csv.DictWriter(f,fieldnames=['排名', '球队', '球员','场均得分', '命中率', '三分命率','罚球命中率'])

csv_write.writeheader()

url = 'https://nba.hupu.com/stats/players'

head = {

'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/100.0.4896.127 Safari/537.36',

'cookie' : 'Hm_lvt_4fac77ceccb0cd4ad5ef1be46d740615=1670421583,1670475116;'

'Hm_lpvt_4fac77ceccb0cd4ad5ef1be46d740615=1670475116;'

'Hm_lvt_b241fb65ecc2ccf4e7e3b9601c7a50de=1670421583,1670475116;'

'Hm_lpvt_b241fb65ecc2ccf4e7e3b9601c7a50de=1670475116;'

'Hm_lvt_a3d34dd67fa1fb34b2b430bbaaa2a5bf=1670421583,1670475117;'

'Hm_lpvt_a3d34dd67fa1fb34b2b430bbaaa2a5bf=1670475117',

'accept' : 'text/html,application/xhtml+xml,application/xml;'

'q=0.9,image/avif,image/webp,image/apng,*/*;'

'q=0.8,application/signed-exchange;v=b3;q=0.9'

}

nb = requests.get(url, headers=head).text

from lxml import etree

sb = etree.HTML(nb)

whh = sb.xpath('//tbody/tr[not(@class)]')

for i in whh:

pm = str(i.xpath('./td[1]/text()')).replace("['", "").replace("']", "") # 排名

team = str(i.xpath('./td[3]/a/text()')).replace("['", "").replace("']", "") # 球队

name = str(i.xpath('./td[2]/a/text()')).replace("['", "").replace("']", "") # 球员

score = str(i.xpath('./td[4]/text()')).replace("['", "").replace("']", "") # 得分

mzl = str(i.xpath('./td[6]/text()')).replace("['", "").replace("']", "") # 命中率

sfmzl = str(i.xpath('./td[8]/text()')).replace("['", "").replace("']", "") # 三分命中率

fqmzl = str(i.xpath('./td[10]/text()')).replace("['", "").replace("']", "") # 罚球命中率

print(pm)

print(team)

print(name)

print(score)

print(mzl)

print(sfmzl)

print(fqmzl)

data_dict = {'排名': pm, '球队': team,

'球员': name, '场均得分': score,

'命中率': mzl, '三分命中率': sfmzl,

'罚球命中率': fqmzl}

csv_write.writerow(data_dict)

f.close()

#预览数据

import pandas as pd

df = pd.read_csv('/Users/bigboss/Desktop/王受杰/qiuyuan.csv',encoding='utf-8')

print(df.head())

#查看空缺数据

df.info()

#查看异常值

df.describe()

import pandas as pd

df = pd.read_csv('/Users/bigboss/Desktop/王受杰/qiuyuan.csv',encoding='utf-8')

#清洗命中率、三分命中率、罚球命中率

re = df['命中率']

list1 = []

for i in re:

a = i[:-1]

print(a)

list1.append(a)

re1 = df['三分命中率']

list2 = []

for i in re1:

a = i[:-1]

print(a)

list2.append(a)

list3 = []

re2 = df['罚球命中率']

for i in re2:

a = i[:-1]

print(a)

list3.append(a)

header = ['alter_hit_rate' , 'alter_three' , 'alter_faqiu']

df1 = pd.DataFrame({header[0]:list1})

dataframe1 = df.join(df1)

dataframe1.to_csv('/Users/bigboss/Desktop/王受杰/qiuyuan.csv', mode='w', sep=',')

df2 = pd.DataFrame({header[1]:list2})

dataframe2 = dataframe1.join(df2)

dataframe2.to_csv('/Users/bigboss/Desktop/王受杰/qiuyuan.csv', mode='w', sep=',')

df3 = pd.DataFrame({header[2]:list3})

dataframe3 = dataframe2.join(df3)

dataframe3.to_csv('/Users/bigboss/Desktop/王受杰/qiuyuan.csv', mode='w', sep=',')

print(df.head(5))

df = pd.read_csv('/Users/bigboss/Desktop/王受杰/qiuyuan.csv',encoding='utf-8')

plt.rcParams['font.sans-serif'] = ['Arial Unicode MS']

data = pd.DataFrame(list(df['场均得分'][:10]),

index=df['球员'][:10])

data.plot.bar(color='b')

plt.xticks(rotation = 45)

plt.xlabel('球员',fontsize = 15)

plt.ylabel('场均得分',fontsize = 15)

plt.title('前十球员的得分对比图',color = 'r',fontsize = 16)

plt.show()

fig = plt.figure(figsize=(8, 6), dpi=100)

ax = plt.subplot(111, polar=True)

listk = []

listk.append(df['alter_hit_rate'][4])

listk.append(df['alter_three'][4])

listk.append(df['alter_faqiu'][4])

listd = []

listd.append(df['alter_hit_rate'][0])

listd.append(df['alter_three'][0])

listd.append(df['alter_faqiu'][0])

lists = ['命中率','三分命中率','罚球命中率']

results = [{lists[0]:listk[0],

lists[1]:listk[1],

lists[2]:listk[2]},

{lists[0]:listd[0],

lists[1]:listd[1],

lists[2]:listd[2]}]

data_length = len(results[0])

# 将极坐标根据数据长度进行等分

angles = np.linspace(0, 2*np.pi, data_length, endpoint=False)

labels = [key for key in results[0].keys()]

score = [[v for v in result.values()] for result in results]

# 使雷达图数据封闭

score_a = np.concatenate((score[0], [score[0][0]]))

score_b = np.concatenate((score[1], [score[1][0]]))

angles = np.concatenate((angles, [angles[0]]))

labels = np.concatenate((labels, [labels[0]]))

# 绘制雷达图

ax.plot(angles, score_a, color='g')

ax.plot(angles, score_b, color='b')

# 设置雷达图中每一项的标签显示

ax.set_thetagrids(angles*180/np.pi, labels)

# 设置雷达图的0度起始位置

ax.set_theta_zero_location('N')

# 设置雷达图的坐标刻度范围

ax.set_rlim(0, 100)

# 设置雷达图的坐标值显示角度，相对于起始角度的偏移量

ax.set_rlabel_position(270)

ax.set_title("球员能力率综合对比")

plt.legend(["库里", "东契奇"], loc='best')

plt.show()

plt.rcParams['font.sans-serif'] = ['Arial Unicode MS']

sns.distplot(df['场均得分'])

plt.xlabel("得分",color = 'g',fontsize = 12)

plt.ylabel('百分占比',color = 'b' , fontsize = 12)

plt.title('得分分布图', fontsize = 15)

财卡号

plt.show()

x= np.arange(0,50)

y=np.array(df['alter_faqiu'])

labels=np.array(df['球员'])

fig=plt.figure(figsize=(10,6),dpi=80)

ax=fig.add_subplot(111)

markerline,stemlines,baseline=ax.stem(x,y,linefmt='--',markerfmt='o',label='TestStem',use_line_collection=True)

plt.setp(stemlines,lw=1)

plt.xlabel(u"",fontsize = 15,color='r')

plt.ylabel("",fontsize = 15,color = 'r')

plt.title("",fontsize = 15,color = 'b')

ax.set_xticks(x)

ax.set_xticklabels(labels,rotation=70)

plt.title('球员罚球命中率对比' , color = 'b')

plt.xlabel('球员')

plt.ylabel('罚球率%')

ax.set_ylim([0,100])

for temp_x,temp_y in zip(x,y):

ax.text(temp_x,temp_y+100,s='{}'.format(temp_y),ha='center',va='bottom',fontsize=12)

plt.show()

plt.rcParams['font.sans-serif'] = ['Arial Unicode MS']

plt.plot(df['alter_three'], df['alter_faqiu'], linestyle='', marker='.')

plt.xlabel('三分命中率',size=12, color='g')

plt.ylabel('罚球命中率',size=12, color='r')

plt.title('三分和罚球命中率图',size=20)

plt.show()

plt.rcParams['font.sans-serif'] = ['Arial Unicode MS']

sns.jointplot(x="失误",y="alter_hit_rate",data=df,kind='reg')

plt.xlabel('失误',size=12, color='g')

plt.ylabel('得分率',size=12, color='r')

plt.show()

你可能感兴趣的:(python,爬虫,信息可视化)

Mysql中的mysqlbinlog_MySQL程序只mysqlbinlog详解 Fly蒋
mysqlbinlog命令详解mysqlbinlog用于处理二进制的日志文件，如果想要查看这些日志文件的文本内容，就需要使用mysqlbinlog工具用法：mysqlbinlog[options]log-files参数详解：-?,--help#显示帮助信息并退出--base64-output=name#binlog输出语句的base64解码分为三类：默认是值auto,仅打印base64编码的需要的
PHP与Java的区别分析 Monika Zhang java 架构设计 php java 开发语言
一、语言特点php：一种的像Python的动态弱语言类型的服务器脚本语言，不需要编译代码；它是专为Web开发目的而开发和设计的，而且简单容易上手。Java：是一种通用的面向对象编程语言，属于强势优选语言类型，在执行前必须先正确编译。是面向对象的和人类可读的；支持服务器端和客户端；可用于开发独立应用程序或基于Web的应用程序，上手比PHP难。二、语法1.PHP是一种脚本语言，代码在服务器上执行，而结
闭包的概念总结与分析 Monika Zhang java java
1定义闭包又称词法闭包闭包最早定义为一种包含和的实体.在计算机科学中，闭包（英语：Closure），又称词法闭包（LexicalClosure）或函数闭包（functionclosures），是引用了自由变量的函数。解释一：闭包是引用了自由变量的函数，这个被引用的变量将和这个函数一同存在。解释二：闭包是函数和相关引用环境组成的实体。注：：除了局部变量的其他变量《Python核心编程》对闭包的解释:
毕业论文代码实验（Python\MATLAB）基于K-means聚类的EMD-BiLSTM-Attention光伏功率预测模型清风AI 毕业设计代码实现 python lstm 深度学习神经网络人工智能 matlab pytorch
一、项目背景1.1光伏功率预测意义在能源结构转型背景下（国家能源局2025规划），光伏发电渗透率已超过18%。但受天气突变、云层遮挡等因素影响，光伏出力具有显著波动性，导致：电网调度难度增加（±15%功率波动）电力市场交易风险提升光储协同控制效率降低1.2技术挑战多尺度特征耦合：分钟级辐照度变化与小时级天气模式共存非线性映射关系：气象因素与发电功率呈高阶非线性关系数据模态差异：数值天气预报(NWP
DeepSeek 部署指南 (使用 vLLM 本地部署) AGI大模型资料分享员人工智能语言模型学习 chatgpt 深度学习大模型 deepseek
DeepSeek部署指南(使用vLLM本地部署)本文档将指导您如何使用vLLM在本地部署DeepSeek语言模型。我们以deepseek-ai/DeepSeek-R1-Distill-Qwen-7B模型为例进行演示。1、安装Python环境首先，您需要安装Python环境。访问Python官网:https://www.python.org/根据您的操作系统选择安装包:Python官网提供Windo
将MySQL数据同步到Elasticsearch作为全文检索数据的实战指南格子先生Lab 全文检索 mysql elasticsearch
在现代应用中，全文检索是一个非常重要的功能，尤其是在处理大量数据时。Elasticsearch是一个强大的分布式搜索引擎，能够快速地进行全文检索、分析和可视化。而MySQL作为传统的关系型数据库，虽然能够处理结构化数据，但在全文检索方面的性能不如Elasticsearch。因此，将MySQL中的数据同步到Elasticsearch中，可以充分发挥两者的优势。本文将介绍如何将MySQL中的数据同步到
Python基础知识点总结豆芽819 tip python 开发语言
1Python简介Python特点：解释型语言：无需编译，逐行执行。动态类型：变量类型在运行时确定。简洁易读：语法接近自然语言，代码简洁。跨平台支持：Windows/Linux/macOS均可运行。应用领域：Web开发、数据分析、人工智能、自动化脚本等。开发环境：推荐使用IDLE、PyCharm、VSCode或JupyterNotebook。2Python数值运算基本运算符：算术：+,-,*,/,
Python与区块链隐私保护技术：如何在去中心化世界中保障数据安全 Echo_Wish Python！实战！区块链 python 去中心化
Python与区块链隐私保护技术：如何在去中心化世界中保障数据安全在区块链世界里，透明性和不可篡改性是两大核心优势，但这也带来了一个悖论——如何在公开账本的同时保障用户隐私？如果你的交易记录对所有人可见，如何防止敏感信息泄露？Python作为区块链开发中最受欢迎的语言之一，提供了强大的工具和库来增强隐私保护。本文将深入探讨区块链的隐私保护技术，并结合Python代码示例，带你了解如何在Web3时代
人脸识别的一些代码饿了就干饭 CV相关人脸识别
1、cv2入门函数imread及其相关操作2、（详解）opencv里的cv2.resize改变图片大小Python3、机器学习之人脸识别face_recognition使用4、使用face_recognition进行人脸校准5、简单的人脸识别通用流程示意图（这个看着写的挺好的）6、face_recognition和图像处理中left、top、right、bottom解释7、使用pillow库对图片
在 Linux 中，lsblk 命令输出内容解释冷冷清清中的风风火火 linux 运维服务器
在Linux中，lsblk命令用于以树状结构列出所有块设备（如磁盘、分区、LVM逻辑卷等）的信息。以下是lsblk输出的详细解释和示例：1.示例输出NAMEMAJ:MINRMSIZEROTYPEMOUNTPOINTSsda8:00238.5G0disk├─sda18:10512M0part/boot/efi├─sda28:201G0part/boot└─sda38:30237G0part└─vg-
Python从入门到精通的系统性学习路径 niuTaylor 编程区 python 学习开发语言
Python从入门到精通的系统性学习路径一、基础语法快速突破1.变量与基础操作#动态类型演示a=10#整型a=3.14#浮点型a="Python"#字符串a=[1,2,3]#列表#格式化输出进阶name="Alice"print(f"{name:*^20}")#居中填充输出：******Alice*******2.运算符优先级实战#常见运算符优先级练习result=5+3*2**2//(4%3)p
【SpringBoot】MorningBox小程序的完整后端接口文档爱因斯坦乐 spring boot 小程序 java
以下是「晨光宅配」小程序的完整接口文档，涵盖了所有12个表的接口。每个接口包括请求方法、URL、请求参数、响应格式和示例接口文档1.用户模块1.1获取用户信息URL:/user/{userId}方法:GET请求参数:userId(路径参数):用户ID响应格式:{"userId":1,"openid":"openid_123456","phone":"13800138000","nickname":
【HarmonyOS开发实战】鸿蒙DevEco Service开发准备与使用「已注销」 harmonyos 华为鸿蒙鸿蒙开发
前言DevEco低代码是一个基于Serverless和ArkUI的端云一体化低代码开发平台，可通过拖拽式开发，可视化配置构建元服务。打通HarmonyOS云侧与端侧能力，轻松实现HMSCore和AGCServerless能力的调用。通过与元服务生态、HMSCore、AGCServerless平台、DevEcoStudio、开发者联盟生态市场等产品的深度打通，助力元服务快速开发与降本增效。开发准备注
Python技术全景解析：从基础到前沿的深度探索靠近彗星 python 开发语言性能优化个人开发极限编程
目录一、Python为何成为开发者首选？1.核心优势矩阵2.性能进化史二、Python核心应用领域1.数据科学黄金三角2.AI开发新范式三、现代Python进阶技巧1.类型提示革命2.异步编程实战四、Python工程化实践1.现代项目架构2.性能优化矩阵五、Python未来生态展望1.前沿技术融合2.性能革命六、学习路线图1.技能成长路径基础阶段（1-3月）专业方向（3-6月）深度进阶（6-12月
在 Spring Boot 结合 MyBatis 的项目中，实现字段脱敏（如手机号、身份证号、银行卡号等敏感信息的部分隐藏）可以通过以下方案实现冷冷清清中的风风火火笔记 springboot spring boot mybatis 后端
在SpringBoot结合MyBatis的项目中，实现字段脱敏（如手机号、身份证号、银行卡号等敏感信息的部分隐藏）可以通过以下方案实现。以下是分步说明和完整代码示例：一、实现方案选择1.方案一：自定义注解+Jackson序列化脱敏适用场景：数据返回给前端时动态脱敏，数据库存储原始数据。优点：无侵入性，通过注解灵活控制脱敏字段，与业务逻辑解耦。核心实现：利用Jackson的JsonSerialize
如何使用DeepSeek编写测试用例？海姐软件测试 deepseek 大数据测试工具
一、DeepSeek在测试用例设计中的定位DeepSeek作为AI工具，并非直接替代测试设计，而是通过以下方式提升效率：快速生成基础用例框架（等价类、边界值等）智能补充易遗漏场景（如特殊字符、异常流）自动化脚本片段生成（Python/pytest/JUnit等）测试数据构造建议（符合业务规则的Mock数据）二、四步法实战：AI协作编写测试用例Step1：明确需求输入输入质量决定输出质量，需向Dee
MQ总结 java
一.如何实现消息可靠性1.发送到MQ失败，重试策略2.生产者确认机制Confirm机制每个消息都有自己的一个Confirm机制消息正确到达交换机，返回ack。未到达交换机，返回nack。Return机制消息未正确到达队列，此时会通过PublisherConfirm返回ack，会通过PublisherReturn回调方法返回异常信息。全局只有一个失败后把消息写入数据库表，后期通过定时任务扫描，再次发
Explore Model-Based Feature Importance 后端
Question1.ExploreModel-BasedFeatureImportanceThroughoutthisquestion,youmayonlyusePython.Foreachsub-question,providecommentary(ifneeded)alongwithscreenshotsofthecodeused.Pleasealsoprovideacopyofthecode
Geotrust SSL证书和SymantecSSL证书哪个好? weixin_34293246 网络
GeoTrust是全球第二大数字证书颁发机构(CA)，也是身份认证和信任认证领域的领导者，GeoTrust始终坚持低成本地部署SSL数字证书和实现各种身份认证。其在2001年到2006年占领全球市场25%的市场分额，在全球150多个国家有超过10万个用户在使用GeoTrust的安全产品，为用户的网站信息进行保驾护航。Symantec作为信息安全领域全球领先的解决方案提供商，也是全球最大的信息安全厂
Python 标准库之 logging 模块 36度道 python系列学习笔记 python
1.logging模块简介在软件开发过程中，了解程序的运行状态、记录重要事件以及排查错误是至关重要的。logging模块为Python提供了灵活且强大的日志记录功能。它允许开发者控制日志的输出内容、输出位置（如文件、控制台）、日志级别（用于过滤不同重要程度的日志信息）等，帮助开发者更好地监控和调试程序。2.基本使用简单配置与输出：importlogging#配置日志基本设置logging.basi
python 标准库之 functools 模块 36度道 python系列学习笔记 python
functools模块提供了一系列用于处理函数的工具。其中，像partial可以创建一个新的可调用对象，这个对象固定了原函数的部分参数，有点像给函数穿上了“参数防护服”；reduce能对一个序列进行累积计算，就好比是一个勤劳的小会计，按顺序把序列里的数加起来或者做其他运算；wraps主要用于装饰器，它能帮助装饰器函数保留被装饰函数的元信息，比如函数名、文档字符串等，让被装饰函数“表里如一”。底层原
Python——函数生如雪花 Python python
一、十进制小数转换成二进制小数【问题描述】编写程序，输入十进制小数（只考虑正数），把它转换为以字符串形式存储的二进制小数，输出该二进制小数字符串。对于转换得到的二进制小数，小数点后最多保留10位。小数点后不足10位，则输出这些位，尾部不补0；小数点后超出10位，则直接舍弃超出部分。【输入形式】十进制浮点小数【输出形式】对应输入小数的二进制小数字符串。若整数部分或者小数部分为0，则输出0。比如输入0
Python Web框架 Flask vs Django vs FastAPI ZengDerby python flask fastapi django
如果您需要构建大型的、功能丰富的应用程序，Django可能是一个很好的选择。如果您需要更灵活的框架，可以选择Flask来定制开发。而对于追求极致性能和高并发处理的项目，FastAPI可能是一个更加理想的选择。优缺点Flask在小型项目或微服务理想的选择。Flask灵活且轻量，非常适合快速开发小型应用。Flask是一个非常灵活的框架，它允许您根据项目需求进行定制。您可以根据需要选择合适的插件和扩展。
可视化动态表单动态表单界的天花板--Formily(阿里开源) hhzz 前端相关开源可视化动态表单
文章目录1、Formily表单介绍2、安装依赖2.1、安装内核库2.2、安装UI桥接库2.3、Formily支持多种UI组件生态：3、表单设计器3.1、核心理念3.2、安装3.3、示例源码4、场景案例-登录注册4.1、MarkupSchema案例4.2、JSONSchema案例4.3、纯JSX案例1、Formily表单介绍Formily是一个由阿里开源的动态表单解决方案，主要用于构建和管理复杂的表
OSI七层模型 _洛_神网络协议
OSI七层模型传输过程当你在微信上发送一句“你吃了吗”时，这条消息会经历一个从你的手机到接收者手机的复杂旅程。这个过程涉及到网络通信中的七层模型，即OSI（开放系统互连）模型。每一层都有特定的功能，并且在这个过程中，信息会被逐步封装成适合网络传输的形式。等到达目的地后，再一层层解开，最终呈现给接收者。一、OSI七层模型简介：物理层-负责定义物理连接的电气、机械、过程和功能特性，如电压水平、电缆规格
2017安全之势：云、大数据、IoT、人工智能 weixin_34392906 人工智能大数据嵌入式
“新技术让信息系统变成了孙悟空，开始无所不能，但安全仍是它的‘紧箍咒’！怎样解开这个‘紧箍咒’？各路安全厂商各显其能，但似乎路漫漫兮离目标还很遥远。”三未信安董事长张岳公在ZD至顶网《百位意见领袖寄语2017》中说出了这样一句话，我觉着很有道理。安全是一个永恒的话题，如果说它与新的信息技术相生相克也不过分。即便如此，我们更要尽可能的减少安全带来的束缚。2017已经到来，不妨来看看至顶网与业界大咖总
服务器中防火墙的重要性 wanhengidc 服务器网络运维
服务器作为重要的网络设备，需要承担存储、处理和传输大量数据信息，所以服务器经常被恶意软件和网络攻击者视为主要目标，企业为了能够保护服务器不受各种网络威胁的影响，安装防火墙是最为基本的一种安全保护措施。服务器防火墙是网络安全的第一道防线，可以控制服务器上的网络访问权限，通过设置适合的规则和策略，管理员可以限制IP地址的访问权限，保护服务器不会受到未经授权的IP地址访问，保护了服务器中重要数据信息的安
MySQL数据库基本命令 Java从零开始数据库 mysql
1.CMD链接数据库：mysql-uroot-p2.打开全部数据库：showdatabases;3.切换数据库:use（school库）；4.显示数据库中所有表的信息：describe（student表）；5.查看数据库中所有的表：showtables；6.创建一个数据库：createdatabase（westos库）；7.SHOWCREATEDATABASEgoods：查看创建goods数据库的
隐私保护：数据生命周期管理——从GDPR到加密存储，守护每一比特敏感信息云计算练习生网络安全网络安全数据安全数据生命周期数据管理
引言：一次“数据泄露”引发的连锁灾难2023年，某知名健康管理平台因未加密存储用户体检报告，导致2200万条记录泄露。攻击者在暗网以每条0.5美元的价格出售，内容包括HIV检测结果、遗传病史等敏感信息。事件直接触发欧盟GDPR（通用数据保护条例）的1.2亿欧元罚款，企业市值蒸发60%。数据是数字时代的“新石油”，而隐私保护是开采过程中的“防爆阀”。本文将系统解析数据生命周期的安全管控，从法律合规到
python if用法 IT技术土狗 python从入门到入狱 python
pythonif用法流程控制流程控制即控制流程，具体指控制程序的执行流程，而程序的执行流程分为三种结构：顺序结构（之前我们写的代码都是顺序结构）、分支结构（用到if判断）、循环结构（用到while与for）1、分支结构分支结构就是根据条件判断的真假去执行不同分支对应的子代码2、为什么需要分支结构人类某些时候需要根据条件来决定做什么事情，比如：如果今天下雨，就带伞所以程序中必须有相应的机制来控制计算
Linux的Initrd机制被触发 linux
Linux 的 initrd 技术是一个非常普遍使用的机制，linux2.6 内核的 initrd 的文件格式由原来的文件系统镜像文件转变成了 cpio 格式，变化不仅反映在文件格式上， linux 内核对这两种格式的 initrd 的处理有着截然的不同。本文首先介绍了什么是 initrd 技术，然后分别介绍了 Linux2.4 内核和 2.6 内核的 initrd 的处理流程。最后通过对 Lin
maven本地仓库路径修改 bitcarter maven
默认maven本地仓库路径：C:\Users\Administrator\.m2 修改maven本地仓库路径方法： 1.打开E:\maven\apache-maven-2.2.1\conf\settings.xml 2.找到
XSD和XML中的命名空间 darrenzhu xml xsd schema namespace 命名空间
http://www.360doc.com/content/12/0418/10/9437165_204585479.shtml http://blog.csdn.net/wanghuan203/article/details/9203621 http://blog.csdn.net/wanghuan203/article/details/9204337 http://www.cn
Java 求素数运算周凡杨 java 算法素数
网络上对求素数之解数不胜数，我在此总结归纳一下，同时对一些编码，加以改进，效率有成倍热提高。第一种：原理: 6N(+-)1法任何一个自然数，总可以表示成为如下的形式之一： 6N，6N+1，6N+2，6N+3，6N+4，6N+5 (N=0，1，2，…)
java 单例模式 g21121 java
想必单例模式大家都不会陌生，有如下两种方式来实现单例模式： class Singleton { private static Singleton instance=new Singleton(); private Singleton(){} static Singleton getInstance() { return instance; }
Linux下Mysql源码安装 510888780 mysql
1.假设已经有mysql-5.6.23-linux-glibc2.5-x86_64.tar.gz (1)创建mysql的安装目录及数据库存放目录解压缩下载的源码包，目录结构，特殊指定的目录除外：
32位和64位操作系统墙头上一根草 32位和64位操作系统
32位和64位操作系统是指：CPU一次处理数据的能力是32位还是64位。现在市场上的CPU一般都是64位的，但是这些CPU并不是真正意义上的64 位CPU，里面依然保留了大部分32位的技术，只是进行了部分64位的改进。32位和64位的区别还涉及了内存的寻址方面，32位系统的最大寻址空间是2 的32次方= 4294967296（bit）= 4（GB）左右，而64位系统的最大寻址空间的寻址空间则达到了
我的spring学习笔记10-轻量级_Spring框架 aijuans Spring 3
一、问题提问： → 请简单介绍一下什么是轻量级？轻量级（Leightweight）是相对于一些重量级的容器来说的，比如Spring的核心是一个轻量级的容器，Spring的核心包在文件容量上只有不到1M大小，使用Spring核心包所需要的资源也是很少的，您甚至可以在小型设备中使用Spring。
mongodb 环境搭建及简单CURD antlove Web Install curd NoSQL mongo
一搭建mongodb环境 1. 在mongo官网下载mongodb 2. 在本地创建目录 "D:\Program Files\mongodb-win32-i386-2.6.4\data\db" 3. 运行mongodb服务 [mongod.exe --dbpath "D:\Program Files\mongodb-win32-i386-2.6.4\data\
数据字典和动态视图百合不是茶 oracle 数据字典动态视图系统和对象权限
数据字典（data dictionary）是 Oracle 数据库的一个重要组成部分，这是一组用于记录数据库信息的只读（read-only）表。随着数据库的启动而启动,数据库关闭时数据字典也关闭数据字典中包含数据库中所有方案对象（schema object）的定义(包括表，视图，索引，簇，同义词，序列，过程，函数，包，触发器等等) 数据库为一
多线程编程一般规则 bijian1013 java thread 多线程 java多线程
如果两个工两个以上的线程都修改一个对象，那么把执行修改的方法定义为被同步的，如果对象更新影响到只读方法，那么只读方法也要定义成同步的。不要滥用同步。如果在一个对象内的不同的方法访问的不是同一个数据，就不要将方法设置为synchronized的。
将文件或目录拷贝到另一个Linux系统的命令scp bijian1013 linux unix scp
一.功能说明 scp就是security copy，用于将文件或者目录从一个Linux系统拷贝到另一个Linux系统下。scp传输数据用的是SSH协议，保证了数据传输的安全，其格式如下： scp 远程用户名@IP地址：文件的绝对路径
【持久化框架MyBatis3五】MyBatis3一对多关联查询 bit1129 Mybatis3
以教员和课程为例介绍一对多关联关系，在这里认为一个教员可以叫多门课程，而一门课程只有1个教员教，这种关系在实际中不太常见，通过教员和课程是多对多的关系。示例数据：地址表： CREATE TABLE ADDRESSES ( ADDR_ID INT(11) NOT NULL AUTO_INCREMENT, STREET VAR
cookie状态判断引发的查找问题 bitcarter form cgi
先说一下我们的业务背景： 1.前台将图片和文本通过form表单提交到后台，图片我们都做了base64的编码，并且前台图片进行了压缩 2.form中action是一个cgi服务 3.后台cgi服务同时供PC，H5，APP 4.后台cgi中调用公共的cookie状态判断方法（公共的，大家都用，几年了没有问题）问题：（折腾两天。。。。） 1.PC端cgi服务正常调用，cookie判断没
通过Nginx,Tomcat访问日志(access log)记录请求耗时 ronin47
一、Nginx通过$upstream_response_time $request_time统计请求和后台服务响应时间 nginx.conf使用配置方式： log_format main '$remote_addr - $remote_user [$time_local] "$request" ''$status $body_bytes_sent "$http_r
java-67- n个骰子的点数。把n个骰子扔在地上，所有骰子朝上一面的点数之和为S。输入n，打印出S的所有可能的值出现的概率。 bylijinnan java
public class ProbabilityOfDice { /** * Q67 n个骰子的点数 * 把n个骰子扔在地上，所有骰子朝上一面的点数之和为S。输入n，打印出S的所有可能的值出现的概率。 * 在以下求解过程中，我们把骰子看作是有序的。 * 例如当n=2时，我们认为（1，2）和（2，1）是两种不同的情况 */ private stati
看别人的博客，觉得心情很好 Cb123456 博客心情
以为写博客，就是总结，就和日记一样吧，同时也在督促自己。今天看了好长时间博客: 职业规划: http://www.iteye.com/blogs/subjects/zhiyeguihua android学习: 1.http://byandby.i
[JWFD开源工作流]尝试用原生代码引擎实现循环反馈拓扑分析 comsci 工作流
我们已经不满足于仅仅跳跃一次，通过对引擎的升级，今天我测试了一下循环反馈模式，大概跑了200圈，引擎报一个溢出错误在一个流程图的结束节点中嵌入一段方程，每次引擎运行到这个节点的时候，通过实时编译器GM模块，计算这个方程，计算结果与预设值进行比较，符合条件则跳跃到开始节点，继续新一轮拓扑分析，直到遇到
JS常用的事件及方法 cwqcwqmax9 js
事件描述 onactivate 当对象设置为活动元素时触发。 onafterupdate 当成功更新数据源对象中的关联对象后在数据绑定对象上触发。 onbeforeactivate 对象要被设置为当前元素前立即触发。 onbeforecut 当选中区从文档中删除之前在源对象触发。 onbeforedeactivate 在 activeElement 从当前对象变为父文档其它对象之前立即
正则表达式验证日期格式 dashuaifu 正则表达式 IT其它 java其它
正则表达式验证日期格式 function isDate(d){ var v = d.match(/^(\d{4})-(\d{1,2})-(\d{1,2})$/i); if(!v) { this.focus(); return false; } } <input value="2000-8-8" onblu
Yii CModel.rules() 方法、validate预定义完整列表、以及说说验证 dcj3sjt126com yii
public array rules () {return} array 要调用 validate() 时应用的有效性规则。返回属性的有效性规则。声明验证规则，应重写此方法。每个规则是数组具有以下结构：array('attribute list', 'validator name', 'on'=>'scenario name', ...validation
UITextAttributeTextColor = deprecated in iOS 7.0 dcj3sjt126com ios
In this lesson we used the key "UITextAttributeTextColor" to change the color of the UINavigationBar appearance to white. This prompts a warning "first deprecated in iOS 7.0." Ins
判断一个数是质数的几种方法 EmmaZhao Math python
质数也叫素数，是只能被1和它本身整除的正整数，最小的质数是2，目前发现的最大的质数是p=2^57885161-1【注1】。判断一个数是质数的最简单的方法如下： def isPrime1(n): for i in range(2, n): if n % i == 0: return False return True 但是在上面的方法中有一些冗余的计算，所以
SpringSecurity工作原理小解读坏我一锅粥 SpringSecurity
SecurityContextPersistenceFilter ConcurrentSessionFilter WebAsyncManagerIntegrationFilter HeaderWriterFilter CsrfFilter LogoutFilter Use
JS实现自适应宽度的Tag切换 ini JavaScript html Web css html5
效果体验：http://hovertree.com/texiao/js/3.htm 该效果使用纯JavaScript代码，实现TAB页切换效果，TAB标签根据内容自适应宽度，点击TAB标签切换内容页。 HTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"
Hbase Rest API : 数据查询 kane_xie REST hbase
hbase（hadoop）是用java编写的，有些语言（例如python）能够对它提供良好的支持，但也有很多语言使用起来并不是那么方便，比如c#只能通过thrift访问。Rest就能很好的解决这个问题。Hbase的org.apache.hadoop.hbase.rest包提供了rest接口，它内嵌了jetty作为servlet容器。启动命令：./bin/hbase rest s
JQuery实现鼠标拖动元素移动位置（源码+注释）明子健 jquery js 源码拖动鼠标
欢迎讨论指正！ print.html代码： <!DOCTYPE html> <html> <head> <meta http-equiv=Content-Type content="text/html;charset=utf-8"> <title>发票打印</title> &l
Postgresql 连表更新字段语法 update qifeifei PostgreSQL
下面这段sql本来目的是想更新条件下的数据，可是这段sql却更新了整个表的数据。sql如下： UPDATE tops_visa.visa_order SET op_audit_abort_pass_date = now() FROM tops_visa.visa_order as t1 INNER JOIN tops_visa.visa_visitor as t2 ON t1.
将redis,memcache结合使用的方案? tcrct redis cache
公司架构上使用了阿里云的服务，由于阿里的kvstore收费相当高，打算自建，自建后就需要自己维护，所以就有了一个想法，针对kvstore(redis)及ocs(memcache)的特点，想自己开发一个cache层，将需要用到list，set，map等redis方法的继续使用redis来完成，将整条记录放在memcache下，即findbyid，save等时就memcache，其它就对应使用redi
开发中遇到的诡异的bug wudixiaotie bug
今天我们服务器组遇到个问题：我们的服务是从Kafka里面取出数据，然后把offset存储到ssdb中，每个topic和partition都对应ssdb中不同的key，服务启动之后，每次kafka数据更新我们这边收到消息，然后存储之后就发现ssdb的值偶尔是-2,这就奇怪了，最开始我们是在代码中打印存储的日志，发现没什么问题，后来去查看ssdb的日志，才发现里面每次set的时候都会对同一个key