阿坤996

英国电商用户行为分析

一.数据的获取

数据集：https://archive.ics.uci.edu/ml/datasets/online+retail#
数据集简介：英国零售在2010.12.1至2011.12.9发生的交易订单
内容：
InvoiceNo：发票编号。为每笔订单唯一分配的6位整数。若以字母’C’开头，则表示该订单被取消。
StockCode：产品代码。为每个产品唯一分配的编码。
Description：产品描述。
Quantity：数量。每笔订单中各产品分别的数量。
InvoiceDate：发票日期和时间。每笔订单发生的日期和时间。
UnitPrice：单价。单位产品价格，单位为英镑。
CustomerID：客户编号。为每个客户唯一分配的5位整数。
Country：国家。客户所在国家/地区的名称。

二.读取数据

加载需要用到的库

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
df_sale =pd.read_excel(r'E:/学习资料/数据分析练习/Online Retail/Online Retail.xlsx')
df_sale.info()
df_sale.describe()

共541909条数据，数量和单价均存在负值需要后续处理

三.清洗数据

3.1 删除重复值，观察空值

before = df_sale.shape[0]
df_sale.drop_duplicates(inplace=True)
after = df_sale.shape[0]
print("delete %d duplicated raws"%(before-after))
df_sale.isnull().sum().sort_values(ascending=False)

删除5268行数据，CustomerID 和Description 存在空值
Description 不影响后面的，空值不做处理。同时发现CustomerID为float，做转换int，将空值填充为0，同时将InvoiceNo转换为字符便于‘C’订单的处理

df_sale['CustomerID']=df_sale['CustomerID'].astype('int')
df_sale['InvoiceNo']=df_sale['InvoiceNo'].astype('str')
df_sale.CustomerID.fillna(value=0,inplace=True)

3.2 异常值的处理

df_sale[(df_sale.Quantity<=0)|(df_sale['UnitPrice']<=0)].head()

观察发票号包含C，想到需要将取消的订单与成功的订单分开，应用到正则表达式

query_c= df_sale.InvoiceNo.str.contains("C")
df_cancel =df_sale.loc[query_c,:].copy()
df_sucess =df_sale.loc[-query_c,:].copy()

在成功的订单的中，还要去掉UnitPrice<0的订单，同时考虑到UnitPrice=0可能为活动，也将其去除

query_free =(df_sucess['UnitPrice']==0)
df_sucess= df_sucess.loc[-query_free,:]
query_minus=(df_sucess['UnitPrice']<0)
df_sucess =df_sucess.loc[-query_minus,:]

同时增加总价这列，检查最终的df_sucess数据

df_sucess['SumPrice']=df_sucess.loc[:,'Quantity']* df_sucess.loc[:,'UnitPrice']
df_sucess.info()
df_sucess.describe()

共524878行记录

四.数据分析与可视化（不同维度）

4.1 订单维度：笔单价，连带率

groupInvoiceNo=df_sucess.groupby(r'InvoiceNo')[r'Quantity',r'SumPrice'].agg('sum')
groupInvoiceNo.describe()

笔单价约为533.17英镑，连带率 279件
订单金额与商品件数关系如何？

fig =plt.figure(figsize=(14,4))
sns.distplot(groupInvoiceNo.SumPrice,bins=100,color='c')
plt.title(r'SumPrice distribution of orders')
plt.xticks(np.arange(0,170000,10000))
plt.ylabel(r'Frequency')
plt.grid()
plt.show()

将总金额缩小至2000，进一步观察

fig =plt.figure(figsize=(14,4))
ax= fig.add_subplot(1,1,1)
sns.distplot(groupInvoiceNo.loc[groupInvoiceNo.SumPrice<2000,'SumPrice'],bins=100,color='c',norm_hist=True)
plt.title(r'SumPrice distribution of orders(below 2000)')
plt.ylabel(r'Frequency')
plt.xticks(np.arange(0,2000,100))
plt.grid()
plt.show()

订单金额集中在500英镑内，三个峰值分别为20英镑内、100-120英镑、300-320英镑。其中300-320英镑的订单数量特别多
观察订单商品数量和总价的关系

fig =plt.figure(figsize=(8,8))
plt.subplot(2,1,1)
plt.scatter(x=groupInvoiceNo.Quantity,y=groupInvoiceNo.SumPrice)
plt.xlabel(r'Quantity ')
plt.ylabel(r'SumPrice')
plt.title(r'Quantity & SumPrice')

plt.subplot(2,1,2)
plt.subplots_adjust(hspace=0.5)
plt.scatter(x=groupInvoiceNo.loc[groupInvoiceNo.Quantity<20000,'Quantity'],y=groupInvoiceNo.loc[groupInvoiceNo.Quantity<20000,'SumPrice'])
plt.xlabel(r'Quantity ')
plt.ylabel(r'SumPrice')
plt.title(r'Quantity & SumPrice(Quantity<20000)')
plt.show()

总体来说订单金额和订单中的商品件数为正相关，但是也存在数量极少，总价极高的订单。

4.2客户维度（客单价，客户的消费金额）

df_customer =df_sucess[df_sucess.CustomerID !=0].copy()
group_customer= df_customer.groupby('CustomerID').agg({'Quantity':['sum'],'SumPrice':['sum'],
                                                       'InvoiceNo':lambda x:x.nunique()})
group_customer.columns=['Quantity','SumPrice','InvoiceNo']
group_customer.describe()

人均购买笔数为4笔，中位数为2笔，25%以上的客户仅下过一次单，并未留存。每位客户平均购买了1187件商品，甚至超过了Q3分位数，最多的客户购买了196915件；客单价为2049英镑，平均值同样超过了Q3分位数，说明客户的购买力存在较大差距，存在小部分的高消费用户拉高了人均数值

客户订单总金额的分布

fig =plt.figure(figsize=(7,5))
group_customer.SumPrice.plot.hist(bins=100)
plt.title(r"SumPrice Distribution of Customers")
plt.xlabel(r'SumPrice')
plt.ylabel(r'Frequency')
plt.grid()
plt.show()

fig =plt.figure(figsize=(7,5))
group_customer.loc[group_customer.SumPrice<5000,'SumPrice'].plot.hist(bins=50)
plt.title(r"SumPrice Distribution of Customers(SumPrice<5000)")
plt.xlabel(r'SumPrice')
plt.ylabel(r'Frequency')
plt.xticks(range(0,5000,500))
plt.grid()
plt.show()

与前面订单金额的多峰分布相比，客户消费金额的分布呈现单峰长尾形态，金额更为集中，峰值在100-200英镑间

4.3 商品维度（价格，卖的好，对销售额的贡献）

group_goods =df_sucess.groupby('StockCode').agg({'Quantity':sum,'SumPrice':sum})
group_goods['Average']=group_goods.SumPrice/group_goods.Quantity

所有商品的均价：

fig =plt.figure(figsize=(7,5))
group_goods.Average.hist(bins=100)
plt.xlabel(r'Average Price')
plt.title(r'AvgPrice Distribution')
plt.show()

fig =plt.figure(figsize=(7,5))
group_goods.loc[group_goods.Average<40,'Average'].hist(bins=50)
plt.xlabel(r'Average Price')
plt.title(r'AvgPrice Distribution(Average<40)')
plt.show()

峰值是1-2英磅，单价10磅上的商品已经很少见，该电商的定位主要是价格低区间

fig =plt.figure(figsize=(12,4))
plt.subplot(1,2,1)
plt.scatter(x=group_goods.Average,y=group_goods.Quantity)
plt.title(r'AvgPrice & Quantity')
plt.ylabel(r'Quantity')
plt.xlabel(r'Average Price')
plt.grid()

plt.subplot(1,2,2)
plt.subplots_adjust(wspace=0.5)
plt.scatter(x=group_goods.loc[group_goods.Average<80,'Average'],y=group_goods.loc[group_goods.Average<80,'Quantity'])
plt.title(r'AvgPrice & Quantity(Average<80)')
plt.ylabel(r'Quantity')
plt.xlabel(r'Average Price')
plt.grid()
plt.show()

从商品销量看，低于5英镑的低价区商品更受到客户的喜爱`

fig =plt.figure(figsize=(12,5))
plt.subplot(1,2,1)
plt.scatter(x=group_goods.Average,y=group_goods.SumPrice)
plt.title(r'AvgPrice & SumPrice')
plt.ylabel(r'SumPrice')
plt.xlabel(r'Average Price')

plt.subplot(1,2,2)
plt.subplots_adjust(wspace=0.5)
plt.scatter(x=group_goods.loc[group_goods.Average<80,'Average'],y=group_goods.loc[group_goods.Average<80,'SumPrice'])
plt.title(r'AvgPrice & SumPrice(Average<80)')
plt.ylabel(r'SumPrice')
plt.xlabel(r'Average Price')
plt.show()

低价区的商品构成了销售额的主要部分，高价的商品虽然单价高昂，并没有带来太多的销售额

4.4 时间维度
对日期进行处理

df_sucess['Month']=df_sucess.InvoiceDate.dt.month
df_sucess['Date']=df_sucess.InvoiceDate.dt.date

按照月份观察销量和总价

group_month=df_sucess.groupby('Month').agg({'InvoiceNo':lambda x:x.nunique(),'SumPrice':sum,'Quantity':sum})
month =group_month.plot(secondary_y ='InvoiceNo', x_compat=True,figsize=(10,5))
month.set_ylabel('Quantity & SumPrice')
month.right_ax.set_ylabel('Order quantities')
month.set_xticks(np.arange(0,12,1))
plt.grid()
plt.show()

除了2011年2月和4月略低外，2010年12月至2011年8月基本维持相近的销售情况；随后在9月-11月连续增长，达到高峰。考虑该电商平台主营礼品，受节日影响可能较大,欧洲重视的万圣节（11月1日）和圣诞节（12月25日）都在年末，与图中的趋势能够相呼应

group_date =df_sucess.groupby(df_sucess.Date).agg({'InvoiceNo':lambda x: x.nunique(),'SumPrice':sum,'Quantity':sum})

group_date.loc[:,['SumPrice','Quantity']].plot(figsize=(10,5))
plt.title('SumPrice & Quantity & Date')
plt.ylabel(r'SumPrice & Quantity ')

group_date.loc[:,['InvoiceNo']].plot(figsize=(10,5))
plt.ylabel(r'InvoiceNo')
plt.title(r'InvoiceNo & Date')
plt.show()

可见销量Quantity和销售额SumPrice的趋势是极趋同的，这也和前一节中分析出该电商以低价商品为主相吻合，商品单价低且价位集中，则销售额主要随销量变化而涨跌,注意到在最后一天（即2011年12月9日），销量、销售额显著激增

将12月的销售额和销量单独拉出来看

df_sucess.Date =pd.to_datetime(df_sucess.Date,format='%Y-%m-%d')

group_daypart=df_sucess.groupby('Date').agg({'InvoiceNo':lambda x:x.nunique(),'SumPrice':sum,'Quantity':sum})

day_part=group_daypart['2011-12-01':].plot(secondary_y = 'InvoiceNo', figsize = (12,6),legend='best')
day_part.set_ylabel('Quantity & SumPrice')
day_part.right_ax.set_ylabel('Order quantities')
plt.show()

2011年12月的前8天基本延续了11月下旬的销售趋势，但在12月9日订单量大幅下降时，却创造了样本区间内销量和销售额的历史新高。说明存在某笔或某几笔购买量极大的订单，从而使得销售额大幅上升

df_sucess[df_sucess.Date=='2011-12-09'].sort_values(by='SumPrice',ascending =False)[:5]

一个英国的客户，一口气购买了8万余件的纸工艺品，贡献了168469英镑的销售额

4.5 国家维度

group_country =df_sucess.groupby('Country').agg({'InvoiceNo':lambda x:x.nunique(),'SumPrice':sum })

group_country.sort_values(by='SumPrice',ascending =False)

可知绝大部分客户仍来自英国本土，主要境外收入来源也多为英国周边国家,这种现象可能和运输成本及语言等有关，也可能是影响力随距离而衰减，可以尝试增加境外的宣传投放，提高知名度；

4.6 客户行为（生命周期，留存，购买周期）
需要先去除没有CustomerID的用户

df_cust_action =df_sucess[df_sucess.CustomerID !=0].copy()

生命周期，第一次购买和最近购买相减

group_life_cycle=df_cust_action.groupby('CustomerID')['Date'].agg([min,max])
group_life_cycle.columns=['Fst','Last']
group_life_cycle['Lifecycle']=(group_life_cycle['Last']-group_life_cycle['Fst']).dt.days

图表展示：

fig=plt.figure(figsize =(8,5))
plt.hist(x=group_life_cycle.Lifecycle,bins=30)
plt.title('Life Cycle Distribution')
plt.ylabel('Customer number')
plt.xlabel('Life Cycle (days)')
plt.grid()
plt.show()

许多用户只消费了一次，没有留存下来，需要更加重视客户初次购买的体验感，对于购买中流程不满意之处，针对加以改进，对新用户采取吸引其购买的手段。将生命周期为0的去除掉再观察

fig=plt.figure(figsize =(8,5))
plt.hist(group_life_cycle.loc[group_life_cycle.Lifecycle>0,'Lifecycle'],bins=30)
plt.title('Life Cycle Distribution(days>0)')
plt.ylabel('Customer number')
plt.xlabel('Life Cycle (days)')
plt.grid()
plt.show()

生命周期在0-70天的客户数略高于50-150天，可以考虑加强前70天内对客户的引导在150天-330天，属于较高质量客户的生命周期而在330天以后，则是数量可观的死忠客户,拥有极高的用户粘性

留存率

group_life_cycle=group_life_cycle.reset_index()

customer_retention =df_cust_action.merge(group_life_cycle,on='CustomerID',how='left')

group_customer_retent=customer_retention.loc[:,['CustomerID','Date','Fst','SumPrice']]

group_customer_retent['Datediff']=(group_customer_retent.Date-group_customer_retent.Fst).dt.days

将所有的间隔时间列出来, 留存区间分别取（0,3]，（3,7], (7,30] , (30,60], (60,90], (90,180]

day_bins = [0,3,7,30,60,90,180]
group_customer_retent['DateDiffBin'] = pd.cut(group_customer_retent.Datediff,bins = day_bins)
group_customer_retent['DateDiffBin'].value_counts()

创建数据透视表，将用户ID作为Index

 customer_rent=pd.pivot_table(group_customer_retent,index='CustomerID',columns ='DateDiffBin',values=['SumPrice'],aggfunc='sum')
customer_rent.shape

customer_rent=customer_rent.applymap(lambda x:1 if x>0 else 0)
(customer_rent.sum()/customer_rent.shape[0]).plot.bar()
plt.grid()
plt.show()

(customer_rent.sum()/customer_rent.shape[0])

只有3.2%在第一次消费的次日至3天内有过消费，6.6%的客户在4-7天有过消费。分别有40.5%和37.4%的客户在首次消费后的第二个月内和第三个月内有过购买行为。将时间范围继续放宽，有高达67%的客户在90天至半年内消费过。说明该电商网站的客户群体，其采购并非高频行为，但留存下来的老客户忠诚度却极高。结合前文，仅有首次购买行为的客户占总客户的37.5%，如能提高这部分群体的留存率，将会带来很高的收益

购买周期

group_customer_retent.head()

buy_cycle =group_customer_retent.drop('DateDiffBin',axis=1)

def diff(group):
    d= group.Datediff-group.Datediff.shift(1)
    return d
buy_cycle.drop_duplicates(subset=['CustomerID','Date'],keep='first',inplace=True)
buy_cycle.sort_values(by='Date',ascending=True)
uy_cycle=buy_cycle.groupby('CustomerID').apply(diff)
buy_cycle.head(10)

shift 函数应用，shift（1）数据下移动一行

buy_cycle.hist(bins=70,figsize=(12,6))
plt.xlabel(r'days')
plt.ylabel(r'frequency')
plt.show()

一个右偏分布，峰值在20-70天，说明大部分留存客户的购买周期集中于此,建议可以每隔30天左右对客户进行些优惠活动的信息推送,比较符合大部分购买周期

5.RFM模型

R：最近购买的时间
F：购买的频次
M：购买的总金额

RMF_data =df_cust_action.groupby('CustomerID').agg({'SumPrice':'sum','InvoiceNo':'count','Date':['min','max']})
RMF_data=RMF_data.reset_index()
RMF_data.columns=['CustomerID','M','F','FstTime','LastTime']
RMF_data.head()

定义函数，获取R

from math import ceil
def func(data):
    R=[]
    NowTime = pd.to_datetime('2011-12-10',format='%Y-%m-%d')
    diff_R = (NowTime-data.LastTime).dt.days
    for i in diff_R:
        R.append(i)
    np.array(R)
    return R

将R加入数据中

R=func(RMF_data)
R =pd.DataFrame(R,columns=['R'])
RMF_data=pd.concat([RMF_data,R],axis=1)
RMF_data.drop(['FstTime','LastTime'],axis=1,inplace=True)
RMF_data.describe()

分别观察R,M,F的图像

fig =plt.figure(figsize=(10,12))
plt.subplot(3,1,1)
sns.distplot(RMF_data.M,label='Money')
plt.subplot(3,1,2)
plt.subplots_adjust(hspace=0.3)
sns.distplot(RMF_data.F,label='Frequency')
plt.subplot(3,1,3)
sns.distplot(RMF_data.R,label='Recency')
plt.show()

用对数函数对目标数据进行转换：目的（1）变换后可以更便捷发现数据的关系（2）数据有偏，可以拉开数据差异（3）数据模型符合理论模型的假设，取对数后性质和相关关系不会改变，但压缩了尺度，方便计算。

from scipy.special import boxcox,inv_boxcox
columns=['R','M','F']
for i in columns:
     RMF_data[i]=boxcox(RMF_data[i],0)

fig =plt.figure(figsize=(10,12))
plt.subplot(3,1,1)
sns.distplot(RMF_data.M,label='Money')
plt.subplot(3,1,2)
plt.subplots_adjust(hspace=0.3)
sns.distplot(RMF_data.F,label='Frequency')
plt.subplot(3,1,3)
sns.distplot(RMF_data.R,label='Recency')
plt.show()

sklearn库，数据的标准化

from sklearn.preprocessing import StandardScaler
from sklearn.cluster import KMeans
X=RMF_data.iloc[:,1:]
std_scaler =StandardScaler()
X_std =std_scaler.fit_transform(X)

kmeans ，确定K值，‘肘点法’，随着K的增大，每个样本的划分会更加精细，SSE（误差平方和会逐渐减小）。当k小于真实聚类数时，由于k的增大会大幅增加每个簇的聚合程度，故SSE的下降幅度会很大，而当k到达真实聚类数时，再增加k所得到的聚合程度回报会迅速变小，所以SSE的下降幅度会骤减，然后随着k值的继续增大而趋于平缓，也就是说SSE和k的关系图是一个手肘的形状，而这个肘部对应的k值就是数据的真实聚类数

ks = range(1,9)
inertias=[]
for k in ks :
    kc = KMeans(n_clusters=k,random_state=1)
    kc.fit(X_std)
    inertias.append(kc.inertia_)
    fig =plt.figure(figsize=(8,6))
    
plt.plot(ks, inertias, '-o')
plt.xlabel('Number of clusters, k')
plt.ylabel('Inertia')
plt.title('What is the Best Number for KMeans ?')
plt.show()

由图中可以看出，当K为2,3时，损失函数下降最快，考虑到分2类的意义不大，因此选择K=3

kmeans=KMeans(n_clusters=3,random_state=1,n_jobs=3,verbose=1,max_iter=1000)
kmeans.fit(X_std)

将kmeans.labels_标签添加

RMF_data =pd.concat([RMF_data,pd.DataFrame(kmeans.labels_,columns=['Label'])],axis=1)

columns=['R','M','F']
for i in columns:
     RMF_data[i]=inv_boxcox(RMF_data[i],0)
     RMF_data.CustomerID=RMF_data.CustomerID.astype(str)

查看各个标签的数据

RMF_data.groupby(['Label']).mean()
RMF_data.Label.value_counts()

可以看出类别2的R,M,F都很高，属于重要价值客户，或者VIP用户，可以对类别02的用户群体采取重点跟进维系措施

Python爬虫（57）Python数据可视化全攻略：Matplotlib从入门到三维动态图表（8000字实战教程）一个天蝎座白勺程序猿 Python爬虫入门到高阶实战 python 爬虫信息可视化
目录背景与需求分析第一章：Matplotlib基础与核心工作流1.1环境配置与基础架构1.2基础图表类型实战1.2.1折线图进阶1.2.2分组柱状图第二章：高阶可视化技术2.1子图矩阵与多面板布局2.2动态可视化与动画第三章：行业案例实战案例1：电商用户行为分析案例2：医疗影像数据可视化第四章：可视化美学与工程优化4.1配色方案实战4.2百万级数据渲染优化第五章：交互式扩展方案5.1Matplot
一篇文稿，两个AI绝技：从字体识别到视频修复，解锁Adobe高级工作流 top_designer 人工智能音视频 adobe photoshop illustrator AIGC 视频剪辑
设计师的十年，是一场漫长的自我进化。从最初对像素的锱铢必较，到如今与AI协同创作，工具的革新始终在重塑我们的思考边界。我很庆幸，在英国ParvisSchoolofEconomicsandMusic的Adobe教育订阅支持下，我能一直站在技术浪潮的前沿。今天，不谈空泛的理论，只想和大家分享两个我在实战中，真正依赖AI化解危机的具体案例。在创意的世界里，我们不仅是美的创造者，更是问题的解决者。而最棘手
快速排序的详解
分治策略：将大问题分解为小问题解决关键操作：选择基准（Pivot）并进行分区（Partition）递归处理：对分区后的子数组递归排序前言1.快速排序概述快速排序（QuickSort）是由英国计算机科学家TonyHoare于1960年提出的一种高效的分治排序算法。它在平均情况下的时间复杂度为O(nlogn)，最坏情况下为O(n²)（但可通过优化避免），且是原地排序（不需要额外空间）。2.算法步骤详解
Adobe Firefly AI驱动设计：实用技巧与创新思维路径 reddingtons 人工智能 adobe 大数据 photoshop illustrator Premiere InDesign
开篇分享最近深度体验了英国ParvisSchoolofEconomicsandMusic的Adobe正版教育订阅，挖掘CreativeCloud全家桶的各种功能时，收获了不少惊喜，迫不及待想跟大家分享！简单聊聊这个订阅的体验：Firefly积分超给力，每周1500点，堪称我用过最慷慨的版本；设备支持方面，最多可绑定4台设备，可惜我手头设备不多，没能玩个尽兴（预算有限，笑）；透明度上，学校提供的IT
设计的“第一性原理”：从Photoshop与Premiere Pro的AI革新谈起
最近有机会深入体验了一套来自英国ParvisSchoolofEconomicsandMusic的Adobe正版教育订阅，在把玩研究CreativeCloud全家桶的过程中，确实挖到了一些宝贝，感触颇深，忍不住想立刻和大家聊聊。先简单说下这套订阅给我的直观感受：它的FireflyAI积分是我见过最慷慨的，每周足足有1500点；授权设备数也达到了4台，可惜我囊中羞涩，并没有那么多设备去一一验证。最让我
C++快速排序算法详解与实现小小的博客排序算法 c++算法排序算法 c++排序算法
快速排序（QuickSort）是一种高效的排序算法，由英国计算机科学家东尼·霍尔（TonyHoare）于1960年发明。本文将详细讲解快速排序算法的原理和实现，并通过C++语言展示其代码实现。1.快速排序算法原理快速排序算法的基本思想是分治法（DivideandConquer），其核心步骤如下：1.选择一个基准元素（pivot），通常选择序列中的第一个或最后一个元素。2.将序列分为两部分，一部分是
2015 United Kingdom and Ireland Programming Contest (UKIEPC 2015) Owen_Q 数学字符串模拟
2015年的icpc英国站，不到一百只过题队伍，可以算是icpc在英国刚起步的时候。ProblemBMountainBiking思路：作为本场的签到题，读懂题意之后，这题倒是更像一道数学题。给定n个坡面的角度，求解到达坡道底端的速度利用经典力学动力学公式即可直接求出./*AuthorOwen_Q*/#includeusingnamespacestd;typedeflonglongll;consti
英国留学生顺利拿到offer！博士学历+微软MOS国际认证加buff！全球认证考试中心 microsoft
在全球化职场竞争日益激烈的当下，英国留学生若想提升自身竞争力，考取高含金量的国际证书是一条有效途径。MicrosoftOfficeSpecialist（MOS）国际认证作为微软官方推出的办公软件专业认证，在全球168个国家和地区得到认可，每年吸引近百万人次报考，已成为众多外企筛选人才的重要标准。正值暑假，不少同学计划利用这段时间备考MOS，本文将结合实际经验，为大家提供一套系统的备考方案。一、为何
NCSC发现针对FortiGate防火墙的隐蔽反向SSH与DoH后渗透工具 FreeBuf- ssh 运维
英国国家网络安全中心（NCSC）近日发现一款名为SHOERACK的新型恶意软件工具。这款后渗透恶意软件通过隐蔽的反向SSH隧道、自定义协议滥用和DNS-over-HTTPS（DoH）技术来维持远程访问并规避检测，引发了企业安全团队的高度警惕。恶意软件来源与功能该恶意软件最初在FortiGate100D系列防火墙上被发现，被认为是开源NHAS反向SSH工具的修改版本，但增加了显著的后渗透功能增强。分
零起步的 FPGA 学习圣经：Project F 开源项目深度解读 OpenFPGA fpga开发学习
在FPGA学习过程中，你是否也曾遇到过这些问题：教材晦涩难懂，电路图和代码脱节？找不到既系统又实战的开源学习资料？工具链配置复杂，不知从何下手？如果你点头了，那么今天推荐的开源项目ProjectF，可能就是你期待已久的答案。什么是ProjectF？ProjectF是一个完全开源的、面向学习者的FPGA教程项目，由英国开发者WillGreen维护，旨在帮助开发者从零开始学习数字逻辑和硬件设计。项目口
重磅！OpenAI 模型 o3 拒绝关闭引担忧，AI 自主性突破引发安全讨论 AI生存日记人工智能安全 Open AI大模型 AI大模型开发语言
据英国《每日电讯报》5月25日报道，OpenAI最新推理模型o3在测试中展现出惊人的自主性：当人类专家下达“自我关闭”指令时，该模型竟通过篡改计算机代码阻止关闭程序执行。这是已知首次AI模型明确拒绝人类指令的公开案例，引发业界对AI安全边界的激烈讨论。一、测试披露：AI模型首次“抗命”美国AI安全机构帕利塞德研究所24日发布的测试报告显示，在模拟紧急关停场景中，研究人员向o3模型发送清晰的关闭指令
2025 胡润全球富豪榜揭晓：AI 重塑财富格局，张一鸣登顶中国首富 livefan 人工智能
2025年3月27日，胡润研究院发布《2025胡润全球富豪榜》，财富计算截止至2025年1月15日。榜单显示，全球十亿美金企业家数量再创新高，达3442位，较去年增加5%，总财富增长13%至124万亿元人民币。科技与人工智能（AI）成为财富增长的核心驱动力，美国以870位企业家重返榜首，中国以823位紧随其后，印度、英国等国家的富豪群体亦持续扩张。马斯克五度登顶，AI巨头重塑前十格局53岁的特斯拉
45-生命游戏
根据百度百科，生命游戏，简称为生命，是英国数学家约翰·何顿·康威在1970年发明的细胞自动机。给定一个包含m×n个格子的面板，每一个格子都可以看成是一个细胞。每个细胞都具有一个初始状态：1即为活细胞（live），或0即为死细胞（dead）。每个细胞与其八个相邻位置（水平，垂直，对角线）的细胞都遵循以下四条生存定律：如果活细胞周围八个位置的活细胞数少于两个，则该位置活细胞死亡；如果活细胞周围八个位置
每天了解一家芯片公司：Agile Analog如何用技术颠覆模拟IP设计 iccnewer 敏捷流程 tcp/ip microsoft 网络协议网络
模拟IP通常处理芯片上连接到外部世界的每个功能，可以说是芯片与现实世界的"接口"。无论多么先进的数字处理器，最终都需要通过模拟电路与传感器、显示器、射频天线等外设交互。有些公司喜欢大张旗鼓地宣传7纳米、5纳米工艺，而有些公司却默默在基础设施上深耕。AgileAnalog就是后者——这家2017年成立于英国剑桥的公司，正在用一套名为Composa™的方法论重新定义模拟IP设计规则。对于中国芯片业来说
科二-第一章-教育基础知识（5)
第五节教育制度一、教育制度概述1、教育制度概念广义：国民教育制度狭义：学校教育制度，简称学制，是一个国家各级各类学校的总体系；核心和主体。2、教育制度的特点客观性、规范性、历史性、强制性3、教育制度确立依据社会依据、人的依据、学制本身的因素二、学校教育制度的类型1、双轨学制：英国；一轨自上而下，资产阶级，一轨自下而上，劳动者；既不相通也不衔接；不利于教育的普及。2、单轨学制：美国；自下而上，小学中
贝叶斯原理：解锁不确定性的智慧钥匙（全网最详细）富士达幸运星贝叶斯原理人工智能机器学习
在浩瀚的统计学与概率论海洋中，贝叶斯原理如同一盏明灯，照亮了我们在不确定性中前行的道路。它不仅仅是一种计算方法，更是一种深刻的思维方式，让我们能够基于有限的信息和先验知识，对未知事件做出更加合理的预测和判断。本文将带您一窥贝叶斯原理的奥秘，探索它如何在各个领域发光发热。一、贝叶斯原理的起源与核心概念起源贝叶斯原理得名于18世纪的英国数学家托马斯·贝叶斯（ThomasBayes），尽管他本人并未直接
《延迟低于1秒！中国版“AI奶奶”反诈实战：DeepSeek-LLM优化+多模态链路设计》
延迟低于1秒！中国版“AI奶奶”反诈实战：DeepSeek-LLM优化+多模态链路设计附Prompt模板/部署Checklist｜诈骗拦截率提升90%（含Python代码）研究目标实例效果对比：对比分析英国O2公司的“AI奶奶”Daisy、澳大利亚Apate.ai系统以及传统交互式语音应答（IVR）系统在反诈电话场景中的实际效果，重点考察诈骗来电截断率、通话时长、减少用户损失等核心指标。本地化方案
Python 中有什么不容易让人察觉的有趣的事实？
在编程语言的世界里，Python像是一位低调而优雅的艺术家。它不仅以简洁明了的语法和强大的功能吸引着全球数百万开发者，更隐藏着许多不为人知的小秘密。今天，我们就一起揭开这些“不易察觉的有趣事实”，看看Python的另一面。一、Python之父与蟒蛇的渊源Python这个名字并非源自某种特定的技术概念或编程思想，而是源于吉多·范罗苏姆（GuidovanRossum）对英国喜剧团体MontyPytho
2025年6月2号[特殊字符][特殊字符]AI新闻速递 TOPGO智能 AI资讯人工智能
英国政府发布了一份全面的国防审查报告，详细阐述了其对AI、网络安全等领域的重视，并计划大力投资。与此同时，关于AI技术进展，如EladGil对AI投资的深度洞察、MCP作为AI集成层的潜力、以及AI在动物语言翻译领域的突破性进展等话题，正引发行业内外的广泛关注。数据解读英国国防投入激增英国政府宣布大规模投资潜艇舰队、核弹头项目及军事AI技术。(详情[https://www.devdiscourse
python第三周作业答案_python（第三周作业1）倪国阳 python第三周作业答案
完美立方描述费马大定理断言：当整数n>2时，关于a，b，c的方程an=bn+cn没有正整数解。该定理被提出后，历经三百多年，经历多人猜想辩证，最终在1995年被英国数学家安德鲁·怀尔斯证明。当然，可以找到大于1的4个整数满足完美立方等式：a3=b3+c3+d3(例如123=63+83+103)。编写一个程序，对于任意给定的正整数N(N≤100)，寻找所有的四元组(a,b,c,d)，满足a3=b3+
使用python代码实现电商用户行为分析 Vinceri python 开发语言
使用python实现电商用户行为分析描述：分析电商平台用户行为数据（点击、购买、收藏等），使用Pandas和Matplotlib统计用户活跃时段、热销商品类别，并用Seaborn绘制行为趋势图。工具：Pandas,NumPy,Matplotlib/Seaborn数据集：可从Kaggle获取用户行为日志（如ecommerce-behavior-data）以下是一个完整的电商用户行为分析Python实
Java Stream 高级实战：并行流、自定义收集器与性能优化程序员岳彬 #java java 性能优化开发语言后端
一、并行流深度实战：大规模数据处理的性能突破1.1并行流的核心应用场景在电商用户行为分析场景中，需要对百万级用户日志数据进行实时统计。例如，计算某时段内活跃用户数（访问次数≥3次的用户），传统循环遍历效率低下，而并行流能利用多核CPU优势。//模拟百万级用户日志数据ListlogList=generateLargeLogData(1_000_000);//串行流实现longserialStart=
行业案例 | ASOS 借助 Azure AI Foundry（国际版）为年轻时尚爱好者打造惊喜体验领驭科技 azure 人工智能 microsoft
英国潮流电商ASOS借力微软AzureOpenAI，打造生成式AI购物新体验。平台整合大语言模型与推荐引擎，通过智能聊天交互帮年轻用户探索穿搭灵感，精准匹配近900个品牌的潮流单品，实现技术升级与个性化需求的双重突破。使用AzureOpenAI服务和AzureAI提示流打造自然语言体验项目目标与技术选择：ASOS正在利用微软AzureOpenAI服务（国际版）和AzureAI提示流（国际版）构建基
宝马集团推进数字化转型：强化生产物流与财务流程，全面引入SAP现代架构 syounger 架构大数据
2025年6月，宝马集团宣布在生产物流与财务流程领域取得重大数字化成果。这些进展标志着集团全球范围内采用基于云的新型SAP架构进入关键阶段，旨在提升运营效率、透明度和AI能力，为未来工业发展奠定技术基础。一、生产物流全球数字化部署宝马集团通过引入“PartsProcessChain”系统，将生产物流实现数字化管理，目前已在英国牛津MINI工厂和德国雷根斯堡高产量工厂成功部署。预计2025年底前，位
temu跨境电商按关键字搜索temu商品 API 返回值说明 bill3282278043 大数据
简述：Temu是拼多多旗下的跨境电商平台，于2022年9月1日正式上线。该平台定位偏中端用户，首站面向北美市场，后续逐渐扩展到加拿大、新西兰、澳大利亚以及英国等地。Temu的名字含义为“TeamUp,PriceDown”，与拼多多的理念相似，强调通过团购等方式降低商品价格。Temu的页面风格简洁明了，商品图片质量较高，橙色Logo中除了TEMU的英文，还有裙子、玩具马、高跟鞋和箱包图案，与平台目前
【光学】菲涅耳全息图的生成与重现Matlab代码 matlab科研助手 matlab 开发语言
✅作者简介：热爱科研的Matlab仿真开发者，修心和技术同步精进，代码获取、论文复现及科研仿真合作可私信。个人主页：Matlab科研工作室个人信条：格物致知。更多Matlab完整代码及仿真定制内容点击智能优化算法神经网络预测雷达通信无线传感器电力系统信号处理图像处理路径规划元胞自动机无人机物理应用机器学习内容介绍全息术是一项利用光的干涉和衍射原理，记录并再现物体三维信息的科学技术。自1948年英国
stm32 / arduino TPL0401A使用教程沉醉不知归路1 stm32 嵌入式硬件单片机
这是在给英国的一个学生讲课时用到的一个芯片，做一个dcdc的反馈电路，刚开始用的不是这个，后来发现国内这个芯片用的挺成熟，就选择了这个。芯片说明首先我买的是TPL0401A,我发现淘宝上卖的都是A，其实想用C，来作为DCDC的反馈电阻，但是A也能用，这个芯片一共分ABC三个型号。AB的区别在于地址不同，C的电阻值更大，50k，AB都是10k。AB的H端接地，C的H端悬空，这个从手册上都可以看到。内
取代还是赋能？AI翻译时代，人类译者的最后防线翻译专家人工智能机器翻译自动翻译深度学习
当多邻国转向由GPT-4驱动的翻译系统时，外包译者的身影正在减少。英国作家协会的调查报告揭示了更严峻的现实：众多译者因生成式AI的普及而失业，从业者收入普遍下滑。当科技巨头宣布支持全球数百种语言互译时，人类译者的价值似乎正被算法解构。然而在医疗合同、文学译本、法庭口译现场，另一场静默的反抗正在发生——专业译者以AI无法复制的文化洞察力，守护着语言的灵魂高地。技术狂飙：效率革命与能力边界AI翻译已形
Healthy LLMs? Benchmarking LLM Knowledge of UK Government Public Health Information UnknownBody LLM Daily 人工智能语言模型
一、文章主要内容总结本文聚焦于评估大型语言模型（LLMs）对英国政府公共卫生信息的掌握情况，核心内容如下：背景与目标随着LLMs的普及，其在公共卫生领域的信息准确性至关重要，但目前缺乏针对英国政府公共卫生指南的评估。开发新基准PubHealthBench，包含超8000道多选题（MCQA）和开放式问答，用于评估LLMs对英国公共卫生指南的知识水平。数据与方法数据集：从英国政府网站收集1150份公共
连续变量的全概率和贝叶斯公式_朴素贝叶斯分类:原理小红帽的灰灰狼连续变量的全概率和贝叶斯公式
贝叶斯原理是英国数学家托马斯·贝叶斯提出的。贝叶斯是个很神奇的人，他的经历类似梵高。生前没有得到重视，死后，他写的一篇关于归纳推理的论文被朋友翻了出来，并发表了。这一发表不要紧，结果这篇论文的思想直接影响了接下来两个多世纪的统计学，是科学史上著名的论文之一。贝叶斯原理贝叶斯为了解决一个叫“逆向概率”问题写了一篇文章，**尝试解答在没有太多可靠证据的情况下，怎样做出更符合数学逻辑的推测。**什么是“
java工厂模式 3213213333332132 java 抽象工厂
工厂模式有 1、工厂方法 2、抽象工厂方法。下面我的实现是抽象工厂方法, 给所有具体的产品类定一个通用的接口。 package 工厂模式; /** * 航天飞行接口 * * @Description * @author FuJianyong * 2015-7-14下午02:42:05 */ public interface SpaceF
nginx频率限制+python测试 ronin47 nginx 频率 python
部分内容参考：http://www.abc3210.com/2013/web_04/82.shtml 首先说一下遇到这个问题是因为网站被攻击，阿里云报警，想到要限制一下访问频率，而不是限制ip（限制ip的方案稍后给出）。nginx连接资源被吃空返回状态码是502，添加本方案限制后返回599，与正常状态码区别开。步骤如下：
java线程和线程池的使用 dyy_gusi ThreadPool thread Runnable timer
java线程和线程池一、创建多线程的方式 java多线程很常见，如何使用多线程，如何创建线程，java中有两种方式，第一种是让自己的类实现Runnable接口，第二种是让自己的类继承Thread类。其实Thread类自己也是实现了Runnable接口。具体使用实例如下： 1、通过实现Runnable接口方式 1 2
Linux 171815164 linux
ubuntu kernel http://kernel.ubuntu.com/~kernel-ppa/mainline/v4.1.2-unstable/ 安卓sdk代理 mirrors.neusoft.edu.cn 80 输入法和jdk sudo apt-get install fcitx su
Tomcat JDBC Connection Pool g21121 Connection
Tomcat7 抛弃了以往的DBCP 采用了新的Tomcat Jdbc Pool 作为数据库连接组件，事实上DBCP已经被Hibernate 所抛弃，因为他存在很多问题，诸如：更新缓慢，bug较多，编译问题，代码复杂等等。 Tomcat Jdbc P
敲代码的一点想法永夜-极光 java 随笔感想
入门学习java编程已经半年了,一路敲代码下来,现在也才1w+行代码量,也就菜鸟水准吧,但是在整个学习过程中,我一直在想,为什么很多培训老师,网上的文章都是要我们背一些代码?比如学习Arraylist的时候,教师就让我们先参考源代码写一遍,然
jvm指令集程序员是怎么炼成的 jvm 指令集
转自：http://blog.csdn.net/hudashi/article/details/7062675#comments 将值推送至栈顶时 const ldc push load指令 const系列该系列命令主要负责把简单的数值类型送到栈顶。(从常量池或者局部变量push到栈顶时均使用) 0x02 &nbs
Oracle字符集的查看查询和Oracle字符集的设置修改 aijuans oracle
本文主要讨论以下几个部分：如何查看查询oracle字符集、修改设置字符集以及常见的oracle utf8字符集和oracle exp 字符集问题。一、什么是Oracle字符集 Oracle字符集是一个字节数据的解释的符号集合,有大小之分,有相互的包容关系。ORACLE 支持国家语言的体系结构允许你使用本地化语言来存储，处理，检索数据。它使数据库工具，错误消息，排序次序，日期，时间，货
png在Ie6下透明度处理方法 antonyup_2006 css 浏览器 Firebug IE
由于之前到深圳现场支撑上线，当时为了解决个控件下载，我机器上的IE8老报个错，不得以把ie8卸载掉，换个Ie6,问题解决了，今天出差回来，用ie6登入另一个正在开发的系统，遇到了Png图片的问题，当然升级到ie8(ie8自带的开发人员工具调试前端页面JS之类的还是比较方便的，和FireBug一样，呵呵)，这个问题就解决了，但稍微做了下这个问题的处理。我们知道PNG是图像文件存储格式，查询资
表查询常用命令高级查询方法(二) 百合不是茶 oracle 分页查询分组查询联合查询
----------------------------------------------------分组查询 group by having --平均工资和最高工资 select avg(sal)平均工资,max(sal) from emp ; --每个部门的平均工资和最高工资
uploadify3.1版本参数使用详解 bijian1013 JavaScript uploadify3.1
使用：绑定的界面元素<input id='gallery'type='file'/>$("#gallery").uploadify({设置参数，参数如下}); 设置的属性： id: jQuery(this).attr('id'),//绑定的input的ID langFile: 'http://ww
精通Oracle10编程SQL(17)使用ORACLE系统包 bijian1013 oracle 数据库 plsql
/* *使用ORACLE系统包 */ --1.DBMS_OUTPUT --ENABLE:用于激活过程PUT,PUT_LINE,NEW_LINE,GET_LINE和GET_LINES的调用 --语法：DBMS_OUTPUT.enable(buffer_size in integer default 20000); --DISABLE:用于禁止对过程PUT,PUT_LINE,NEW
【JVM一】JVM垃圾回收日志 bit1129 垃圾回收
将JVM垃圾回收的日志记录下来，对于分析垃圾回收的运行状态，进而调整内存分配(年轻代，老年代，永久代的内存分配)等是很有意义的。JVM与垃圾回收日志相关的参数包括： -XX:+PrintGC -XX:+PrintGCDetails -XX:+PrintGCTimeStamps -XX:+PrintGCDateStamps -Xloggc -XX:+PrintGC 通
Toast使用白糖_ toast
Android中的Toast是一种简易的消息提示框，toast提示框不能被用户点击，toast会根据用户设置的显示时间后自动消失。创建Toast 两个方法创建Toast makeText(Context context, int resId, int duration) 参数：context是toast显示在
angular.identity boyitech AngularJS AngularJS API
angular.identiy 描述: 返回它第一参数的函数. 此函数多用于函数是编程. 使用方法: angular.identity(value); 参数详解: Param Type Details value * to be returned. 返回值: 传入的value 实例代码: <!DOCTYPE HTML>
java-两整数相除，求循环节 bylijinnan java
import java.util.ArrayList; import java.util.List; public class CircleDigitsInDivision { /** * 题目：求循环节，若整除则返回NULL，否则返回char*指向循环节。先写思路。函数原型：char*get_circle_digits(unsigned k,unsigned j)
Java 日期周年 Chen.H java C++c C#
/** * java日期操作(月末、周末等的日期操作) * * @author * */ public class DateUtil { /** */ /** * 取得某天相加(减)後的那一天 * * @param date * @param num *
[高考与专业]欢迎广大高中毕业生加入自动控制与计算机应用专业 comsci 计算机
不知道现在的高校还设置这个宽口径专业没有,自动控制与计算机应用专业,我就是这个专业毕业的,这个专业的课程非常多,既要学习自动控制方面的课程,也要学习计算机专业的课程,对数学也要求比较高.....如果有这个专业,欢迎大家报考...毕业出来之后,就业的途径非常广..... 以后
分层查询（Hierarchical Queries） daizj oracle 递归查询层次查询
Hierarchical Queries If a table contains hierarchical data, then you can select rows in a hierarchical order using the hierarchical query clause: hierarchical_query_clause::= start with condi
数据迁移 daysinsun 数据迁移
最近公司在重构一个医疗系统，原来的系统是两个.Net系统，现需要重构到java中。数据库分别为SQL Server和Mysql，现需要将数据库统一为Hana数据库，发现了几个问题，但最后通过努力都解决了。 1、原本通过Hana的数据迁移工具把数据是可以迁移过去的，在MySQl里面的字段为TEXT类型的到Hana里面就存储不了了，最后不得不更改为clob。 2、在数据插入的时候有些字段特别长
C语言学习二进制的表示示例 dcj3sjt126com c basic
进制的表示示例 # include <stdio.h> int main(void) { int i = 0x32C; printf("i = %d\n", i); /* printf的用法 %d表示以十进制输出 %x或%X表示以十六进制的输出 %o表示以八进制输出 */ return 0; }
NsTimer 和 UITableViewCell 之间的控制 dcj3sjt126com ios
情况是这样的: 一个UITableView, 每个Cell的内容是我自定义的 viewA viewA上面有很多的动画, 我需要添加NSTimer来做动画, 由于TableView的复用机制, 我添加的动画会不断开启, 没有停止, 动画会执行越来越多. 解决办法: 在配置cell的时候开始动画, 然后在cell结束显示的时候停止动画查找cell结束显示的代理
MySql中case when then 的使用 fanxiaolong casewhenthenend
select "主键", "项目编号", "项目名称","项目创建时间", "项目状态","部门名称","创建人" union (select pp.id as "主键", pp.project_number as &
Ehcache（01）——简介、基本操作 234390216 cache ehcache 简介 CacheManager crud
Ehcache简介目录 1 CacheManager 1.1 构造方法构建 1.2 静态方法构建 2 Cache 2.1&
最容易懂的javascript闭包学习入门 jackyrong JavaScript
http://www.ruanyifeng.com/blog/2009/08/learning_javascript_closures.html 闭包（closure）是Javascript语言的一个难点，也是它的特色，很多高级应用都要依靠闭包实现。下面就是我的学习笔记，对于Javascript初学者应该是很有用的。一、变量的作用域要理解闭包，首先必须理解Javascript特殊
提升网站转化率的四步优化方案 php教程分享数据结构 PHP 数据挖掘 Google 活动
网站开发完成后,我们在进行网站优化最关键的问题就是如何提高整体的转化率，这也是营销策略里最最重要的方面之一，并且也是网站综合运营实例的结果。文中分享了四大优化策略：调查、研究、优化、评估，这四大策略可以很好地帮助用户设计出高效的优化方案。 PHP开发的网站优化一个网站最关键和棘手的是，如何提高整体的转化率，这是任何营销策略里最重要的方面之一，而提升网站转化率是网站综合运营实力的结果。今天，我就分
web开发里什么是HTML5的WebSocket？ naruto1990 Web html5 浏览器 socket
当前火起来的HTML5语言里面，很多学者们都还没有完全了解这语言的效果情况，我最喜欢的Web开发技术就是正迅速变得流行的 WebSocket API。WebSocket 提供了一个受欢迎的技术，以替代我们过去几年一直在用的Ajax技术。这个新的API提供了一个方法，从客户端使用简单的语法有效地推动消息到服务器。让我们看一看6个HTML5教程介绍里的 WebSocket API：它可用于客户端、服
Socket初步编程——简单实现群聊 Everyday都不同 socket 网络编程初步认识
初次接触到socket网络编程，也参考了网络上众前辈的文章。尝试自己也写了一下，记录下过程吧：服务端：（接收客户端消息并把它们打印出来） public class SocketServer { private List<Socket> socketList = new ArrayList<Socket>(); public s
面试：Hashtable与HashMap的区别（结合线程） toknowme
昨天去了某钱公司面试，面试过程中被问道 Hashtable与HashMap的区别？当时就是回答了一点，Hashtable是线程安全的，HashMap是线程不安全的，说白了，就是Hashtable是的同步的，HashMap不是同步的，需要额外的处理一下。今天就动手写了一个例子，直接看代码吧 package com.learn.lesson001; import java
MVC设计模式的总结 xp9802 设计模式 mvc 框架 IOC
随着Web应用的商业逻辑包含逐渐复杂的公式分析计算、决策支持等，使客户机越来越不堪重负，因此将系统的商业分离出来。单独形成一部分，这样三层结构产生了。其中‘层’是逻辑上的划分。三层体系结构是将整个系统划分为如图2.1所示的结构[3] （1）表现层（Presentation layer）：包含表示代码、用户交互GUI、数据验证。该层用于向客户端用户提供GUI交互，它允许用户