Rainbow_Qi

购买行为中的关联规则挖掘(python分析)

依据交易数据集 basket_data.csv 挖掘数据中购买行为中的关联规则

问题概述

实验目的

本实验旨在通过关联规则分析挖掘购物篮中的购买行为。通过分析购物篮中不同商品之间的关联关系，可以揭示商品之间的搭配规律，为商家提供定制化的推荐策略，优化产品摆放和促销活动，以提高销售额和顾客满意度。

数据集描述

本实验使用的数据集为名为 "basket_data.csv" 的交易数据集，该数据集记录了顾客在购物时的交易信息。以下是数据集的描述：

- Transaction: 交易编号，表示一次购物交易的唯一标识。

- Item: 商品名称，表示顾客购买的商品。

- date_time: 交易时间，表示购买发生的日期和时间。

- period_day: 交易发生的时间段，可以是"morning"（上午）或 "afternoon"（下午）。

- weekday_weekend: 交易发生的工作日/周末，可以是 "weekday"（工作日）或 "weekend"（周末）。

数据集中的每一行记录代表一次购物交易，顾客可能同时购买多种商品。通过对数据集进行关联规则分析，可以发现商品之间的频繁项集和关联规则，例如哪些商品经常一起购买，或者购买某个商品时另一个商品的出现概率较高等。这些规律有助于了解顾客的购买习惯，为商家提供决策支持，以优化产品摆放、销售策略和推荐系统等方面的工作。

数据预处理

预处理是数据分析的重要步骤之一，常用于数据清洗、转换和准备阶段，以确保数据的质量和适用性。在关联规则分析中，预处理步骤可能包括以下几个方面：

1. 数据清洗：检查数据集中是否存在缺失值、重复值、异常值或错误数据，并进行相应的处理。例如，可以删除缺失值或重复值，根据领域知识或统计方法处理异常值。通过浏览表格数据，并未发现缺失值。

2. 数据转换：根据分析的需求，对数据进行适当的转换。例如，可以将日期时间字段拆分为日期和时间，并进行标准化；将文本数据进行编码，以便进行分析；或者将连续值离散化为分类变量。

3. 数据集构建：根据实验目标，构建适当的数据集。例如，可以按照交易编号将购买同一交易中的商品进行组合，以形成适合关联规则分析的交易项集。

4. 数据编码：将数据集中的离散变量进行编码，以便进行关联规则分析。常用的编码方法包括独热编码、标签编码等。

具体的预处理步骤和方法取决于数据的特点、实验目标和分析需求。在实际应用中，根据实验的具体要求和数据的特点，可以进行适当的预处理操作，以确保数据的准确性、一致性和可用性。本实验对数据进行了列提取和对数据进行转换操作。

问题分析

当分析挖掘购买行为中的关联规则时，我们需要经过以下步骤来实现这一目标。这些步骤旨在从交易数据集中揭示不同物品之间的相关性和依赖关系，帮助企业更好地了解消费者的购买习惯，以制定更有效的营销策略和推荐系统。

首先，我们使用名为“basket_data.csv”的交易数据集进行分析。该数据集包含了交易编号、购买的物品、日期时间、购买时间段以及是否为工作日或周末的信息。

在进行分析之前，我们需要对数据进行预处理。根据我们的分析目标，我们只需保留“Transaction”和“Item”这两列数据，将其他列进行删除。这样可以将数据转换为适合进行关联规则挖掘的格式。接下来，我们可以使用Apriori算法进行关联规则挖掘。Apriori算法是一种经典的关联规则挖掘算法，能够帮助我们找到经常同时出现的物品组合。

在应用Apriori算法之前，我们需要将数据集转换为算法所需的格式。我们将每个交易的物品列表作为一个列表的列表，并将其作为输入提供给Apriori算法。然后，需要设置支持度阈值和置信度阈值。支持度表示物品组合在数据集中出现的频率，而置信度表示关联规则的可靠程度。通过设置适当的阈值，我们可以控制挖掘出的频繁项集和关联规则的数量和质量。通过调用Apriori算法，我们可以得到频繁项集，即经常同时出现的物品组合。这些频繁项集可以作为潜在的关联规则的基础。接下来，我们可以使用关联规则生成方法从频繁项集中生成具有一定置信度的关联规则。通过设置适当的置信度阈值，我们可以筛选出具有一定关联性的规则。最后，通过分析挖掘出的频繁项集和关联规则，我们可以解释和理解结果。我们可以根据支持度、置信度等指标评估规则的重要性和可信度，并根据具体的业务需求和上下文进行解读和应用。

通过这个分析过程和关联规则挖掘算法，我们能够从购买行为数据中发现物品之间的关联规律，为企业提供决策支持。这些规律可以帮助企业制定定向营销策略、个性化推荐以及商品搭配等策略，从而更好地满足消费者的需求和提升业绩。

算法选择

在关联规则分析中，常见的算法包括Apriori算法和FP-growth算法：

Apriori算法是一种基于频繁项集的关联规则挖掘算法。它通过扫描数据集来识别频繁项集，然后基于频繁项集生成关联规则。Apriori算法的主要优点是简单易实现，适用于处理小规模数据集。然而，对于大规模数据集，Apriori算法的计算开销较大，因为它需要进行多次数据扫描。

FP-growth算法是一种基于FP树的关联规则挖掘算法。它通过构建FP树来表示数据集，并利用FP树的性质进行频繁项集的挖掘。相比于Apriori算法，FP-growth算法具有更高的效率，尤其在处理大规模数据集时表现更好。它只需要对数据集进行两次扫描，因此在计算开销上较为高效。

本实验选择Apriori算法进行关联规则挖掘的原因如下：

Apriori算法是一种经典而有效的关联规则挖掘算法，适用于发现频繁项集和生成关联规则，被广泛应用于关联规则的发现和分析。它的原理相对简单，易于理解和实现。并且本实验的数据对象仅为200条样本数据，数据规模并不算大。
Apriori算法基于频繁项集的概念进行关联规则挖掘。频繁项集是在数据集中频繁出现的物品组合。通过找到频繁项集，我们可以挖掘出经常同时出现的物品组合，从而推断它们之间的关联关系。
Apriori算法利用支持度剪枝的策略，减少候选项集的搜索空间。通过设置支持度阈值，可以排除掉低支持度的候选项集，从而减少计算开销。
Apriori算法不仅可以找到频繁项集，还可以基于频繁项集生成关联规则。通过设置置信度阈值，可以筛选出具有一定可靠性的关联规则。这使得我们可以通过关联规则来推断物品之间的关联性，进而进行数据分析和决策支持。

2.实验过程

2.1 步骤说明

通过以上步骤，我们得到了频繁项集和关联规则的输出结果。频繁项集显示了经常同时出现的物品组合，而关联规则显示了物品之间的关联性以及支持度、置信度等指标。（可以根据具体的需求和实际情况调整支持度和置信度的阈值，以探索不同的关联规则。）

2.2 完整代码

import pandas as pd
from mlxtend.preprocessing import TransactionEncoder
from mlxtend.frequent_patterns import apriori, association_rules

# 1. 加载数据集
data = pd.read_csv('basket_data.csv')

# 2. 数据预处理
data = data[['Transaction', 'Item']]

# 3. 数据转换
transaction_list = data.groupby('Transaction')['Item'].apply(list).values.tolist()

# 4. 构建关联规则
te = TransactionEncoder()
te_ary = te.fit_transform(transaction_list)
df = pd.DataFrame(te_ary, columns=te.columns_)
frequent_itemsets = apriori(df, min_support=0.05, use_colnames=True)
rules = association_rules(frequent_itemsets, metric="confidence", min_threshold=0.5)

# 输出频繁项集和关联规则
print("频繁项集:")
print(frequent_itemsets)
print("\n关联规则:")
print(rules)

频繁项集:
     support         itemsets
0   0.327205          (Bread)
1   0.103856           (Cake)
2   0.478394         (Coffee)
3   0.054411        (Cookies)
4   0.058320  (Hot chocolate)
5   0.061807      (Medialuna)
6   0.086107         (Pastry)
7   0.071844       (Sandwich)
8   0.142631            (Tea)
9   0.090016  (Coffee, Bread)
10  0.054728   (Coffee, Cake)

关联规则:
  antecedents consequents  antecedent support  consequent support   support  \
0      (Cake)    (Coffee)            0.103856            0.478394  0.054728   

   confidence      lift  leverage  conviction  zhangs_metric  
0    0.526958  1.101515  0.005044    1.102664        0.10284

这段代码实现了使用Apriori算法进行关联规则挖掘的步骤。下面对代码进行详细分析说明：

从数据集中选择两列数据“Transaction”和“Item”。这些列分别表示交易ID和购买的物品。通过“data[[“Transaction”, “Item”]]”语句，将只包含这两列的数据提取出来，存储在“data”变量中。

在进行关联规则挖掘之前，需要将数据集转换为Apriori算法所需的格式。首先，使用“groupby”函数按交易ID进行分组，然后使用“apply(list)”将每个交易中购买的物品转换为列表，并使用“values.tolist()”将所有交易转换为列表的列表。这样就得到了一个二维列表“transaction_list”，其中每个子列表代表一笔交易的物品列表。

构建关联规则：使用mlxtend库中的“TransactionEncoder”将“transaction_list”转换为Apriori算法所需的布尔类型的数据矩阵。“TransactionEncoder”是一个用于转换事务数据的工具类，它将每个物品转换为一个列，并为每个交易中存在的物品标记为True。然后，使用转换后的数据矩阵构建一个DataFrame对象“df`”，其中每列代表一个物品，每行代表一笔交易。

接下来，使用“apriori”函数来计算频繁项集。“apriori”函数接受DataFrame对象和最小支持度阈值作为输入，并返回包含频繁项集的DataFrame。在这里，设置了“min_support=0.05”，表示设置支持度阈值为5%。频繁项集是经常同时出现的物品组合。

最后，使用“association_rules”函数从频繁项集中生成关联规则。“association_rules”函数接受频繁项集和关联规则的评估指标（在这里是置信度）的最小阈值作为输入，并返回包含关联规则的DataFrame。在这里，设置了“metric="confidence"”和“min_threshold=0.5”，表示使用置信度作为评估指标，并设置置信度阈值为50%。关联规则是满足最小置信度阈值的规则。

3. 结果分析

3.1 频繁项集分析

频繁项集是指在数据集中经常同时出现的物品组合。根据实验结果，我们可以看到频繁项集的支持度（support）和物品组合（itemsets）。支持度表示物品组合在所有交易中出现的频率。例如，Bread的支持度为0.327205，表示在所有交易中，购买Bread的交易占总交易数的32.72%。我们可以根据支持度的大小对频繁项集进行排序，以了解哪些物品组合最常出现。例如，Coffee的支持度为0.478394，说明Coffee是最常出现的物品。

3.2 关联规则分析

关联规则是指物品之间的关联性以及其相关度量，如置信度（confidence）、提升度（lift）等。

关联规则中的antecedents表示规则的前提项，consequents表示规则的结论项。例如，(Cake) -> (Coffee)表示购买Cake的顾客也会购买Coffee。

支持度、置信度和提升度是关联规则的重要度量指标：

支持度表示同时包含前提项和结论项的交易占总交易数的比例。例如，(Cake) -> (Coffee)的支持度为0.054728，表示同时购买Cake和Coffee的交易占总交易数的5.47%。
置信度表示在购买前提项的情况下，同时购买结论项的概率。例如，(Cake) -> (Coffee)的置信度为0.526958，表示购买Cake的顾客中有52.70%也会购买Coffee。
提升度表示购买前提项的情况下，购买结论项的概率相对于只购买结论项的概率的增加倍数。例如，(Cake) -> (Coffee)的提升度为1.101515，说明购买Cake会将购买Coffee的概率增加1.101515倍。
除了支持度、置信度和提升度外，还可以使用其他度量指标来评估关联规则的质量。例如，leverage、conviction和zhangs_metric。

通过以上分析，我们可以得出以下结论和洞察：

Bread、Coffee和Pastry是最常购买的物品，它们的支持度较高。
关联规则分析显示了一些有趣的购买关联性。例如，购买Cake的顾客中有一部分也会购买Coffee，这可以作为市场营销的潜在策略，例如将Cake和Coffee进行捆绑销售或者推荐给购买Cake的顾客。
通过提升度可以判断关联规则的相关性。提升度大于1表示前提项和结论项之间有正向关联，小于1表示负向关联，等于1表示没有关联。在这个实验中，(Cake) -> (Coffee)的提升度略大于1，说明购买Cake会略微增加购买Coffee的概率，但关联性不是非常强。

在本实验中，我们得到了以下关联规则：

1. {Cake} => {Coffee}

这条规则的支持度为0.103856，置信度为0.526958。支持度表示购买蛋糕和咖啡的同时发生的频率，而置信度表示当顾客购买蛋糕时，他们也购买咖啡的概率。

通过分析这条规则，我们可以得出结论：蛋糕和咖啡之间存在一定的关联性。当顾客购买蛋糕时，他们更有可能同时购买咖啡。这个关联关系可以为店铺提供一些有用的信息。例如，店铺可以通过将蛋糕和咖啡放在一起展示，或者提供套餐优惠来促进顾客同时购买蛋糕和咖啡，从而增加销售额。

置信度为0.526958意味着只有约52.7%的购买蛋糕的顾客也同时购买咖啡，因此这个关联关系并不是绝对的，可能存在其他因素影响顾客的购买决策。

2. {Coffee} => {Bread}

这条规则的支持度为0.090016，置信度为0.188163。支持度表示购买咖啡和面包的同时发生的频率，而置信度表示当顾客购买咖啡时，他们也购买面包的概率。置信度为0.188163意味着只有约18.8%的购买咖啡的顾客也同时购买面包，因此这个关联关系并不是非常强。可能存在其他因素或商品之间的竞争影响了顾客的购买决策。

关联规则的分析可以帮助我们理解不同商品之间的购买关系，发现潜在的交叉销售机会，优化产品陈列和促销策略，提高销售额和顾客满意度。但需要注意，关联规则只能提供统计上的相关性，无法确定因果关系，具体的解读和应用仍需要结合实际情况和专业知识进行综合考量。

总的来说，购买行为的关联规则分析可以帮助我们理解产品之间的关联关系，为营销和销售策略提供指导。这种分析可以帮助店铺设计更有效的商品陈列和促销策略，提高销售额和顾客满意度。

4. 实验优化

4.1 参数调优

在该实验中，可以通过参数调优来优化关联规则的挖掘结果。以下是一些可以尝试调整的参数和相关策略：

1. 支持度阈值（min_support）：支持度阈值控制着频繁项集的选择，即物品组合在数据集中出现的频率。较高的支持度阈值会得到更具共现性的频繁项集，而较低的支持度阈值可能导致更多的频繁项集但可能包含更多噪声。因此，可以尝试不同的支持度阈值，观察结果并选择合适的值。

2. 置信度阈值（min_threshold）：置信度阈值用于筛选关联规则的可靠性。较高的置信度阈值将导致选择更可靠的关联规则，但可能会减少规则的数量。较低的置信度阈值可能会生成更多的关联规则，但可能包含较多的噪声和不太可靠的规则。通过调整置信度阈值，可以根据具体需求选择合适的关联规则。

3. 其他度量标准（metric）：在代码中，使用了置信度作为评估关联规则的度量标准。但也可以尝试其他度量标准，如支持度、提升度（lift）、全置信度（leverage）等。不同的度量标准可以提供不同的规则评估指标，从而得到不同类型的规则。

4. 数据预处理：在进行关联规则挖掘之前，可以进行数据预处理操作，例如删除稀疏项、过滤掉出现频率较低的物品或交易、合并相似的物品等。这些预处理操作可以清理数据集，减少噪声和冗余信息，从而提高关联规则挖掘的效果。

通过对这些参数进行调优，可以获得更准确、有用和可解释的关联规则，提供更深入的购买行为分析和业务洞察。调优的过程需要不断尝试和评估不同的参数组合，并根据实际需求和目标选择最佳的参数设置。

4.2 模型评估

# 设置评估参数
min_support = 0.05
min_confidence = 0.5
min_lift = 1.0

# 评估关联规则挖掘结果
# 1. 计算规则的支持度、置信度和提升度
rules['support'] = rules['support'].round(4)
rules['confidence'] = rules['confidence'].round(4)
rules['lift'] = rules['lift'].round(4)

# 2. 根据指标筛选规则
filtered_rules = rules[(rules['support'] >= min_support) &
                       (rules['confidence'] >= min_confidence) &
                       (rules['lift'] >= min_lift)]

# 3. 根据指标排序规则
sorted_rules = filtered_rules.sort_values(by=['support', 'confidence', 'lift'], ascending=[False, False, False])

# 输出评估结果
print("评估结果:")
print(sorted_rules)

根据设置的最小支持度（min_support）、最小置信度（min_confidence）和最小提升度（min_lift），对挖掘得到的关联规则进行筛选和排序。可以根据实际需求调整这些阈值。筛选后的规则按照支持度、置信度和提升度进行排序，以便更好地理解和解释规则的重要性和关联程度。

通过运行上述代码，可以输出评估结果，包括关联规则的支持度、置信度和提升度等指标。根据这些指标，可以对关联规则进行评估，判断其质量、重要性和可信度。根据具体的业务需求，可以选择合适的规则进行进一步分析和应用。

评估结果:
  antecedents consequents  antecedent support  consequent support  support  \
0      (Cake)    (Coffee)            0.103856            0.478394   0.0547   

   confidence    lift  leverage  conviction  zhangs_metric  
0       0.527  1.1015  0.005044    1.102664        0.10284

4.3 结果可视化

import matplotlib.pyplot as plt

# 绘制散点图
plt.scatter(rules['support'], rules['confidence'], c=rules['lift'], cmap='viridis')
plt.colorbar(label='Lift')
plt.xlabel('Support')
plt.ylabel('Confidence')
plt.title('Association Rules - Support vs Confidence')
plt.show()

# 绘制热力图
pivot_table = rules.pivot(index='antecedents', columns='consequents', values='lift')
plt.imshow(pivot_table, cmap='hot', interpolation='nearest')
plt.colorbar(label='Lift')
plt.xticks(range(len(pivot_table.columns)), pivot_table.columns, rotation=90)
plt.yticks(range(len(pivot_table.index)), pivot_table.index)
plt.title('Association Rules - Lift Heatmap')
plt.show()

散点图展示了关联规则的支持度和置信度之间的关系，同时使用颜色编码来表示提升度：

1. 支持度与置信度之间的关系：支持度和置信度呈现一定的正相关关系。通常情况下，支持度较高的规则往往具有较高的置信度，说明这些规则在数据集中的出现频率较高且相对可靠。

2. 提升度的影响：颜色编码表示了关联规则的提升度。较高的提升度意味着规则中的物品组合更有可能同时出现，而较低的提升度则意味着规则中的物品组合出现的概率相对较低。通过颜色的变化，我们可以观察到不同规则的提升度差异，并根据提升度选择感兴趣的规则。

热力图展示了关联规则的提升度，以矩阵的形式展示不同规则之间的关系：

1. 规则之间的相关性：热力图可以帮助我们识别关联规则之间的相关性。通过观察热力图中的亮度变化，我们可以找到具有较高提升度的规则组合。较亮的区域表示具有较高提升度的规则组合，而较暗的区域则表示提升度较低的规则组合。

2. 强关联规则的发现：热力图可以帮助我们发现一些强关联规则。在热力图中，我们可以观察到明显的亮斑，这表示存在一些物品组合之间的强关联性。这些亮斑指示了可能具有高提升度的规则，值得进一步挖掘和分析。

OpenCV 基础模块 Python 版 ice_junjun OpenCV opencv python 计算机视觉
OpenCV基础模块权威指南（Python版）一、模块全景图plaintextOpenCV架构(v4.x+)├─核心层│├─core：基础数据结构与操作（Mat/Scalar/Point）│└─imgproc：图像处理流水线（滤波→变换→检测）├─交互层│├─highgui：GUI与媒体I/O（显示/捕获/交互）│└─video：视频分析（运动检测/目标跟踪）├─3D视觉层│└─calib3d：相
Python入门(函数) 高育良00003 python 开发语言
一.基础认识一种映射关系1.1什么是函数呢？概念函数是可以重复执行的语句块，可以重复调用作用用于封装语句块，提高代码的重用性1.2函数的定义语法：deffunction():#def为关键字，function为函数名#语句想要执行的操作returnre#re为返回值二.函数的调用函数名后+小括号()表示函数的执行2.1基本用法语法：函数名(实际调用的参数)2.2调用传参2.2.1位置传参最为常见，
python本地连接minio 伶星37 python 网络服务器
在你浏览器能成功访问到你的minio网页，并且成功登录之后。接下来如果你想用python连接数据库，并且想用python连接minio，就可以用这个blog。连接代码client=Minio("localhost:9000",#9000是默认端口号access_key="admin",#你的账户secret_key="password",#你的密码secure=False,#这点我会详细说明)为什
头歌实践教学平台 Python程序设计实训答案（三）学习的锅头哥实践教学平台实训答案 python
第七阶段文件实验一文本文件的读取第1关：学习-Python文件之文本文件的读取任务描述本关任务：使用open函数以只写的方式打开文件，打印文件的打开方式。相关知识为了完成本关任务，你需要掌握：文本文件；open函数及其参数；文件打开模式；文件对象常用属性；关闭文件close函数。#请在下面的Begin-End之间按照注释中给出的提示编写正确的代码##########Begin###########
python基础之--面相对象--OOP基本特性暴龙胡乱写博客 python 开发语言人工智能
python基础之–面相对象–OOP基本特性文章目录python基础之--面相对象--OOP基本特性一，OOP基本特性1.1封装1.2继承/派生1.2.1基础概念1.2.3继承实现1.3多态1.4对象对成员的操作（补充）1.5私有属性1.6重写魔术方法二，super函数2.1基本使用2.2super().\__init__()一，OOP基本特性OOP的四大基本特性是封装、继承、多态和抽象。1.1封
Dify1.01版本vscode 本地环境搭建运行实践 hamish-wu vscode 编辑器 dify 大模型 python flask
dify是python编写的低代码AI开发平台，是常用的大模型开发平台。本文基于最新的1.0.1版本实践完成，有需要的可以私信交流。咨询免费，详细文档及视频需要一定成本，大概相当于节约的时间成本。搭建环境windows11开发工具vscode搭建步骤：1.Startthedocker-composestackwindow环境下运行docker命令，需要下载docker官网镜像，会遇到timeout
vscode python 入门教程(一) window 10 环境下安装pyenv hamish-wu Python python 开发语言 pyenv
python的环境配置方法很多，由于python有两个大版本，很多时候需要切换某个固定的版本才能运行三方包，所以推荐使用pyenv配置python环境变量pyenv的安装安装方法：Invoke-WebRequest-UseBasicParsing-Uri"https://raw.githubusercontent.com/pyenv-win/pyenv-win/master/pyenv-win/i
1-5 Python 入门之运算符的使用 Sa_sa_ki_Haise python
第1关：算术、比较、赋值运算符100任务要求参考答案评论201任务描述相关知识算术运算符比较(关系)运算符赋值运算符编程要求测试说明任务描述在编程时，我们常常需要对数值或对象进行算术、比较运算和赋值运算，以此来实现我们的功能需求。本关介绍Python中的一些基本运算符，并要求对给定的苹果和梨的数量进行算术运算、比较、赋值运算，然后输出相应的结果。相关知识要实现上述功能，需要用到Python中的各种
rabbitmq + minio +python 上传文件伶星37 rabbitmq python ruby
功能实现RabbitMq接收hello里面传来的消息根据消息在MobileFile里面新建文件新建文件上传到miniopython新建文件importospath='./MobileFile'file_path=os.path.join(path,"new_file.txt")withopen(file_path,"w")asfile:pass转换成函数格式importosdefcreatefil
vscode python 入门教程(二) vscode使用gti 管理代码 hamish-wu vscode ide 编辑器
vscode代码管理需要用管道git的命令，这点和idea的代码管理区别比较大。作为java开发需要自己熟悉适应一下。一、GitHub新建一个仓库过程略二、本地git项目初始化gitinitvscode中可以看到文件状态gitstatus使用gitremote命令吧本地git仓库和远程git仓库链接起来[email protected]提交代码gitcommit-m"评论
Python进阶之-加密库cryptography使用详解夏天Aileft Python python 网络加密
✨前言cryptography库是一个强大的Python加密库，提供了对加密算法和协议的高层和低层访问。它是用来实现数据加密、签名、密钥管理等功能的。以下是一些常见用法的详解，帮助你理解如何使用这个库。✨安装首先，你需要确保安装了cryptography库：pipinstallcryptography✨1.对称加密对称加密是指加密和解密使用相同的密钥。Fernet是cryptography库中提供
python列表添加元素的三种方法定义集合数据对象_python 学习第三天可迭代对象（列表，字典，元组和集合）... weixin_39852491
列表，字典，元组和集合列表list列表是由一系列特定元素组成的，元素和元素之间没有任何关联关系，但他们之间有先后顺序关系列表是一种容器列表是序列的一种列表是可以被改变的序列Python中的序列类型简介（sequence）字符串（str）列表（list）元组（tuple）字节串（bytes）字节数组（bytearray）创建空列表的字面值L=[]#L绑定空列表创建非空列表：L=[1,’two’,3,
python~集合详解鱼跃龙 python python集合详解 set集合
集合的基本操作首先需要明确的是：集合(set)是一个无序的不重复元素序列，多用来进行排重；不支持切片和索引取值！1.创建集合>>>a={1,2,4,4}>>>a{1,2,4}>>>type(a)**创建空集合时需要注意：不能直接用大括号，只能用set()；否则创建的是一个字典>>>b=set()>>>type(b)>>>c={}>>>type(c)2.添加元素add()方法是将要添加的元素作为一个
Python密码学：cryptography库零度° python python 密码学
在数字时代，确保数据的安全性和隐私至关重要。Python中的cryptography库是一个全面的包，为Python开发者提供了密码学原语和配方。它支持高级配方和常见密码学算法的低级接口。cryptography库概述cryptography库旨在易于使用且默认安全。它包括各种密码学操作的高级和低级API，如：对称加密非对称加密哈希函数消息认证码（MAC）数字签名密钥管理cryptography库
Python---frozenset集合爱听雨声的北方汉快快乐乐学Python Python
frozenset是set的不可变版本，因此set集合中所有能改变集合本身的方法（如add、remove、discard、xxx_update等），frozenset都不支持；set集合中不改变集合本身的方法，fronzenset都支持。frozenset的作用主要有以下两点：1、当集合元素不需要改变时，使用frozenset代替set更安全。2、当某些API需要不可变对象时，必须用frozens
(python)保障信息安全的加密库-cryptography Marst·Zhang 基础知识实用工具 python
前言cryptography是一个广泛使用的Python加密库，提供了各种加密、哈希和签名算法的实现。它支持多种加密算法，如AES、RSA、ECC等，以及哈希函数（如SHA-256、SHA-384等）和数字签名算法(如DSA、ECDSA等).目录常见用途密码学函数主要功能优点缺点总结常见用途数据加密使用对称加密算法（如AES）对数据进行加密，确保数据在传输或存储过程中的机密性。数字签名生成和验证数
Python if-else对缩进的要求宇寒风暖 python编程 python 开发语言学习笔记
在Python中，缩进是语法的一部分，用于表示代码块的层次结构。if-else语句的代码块必须通过缩进来定义，缩进不正确会导致语法错误或逻辑错误。1.缩进的基本规则1.1缩进的作用缩进用于表示代码块的层次结构。同一代码块中的语句必须具有相同的缩进级别。缩进通常使用4个空格，这是Python官方推荐的风格。1.2示例x=10ifx>5:print("x大于5")#缩进4个空格print("这是if代
一文弄懂 Python assert 断言宇寒风暖 python编程 python 开发语言学习笔记
在Python中，assert是一种用于调试的语句，用于检查某个条件是否为True。如果条件为False，assert会抛出AssertionError异常，并可选地输出错误信息。assert通常用于在开发阶段验证程序的假设条件，确保代码的正确性。1.assert的基本语法1.1语法assertcondition,messagecondition：需要检查的条件表达式。message：可选参数，当
开源项目常见问题解决方案——cryptography 周屹隽
开源项目常见问题解决方案——cryptographycryptographycryptographyisapackagedesignedtoexposecryptographicprimitivesandrecipestoPythondevelopers.项目地址:https://gitcode.com/gh_mirrors/cr/cryptography项目基础介绍cryptography是一个
python 利用pandas实现从CSV导出并格式化后写入.jsonl文件风_流沙 python工具备忘录 python pandas 开发语言
你可以使用pandas库来读取CSV文件，然后通过一些格式化操作将数据转换为JSONL格式并写入文件。JSONL（JSONLines）格式是一种每行一个JSON对象的文件格式。下面是一个示例，演示了如何使用pandas读取CSV文件，处理数据并将其导出到JSONL文件中：示例代码：importpandasaspdimportjson#读取CSV文件df=pd.read_csv('data.csv'
Python文件加密库之cryptography使用详解 Rocky006 python 开发语言
概要在现代信息社会中，数据的安全性变得越来越重要。为了保护敏感信息，文件加密技术被广泛应用。Python的cryptography库提供了强大的加密功能，可以轻松实现文件加密和解密。本文将详细介绍如何使用cryptography库进行文件加密，包含具体的示例代码。cryptography库简介cryptography是Python中一个功能强大且易用的加密库，提供了对称加密、非对称加密、哈希算法、
【Python系列】高效Parquet数据处理策略：合并与分析实践小团团0 python 开发语言
在大数据时代，数据的存储、处理和分析变得尤为重要。Parquet作为一种高效的列存储格式，被广泛应用于大数据处理框架中，如ApacheSpark、ApacheHive等。Parquet是一个开源的列存储格式，它被设计用于支持复杂的嵌套数据结构，同时提供高效的压缩和编码方案，以优化存储空间和查询性能。以下将详细介绍如何使用Python对Parquet文件进行数据处理与合并，并提供相应的源码示例。一、
cryptography，一个神奇的 Python 库！ Sitin涛哥 Python python 开发语言
更多资料获取个人网站：ipengtao.com大家好，今天为大家分享一个神奇的Python库-cryptography。Github地址：https://github.com/pyca/cryptography在当今数字化时代，信息安全越来越受到重视。数据加密是保护数据安全的重要手段之一，而Python的cryptography库提供了丰富的功能来支持各种加密算法和协议。本文将深入探讨crypto
深度讨论Python for循环观智能 python 开发语言
作者的其他文章推荐：强化学习再受关注！for循环使用于遍历可迭代对象的Python语句，工作原理如下：#for循环foriteminiterable:print(item)#等价于iterator=iter(iterable)#获取迭代器whileTrue:try:item=next(iterator)#获取下一个元素print(item)exceptStopIteration:break#迭代结
Python第六章08：元组操作练习题苹果.Python.八宝粥 python 开发语言
#元组定义操作练习题"""定义一个元组，内容是：('周杰伦',11,['football','music'])，记录一个学生的信息（姓名、年龄、爱好）请通元组（tuple）的功能，对其进行如下操作：1.查询其年龄所在的下标位置2.查询学生的姓名3.删除学生爱好中的football4.增加爱好：coding"""my_tuple=('周杰伦',11,['football','music'])#1.查
Python第六章07：元组的定义和操作苹果.Python.八宝粥 python 前端开发语言
#tuple元组的定义和操作#tuple元组定义用小括号：(1,2,3,4,5),可以是不同类型元素#给变量定义元组时，写括号不写tuple：a=(1,2,3,4,5)#变量=（）变量=tuple（）空元组变量#tuple元组定义完成后，不可以修改，但是，如果元组中嵌套了一个列表时，元组中列表的内容可以修改#封装数据后，不希望被篡改数据，就使用元组tuple#1.定义一个元组t1=("halibo
利用Python爬虫获取Shopee（虾皮）商品详情：实战指南小爬虫程序猿 python 爬虫开发语言
在跨境电商领域，Shopee（虾皮）作为东南亚及台湾地区领先的电商平台，拥有海量的商品信息。无论是进行市场调研、数据分析，还是寻找热门商品，获取Shopee商品详情都是一项极具价值的任务。然而，手动浏览和整理这些信息显然是低效且容易出错的。幸运的是，通过编写Python爬虫程序，我们可以高效地完成这一任务。本文将详细介绍如何利用Python爬虫获取Shopee商品详情，并提供完整的代码示例。一、为
业务7——数据埋点嚯嚯嚯嚯什么都不会业务数据分析
文章目录一、数据生命周期：二、埋点是什么？1、含义2、方式三、埋点流程1、埋点生命周期2、业务需求分析3、埋点文档设计一、数据生命周期：还能从数据角度来看，数据在工作中的参与环节，帮助理清数据分析流程和思路。二、埋点是什么？1、含义数据埋点是数据采集的一种重要方式，是在有需要的位置采集相应的信息，主要是终端用户的操作行为，后续用于解决业务方提出的业务需求。2、方式全埋点代码埋点（百度统计、友盟、T
在Mac M1/M2芯片上完美安装DeepCTR库：避坑指南与实战验证 ku_code_ku 机器学习 macos 推荐算法推荐系统
让推荐算法在AppleSilicon上全速运行概述作为推荐系统领域的最经常用的明星库，DeepCTR集成了CTR预估、多任务学习等前沿模型实现。但在AppleSilicon架构的Mac设备上，安装过程常因ARM架构适配、依赖库版本冲突等问题受阻。本文通过20+次环境搭建实测，总结出最稳定的安装方案。关键版本说明（2024年验证）组件推荐版本注意事项Python3.10.x向下兼容至3.7，但3.1
前端实现埋点&监控 Cipher_Y 前端
前端实现埋点&监控实现埋点功能的意义主要体现在以下几个方面：数据采集：埋点是数据采集领域（尤其是用户行为数据采集领域）的术语，它针对特定用户行为或事件进行捕获、处理和发送的相关技术及其实施过程。通过埋点，可以收集到用户在应用中的所有行为数据，例如页面浏览、按钮点击、表单提交等。数据分析：采集的数据可以帮助业务人员分析网站或者App的使用情况、用户行为习惯等，是后续建立用户画像、用户行为路径等数据产
java解析APK 3213213333332132 java apk linux 解析APK
解析apk有两种方法 1、结合安卓提供apktool工具，用java执行cmd解析命令获取apk信息 2、利用相关jar包里的集成方法解析apk 这里只给出第二种方法，因为第一种方法在linux服务器下会出现不在控制范围之内的结果。 public class ApkUtil { /** * 日志对象 */ private static Logger
nginx自定义ip访问N种方法 ronin47 nginx 禁止ip访问
　　　因业务需要，禁止一部分内网访问接口，　由于前端架了F5，直接用deny或allow是不行的，这是因为直接获取的前端Ｆ５的地址。　　　所以开始思考有哪些主案可以实现这样的需求，目前可实施的是三种：　　　一：把ip段放在redis里，写一段lua 二：利用geo传递变量，写一段
mysql timestamp类型字段的CURRENT_TIMESTAMP与ON UPDATE CURRENT_TIMESTAMP属性 dcj3sjt126com mysql
timestamp有两个属性，分别是CURRENT_TIMESTAMP 和ON UPDATE CURRENT_TIMESTAMP两种，使用情况分别如下： 1. CURRENT_TIMESTAMP 当要向数据库执行insert操作时，如果有个timestamp字段属性设为 CURRENT_TIMESTAMP，则无论这
struts2+spring+hibernate分页显示 171815164 Hibernate
分页显示一直是web开发中一大烦琐的难题，传统的网页设计只在一个JSP或者ASP页面中书写所有关于数据库操作的代码，那样做分页可能简单一点，但当把网站分层开发后，分页就比较困难了，下面是我做Spring+Hibernate+Struts2项目时设计的分页代码，与大家分享交流。　　1、DAO层接口的设计，在MemberDao接口中定义了如下两个方法： public in
构建自己的Wrapper应用 g21121 rap
我们已经了解Wrapper的目录结构，下面可是正式利用Wrapper来包装我们自己的应用，这里假设Wrapper的安装目录为:/usr/local/wrapper。首先，创建项目应用 &nb
[简单]工作记录_多线程相关 53873039oycg 多线程
最近遇到多线程的问题,原来使用异步请求多个接口(n*3次请求) 方案一使用多线程一次返回数据,最开始是使用5个线程,一个线程顺序请求3个接口,超时终止返回缺点测试发现必须3个接
调试jdk中的源码，查看jdk局部变量程序员是怎么炼成的 jdk 源码
转自：http://www.douban.com/note/211369821/ 学习jdk源码时使用-- 学习java最好的办法就是看jdk源代码，面对浩瀚的jdk（光源码就有40M多，比一个大型网站的源码都多）从何入手呢，要是能单步调试跟进到jdk源码里并且能查看其中的局部变量最好了。可惜的是sun提供的jdk并不能查看运行中的局部变量
Oracle RAC Failover 详解 aijuans oracle
Oracle RAC 同时具备HA(High Availiablity) 和LB(LoadBalance). 而其高可用性的基础就是Failover(故障转移). 它指集群中任何一个节点的故障都不会影响用户的使用，连接到故障节点的用户会被自动转移到健康节点，从用户感受而言，是感觉不到这种切换。 Oracle 10g RAC 的Failover 可以分为3种： 1. Client-Si
form表单提交数据编码方式及tomcat的接受编码方式 antonyup_2006 JavaScript tomcat 浏览器互联网 servlet
原帖地址：http://www.iteye.com/topic/266705 form有2中方法把数据提交给服务器，get和post,分别说下吧。（一）get提交 1.首先说下客户端（浏览器）的form表单用get方法是如何将数据编码后提交给服务器端的吧。对于get方法来说，都是把数据串联在请求的url后面作为参数，如：http://localhost:
JS初学者必知的基础百合不是茶 js函数 js入门基础
JavaScript是网页的交互语言,实现网页的各种效果, JavaScript 是世界上最流行的脚本语言。 JavaScript 是属于 web 的语言，它适用于 PC、笔记本电脑、平板电脑和移动电话。 JavaScript 被设计为向 HTML 页面增加交互性。许多 HTML 开发者都不是程序员，但是 JavaScript 却拥有非常简单的语法。几乎每个人都有能力将小的
iBatis的分页分析与详解 bijian1013 java ibatis
分页是操作数据库型系统常遇到的问题。分页实现方法很多，但效率的差异就很大了。iBatis是通过什么方式来实现这个分页的了。查看它的实现部分，发现返回的PaginatedList实际上是个接口，实现这个接口的是PaginatedDataList类的对象，查看PaginatedDataList类发现，每次翻页的时候最
精通Oracle10编程SQL(15)使用对象类型 bijian1013 oracle 数据库 plsql
/* *使用对象类型 */ --建立和使用简单对象类型 --对象类型包括对象类型规范和对象类型体两部分。 --建立和使用不包含任何方法的对象类型 CREATE OR REPLACE TYPE person_typ1 as OBJECT( name varchar2(10),gender varchar2(4),birthdate date ); drop type p
【Linux命令二】文本处理命令awk bit1129 linux命令
awk是Linux用来进行文本处理的命令，在日常工作中，广泛应用于日志分析。awk是一门解释型编程语言，包含变量，数组，循环控制结构，条件控制结构等。它的语法采用类C语言的语法。 awk命令用来做什么？ 1.awk适用于具有一定结构的文本行，对其中的列进行提取信息 2.awk可以把当前正在处理的文本行提交给Linux的其它命令处理，然后把直接结构返回给awk 3.awk实际工
JAVA(ssh2框架)+Flex实现权限控制方案分析白糖_ java
目前项目使用的是Struts2+Hibernate+Spring的架构模式，目前已经有一套针对SSH2的权限系统，运行良好。但是项目有了新需求：在目前系统的基础上使用Flex逐步取代JSP，在取代JSP过程中可能存在Flex与JSP并存的情况，所以权限系统需要进行修改。【SSH2权限系统的实现机制】权限控制分为页面和后台两块：不同类型用户的帐号分配的访问权限是不同的，用户使
angular.forEach boyitech AngularJS AngularJS API angular.forEach
angular.forEach 描述: 循环对obj对象的每个元素调用iterator, obj对象可以是一个Object或一个Array. Iterator函数调用方法: iterator(value, key, obj), 其中obj是被迭代对象，key是obj的property key或者是数组的index，value就是相应的值啦. (此函数不能够迭代继承的属性.)
java-谷歌面试题-给定一个排序数组，如何构造一个二叉排序树 bylijinnan 二叉排序树
import java.util.LinkedList; public class CreateBSTfromSortedArray { /** * 题目:给定一个排序数组，如何构造一个二叉排序树 * 递归 */ public static void main(String[] args) { int[] data = { 1, 2, 3, 4,
action执行2次 Chen.H JavaScript jsp XHTML css Webwork
xwork 写道 <action name="userTypeAction" class="com.ekangcount.website.system.view.action.UserTypeAction"> <result name="ssss" type="dispatcher">
[时空与能量]逆转时空需要消耗大量能源 comsci 能源
无论如何,人类始终都想摆脱时间和空间的限制....但是受到质量与能量关系的限制,我们人类在目前和今后很长一段时间内,都无法获得大量廉价的能源来进行时空跨越..... 在进行时空穿梭的实验中,消耗超大规模的能源是必然
oracle的正则表达式(regular expression)详细介绍 daizj oracle 正则表达式
正则表达式是很多编程语言中都有的。可惜oracle8i、oracle9i中一直迟迟不肯加入，好在oracle10g中终于增加了期盼已久的正则表达式功能。你可以在oracle10g中使用正则表达式肆意地匹配你想匹配的任何字符串了。正则表达式中常用到的元数据(metacharacter)如下： ^ 匹配字符串的开头位置。 $ 匹配支付传的结尾位置。 *
报表工具与报表性能的关系 datamachine 报表工具 birt 报表性能润乾报表
在选择报表工具时，性能一直是用户关心的指标，但是，报表工具的性能和整个报表系统的性能有多大关系呢？要回答这个问题，首先要分析一下报表的处理过程包含哪些环节，哪些环节容易出现性能瓶颈，如何优化这些环节。一、报表处理的一般过程分析 1、用户选择报表输入参数后，报表引擎会根据报表模板和输入参数来解析报表，并将数据计算和读取请求以SQL的方式发送给数据库。 2、
初一上学期难记忆单词背诵第一课 dcj3sjt126com word english
what 什么 your 你 name 名字 my 我的 am 是 one 一 two 二 three 三 four 四 five 五 class 班级，课 six 六 seven 七 eight 八 nince 九 ten 十 zero 零 how 怎样 old 老的 eleven 十一 twelve 十二 thirteen
我学过和准备学的各种技术 dcj3sjt126com 技术
语言VB https://msdn.microsoft.com/zh-cn/library/2x7h1hfk.aspxJava http://docs.oracle.com/javase/8/C# https://msdn.microsoft.com/library/vstudioPHP http://php.net/manual/en/Html
struts2中token防止重复提交表单蕃薯耀重复提交表单 struts2中token
struts2中token防止重复提交表单 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月12日 11:52:32 星期日 ht
线性查找二维数组 hao3100590 二维数组
1.算法描述有序（行有序，列有序，且每行从左至右递增，列从上至下递增）二维数组查找，要求复杂度O(n) 2.使用到的相关知识：结构体定义和使用，二维数组传递（http://blog.csdn.net/yzhhmhm/article/details/2045816） 3.使用数组名传递这个的不便之处很明显，一旦确定就是不能设置列值 //使
spring security 3中推荐使用BCrypt算法加密密码 jackyrong Spring Security
spring security 3中推荐使用BCrypt算法加密密码了，以前使用的是md5， Md5PasswordEncoder 和 ShaPasswordEncoder，现在不推荐了，推荐用bcrpt Bcrpt中的salt可以是随机的，比如： int i = 0; while (i < 10) { String password = "1234
学习编程并不难,做到以下几点即可! lampcy java html 编程语言
不论你是想自己设计游戏，还是开发iPhone或安卓手机上的应用，还是仅仅为了娱乐，学习编程语言都是一条必经之路。编程语言种类繁多，用途各异，然而一旦掌握其中之一，其他的也就迎刃而解。作为初学者，你可能要先从Java或HTML开始学，一旦掌握了一门编程语言，你就发挥无穷的想象，开发各种神奇的软件啦。 1、确定目标学习编程语言既充满乐趣，又充满挑战。有些花费多年时间学习一门编程语言的大学生到
架构师之mysql----------------用group+inner join,left join ,right join 查重复数据（替代in) nannan408 right join
1.前言。如题。 2.代码 (1)单表查重复数据,根据a分组 SELECT m.a,m.b, INNER JOIN （select a,b,COUNT(*) AS rank FROM test.`A` A GROUP BY a HAVING rank>1 )k ON m.a=k.a （2）多表查询，使用改为le
jQuery选择器小结 VS 节点查找（附css的一些东西） Everyday都不同 jquery css name选择器追加元素查找节点
最近做前端页面，频繁用到一些jQuery的选择器，所以特意来总结一下：测试页面： <html> <head> <script src="jquery-1.7.2.min.js"></script> <script> /*$(function() { $(documen
关于EXT tntxia ext
ExtJS是一个很不错的Ajax框架，可以用来开发带有华丽外观的富客户端应用，使得我们的b/s应用更加具有活力及生命力。ExtJS是一个用 javascript编写，与后台技术无关的前端ajax框架。因此，可以把ExtJS用在.Net、Java、Php等各种开发语言开发的应用中。 ExtJs最开始基于YUI技术，由开发人员Jack
一个MIT计算机博士对数学的思考 xjnine Math
在过去的一年中，我一直在数学的海洋中游荡，research进展不多，对于数学世界的阅历算是有了一些长进。为什么要深入数学的世界？作为计算机的学生，我没有任何企图要成为一个数学家。我学习数学的目的，是要想爬上巨人的肩膀，希望站在更高的高度，能把我自己研究的东西看得更深广一些。说起来，我在刚来这个学校的时候，并没有预料到我将会有一个深入数学的旅程。我的导师最初希望我去做的题目，是对appe