爱编程的喵喵

Python深度数据挖掘之电力系统负荷预测

文章目录

前言
1. 案例背景
2. 分析目标
3. 分析过程
4. 数据准备
- 4.1 数据探索
- 4.2 缺失值处理
5. 属性构造
- 5.1 设备数据
- 5.2 周波数据
6. 模型训练
7. 性能度量
8. 推荐阅读与粉丝福利

前言

本案例将根据已收集到的电力数据，深度挖掘各电力设备的电流、电压和功率等情况，分析各电力设备的实际用电量，进而为电力公司制定电能能源策略提供一定的参考依据。更多详细内容请参考《Python数据挖掘：入门进阶与实用案例分析》一书。

1. 案例背景

为了更好地监测用电设备的能耗情况，电力分项计量技术随之诞生。电力分项计量对于电力公司准确预测电力负荷、科学制定电网调度方案、提高电力系统稳定性和可靠性有着重要意义。对用户而言，电力分项计量可以帮助用户了解用电设备的使用情况，提高用户的节能意识，促进科学合理用电。

2. 分析目标

本案例根据非侵入式负荷检测与分解的电力数据挖掘的背景和业务需求，需要实现的目标如下。

分析每个用电设备的运行属性。
构建设备判别属性库。
利用K最近邻模型，实现从整条线路中“分解”出每个用电设备的独立用电数据。

3. 分析过程

详细的分析过程可以看下图所示，从数据来源到数据最后准备，最后到性能度量所有的过程。

4. 数据准备

4.1 数据探索

在本案例的电力数据挖掘分析中，不会涉及操作记录数据。因此，此处主要获取设备数据、周波数据和谐波数据。在获取数据后，由于数据表较多，每个表的属性也较多，所以需要对数据进行数据探索分析。在数据探索过程中主要根据原始数据特点，对每个设备的不同属性对应的数据进行可视化，得到的部分结果如下图1~图3所示。

（图1 无功功率和总无功功率）

（图2 电流轨迹）

（图3 电压轨迹）

根据可视化结果可以看出，不同设备之间的电流、电压和功率属性各不相同。

对数据属性进行可视化如代码清单1所示。

import pandas as pd
import matplotlib.pyplot as plt
import os

 

filename = os.listdir('../data/附件1')  
n_filename = len(filename)  

def fun(a):
    save_name = ['YD1', 'YD10', 'YD11', 'YD2', 'YD3', 'YD4',
           'YD5', 'YD6', 'YD7', 'YD8', 'YD9']

    plt.rcParams['font.sans-serif'] = ['SimHei']  
    plt.rcParams['axes.unicode_minus'] = False  

    for i in range(a):
        Sb = pd.read_excel('../data/附件1/' + filename[i], '设备数据', index_col = None)
        Xb = pd.read_excel('../data/附件1/' + filename[i], '谐波数据', index_col = None)
        Zb = pd.read_excel('../data/附件1/' + filename[i], '周波数据', index_col = None)

        plt.plot(Sb['IC'])
        plt.title(save_name[i] + '-IC')
        plt.ylabel('电流（0.001A）')
        plt.show()
        
        lt.plot(Sb['UC'])
        plt.title(save_name[i] + '-UC')
        plt.ylabel('电压（0.1V）')
        plt.show()
        
        plt.plot(Sb[['PC', 'P']])
        plt.title(save_name[i] + '-P')
        plt.ylabel('有功功率（0.0001kW）')
        plt.show()
        
        plt.plot(Sb[['QC', 'Q']])
        plt.title(save_name[i] + '-Q')
        plt.ylabel('无功功率（0.0001kVar）')
        plt.show()

       
        plt.plot(Sb[['PFC', 'PF']])
        plt.title(save_name[i] + '-PF')
        plt.ylabel('功率因数（%）')
        plt.show()
        
        plt.plot(Xb.loc[:, 'UC02':].T)
        plt.title(save_name[i] + '-谐波电压')
        plt.show()

        plt.plot(Zb.loc[:, 'IC001':].T)
        plt.title(save_name[i] + '-周波数据')
        plt.show()

fun(n_filename)`

4.2 缺失值处理

通过数据探索，发现数据中部分time属性存在缺失值，需要对这部分缺失值进行处理。由于每份数据中time属性的缺失时间段长不同，所以需要进行不同的处理。对于每个设备数据中具有较大缺失时间段的数据进行删除处理，对于具有较小缺失时间段的数据使用前一个值进行插补。

在进行缺失值处理之前，需要将训练数据中所有设备数据中的设备数据表、周波数据表、谐波数据表和操作记录表，以及测试数据中所有设备数据中的设备数据表、周波数据表和谐波数据表都提取出来，作为独立的数据文件，生成的部分文件如图 4 所示。

（图4 提取数据文件部分结果）

提取数据文件如代码清单 2 所示。

import glob
import pandas as pd
import math

 

def file_transform(xls):
    print('共发现%s个xlsx文件' % len(glob.glob(xls)))
    print('正在处理............')

    for file in glob.glob(xls):  
        combine1 = pd.read_excel(file, index_col=0, sheet_name=None)
        for key in combine1:
            combine1[key].to_csv('../tmp/' + file[8: -5] + key + '.csv', encoding='utf-8')
    print('处理完成')

 

xls_list = ['../data/附件1/*.xlsx', '../data/附件2/*.xlsx']
file_transform(xls_list[0])  
file_transform(xls_list[1])`

提取数据文件完成后，对提取的数据文件进行缺失值处理，处理后生成的部分文件如图 5 所示。

（图5 缺失值处理后的部分结果）

 def missing_data(evi):
    print('共发现%s个CSV文件' % len(glob.glob(evi)))
    
    for j in glob.glob(evi):
        fr = pd.read_csv(j, header=0, encoding='gbk')
        fr['time'] = pd.to_datetime(fr['time'])
        helper = pd.DataFrame({'time': pd.date_range(fr['time'].min(), fr['time'].max(), freq='S')})

        fr = pd.merge(fr, helper, on='time', how='outer').sort_values('time')
        fr = fr.reset_index(drop=True)
        frame = pd.DataFrame()

        for g in range(0, len(list(fr['time'])) - 1):
            if math.isnan(fr.iloc[:, 1][g + 1]) and math.isnan(fr.iloc[:, 1][g]):
                continue

            else:
                scop = pd.Series(fr.loc[g])
                frame = pd.concat([frame, scop], axis=1)

        frame = pd.DataFrame(frame.values.T, index=frame.columns, columns=frame.index)
        frames = frame.fillna(method='ffill')
        frames.to_csv(j[:-4] + '1.csv', index=False, encoding='utf-8')

    print('处理完成')

 

evi_list = ['../tmp/附件1/*数据.csv', '../tmp/附件2/*数据.csv']
missing_data(evi_list[0])  
missing_data(evi_list[1])`

5. 属性构造

虽然在数据准备过程中对属性进行了初步处理，但是引入的属性太多，而且这些属性之间存在重复的信息。为了保留重要的属性，建立精确、简单的模型，需要对原始属性进一步筛选与构造。

5.1 设备数据

在数据探索过程中发现，不同设备的无功功率、总无功功率、有功功率、总有功功率、功率因数和总功率因数差别很大，具有较高的区分度，故本案例选择无功功率、总无功功率、有功功率、总有功功率、功率因数和总功率因数作为设备数据的属性构建判别属性库。

处理好缺失值后，每个设备的数据都由一张表变为了多张表，所以需要将相同类型的数据表合并到一张表中，如将所有设备的设备数据表合并到一张表当中。同时，因为缺失值处理的其中一种方式是使用前一个值进行插补，所以产生了相同的记录，需要对重复出现的记录进行处理，处理后生成的数据表如表1所示。

合并且去重设备数据如代码清单4所示：

import glob
import pandas as pd
import os

def combined_equipment(csv_name):
    print('共发现%s个CSV文件' % len(glob.glob(csv_name)))
    print('正在处理............')

    for i in glob.glob(csv_name):  

        fr = open(i, 'rb').read()
        file_path = os.path.split(i)
        with open(file_path[0] + '/device_combine.csv', 'ab') as f:
            f.write(fr)

    print('合并完毕！')

    

    df = pd.read_csv(file_path[0] + '/device_combine.csv', header=None, encoding='utf-8')
    datalist = df.drop_duplicates()
    datalist.to_csv(file_path[0] + '/device_combine.csv', index=False, header=0)

    print('去重完成')

csv_list = ['../tmp/附件1/*设备数据1.csv', '../tmp/附件2/*设备数据1.csv']

combined_equipment(csv_list[0])  
combined_equipment(csv_list[1])

5.2 周波数据

在数据探索过程中发现，周波数据中的电流随着时间的变化有较大的起伏，不同设备的周波数据中的电流绘制出来的折线图的起伏不尽相同，具有明显的差异，故本案例选择波峰和波谷作为周波数据的属性构建判别属性库。

由于原始的周波数据中并未存在电流的波峰和波谷两个属性，所以需要进行属性构建，构建生成的数据表如表2所示。

构建周波数据中的属性代码如代码清单 5 所示:

import glob
import pandas as pd
from sklearn.cluster import KMeans
import os

 

def cycle(cycle_file):
    for file in glob.glob(cycle_file):

        cycle_YD = pd.read_csv(file, header=0, encoding='utf-8')
        cycle_YD1 = cycle_YD.iloc[:, 0:128]
        models = []

        for types in range(0, len(cycle_YD1)):

            model = KMeans(n_clusters=2, random_state=10)
            model.fit(pd.DataFrame(cycle_YD1.iloc[types, 1:]))  
            models.append(model)

        mean = pd.DataFrame()
        for model in models:
            r = pd.DataFrame(model.cluster_centers_, )  
            r = r.sort_values(axis=0, ascending=True, by=[0])
            mean = pd.concat([mean, r.reset_index(drop=True)], axis=1)

        mean = pd.DataFrame(mean.values.T, index=mean.columns, columns=mean.index)
        mean.columns = ['波谷', '波峰']
        mean.index = list(cycle_YD['time'])
        mean.to_csv(file[:-9] + '波谷波峰.csv', index=False, encoding='gbk ')

cycle_file = ['../tmp/附件1/*周波数据1.csv', '../tmp/附件2/*周波数据1.csv']
cycle(cycle_file[0])  
cycle(cycle_file[1])  

 

def merge_cycle(cycles_file):
    means = pd.DataFrame()

    for files in glob.glob(cycles_file):
        mean0 = pd.read_csv(files, header=0, encoding='gbk')
        means = pd.concat([means, mean0])

    file_path = os.path.split(glob.glob(cycles_file)[0])
    means.to_csv(file_path[0] + '/zuhe.csv', index=False, encoding='gbk')

    print('合并完成')

 
cycles_file = ['../tmp/附件1/*波谷波峰.csv', '../tmp/附件2/*波谷波峰.csv']

merge_cycle(cycles_file[0])  
merge_cycle(cycles_file[1])`

6. 模型训练

在判别设备种类时，选择K最近邻模型进行判别，利用属性构建而成的属性库训练模型，然后利用训练好的模型对设备1和设备2进行判别。构建判别模型并对设备种类进行判别，如代码清单 6 所示。

import glob
import pandas as pd
from sklearn import neighbors
import pickle
import os

def model(test_files, test_devices):
    zuhe = pd.read_csv('../tmp/附件1/zuhe.csv', header=0, encoding='gbk')

    device_combine = pd.read_csv('../tmp/附件1/device_combine.csv', header=0, encoding='gbk')
    train = pd.concat([zuhe, device_combine], axis=1)
    train.index = train['time'].tolist()  
    train = train.drop(['PC', 'QC', 'PFC', 'time'], axis=1)
    train.to_csv('../tmp/' + 'train.csv', index=False, encoding='gbk')

    for test_file, test_device in zip(test_files, test_devices):
        test_bofeng = pd.read_csv(test_file, header=0, encoding='gbk')
        test_devi = pd.read_csv(test_device, header=0, encoding='gbk')
        test = pd.concat([test_bofeng, test_devi], axis=1)
        test.index = test['time'].tolist()  
        test = test.drop(['PC', 'QC', 'PFC', 'time'], axis=1)

        clf = neighbors.KNeighborsClassifier(n_neighbors=6, algorithm='auto')
        clf.fit(train.drop(['label'], axis=1), train['label'])

        predicted = clf.predict(test.drop(['label'], axis=1))
        predicted = pd.DataFrame(predicted)
        file_path = os.path.split(test_file)[1]

        test.to_csv('../tmp/' + file_path[:3] + 'test.csv', encoding='gbk')
        predicted.to_csv('../tmp/' + file_path[:3] + 'predicted.csv', index=False, encoding='gbk')

        with open('../tmp/' + file_path[:3] + 'model.pkl', 'ab') as pickle_file:
            pickle.dump(clf, pickle_file)
        print(clf)


model(glob.glob('../tmp/附件2/*波谷波峰.csv'), glob.glob('../tmp/附件2/*设备数据1.csv'))

7. 性能度量

根据代码清单 6 的设备判别结果，对模型进行模型评估，得到的结果如下，混淆矩阵如图 7 所示，ROC曲线如图 8 所示。

模型分类准确度： 0.7951219512195122
模型评估报告：

               precision    recall  f1-score   support

         0.0       1.00      0.84      0.92        64

        21.0       0.00      0.00      0.00         0

        61.0       0.00      0.00      0.00         0

        91.0       0.78      0.84      0.81        77

        92.0       0.00      0.00      0.00         5

        93.0       0.76      0.75      0.75        59

       111.0       0.00      0.00      0.00         0

   accuracy                            0.80       205
   macro avg       0.36      0.35      0.35       205
weighted avg       0.82      0.80      0.81       205

计算auc：0.8682926829268293`

混淆矩阵如下图所示：

ROC曲线如下图：

模型评估如代码清单7所示：

import glob
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn import metrics
from sklearn.preprocessing import label_binarize
import os
import pickle

def model_evaluation(model_file, test_csv, predicted_csv):

    for clf, test, predicted in zip(model_file, test_csv, predicted_csv):
        with open(clf, 'rb') as pickle_file:
            clf = pickle.load(pickle_file)

        test = pd.read_csv(test, header=0, encoding='gbk')
        predicted = pd.read_csv(predicted, header=0, encoding='gbk')
        test.columns = ['time', '波谷', '波峰', 'IC', 'UC', 'P', 'Q', 'PF', 'label']
        print('模型分类准确度：', clf.score(test.drop(['label', 'time'], axis=1), test['label']))
        print('模型评估报告：\n', metrics.classification_report(test['label'], predicted))

        confusion_matrix0 = metrics.confusion_matrix(test['label'], predicted)
        confusion_matrix = pd.DataFrame(confusion_matrix0)
        class_names = list(set(test['label']))
 

        tick_marks = range(len(class_names))

        sns.heatmap(confusion_matrix, annot=True, cmap='YlGnBu', fmt='g')

        plt.xticks(tick_marks, class_names)
        plt.yticks(tick_marks, class_names)
        plt.tight_layout()

        plt.title('混淆矩阵')
        plt.ylabel('真实标签')
        plt.xlabel('预测标签')
        plt.show()

        y_binarize = label_binarize(test['label'], classes=class_names)
        predicted = label_binarize(predicted, classes=class_names)

        fpr, tpr, thresholds = metrics.roc_curve(y_binarize.ravel(), predicted.ravel())
        auc = metrics.auc(fpr, tpr)
        print('计算auc：', auc)  
        plt.figure(figsize=(8, 4))

        lw = 2

        plt.plot(fpr, tpr, label='area = %0.2f' % auc)
        plt.plot([0, 1], [0, 1], color='navy', lw=lw, linestyle='--')
        plt.fill_between(fpr, tpr, alpha=0.2, color='b')
        plt.xlim([0.0, 1.0])
        plt.ylim([0.0, 1.05])
        plt.xlabel('1-特异性')
        plt.ylabel('灵敏度')
        plt.title('ROC曲线')
        plt.legend(loc='lower right')
        plt.show()

model_evaluation(glob.glob('../tmp/*model.pkl'),
                 glob.glob('../tmp/*test.csv'),
                 glob.glob('../tmp/*predicted.csv'))

根据分析目标，需要计算实时用电量。实时用电量计算的是瞬时的用电器的电流、电压和时间的乘积，公式如下。

其中，为实时用电量，单位是0.001kWh。为功率，单位为W。

实时用电量计算，得到的实时用电量如表3所示。

计算实时用电量如代码清单8所示。

def cw(test_csv, predicted_csv, test_devices):

    for test, predicted, test_device in zip(test_csv, predicted_csv, test_devices):
        test = pd.read_csv(test, header=0, encoding='gbk')
        test.columns = ['time', '波谷', '波峰', 'IC', 'UC', 'P', 'Q', 'PF', 'label']
        test['time'] = pd.to_datetime(test['time'])
        test.index = test['time']

        predicteds = pd.read_csv(predicted, header=0, encoding='gbk')
        predicteds.columns = ['label']
        indexes = []

        class_names = list(set(test['label']))

        for j in class_names:
            index = list(predicteds.index[predicteds['label'] == j])
            indexes.append(index)

 
        from itertools import groupby  
        dif_indexs = []
        time_indexes = []
        info_lists = pd.DataFrame()

        for y, z in zip(indexes, class_names):
            dif_index = []
            fun = lambda x: x[1] - x[0]

            for k, g in groupby(enumerate(y), fun):
                dif_list = [j for i, j in g]  

                if len(dif_list) > 1:
                    scop = min(dif_list)  

                else:
                    scop = dif_list[0   ]

                dif_index.append(scop)

            time_index = list(test.iloc[dif_index, :].index)
            time_indexes.append(time_index)
            info_list = pd.DataFrame({'时间': time_index, 'model_设备状态': [z] * len(time_index)})

            dif_indexs.append(dif_index)
            info_lists = pd.concat([info_lists, info_list])

        test_devi = pd.read_csv(test_device, header=0, encoding='gbk')
        test_devi['time'] = pd.to_datetime(test_devi['time'])
        test_devi['实时用电量'] = test_devi['P'] * 100 / 3600
        info_lists = info_lists.merge(test_devi[['time', '实时用电量']],
                                      how='inner', left_on='时间', right_on='time')

        info_lists = info_lists.sort_values(by=['时间'], ascending=True)
        info_lists = info_lists.drop(['time'], axis=1)
        file_path = os.path.split(test_device)[1]
        info_lists.to_csv('../tmp/' + file_path[:3] + '状态表.csv', index=False, encoding='gbk')

        print(info_lists)
        
cw(glob.glob('../tmp/*test.csv'),
   glob.glob('../tmp/*predicted.csv'),
   glob.glob('../tmp/附件2/*设备数据1.csv'))

8. 推荐阅读与粉丝福利

今天给大家推荐的是：Python数据挖掘书籍：《Python数据挖掘：入门、进阶与实用案例分析》

京东官方购买链接：https://item.jd.com/13814157.html

《Python数据挖掘：入门、进阶与实用案例分析》是一本以项目实战案例为驱动的数据挖掘著作，它能帮助完全没有 Python 编程基础和数据挖掘基础的读者快速掌握 Python 数据挖掘的技术、流程与方法。在写作方式上，与传统的“理论与实践结合”的入门书不同，它以数据挖掘领域的知名赛事“泰迪杯”数据挖掘挑战赛（已举办10届）和“泰迪杯”数据分析技能赛（已举办5届）（累计1500余所高校的10余万师生参赛）为依托，精选了11个经典赛题，将Python编程知识、数据挖掘知识和行业知识三者融合，让读者在实践中快速掌握电商、教育、交通、传媒、电力、旅游、制造等7大行业的数据挖掘方法。

本书不仅适用于零基础的读者自学，还适用于教师教学，为了帮助读者更加高效地掌握本书的内容，本书提供了以下10项附加价值：

建模平台：提供一站式大数据挖掘建模平台，免配置，包含大量案例工程，边练边学，告别纸上谈兵
视频讲解：提供不少于600分钟Python编程和数据挖掘相关教学视频，边看边学，快速收获经验值
精选习题：精心挑选不少于60道数据挖掘练习题，并提供详细解答，边学边练，检查知识盲区
作者答疑：学习过程中有任何问题，通过“树洞”小程序，纸书拍照，一键发给作者，边问边学，事半功倍
数据文件：提供各个案例配套的数据文件，与工程实践结合，开箱即用，增强实操性
程序代码：提供书中代码的电子文件及相关工具的安装包，代码导入平台即可运行，学习效果立竿见影
教学课件：提供配套的PPT课件，使用本书作为教材的老师可以申请，节省备课时间
模型服务：提供不少于10个数据挖掘模型，模型提供完整的案例实现过程，助力提升数据挖掘实践能力
教学平台：泰迪科技为本书提供的附加资源提供一站式数据化教学平台，附有详细操作指南，边看边学边练，节省时间
就业推荐：提供大量就业推荐机会，与1500+企业合作，包含华为、京东、美的等知名企业

通过学习本书，读者可以理解数据挖掘的原理，迅速掌握大数据技术的相关操作，为后续数据分析、数据挖掘、深度学习的实践及竞赛打下良好的技术基础。

本次送书三本

活动时间：截止到2023-10-31

参与方式：关注博主、并在此文章下面点赞、收藏并任意评论。

两本送给所有粉丝抽奖，另外一本送给购买专栏的同学们，购买专栏的同学们可私信联系，先到先得，仅限一本

llama-cpp-python 项目常见问题解决方案蔡晶斯
llama-cpp-python项目常见问题解决方案llama-cpp-pythonPythonbindingsforllama.cpp项目地址:https://gitcode.com/gh_mirrors/ll/llama-cpp-python项目基础介绍llama-cpp-python是一个为llama.cpp库提供Python绑定的开源项目。该项目的主要目的是简化在Python环境中使用ll
「Python系列」Python uWSGI ·零落· Python入门到掌握 python 开发语言 uWSGI
文章目录一、PythonuWSGI简介二、PythonuWSGI安装配置三、PythonuWSGI应用案例前提条件步骤1：创建Django项目步骤2：配置Django项目步骤3：创建uWSGI配置文件步骤4：启动uWSGI步骤5：配置Web服务器四、PythonuWSGI常见问题常见问题1：uWSGI无法找到应用模块常见问题2：uWSGI和Nginx通信问题常见问题3：uWSGI进程管理常见问题4
Python系列（亲测有效）：uwsgi: command not found（python环境明明安装了）、uwsgi出现invalid request block size: 21573 (max 坦笑&&life #python python 网络开发语言
uwsgi:commandnotfound（python环境明明安装了）、uwsgi出现invalidrequestblocksize:21573(max一.uwsgi:commandnotfound问题描述：uwsgi:commandnotfound解决办法：找到uwsgi执行位置，建立软链接软连接做了，测试uwsgi是否正常运行创建test.py文件如下：运行方式运行方式一：运行方式二：访问均
基于opencv消除图片马赛克小苗爸爸 opencv 人工智能计算机视觉
以下是一个基于Python的图片马赛克消除函数实现，结合了图像处理和深度学习方法。由于马赛克消除涉及复杂的图像重建任务，建议根据实际需求选择合适的方法：importcv2importnumpyasnpfromPILimportImagedefremove_mosaic(image_path,output_path,method='traditional',block_size=10,scale_f
部署Django+nginx+uwsgi到ubuntu服务器 Mr番茄蛋问题解决 python Linux
前提：Django程序可以正常运行，注意服务器python版本和本地版本可能不一致，有可能不能正常运行Django程序。安装过程更新ubuntu的python比如更新到3.6，先拉取新的仓库，再更新安装sudoadd-apt-repositoryppa:jonathonf/python-3.6sudoaptupdatesudoaptinstallpython3.6创建虚拟环境安装虚拟环境命令sud
Python将json格式数据存储到Mysql数据库代码轨迹 Python python 数据库 json
Python操作Mysql数据库1.安装pipinstallmysql-connector-python2.数据库插入json格式数据importmysql.connectorimportjsonfromdatetimeimportdatetime#创建数据库连接db=mysql.connector.connect( host="localhost", #MySQL服务器地址 user="ro
【AI深度学习基础】Pandas完全指南入门篇：数据处理的瑞士军刀（含完整代码） arbboter 人工智能人工智能深度学习 pandas 数据处理数据分析数据清洗数据分析效率提升
Pandas系列文章导航入门篇进阶篇终极篇一、引言在大数据与AI驱动的时代，数据预处理和分析是深度学习与机器学习的基石。Pandas作为Python生态中最强大的数据处理库，以其灵活的数据结构（如DataFrame和Series）和丰富的功能（数据清洗、转换、聚合等），成为数据科学家和工程师的核心工具。Pandas以Series（一维标签数组）和DataFrame（二维表格）为核心数据结构，提供高
怎么做好备件管理？备件管理系统都包括哪些功能模块？沃丰科技低代码人工智能系统架构
数字化转型成为大趋势，在全球供应链面临挑战的背景下，备件仓储、备件管理的数字化升级对企业、对行业有着至关重要的意义。如何借助售后服务系统，加强整个备件管理链条清晰程度，沉淀管理数据，通过数据挖掘明确备件的损坏规律，对未来设备管理流程进行优化成为各大企业的关注点。进一步来说，备件是设备修理的主要物质基础，做好备件管理，及时供应备件，可以缩短修理时间、减少损失，供应质量优良的备件，可以保证修理质量和修
bash: uwsgi: 未找到命令大胖丫 bash 开发语言
针对你提出的“bash:uwsgi:commandnotfound”问题，以下是一些可能的解决方案，请按照步骤逐一排查：‌1、检查uwsgi命令是否正确‌：确保你输入的命令是uwsgi，而不是uWSGI或其他变体。‌2、确认uwsgi是否已安装‌：使用pipshowuwsgi命令来检查uwsgi是否已安装在你的Python环境中。如果未安装，可以使用pipinstalluwsgi或pip3inst
Github 2024-09-30 开源项目周报 Top15 老孙正经胡说 github 开源 Github趋势分析开源项目 Python Golang
根据GithubTrendings的统计，本周(2024-09-30统计)共有15个项目上榜。根据开发语言中项目的数量，汇总情况如下：开发语言项目数量Python项目7JupyterNotebook项目2Dart项目1Ruby项目1HTML项目1C#项目1TypeScript项目1Rust项目1非开发语言项目1AutoGPT:人工智能革命的先锋创建周期：486天开发语言：Python协议类型：MI
python json转化为字典_Python处理json字符串转化为字典 weixin_39636691 python json转化为字典
原博文2015-11-0923:02−有一个需求，需要用python把json字符串转化为字典inp_str="{'k1':123,'k2':'345',’k3’,’ares’}"importjsoninp_str="{'k1':123,'k2':'345',’k3’,...相关推荐2017-11-1711:57−在工作中遇到一个小问题，需要将一个python的字符串转为字典，比如字符串：user
python保存字典到xml文件_如何将Python字典序列化为XML？ weixin_39725193
使用dicttoxml包将Python字典转换为xml表示形式。首先，安装dicttoxml软件包pip3installdicttoxml创建一个字典对象>>>D1={"name":"Ravi","age":21,"marks":55}现在dicttoxml()从dicttoxml包中导入函数，并使用D1作为参数。该函数返回已编码的字符串作为字典的xml表示形式>>>fromdicttoxmlim
python保存字典到xml文件_Python将字典转换为XML的方法 weixin_39872123
问题你想使用一个Python字典存储数据，并将它转换成XML格式。解决方案尽管xml.etree.ElementTree库通常用来做解析工作，其实它也可以创建XML文档。例如，考虑如下这个函数：fromxml.etree.ElementTreeimportElementdefdict_to_xml(tag,d):'''Turnasimpledictofkey/valuepairsintoXML''
Python 3.8.10 for Windows：开启编程之旅的完美选择裴涓斐Kathy
Python3.8.10forWindows：开启编程之旅的完美选择python3.8.zip项目地址:https://gitcode.com/open-source-toolkit/dd07d项目介绍Python3.8.10forWindows是一款专为Windows用户设计的Python安装包，旨在为Windows7及更高版本的操作系统提供稳定、高效的Python环境。无论您是Python编程
Python 3.8.10 AMD64 安装包卢枫岱
Python3.8.10AMD64安装包项目地址:https://gitcode.com/open-source-toolkit/03899描述本仓库提供了一个Python3.8.10的AMD64安装包，旨在解决原下载地址网速过慢的问题，帮助用户节省下载时间。资源文件文件名:python-3.8.10-amd64.exe版本:Python3.8.10架构:AMD64使用方法点击仓库中的python
一键生成Python项目依赖清单：pipreqs完全指南北岭敲键盘的荒漠猫 #python开发 python 开发语言
省流:pipinstallpipreqspipreqs./--encoding=utf8--force一键生成Python项目依赖清单：pipreqs完全指南作为Python开发者，你是否经历过这些痛苦场景？✅项目迁移到新环境时，发现漏装了几个依赖包，调试到崩溃…✅用pipfreeze导出依赖，结果混入一堆无关的全局包，臃肿不堪…✅手动维护requirements.txt，每次更新都要反复核对版本
思考–如何学习陌生的知识后知后觉的先行者思考学习
思考–如何学习陌生的知识面对新知识的学习，可以遵循以下系统化的方法，既提高效率又减少迷茫感：一、明确学习目标：打破“学什么都要学全”的误区核心原则二八定律：80%的实用场景只需掌握20%的核心知识。场景驱动：明确“学这个知识要解决什么问题？”（例如：学Python是为了数据分析还是自动化办公？）。快速定位重点通过行业标杆案例、岗位JD或技术文档，提取高频关键词（如“神经网络”之于AI、“API调用
python:类属性与方法 muxue178 python 开发语言
1.类的属性'''类属性：不能用实例化对象对类属性进行修改只类用类对象对其属性进行修改'''classPolice(object):name='警察'Police.name='交通警察'print(Police.name)police=Police()police.name='民警'print(police.name)print(Police.name)运行结果：交通警察民警交通警察即原理是在对类
【python】错误处理、异常捕获、调试和单元测试详解 echo 慧 Python学习 python 单元测试异常调试错误
错误、异常和调试测试1.错误1.1语法错误1.2逻辑错误2.异常2.1ZerDevisionError2.2FileNotFoundError2.3IndexError2.4keyError2.5ValueError2.6TypeError3.异常处理方法3.1try-except捕获异常3.2else和finally子句4.抛出异常4.1使用raise主动抛出异常4.2重新抛出异常5.自定义异常
类的定义和使用（python）小臭希 python 开发语言
一、定义一个类格式：class类名（建议首字母大写）:passclassStudent:#定义了一个Student类age=18def__init__(self,name,hight):self.name=nameself.hight=hight二、定义属性（一）动态绑定属性classStudent:defget(self):print(self.name,"今年18岁了。")tom=Studen
字符串（Python）小臭希 python
一、转义字符1.\（续行符）：将两行字符串连接起来2.\\（反斜杠）：打印输出反斜杠符3.\"(双引号）：打印输出双引号4.\n(换行符）：换行5.\t（制表符）：将数据对齐二、编码与对应字符的转换ord(x)print(ord("a"))#将字符转成对应的Unicode码chr(x)print(chr(97))#将unicode码转成对应的字符三、判断类函数（不需要特别的去记）1.isalnum
Python AES 加密和解密（qbit） pythonaes加密解密
前言AES有多种加密模式，本文选取了最常用的CBC模式CipherBlockChaining密码块链模式技术栈Python3.11.8cryptography43.0.3loguru0.7.2示例代码导入库#encoding:utf-8#author:qbit#date:2024-10-28#summary:测试AES的加密和解密importosimportrandomimportstringfr
Windows 下启动 gradio 信息: 用提供的模式无法找到文件。（qbit） gradio
技术栈Windows10Python3.11.8Gradio5.6.0启动gradio报如下信息信息:用提供的模式无法找到文件。经排查，是因为gradio时调用系统where命令去找nodejs$wherenode信息:用提供的模式无法找到文件。本文出自qbitsnap
C++使用Onnxruntime/TensorRT模型推理奇华智能 AI c++开发语言人工智能 AI 计算机视觉
onnxruntime和tensorrt是我们常用的两种推理方式，下面整理了两个推理示例，仅供参考。步骤流程模型训练，python下生成pytorch的模型.pth，并基于.pth模型进行推理python下依据模型推理实现从.pth转向.onnxpython下基于.onnx进行推理，与后续两种推理方式种的推理结果进行比较环境windows10+RTX308015GB显存cuda11.3onnxru
数据挖掘data mining Wlq0415 学习5 数据挖掘人工智能
数据挖掘是从大量数据集中提取有用信息和知识的过程。它通常涉及使用算法和技术来分析数据，以发现数据中的模式、趋势和关联。数据挖掘可以帮助企业和组织理解客户行为，预测市场趋势，优化运营流程等。数据挖掘的过程大致可以分为以下几个步骤：定义问题：明确数据挖掘的目的和需要解决的问题。数据收集：从各种数据源中收集相关的数据。数据预处理：清洗和整理数据，处理缺失值、异常值等问题。数据转换：将原始数据转换成适合挖
数据分类分级：如何用AI自动打标签（附Python代码示例）活力板蓝根数据治理人工智能分类 python
数据分类分级：如何用AI自动打标签（附Python代码示例）1.引言在当今数字化时代，数据的安全管理变得越来越重要。数据分类分级不仅是合规要求，更是保护核心资产的重要手段。然而，随着数据量的激增，传统的人工分类方式已经难以应对这个问题。本文将介绍如何利用AI技术实现数据的自动分类分级。希望大家享用愉快！2.技术方案概述2.1问题定义目标：将数据按照敏感度（公开、内部、机密）和业务类型（财务、人事、
【Python】使用Python脚本生成文件头注释哇咔咔哇咔 Python脚本 python
文章目录一、引言二、详细代码三、运行实例一、引言在大家平常编写代码的过程中，可能会需要生成文件头来说明代码的作者信息、版权、联系方式、编写时间、文件名、使用的软件、代码简单概述等来说明代码文件详情。此代码会自动化创建符合规范的Python文件头注释二、详细代码#-*-coding:utf-8-*-#@Time:2024/10/0518:17#@Author:哇咔咔哇咔#@Email:yannbao
Python使用browser_cookie3库来读取浏览器Cookies 飞起来fly呀 Python python 浏览器 cookies
browser_cookie3是一个强大且实用的Python模块，用于从各种常用浏览器中提取Cookies。这在进行Web请求时特别有用，因为它允许您直接使用登录会话Cookies进行操作，而无需手动输入凭据。以下是关于如何使用browser_cookie3模块从浏览器中提取Cookies的详细步骤：1.安装browser_cookie3模块首先，确保您的工作环境中已安装了browser_cook
【Python 开发网络爬虫抓取客户订单网站数据】局外人_Jia python 爬虫数据库开发语言字符串正则表达式
以下是使用Python开发网络爬虫抓取客户订单网站数据的完整指南，包含技术实现、注意事项和法律合规性说明：一、准备工作：法律与合规性确认合法性：检查目标网站的robots.txt文件（如https://example.com/robots.txt）。确保遵守网站的《服务条款》（TermsofService）。如果涉及用户隐私数据（如订单详情），需获得明确授权。推荐替代方案：优先使用网站提供的API
【python数据挖掘之numpy】-数组及对象属性和数据转换 sc.溯琛 python 数据挖掘 numpy
Numpy是一个Python库，用于处理多维数组和矩阵，以及针对这些数组执行数学运算的函数。它提供了高效的数组对象和相关的操作，可以用于快速处理大量数据。Numpy的主要功能包括：创建数组、数组运算、数组索引和切片、线性代数、随机数生成等。Numpy在科学计算、数据分析、机器学习等领域都广泛应用。tips：（本博文在jupyter中实训）目录一、创建数组对象1.array（）函数来创建数组的对象2
Dom 周华华 JavaScript html
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
【Spark九十六】RDD API之combineByKey bit1129 spark
1. combineByKey函数的运行机制 RDD提供了很多针对元素类型为(K,V)的API，这些API封装在PairRDDFunctions类中，通过Scala隐式转换使用。这些API实现上是借助于combineByKey实现的。combineByKey函数本身也是RDD开放给Spark开发人员使用的API之一首先看一下combineByKey的方法说明：
msyql设置密码报错：ERROR 1372 (HY000): 解决方法详解 daizj mysql 设置密码
MySql给用户设置权限同时指定访问密码时，会提示如下错误： ERROR 1372 (HY000): Password hash should be a 41-digit hexadecimal number；问题原因：你输入的密码是明文。不允许这么输入。解决办法：用select password('你想输入的密码');查询出你的密码对应的字符串，然后
路漫漫其修远兮吾将上下而求索周凡杨学习思索
王国维在他的《人间词话》中曾经概括了为学的三种境界古今之成大事业、大学问者，罔不经过三种之境界。“昨夜西风凋碧树。独上高楼，望尽天涯路。”此第一境界也。“衣带渐宽终不悔，为伊消得人憔悴。”此第二境界也。“众里寻他千百度，蓦然回首，那人却在灯火阑珊处。”此第三境界也。学习技术，这也是你必须经历的三种境界。第一层境界是说，学习的路是漫漫的，你必须做好充分的思想准备，如果半途而废还不如不要开始。这里，注
Hadoop(二)对话单的操作朱辉辉33 hadoop
Debug： 1、 A = LOAD '/user/hue/task.txt' USING PigStorage(' ') AS (col1,col2,col3); DUMP A; //输出结果前几行示例： (>ggsnPDPRecord(21),,) (-->recordType(0),,) (-->networkInitiation(1),,)
web报表工具FineReport常用函数的用法总结（日期和时间函数）老A不折腾 finereport 报表工具 web开发
web报表工具FineReport常用函数的用法总结（日期和时间函数）说明：凡函数中以日期作为参数因子的，其中日期的形式都必须是yy/mm/dd。而且必须用英文环境下双引号(" ")引用。 DATE DATE(year,month,day):返回一个表示某一特定日期的系列数。 Year:代表年，可为一到四位数。 Month:代表月份。
c++ 宏定义中的##操作符墙头上一根草 C++
#与##在宏定义中的--宏展开 #include <stdio.h> #define f(a,b) a##b #define g(a) #a #define h(a) g(a) int main() { &nbs
分析Spring源代码之，DI的实现 aijuans spring DI 现源代码
(转) 分析Spring源代码之，DI的实现 2012/1/3 by tony 接着上次的讲，以下这个sample [java] view plain copy print
for循环的进化 alxw4616 JavaScript
// for循环的进化 // 菜鸟 for (var i = 0; i < Things.length ; i++) { // Things[i] } // 老鸟 for (var i = 0, len = Things.length; i < len; i++) { // Things[i] } // 大师 for (var i = Things.le
网络编程Socket和ServerSocket简单的使用百合不是茶网络编程基础 IP地址端口
网络编程;TCP/IP协议网络:实现计算机之间的信息共享,数据资源的交换协议:数据交换需要遵守的一种协议,按照约定的数据格式等写出去端口:用于计算机之间的通信每运行一个程序，系统会分配一个编号给该程序，作为和外界交换数据的唯一标识 0~65535 查看被使用的
JDK1.5 生产消费者 bijian1013 java thread 生产消费者 java多线程
ArrayBlockingQueue：一个由数组支持的有界阻塞队列。此队列按 FIFO（先进先出）原则对元素进行排序。队列的头部是在队列中存在时间最长的元素。队列的尾部是在队列中存在时间最短的元素。新元素插入到队列的尾部，队列检索操作则是从队列头部开始获得元素。 ArrayBlockingQueue的常用方法：
JAVA版身份证获取性别、出生日期及年龄 bijian1013 java 性别出生日期年龄
工作中需要根据身份证获取性别、出生日期及年龄，且要还要支持15位长度的身份证号码，网上搜索了一下，经过测试好像多少存在点问题，干脆自已写一个。 CertificateNo.java package com.bijian.study; import java.util.Calendar; import
【Java范型六】范型与枚举 bit1129 java
首先，枚举类型的定义不能带有类型参数，所以，不能把枚举类型定义为范型枚举类，例如下面的枚举类定义是有编译错的 public enum EnumGenerics<T> { //编译错，提示枚举不能带有范型参数 OK, ERROR; public <T> T get(T type) { return null;
【Nginx五】Nginx常用日志格式含义 bit1129 nginx
1. log_format 1.1 log_format指令用于指定日志的格式，格式： log_format name(格式名称) type(格式样式) 1.2 如下是一个常用的Nginx日志格式： log_format main '[$time_local]|$request_time|$status|$body_bytes
Lua 语言 15 分钟快速入门 ronin47 lua 基础
- - 单行注释 - - [[ [多行注释] - - ]] - - - - - - - - - - - 1. 变量 & 控制流 - - - - - - - - - - num = 23 - - 数字都是双精度 str = 'aspythonstring'
java-35.求一个矩阵中最大的二维矩阵 ( 元素和最大 ) bylijinnan java
the idea is from: http://blog.csdn.net/zhanxinhang/article/details/6731134 public class MaxSubMatrix { /**see http://blog.csdn.net/zhanxinhang/article/details/6731134 * Q35 求一个矩阵中最大的二维
mongoDB文档型数据库特点开窍的石头 mongoDB文档型数据库特点
MongoDD: 文档型数据库存储的是Bson文档-->json的二进制特点：内部是执行引擎是js解释器，把文档转成Bson结构，在查询时转换成js对象。 mongoDB传统型数据库对比传统类型数据库：结构化数据，定好了表结构后每一个内容符合表结构的。也就是说每一行每一列的数据都是一样的文档型数据库：不用定好数据结构，
[毕业季节]欢迎广大毕业生加入JAVA程序员的行列 comsci java
一年一度的毕业季来临了。。。。。。。。正在投简历的学弟学妹们。。。如果觉得学校推荐的单位和公司不适合自己的兴趣和专业，可以考虑来我们软件行业，做一名职业程序员。。。软件行业的开发工具中，对初学者最友好的就是JAVA语言了，网络上不仅仅有大量的
PHP操作Excel – PHPExcel 基本用法详解 cuiyadll PHP Excel
导出excel属性设置//Include classrequire_once('Classes/PHPExcel.php');require_once('Classes/PHPExcel/Writer/Excel2007.php');$objPHPExcel = new PHPExcel();//Set properties 设置文件属性$objPHPExcel->getProperties
IBM Webshpere MQ Client User Issue (MCAUSER) darrenzhu IBM jms user MQ MCAUSER
IBM MQ JMS Client去连接远端MQ Server的时候，需要提供User和Password吗？答案是根据情况而定，取决于所定义的Channel里面的属性Message channel agent user identifier (MCAUSER)的设置。 http://stackoverflow.com/questions/20209429/how-mca-user-i
网线的接法 dcj3sjt126com
一、PC连HUB (直连线)A端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。 B端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。二、PC连PC （交叉线）A端：(568A)：白绿，绿，白橙，蓝，白蓝，橙，白棕，棕； B端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。三、HUB连HUB&nb
Vimium插件让键盘党像操作Vim一样操作Chrome dcj3sjt126com chrome vim
什么是键盘党？键盘党是指尽可能将所有电脑操作用键盘来完成，而不去动鼠标的人。鼠标应该说是新手们的最爱，很直观，指哪点哪，很听话！不过常常使用电脑的人，如果一直使用鼠标的话，手会发酸，因为操作鼠标的时候，手臂不是在一个自然的状态，臂肌会处于绷紧状态。而使用键盘则双手是放松状态，只有手指在动。而且尽量少的从鼠标移动到键盘来回操作，也省不少事。在chrome里安装 vimium 插件
MongoDB查询（2）——数组查询[六] eksliang mongodb MongoDB查询数组
MongoDB查询数组转载请出自出处：http://eksliang.iteye.com/blog/2177292 一、概述 MongoDB查询数组与查询标量值是一样的，例如，有一个水果列表，如下所示： > db.food.find() { "_id" : "001", "fruits" : [ "苹
cordova读写文件（1） gundumw100 JavaScript Cordova
使用cordova可以很方便的在手机sdcard中读写文件。首先需要安装cordova插件：file 命令为： cordova plugin add org.apache.cordova.file 然后就可以读写文件了，这里我先是写入一个文件，具体的JS代码为： var datas=null;//datas need write var directory=&
HTML5 FormData 进行文件jquery ajax 上传到又拍云 ileson jquery Ajax html5 FormData
html5 新东西：FormData 可以提交二进制数据。页面test.html <!DOCTYPE> <html> <head> <title> formdata file jquery ajax upload</title> </head> <body> <
swift appearanceWhenContainedIn:(version1.2 xcode6.4) 啸笑天 version
swift1.2中没有oc中对应的方法： + (instancetype)appearanceWhenContainedIn:(Class <UIAppearanceContainer>)ContainerClass, ... NS_REQUIRES_NIL_TERMINATION; 解决方法：在swift项目中新建oc类如下： #import &
java实现SMTP邮件服务器 macroli java 编程
电子邮件传递可以由多种协议来实现。目前，在Internet 网上最流行的三种电子邮件协议是SMTP、POP3 和 IMAP，下面分别简单介绍。　　◆ SMTP 协议　　简单邮件传输协议(Simple Mail Transfer Protocol,SMTP)是一个运行在TCP/IP之上的协议，用它发送和接收电子邮件。SMTP 服务器在默认端口25上监听。SMTP客户使用一组简单的、基于文本的
mongodb group by having where 查询sql qiaolevip 每天进步一点点学习永无止境 mongo 纵观千象
SELECT cust_id, SUM(price) as total FROM orders WHERE status = 'A' GROUP BY cust_id HAVING total > 250 db.orders.aggregate( [ { $match: { status: 'A' } }, { $group: {
Struts2 Pojo（六） Luob. POJO strust2
注意：附件中有完整案例 1.采用POJO对象的方法进行赋值和传值 2.web配置 <?xml version="1.0" encoding="UTF-8"?> <web-app version="2.5" xmlns="http://java.sun.com/xml/ns/javaee&q
struts2步骤 wuai struts
1、添加jar包 2、在web.xml中配置过滤器 <filter> <filter-name>struts2</filter-name> <filter-class>org.apache.st