Top Secret

数据分析——数据预处理和数据管道构建

目标：对于拿到的一个任意数据集，编写类似数据加载程序，以适应深度学习的研究。

框架：

针对不同的时间序列数据集，可以总结如下关键步骤，以编写类似上述代码的深度学习数据处理流程：

1. 了解数据集:

- 了解新数据集的特性，包括时间序列的长度、采样频率、数据格式和标签信息等。

2. 数据加载:

- 实现加载时间序列数据的函数，可以使用常见的数据处理库（例如`pandas`、`numpy`）。

```python
# 例如，对CSV格式的时间序列数据进行加载
import pandas as pd

def load_time_series_data(file_path):
return pd.read_csv(file_path)
```

3. 数据预处理:

- 根据时间序列数据的特点进行预处理，包括但不限于：
- 缺失值处理
- 平滑处理（如滤波）
- 标准化或归一化
- 特征工程（提取有用的特征）

```python
# 例如，简单的归一化处理
def normalize_time_series_data(data):
return (data - data.mean()) / data.std()
```

4. 数据分割:

- 将时间序列数据集划分为训练集、验证集和测试集。

```python
# 例如，基于时间的分割
def split_time_series_data(data, train_ratio=0.8, val_ratio=0.1):
train_size = int(len(data) * train_ratio)
val_size = int(len(data) * val_ratio)
test_size = len(data) - train_size - val_size
train_data, val_data, test_data = data[:train_size], data[train_size:train_size + val_size], data[-test_size:]
return train_data, val_data, test_data
```

5. **序列切割:**
- 如果时间序列较长，可以将其切割成固定长度的序列，以便输入深度学习模型。

```python
# 例如，将时间序列切割成固定长度的子序列
def segment_time_series(data, segment_length):
segments = []
for i in range(0, len(data) - segment_length + 1, segment_length):
segments.append(data[i:i+segment_length])
return segments
```

6. 数据增强:

- 根据需要，实现时间序列数据的数据增强方法，例如引入噪声、随机缩放等。

```python
# 例如，简单的添加噪声
import numpy as np

def add_noise_to_time_series(data, noise_level=0.1):
noise = np.random.normal(0, noise_level, len(data))
return data + noise
```

7. 构建数据集类:

- 设计一个数据集类，整合加载、预处理、分割等操作，以便于在深度学习模型中使用。

```python
class TimeSeriesDataset:
def __init__(self, file_path, segment_length=256, train_ratio=0.8, val_ratio=0.1):
self.data = load_time_series_data(file_path)
self.data = normalize_time_series_data(self.data)
self.train_data, self.val_data, self.test_data = split_time_series_data(self.data, train_ratio, val_ratio)
self.train_segments = segment_time_series(self.train_data, segment_length)
# ...其他初始化步骤...

# 示例用法
time_series_dataset = TimeSeriesDataset('path/to/your/time_series_data.csv')
```

8. 数据管道:

- 建立一个数据管道，确保数据有效地输入到深度学习模型中。

```python
# 例如，使用 TensorFlow 的数据管道
import tensorflow as tf

def create_data_pipeline(data, batch_size=32):
dataset = tf.data.Dataset.from_tensor_slices(data)
dataset = dataset.shuffle(buffer_size=len(data))
dataset = dataset.batch(batch_size)
return dataset
```

通过按照这些步骤组织代码，您可以更容易地处理不同时间序列数据集，并确保数据准备流程适应您的深度学习任务。

案例一：将如下LSTM的时间预测项目代码改为由数据加载和处理（data_loader）、模型(models) 、训练代码（train.py）三部分组成。

1.1 整体代码（修改前）

import torch
import torch.nn as nn

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

# 读取数据集
dataset = pd.read_csv(r'D:\datasets\预测模型实验\PRZ liquid space leak 0.8.csv')

# 将行数做成一列显式的索引列
dataset.insert(0, 'Index_Column', dataset.index)

all_data = dataset['主回路1热管段冷却剂温度（℃）306.852814'].values


# 数据预处理
# 定义划分比例
train_ratio = 0.8  # 80%的数据作为训练集

# 计算划分索引
split_index = int(len(dataset) * train_ratio)

# 划分数据
train_data = dataset.iloc[:split_index]
test_data = dataset.iloc[split_index:]

# 标准化
from sklearn.preprocessing import MinMaxScaler

# '主回路1热管段冷却剂温度（℃）306.852814' 是要归一化的列名
column_name = '主回路1热管段冷却剂温度（℃）306.852814'

# 将 DataFrame 转换为 NumPy 数组
train_data_array = train_data[column_name].values.reshape(-1, 1)

# 使用 MinMaxScaler 进行归一化
scaler = MinMaxScaler(feature_range=(-1, 1))
train_data_normalized = scaler.fit_transform(train_data_array)

# 数据张量化
train_data_normalized = torch.FloatTensor(train_data_normalized).view(-1)

# 训练数据转换为序列和相应的标签
train_window = 30

def create_inout_sequences(input_data, tw):
    inout_seq = []
    L = len(input_data)
    for i in range(L-tw):
        train_seq = input_data[i:i+tw]
        train_label = input_data[i+tw:i+tw+1]
        inout_seq.append((train_seq ,train_label))
    return inout_seq

train_inout_seq = create_inout_sequences(train_data_normalized, train_window)

# 创建模型
import torch.nn as nn

class LSTM(nn.Module):
    def __init__(self, input_size=1, hidden_layer_size=100, output_size=1):
        super().__init__()
        self.hidden_layer_size = hidden_layer_size

        self.lstm = nn.LSTM(input_size, hidden_layer_size)
        self.linear = nn.Linear(hidden_layer_size, output_size)

    def forward(self, input_seq):
        lstm_out, self.hidden_cell = self.lstm(input_seq.view(len(input_seq), 1, -1), self.hidden_cell)
        predictions = self.linear(lstm_out.view(len(input_seq), -1))
        return predictions[-1]

# 构建模型对象
model = LSTM()
loss_function = nn.MSELoss()
optimizer = torch.optim.Adam(model.parameters(), lr=0.001)

import matplotlib.pyplot as plt

epochs = 50
losses = []  # 用于存储每个 epoch 的损失值

for i in range(epochs):
    epoch_loss = 0.0  # 用于累积每个 epoch 的损失值

    for seq, labels in train_inout_seq:
        optimizer.zero_grad()
        model.hidden_cell = (torch.zeros(1, 1, model.hidden_layer_size),
                            torch.zeros(1, 1, model.hidden_layer_size))

        y_pred = model(seq)

        single_loss = loss_function(y_pred, labels)
        single_loss.backward()
        optimizer.step()

        epoch_loss += single_loss.item()

    losses.append(epoch_loss)  # 记录每个 epoch 的损失值

    if i % 5 == 0:  # 每5个 epoch 打印一次损失值
        print(f'Epoch [{i}/{epochs}], Loss: {epoch_loss:.8f}')

# 绘制损失曲线
plt.plot(losses)
plt.xlabel('Epoch')
plt.ylabel('Loss')
plt.title('Training Loss Over Epochs')
plt.show()

# 进行预测
fut_pred = 30

test_inputs = train_data_normalized[-train_window:].tolist()
#print(test_inputs)

model.eval()

for i in range(fut_pred):
    seq = torch.FloatTensor(test_inputs[-train_window:])
    with torch.no_grad():
        model.hidden = (torch.zeros(1, 1, model.hidden_layer_size),
                        torch.zeros(1, 1, model.hidden_layer_size))
        test_inputs.append(model(seq).item())


# 将归一化后的预测值转换为实际预测值
actual_predictions = scaler.inverse_transform(np.array(test_inputs[train_window:] ).reshape(-1, 1))

# 可视化预测值与实际值
x = np.arange(437, 467, 1)

# 设置中文字体
plt.rcParams['font.sans-serif'] = ['SimHei']  # 使用中文字体（例如：黑体）
plt.rcParams['axes.unicode_minus'] = False  # 解决负号显示问题

plt.title('主回路1热管段冷却剂温度')
plt.ylabel('温度值')
plt.grid(True)
plt.autoscale(axis='x', tight=True)
plt.plot(dataset['主回路1热管段冷却剂温度（℃）306.852814'],label='实际温度')
plt.plot(x,actual_predictions, label='预测温度')
# 添加图例
plt.legend()
plt.show()

将如上LSTM的时间预测项目代码改为由数据加载和处理（data_loader）、模型(models) 、训练代码（train.py）三部分组成。

1.2 数据加载和处理（data_loader）

将被用于深度学习的数据集定义为一个数据集类，数据的加载和预处理都通过这个类来实现。编写该类时，主要关注两个方面，其一是构造函数（详情如下），其二就是

构造函数：

初始化可控参数，包括加载数据（导入数据），初始化超参数，实例化某种工具（比如归一化实例）。

data_loader部分的代码：

# data_loader/shujvjiazai.py
import torch
import pandas as pd
from sklearn.preprocessing import MinMaxScaler

# 数据加载
class DataLoader:
    def __init__(self, file_path, column_name, train_ratio=0.8):
        self.dataset = pd.read_csv(file_path)
        self.train_ratio = train_ratio  # 划分为训练集的比例
        self.scaler = MinMaxScaler(feature_range=(-1, 1)) # 归一化实例
        self.column_name = column_name  # 将要被归一化的列名

    def load_and_preprocess_data(self):
        split_index = int(len(self.dataset) * self.train_ratio) # # 计算划分索引

        # 划分数据集
        train_data = self.dataset.iloc[:split_index] # 划分的训练集
        test_data = self.dataset.iloc[split_index:]  # 划分的测试集

        # # 将 DataFrame 转换为 NumPy 数组
        train_data_array = train_data[self.column_name].values.reshape(-1, 1)
        train_data_normalized = self.scaler.fit_transform(train_data_array)

        # 张量化
        train_data_normalized = torch.FloatTensor(train_data_normalized).view(-1)

        # 返回张量化后的数据
        return train_data_normalized

要点：
（1）构造函数负责加载数据和声明（初始化）可控参数。

（2）在函数中定义数据预处理的步骤，比如数据划分，归一化，张量化等。

1.3 模型（model）

整体代码中和将代码分写，关于model部分并无变化。

1.4 训练脚本（train.py）

在训练脚本train.py中，需要导入前面编写好的数据加载代码，比如要导入

data_loader/shujvjiazai.py中的数据处理类DataLoader

那就在train.py中做导入，即：

from data_loader.shujvjiazai import DataLoader

由上可知，也可以在shujvjiazai.py文件中写下多个不同的数据集处理类，比如class DataLoader1，class DataLoader2，class DataLoader3

这样当train中需要对某个数据集做训练时，只要在train.py中导入该数据集类即可。比如：

from data_loader.shujvjiazai import DataLoader2 # 应用数据集DataLoader2

关于创建模型实例，以及迭代训练模型的代码，train.py中好“一体化”代码并没有什么两样。

总结

若想改变原来写“一体化”代码的习惯，养成将代码分块，其实就是python中模块化的思想。

（1）首先，编写好数据加载和预处理模块（例如：data_loader/shujvjiazai.py ），导入数据，设置好一些超参数。

（2）然后再根据数据预处理的基本步骤，将各个步骤写成函数，于数据集类中。

（3）编写好模型代码（例如：models/LSTM_LKW.py ）。

（4）编写好模型训练代码（train.py）。主要在于导入包部分，其他的训练代码的写法其实和“一体化”代码一样。导入如上（1）（3）中的数据和模型，所以在train.py中。需要导入这两个模块。

你可能感兴趣的:(python数据分析与数据处理,数据分析,数据挖掘)

探索大数据处理：利用 Apache Spark 解锁数据价值 Echo_Wish 实战高阶大数据 apache spark 大数据
探索大数据处理：利用ApacheSpark解锁数据价值大家好，我是你们熟悉的大数据领域自媒体创作者Echo_Wish。今天，我们来聊聊如何利用ApacheSpark进行大规模数据处理。ApacheSpark作为一个快速、通用的集群计算框架，以其出色的性能和丰富的API，成为大数据处理的利器。那么，ApacheSpark究竟如何帮助我们高效处理海量数据？接下来，让我们一起深入探讨。一、ApacheS
VTK知识学习（32）-图像运算无所谓จุ๊บ VTK 学习 VTK
1、数学运算vklmageMathematics提供了基本的一元和二元数学操作。根据不同的操作，需要一个或者两个输入图像。二元数学操作要求两个输入图像具有相同的像素数据类型和颜色组分。当两个图像大小不同时，输出图像的范围为两个输入图像范围的并集，并且原点和像素间隔与第一个输入图像保持一致。privatevoidTestMathematics(){//绘制一个暗红色矩形vtkImageCanvasS
java实现数据上传到接口,Java 导入数据到Excel并提供文件下载接口梨漾 java实现数据上传到接口
依赖net.sourceforge.jexcelapijxl2.6.12复制代码我们需要用到jxl包的类，而jxl.jar正是操作excel表格的工具类库，除了jxl以外，poi包也是一个操作excel的类库。而对比两个包，jxl更适用与数据量大的情况，而poi在数据量不高(大约5000以内)时，效率较高，但占用内存大，更容易内存溢出。测试数据privateintid;privateStringn
【学习笔记】Python基础-字典Dict和Set和List与Str扩展法迪 Python基础 python hashmap Dict set list
Dict使用大括号围起来，这里提供一种键值对的list表示方法1.Dict{}2.List[]3.turple()实例代码#!/usr/bin/envpython3#-*-coding:utf-8-*-#字典dict类似Java的HashMap#Dict{}#List[]#turple()mDict={"Lava":90,"Huawei":100,"Sony":60}print(mDict['La
flink核心特性 24k小善 flink 大数据 java 架构
ApacheFlink核心特性详解一、流处理与批处理的统一Flink的核心设计理念之一是将流处理和批处理统一在一个框架中。这种统一性使得Flink在处理实时数据和批量数据时具有高度的灵活性和一致性。1.流处理与批处理的统一计算引擎流处理作为批处理的特例：Flink将批处理视为有限流（FiniteStream），从而实现了流处理和批处理的统一。统一API：Flink提供了DataStream和Dat
python中的dict与set “光光” python
python内置字典：dict支持key-value存储方式，在放进去的时候，必须根据key算出value的存放位置，这样取出来的时候才能根据key拿到value。由于一个key只能对应一个value,所以，多次对一个key放入value,后面的值会将前面的值覆盖掉。如果key不存在，dict就会报错要避免key不存在的错误，有两种方法：1）通过in判断key是否存在>>>d=｛'a':'1'｝>
探索未来云部署：Spring Boot、Docker与AWS Fargate的完美融合秦贝仁Lincoln
探索未来云部署：SpringBoot、Docker与AWSFargate的完美融合去发现同类优质开源项目:https://gitcode.com/在这个日益数字化的时代，【DeploySpringBootandDockerMicroservicestoAWSusingECSandAWSFargate】项目为我们提供了一个创新的方式来部署Java微服务到亚马逊云。该项目不仅涵盖了SpringBoot
Pytorch实现之在LSGAN中结合重建损失这张生成的图像能检测吗 GAN系列优质GAN模型训练自己的数据集 pytorch 人工智能 python
简介简介：这篇论文在LSGAN的基础上结合了重建损失来产生通过传统不良数据检测（BDD）机制的人工测量。这篇博客的主要内容是关于实现了重建损失与LSGAN的结合。论文题目：FalseDataInjectionAttacksBasedonLeastSquaresGenerativeAdversarialNetworkswithReconstructionLoss（基于重构损失最小二乘生成对抗网络的虚
Pytorch实现论文：利用推土机距离与梯度惩罚在ACGAN中训练。这张生成的图像能检测吗优质GAN模型训练自己的数据集 pytorch 人工智能深度学习 gan 机器学习生成对抗网络
论文简介论文：ACWGAN-GPformillingtoolbreakagemonitoringwithimbalanceddata（ACWGAN-GP用于铣削工具断裂监视的数据不平衡数据）出处：RoboticsandComputer-IntegratedManufacturing论文摘要：铣削操作过程中的刀具破损监测(TBM)对于确保工件质量和最大限度减少经济损失至关重要。在训练数据充足、分布均
无人机遥感技术：从植被监测到生理参数反演的进阶之路 KY_chenzhao 无人机植被遥感参数反演
在当今的生态学和农林业研究中，无人机遥感技术已经成为获取植被信息的重要手段。它不仅能够快速覆盖大面积区域，还能提供高分辨率的多光谱和高光谱数据，为植被健康监测、生长状况评估和生理参数反演提供了强大的技术支持。今天，我们就来深入了解一下无人机遥感技术在植被定量监测中的应用。一、无人机遥感：为何备受青睐？无人机遥感技术结合了无人机的灵活性和遥感传感器的高精度，能够快速获取植被的多维度信息。与传统的卫星
springcloudalibaba组件gateway zzyh123456 gateway 前端 javascript
SpringCloudAlibaba组件中的Gateway是一个基于SpringCloudGateway实现的API网关，它专为微服务架构提供简单且有效的API路由管理方式。以下是对SpringCloudAlibabaGateway的详细介绍：一、基本概念API网关：作为系统的统一入口，提供内部服务的路由中转，为客户端提供统一服务。网关可以处理一些与业务本身功能无关的公共逻辑，如认证、鉴权、监控、
springcloud的组件及作用 zzyh123456 spring cloud spring 后端
SpringCloud是一个用于构建分布式系统的工具集，它提供了一系列组件来简化微服务架构的开发和部署。以下是一些关键的SpringCloud组件及其作用：1.服务注册与发现Eureka：Eureka是SpringCloud中的核心组件之一，用于实现服务注册与发现。服务实例通过EurekaServer进行注册，消费者通过EurekaServer查询服务实例的地址，实现服务的自动发现和调用。Eure
C++Primer学习（4.6成员访问运算符）黑果果的思考零基础学习C++c++
4.6成员访问运算符点运算符和箭头运算符都可用于访问成员，其中，点运算符获取类对象的一个成员;箭头运算符与点运算符有关，表达式ptr->mem等价于(*ptr).mem:stringsl="astring",*p=&s1;auton=s1.size();//运行string对象s1的size成员n=(*p).size();//运行p所指对象的size成员n=p->size();//等价于(*p).
微服务架构中的负载均衡与服务注册中心(Nacos) ღ᭄ꦿ࿐Never say never꧂ 微服务架构微服务负载均衡 spring cloud spring boot 后端 java
1.负载均衡：解决实际业务问题1.1业务场景思考想象一个电子商务平台的微服务架构。我们有一个订单服务和多个用户服务实例。当订单服务需要调用用户服务时，它如何选择具体调用哪一台用户服务器？这就是负载均衡要解决的核心问题。1.2常用负载均衡算法及其业务影响1.2.1轮询（RoundRobin）原理：请求依次分配给每个服务器。业务影响：优点：实现简单，在服务器性能相近的情况下能达到较好的负载平衡。缺点：
Linux下JVM相关指令详解及案例介绍码农阿豪@新空间好“物”分享 linux jvm 运维
个人名片作者简介：java领域优质创作者个人主页：码农阿豪工作室：新空间代码工作室（提供各种软件服务）个人邮箱：[[email protected]]个人微信：15279484656个人导航网站：www.forff.top座右铭：总有人要赢。为什么不能是我呢？专栏导航：码农阿豪系列专栏导航面试专栏：收集了java相关高频面试题，面试实战总结️Spring5系列专栏：整理了Spring5重要知识点与
2024年AI虚拟伴侣应用趋势深度剖析：技术前沿与社会影响花生糖@ 技术科普 AIGC学习资料库人工智能 AI数字人 aigc 产品经理
随着人工智能技术的飞速发展，AI虚拟伴侣市场在2024年迎来了前所未有的繁荣期。这一新兴领域不仅验证了产品与市场的高度契合（Product-MarketFit,PMF），而且正逐步成为连接用户、流量与商业价值的桥梁。本文旨在深入探讨驱动AI伴侣行业爆炸性增长的关键趋势，并分析背后的技术动向及社会心理因素，为创业者和开发者提供一份全面的参考指南。一、市场概览：AI伴侣的崛起近年来，以Characte
AI与育儿领域的融合——探索未来的可能性花生糖@ AIGC学习资料库人工智能 AI创业点创意点
在当今快速发展的社会中，育儿成为了众多家庭面临的重大挑战。随着人工智能（AI）技术的不断进步，AI在育儿领域的应用逐渐展现出巨大的潜力，不仅能够为父母提供及时有效的支持，还能在很大程度上改善育儿体验。本文旨在探讨AI技术如何与育儿领域相结合，创造新的商业机会，以及未来的发展趋势。一、AI解决育儿的核心痛点育儿是一项复杂的工作，涉及广泛的知识和技能。然而，专业的育儿服务通常价格昂贵，许多家庭无法承担
三级等保项目设备清单及高风险项整改方向故事讲予风听等保网络安全 web安全等保等级保护
目录一、三级等保项目所需设备清单1.安全物理环境2.安全通信网络3.安全区域边界4.安全计算环境5.安全管理中心二、三级等保测评的高风险项分析与整改方向1.高风险项判定依据2.三级系统高风险项整改方向技术方面管理方面结语随着信息安全形势的日益严峻，构建“一个中心，三重防护”的多级防护体系成为保障信息系统安全运行的重要举措。针对三级等保项目，不仅在安全物理环境、通信网络、安全区域边界、安全计算环境以
RPC(3)--基于 Nacos 的服务发现与负载均衡版三喂树屋 Java rpc 服务发现负载均衡
nacos:提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据及流量管理。Nacos是构建以“服务”为中心的现代应用架构(例如微服务范式、云原生范式)的服务基础设施。nacos架构如下(图片来源)依赖包：com.alibaba.nacosnacos-client1.3.0使用如下：//创建命名服务NamingServicenamingService=NamingFacto
MATLAB算法实战应用案例精讲-【目标检测】机器视觉-工业相机（补充篇）林聪木数码相机 matlab 算法
目录知识储备光学系统设计全过程算法原理工业相机基本参数以及选型工业相机基本参数：如何选择合适的工业相机：分辨率分辨率的定义与“检测/测量精度”的区别分辨率与相机的匹配相机关键参数设置工业相机的曝光、曝光时间、快门、增益什么是曝光？什么是快门影响曝光的因素工业相机-坐标系和机械手坐标系的标定工业相机-缺陷检测一、相机的选择（1）工业数字相机的分类：（2）相机的主要参数（3）工业数字摄像机主要接口类型
LVS 负载均衡-DR模式敢敢936 lvs 负载均衡服务器
一.DR模式直接路由：1.介绍：直接路由（DirectRouting）：简称DR模式，采用半开放式的网络结构，与TUN模式的结构类似，但各节点并不是分散在各地，而是与调度器位于同一个物理网络。负载调度器与各节点服务器通过本地网络连接，不需要建立专用的IP隧道。直接路由，LVS默认模式,应用最广泛,通过请求报文重新封装一个MAC首部进行转发，源MAC是DIP所在的接口的MAC，目标MAC是某挑选出的
NACOS保姆笔记（2）——Spring Cloud Alibaba Nacos服务注册与发现以及负载均衡 laolitou_1024 Nacos 微服务中间件服务发现微服务 rpc 中间件 spring cloud
前面我们介绍过：NACOS保姆笔记（1）——NACOS的安装和启动本篇主要介绍下Nacos和springcloudalibaba来组合实现服务注册与发现以及负载均衡。环境具体的版本约束参见版本说明，我的环境版本如下：Nacos:2.2.0Springboot:2.6.13SpringCloudAlibaba:2021.0.5.0Loadbalancer:3.1.0Nacos端1，可以新建一个nam
mysql记录到毫秒，记录到微妙 kingmax54212008
TIMESTAMP(3)与DATETIME(3)意思是保留3位毫秒数TIMESTAMP(6)与DATETIME(6)意思是保留6位毫秒数更多参考：https://blog.csdn.net/helloxiaozhe/article/details/83269152
数据权限校验实践 fengdongnan 数据库前端网络
数据权限控制实践最近在实习中为公司项目完成一个文件数据权限校验代码的转换重构，写这篇博客来记录前后两种权限校验的实现方案与相关概念原实现方案：RBAC-基于角色的访问控制RBAC（Role-BasedAccessControl）RBAC是一种常见的访问控制模型，它通过角色来分配权限。在RBAC模型中，角色是一组权限的集合，用户通过被分配角色来获得相应的权限。RBAC的主要特点包括：角色分配：用户被
【Python 学习 / 5】函数详解（定义、参数、作用域、lambda、内置函数）卜及中 Python基础 python 学习开发语言
文章目录一、函数1.定义函数1.1基本函数定义1.2带参数的函数1.3带返回值的函数2.参数传递2.1位置参数2.2默认参数2.3可变参数2.3.1使用`*args`2.3.2使用`**kwargs`2.4参数的混合使用3.作用域3.1局部和全局变量3.2`global`关键字输出：3.3`nonlocal`关键字输出：4.lambda表达式4.1基本用法4.2与`map()`、`filter()
哈希表(C语言实现) 写代码的大学生散列表 c语言哈希算法
在计算机世界中，哈希表如同一位聪慧的图书管理员。他知道如何计算索书号，从而可以快速找到目标图书。文章目录1.哈希表的概念1.1哈希表的基本操作1.2哈希表的常用操作2.基于数实现哈希表2.1哈希表的结构体定义2.2哈希表的初始化2.3删除哈希表2.4哈希函数2.5查找哈希表中的元素2.6删除哈希表中的元素2.7添加哈希表元素3.哈希冲突与扩容4.链式地址改良哈希表4.1链式地址哈希表结构体定义4.
LeetCode解决方案集：编程与面试技能提升徐子贡
本文还有配套的精品资源，点击获取简介：LeetCode是一个编程训练平台，提供了大量编程题目，用于提升开发者的算法技能和面试准备。本文将探讨名为"some-leetcode-solutions"的开源项目，其中包括LeetCode问题的多种编程语言解决方案。这些解决方案由社区成员贡献，可用于学习不同思路和比较语言实现。开源项目遵循开源协议，允许自由使用和修改代码，鼓励知识共享。本文还强调了学习算法
C#托管类型与非托管类型简析 _DRAGON__XU C#c#开发语言
C#托管类型与非托管类型定义托管对象指的是.net可以自动进行回收的资源，主要是指托管对象在堆上分配的内存资源。托管资源的回收工作是不需要人工干预的，有.net运行库在合适的时间进行回收。当然，也可以使用GC.Collect手动回收。非托管对象指.net不知道如何回收的资源。例如文件、窗口、网络连接、数据库连接、画刷、图标等。这类资源，垃圾回收器在清理的时候会调用Object.Finalize()
QT 3D渲染技术详解 QT性能优化QT原理源码QT界面美化 qt 3d qt6.3 qt5 c++QT教程
QT3D渲染技术详解使用AI技术辅助生成QT界面美化视频课程QT性能优化视频课程QT原理与源码分析视频课程QTQMLC++扩展开发视频课程免费QT视频课程您可以看免费1000+个QT技术视频免费QT视频课程QT统计图和QT数据可视化视频免费看免费QT视频课程QT性能优化视频免费看免费QT视频课程QT界面美化视频免费看1QT_3D渲染技术概述1.13D渲染技术简介1.1.13D渲染技术简介3D渲染技
Qt QOpenGLFunctions详解码农客栈_V13427279549 Qt qt
1.概述QOpenGLFunctions是Qt提供的一个工具类，用于封装OpenGL的函数调用。它使得在Qt应用程序中使用OpenGL更加方便和安全，同时提供了跨平台的兼容性。通过继承QOpenGLFunctions，开发者可以轻松地访问OpenGL的核心功能，而无需直接调用原生的OpenGLAPI。QOpenGLFunctions提供了大量封装的OpenGL函数，这些函数与OpenGL的原生函数
多线程编程之卫生间周凡杨 java 并发卫生间线程厕所
如大家所知，火车上车厢的卫生间很小，每次只能容纳一个人，一个车厢只有一个卫生间，这个卫生间会被多个人同时使用，在实际使用时，当一个人进入卫生间时则会把卫生间锁上，等出来时打开门，下一个人进去把门锁上，如果有一个人在卫生间内部则别人的人发现门是锁的则只能在外面等待。问题分析：首先问题中有两个实体，一个是人，一个是厕所，所以设计程序时就可以设计两个类。人是多数的，厕所只有一个（暂且模拟的是一个车厢）。
How to Install GUI to Centos Minimal sunjing linux Install Desktop GUI
http://www.namhuy.net/475/how-to-install-gui-to-centos-minimal.html I have centos 6.3 minimal running as web server. I’m looking to install gui to my server to vnc to my server. You can insta
Shell 函数 daizj shell 函数
Shell 函数 linux shell 可以用户定义函数，然后在shell脚本中可以随便调用。 shell中函数的定义格式如下： [function] funname [()]{ action; [return int;] } 说明： 1、可以带function fun() 定义，也可以直接fun() 定义,不带任何参数。 2、参数返回
Linux服务器新手操作之一周凡杨 Linux 简单操作
1.whoami 当一个用户登录Linux系统之后，也许他想知道自己是发哪个用户登录的。此时可以使用whoami命令。 [ecuser@HA5-DZ05 ~]$ whoami e
浅谈Socket通信（一）朱辉辉33 socket
在java中ServerSocket用于服务器端，用来监听端口。通过服务器监听，客户端发送请求，双方建立链接后才能通信。当服务器和客户端建立链接后，两边都会产生一个Socket实例，我们可以通过操作Socket来建立通信。首先我建立一个ServerSocket对象。当然要导入java.net.ServerSocket包 ServerSock
关于框架的简单认识西蜀石兰框架
入职两个月多，依然是一个不会写代码的小白，每天的工作就是看代码，写wiki。前端接触CSS、HTML、JS等语言，一直在用的CS模型，自然免不了数据库的链接及使用，真心涉及框架，项目中用到的BootStrap算一个吧，哦，JQuery只能算半个框架吧，我更觉得它是另外一种语言。后台一直是纯Java代码，涉及的框架是Quzrtz和log4j。都说学前端的要知道三大框架，目前node.
You have an error in your SQL syntax; check the manual that corresponds to your 林鹤霄
You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'option,changed_ids ) values('0ac91f167f754c8cbac00e9e3dc372
MySQL5.6的my.ini配置 aigo mysql
注意：以下配置的服务器硬件是：8核16G内存 [client] port=3306 [mysql] default-character-set=utf8 [mysqld] port=3306 basedir=D:/mysql-5.6.21-win
mysql 全文模糊查找便捷解决方案 alxw4616 mysql
mysql 全文模糊查找便捷解决方案 2013/6/14 by 半仙 [email protected] 目的: 项目需求实现模糊查找. 原则: 查询不能超过 1秒. 问题: 目标表中有超过1千万条记录. 使用like '%str%' 进行模糊查询无法达到性能需求. 解决方案: 使用mysql全文索引. 1.全文索引 : MySQL支持全文索引和搜索功能。MySQL中的全文索
自定义数据结构链表(单项 ,双向,环形) 百合不是茶单项链表双向链表
链表与动态数组的实现方式差不多, 数组适合快速删除某个元素链表则可以快速的保存数组并且可以是不连续的单项链表;数据从第一个指向最后一个实现代码: //定义动态链表 clas
threadLocal实例 bijian1013 java thread java多线程 threadLocal
实例1： package com.bijian.thread; public class MyThread extends Thread { private static ThreadLocal tl = new ThreadLocal() { protected synchronized Object initialValue() { return new Inte
activemq安全设置—设置admin的用户名和密码 bijian1013 java activemq
ActiveMQ使用的是jetty服务器, 打开conf/jetty.xml文件，找到 <bean id="adminSecurityConstraint" class="org.eclipse.jetty.util.security.Constraint"> <p
【Java范型一】Java范型详解之范型集合和自定义范型类 bit1129 java
本文详细介绍Java的范型，写一篇关于范型的博客原因有两个，前几天要写个范型方法(返回值根据传入的类型而定)，竟然想了半天，最后还是从网上找了个范型方法的写法；再者，前一段时间在看Gson, Gson这个JSON包的精华就在于对范型的优雅简单的处理，看它的源代码就比较迷糊，只其然不知其所以然。所以，还是花点时间系统的整理总结下范型吧。范型内容范型集合类范型类
【HBase十二】HFile存储的是一个列族的数据 bit1129 hbase
在HBase中，每个HFile存储的是一个表中一个列族的数据，也就是说，当一个表中有多个列簇时，针对每个列簇插入数据，最后产生的数据是多个HFile，每个对应一个列族，通过如下操作验证 1. 建立一个有两个列族的表 create 'members','colfam1','colfam2' 2. 在members表中的colfam1中插入50*5
Nginx 官方一个配置实例 ronin47 nginx 配置实例
user www www; worker_processes 5; error_log logs/error.log; pid logs/nginx.pid; worker_rlimit_nofile 8192; events { worker_connections 4096;} http { include conf/mim
java-15.输入一颗二元查找树，将该树转换为它的镜像，即在转换后的二元查找树中，左子树的结点都大于右子树的结点。用递归和循环 bylijinnan java
//use recursion public static void mirrorHelp1(Node node){ if(node==null)return; swapChild(node); mirrorHelp1(node.getLeft()); mirrorHelp1(node.getRight()); } //use no recursion bu
返回null还是empty bylijinnan java apache spring 编程
第一个问题，函数是应当返回null还是长度为0的数组（或集合）？第二个问题，函数输入参数不当时，是异常还是返回null？先看第一个问题有两个约定我觉得应当遵守： 1.返回零长度的数组或集合而不是null（详见《Effective Java》）理由就是，如果返回empty，就可以少了很多not-null判断： List<Person> list
[科技与项目]工作流厂商的战略机遇期 comsci 工作流
在新的战略平衡形成之前，这里有一个短暂的战略机遇期，只有大概最短6年，最长14年的时间，这段时间就好像我们森林里面的小动物，在秋天中，必须抓紧一切时间存储坚果一样，否则无法熬过漫长的冬季。。。。在微软，甲骨文，谷歌，IBM,SONY
过度设计-举例 cuityang 过度设计
过度设计，需要更多设计时间和测试成本，如无必要，还是尽量简洁一些好。未来的事情，比如访问量，比如数据库的容量，比如是否需要改成分布式都是无法预料的再举一个例子，对闰年的判断逻辑：　　1、 if($Year%4==0) return True; else return Fasle; 　　2、if ( ($Year%4==0 &am
java进阶，《Java性能优化权威指南》试读 darkblue086 java性能优化
记得当年随意读了微软出版社的.NET 2.0应用程序调试，才发现调试器如此强大，应用程序开发调试其实真的简单了很多，不仅仅是因为里面介绍了很多调试器工具的使用，更是因为里面寻找问题并重现问题的思想让我震撼，时隔多年，Java已经如日中天，成为许多大型企业应用的首选，而今天，这本《Java性能优化权威指南》让我再次找到了这种感觉，从不经意的开发过程让我刮目相看，原来性能调优不是简单地看看热点在哪里，
网络学习笔记初识OSI七层模型与TCP协议 dcj3sjt126com 学习笔记
协议：在计算机网络中通信各方面所达成的、共同遵守和执行的一系列约定　　计算机网络的体系结构：计算机网络的层次结构和各层协议的集合。　　两类服务：　　面向连接的服务通信双方在通信之前先建立某种状态，并在通信过程中维持这种状态的变化，同时为服务对象预先分配一定的资源。这种服务叫做面向连接的服务。　　面向无连接的服务通信双方在通信前后不建立和维持状态，不为服务对象
mac中用命令行运行mysql dcj3sjt126com mysql linux mac
参考这篇博客：http://www.cnblogs.com/macro-cheng/archive/2011/10/25/mysql-001.html 感觉workbench不好用（有点先入为主了）。 1，安装mysql 在mysql的官方网站下载 mysql 5.5.23 http://www.mysql.com/downloads/mysql/，根据我的机器的配置情况选择了64
MongDB查询（1）——基本查询[五] eksliang mongodb mongodb 查询 mongodb find
MongDB查询转载请出自出处：http://eksliang.iteye.com/blog/2174452 一、find简介 MongoDB中使用find来进行查询。 API:如下 function ( query , fields , limit , skip, batchSize, options ){.....} 参数含义： query:查询参数 fie
base64，加密解密经融加密，对接 y806839048 经融加密对接
String data0 = new String(Base64.encode(bo.getPaymentResult().getBytes(("GBK")))); String data1 = new String(Base64.decode(data0.toCharArray()),"GBK"); // 注意编码格式，注意用于加密，解密的要是同
JavaWeb之JSP概述 ihuning javaweb
什么是JSP？为什么使用JSP？ JSP表示Java Server Page，即嵌有Java代码的HTML页面。使用JSP是因为在HTML中嵌入Java代码比在Java代码中拼接字符串更容易、更方便和更高效。 JSP起源在很多动态网页中，绝大部分内容都是固定不变的，只有局部内容需要动态产生和改变。如果使用Servl
apple watch 指南啸笑天 apple
1. 文档 WatchKit Programming Guide（中译在线版 By @CocoaChina）译文译者原文概览 - 开始为 Apple Watch 进行开发 @星夜暮晨 Overview - Developing for Apple Watch 概览 - 配置 Xcode 项目 - Overview - Configuring Yo
java经典的基础题目 macroli java 编程
1.列举出 10个JAVA语言的优势 a:免费，开源，跨平台(平台独立性)，简单易用，功能完善，面向对象，健壮性，多线程，结构中立，企业应用的成熟平台, 无线应用 2.列举出JAVA中10个面向对象编程的术语 a:包，类，接口，对象，属性，方法，构造器，继承，封装，多态，抽象，范型 3.列举出JAVA中6个比较常用的包 Java.lang;java.util;java.io;java.sql;ja
你所不知道神奇的js replace正则表达式 qiaolevip 每天进步一点点学习永无止境纵观千象 regex
var v = 'C9CFBAA3CAD0'; console.log(v); var arr = v.split(''); for (var i = 0; i < arr.length; i ++) { if (i % 2 == 0) arr[i] = '%' + arr[i]; } console.log(arr.join('')); console.log(v.r
[一起学Hive]之十五-分析Hive表和分区的统计信息(Statistics) superlxw1234 hive hive分析表 hive统计信息 hive Statistics
关键字：Hive统计信息、分析Hive表、Hive Statistics 类似于Oracle的分析表，Hive中也提供了分析表和分区的功能，通过自动和手动分析Hive表，将Hive表的一些统计信息存储到元数据中。表和分区的统计信息主要包括：行数、文件数、原始数据大小、所占存储大小、最后一次操作时间等； 14.1 新表的统计信息对于一个新创建
Spring Boot 1.2.5 发布 wiselyman spring boot
Spring Boot 1.2.5已在7月2日发布，现在可以从spring的maven库和maven中心库下载。这个版本是一个维护的发布版，主要是一些修复以及将Spring的依赖提升至4.1.7(包含重要的安全修复)。官方建议所有的Spring Boot用户升级这个版本。项目首页 | 源

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他