SmartLychee

GAN（生成对抗网络）在合成时间序列数据中的应用

（本文基本是对Jansen 的《Machine Learning for Algorithmic Trading》第二版的第21章进行翻译、学习和梳理，此项为课程作业，以此形式进行记录和自我学习）

利用GAN生成合成时间序列数据，所面临的挑战要大于利用GAN生成合成图片。除了要学习每个给定点分布（如某个时间戳上股票价格的分布），GAN还需要学习时间动力学——这种动力学是两个序列相关性背后的驱动力。

Yoon等人在2019年12月介绍了一种新颖的时间序列生成对抗网络(TimeGAN)框架，这种框架同时结合了监督学习和无监督学习，以解释时间上的相关性。这个模型在学习时间序列的内在空间(a time-series embedding space)时，同时对监督学习和对抗训练这两个目标进行优化。这能够使模型能够在对历史数据采样的同时，也能观测到其中的动力学(dynamics observed)。模型的作者将许多时间序列（如股票价格）用于测试模型，结果发现合成数据的质量要好于许多其他的数据。

本文在于展示TimeGAN的工作方式以及关键的实施步骤。

1. TimeGAN文章的摘要与介绍

在Yoon等人的研究发表之前，将GAN作为生成序列数据的方法的研究，都没有对“时间上的动力学”(temporal dynamics,即序列的自相关性)给予足够的重视，而一般的作为解决预测问题的监督学习算法，则天然具有确定性(inherently deterministic)。因此对两种框架取其精华弃其糟粕，则是Yoon等人创新的地方。在文章中，Yoon等人结合了非监督学习的范式灵活的特点和监督学习对于训练过程控制力强的性质，让TimeGAN模型能够把“时间上的动力学”考虑进模型中。

具体而言，序列相关性作为时间序列数据的一种内在性质，对以生成时间序列为目的生成模型提出了一个很大的挑战。一个好的生成模型不仅应该学习到每个时间戳上的特征分布(distributiions of features within each time point)，而且还应该学习到不同时点之间变量间的潜在复杂关系(potentially complex dynamics of those variables across time)。用数学的语言表达，就是说如果现在需要对一个序列数据 $\textbf{X}_{1:T} = (\textbf{X}_1,\cdots,\textbf{X}_T)$ 进行建模，那么我们希望模型能够准确地学习到 $p(\textbf{X}_t|\textbf{X}_{1:t-1})$ 这一条件分布，而且随着时间的流逝，模型也应该保持优秀的学习能力。

一方面，有大量的工作专注于使用自回归模型去拟合“时间上的动力学”。虽说自回归模型明确地将序列的分布划入了条件分布的乘积( $\prod_tp(X_t|X_{1:T})$ )中，而且在解决预测问题上，自相关模型也算有用。但是，归根到底，自相关模型是天然确定性(fundamentally deterministic)的，而且自相关模型并不具备生成性，因为自相关模型的输入是有条件的，它的输入必须是有意义的真实数据。而一个好的生成模型，必须要能够做到自己动手丰衣足食，即使输入是随机噪声，生成模型也能够生成高质量的合成数据。

另一方面，许多研究致力于将GAN的框架直接用于序列数据的生成，这些研究的想法多是以RGANs作为生成器和判别器。然而，这些GAN的对抗训练，仅仅在于直接对 $p(\textbf{X}_{1:T})$ 建模,而不考虑“时间上的动力学”。总之，RGANs的做法是每个时点的特征分布建模，相应的，其loss也仅仅是简单的将每个时点的loss相加，这种训练方法是不足以捕获序列相关性的。

在文章中，Yoon等人结合了上述两条技术路线的优点，并在此基础上提出了一个包含“时间上的动力学”的生成模型——TimeGAN。这个模型的特点：

除了基于真实和合成数据的无监督学习的对抗loss之外，作者引入了步进的(stepwise)、基于真实数据的监督学习的loss，因此模型捕获“时间上的动力学”的这一目标便变得十分明确。因为真实数据的信息是1+1>2的效果，整个数据序列所具有的信息要比单个数据具有的信息之和更大，使用基于真实数据的loss能够有效利用潜藏于真实数据序列下的信息。
这个模型引入了一个“内在网络”(embedding network)以提供特征(features)和潜在模式(latent representations)之间的可逆映射，这使得对抗训练需要学习的参数空间的维度得到削减（降维处理）。这个降维的思路来自于这个事实——尽管系统，也就是时间戳上单个特征的分布，可能是十分复杂的，但序列相关性的复杂程度可能远远低于系统的复杂程度（原文为“‘时间上的动力学’背后的驱动因子的空间维度可能并不高”）。而模型中监督学习的loss最小化是同时基于内在网络和生成网络的训练的，因此隐藏空间(latent space)的任务就不仅仅是提升参数的有效性，它同时也肩负着督促生成器学习序列相关性这一使命。

在定性上，这一模型利用t-SNE和PCA分析，将生成数据对原始数据分布的模拟程度进行可视化，用以在定性上评价模型的好坏。在定量上，作者利用post-hoc(事后检验)对合成数据和真实数据进行区分以验证模型好坏。文章的最后，作者还用利用TSTR(train on synthetic,test on real)的框架，用以评价生成数据的质量。结论是，TimeGAN在生成时间序列数据这一领域达到了顶级水平。

2. 让模型学习如何通过特征和时间生成数据

2.1 TIMEGAN的结构

TimeGAN的关键组成部分是生成器和内在网络，两者都直接关系到loss的最小化过程。而loss则用以衡量模型在学习动力学关系上达到了多“好”的程度。因此，模型会以促进生成器学习序列相关性为条件去学习潜在空间(latent space,也就是真实数据背后的驱动力)。

上图阐明了TimeGAN的两个网络及其所包含的四个部分

自编码器：含有内在和复现网络(embedding and recovery networks)
对抗网络：包含序列生成器和序列判别器

TimeGAN的训练是独特的，因为它是一种联合训练，即依靠三个不同的loss function对自编码器和对抗网络进行训练。Reconstruction Loss用于自编码器参数的优化，Unsupervised Loss用于对抗网络参数的优化，而Supervised Loss则是针对于生成器对“时间动力学”的学习。具体来说，自编码器的embedding network致力于创造出潜在空间，而对抗网络则在潜在空间里进行操作，最后Supervised Loss则要让合成数据的“时间上的动力学”尽可能地向真实数据的“时间上的动力学”靠拢。

自编码器实现的是特征空间和潜在空间之间的可逆映射，它的作用就是让对抗网络能够在更小维度的空间中学习“时间上的动力学”。

而TimeGAN中对抗网络不同于DCGANs的地方有两个

TimeGAN的对抗网络所需要生成的是时间序列数据，而不是图片。
对抗网络要学习的对象——潜在空间不是静止的，而是随着学习过程动态变化的，因为潜在空间是由自编码器的内在网络生成的，随着合成序列的生成，自编码器也在学习，故它所创造的潜在空间也会变化。

2.2 自编码器和对抗网络的联合训练

具体来说，三个loss的具体工作是

Reconstruction Loss是自编码器的Loss，我们知道，自编码器是对输入数据进行表示学习(representation learning)，因此Reconstruction Loss实际上是表示自编码器对输入数据的内在模式的掌握程度，也就是自编码器编的码到底有多好。
Unsupervised Loss反映的是生成器和判别器的竞争对抗互动。
Supervised Loss反映的是生成器生成的数据能够在多大程度上逼近真实数据经过自编码编码后的数据。

因此训练的进行要有三个阶段

利用真实时间序列数据训练自编码器以优化重构过程。
利用真实时间序列数据优化supervised loss以捕获历史数据中的“时间上的动力学”
联合训练

3. 利用Tensorflow实现TimeGAN

构建和训练TimeGAN需要以下几个步骤：

选择并准备真实的时间序列输入和随机的时间序列输入
创建TimeGAN模型的关键组成部分
定义用于训练阶段的loss function和训练步骤
执行训练循环，并储存结果
利用训练好的模型生成合成时间序列数据并评估输出的结果

Original code author: Jinsung Yoon

初始阶段

import warnings
warnings.filterwarnings('ignore')
import pandas as pd
import numpy as np
from sklearn.preprocessing import MinMaxScaler
import tensorflow as tf
from pathlib import Path #导入路径处理库
from tqdm import tqdm

from tensorflow.keras.models import Sequential, Model
from tensorflow.keras.layers import GRU, Dense, RNN, GRUCell, Input
from tensorflow.keras.losses import BinaryCrossentropy, MeanSquaredError
from tensorflow.keras.optimizers import Adam
from tensorflow.keras.callbacks import TensorBoard
from tensorflow.keras.utils import plot_model

import matplotlib.pyplot as plt
import seaborn as sns
gpu_devices = tf.config.experimental.list_physical_devices('GPU')
if gpu_devices:
    print('Using GPU')
    tf.config.experimental.set_memory_growth(gpu_devices[0], True)
else:
    print('Using CPU')
sns.set_style('white')
#试验路径
results_path = Path('time_gan')
if not results_path.exists():
    results_path.mkdir()
experiment = 0
log_dir = results_path / f'experiment_{experiment:02}'
if not log_dir.exists():
    log_dir.mkdir(parents=True)
hdf_store = results_path / 'TimeSeriesGAN.h5'

#数据准备
#参数设置
seq_len = 24
n_seq = 6
batch_size = 128
tickers = ['BA', 'CAT', 'DIS', 'GE', 'IBM', 'KO']
#此处数据来源于Quandl community，在2018年已经停用了，所以这里实际上使用的是历史数据
def select_data():
    df = (pd.read_hdf('../data/assets.h5', 'quandl/wiki/prices')
          .adj_close #经过调整的价格
          .unstack('ticker')
          .loc['2000':, tickers]
          .dropna())
    df.to_hdf(hdf_store, 'data/real')
select_data()

#画图
df = pd.read_hdf(hdf_store, 'data/real')
axes = df.div(df.iloc[0]).plot(subplots=True,
                               figsize=(14, 6),
                               layout=(3, 2),
                               title=tickers,
                               legend=False,
                               rot=0,
                               lw=1, 
                               color='k')
for ax in axes.flatten():
    ax.set_xlabel('')

plt.suptitle('Normalized Price Series')
plt.gcf().tight_layout()
sns.despine();

#将数据进行标准化处理
scaler = MinMaxScaler()
scaled_data = scaler.fit_transform(df).astype(np.float32)
#创建滚动窗口序列 
data = []
for i in range(len(df) - seq_len):
    data.append(scaled_data[i:i + seq_len])

n_windows = len(data)
#创建tf.data.Dataset
real_series = (tf.data.Dataset
               .from_tensor_slices(data)
               .shuffle(buffer_size=n_windows)
               .batch(batch_size))
real_series_iter = iter(real_series.repeat())
#设置随机序列生成器
def make_random_data():
    while True:
        yield np.random.uniform(low=0, high=1, size=(seq_len, n_seq))
#我们使用 Python 生成器来提供一个 tf.data.Dataset，它会根据需要继续调用随机数生成器并生成所需的批量大小。 
random_series = iter(tf.data.Dataset
                     .from_generator(make_random_data, output_types=tf.float32)
                     .batch(batch_size)
                     .repeat())

TimeGAN模型的组成部分

#网络参数
hidden_dim = 24
num_layers = 3

在这段代码里将其设计的非常简单，并且对四个组成部分都使用了一个非常相似的架构（看下方代码）；但在实际的应用中，这些架构设计应当根据数据的实际情况进行定制修改。

def make_rnn(n_layers, hidden_units, output_units, name):
    return Sequential([GRU(units=hidden_units,
                           return_sequences=True,
                           name=f'GRU_{i + 1}') for i in range(n_layers)] +
                      [Dense(units=output_units,
                             activation='sigmoid',
                             name='OUT')], name=name)
#自编码器：内在和复现网络（Embedder & Recovery）
embedder = make_rnn(n_layers=3, 
                    hidden_units=hidden_dim, 
                    output_units=hidden_dim, 
                    name='Embedder')
recovery = make_rnn(n_layers=3, 
                    hidden_units=hidden_dim, 
                    output_units=n_seq, 
                    name='Recovery')
#生成器和判别器（Generator & Discriminator）
generator = make_rnn(n_layers=3, 
                     hidden_units=hidden_dim, 
                     output_units=hidden_dim, 
                     name='Generator')
discriminator = make_rnn(n_layers=3, 
                         hidden_units=hidden_dim, 
                         output_units=1, 
                         name='Discriminator')
supervisor = make_rnn(n_layers=2, 
                      hidden_units=hidden_dim, 
                      output_units=hidden_dim, 
                      name='Supervisor')

TimeGAN的训练

#设置
train_steps = 10000
gamma = 1
#通用损失函数 
mse = MeanSquaredError()
bce = BinaryCrossentropy()

一、自编码器的训练

H = embedder(X)
X_tilde = recovery(H)

autoencoder = Model(inputs=X,
                    outputs=X_tilde,
                    name='Autoencoder')
#自编码器训练步骤
@tf.function
def train_autoencoder_init(x):
    with tf.GradientTape() as tape:
        x_tilde = autoencoder(x)
        embedding_loss_t0 = mse(x, x_tilde)
        e_loss_0 = 10 * tf.sqrt(embedding_loss_t0)

    var_list = embedder.trainable_variables + recovery.trainable_variables
    gradients = tape.gradient(e_loss_0, var_list)
    autoencoder_optimizer.apply_gradients(zip(gradients, var_list))
    return tf.sqrt(embedding_loss_t0)
#自编码器训练循环
for step in tqdm(range(train_steps)):
    X_ = next(real_series_iter)
    step_e_loss_t0 = train_autoencoder_init(X_)
    with writer.as_default():
        tf.summary.scalar('Loss Autoencoder Init', step_e_loss_t0, step=step)

二、监督训练

#训练步骤
@tf.function
def train_supervisor(x):
    with tf.GradientTape() as tape:
        h = embedder(x)
        h_hat_supervised = supervisor(h)
        g_loss_s = mse(h[:, 1:, :], h_hat_supervised[:, :-1, :])

    var_list = supervisor.trainable_variables
    gradients = tape.gradient(g_loss_s, var_list)
    supervisor_optimizer.apply_gradients(zip(gradients, var_list))
    return g_loss_s
#训练循环
for step in tqdm(range(train_steps)):
    X_ = next(real_series_iter)
    step_g_loss_s = train_supervisor(X_)
    with writer.as_default():
        tf.summary.scalar('Loss Generator Supervised Init', step_g_loss_s, step=step)

三、联合训练（Joint Training）

1、生成器

#对抗性架构--监督（supervised）
E_hat = generator(Z)
H_hat = supervisor(E_hat)
Y_fake = discriminator(H_hat)

adversarial_supervised = Model(inputs=Z,
                               outputs=Y_fake,
                               name='AdversarialNetSupervised')
#在潜在空间（latent space）的对抗性架构
Y_fake_e = discriminator(E_hat)

adversarial_emb = Model(inputs=Z,
                    outputs=Y_fake_e,
                    name='AdversarialNet')
#均值-方差损失
X_hat = recovery(H_hat)
synthetic_data = Model(inputs=Z,
                       outputs=X_hat,
                       name='SyntheticData')

2、判别器

#架构--实际的数据
Y_real = discriminator(H)
discriminator_model = Model(inputs=X,
                            outputs=Y_real,
                            name='DiscriminatorReal')

#生成器的训练步骤
@tf.function
def train_generator(x, z):
    with tf.GradientTape() as tape:
        y_fake = adversarial_supervised(z)
        generator_loss_unsupervised = bce(y_true=tf.ones_like(y_fake),
                                          y_pred=y_fake)

        y_fake_e = adversarial_emb(z)
        generator_loss_unsupervised_e = bce(y_true=tf.ones_like(y_fake_e),
                                            y_pred=y_fake_e)
        h = embedder(x)
        h_hat_supervised = supervisor(h)
        generator_loss_supervised = mse(h[:, 1:, :], h_hat_supervised[:, 1:, :])

        x_hat = synthetic_data(z)
        generator_moment_loss = get_generator_moment_loss(x, x_hat)

        generator_loss = (generator_loss_unsupervised +
                          generator_loss_unsupervised_e +
                          100 * tf.sqrt(generator_loss_supervised) +
                          100 * generator_moment_loss)

    var_list = generator.trainable_variables + supervisor.trainable_variables
    gradients = tape.gradient(generator_loss, var_list)
    generator_optimizer.apply_gradients(zip(gradients, var_list))
    return generator_loss_unsupervised, generator_loss_supervised, generator_moment_loss

#内在网络（embedding）的训练步骤
@tf.function
def train_embedder(x):
    with tf.GradientTape() as tape:
        h = embedder(x)
        h_hat_supervised = supervisor(h)
        generator_loss_supervised = mse(h[:, 1:, :], h_hat_supervised[:, 1:, :])

        x_tilde = autoencoder(x)
        embedding_loss_t0 = mse(x, x_tilde)
        e_loss = 10 * tf.sqrt(embedding_loss_t0) + 0.1 * generator_loss_supervised

    var_list = embedder.trainable_variables + recovery.trainable_variables
    gradients = tape.gradient(e_loss, var_list)
    embedding_optimizer.apply_gradients(zip(gradients, var_list))
    return tf.sqrt(embedding_loss_t0)

#判别器的训练步骤
@tf.function
def get_discriminator_loss(x, z):
    y_real = discriminator_model(x)
    discriminator_loss_real = bce(y_true=tf.ones_like(y_real),
                                  y_pred=y_real)

    y_fake = adversarial_supervised(z)
    discriminator_loss_fake = bce(y_true=tf.zeros_like(y_fake),
                                  y_pred=y_fake)

    y_fake_e = adversarial_emb(z)
    discriminator_loss_fake_e = bce(y_true=tf.zeros_like(y_fake_e),
                                    y_pred=y_fake_e)
    return (discriminator_loss_real +
            discriminator_loss_fake +
            gamma * discriminator_loss_fake_e)
@tf.function
def train_discriminator(x, z):
    with tf.GradientTape() as tape:
        discriminator_loss = get_discriminator_loss(x, z)

    var_list = discriminator.trainable_variables
    gradients = tape.gradient(discriminator_loss, var_list)
    discriminator_optimizer.apply_gradients(zip(gradients, var_list))
    return discriminator_loss

#训练循环
step_g_loss_u = step_g_loss_s = step_g_loss_v = step_e_loss_t0 = step_d_loss = 0
for step in range(train_steps):
    # Train generator (twice as often as discriminator)
    for kk in range(2):
        X_ = next(real_series_iter)
        Z_ = next(random_series)

        # Train generator
        step_g_loss_u, step_g_loss_s, step_g_loss_v = train_generator(X_, Z_)
        # Train embedder
        step_e_loss_t0 = train_embedder(X_)

    X_ = next(real_series_iter)
    Z_ = next(random_series)
    step_d_loss = get_discriminator_loss(X_, Z_)
    if step_d_loss > 0.15:
        step_d_loss = train_discriminator(X_, Z_)

    if step % 1000 == 0:
        print(f'{step:6,.0f} | d_loss: {step_d_loss:6.4f} | g_loss_u: {step_g_loss_u:6.4f} | '
              f'g_loss_s: {step_g_loss_s:6.4f} | g_loss_v: {step_g_loss_v:6.4f} | e_loss_t0: {step_e_loss_t0:6.4f}')

    with writer.as_default():
        tf.summary.scalar('G Loss S', step_g_loss_s, step=step)
        tf.summary.scalar('G Loss U', step_g_loss_u, step=step)
        tf.summary.scalar('G Loss V', step_g_loss_v, step=step)
        tf.summary.scalar('E Loss T0', step_e_loss_t0, step=step)
        tf.summary.scalar('D Loss', step_d_loss, step=step)

生成合成时间序列数据

generated_data = []
for i in range(int(n_windows / batch_size)):
    Z_ = next(random_series)
    d = synthetic_data(Z_)
    generated_data.append(d)

#绘制样本序列
fig, axes = plt.subplots(nrows=3, ncols=2, figsize=(14, 7))
axes = axes.flatten()

index = list(range(1, 25))
synthetic = generated_data[np.random.randint(n_windows)]

idx = np.random.randint(len(df) - seq_len)
real = df.iloc[idx: idx + seq_len]

for j, ticker in enumerate(tickers):
    (pd.DataFrame({'Real': real.iloc[:, j].values,
                   'Synthetic': synthetic[:, j]})
     .plot(ax=axes[j],
           title=ticker,
           secondary_y='Synthetic', style=['-', '--'],
           lw=1))
sns.despine()
fig.tight_layout()

CESM1.2.1移植使用说明 ༊.枕星＇听光.ঌ 人工智能 linux
文章目录概述环境配置cesm1_2_1配置部分环境软件压缩包改变CLM陆面模式结果文件的输出变量、特征值及频率小结概述记录用户如何在Linux系统上移植CESM1.2.1模型，并且使用CLM4.5模式创建并单点模拟算例I_2000_CLM45。环境配置1.更新系统软件源2.更新系统安装软件安装git、make、python等。3.安装MPI(openmpi4.1.5)//下载并解压进入文件夹wge
模型的秘密武器：利用注意力改善长上下文推理能力步子哥人工智能自然语言处理深度学习语言模型
【导语】在大语言模型（LLM）不断刷新各项任务记录的今天，很多模型宣称能处理超长上下文内容，但在实际推理过程中，复杂问题往往因隐性事实的遗漏而败下阵来。今天，我们就以《AttentionRevealsMoreThanTokens:Training-FreeLong-ContextReasoningwithAttention-guidedRetrieval》为蓝本，带大家通俗解读如何利用Transf
llamaindex实现企业级RAG应用（一）弈秋001 transformer 自然语言处理深度学习人工智能
在上一篇文章中使用Qwen2进行RAG代码实践，手动实现了一版简易的RAG应用，在实际工作中通常都用会使用langchain或llamaindex架构来搭建rag应用，并且会非常复杂。RAG是个很神奇的应用，可以很简单，也可以很复杂。在llamaindex官网给的案例，5行代码就可以构建RAG应用，但要真正实现企业级RAG应用，则需要花费大量时间去调优。本文通过一个复杂的项目案例，记录下工作中常用
深度学习-服务器训练SparseDrive过程记录 weixin_40826634 深度学习服务器人工智能
1、cuda安装1.1卸载安装失败的cuda参考：https://blog.csdn.net/weixin_40826634/article/details/127493809注意：因为/usr/local/cuda-xx.x/bin/下没有卸载脚本，很可能是apt安装的，所以通过执行下面的命令删除：apt-get--purgeremove"cuda*"apt-getautoremove然后执行f
算法在各领域的广泛应用：100 个实例全解析软件职业规划 AI&模型算法
一、互联网与信息技术领域搜索引擎算法：如谷歌的PageRank算法，用于根据网页的重要性和相关性对搜索结果进行排序，帮助用户快速找到所需信息。推荐系统算法：例如亚马逊和Netflix使用的协同过滤算法。根据用户的历史行为（购买、观看记录等）和其他相似用户的偏好，为用户推荐可能感兴趣的产品或内容。社交网络分析算法：用于分析社交网络中的用户关系，如Facebook通过算法发现用户的好友推荐、社区划分等
匿名内部类 qq_52983535 JAVA java 开发语言
匿名内部类接口的匿名内部类继承的匿名内部类匿名内部类在日常编写代码的过程中，总是会遇到匿名内部类的使用，但是对这一块一直不是很熟，所以这里总结记录一下。只讲实用。接口的匿名内部类正常如果要使用一个接口，如下代码：publicinterfaceKp{publicabstractvoidshow();}publicclassKpImplimplementsKp{@Overridepublicvoids
JVM汇总篇 xk_一步一步来 JVM JVM汇总篇
转自：https://blog.csdn.net/wolf_love666/article/details/85712922书中内容来自于深入理解java虚拟机，作者周志明。会融合自己的知识和理解来记录下来，为了赚钱而奋斗！DayDayUp!!!前期准备：准备篇（一）内存管理内存如何划分、内存溢出的原因----点击这里内存分配和垃圾回收-----点击这里（二）虚拟机如何执行数据存储和访问（类文件结
【2025年37期免费获取股票数据API接口】实例演示五种主流语言获取股票行情api接口之沪深指数实时数据获取实例演示及接口API说明文档不会写代码的码农农 python java 开发语言股票api 股票数据股票数据接口
在近一至两年期间，股票量化分析逐步成为备受关注的热门议题。对于投身于该领域工作而言，首要步骤便是获取全面且精准的股票数据。无论是实时交易数据、历史交易记录、财务数据，亦或是基本面信息，这些数据均是开展量化分析过程中不可或缺的宝贵资源。我们的核心任务在于从这些数据中提炼出具有价值的信息，从而为投资策略提供坚实有力的指导。在数据探索进程中，我尝试运用了多种方法，涵盖自编网易股票页面爬虫程序、申万行业数
HarmonyOS 实战开发 —— 基于HMRouter的路由跳转方案 CTrup 鸿蒙开发 HarmonyOS 移动开发 harmonyos 组件化移动开发鸿蒙开发 ArkUI HMRouter 组件化路由
往期笔录记录：鸿蒙（HarmonyOS）北向开发知识点记录~鸿蒙（OpenHarmony）南向开发保姆级知识点汇总~鸿蒙应用开发与鸿蒙系统开发哪个更有前景？嵌入式开发适不适合做鸿蒙南向开发？看完这篇你就了解了~对于大前端开发来说，转鸿蒙开发究竟是福还是祸？鸿蒙岗位需求突增！移动端、PC端、IoT到底该怎么选？记录一场鸿蒙开发岗位面试经历~持续更新中……HMRouter简介HMRouter作为Har
FLASK核心操作之ORM 爬山的小明 Flask Flask ORM
ORM一、概要1、说明ORM，即Object-RelationalMapping（对象关系映射），它的作用是在关系型数据库和业务实体对象之间作一个映射，这样，我们在具体的操作业务对象的时候，就不需要再去和复杂的SQL语句打交道，只需简单的操作对象的属性和方法,2、核心模块SQLAlchemyORM和SQLAlchemyCoreCore是一种构建在表达式语言之上的一种API，一种SQL抽象工具包，允
2025-03-14 学习记录--C/C++-PTA 习题2-1 求整数均值小呀小萝卜儿学习-C/C++学习 c语言
合抱之木，生于毫末；九层之台，起于累土；千里之行，始于足下。一、题目描述⭐️习题2-1求整数均值本题要求编写程序，计算4个整数的和与平均值。题目保证输入与输出均在整型范围内。输入格式:输入在一行中给出4个整数，其间以空格分隔。输出格式:在一行中按照格式“Sum=和;Average=平均值”顺序输出和与平均值，其中平均值精确到小数点后一位。输入样例:1234输出样例:Sum=10;Average=2
438. 找到字符串中所有字母异位词 Zannnne leetcode
438.找到字符串中所有字母异位词题号：力扣438知识点：字符串，滚动窗口目标完成度：59/150总结题干：思路：1.如果s的长度小于p，则s中必然找不到与p是异位词的子串。2.异位词的特点是每个字母出现的次数一直，但是出现的顺序不一定相同。因此我们建立两个容器，来记录p中和滚动窗口中每个字母出现的次数，由于字母一共只有26个，所以容易大小为26。3.第一个for循环相当于是对scount进行初始
DeepSeek API 客户端使用文档老大白菜 python 人工智能数据库
1.简介deep.py是一个用于与DeepSeekAPI交互的Python客户端封装。它提供了简单易用的接口，支持对话历史管理、日志记录等功能，使得与DeepSeekAPI的交互更加便捷和可靠。2.功能特点简单的接口设计自动管理对话历史完整的日志记录灵活的配置选项异常处理机制3.安装依赖pipinstallopenai4.配置环境在项目根目录创建.env文件：#WindowssetDEEPSEEK
我的创作纪念日我爱学习_zwj 前端前端框架华为
机缘在前端开发的广袤天地中，我的创作之旅始于一次充满挑战与机遇的契机。初涉前端领域时，面对复杂多变的项目需求和飞速更新的技术栈，我深刻感受到知识的浩瀚无边，也意识到自身能力的不足。在参与一个大型项目时，我遭遇了许多棘手难题，像页面加载速度的优化、不同浏览器兼容性的处理等。那时，我便产生了一个想法：把在实战中积累的经验以及过去学习的知识记录下来，既能作为自己成长的见证，也能与同行交流分享，携手攻克技
2025-3-14 leetcode刷题情况（贪心算法）肖筱小瀟蓝桥杯 leetcode 贪心算法算法
一、53.最大子序和1.题目描述2.代码3.思路先特殊处理数组只有一个数的情况，再定义两个变量，sum用于记录最大子数组和，count用于记录当前连续子数组的和。使用for循环遍历数组nums中的每个元素。对于每个元素nums[i]，将其累加到count中。每次累加后，使用Math.max函数比较sum和count的大小，将较大值更新到sum中，确保sum始终记录最大子数组和。如果count小于等
吴恩达机器学习笔记复盘（二）监督学习和无监督学习 wgc2k 机器学习机器学习笔记学习
监督学习经济价值以及定义监督学习是机器学习中创造了99%经济价值的类型，它是学习输入到输出映射的算法，关键在于给学习算法提供包含正确答案（即给定输入X的正确标签Y）的学习例子。生活中的例子邮件分类，输入是电子邮件，输出是判断邮件是否为垃圾邮件。语音识别，输入音频剪辑，输出文本记录。机器翻译，输入一种语言文本，输出其他语言的相应翻译。在线广告，输入广告和用户信息，预测用户是否点击广告，为公司带来大量
大模型架构记录7-langchain 处女座_三月 LLM langchain
一Langchain的应用目录：langchain的overviewprompttemplatemodelsandoutputparsers1.什么是langchain,为什么需要langchain?问题：如何没有langchain会怎么样？一个项目可能会包括：调用多个不同的大模型（gpt4,视频生成...)向量数据库数据类型（读取，trunk的切分...)langchain是面于大模型开发的框架
【MyBatis-Plus 进阶功能】开发中常用场景剖析 Yan.love mybatis 后端 java 数据库
MyBatis-Plus（MP）除了封装常见的CRUD操作，还提供了一些高级功能，进一步简化复杂场景下的开发工作。本文将逐一讲解逻辑删除、自动填充、多表关联查询的原理与使用方式，让你快速掌握这些技巧！一、逻辑删除逻辑删除是指在数据库中不直接删除记录，而是通过标记（如is_deleted字段）表示数据是否有效。1.原理与配置逻辑删除是指在数据库中不直接删除记录，而是通过标记（如is_deleted字
(学习总结28)Linux 基本命令3 瞌睡不来学习 linux
Linux基本命令3工具使用命令使用vim编辑器命令vim使用nano文本编辑器命令nano使用gcc/g++编译器命令gcc/g++使用gdb/cgdb调试器命令gdb/cgdb使用自动化构建命令make使用版本控制器命令git系统或进程相关命令读取输入并赋值给变量命令read设置或修改shell环境命令set设置环境变量命令export测试网络连接命令ping显示系统登录记录命令last显示失
Redisson 分布式锁全面解析：锁类型(可重入锁、公平锁、联锁、红锁、读写锁)和锁常见方法解读千层冷面 Redis 分布式
Redisson分布式锁全面解析一、Redisson分布式锁原理Redisson分布式锁基于Redis实现，核心机制如下：Lua脚本保证原子性使用Lua脚本在Redis中执行锁的获取和释放操作，确保多个Redis命令的原子性。可重入锁设计同一线程可重复获取锁，通过计数器记录重入次数，避免死锁。看门狗（Watchdog）自动续期后台线程定期检查锁状态，若锁仍被持有且未完成业务逻辑，则自动延长锁的过期
(nice!!!)(LeetCode 每日一题)3306. 元音辅音字符串计数 II(哈希表、滑动窗口) 岁忧 java版刷题 LeetCode leetcode 散列表 c++java 算法
题目：3306.元音辅音字符串计数II思路：恰好包含k个，可以转换为“至少包含k个”减去“至少包含k+1个”。用哈希表来记录元音字母出现的情况，用滑动窗口来实现符合要求的子字符串出现的数量。基础版：(LeetCode每日一题)3305.元音辅音字符串计数I(暴力枚举||滑动窗口、哈希表)classSolution{public:longlongsolve(stringword,intk){unor
SpringBoot使用@Slf4j注解实现日志输出 pan_junbiao Spring Boot 我の原创 spring boot java spring
日志框架的使用，系列文章：《SpringBoot使用Logback日志框架与综合实例》《SpringBoot使用@Slf4j注解实现日志输出》《Log4j2日志记录框架的使用教程与简单实例》《SpringBoot使用AspectJ实现AOP记录接口：请求日志、响应日志、异常日志》《SpringBoot使用AspectJ的@Around注解实现AOP全局记录接口：请求日志、响应日志、异常日志》@Sl
滑动窗口6：LCR 015. 找到字符串中所有字母异位词南林yan #优选算法算法 leetcode 数据结构
链接：LCR015.找到字符串中所有字母异位词-力扣（LeetCode）题解：本题是一个固定窗口大小的滑动窗口，利用哈希表判断两个字符串是否为字母异位词。先将字符串p记录在哈希表pCount中，再将字符串s的前m个字母记录在哈希表sCount中（m为字符串p长度），这样可以保证一开始的窗口长度就是m，在窗口进行滑动比较前，可以先对sCount和pCount进行比较，窗口滑动后，left和right
laravel中 firstOrNew(), firstOrCreate(), updateOrInsert(), updateOrCreate() 方法的区别和实现原理 Amber_37 laravel php
在Laravel中，firstOrNew,firstOrCreate,updateOrInsert,和updateOrCreate是用于处理数据库记录的常用方法，每个方法有其特定的用途和行为。下面是它们的主要区别和工作原理：1.firstOrNew目的:该方法主要用于查找数据库中与给定属性相匹配的第一条记录，如果找不到，则创建一个新的模型实例（但不会立即保存到数据库）。返回值:返回一个Eloque
mysql 查询后, 不存在则插入记录, 但是在高并发时容易导致重复插入, 有什么解决办法吗 Amber_37 mysql 数据库
在高并发场景下，为了避免因并发请求导致的重复插入问题，可以采用以下几种策略：使用INSERT...ONDUPLICATEKEYUPDATE:利用MySQL提供的ONDUPLICATEKEYUPDATE语句，可以在尝试插入数据时，如果发现唯一键（如主键或唯一索引）冲突，即数据已存在，自动转为执行更新操作。确保无论多少并发请求同时到达，只要涉及的关键字段值相同，只会执行一次插入或更新操作。INSERT
【vue2+elementui】记录el-upload文件上传时调接口传参的几种情况湛海不过深蓝 elementUI vue2 elementui 前端 javascript
文件上传的接口请求头headers:{"Content-Type":"multipart/form-data"},自动上传el-upload上传文件调接口的时候默认会带有一个入参file:原生的file对象无额外入参action属性指定了文件上传的接口地址auto-upload属性：是否在选取文件后立即上传，默认值true所以只要设置了这两属性，文件在选择后（或拖拽到上传区域后）会自动上传到act
Milvus 本地Ollama向量化markdown文件慌雨 milvus 数据库
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言代码测试注意前言提示：这里可以添加本文要记录的大概内容：我在局域网内安装了milvus服务，现在需要把一个文件夹里所有的markdown文档都向量化到milvus数据库中。所用的切分方法是langchain中自带的markdown按照标题切分，且带有标题的metadata，非常清晰。但是用langchain提供的milvu
Maven的安装配置 2301_82243979 作者\/maven java
（注：文章是前段时间写的忘记发了，防止丢失在此记录一下）Maven是Apache下的纯Java开发的开源项目,是一个项目管理工具,使用Maven对项目进行构建,依赖管理。依赖管理就是一个项目中要使用第三方jar包才可以运行。Maven正是对这些jar包进行规范化管理，所以在Maven的项目中只需要在pom.xml中添加jar包的坐标,自动从Maven仓库中下载jar包,运行即可。Maven项目对比
记录：uniapp中sass问题SassError: expected selector. 院人冲冲冲 sass 前端
SassError:expectedselector.看了网上很多方法可以将/deep/改成：::v-deep降低sass-loader版本（我没实现）最后npmuninstallsass-gsass--version'sass'不是内部或外部命令，也不是可运行的程序或批处理文件。以上解决
SQL必知必会40-SQLite：为什么微信用SQLite存储聊天记录？程序员zhi路 MYSQL专栏 sql sqlite jvm
我在上一篇文章中讲了WebSQL，当我们在Chrome、Safari和Firefox等浏览器客户端中使用WebSQL时，会直接操作SQLite。实际上SQLite本身是一个嵌入式的开源数据库引擎，大小只有3M左右，可以将整个SQLite嵌入到应用中，而不用采用传统的客户端／服务器（Client/Server）的架构。这样做的好处就是非常轻便，在许多智能设备和应用中都可以使用SQLite，比如微信就
SAX解析xml文件小猪猪08 xml
1.创建SAXParserFactory实例 2.通过SAXParserFactory对象获取SAXParser实例 3.创建一个类SAXParserHander继续DefaultHandler，并且实例化这个类 4.SAXParser实例的parse来获取文件 public static void main(String[] args) { //
为什么mysql里的ibdata1文件不断的增长？ brotherlamp linux linux运维 linux资料 linux视频 linux运维自学
我们在 Percona 支持栏目经常收到关于 MySQL 的 ibdata1 文件的这个问题。当监控服务器发送一个关于 MySQL 服务器存储的报警时，恐慌就开始了 —— 就是说磁盘快要满了。一番调查后你意识到大多数地盘空间被 InnoDB 的共享表空间 ibdata1 使用。而你已经启用了 innodbfileper_table，所以问题是： ibdata1存了什么？当你启用了 i
Quartz-quartz.properties配置 eksliang quartz
其实Quartz JAR文件的org.quartz包下就包含了一个quartz.properties属性配置文件并提供了默认设置。如果需要调整默认配置，可以在类路径下建立一个新的quartz.properties，它将自动被Quartz加载并覆盖默认的设置。下面是这些默认值的解释 #-----集群的配置 org.quartz.scheduler.instanceName =
informatica session的使用 18289753290 workflow session log Informatica
如果希望workflow存储最近20次的log，在session里的Config Object设置，log options做配置，save session log :sessions run ;savesessio log for these runs:20 session下面的source 里面有个tracing
Scrapy抓取网页时出现CRC check failed 0x471e6e9a != 0x7c07b839L的错误酷的飞上天空 scrapy
Scrapy版本0.14.4 出现问题现象： ERROR: Error downloading <GET http://xxxxx CRC check failed 解决方法 1.设置网络请求时的header中的属性'Accept-Encoding': '*;q=0' 明确表示不支持任何形式的压缩格式，避免程序的解压
java Swing小集锦永夜-极光 java swing
1.关闭窗体弹出确认对话框 1.1 this.setDefaultCloseOperation (JFrame.DO_NOTHING_ON_CLOSE); 1.2 this.addWindowListener ( new WindowAdapter () { public void windo
强制删除.svn文件夹随便小屋 java
在windows上，从别处复制的项目中可能带有.svn文件夹，手动删除太麻烦，并且每个文件夹下都有。所以写了个程序进行删除。因为.svn文件夹在windows上是只读的，所以用File中的delete()和deleteOnExist()方法都不能将其删除，所以只能采用windows命令方式进行删除
GET和POST有什么区别？及为什么网上的多数答案都是错的。 aijuans get post
如果有人问你，GET和POST，有什么区别？你会如何回答？我的经历前几天有人问我这个问题。我说GET是用于获取数据的，POST，一般用于将数据发给服务器之用。这个答案好像并不是他想要的。于是他继续追问有没有别的区别？我说这就是个名字而已，如果服务器支持，他完全可以把G
谈谈新浪微博背后的那些算法 aoyouzi 谈谈新浪微博背后的那些算法
本文对微博中常见的问题的对应算法进行了简单的介绍，在实际应用中的算法比介绍的要复杂的多。当然，本文覆盖的主题并不全，比如好友推荐、热点跟踪等就没有涉及到。但古人云“窥一斑而见全豹”，希望本文的介绍能帮助大家更好的理解微博这样的社交网络应用。微博是一个很多人都在用的社交应用。天天刷微博的人每天都会进行着这样几个操作：原创、转发、回复、阅读、关注、@等。其中，前四个是针对短博文，最后的关注和@则针
Connection reset 连接被重置的解决方法百合不是茶 java 字符流连接被重置
流是java的核心部分,,昨天在做android服务器连接服务器的时候出了问题,就将代码放到java中执行,结果还是一样连接被重置被重置的代码如下; 客户端代码; package 通信软件服务器; import java.io.BufferedWriter; import java.io.OutputStream; import java.io.O
web.xml配置详解之filter bijian1013 java web.xml filter
一.定义 <filter> <filter-name>encodingfilter</filter-name> <filter-class>com.my.app.EncodingFilter</filter-class> <init-param> <param-name>encoding<
Heritrix Bill_chen 多线程 xml 算法制造配置管理
作为纯Java语言开发的、功能强大的网络爬虫Heritrix，其功能极其强大，且扩展性良好，深受热爱搜索技术的盆友们的喜爱，但它配置较为复杂，且源码不好理解，最近又使劲看了下，结合自己的学习和理解，跟大家分享Heritrix的点点滴滴。 Heritrix的下载（http://sourceforge.net/projects/archive-crawler/）安装、配置，就不罗嗦了，可以自己找找资
【Zookeeper】FAQ bit1129 zookeeper
1.脱离IDE，运行简单的Java客户端程序 #ZkClient是简单的Zookeeper~$ java -cp "./:zookeeper-3.4.6.jar:./lib/*" ZKClient 1. Zookeeper是的Watcher回调是同步操作，需要添加异步处理的代码 2. 如果Zookeeper集群跨越多个机房，那么Leader/
The user specified as a definer ('aaa'@'localhost') does not exist 白糖_ localhost
今天遇到一个客户BUG，当前的jdbc连接用户是root，然后部分删除操作都会报下面这个错误：The user specified as a definer ('aaa'@'localhost') does not exist 最后找原因发现删除操作做了触发器，而触发器里面有这样一句 /*!50017 DEFINER = ''aaa@'localhost' */ 原来最初
javascript中showModelDialog刷新父页面 bozch JavaScript 刷新父页面 showModalDialog
在页面中使用showModalDialog打开模式子页面窗口的时候，如果想在子页面中操作父页面中的某个节点，可以通过如下的进行： window.showModalDialog('url',self,‘status...’); // 首先中间参数使用self 在子页面使用w
编程之美-买书折扣 bylijinnan 编程之美
import java.util.Arrays; public class BookDiscount { /**编程之美买书折扣书上的贪心算法的分析很有意思，我看了半天看不懂，结果作者说，贪心算法在这个问题上是不适用的。。下面用动态规划实现。哈利波特这本书一共有五卷，每卷都是8欧元，如果读者一次购买不同的两卷可扣除5%的折扣，三卷10%，四卷20%，五卷
关于struts2.3.4项目跨站执行脚本以及远程执行漏洞修复概要 chenbowen00 struts WEB安全
因为近期负责的几个银行系统软件，需要交付客户，因此客户专门请了安全公司对系统进行了安全评测，结果发现了诸如跨站执行脚本，远程执行漏洞以及弱口令等问题。下面记录下本次解决的过程以便后续 1、首先从最简单的开始处理，服务器的弱口令问题，首先根据安全工具提供的测试描述中发现应用服务器中存在一个匿名用户，默认是不需要密码的，经过分析发现服务器使用了FTP协议，而使用ftp协议默认会产生一个匿名用
[电力与暖气]煤炭燃烧与电力加温 comsci
在宇宙中,用贝塔射线观测地球某个部分,看上去,好像一个个马蜂窝,又像珊瑚礁一样,原来是某个国家的采煤区..... 不过,这个采煤区的煤炭看来是要用完了.....那么依赖将起燃烧并取暖的城市,在极度严寒的季节中...该怎么办呢? &nbs
oracle O7_DICTIONARY_ACCESSIBILITY参数 daizj oracle
O7_DICTIONARY_ACCESSIBILITY参数控制对数据字典的访问.设置为true,如果用户被授予了如select any table等any table权限,用户即使不是dba或sysdba用户也可以访问数据字典.在9i及以上版本默认为false,8i及以前版本默认为true.如果设置为true就可能会带来安全上的一些问题.这也就为什么O7_DICTIONARY_ACCESSIBIL
比较全面的MySQL优化参考 dengkane mysql
本文整理了一些MySQL的通用优化方法，做个简单的总结分享，旨在帮助那些没有专职MySQL DBA的企业做好基本的优化工作，至于具体的SQL优化，大部分通过加适当的索引即可达到效果，更复杂的就需要具体分析了，可以参考本站的一些优化案例或者联系我，下方有我的联系方式。这是上篇。 1、硬件层相关优化 1.1、CPU相关在服务器的BIOS设置中，可
C语言homework2，有一个逆序打印数字的小算法 dcj3sjt126com c
#h1# 0、完成课堂例子 1、将一个四位数逆序打印 1234 ==> 4321 实现方法一： # include <stdio.h> int main(void) { int i = 1234; int one = i%10; int two = i / 10 % 10; int three = i / 100 % 10;
apacheBench对网站进行压力测试 dcj3sjt126com apachebench
ab 的全称是 ApacheBench ，是 Apache 附带的一个小工具，专门用于 HTTP Server 的 benchmark testing ，可以同时模拟多个并发请求。前段时间看到公司的开发人员也在用它作一些测试，看起来也不错，很简单，也很容易使用，所以今天花一点时间看了一下。通过下面的一个简单的例子和注释，相信大家可以更容易理解这个工具的使用。
2种办法让HashMap线程安全 flyfoxs java jdk jni
多线程之--2种办法让HashMap线程安全多线程之--synchronized 和reentrantlock的优缺点多线程之--2种JAVA乐观锁的比较( NonfairSync VS. FairSync) HashMap不是线程安全的,往往在写程序时需要通过一些方法来回避.其实JDK原生的提供了2种方法让HashMap支持线程安全.
Spring Security（04）——认证简介 234390216 Spring Security 认证过程
认证简介目录 1.1 认证过程 1.2 Web应用的认证过程 1.2.1 ExceptionTranslationFilter 1.2.2 在request之间共享SecurityContext 1
Java 位运算 Javahuhui java 位运算
// 左移( << ) 低位补0 // 0000 0000 0000 0000 0000 0000 0000 0110 然后左移2位后，低位补0： // 0000 0000 0000 0000 0000 0000 0001 1000 System.out.println(6 << 2);// 运行结果是24 // 右移( >> ) 高位补"
mysql免安装版配置 ldzyz007 mysql
1、my-small.ini是为了小型数据库而设计的。不应该把这个模型用于含有一些常用项目的数据库。 2、my-medium.ini是为中等规模的数据库而设计的。如果你正在企业中使用RHEL,可能会比这个操作系统的最小RAM需求(256MB)明显多得多的物理内存。由此可见，如果有那么多RAM内存可以使用，自然可以在同一台机器上运行其它服务。 3、my-large.ini是为专用于一个SQL数据
MFC和ado数据库使用时遇到的问题你不认识的休道人 sql C++mfc
=================================================================== 第一个 =================================================================== try{ CString sql; sql.Format("select * from p
表单重复提交Double Submits rensanning double
可能发生的场景： *多次点击提交按钮 *刷新页面 *点击浏览器回退按钮 *直接访问收藏夹中的地址 *重复发送HTTP请求（Ajax）（1）点击按钮后disable该按钮一会儿，这样能避免急躁的用户频繁点击按钮。这种方法确实有些粗暴，友好一点的可以把按钮的文字变一下做个提示，比如Bootstrap的做法： http://getbootstrap.co
Java String 十大常见问题 tomcat_oracle java 正则表达式
　1.字符串比较，使用“==”还是equals()? 　　"=="判断两个引用的是不是同一个内存地址(同一个物理对象)。　　equals()判断两个字符串的值是否相等。　　除非你想判断两个string引用是否同一个对象，否则应该总是使用equals()方法。　　如果你了解字符串的驻留(String Interning)则会更好地理解这个问题。　　
SpringMVC 登陆拦截器实现登陆控制 xp9802 springMVC
思路，先登陆后，将登陆信息存储在session中，然后通过拦截器，对系统中的页面和资源进行访问拦截，同时对于登陆本身相关的页面和资源不拦截。实现方法： 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23

GAN（生成对抗网络）在合成时间序列数据中的应用

GAN（生成对抗网络）在合成时间序列数据中的应用

1. TimeGAN文章的摘要与介绍

2. 让模型学习如何通过特征和时间生成数据

2.1 TIMEGAN的结构

2.2 自编码器和对抗网络的联合训练

3. 利用Tensorflow实现TimeGAN

你可能感兴趣的:(作业记录)