勋章DhR

【深度学习实战：利用墨尔本十年的温度数据，基于keras框架用循环神经网络LSTM做时间序列预测】

学习笔记，仅供参考！

介绍

RNN是基于序列数据（如语言、语音、时间序列）的递归性质而设计的，是一种反馈类型的神经网络，其结构包含环和自重复，因此被称为“循环”。它专门用于处理序列数据，这里使用的是many to one 的结构类型，输入序列，输出为单个值，类似于之前的文本分类和文本生成或预测时间序列数据。

本文使用的是目前常用的LSTM长短时记忆网络，相对于传统的循环神经网络，信息是通过多个隐含层逐层传递到输出层的。直观上，这会导致信息的损失，更本质地，这会使得网络参数难以优化，LSTM可以很好的解决这问题，对于时间序列预测也有一定的参考价值。

数据集

给出墨尔本近十年的温度数据集，以温度作为输入，利用lstm神经网络模型来做时间序列预测，根据提供的温度数据集来预测未来一天的温度，数据集如下图示例：

参数解释,其中的window_size：将温度每15个作为一组输入，第16个元素作为输出，也就是预测值，依次滑动窗口

“epochs”: 2,
“batch_size”: 10,
“window_size”: 15, 窗口，每15个数据作为一组，依次滑动
“train_test_split”: 0.8, 切分训练集
“validation_split”: 0.1,
“dropout_keep_prob”: 0.2,抑制参数传递，在全连接层，0.2的参数不做更新，更新速度变快，泛化能力更好，防止过拟合
“hidden_unit”: 100 隐藏层单元

代码

处理时间序列数据集，其中index_col=0：将第0列数据日期作为index，输入的values值只有温度，每16个元素作为一组数据，index：0-14为输入x，index：15为输出y，在对数据切分，0.8为训练集，0.2为测试集

# 处理时间序列数据集
def load_timeseries(filename, params):
    # 加载时间序列数据集
    series = pd.read_csv(filename, sep=',', header=0, index_col=0, squeeze=True)
    data = series.values
    adjusted_window = params['window_size'] + 1  # window_size+1,’+1‘作为预测值
    # Split data into windows
    raw = []  # 原始数据
    for index in range(len(data) - adjusted_window):
        raw.append(data[index:index + adjusted_window])
    # Normalize data
    result = normalize_window(raw)

    raw = np.array(raw)
    # 原始数据假设最开始有N行，通过窗口滑动形成[N-16，16]的二维数据
    result = np.array(result)

    # Split the input dataset into train and test

    split_train_index = int(round(params['train_test_split'] * result.shape[0]))
    train = result[:split_train_index, :]
    np.random.shuffle(train)  # 滑动窗口后的数据相关性太高，按行做重新排序，洗牌

    x_train = train[:, :-1]
    y_train = train[:, -1]
    x_test = result[split_train_index:, :-1]
    y_test = result[split_train_index:, -1]
    # 对数据升维度，每一个X作为一个向量，作为一个输入
    x_train = np.reshape(x_train, (x_train.shape[0], x_train.shape[1], 1))
    x_test = np.reshape(x_test, (x_test.shape[0], x_test.shape[1], 1))
    # 处理原始数据
    # order = y_train.argsort(axis=0)
    x_test_raw = raw[split_train_index:, :-1]
    y_test_raw = raw[split_train_index:, -1]

    # Last window, for next time stamp prediction
    last_raw = [data[-params['window_size']:]]  # 取出最后一组数据
    last = normalize_window(last_raw)
    last = np.array(last)
    last = np.reshape(last, (last.shape[0], last.shape[1], 1))
    return [x_train, y_train, x_test, y_test, x_test_raw, y_test_raw, last_raw, last]

规范化数据，正则化


def normalize_window(window_data):
    normalize_data = []
    for window in window_data:
        normalize_window = [((float(p) / float(window[0])) - 1) for p in window]
        normalize_data.append(normalize_window)
    return normalize_data

建立模型，这里使用的是keras框架的Sequential 模型，在数据处理时对数据进行了升维，一组数据0-15中的每一个元素x作为一个输入，输出为某个值，也就是温度的预测值，这里使用LSTM模型，layer[2]是hidden_unit隐藏层，输入层->隐藏层->全连接层->输出

def rnn_lstm(layers, params):
    model = Sequential()
    model.add(LSTM(1, input_shape=(layers[1], layers[0]), return_sequences=True))  # 15行1列作为输入
    model.add(Dropout(params['dropout_keep_prob']))
    model.add(LSTM(layers[2], return_sequences=False))
    model.add(Dropout(params['dropout_keep_prob']))
    model.add(Dense(units=layers[3], activation='tanh')) #输出为1维
    model.compile(loss='mean_squared_error', optimizer=Adam(learning_rate=0.001))
    return model

预测下一个时间戳，带入训练好的模型和数据，来对未来的温度数据做预测

def predict_next_timestamp(model, history):
    prediction = model.predict(history)
    prediction = np.reshape(prediction, (prediction.size,))

    return prediction

读入json文件类型的参数，key：value，load_timeseries函数获取时间序列数据，rnn_lstm函数读入模型做训练，predict_next_timestamp函数做未来温度的预测

def train_predict():
    params = None
    # 读入参数
    with open(parameter_file) as f:
        params = json.load(f)
    # 获取时间序列数据
    x_train, y_train, x_test, y_test, x_test_raw, y_test_raw, last_window_raw, last_window \
        = load_timeseries(train_file, params)

    lstm_layer = [1, params['window_size'], params['hidden_unit'], 1]  # 输入层shape
    # 读入模型
    model = rnn_lstm(lstm_layer, params)
    # 训练模型
    model.fit(x_train, y_train, batch_size=params['batch_size'], epochs=params['epochs'],
              validation_split=params['validation_split'])
    # model.summary()
    predicted = predict_next_timestamp(model, x_test)  # 根据测试集做温度的预测
    # 获取预测的结果
    predicted_raw = []
    for i in range(len(x_test_raw)):
        predicted_raw.append((predicted[i] + 1) * x_test_raw[i][0])  # 返回原始结果
    plt.plot(predicted_raw[0:200], 'r+-', ms=3, lw=1, label='Test Actual')
    plt.plot(y_test_raw[0:200], 'b+-', ms=3, lw=1, label='Test Predicted')
    plt.legend()
    plt.show()

    # predict next time stamp
    next_timestamp = predict_next_timestamp(model, last_window)
    next_timestamp_raw = (next_timestamp[0] + 1) * last_window_raw[0][0]
    print('The next time stamp forecasting is: {}'.format(next_timestamp_raw))
    print('结果:', next_timestamp_raw)

实验结果

可视化结果可以看到预测值在真实值的上下浮动，浮动程度比较大，效果一般，但是还有一定的参考价值，我这里只训练了两个epoch，模型只有简单的输入输出，还有待优化和改进

262/262 [==============================] - 35s 120ms/step - loss: 4.2713 - val_loss: 1.0284
Epoch 2/2
262/262 [==============================] - 32s 121ms/step - loss: 4.2500 - val_loss: 1.0195
The next time stamp forecasting is: 15.915689048171044
结果: 15.915689048171044

给出数据集
链接：https://pan.baidu.com/s/1iwwUIvbh4vcR2bQ2iYtnAg
提取码：2ml5

给出全部代码

import numpy as np
import pandas as pd
from keras.layers.core import Dense, Activation, Dropout
from keras.layers.recurrent import LSTM
from keras.models import Sequential
from tensorflow.keras.optimizers import Adam, SGD, RMSprop
import json
import tensorflow._api.v2.compat.v1 as tf
import matplotlib.pyplot as plt

'''
    "epochs": 2,
	"batch_size": 10,
	"window_size": 15,  窗口，每15个数据作为一组，依次滑动
	"train_test_split": 0.8, 切分训练集
	"validation_split": 0.1,
	"dropout_keep_prob": 0.2,抑制参数传递，在全连接层，0.2的参数不做更新，更新速度变快，泛化能力更好，防止过拟合
	"hidden_unit": 100
'''


# 处理时间序列数据集
def load_timeseries(filename, params):
    # 加载时间序列数据集
    series = pd.read_csv(filename, sep=',', header=0, index_col=0, squeeze=True)
    data = series.values
    adjusted_window = params['window_size'] + 1  # window_size+1,’+1‘作为预测值
    # Split data into windows
    raw = []  # 原始数据
    for index in range(len(data) - adjusted_window):
        raw.append(data[index:index + adjusted_window])
    # Normalize data
    result = normalize_window(raw)

    raw = np.array(raw)
    # 原始数据假设最开始有N行，通过窗口滑动形成[N-16，16]的二维数据
    result = np.array(result)

    # Split the input dataset into train and test

    split_train_index = int(round(params['train_test_split'] * result.shape[0]))
    train = result[:split_train_index, :]
    np.random.shuffle(train)  # 滑动窗口后的数据相关性太高，按行做重新排序，洗牌

    x_train = train[:, :-1]
    y_train = train[:, -1]
    x_test = result[split_train_index:, :-1]
    y_test = result[split_train_index:, -1]
    # 对数据升维度，每一个X作为一个向量，作为一个输入
    x_train = np.reshape(x_train, (x_train.shape[0], x_train.shape[1], 1))
    x_test = np.reshape(x_test, (x_test.shape[0], x_test.shape[1], 1))
    # 处理原始数据
    # order = y_train.argsort(axis=0)
    x_test_raw = raw[split_train_index:, :-1]
    y_test_raw = raw[split_train_index:, -1]

    # Last window, for next time stamp prediction
    last_raw = [data[-params['window_size']:]]  # 取出最后一组数据
    last = normalize_window(last_raw)
    last = np.array(last)
    last = np.reshape(last, (last.shape[0], last.shape[1], 1))
    return [x_train, y_train, x_test, y_test, x_test_raw, y_test_raw, last_raw, last]


# 规范化数据，正则化
def normalize_window(window_data):
    normalize_data = []
    for window in window_data:
        normalize_window = [((float(p) / float(window[0])) - 1) for p in window]
        normalize_data.append(normalize_window)
    return normalize_data


# 建立模型
def rnn_lstm(layers, params):
    model = Sequential()
    model.add(LSTM(1, input_shape=(layers[1], layers[0]), return_sequences=True))  # 15行1列作为输入
    model.add(Dropout(params['dropout_keep_prob']))
    model.add(LSTM(layers[2], return_sequences=False))
    model.add(Dropout(params['dropout_keep_prob']))
    model.add(Dense(units=layers[3], activation='tanh')) #输出为1维
    model.compile(loss='mean_squared_error', optimizer=Adam(learning_rate=0.001))
    return model


# 预测下一个时间戳
def predict_next_timestamp(model, history):
    prediction = model.predict(history)
    prediction = np.reshape(prediction, (prediction.size,))

    return prediction


# 数据预测
def train_predict():
    params = None
    # 读入参数
    with open(parameter_file) as f:
        params = json.load(f)
    # 获取时间序列数据
    x_train, y_train, x_test, y_test, x_test_raw, y_test_raw, last_window_raw, last_window \
        = load_timeseries(train_file, params)

    lstm_layer = [1, params['window_size'], params['hidden_unit'], 1]  # 输入层shape
    # 读入模型
    model = rnn_lstm(lstm_layer, params)
    # 训练模型
    model.fit(x_train, y_train, batch_size=params['batch_size'], epochs=params['epochs'],
              validation_split=params['validation_split'])
    # model.summary()
    predicted = predict_next_timestamp(model, x_test)  # 根据测试集做温度的预测
    # 获取预测的结果
    predicted_raw = []
    for i in range(len(x_test_raw)):
        predicted_raw.append((predicted[i] + 1) * x_test_raw[i][0])  # 返回原始结果
    plt.plot(predicted_raw[0:200], 'r+-', ms=3, lw=1, label='Test Actual')
    plt.plot(y_test_raw[0:200], 'b+-', ms=3, lw=1, label='Test Predicted')
    plt.legend()
    plt.show()

    # predict next time stamp
    next_timestamp = predict_next_timestamp(model, last_window)
    next_timestamp_raw = (next_timestamp[0] + 1) * last_window_raw[0][0]
    print('The next time stamp forecasting is: {}'.format(next_timestamp_raw))
    print('结果:', next_timestamp_raw)


if __name__ == '__main__':
    train_file = './data/daily-minimum-temperatures.csv'
    parameter_file = './training_config.json'
    # 如果是空格分隔符，\s+.index_col=0,第0列数据作为index,日期作为index，温度作为value
    data = pd.read_csv(train_file, sep=',', header=0, index_col=0, squeeze=True)
    # 动态申请显存
    config = tf.ConfigProto()
    config.gpu_options.allow_growth = True
    sess = tf.Session(config=config)
    train_predict()

python JSON Lines (JSONL)的保存和读取；jsonl的数据保存和读取，大模型prompt文件保存常用格式医学小达人常用算法 NLP prompt JSON Lines JSONL jsonl jsonl文件保存读取
1.JSONLines(JSONL)文件保存将一个包含多个字典的列表保存为JSONLines(JSONL)格式的文件，每个字典对应一个JSONL文件中的一行。以下是如何实现这一操作的Python代码importjson#定义包含字典的列表data=[{"id":1,"name":"Alice","age":30,"email":"[email protected]"},{"id":2,"name"
四十行Python代码，带你爬取热门音乐评论，制作评论词云图！
请求页面数据driver.get(‘https://music.163.com/#/song?id=569213220’)#selenium无法直接获取到嵌套页面里面的数据switch_to.frame()切换到嵌套网页driver.switch_to.frame(0)让浏览器加载的时候,等待渲染页面driver.implicitly_wait(10)driver.page_source获取请求页
Python 处理图像并生成 JSONL 元数据文件 - 固定text版本
Python处理图像并生成JSONL元数据文件-固定text版本flyfishJSONL（JSONLines）简介JSONL（JSONLines，也称为newline-delimitedJSON）是一种轻量级的数据序列化格式，由一系列独立的JSON对象组成，每行一个有效的JSON对象，行与行之间通过换行符（\n）分隔。JSONL是传统JSON的“轻量化”变体，通过“每行一个JSON对象”的设计，解
Android 蓝牙通讯全解析：从基础到实战 Monkey-旭 microsoft java android 蓝牙通讯
蓝牙作为一种短距离无线通信技术，在Android设备中应用广泛——从蓝牙耳机、蓝牙音箱等音频设备，到蓝牙打印机、蓝牙传感器等数据传输设备，再到蓝牙手表等穿戴设备，都依赖蓝牙通讯实现交互。本文将从蓝牙技术基础出发，详解Android蓝牙通讯的两种核心模式（经典蓝牙、低功耗蓝牙）及开发实战，帮助开发者快速实现蓝牙设备连接与数据交互。一、Android蓝牙技术基础1.1蓝牙技术分类与应用场景Androi
基于YOLOv8的Web端交互式目标检测系统设计与实现 YOLO实战营 YOLO 前端目标检测人工智能 ui 目标跟踪计算机视觉
1.引言目标检测是计算机视觉领域的一项重要任务，它在安防监控、自动驾驶、医疗影像分析等领域有着广泛的应用。近年来，随着深度学习技术的快速发展，YOLO(YouOnlyLookOnce)系列算法因其出色的速度和精度平衡而备受关注。本文将详细介绍如何基于最新的YOLOv8模型构建一个Web端交互式目标检测系统，包含完整的UI界面设计和数据集处理流程。本系统将实现以下功能：基于YOLOv8的高效目标检测
基于卷积神经网络与小波变换的医学图像超分辨率算法复现神经网络15044 python 算法 cnn 算法人工智能图像处理开发语言神经网络深度学习
基于卷积神经网络与小波变换的医学图像超分辨率算法复现前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家，觉得好请收藏。点击跳转到网站。1.引言医学图像超分辨率技术在临床诊断和治疗规划中具有重要意义。高分辨率的医学图像能够提供更丰富的细节信息，帮助医生做出更准确的诊断。近年来，深度学习技术在图像超分辨率领域取得了显著进展。本文将复现一种结合卷积神经网络(CNN)、小波变
RxJava 全解析：从原理到 Android 实战 Monkey-旭 java rxjava 响应式编程 android
在Android开发中，异步任务处理是绕不开的核心场景——网络请求、数据库操作、文件读写等都需要在后台执行，而结果需回调到主线程更新UI。传统的“Handler+Thread”或AsyncTask不仅代码冗余，还容易陷入“回调地狱”（嵌套回调导致代码可读性差）。RxJava作为一款基于响应式编程思想的异步框架，通过“链式调用”和“操作符”完美解决了这些问题，成为Android开发者的必备工具。本文
jxORM--编程指南 jxandrew jxWebUI 数据库 python jxWebUI jxORM ORM
jxORM是jxWebUI配套的数据库操作库，可以简化python程序员操作数据库。声明数据类定义数据类之前，先导入ORM修饰符：fromjxORMimportORM,DBDataType,ColType然后就可以用ORM修饰符来修饰一个类，从而定义一个数据类：@ORMclassUser:ID:DBDataType.Long=ColType.PrimaryKeyCreateTime:DBDataT
深度学习系列-----＞环境搭建（Ubuntu）二师兄用飘柔深度学习历程深度学习 ubuntu 人工智能 pytorch python
1、前言电脑基础系统硬件情况：系统：ubuntu18.04、显卡：GTX1050Ti；后续的环境搭建都在此基础上进行。此次学习选择Pytorch作为深度学习的框架，选择的原因主要由于PyTorch在研究领域特别受欢迎，较多的论文框架也是基于其开发。2、anaconda+python3安装测试在学习深度学习的过程中会涉及到使用不同版本python包的问题，而anaconda可以便捷获取包且对包能够进
Python中的enumerate()函数冉成未来 Service python 开发语言
文章目录基本用法参数说明特点实际应用与zip()的比较注意事项enumerate()是Python内置的一个非常有用的函数，它用于在遍历可迭代对象（如列表、元组、字符串等）时，同时获取元素的索引和值。基本用法fruits=['apple','banana','cherry']forindex,fruitinenumerate(fruits):print(index,fruit)输出：0apple1
空间曲线正交投影及其距离计算的理论与实践老歌老听老掉牙 python 正交投影
引言：正交投影的几何本质在三维空间中，正交投影是一种基础而重要的几何变换，它将空间中的点沿特定方向映射到一个平面上。当我们考虑将空间曲线投影到由给定法向量n\mathbf{n}n定义的平面时，这一问题在计算机图形学、CAD/CAM系统和科学计算中具有广泛应用。本文将从数学原理、Python实现到距离计算的等价性问题，全面探讨这一几何操作的深层内涵。设空间曲线由参数方程r(t)=(x(t),y(t)
pip是如何卸载你安装的第三方库的酷python python python
使用pipuninstall命令可以卸载掉你所安装的第三方库，所有与其相关的文件都将被pip整理出来展示并询问是否真的要删除，类似下面的提示pipuninstallnoxFoundexistinginstallation:nox2020.8.22Uninstallingnox-2020.8.22:Wouldremove:d:\python\lib\site-packages\nox-2020.8.
SSH服务与rsync服务配置实战
SSH服务与rsync服务SSHssh服务，一种远程管理连接工具，在CentOS7系统中默认安装并开机自启的。SSH（SecureShell）是一种安全通道协议，主要用来实现字符界面的远程登录，远程复制等功能。监听tcp的22号端口。软件包名称：openssh配置文件目录：/etc/ssh，sshd_config服务端配置文件；ssh_config客户端配置文件。客户端提供：ssh、scp、sft
深度学习-常用环境配置瑶山 AI linux 人工智能 windows CUDA PyTorch
目录Miniconda安装安装NVIDIA显卡驱动安装CUDA和cnDNNCUDAcuDNNPyTorch安装手动下载测试Miniconda安装最新版Miniconda搭建Python环境_miniconda创建python虚拟环境-CSDN博客安装NVIDIA显卡驱动直接进NVIDIA官网：NVIDIAGeForce驱动程序-N卡驱动|NVIDIA在这里有GeForce驱动程序，立即下载，这是下
Nginx IP授权页面实现步骤
目标：一、创建白名单文件sudomkdir-p/usr/local/nginx/conf/whitelistsudotouch/usr/local/nginx/conf/whitelist/temporary.conf二、创建Python认证服务文件路径：/opt/script/auth_server.pyimportosimporttimefromflaskimportFlask,request
高阶知识库搭建实战五、（向量数据库Milvus安装）伯牙碎琴大模型数据库 milvus 大模型 AI
以下是关于在Windows环境下直接搭建Milvus向量数据库的教程：本教程分两部分，第一部分是基于docker安装，在Windows环境下直接安装Milvus向量数据库，目前官方推荐的方式是通过Docker进行部署，因为Milvus的运行环境依赖于Linux系统。如果你希望在Windows上直接运行Milvus，可以考虑使用MilvusLite版本，这是一个轻量级的Python库，适用于快速原型
社交应用全栈开发实战：前后端与数据库整合
本文还有配套的精品资源，点击获取简介：本资源包详细介绍了构建一个社交应用程序的全过程，包括前端、后端以及数据库管理的核心组件和关键功能。Uniapp框架用于开发跨平台的移动端用户界面，Java后端负责处理业务逻辑和数据交互，MySQL数据库用于管理用户信息和动态数据。项目还包括前后端通信、身份验证、性能优化和推送通知服务的实现。学习这些代码可以提升开发者的技能，帮助快速构建社交应用。1.社交APP
新版进销存管理系统完整教程：PB9.0与SQL Server 2000的实战应用语嫣凝冰
本文还有配套的精品资源，点击获取简介：本文档提供了一个基于PowerBuilder9.0和SQLServer2000开发的进销存管理系统的全面教程。系统涵盖了企业管理中的采购、销售和库存管理环节，通过强大的数据窗口组件和三层架构设计，实现了业务逻辑和数据库的有效交互。文章详细解释了系统的技术栈、核心功能、系统架构、数据窗口组件、数据库设计、报表分析及权限安全管理等关键点，旨在帮助用户深入理解进销存
python分布式事务_分布式事务系列（2.1）分布式事务的概念
#1系列目录#2X/OpenDTPDTP全称是DistributedTransactionProcess，即分布式事务模型。之前我们接触的事务都是针对单个数据库的操作，如果涉及多个数据库的操作，还想保证原子性，这就需要使用分布式事务了。而X/OpenDTP就是一种分布式事务处理模型。##2.1X/OpenDTP模型X/Open是一个组织，维基百科上这样说明：X/Open是1984年由多个公司联合创
从0构建 HarmonyOS 本地语音识别项目：Whisper 完整落地教程观熵国产大模型部署实战全流程指南 harmonyos 语音识别 whisper 深度学习机器学习
第一章：鸿蒙手机语音识别项目实战（基于Whisper本地推理）项目目标：构建一个可以在鸿蒙系统手机本地运行的语音识别应用，使用Whisper模型识别用户语音为文字，全程无需联网。1.为什么要在鸿蒙手机本地部署语音识别？在很多移动场景下（驾驶、弱网环境、隐私敏感场景等），云端语音识别存在如下痛点：⏳网络延迟高、体验割裂⚠️数据隐私风险大网络依赖强，弱网/无网直接无法使用而将语音识别模型部署在鸿蒙设备
LLM初识
从零到一：用Python和LLM构建你的专属本地知识库问答机器人摘要：随着大型语言模型（LLM）的兴起，构建智能问答系统变得前所未有的简单。本文将详细介绍如何使用Python，结合开源的LLM和向量数据库技术，一步步搭建一个基于你本地文档的知识库问答机器人。你将学习到从环境准备、文档加载、文本切分、向量化、索引构建到最终实现问答交互的完整流程。本文包含详细的流程图描述、代码片段思路和关键注意事项，
CCF-GESP 等级考试 2025年6月认证Python四级真题解析
1单选题（每题2分，共30分）第1题2025年4月19日在北京举行了一场颇为瞩目的人形机器人半程马拉松赛。比赛期间，跑动着的机器人会利用身上安装的多个传感器所反馈的数据来调整姿态、保持平衡等，那么这类传感器类似于计算机的()。A.处理器B.存储器C.输入设备D.输出设备解析：答案：C。所有传感器都用于采集数据，属于输入设备，故选C。第2题小杨购置的计算机使用一年后觉得内存不够用了，想购置一个容量更
推荐开源项目：Milvus Lite —— 轻量级向量数据库，助力AI应用快速起飞穆希静
推荐开源项目：MilvusLite——轻量级向量数据库，助力AI应用快速起飞项目介绍MilvusLite是知名开源向量数据库Milvus的轻量级版本，专为需要在小型环境中进行向量嵌入和相似性搜索的AI应用设计。通过将MilvusLite导入您的Python应用，您可以直接使用Milvus的核心向量搜索功能。MilvusLite已集成在PythonSDKofMilvus中，只需通过pipinstal
【速通RAG实战：数据库】6.RAG向量数据库原理无心水速通 RAG 实战！解锁 AI 2.0 高薪密码速通RAG实战 RAG快速开发实战 RAG RAG向量数据库相似度 FAISS Chroma
在RAG（检索增强生成）系统中，向量数据库扮演着至关重要的角色，它负责存储文本经过Embedding处理后的向量表示，并能高效地进行向量检索，以找出与查询向量最相似的文档。1.向量数据库原理1.向量表示在RAG系统里，文本首先会通过Embedding模型（如OpenAIEmbeddings、SentenceTransformers等）转化为固定维度的向量。这些向量能够捕捉文本的语义信息，使得语义相
集群技术笔记-HAProxy 与 Keepalived 高可用负载均衡实战
目录前言HAProxy一、HAProxy介绍（一）定义（二）核心优势（三）调度算法速查表（四）工作模式（五）配置文件结构（六）健康检查字段二、搭建负载均衡集群（一）准备基本环境（二）配置流程配置真实服务器配置代理服务器（三）客户端验证三、配置健康检查页面（一）修改配置文件追加配置内容（二）重启服务（三）浏览器访问验证Keepalived一、Keepalived介绍（一）定义（二）功能（三）工作原理
【华为419机考真题】服务器能耗统计，JAVA 题解梦想橡皮擦华为服务器 java 华为OD机试华为OD
最近更新的博客华为od2023|什么是华为od，od薪资待遇，od机试题清单华为OD机试真题大全，用Python解华为机试题|机试宝典【华为OD机试】全流程解析+经验分享,题型分享,防作弊指南华为od机试，独家整理已参加机试人员的实战技巧本篇题解：服务器耗能题目描述服务器有三种运行状态：空载，单任务，多任务，每个时间片的能耗的分别为111、333、444，每个任务由起始时间片和结束时间片定义运行时
算法工程师必备：数据结构10大经典算法详解数据结构与算法学习数据结构与算法宝典算法数据结构 ai
算法工程师必备：数据结构10大经典算法详解关键词：数据结构、经典算法、时间复杂度、应用场景、代码实现摘要：本文是算法工程师的“算法工具箱”指南，系统讲解数据结构领域最核心的10大经典算法（快速排序、归并排序、二分查找、深度优先搜索DFS、广度优先搜索BFS、动态规划、贪心算法、KMP字符串匹配、哈希算法、并查集）。通过生活案例、代码示例、复杂度分析和实战场景，帮你彻底掌握这些算法的原理与应用，真正
全球软件技术峰会 2025：聚焦大模型开发、智能运维与架构创新，共赴技术实战盛宴向日葵也有悲伤运维架构推荐算法数据结构大数据数据库架构
全球软件技术峰会2025：聚焦大模型开发、智能运维与架构创新，共赴技术实战盛宴在软件定义未来的时代，人工智能与数字化技术正以颠覆性力量重塑全球产业格局。2025年8月15-16日，以"全球专家、卓越智慧"为宗旨的全球软件技术峰会将盛大启幕，特邀全球近50位来自微软、谷歌、亚马逊、字节跳动等企业的技术领袖及一线实战专家，围绕大模型智能应用开发、AI与ML智能运维、软件开发智能化、架构设计与演进四大核
python2.x里面的input（）和raw_input（）函数以及3.x中的input（）函数的区别 scuter_yu python python input函数 raw_input函数 3.x中的input函数
在python3.0及以上的版本中，raw_input（）函数已经和我们说再见了，但是呢，input（）函数则很好地替代了消失了的raw_input（）函数。而且现在的input（）函数所返回的值都是字符串，所以对于要有int，float等类型的数值必须进行强制的类型转换。下面让我对3.0的input（）函数做个小总结：>>>str=input("abc:")abc:15>>>str'15'(虽然
代码相关（python）一个月只能修改一次次代码 python
python程序崩溃提示符用python的时候的各个tips矩阵python判断某个矩阵是否满足要求python生成二维随机数文件/档python检查某个文件存不存在python添加有特定字段的文件到列表python矩阵保存为txt文档python按行读文档python写文档python文档操作字符串python用split来拆分字符串python搜索字符串某个字符的位置给字符串前/后添加字符画图
html页面js获取参数值 0624chenhong html
1.js获取参数值js function GetQueryString(name) { var reg = new RegExp("(^|&)"+ name +"=([^&]*)(&|$)"); var r = windo
MongoDB 在多线程高并发下的问题 BigCat2013 mongodb DB 高并发重复数据
最近项目用到 MongoDB , 主要是一些读取数据及改状态位的操作. 因为是结合了最近流行的 Storm进行大数据的分析处理，并将分析结果插入Vertica数据库，所以在多线程高并发的情境下, 会发现 Vertica 数据库中有部分重复的数据. 这到底是什么原因导致的呢？笔者开始也是一筹莫展，重复去看 MongoDB 的 API , 终于有了新发现： com.mongodb.DB 这个类有
c++ 用类模版实现链表(c++语言程序设计第四版示例代码) CrazyMizzz 数据结构 C++
#include<iostream> #include<cassert> using namespace std; template<class T> class Node { private: Node<T> * next; public: T data;
最近情况麦田的设计者感慨考试生活
在五月黄梅天的岁月里，一年两次的软考又要开始了。到目前为止，我已经考了多达三次的软考，最后的结果就是通过了初级考试（程序员）。人啊，就是不满足，考了初级就希望考中级，于是，这学期我就报考了中级，明天就要考试。感觉机会不大，期待奇迹发生吧。这个学期忙于练车，写项目，反正最后是一团糟。后天还要考试科目二。这个星期真的是很艰难的一周，希望能快点度过。
linux系统中用pkill踢出在线登录用户被触发 linux
由于linux服务器允许多用户登录，公司很多人知道密码，工作造成一定的障碍所以需要有时踢出指定的用户 1/#who 查出当前有那些终端登录（用 w 命令更详细） # who root pts/0 2010-10-28 09:36 (192
仿QQ聊天第二版肆无忌惮_ qq
在第一版之上的改进内容: 第一版链接: http://479001499.iteye.com/admin/blogs/2100893 用map存起来号码对应的聊天窗口对象,解决私聊的时候所有消息发到一个窗口的问题. 增加ViewInfo类,这个是信息预览的窗口,如果是自己的信息,则可以进行编辑. 信息修改后上传至服务器再告诉所有用户,自己的窗口
java读取配置文件知了ing
1，java读取.properties配置文件 InputStream in; try { in = test.class.getClassLoader().getResourceAsStream("config/ipnetOracle.properties");//配置文件的路径 Properties p = new Properties()
__attribute__ 你知多少？矮蛋蛋 C++gcc
原文地址: http://www.cnblogs.com/astwish/p/3460618.html GNU C 的一大特色就是__attribute__ 机制。__attribute__ 可以设置函数属性（Function Attribute ）、变量属性（Variable Attribute ）和类型属性（Type Attribute ）。 __attribute__ 书写特征是：
jsoup使用笔记 alleni123 java 爬虫 JSoup
<dependency> <groupId>org.jsoup</groupId> <artifactId>jsoup</artifactId> <version>1.7.3</version> </dependency> 2014/08/28 今天遇到这种形式，
JAVA中的集合 Collectio 和Map的简单使用及方法百合不是茶 list map set
List ,set ,map的使用方法和区别 java容器类类库的用途是保存对象，并将其分为两个概念： Collection集合：一个独立的序列，这些序列都服从一条或多条规则;List必须按顺序保存元素，set不能重复元素；Queue按照排队规则来确定对象产生的顺序（通常与他们被插入的
杀LINUX的JOB进程 bijian1013 linux unix
今天发现数据库一个JOB一直在执行，都执行了好几个小时还在执行，所以想办法给删除掉系统环境： ORACLE 10G Linux操作系统操作步骤如下：第一步.查询出来那个job在运行，找个对应的SID字段 select * from dba_jobs_running--找到job对应的sid &n
Spring AOP详解 bijian1013 java spring AOP
最近项目中遇到了以下几点需求，仔细思考之后，觉得采用AOP来解决。一方面是为了以更加灵活的方式来解决问题，另一方面是借此机会深入学习Spring AOP相关的内容。例如，以下需求不用AOP肯定也能解决，至于是否牵强附会，仁者见仁智者见智。 1.对部分函数的调用进行日志记录，用于观察特定问题在运行过程中的函数调用
[Gson六]Gson类型适配器(TypeAdapter) bit1129 Adapter
TypeAdapter的使用动机 Gson在序列化和反序列化时，默认情况下，是按照POJO类的字段属性名和JSON串键进行一一映射匹配，然后把JSON串的键对应的值转换成POJO相同字段对应的值，反之亦然，在这个过程中有一个JSON串Key对应的Value和对象之间如何转换(序列化/反序列化)的问题。以Date为例，在序列化和反序列化时，Gson默认使用java.
【spark八十七】给定Driver Program，如何判断哪些代码在Driver运行，哪些代码在Worker上执行 bit1129 driver
Driver Program是用户编写的提交给Spark集群执行的application，它包含两部分作为驱动： Driver与Master、Worker协作完成application进程的启动、DAG划分、计算任务封装、计算任务分发到各个计算节点(Worker)、计算资源的分配等。计算逻辑本身，当计算任务在Worker执行时，执行计算逻辑完成application的计算任务
nginx 经验总结 ronin47 nginx 总结
　　　深感nginx的强大，只学了皮毛，把学下的记录。　　　获取Header 信息，一般是以$http_XX（ＸＸ是小写）获取body,通过接口，再展开，根据Ｋ取Ｖ　　　获取uri,以$arg_XX &n
轩辕互动-1.求三个整数中第二大的数2.整型数组的平衡点 bylijinnan 数组
import java.util.ArrayList; import java.util.Arrays; import java.util.List; public class ExoWeb { public static void main(String[] args) { ExoWeb ew=new ExoWeb(); System.out.pri
Netty源码学习-Java-NIO-Reactor bylijinnan java 多线程 netty
Netty里面采用了NIO-based Reactor Pattern 了解这个模式对学习Netty非常有帮助参考以下两篇文章： http://jeewanthad.blogspot.com/2013/02/reactor-pattern-explained-part-1.html http://gee.cs.oswego.edu/dl/cpjslides/nio.pdf
AOP通俗理解 cngolon spring AOP
1.我所知道的aop 初看aop,上来就是一大堆术语，而且还有个拉风的名字，面向切面编程，都说是OOP的一种有益补充等等。一下子让你不知所措，心想着：怪不得很多人都和我说aop多难多难。当我看进去以后，我才发现：它就是一些java基础上的朴实无华的应用，包括ioc，包括许许多多这样的名词，都是万变不离其宗而已。 2.为什么用aop&nb
cursor variable 实例 ctrain variable
create or replace procedure proc_test01 as type emp_row is record( empno emp.empno%type, ename emp.ename%type, job emp.job%type, mgr emp.mgr%type, hiberdate emp.hiredate%type, sal emp.sal%t
shell报bash: service: command not found解决方法 daizj linux shell service jps
今天在执行一个脚本时，本来是想在脚本中启动hdfs和hive等程序，可以在执行到service hive-server start等启动服务的命令时会报错，最终解决方法记录一下：脚本报错如下： ./olap_quick_intall.sh: line 57: service: command not found ./olap_quick_intall.sh: line 59
40个迹象表明你还是PHP菜鸟 dcj3sjt126com 设计模式 PHP 正则表达式 oop
你是PHP菜鸟，如果你：1. 不会利用如phpDoc 这样的工具来恰当地注释你的代码2. 对优秀的集成开发环境如Zend Studio 或Eclipse PDT 视而不见3. 从未用过任何形式的版本控制系统，如Subclipse4. 不采用某种编码与命名标准，以及通用约定，不能在项目开发周期里贯彻落实5. 不使用统一开发方式6. 不转换（或）也不验证某些输入或SQL查询串（译注：参考PHP相关函
Android逐帧动画的实现 dcj3sjt126com android
一、代码实现： private ImageView iv; private AnimationDrawable ad; @Override protected void onCreate(Bundle savedInstanceState) { super.onCreate(savedInstanceState); setContentView(R.layout
java远程调用linux的命令或者脚本 eksliang linux ganymed-ssh2
转载请出自出处： http://eksliang.iteye.com/blog/2105862 Java通过SSH2协议执行远程Shell脚本(ganymed-ssh2-build210.jar) 使用步骤如下： 1.导包官网下载: http://www.ganymed.ethz.ch/ssh2/ ma
adb端口被占用问题 gqdy365 adb
最近重新安装的电脑，配置了新环境，老是出现： adb server is out of date. killing... ADB server didn't ACK * failed to start daemon * 百度了一下，说是端口被占用，我开个eclipse，然后打开cmd，就提示这个，很烦人。一个比较彻底的解决办法就是修改
ASP.NET使用FileUpload上传文件 hvt .net C#hovertree asp.net webform
前台代码： <asp:FileUpload ID="fuKeleyi" runat="server" /> <asp:Button ID="BtnUp" runat="server" onclick="BtnUp_Click" Text="上传" />
代码之谜（四）- 浮点数（从惊讶到思考） justjavac 浮点数精度代码之谜 IEEE
在『代码之谜』系列的前几篇文章中，很多次出现了浮点数。浮点数在很多编程语言中被称为简单数据类型，其实，浮点数比起那些复杂数据类型（比如字符串）来说，一点都不简单。单单是说明 IEEE浮点数就可以写一本书了，我将用几篇博文来简单的说说我所理解的浮点数，算是抛砖引玉吧。一次面试记得多年前我招聘 Java 程序员时的一次关于浮点数、二分法、编码的面试，多年以后，他已经称为了一名很出色的
数据结构随记_1 lx.asymmetric 数据结构笔记
第一章 1.数据结构包括数据的逻辑结构、数据的物理/存储结构和数据的逻辑关系这三个方面的内容。 2.数据的存储结构可用四种基本的存储方法表示，它们分别是顺序存储、链式存储、索引存储和散列存储。 3.数据运算最常用的有五种，分别是查找/检索、排序、插入、删除、修改。 4.算法主要有以下五个特性：输入、输出、可行性、确定性和有穷性。 5.算法分析的
linux的会话和进程组网络接口 linux
会话：一个或多个进程组。起于用户登录，终止于用户退出。此期间所有进程都属于这个会话期。会话首进程：调用setsid创建会话的进程1.规定组长进程不能调用setsid，因为调用setsid后，调用进程会成为新的进程组的组长进程.如何保证？先调用fork，然后终止父进程，此时由于子进程的进程组ID为父进程的进程组ID，而子进程的ID是重新分配的，所以保证子进程不会是进程组长，从而子进程可以调用se
二维数组元素的连续求解 1140566087 二维数组 ACM
import java.util.HashMap; public class Title { public static void main(String[] args){ f(); } // 二位数组的应用 //12、二维数组中，哪一行或哪一列的连续存放的0的个数最多，是几个0。注意，是“连续”。 public static void f(){
也谈什么时候Java比C++快 windshome java C++
刚打开iteye就看到这个标题“Java什么时候比C++快”，觉得很好笑。你要比，就比同等水平的基础上的相比，笨蛋写得C代码和C++代码，去和高手写的Java代码比效率，有什么意义呢？我是写密码算法的，深刻知道算法C和C++实现和Java实现之间的效率差，甚至也比对过C代码和汇编代码的效率差，计算机是个死的东西，再怎么优化，Java也就是和C

【深度学习实战：利用墨尔本十年的温度数据，基于keras框架用循环神经网络LSTM做时间序列预测】

介绍

数据集

代码

实验结果

你可能感兴趣的:(深度学习,实战,深度学习,lstm,keras,python)