FriendshipT

Tensorflow2学习笔记：房价预测

- 相关介绍
- 实验环境
- 实验步骤
- - 导入相关库
  - 获取数据
  - 数据清洗
  - 拆分训练数据集和测试数据集
  - 数据检查
  - 从标签中分离特征
  - 数据规范化
  - 模型
  - - 构建模型
    - 检查模型
    - 训练模型
    - 进行预测
- 小结
- 参考文献

实验环境

Python 3.6.2

Tensorflow-gpu 2.0.0

Matplotlib 3.3.2

Pandas 0.23.4

Seaborn 0.11.0

实验步骤

导入相关库

import pathlib

import matplotlib.pyplot as plt
import pandas as pd
import seaborn as sns

import tensorflow as tf

from tensorflow import keras
from tensorflow.keras import layers

获取数据

使用 pandas 导入数据集。

raw_dataset = pd.read_csv("shenzhen_house_price.csv")

dataset = raw_dataset.copy()
dataset.tail() # 查看末尾5行

	district	roomnum	hall	AREA	C_floor	floor_num	school	subway	per_price
18509	longgang	6	2	269.22	middle	10	1	1	9.2861
18510	nanshan	4	1	203.00	low	11	1	1	10.3448
18511	pingshan	3	2	88.08	middle	32	1	0	3.4060
18512	longgang	3	2	87.50	middle	33	1	1	6.6057
18513	luohu	3	2	69.30	middle	26	1	0	6.2771

数据清洗

# 统计每列nan值的个数
dataset.isna().sum()

district     0
roomnum      0
hall         0
AREA         0
C_floor      0
floor_num    0
school       0
subway       0
per_price    0
dtype: int64

# 序列特征映射
district_mapping = {'baoan': 0,
                    'dapengxinqu': 1,
                    'futian': 2,
                    'guangming': 3,
                    'longgang': 4,
                    'longhua': 5,
                    'luohu': 7,
                    'nanshan': 8,
                    'pingshan': 9,
                    'yantian': 10}
dataset['district']=dataset['district'].map(district_mapping)
C_floor_mapping = {'low': 0, 'middle': 1, 'high': 2}
dataset['C_floor']=dataset['C_floor'].map(C_floor_mapping)

dataset.tail() # 查看末尾5行

	district	roomnum	hall	AREA	C_floor	floor_num	school	subway	per_price
18509	4	6	2	269.22	1	10	1	1	9.2861
18510	8	4	1	203.00	0	11	1	1	10.3448
18511	9	3	2	88.08	1	32	1	0	3.4060
18512	4	3	2	87.50	1	33	1	1	6.6057
18513	7	3	2	69.30	1	26	1	0	6.2771

拆分训练数据集和测试数据集

将数据集拆分为一个训练数据集和一个测试数据集。最后将使用测试数据集对模型进行评估。

train_dataset = dataset.sample(frac=0.8,random_state=0) # frac=0.8，就是抽取其中80%
test_dataset = dataset.drop(train_dataset.index)

数据检查

核密度估计（kernel density estimation）是在概率论中用来估计未知的密度函数，属于非参数检验方法之一

查看训练集中几对列的联合分布。

# 通过diag_kind='kde’显示双变量间的核密度并用其估计其特征
sns.pairplot(train_dataset[["district", "roomnum","hall","AREA"]], diag_kind="kde")

查看总体的数据统计

train_stats = train_dataset.describe()
train_stats.pop("per_price") # pop() 函数用于移除列表中的一个元素（默认最后一个元素），并且返回该元素的值
train_stats = train_stats.transpose() # 转置
train_stats

	count	mean	std	min	25%	50%	75%	max
district	14811.0	5.692526	3.015980	0.0	3.00	7.0	8.0	10.0
roomnum	14811.0	2.870299	1.047548	1.0	2.00	3.0	3.0	9.0
hall	14811.0	1.811356	0.487863	0.0	2.00	2.0	2.0	6.0
AREA	14811.0	95.052092	48.526370	15.0	70.52	88.0	103.2	697.2
C_floor	14811.0	1.022011	0.768946	0.0	0.00	1.0	2.0	2.0
floor_num	14811.0	27.519546	10.093864	1.0	23.00	31.0	33.0	90.0
school	14811.0	0.585241	0.492697	0.0	0.00	1.0	1.0	1.0
subway	14811.0	0.501722	0.500014	0.0	0.00	1.0	1.0	1.0

从标签中分离特征

将特征值从目标值或者"标签"中分离。这个标签是你使用训练模型进行预测的值。

train_labels = train_dataset.pop('per_price') 
test_labels = test_dataset.pop('per_price')

数据规范化

再次审视下上面的 train_stats 部分，并注意每个特征的范围有什么不同。

使用不同的尺度和范围对特征归一化是好的实践。尽管模型可能在没有特征归一化的情况下收敛，它会使得模型训练更加复杂，并会造成生成的模型依赖输入所使用的单位选择。

注意：尽管我们仅仅从训练集中有意生成这些统计数据，但是这些统计信息也会用于归一化的测试数据集。我们需要这样做，将测试数据集放入到与已经训练过的模型相同的分布中。

在此我们使用，零-均值规范化也称标准差标准化，经过处理的数据的均值为0，标准差为1。转化公式为：

其中 $\mu$ 为原始数据的均值， $\sigma$ 为原始数据的标准差，是当前用得最多的数据标准化方式。

标准差分数可以回答这样一个问题："给定数据距离其均值多少个标准差"的问题:

在均值之上的数据会得到一个正的标准化分数，反之会得到一个负的标准化分数。

# #归一化
def norm(x):
    return (x - train_stats['mean']) / train_stats['std']
normed_train_data = norm(train_dataset)
normed_test_data = norm(test_dataset)

模型

构建模型

这里，我们将会使用一个“顺序”模型，其中包含两个紧密相连的隐藏层，以及返回单个、连续值得输出层。模型的构建步骤包含于一个名叫 ‘build_model’ 的函数中，稍后我们将会创建第二个模型。两个密集连接的隐藏层。

激活函数:

线性整流函数（Rectified Linear Unit, ReLU），又称修正线性单元，是一种人工神经网络中常用的激活函数（activation function），通常指代以斜坡函数及其变种为代表的非线性函数。
其图像如下：
优势：
- 更加有效率的梯度下降以及反向传播，避免了梯度爆炸和梯度消失问题；
- 简化计算过程：没有了其他复杂激活函数中诸如指数函数的影响；同时活跃度-的分散性使得神经网络整体计算成本下降。

损失函数：

机器学习多数算法都需要最大化或最小化一个函数，即“目标函数”。一般把最小化的一类函数称为“损失函数”。
损失函数用于模型构建中，所以它用于指导模型的生成。

评估指标：

评估机器学习算法模型，有些问题中损失函数可以直接作为评价指标。
评估指标用于模型构建后，所以它用于评价模型性能。

在此回归问题中，均方误差(MSE)既用来指导模型构建，也用来在模型完成后评估模型性能

def build_model():
    model = keras.Sequential([
        layers.Dense(64, activation='relu', input_shape=[len(train_dataset.keys())]),
        layers.Dense(64, activation='relu'),
        layers.Dense(1)
    ])
    
    optimizer = tf.keras.optimizers.RMSprop(0.001) # learning_rate=0.001
    
    model.compile(loss='mse',# 损失函数
                  optimizer=optimizer, # 优化器
                  metrics=['mae', 'mse'] # 评估指标
                 )
    return model

model = build_model()

检查模型

使用 .summary 方法来打印该模型的简单描述。

model.summary()

Model: "sequential_3"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
=================================================================
dense_9 (Dense)              (None, 64)                576       
_________________________________________________________________
dense_10 (Dense)             (None, 64)                4160      
_________________________________________________________________
dense_11 (Dense)             (None, 1)                 65        
=================================================================
Total params: 4,801
Trainable params: 4,801
Non-trainable params: 0
_________________________________________________________________

试用下这个模型。从训练数据中批量获取‘10’条例子并对这些例子调用 model.predict

example_batch = normed_train_data[:10]
example_result = model.predict(example_batch)
example_result

array([[ 0.12918985],
       [ 0.1756232 ],
       [ 0.23027313],
       [ 0.16373649],
       [ 0.01900654],
       [ 0.28642148],
       [-0.26140502],
       [ 0.15351082],
       [ 0.19139563],
       [ 0.23934828]], dtype=float32)

训练模型

对模型进行1000个周期的训练，并在 history 对象中记录训练和验证的准确性。

# 通过为每个完成的时期打印一个点来显示训练进度
class PrintDot(keras.callbacks.Callback):
    def on_epoch_end(self, epoch, logs):
        if epoch % 100 == 0: 
            print('')
        print('.', end='')

EPOCHS = 1000
# 训练模型
history = model.fit(
    normed_train_data, # 训练数据
    train_labels, # 训练标签
    epochs=EPOCHS, # 训练周期
    validation_split = 0.2, # 用作验证集的训练数据的比例。
    verbose=0, # 日志显示模式。 0 = 安静模式, 1 = 进度条, 2 = 每轮一行。
    callbacks=[PrintDot()] # 回调函数,用于在模型训练期间指定阶段被调用的函数
)

....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................
....................................................................................................

使用 history 对象中存储的统计信息可视化模型的训练进度。

hist = pd.DataFrame(history.history)
hist['epoch'] = history.epoch
hist.tail()

	loss	mae	mse	val_loss	val_mae	val_mse	epoch
995	1.754809	0.881673	1.754809	3.012332	1.098387	3.012332	995
996	1.746673	0.877518	1.746674	3.533036	1.214398	3.533037	996
997	1.767880	0.884328	1.767881	3.020478	1.115132	3.020477	997
998	1.760693	0.885182	1.760694	3.260231	1.178415	3.260231	998
999	1.760055	0.888085	1.760056	3.035253	1.109489	3.035254	999

可视化训练误差和验证误差

def plot_history(history):
    hist = pd.DataFrame(history.history)
    hist['epoch'] = history.epoch

    plt.figure()
    plt.xlabel('Epoch')
    plt.ylabel('Mean Abs Error [per_price]')
    plt.plot(hist['epoch'], hist['mae'],
           label='Train Error')
    plt.plot(hist['epoch'], hist['val_mae'],
           label = 'Val Error')
    plt.ylim([0,5])
    plt.legend()

    plt.figure()
    plt.xlabel('Epoch')
    plt.ylabel('Mean Square Error [${(per\_price)}^2$]')
    plt.plot(hist['epoch'], hist['mse'],
           label='Train Error')
    plt.plot(hist['epoch'], hist['val_mse'],
           label = 'Val Error')
    plt.ylim([0,20])
    plt.legend()
    plt.show()

plot_history(history)

该图表显示在约10个 epochs 之后误差非但没有改进，反而出现恶化。
让我们更新 model.fit 调用，当验证值没有提高上是自动停止训练。
我们将使用一个 EarlyStopping callback 来测试每个 epoch 的训练条件。
如果经过一定数量的 epochs 后没有改进，则自动停止训练。

EarlyStopping是什么？

EarlyStopping是Callbacks的一种，callbacks用于指定在每个epoch开始和结束的时候进行哪种特定操作。
- Callbacks中有一些设置好的接口，可以直接使用，如’acc’,’val_acc’,’loss’和’val_loss’等等。
EarlyStopping则是用于提前停止训练的callbacks。
- 具体地，可以达到当训练集上的loss不在减小（即减小的程度小于某个阈值）的时候停止继续训练。

为什么要用EarlyStopping？

根本原因就是因为继续训练会导致测试集上的准确率下降。
那继续训练导致测试准确率下降的原因可能是：
- 过拟合
- 学习率过大导致不收敛
- 使用正则项的时候，Loss的减少可能不是因为准确率增加导致的，而是因为权重大小的降低。

当然使用EarlyStopping也可以加快学习的速度，提高调参效率。

model = build_model()

# patience 值用来检查改进 epochs 的数量
# patience:能够容忍多少个epoch内都没有改善。这个设置其实是在抖动和真正的准确率下降之间做权衡。
early_stop = keras.callbacks.EarlyStopping(monitor='val_loss', # 监控的数据接口,有'acc','val_acc','loss','val_loss'等等
                                           patience=10)

history = model.fit(normed_train_data, train_labels, epochs=EPOCHS,
                    validation_split = 0.2, verbose=0, callbacks=[early_stop, PrintDot()])

plot_history(history)

..............................................................

如图所示，验证集中的平均的误差通常在 +/- 1.0 pre_price左右。

通过使用测试集来泛化模型的效果如何，在训练模型时没有使用测试集。当我们在现实世界中使用这个模型时，我们可以期望它预测得有多好。

loss, mae, mse = model.evaluate(normed_test_data, test_labels, verbose=2)

print("Testing set Mean Abs Error: {:5.2f} per_price".format(mae))

3703/3703 - 0s - loss: 3.1772 - mae: 1.1967 - mse: 3.1772
Testing set Mean Abs Error:  1.20 per_price

进行预测

最后，使用测试集中的数据预测 per_price 值:

test_predictions = model.predict(normed_test_data).flatten()
plt.scatter(test_labels, test_predictions)
plt.xlabel('True Values [per_price]')
plt.ylabel('Predictions [per_price]')
plt.axis('equal') # x,y轴刻度等长
plt.axis('square') # 作图为正方形，并且x,y轴范围相同
plt.xlim([0,plt.xlim()[1]])
plt.ylim([0,plt.ylim()[1]])
_ = plt.plot([-100, 100], [-100, 100])

error = test_predictions - test_labels
plt.hist(error, bins = 25)
plt.xlabel("Prediction Error [per_price]")
_ = plt.ylabel("Count")

它不是完全的高斯分布，可能这是因为样本的数量很小所导致的。理论上，样本的数量足够大，即服从高斯分布(正态分布)。

小结

均方误差（MSE）是用于回归问题的常见损失函数。

用于回归的评估指标与分类不同。常见的回归指标是平均绝对误差（MAE）和均方误差（MSE）。

当数字输入数据特征的值存在不同范围时，每个特征应独立缩放到相同范围，即归一化。

如果训练数据不多，一种方法是选择隐藏层较少的小网络，以避免过度拟合。

早期停止（EarlyStopping）是一种防止过度拟合的有效技术。

参考文献

[1]Tensorflow官方文档(https://tensorflow.google.cn/tutorials)

自学人工智能大模型，满足7B模型的训练和微调以及推理，预算3万，如何选购电脑岁月的眸人工智能
如果你的预算是3万元人民币，希望训练和微调7B参数规模的人工智能大模型（如LLaMA、Mistral等），你需要一台高性能的深度学习工作站。在这个预算范围内，以下是推荐的配置：1.关键硬件配置(1)GPU(显卡)推荐显卡：NVIDIARTX4090(24GBVRAM)或者RTX3090（24GBVRAM）理由：7B模型推理：24GB显存足够跑7B模型的推理，但全参数训练可能吃力，适合LoRA等微调
多模态大模型（LMMs）与大语言模型（LLMs）的比较大F的智能小课底层技术解析人工智能语言模型
前言现在的大模型分为两大类：大语言模型（LargeLanguageModels，简称LLMs）和多模态大模型（LargeMultimodalModels，简称LMMs）。本文将从基础定义、输入数据、应用场景、训练过程这几方面讨论下两者的区别。基础定义LLMs(LargeLanguageModels,大型语言模型)-深度学习的应用之一，是基于深度学习的大规模机器学习模型，通常由数十亿到数万亿个参数构
人工智能之推荐系统实战系列(协同过滤,矩阵分解,FM与DeepFM算法) weixin_58351028 人工智能深度学习神经网络算法机器学习
一.推荐系统介绍和应用(1)推荐系统通俗解读推荐系统就是来了就别想走了。例如在大数据时代中京东越买越想买，抖音越刷越是自己喜欢的东西，微博越刷越过瘾。(2).推荐系统发展简介1)推荐系统无处不在，它是根据用户的行为决定推荐的内容。用户每天在互联网中都会留下足迹，这样就会越来越多的用户画像。2)为什么要推荐系统卖的好的商品就那几种，其它就不管了吗？答案是否定的。80%的销售来自20%的热门商品，要想
手把手教你给 windows装个vmware虚拟机 python算法小白
附Java/C/C++/机器学习/算法与数据结构/前端/安卓/Python/程序员必读书籍书单大全：书单导航页（点击右侧极客侠栈即可打开个人博客）：极客侠栈①【Java】学习之路吐血整理技术书从入门到进阶最全50+本（珍藏版)②【算法数据结构+acm】从入门到进阶吐血整理书单50+本（珍藏版)③【数据库】从入门到进阶必读18本技术书籍网盘吐血整理网盘(珍藏版)④【Web前端】从HTML到JS到AJ
appium环境搭建 weixin_43516809 appium appuim
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言记录手机自动化环境搭建学习过程一、jdk安装配置（省略）二、AndroidSDK安装配置三、python环境安装配置四、pycharm开发工具安装五、安装node.js六、appium安装1.安装2.检查appium环境是否搭建成功七、appium工作原理总结前言记录手机自动化环境搭建学习过程一、jdk安装配置（省略）cm
VS Code 通知中一直显示“Reactivating terminals...”的问题解决随猿Fa IDE python ide vscode
VSCode通知中一直显示“Reactivatingterminals...”的问题解决问题截图解决方案修复截图相关链接问题截图解决方案点击顶部放大镜()->输入尖括号(>)->然后搜索(Python:ClearWorkspaceInterpreterSetting)->最后点击即可修复截图之后就没有这个烦人的通知啦!相关链接GitHubissueofvscode-pythonforReactiv
Stable Diffusion AI软件绘画速成从入门到精通课兴兴 stable diffusion 人工智能
课兴兴资源圈创始人，更多课程干货，欢迎关注（课兴兴）KMastery-StableDiffusionAI软件绘画速成从入门到精通-中英字幕KMasteryStableDiffusionFromNovicetoArtist英文+中英字幕|1080P|14.5GBAI绘画软件速成课程：从初学者到专业人士欢迎来到人工智能绘画软件初学者速成班！无论您是刚刚开始探索绘画世界，还是希望使用人工智能技术增强您的
【Elasticsearch】分词器概述 risc123456 Elasticsearch elasticsearch
Elasticsearch分词与神经网络分词的区别Elasticsearch的分词过程产生的是优化用于搜索和检索的语言学分词。这与机器学习和自然语言处理中的神经分词不同。神经分词器将字符串转换为更小的子词分词，这些分词被编码为向量，供神经网络使用。Elasticsearch没有内置的神经分词器。分词器接收一个字符流，将其分解为单独的分词（通常是单个单词），并输出一个分词流。例如，`whitespa
Python网络请求详解 wespten 全栈软件测试人工智能测试开发自动化测试性能测试软件测试
一、网络请求测试人员对于接口测试的理解总是停留在工具使用层面。很多情况下，测试人员会花很大的代价去学习一个工具。而测试工具本身的局限性，又导致测试人员陷入想直接用现成的测试框架却又无法进行扩展的僵局。最后由于项目的特殊性等客观因素，测试人员只能放弃工具，脱离了工具的可视化界面友好操作，发现自己连接口是什么都不明白，更不要说自行完成接口自动化测试了。随即接口自动化测试由于项目成本及人员能力问题宣告失
基于 Python 的云笔记平台分析与设计程序员奇奇计算机毕设 Python 云笔记毕业设计
完整代码：https://download.csdn.net/download/qq_38735017/873824351前言1.1背景苏联著名教育学家苏霍姆林斯基说得好：“如果学生的智力生活仅局限于教科书，如果他做完了功课就觉得任务已经完成，那么他是不可能有自己特别爱好的。”每一个学生要在书籍的世界里，有自己的生活。把读书，应视为自己的乐趣。当每读完一本有意思的书时，很多时候都想把书中感触深刻亦
Windows下安装CPU用的Tensorflow Coder LM Wang Python
刚在电脑上安装了Tensorflow，还是碰到了一些麻烦，记录一下：很多教程是介绍怎么在Linux平台下安装的，或者是Windows平台下GPU用的，很可惜，这些教程对我来说太麻烦了。安装步骤：1）安装Python。版本：python-3.6.4-amd64.exe。2）cmd，命令行输入：python，查看Python版本号，以验证Python是否安装成功了。3）继续在命令行输入：pipinst
【算法】动态规划专题⑪ —— 区间DP python 查理零世动态规划专题算法动态规划 python
目录引入进入正题回归经典总结引入区间动态规划（区间DP）适用于解决涉及区间最优化的经典问题，如石子合并、最长回文子序列等。进入正题石子合并https://www.acwing.com/problem/content/284/有N堆石子排成一排，其编号为1,2,3,…,N。每堆石子有一定的质量，可以用一个整数来描述，现在要将这N堆石子合并成为一堆。每次只能合并相邻的两堆，合并的代价为这两堆石子的质量
解码DeepSeek家族系列：大语言模型赛道上的黑马传奇大F的智能小课语言模型人工智能自然语言处理
1.DeepSeek公司概况1.1成立背景与发展历程DeepSeek，全称杭州深度求索人工智能基础技术研究有限公司，于2023年7月17日正式成立。公司由知名量化资管巨头幻方量化孕育而生，其创始人梁文峰是幻方量化的联合创始人之一。DeepSeek自成立之初，便专注于开发先进的大语言模型（LLM）及相关技术，致力于通过数据蒸馏技术提取更精炼、有用的数据，以提升模型性能。在发展历程中，DeepSeek
python创建画布语句_canvas元素创建画布 weixin_39847945 python创建画布语句
Phaser桌面和手机游戏HTML5框架Phaser是一个流行的2D开源游戏框架，可以用来开发桌面或手机浏览器HTML5游戏，适合侧视或顶视风格：Phaser同时支持Canvas和WebGL渲染引擎，预置了完备的精灵动画、输入管理、瓦片地图、补间动画、资源加载器、物理系统、粒子系统等特性，几乎能够满足你开发一个2D游戏的任何...文章马拉喀什2017-11-021163浏览量HTML5学习手笔四：
Python.pyecharts.charts折线图新旧版本对比详解！唔使般若 python
旧版本(0.5.10)实现frompyechartsimportLineline=Line("美国邮费阶梯图")datax=[1995,1996,1997,1998,1999,2001,2002,2003,2004,2005,2006,2007,2008,2009]datay=[0.32,0.32,0.32,0.32,0.33,0.33,0.34,0.37,0.37,0.37,0.37,0.39,
从需求分析到代码生成：AI如何重塑软件需求工程前端
软件开发的世界，一直以来都面临着巨大的挑战。传统软件开发过程中，需求分析往往耗时长、易出错，沟通成本高昂，这些都直接导致项目延期和成本超支。然而，随着人工智能技术的飞速发展，一个新的时代正在到来。AI代码生成器等AI技术的应用，为我们提供了自动化部分需求分析和代码生成过程的可能性，显著提高了效率，降低了成本。本文将探讨AI技术如何重塑软件需求工程，并以ScriptEcho为例，说明AI驱动的代码生
AI前端开发对未来职业规划的影响：拥抱变化，迎接挑战前端
随着人工智能技术的飞速发展，AI写代码工具（以及其他AI代码生成工具）的兴起正在深刻地改变着前端开发领域。从简单的代码片段生成到复杂的页面布局设计，AI已经开始扮演越来越重要的角色。这不仅给前端开发带来了前所未有的效率提升，也对前端开发者的职业规划提出了新的挑战和机遇。本文将探讨AI前端开发的未来趋势，以及如何利用AI工具，例如ScriptEcho，来帮助前端开发者适应未来，在竞争激烈的市场中保持
AI前端开发与个人品牌打造：乘风破浪会有时，直挂云帆济沧海前端
在数字化浪潮席卷全球的今天，前端开发领域正经历着前所未有的变革。得益于人工智能技术的快速发展，越来越多的AI写代码工具涌现，深刻地改变着前端开发的模式和效率。掌握AI前端开发技能，不仅能提升个人竞争力，更能助力个人品牌的打造，让你的职业生涯乘风破浪。AI前端开发技能如何提升个人竞争力在竞争日益激烈的IT行业，高效的开发能力是建立个人品牌的基础。而AI赋能的前端开发，正为开发者提供了前所未有的效率提
【2024年华为OD机试】 (C卷,200分)- 亲子游戏（JavaScript&Java & Python&C/C++）妄北y 算法汇集笔记总结(保姆级)华为od c语言游戏 java javascript 矩阵
一、问题描述宝宝和妈妈的糖果游戏问题题目描述在一个N×N的二维矩阵中，宝宝和妈妈分别用抽签决定自己的初始位置。每个格子可能有不同的糖果数量，同时部分格子有障碍物，妈妈需要遵循以下规则：妈妈必须在最短的时间内到达宝宝的位置（每单位时间只能移动一步）。妈妈沿路可以拾取格子上的糖果，糖果数量会累加。妈妈不能走障碍物的格子，只能上下左右移动。如果妈妈无法到达宝宝，则输出-1。输入格式：第一行输入为N，表示
以C语言为基石，轻松理解Python的核心逻辑 welcome_123_ c语言 python 开发语言
一、编程思维的桥梁：从C到Python对于掌握C语言的开发者来说，Python的学习就像在熟悉的城市中发现一条新的捷径。本文将通过对比C语言和Python的核心特性，揭示两种语言的本质联系与差异，帮助C开发者快速建立Python编程思维。二、基础语法对照表2.1变量定义与使用操作C语言实现Python实现核心差异定义整型变量intnum=10;num=10Python无需声明类型浮点数运算floa
DeepSeek使用手册，其中一份是清华大学出品 cpa007 云计算
自娶，。https://pan.quark.cn/s/d174471b17c0深入了解DeepSeek：从技术到应用一、DeepSeek是什么？DeepSeek（深度求索）是一款由杭州深度求索人工智能基础技术研究有限公司开发的人工智能平台，专注于提供高效易用的AI模型训练与推理能力。它既包含预训练大语言模型（如DeepSeek-R1系列），也提供配套工具链，助力开发者快速实现AI应用落地。二、De
获取 OpenAI o1-preview/o1-Mini API key 进行 API 调用的详细教程 openaiapikey
如何使用OpenAI推理模型：o1-preview/o1-Mini模型的API调用在快速发展的人工智能领域，OpenAI推出了o1系列模型（草莓），包括o1-preview和o1-Mini。这些模型旨在执行复杂的推理任务，成为开发人员和研究人员的强大工具。本文将介绍如何使用这些模型进行API调用。1.openaiapikey获取首先，您需要一个OpenAIAPI密钥。您可以在OpenAI的官方网站
探索Python爬虫：获取淘宝商品详情与订单API接口的深度解析不爱搞技术的技术猿 Python 淘宝API python 爬虫开发语言
引言在数字化时代，电子商务平台的数据挖掘和分析已成为企业获取市场洞察的重要手段。淘宝，作为中国最大的电商平台之一，拥有海量的商品数据和订单信息。对于商家和市场分析师来说，如何高效、合规地获取这些数据，成为了一个迫切需要解决的问题。本文将深入探讨如何利用Python爬虫技术，通过淘宝提供的API接口，合法合规地获取商品详情和订单数据。淘宝API接口概览淘宝开放平台提供了丰富的API接口，允许开发者在
使用Python爬虫获取淘宝订单商品接口的全面指南 JelenaAPI小小爬虫 API Python python 爬虫数据库
引言淘宝作为中国最大的电商平台之一，拥有海量的商品数据和订单信息。对于开发者来说，获取淘宝订单商品接口是一个常见的需求。本文将介绍如何使用Python编写爬虫，获取淘宝订单商品信息。一、淘宝订单商品接口概览淘宝提供了多个与订单相关的API接口，以下是几个主要的接口：订单详情API接口：taobao.trade.fullinfo.get：获取订单的详细信息，包括订单状态、支付信息、物流信息等。订单批
python爬虫6个经典常用案例（完整代码）小北画画 python 爬虫开发语言人工智能 pycharm
文章目录1.抓取静态网页内容2.抓取多个网页（分页）3.使用正则表达式提取数据4.处理动态内容（使用Selenium）5.抓取带有登录认证的网页6.使用Scrapy框架Python爬虫是一种强大的工具，可以用来从网页中提取数据。以下是六个常用的Python爬虫案例，涵盖了从简单的网页抓取到更复杂的动态内容抓取。1.抓取静态网页内容目标：抓取一个静态网页的内容，并提取其中的特定信息。示例：抓取一个新
【爬虫案例】2025最新python爬虫案例！5个经典案例！（完整代码）小北画画爬虫 python 开发语言蓝桥杯职场和发展 pycharm
文章目录案例1：爬取豆瓣电影Top250案例2：爬取猫眼电影Top100案例3：爬取某吧帖子内容案例4：多线程爬取小说章节内容案例5：爬取全国高校名单—————其他案例分享—————案例1：爬取豆瓣电影Top250目标：获取豆瓣电影Top250的电影名称、评分和评价人数等信息。方法：使用requests库发送HTTP请求，BeautifulSoup库解析网页内容，csv库保存数据到CSV文件。代码
Python爬虫教程：公司信息与财务数据抓取——财务报告、业绩数据及新闻分析 Python爬虫项目 2025年爬虫实战项目 python 爬虫开发语言 chrome 美食信息可视化
在当今金融市场，获取公司的财务报告、业绩数据以及相关新闻是投资分析、市场监控和竞争对手研究的重要组成部分。投资者、分析师、以及公司管理层都需要这些信息来做出重要决策。通过爬虫技术，我们可以高效地抓取这些数据并进行分析。本文将介绍如何使用Python编写爬虫，抓取公司的财务报告、业绩数据和新闻。我们将使用最新的技术栈，包括requests、BeautifulSoup、Selenium、Pandas等
免费体验！DeepSeek一键部署全攻略 deepseek
1.背景介绍热点聚焦：DeepSeek-R1&V3引爆全球关注！自从深度求索团队开源了DeepSeek-R1和DeepSeek-V3，这两款模型迅速成为AI领域的焦点，引发了全球范围的热议！它们不仅是人工智能技术的重大突破，更是深度求索团队献给全人类的一份重磅科技大礼。AlayaNeW算力云：让DeepSeek部署更简单！借助AlayaNeW算力云服务提供的强大GPU资源，您可以轻松实现DeepS
【附源码】108个Python实战项目，练完能力飙升小北画画 python 开发语言 pycharm windows 人工智能
学Python不实战是万万不能的，在这里整理了108个Python实战项目列表，都有完整且详细的教程，分享给大家。1.Python图片转字符画2.200行Python代码实现204813.Python3实现火车票查询工具4.高德API+Python解决租房问题5.IPython3色情图片识别6.Python破解验证码7.Python实现简单的web服务器8.Ipygame开发打飞机游戏9.Djan
【学术投稿-2025年计算机视觉研究进展与应用国际学术会议 (ACVRA 2025)】CSS样式解析：行内、内部与外部样式的区别与优先级分析禁默前端学术会议 css 前端
简介2025年计算机视觉研究进展与应用（ACVRA2025）将于2025年2月28-3月2日在中国广州召开，会议将汇聚世界各地的顶尖学者、研究人员和行业专家，聚焦计算机视觉领域的最新研究动态与应用成就。本次会议将探讨前沿技术，包括深度学习、多模态学习、图像和视频分析、3D重建等，以及其在智能交通、医疗影像、增强现实和自动化等多个实际应用中的创新转化。会议官网：www.acvra.org目录前言一、
枚举的构造函数中抛出异常会怎样 bylijinnan java enum 单例
首先从使用enum实现单例说起。为什么要用enum来实现单例？这篇文章（ http://javarevisited.blogspot.sg/2012/07/why-enum-singleton-are-better-in-java.html）阐述了三个理由： 1.enum单例简单、容易，只需几行代码： public enum Singleton { INSTANCE;
CMake 教程 aigo C++
转自：http://xiang.lf.blog.163.com/blog/static/127733322201481114456136/ CMake是一个跨平台的程序构建工具，比如起自己编写Makefile方便很多。介绍：http://baike.baidu.com/view/1126160.htm 本文件不介绍CMake的基本语法，下面是篇不错的入门教程： http:
cvc-complex-type.2.3: Element 'beans' cannot have character Cb123456 spring Webgis
cvc-complex-type.2.3: Element 'beans' cannot have character Line 33 in XML document from ServletContext resource [/WEB-INF/backend-servlet.xml] is i
jquery实例:随页面滚动条滚动而自动加载内容 120153216 jquery
<script language="javascript"> $(function (){ var i = 4;$(window).bind("scroll", function (event){ //滚动条到网页头部的高度，兼容ie,ff,chrome var top = document.documentElement.s
将数据库中的数据转换成dbs文件何必如此 sql dbs
旗正规则引擎通过数据库配置器（DataBuilder）来管理数据库，无论是Oracle，还是其他主流的数据都支持，操作方式是一样的。旗正规则引擎的数据库配置器是用于编辑数据库结构信息以及管理数据库表数据，并且可以执行SQL 语句，主要功能如下。 1)数据库生成表结构信息：主要生成数据库配置文件(.conf文
在IBATIS中配置SQL语句的IN方式 357029540 ibatis
在使用IBATIS进行SQL语句配置查询时，我们一定会遇到通过IN查询的地方，在使用IN查询时我们可以有两种方式进行配置参数：String和List。具体使用方式如下： 1.String:定义一个String的参数userIds，把这个参数传入IBATIS的sql配置文件，sql语句就可以这样写： <select id="getForms" param
Spring3 MVC 笔记（一） 7454103 spring mvc bean REST JSF
自从 MVC 这个概念提出来之后 struts1.X struts2.X jsf 。。。。。这个view 层的技术一个接一个！都用过！不敢说哪个绝对的强悍！要看业务，和整体的设计！最近公司要求开发个新系统！
Timer与Spring Quartz 定时执行程序 darkranger spring bean 工作 quartz
有时候需要定时触发某一项任务。其实在jdk1.3，java sdk就通过java.util.Timer提供相应的功能。一个简单的例子说明如何使用，很简单： 1、第一步，我们需要建立一项任务，我们的任务需要继承java.util.TimerTask package com.test; import java.text.SimpleDateFormat; import java.util.Date;
大端小端转换，le32_to_cpu 和cpu_to_le32 aijuans C语言相关
大端小端转换，le32_to_cpu 和cpu_to_le32 字节序 http://oss.org.cn/kernel-book/ldd3/ch11s04.html 小心不要假设字节序. PC 存储多字节值是低字节为先(小端为先, 因此是小端), 一些高级的平台以另一种方式(大端)
Nginx负载均衡配置实例详解 avords
[导读] 负载均衡是我们大流量网站要做的一个东西，下面我来给大家介绍在Nginx服务器上进行负载均衡配置方法，希望对有需要的同学有所帮助哦。负载均衡先来简单了解一下什么是负载均衡，单从字面上的意思来理解就可以解负载均衡是我们大流量网站要做的一个东西，下面我来给大家介绍在Nginx服务器上进行负载均衡配置方法，希望对有需要的同学有所帮助哦。负载均衡先来简单了解一下什么是负载均衡
乱说的 houxinyou 框架敏捷开发软件测试
从很久以前，大家就研究框架，开发方法，软件工程，好多！反正我是搞不明白！这两天看好多人研究敏捷模型，瀑布模型！也没太搞明白. 不过感觉和程序开发语言差不多，瀑布就是顺序，敏捷就是循环. 瀑布就是需求、分析、设计、编码、测试一步一步走下来。而敏捷就是按摸块或者说迭代做个循环，第个循环中也一样是需求、分析、设计、编码、测试一步一步走下来。也可以把软件开发理
欣赏的价值——一个小故事 bijian1013 有效辅导欣赏欣赏的价值
　　第一次参加家长会，幼儿园的老师说："您的儿子有多动症，在板凳上连三分钟都坐不了，你最好带他去医院看一看。"　　回家的路上，儿子问她老师都说了些什么，她鼻子一酸，差点流下泪来。因为全班30位小朋友，惟有他表现最差；惟有对他，老师表现出不屑，然而她还在告诉她的儿子："老师表扬你了，说宝宝原来在板凳上坐不了一分钟，现在能坐三分钟。其他妈妈都非常羡慕妈妈，因为全班只有宝宝
包冲突问题的解决方法 bingyingao eclipse maven exclusions 包冲突
包冲突是开发过程中很常见的问题：其表现有： 1.明明在eclipse中能够索引到某个类，运行时却报出找不到类。 2.明明在eclipse中能够索引到某个类的方法，运行时却报出找不到方法。 3.类及方法都有，以正确编译成了.class文件，在本机跑的好好的，发到测试或者正式环境就抛如下异常： java.lang.NoClassDefFoundError: Could not in
【Spark七十五】Spark Streaming整合Flume-NG三之接入log4j bit1129 Stream
先来一段废话：实际工作中，业务系统的日志基本上是使用Log4j写入到日志文件中的，问题的关键之处在于业务日志的格式混乱，这给对日志文件中的日志进行统计分析带来了极大的困难，或者说，基本上无法进行分析，每个人写日志的习惯不同，导致日志行的格式五花八门，最后只能通过grep来查找特定的关键词缩小范围，但是在集群环境下，每个机器去grep一遍，分析一遍，这个效率如何可想之二，大好光阴都浪费在这上面了
sudoku solver in Haskell bookjovi sudoku haskell
这几天没太多的事做，想着用函数式语言来写点实用的程序，像fib和prime之类的就不想提了（就一行代码的事），写什么程序呢？在网上闲逛时发现sudoku游戏，sudoku十几年前就知道了，学生生涯时也想过用C/Java来实现个智能求解，但到最后往往没写成，主要是用C/Java写的话会很麻烦。现在写程序，本人总是有一种思维惯性，总是想把程序写的更紧凑，更精致，代码行数最少，所以现
java apache ftpClient bro_feng java
最近使用apache的ftpclient插件实现ftp下载，遇见几个问题，做如下总结。 1. 上传阻塞，一连串的上传，其中一个就阻塞了，或是用storeFile上传时返回false。查了点资料，说是FTP有主动模式和被动模式。将传出模式修改为被动模式ftp.enterLocalPassiveMode();然后就好了。看了网上相关介绍，对主动模式和被动模式区别还是比较的模糊，不太了解被动模
读《研磨设计模式》-代码笔记-工厂方法模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 工厂方法模式：使一个类的实例化延迟到子类 * 某次，我在工作不知不觉中就用到了工厂方法模式（称为模板方法模式更恰当。2012-10-29）： * 有很多不同的产品，它
面试记录语 chenyu19891124 招聘
或许真的在一个平台上成长成什么样，都必须靠自己去努力。有了好的平台让自己展示，就该好好努力。今天是自己单独一次去面试别人，感觉有点小紧张，说话有点打结。在面试完后写面试情况表，下笔真的好难，尤其是要对面试人的情况说明真的好难。今天面试的是自己同事的同事，现在的这个同事要离职了，介绍了我现在这位同事以前的同事来面试。今天这位求职者面试的是配置管理，期初看了简历觉得应该很适合做配置管理，但是今天面
Fire Workflow 1.0正式版终于发布了 comsci 工作 workflow Google
Fire Workflow 是国内另外一款开源工作流，作者是著名的非也同志，哈哈.... 官方网站是 http://www.fireflow.org 经过大家努力,Fire Workflow 1.0正式版终于发布了正式版主要变化: 1、增加IWorkItem.jumpToEx(...)方法，取消了当前环节和目标环节必须在同一条执行线的限制，使得自由流更加自由 2、增加IT
Python向脚本传参 daizj python 脚本传参
如果想对python脚本传参数，python中对应的argc, argv(c语言的命令行参数)是什么呢？需要模块：sys 参数个数：len(sys.argv) 脚本名： sys.argv[0] 参数1： sys.argv[1] 参数2： sys.argv[
管理用户分组的命令gpasswd dongwei_6688 passwd
NAME： gpasswd - administer the /etc/group file SYNOPSIS： gpasswd group gpasswd -a user group gpasswd -d user group gpasswd -R group gpasswd -r group gpasswd [-A user,...] [-M user,...] g
郝斌老师数据结构课程笔记 dcj3sjt126com 数据结构与算法
<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<
yii2 cgridview加上选择框进行操作 dcj3sjt126com GridView
页面代码 <?=Html::beginForm(['controller/bulk'],'post');?> <?=Html::dropDownList('action','',[''=>'Mark selected as: ','c'=>'Confirmed','nc'=>'No Confirmed'],['class'=>'dropdown',])
linux mysql fypop linux
enquiry mysql version in centos linux yum list installed | grep mysql yum -y remove mysql-libs.x86_64 enquiry mysql version in yum repositoryyum list | grep mysql oryum -y list mysql* install mysq
Scramble String hcx2013 String
Given a string s1, we may represent it as a binary tree by partitioning it to two non-empty substrings recursively. Below is one possible representation of s1 = "great":
跟我学Shiro目录贴 jinnianshilongnian 跟我学shiro
历经三个月左右时间，《跟我学Shiro》系列教程已经完结，暂时没有需要补充的内容，因此生成PDF版供大家下载。最近项目比较紧，没有时间解答一些疑问，暂时无法回复一些问题，很抱歉，不过可以加群（334194438/348194195）一起讨论问题。 ----广告-----------------------------------------------------
nginx日志切割并使用flume-ng收集日志 liyonghui160com
nginx的日志文件没有rotate功能。如果你不处理，日志文件将变得越来越大，还好我们可以写一个nginx日志切割脚本来自动切割日志文件。第一步就是重命名日志文件，不用担心重命名后nginx找不到日志文件而丢失日志。在你未重新打开原名字的日志文件前，nginx还是会向你重命名的文件写日志，linux是靠文件描述符而不是文件名定位文件。第二步向nginx主
Oracle死锁解决方法 pda158 oracle
　select p.spid,c.object_name,b.session_id,b.oracle_username,b.os_user_name from v$process p,v$session a, v$locked_object b,all_objects c where p.addr=a.paddr and a.process=b.process and c.object_id=b.
java之List排序 shiguanghui list排序
在Java Collection Framework中定义的List实现有Vector，ArrayList和LinkedList。这些集合提供了对对象组的索引访问。他们提供了元素的添加与删除支持。然而，它们并没有内置的元素排序支持。　　你能够使用java.util.Collections类中的sort()方法对List元素进行排序。你既可以给方法传递
servlet单例多线程 utopialxw 单例多线程 servlet
转自http://www.cnblogs.com/yjhrem/articles/3160864.html 和 http://blog.chinaunix.net/uid-7374279-id-3687149.html Servlet 单例多线程 Servlet如何处理多个请求访问？Servlet容器默认是采用单实例多线程的方式处理多个请求的：1.当web服务器启动的

Tensorflow2学习笔记：房价预测