程序员的世界你不懂

数据处理专题（十二）

深度学习基础

目标

了解深度学习的基本概念。‍

学习内容

神经网络基础

Keras 基础

实践：使用 Keras 构建一个简单的神经网络模型‍

代码示例

1. 导入必要的库

import numpy as npimport pandas as pdimport tensorflow as tffrom tensorflow.keras.models import Sequentialfrom tensorflow.keras.layers import Densefrom tensorflow.keras.optimizers import Adamfrom sklearn.model_selection import train_test_splitfrom sklearn.preprocessing import StandardScalerfrom sklearn.datasets import load_iris

2. 加载示例数据集

# 加载示例数据集（鸢尾花数据集）iris = load_iris()df = pd.DataFrame(iris.data, columns=iris.feature_names)df['target'] = iris.targetprint(f"示例数据集: \n{df.head()}")

3. 数据预处理

分割数据集

# 分割数据集为训练集和测试集X = df.drop('target', axis=1)y = df['target']X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)print(f"训练集特征: \n{X_train.head()}")print(f"测试集特征: \n{X_test.head()}")print(f"训练集标签: \n{y_train.head()}")print(f"测试集标签: \n{y_test.head()}")

标准化特征

# 标准化特征scaler = StandardScaler()X_train_scaled = scaler.fit_transform(X_train)X_test_scaled = scaler.transform(X_test)

4. 构建神经网络模型

定义模型

# 定义一个简单的神经网络模型model = Sequential()model.add(Dense(10, input_dim=4, activation='relu'))  # 输入层和第一个隐藏层model.add(Dense(10, activation='relu'))  # 第二个隐藏层model.add(Dense(3, activation='softmax'))  # 输出层# 打印模型结构model.summary()

编译模型

# 编译模型model.compile(optimizer=Adam(learning_rate=0.01), loss='sparse_categorical_crossentropy', metrics=['accuracy'])

5. 训练模型

# 训练模型history = model.fit(X_train_scaled, y_train, epochs=50, batch_size=10, validation_split=0.2)

6. 评估模型

在测试集上评估模型

# 在测试集上评估模型loss, accuracy = model.evaluate(X_test_scaled, y_test)print(f"测试集上的损失: {loss:.4f}")print(f"测试集上的准确率: {accuracy:.4f}")

绘制训练过程中的损失和准确率

# 绘制训练过程中的损失和准确率plt.figure(figsize=(12, 4))# 绘制训练和验证损失plt.subplot(1, 2, 1)plt.plot(history.history['loss'], label='训练损失')plt.plot(history.history['val_loss'], label='验证损失')plt.xlabel('Epoch')plt.ylabel('Loss')plt.legend()plt.title('训练和验证损失')# 绘制训练和验证准确率plt.subplot(1, 2, 2)plt.plot(history.history['accuracy'], label='训练准确率')plt.plot(history.history['val_accuracy'], label='验证准确率')plt.xlabel('Epoch')plt.ylabel('Accuracy')plt.legend()plt.title('训练和验证准确率')plt.show()

7. 预测

使用模型进行预测

# 使用模型进行预测y_pred = model.predict(X_test_scaled)y_pred_classes = np.argmax(y_pred, axis=1)# 打印前几个预测结果print(f"前几个预测结果: \n{y_pred_classes[:10]}")print(f"前几个真实标签: \n{y_test[:10].values}")

实践

# 导入必要的库import numpy as npimport pandas as pdimport tensorflow as tffrom tensorflow.keras.models import Sequentialfrom tensorflow.keras.layers import Densefrom tensorflow.keras.optimizers import Adamfrom sklearn.model_selection import train_test_splitfrom sklearn.preprocessing import StandardScalerfrom sklearn.datasets import load_irisimport matplotlib.pyplot as plt# 加载示例数据集（鸢尾花数据集）iris = load_iris()df = pd.DataFrame(iris.data, columns=iris.feature_names)df['target'] = iris.targetprint(f"示例数据集: \n{df.head()}")# 分割数据集为训练集和测试集X = df.drop('target', axis=1)y = df['target']X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)print(f"训练集特征: \n{X_train.head()}")print(f"测试集特征: \n{X_test.head()}")print(f"训练集标签: \n{y_train.head()}")print(f"测试集标签: \n{y_test.head()}")# 标准化特征scaler = StandardScaler()X_train_scaled = scaler.fit_transform(X_train)X_test_scaled = scaler.transform(X_test)# 定义一个简单的神经网络模型model = Sequential()model.add(Dense(10, input_dim=4, activation='relu'))  # 输入层和第一个隐藏层model.add(Dense(10, activation='relu'))  # 第二个隐藏层model.add(Dense(3, activation='softmax'))  # 输出层# 打印模型结构model.summary()# 编译模型model.compile(optimizer=Adam(learning_rate=0.01), loss='sparse_categorical_crossentropy', metrics=['accuracy'])# 训练模型history = model.fit(X_train_scaled, y_train, epochs=50, batch_size=10, validation_split=0.2)# 在测试集上评估模型loss, accuracy = model.evaluate(X_test_scaled, y_test)print(f"测试集上的损失: {loss:.4f}")print(f"测试集上的准确率: {accuracy:.4f}")# 绘制训练过程中的损失和准确率plt.figure(figsize=(12, 4))# 绘制训练和验证损失plt.subplot(1, 2, 1)plt.plot(history.history['loss'], label='训练损失')plt.plot(history.history['val_loss'], label='验证损失')plt.xlabel('Epoch')plt.ylabel('Loss')plt.legend()plt.title('训练和验证损失')# 绘制训练和验证准确率plt.subplot(1, 2, 2)plt.plot(history.history['accuracy'], label='训练准确率')plt.plot(history.history['val_accuracy'], label='验证准确率')plt.xlabel('Epoch')plt.ylabel('Accuracy')plt.legend()plt.title('训练和验证准确率')plt.show()# 使用模型进行预测y_pred = model.predict(X_test_scaled)y_pred_classes = np.argmax(y_pred, axis=1)# 打印前几个预测结果print(f"前几个预测结果: \n{y_pred_classes[:10]}")print(f"前几个真实标签: \n{y_test[:10].values}")

总结

通过今天的练习，你应该已经了解了神经网络的基础知识，并学会了如何使用 Keras 构建和训练一个简单的神经网络模型

时间序列预测

学会使用深度学习进行时间序列预测。‍

LSTM 网络

实践：使用 LSTM 预测股票价格‍

01

目标

学会使用深度学习进行时间序列预测。‍

学习内容

LSTM 网络

实践：使用 LSTM 预测股票价格‍

代码示例

1. 导入必要的库

import numpy as npimport pandas as pdimport matplotlib.pyplot as pltfrom sklearn.preprocessing import MinMaxScalerfrom tensorflow.keras.models import Sequentialfrom tensorflow.keras.layers import Dense, LSTMfrom tensorflow.keras.optimizers import Adamfrom tushare.pro_api import ProApi

2. 获取股票数据

# 设置 Tushare API Tokentoken = 'your_tushare_token'  # 请替换为你的 Tushare Tokenpro = ProApi(token)# 获取股票数据ts_code = '002594.SZ'  # 比亚迪股票代码start_date = '2018-01-01'end_date = '2023-06-05'df = pro.daily(ts_code=ts_code, start_date=start_date, end_date=end_date)# 将数据按日期排序df['trade_date'] = pd.to_datetime(df['trade_date'])df.set_index('trade_date', inplace=True)df.sort_index(inplace=True)# 选择收盘价作为预测目标df = df[['close']]print(f"股票数据: \n{df.head()}")

3. 数据预处理

标准化数据

# 标准化数据scaler = MinMaxScaler(feature_range=(0, 1))scaled_data = scaler.fit_transform(df)# 将标准化后的数据转换为 DataFramedf_scaled = pd.DataFrame(scaled_data, columns=['close'], index=df.index)print(f"标准化后的数据: \n{df_scaled.head()}")

创建时间序列数据集

# 创建时间序列数据集def create_dataset(data, time_step=60):    X, y = [], []    for i in range(len(data) - time_step - 1):        a = data[i:(i + time_step), 0]        X.append(a)        y.append(data[i + time_step, 0])    return np.array(X), np.array(y)time_step = 60X, y = create_dataset(scaled_data, time_step)# 分割数据集为训练集和测试集train_size = int(len(X) * 0.8)test_size = len(X) - train_sizeX_train, X_test = X[0:train_size], X[train_size:len(X)]y_train, y_test = y[0:train_size], y[train_size:len(y)]# 重塑输入数据为 [samples, time_steps, features]X_train = X_train.reshape(X_train.shape[0], X_train.shape[1], 1)X_test = X_test.reshape(X_test.shape[0], X_test.shape[1], 1)

4. 构建 LSTM 模型

定义模型

# 定义 LSTM 模型model = Sequential()model.add(LSTM(50, return_sequences=True, input_shape=(time_step, 1)))model.add(LSTM(50, return_sequences=False))model.add(Dense(25))model.add(Dense(1))# 打印模型结构model.summary()

编译模型

# 编译模型model.compile(optimizer=Adam(learning_rate=0.001), loss='mean_squared_error')

5. 训练模型

# 训练模型history = model.fit(X_train, y_train, epochs=50, batch_size=64, validation_data=(X_test, y_test))

6. 评估模型

在测试集上评估模型

# 在测试集上评估模型loss = model.evaluate(X_test, y_test)print(f"测试集上的损失: {loss:.4f}")

绘制训练过程中的损失

# 绘制训练过程中的损失plt.figure(figsize=(12, 4))plt.plot(history.history['loss'], label='训练损失')plt.plot(history.history['val_loss'], label='验证损失')plt.xlabel('Epoch')plt.ylabel('Loss')plt.legend()plt.title('训练和验证损失')plt.show()

7. 预测

使用模型进行预测

# 使用模型进行预测y_pred = model.predict(X_test)# 反标准化预测结果y_pred_inv = scaler.inverse_transform(y_pred)y_test_inv = scaler.inverse_transform(y_test.reshape(-1, 1))# 打印前几个预测结果print(f"前几个预测结果: \n{y_pred_inv[:10].flatten()}")print(f"前几个真实标签: \n{y_test_inv[:10].flatten()}")

绘制预测结果

# 绘制预测结果plt.figure(figsize=(12, 6))plt.plot(df.index[-len(y_test):], y_test_inv, label='真实值')plt.plot(df.index[-len(y_test):], y_pred_inv, label='预测值')plt.xlabel('日期')plt.ylabel('收盘价')plt.legend()plt.title('股票价格预测')plt.show()

实践

# 导入必要的库import numpy as npimport pandas as pdimport matplotlib.pyplot as pltfrom sklearn.preprocessing import MinMaxScalerfrom tensorflow.keras.models import Sequentialfrom tensorflow.keras.layers import Dense, LSTMfrom tensorflow.keras.optimizers import Adamfrom tushare.pro_api import ProApi# 设置 Tushare API Tokentoken = 'your_tushare_token'  # 请替换为你的 Tushare Tokenpro = ProApi(token)# 获取股票数据ts_code = '002594.SZ'  # 比亚迪股票代码start_date = '2018-01-01'end_date = '2023-06-05'df = pro.daily(ts_code=ts_code, start_date=start_date, end_date=end_date)# 将数据按日期排序df['trade_date'] = pd.to_datetime(df['trade_date'])df.set_index('trade_date', inplace=True)df.sort_index(inplace=True)# 选择收盘价作为预测目标df = df[['close']]print(f"股票数据: \n{df.head()}")# 标准化数据scaler = MinMaxScaler(feature_range=(0, 1))scaled_data = scaler.fit_transform(df)# 将标准化后的数据转换为 DataFramedf_scaled = pd.DataFrame(scaled_data, columns=['close'], index=df.index)print(f"标准化后的数据: \n{df_scaled.head()}")# 创建时间序列数据集def create_dataset(data, time_step=60):    X, y = [], []    for i in range(len(data) - time_step - 1):        a = data[i:(i + time_step), 0]        X.append(a)        y.append(data[i + time_step, 0])    return np.array(X), np.array(y)time_step = 60X, y = create_dataset(scaled_data, time_step)# 分割数据集为训练集和测试集train_size = int(len(X) * 0.8)test_size = len(X) - train_sizeX_train, X_test = X[0:train_size], X[train_size:len(X)]y_train, y_test = y[0:train_size], y[train_size:len(y)]# 重塑输入数据为 [samples, time_steps, features]X_train = X_train.reshape(X_train.shape[0], X_train.shape[1], 1)X_test = X_test.reshape(X_test.shape[0], X_test.shape[1], 1)# 定义 LSTM 模型model = Sequential()model.add(LSTM(50, return_sequences=True, input_shape=(time_step, 1)))model.add(LSTM(50, return_sequences=False))model.add(Dense(25))model.add(Dense(1))# 打印模型结构model.summary()# 编译模型model.compile(optimizer=Adam(learning_rate=0.001), loss='mean_squared_error')# 训练模型history = model.fit(X_train, y_train, epochs=50, batch_size=64, validation_data=(X_test, y_test))# 在测试集上评估模型loss = model.evaluate(X_test, y_test)print(f"测试集上的损失: {loss:.4f}")# 绘制训练过程中的损失plt.figure(figsize=(12, 4))plt.plot(history.history['loss'], label='训练损失')plt.plot(history.history['val_loss'], label='验证损失')plt.xlabel('Epoch')plt.ylabel('Loss')plt.legend()plt.title('训练和验证损失')plt.show()# 使用模型进行预测y_pred = model.predict(X_test)# 反标准化预测结果y_pred_inv = scaler.inverse_transform(y_pred)y_test_inv = scaler.inverse_transform(y_test.reshape(-1, 1))# 打印前几个预测结果print(f"前几个预测结果: \n{y_pred_inv[:10].flatten()}")print(f"前几个真实标签: \n{y_test_inv[:10].flatten()}")# 绘制预测结果plt.figure(figsize=(12, 6))plt.plot(df.index[-len(y_test):], y_test_inv, label='真实值')plt.plot(df.index[-len(y_test):], y_pred_inv, label='预测值')plt.xlabel('日期')plt.ylabel('收盘价')plt.legend()plt.title('股票价格预测')plt.show()

总结

通过今天的练习，你应该已经学会了如何使用 LSTM 网络进行时间序列预测，并能够使用 Keras 构建和训练一个简单的 LSTM 模型来预测股票价格

你可能感兴趣的:(数据分析,百度,经验分享)

企业如何构建基于YashanDB的数据分析系统数据库
随着大数据时代的到来，企业面临的一个核心技术问题是如何有效、快速地进行数据分析以指导决策。一个重要的性能瓶颈在于数据库的查询速度和存储结构的设计。尤其在处理海量数据时，如何在保证数据查询性能的同时确保数据的准确性和完整性，这问题显得尤为重要。YashanDB作为一个高性能的数据库系统，通过其独特的体系架构和强大的数据存储及访问机制，为企业构建高效的数据分析系统提供了可靠的技术支持。YashanDB
Spring Boot拦截器详解：原理、实现与应用场景嘵奇提升自己 spring boot 后端 java
精心整理了最新的面试资料和简历模板，有需要的可以自行获取点击前往百度网盘获取点击前往夸克网盘获取一、拦截器概述拦截器（Interceptor）是SpringMVC框架中用于对请求进行预处理和后处理的组件，主要作用于Controller层。相较于Filter（过滤器）作用于更底层，拦截器可以获取Spring的上下文信息，更适合处理与业务逻辑相关的请求拦截。拦截器与过滤器的区别：作用层面：Filter
ChatGPT、DeepSeek等大语言模型技术教程
随着人工智能技术的快速发展，大语言模型如ChatGPT和DeepSeek在科研领域的应用正在为科研人员提供强大的支持。这些模型通过深度学习和大规模语料库训练，能够帮助科研人员高效地筛选文献、生成论文内容、进行数据分析和优化机器学习模型。ChatGPT和DeepSeek能够快速理解和生成复杂的语言，帮助研究人员在撰写论文时提高效率，不仅生成高质量的文章内容，还能优化论文结构和语言表达。在数据分析方面
LLM大模型命名规则与部署硬件实践手册
文章目录一、理论基础：从信息编码到系统设计1.1命名系统的信息论基础1.2硬件架构与模型运行的关系1.3量化技术的数学原理二、国际主流模型命名规则深度解析2.1OpenAI：极简主义与功能导向2.2AnthropicClaude：诗意命名的技术内涵2.3GoogleGemini：统一品牌下的分层架构2.4MetaLlama：开源社区的透明化命名三、国内主流模型命名规则与文化内涵3.1百度文心：知识
Python爬虫实战：研究httplib2库相关技术 ylfhpy 爬虫项目实战 python 爬虫 php httplib2
1.引言1.1研究背景与意义随着互联网的快速发展，网络上的信息量呈爆炸式增长。如何从海量的网页中高效地获取有价值的数据，成为了当前信息技术领域的一个重要研究课题。网络爬虫作为一种自动获取互联网信息的程序，能够按照一定的规则，自动地抓取网页内容并提取和整理信息，为信息检索、数据分析、机器学习等领域提供了丰富的数据来源。在电子商务领域，爬虫可以用于价格监控、竞品分析和市场调研；在学术研究中，爬虫可以帮
Spring AI ETL Pipeline使用指南超级小忍 SpringAI spring 人工智能
前言（Introduction）版本声明：本文基于SpringAI1.0.0版本编写。由于SpringAI目前仍处于活跃开发阶段，API和组件可能在后续版本中发生变化，请注意及时关注官方文档更新以保持兼容性。在当今大数据和人工智能快速发展的背景下，ETL（Extract,Transform,Load）系统已经不再只是简单的数据搬运工。ETL是数据仓库和数据分析流程中的核心环节，它负责将分散的数据从
HashMap和HashSet的区别 weixin_44612246 java 开发语言
你可以先百度一下HashMap和HashSet的区别，有很多答案，包括但不限于：HashMap实现了Map接口，HashSet实现了Set接口。HashMap是保存key/value的集合，HashSet是保存对象的结合。HashMap不允许重复的键，但是允许重复的值，HashSet不允许重复的元素。HashMap允许有一个键为空，多个值为空，HashSet允许有一个空值。HashMap中使用pu
JavaScript性能优化实战：表格控件高效开发指南 javascript
引言在现代Web应用开发中，电子表格功能已成为数据分析、报表展示等场景的核心需求。SpreadJS作为一款高性能的纯前端电子表格控件，能够完美兼容Excel文件格式，支持百万级数据量和复杂公式计算。然而随着数据规模的增长和业务逻辑的复杂化，性能优化成为开发者必须面对的挑战。本文将深入剖析几种SpreadJS性能优化技巧，通过实际案例和代码演示，帮助开发者构建响应迅速、用户体验优异的电子表格应用。正
「字节跳动」我如何在一个月顺利通过测开实习岗，拿到offer 柠檬软件测试软件测试 python 软件测试功能测试测试工具 selenium
是基本情况：某交211小硕，研二，目标岗位测开大概从四月初开始找实习，也赶上了一波校招热潮，不过大都败在了笔试上（T^T，感觉经验超重要的~），经过了一个多月，顺利拿到了offer，也积累了许多经验，回头看看，也会不禁感慨，从一开始面试官说“你基础知识太薄弱了，怎么也要提前准备一下”到最近百度、头条面试官说“嗯嗯看得出来，你的基础知识非常扎实”我觉得对我来说，就是对这一个多月的肯定。找实习的过程中
数据仓库之星型模型 james二次元数据仓库大数据数据仓库
星型模型（StarSchema）是一种常见的数据仓库建模技术，专门用于支持高效的查询和数据分析。它以其简单直观的结构得名，中心是一个事实表（FactTable），周围是多个维度表（DimensionTables），整体结构看起来像一颗星。星型模型的组成部分事实表（FactTable）定义：存储与业务过程相关的数值型度量数据（Measures），如销售额、数量等。特征：主键：由多个外键组成，这些外键
深入浅出地讲解数据仓库建设中的业务建模方法论，包括实体联系视图模式、维度建模、星型模型、雪花模型、主题建模等 AI天才研究院 Python实战自然语言处理人工智能语言模型编程实践开发语言架构设计
作者：禅与计算机程序设计艺术1.简介数据分析师经历了从小处收集数据到中大型互联网公司的数据，面对海量数据和种类繁多的数据源头，如何快速准确地进行分析、建模、报表，成为众多数据分析师的共同心愿。而数据建模则是数据分析师的基础功课之一。数据建模作为数据分析师的一项关键技能和素质要求，其目标是将分析获得的数据转化成有意义的信息，并最终呈现给用户，能够帮助企业实现科学管理、优化决策、提升效益和服务能力。随
易语言数据分析小实例：数人头。用到：易数据库好开心啊没烦恼易语言数据分析数据库数据挖掘开发语言
目录（不如Python方便，已弃用易语言，但以“易语言”为工具的朋友可作参考。已测试通过。）------0需求1直接操作Excel表2易语言实现2.1导库2.2处理小插曲3欢迎纠错4论文写作/Python学习智能体------以下关于Markdown编辑器新的改变功能快捷键合理的创建标题，有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内
基于MCP架构的ChatBI：破解数据分析难题，让智能对话赋能商业决策码力金矿 MCP 人工智能 python 架构数据分析数据挖掘数据库 sql oceanbase 人工智能
在数据驱动的时代，传统BI工具操作复杂、效率低下，而ChatBI（对话式商业智能）的兴起为企业带来了新希望。本文将深入探讨一种基于MCP（ModelContextProtocol，模型上下文协议）架构的ChatBI解决方案，通过创新设计解决数据准确性、多指标查询及自动化分析等核心痛点。文章以技术拆解+实战案例的形式呈现，帮助您快速理解其原理与价值，助力企业高效实现智能数据分析。关键词：MCP、Ch
用Ruby脚本抓取百度MP3新歌Top 100发布到闲聊 iteye_8302 Ruby 百度脚本 Ruby PHP rubygems
昨天和ouspec闲聊谈到可以用[url=http://www.iteye.com/wiki/JavaEye/1499-javaeye-api-help]JavaEye的闲聊api[/url]做些什么：[url]http://quake.iteye.com/blog/chat/1766[/url][quote]用JavaEye的闲聊API可以做什么？举例子：你可以注册一个账号，写个小程序从某个"专
探索《非官方知乎 API》：解锁知乎数据的新方式
探索《非官方知乎API》：解锁知乎数据的新方式项目地址:https://gitcode.com/gh_mirrors/un/Unofficial-Zhihu-API在数据分析和社交媒体研究的世界里，拥有可靠的API是至关重要的。今天，我们将深入探讨一个由社区贡献的开源项目——。该项目提供了一个独特的方式，让你能够访问和解析知乎平台上的数据。项目简介非官方知乎API是由开发者littlepai创建的
【Python爬虫实战】全面抓取网页资源（图片、JS、CSS等）——超详细教程与源码解析 Python爬虫项目 python 爬虫 javascript 新浪微博开发语言 css 旅游
前言在互联网时代，网页数据已经成为重要的信息来源。许多时候，我们不仅需要抓取网页中的文字信息，还需要将网页中的各种资源文件（如图片、CSS样式表、JavaScript脚本文件等）一起抓取并保存下来。这种需求广泛应用于网页备份、离线浏览、数据分析等场景。本篇文章将带你从零开始，系统讲解如何使用Python最新技术，一步步实现抓取网页中所有静态资源的完整流程，包括：页面结构分析爬虫基本架构搭建异步爬取
用Python爬虫抓取网页中的视频文件：从数据获取到处理与保存的完整教程 Python爬虫项目 2025年爬虫实战项目 python 爬虫开发语言 selenium
一、引言随着在线视频平台的快速发展，视频成为了互联网中最重要的媒介之一。无论是用于娱乐、教育还是技术学习，视频内容都极大地改变了我们的信息获取方式。对于开发者、数据分析师或者研究者而言，获取和分析视频文件的数据不仅可以帮助他们深入理解某些平台的运营模式，也有助于建立自定义的多媒体内容库。爬虫技术是自动化抓取网页数据的一种工具。它通过模拟浏览器行为，抓取目标网页的内容。对于视频文件的抓取，尤其是那些
Python —— pandas 主要方法和常用属性（一）墨码笔记知识点 python 数据分析 Pandas
Pandas基础类型Series类型创建SeriesSeries的自定义索引读取SeriesPandaspandas数据分析统计包，是一款功能强大的用于数据分析的操作工具，由于其的实用性对操作数据的方便性广受欢迎，今天就来学习一下Pandas数据包的用法吧！在此之前推荐了解一下numpy基础类型说道数据类型，大家熟知的大概都是intstrbool等数据类型，或者是Python中的listtuple
Postman设置Referer头部的作用
设置HTTP请求头中的Referer字段主要有以下作用和意义：‌来源追踪与统计分析‌Referer用于记录用户访问当前页面的来源地址，帮助网站分析流量来源渠道（如搜索引擎、外部链接等），统计不同入口的转化率。例如统计来自谷歌或百度的搜索访问量，优化营销策略‌。‌防盗链保护‌通过检查Referer是否来自白名单域名，可防止其他网站直接盗用图片、视频等静态资源（如CDN加速场景）。若Referer不匹
Python 爬虫实战：知乎热榜趋势分析（话题生命周期 + 影响力评估） Python核芯 Python爬虫实战项目 python 爬虫开发语言
一、引言知乎作为国内知名的问答社区，其热榜功能汇聚了当下最受关注的话题。这些话题的热度变化反映了公众兴趣的动态，对于内容创作者、市场营销人员和数据分析师等具有极高的参考价值。本文将详细介绍如何通过Python和Scrapy技术实现知乎热榜数据的自动化爬取，并结合数据分析手段进行话题热度分析和趋势预测。二、目标网站分析（一）知乎热榜页面结构知乎热榜页面（https://www.zhihu.com/h
Python 爬虫实战：网易云音乐登录解密（加密参数逆向 + 音乐数据采集） Python核芯 Python爬虫实战项目 python 爬虫开发语言
一、前言网易云音乐作为国内流行的音乐平台，拥有海量的音乐资源和用户数据。通过爬取网易云音乐的数据，我们可以进行音乐推荐、用户行为分析等。本文将详细介绍如何使用Python爬取网易云音乐的数据，包括登录解密和音乐数据采集。二、准备工作1.环境搭建确保已安装Python3.7或以上版本，推荐使用VisualStudioCode作为开发工具。2.安装依赖库在命令行中安装爬虫和数据分析所需的库：pipin
深入探索 Vanna：让数据库交互更智能从零开始学习人工智能数据库交互
深入探索Vanna：让数据库交互更智能在数字化时代，与数据库进行高效交互是许多开发者、数据分析师和企业面临的挑战。传统的SQL查询编写不仅需要对数据库结构有深入的了解，还需要花费大量的时间和精力来调试和优化。Vanna，一个基于Python的开源工具，通过结合检索增强（RetrievalAugmentation）和大型语言模型（LLM），为这一问题提供了一个创新的解决方案。本文将深入探讨Vanna
嵌套列表与二维列表的遍历方法
在Python的世界中，列表（list）是最为基础而强大的数据结构之一。而当一个列表的元素本身又是列表时，我们便进入了嵌套列表（NestedList）或更通用的二维列表（2DList）的语境中。无论是在软件开发、测试数据构造、数据分析、机器学习、自动化运维还是教育教学场景中，嵌套结构的遍历与处理都是工程能力的一项基本功。本文将系统剖析Python中处理嵌套列表和二维列表的常用遍历方式，从基础语法到
巨头开源的背后，是价格战还是价值战？ CSDN资讯开源
当巨头们纷纷开源自家模型，他们背后的博弈是什么？放眼全球，谷歌在发布其王牌模型Gemini2.5Pro时，选择开源其衍生的轻量级模型Gemma，Meta的LLaMA虽名为开源，却始终带着商业限制的“镣铐”……他们小心谨慎地通过开源开放吸引全球开发者的关注，同时却牢牢掌控核心能力与商业变现路径。回到国内，从阿里通义千问全尺寸开源到DeepSeek的一鸣惊人，再到前几天百度开源其主力模型文心4.5。中
自学黑客技术多长时间能达到挖漏洞的水平？～小羊没烦恼～网络安全黑客技术黑客网络安全 web安全人工智能学习
作为一名白帽黑客，自学黑客技术是一种既刺激又实用的技能。然而，很多初学者都好奇，自学这门技术需要多长时间才能达到挖掘漏洞的水平。本文将从黑客的角度详细探讨这个问题，包括学习路径、实践方法和一些个人经验分享。自学路径概览黑客技术的自学可以分为几个阶段：基础知识学习、工具与技术掌握、实战演练和专业深造。每个阶段的时间长度可以根据个人的学习速度和投入时间的多少而有所不同。1.基础知识学习（1-3个月）初
百度颠覆了自己，飞算JavaAI造福了中国程序员！飞算JavaAI开发助手百度
在当今这个科技日新月异的时代，企业纷纷寻求技术突破，以期在激烈的市场竞争中脱颖而出。百度，作为中国互联网行业的领军企业之一，凭借其强大的科技实力和创新能力，在人工智能等多个领域取得了显著成就，并正在逐步颠覆自身的传统形象。百度自成立之初，就将技术创新视为企业的生命线。从最初的搜索引擎技术，到如今的深度学习、自然语言处理、计算机视觉等前沿领域，百度始终走在技术革新的前沿。其自主研发的飞桨深度学习平台
大模型智能运维详解：技术架构、落地挑战与行业实践 FreeTools FreeAiGuard 运维架构人工智能运维开发科技
大模型智能运维详解：技术架构、落地挑战与行业实践作者：开源大模型智能运维FreeAiOps在数字化转型加速的背景下，企业IT系统复杂度呈指数级增长，传统运维模式面临效率低下、故障定位困难、成本高昂等瓶颈。大模型技术的出现为智能运维提供了突破性解决方案，其通过自然语言处理、多模态数据分析与自动化决策能力，正在重塑运维工作的底层逻辑。本文将从技术原理、落地挑战、行业实践三个维度，系统解析大模型智能运维
10个可以快速用Python进行数据分析的小技巧_python 通径分析 2401_86043917 python 数据分析开发语言
df.iplot()![](https://img-blog.csdnimg.cn/img_convert/f3c1ad79e3c29ed0231d72af2988f6f9.jpeg)![](https://img-blog.csdnimg.cn/img_convert/dd456c392a2ddd14c649270707520e48.jpeg)df.iplot()vsdf.plot()右侧的可视
《R循环：深度解析与高效使用技巧》沐知全栈开发开发语言
《R循环：深度解析与高效使用技巧》引言R语言作为一种功能强大的统计计算和图形显示语言，被广泛应用于科研、数据分析、金融等领域。R循环是R语言中的核心概念之一，对于提高编程效率、处理复杂数据至关重要。本文将深度解析R循环，并介绍高效使用技巧，帮助读者更好地掌握R语言。一、R循环概述1.1什么是R循环R循环是指在R语言中，重复执行某个操作或代码段的过程。R循环包括for循环、while循环和repea
树莓派上基于Opencv 实现人脸检测与人脸识别土拨鼠不是老鼠 C++opencv 人工智能计算机视觉
一，需求基于树莓派4b，usb1080p摄像头，实现人脸检测与人脸识别。尝试了海陵科的模组和百度的sdk。海陵科的模组无法录入人脸，浪费了100多块钱。百度的sdk在树莓派上也无法录入人脸，官方解决不了。最后只能用opencv自己实现，因为只要实现最简单检测和识别就行，不在乎准确率。经测试opencv能满足基本要求，这里整理下思路。二，（1），加载模型并实例化Ptr和Ptr对象。树莓派4bopen
面向对象面向过程 3213213333332132 java
面向对象：把要完成的一件事，通过对象间的协作实现。面向过程：把要完成的一件事，通过循序依次调用各个模块实现。我把大象装进冰箱这件事为例，用面向对象和面向过程实现，都是用java代码完成。 1、面向对象 package bigDemo.ObjectOriented; /** * 大象类 * * @Description * @author FuJian
Java Hotspot: Remove the Permanent Generation bookjovi HotSpot
openjdk上关于hotspot将移除永久带的描述非常详细，http://openjdk.java.net/jeps/122 JEP 122: Remove the Permanent Generation Author Jon Masamitsu Organization Oracle Created 2010/8/15 Updated 2011/
正则表达式向前查找向后查找,环绕或零宽断言 dcj3sjt126com 正则表达式
向前查找和向后查找 1. 向前查找：根据要匹配的字符序列后面存在一个特定的字符序列(肯定式向前查找)或不存在一个特定的序列(否定式向前查找)来决定是否匹配。.NET将向前查找称之为零宽度向前查找断言。对于向前查找，出现在指定项之后的字符序列不会被正则表达式引擎返回。 2. 向后查找：一个要匹配的字符序列前面有或者没有指定的
BaseDao 171815164 seda
import java.sql.Connection; import java.sql.DriverManager; import java.sql.SQLException; import java.sql.PreparedStatement; import java.sql.ResultSet; public class BaseDao { public Conn
Ant标签详解--Java命令 g21121 Java命令
这一篇主要介绍与java相关标签的使用终于开始重头戏了，Java部分是我们关注的重点也是项目中用处最多的部分。 1
[简单]代码片段_电梯数字排列 53873039oycg 代码
今天看电梯数字排列是9 18 26这样呈倒N排列的,写了个类似的打印例子，如下: import java.util.Arrays; public class 电梯数字排列_S3_Test { public static void main(S
Hessian原理云端月影 hessian原理
Hessian 原理分析一．远程通讯协议的基本原理网络通信需要做的就是将流从一台计算机传输到另外一台计算机，基于传输协议和网络 IO 来实现，其中传输协议比较出名的有 http 、 tcp 、 udp 等等， http 、 tcp 、 udp 都是在基于 Socket 概念上为某类应用场景而扩展出的传输协
区分Activity的四种加载模式----以及Intent的setFlags aijuans android
在多Activity开发中，有可能是自己应用之间的Activity跳转，或者夹带其他应用的可复用Activity。可能会希望跳转到原来某个Activity实例，而不是产生大量重复的Activity。这需要为Activity配置特定的加载模式，而不是使用默认的加载模式。加载模式分类及在哪里配置 Activity有四种加载模式： standard singleTop
hibernate几个核心API及其查询分析 antonyup_2006 html .net Hibernate xml 配置管理
(一) org.hibernate.cfg.Configuration类读取配置文件并创建唯一的SessionFactory对象.(一般,程序初始化hibernate时创建.) Configuration co
PL/SQL的流程控制百合不是茶 oracle PL/SQL编程循环控制
PL/SQL也是一门高级语言,所以流程控制是必须要有的,oracle数据库的pl/sql比sqlserver数据库要难,很多pl/sql中有的sqlserver里面没有流程控制; 分支语句 if 条件 then 结果 else 结果 end if ; 条件语句 case when 条件 then 结果; 循环语句 loop
强大的Mockito测试框架 bijian1013 mockito 单元测试
一.自动生成Mock类在需要Mock的属性上标记@Mock注解，然后@RunWith中配置Mockito的TestRunner或者在setUp()方法中显示调用MockitoAnnotations.initMocks(this);生成Mock类即可。二.自动注入Mock类到被测试类 &nbs
精通Oracle10编程SQL(11)开发子程序 bijian1013 oracle 数据库 plsql
/* *开发子程序 */ --子程序目是指被命名的PL/SQL块，这种块可以带有参数，可以在不同应用程序中多次调用 --PL/SQL有两种类型的子程序：过程和函数 --开发过程 --建立过程：不带任何参数 CREATE OR REPLACE PROCEDURE out_time IS BEGIN DBMS_OUTPUT.put_line(systimestamp); E
【EhCache一】EhCache版Hello World bit1129 Hello world
本篇是EhCache系列的第一篇，总体介绍使用EhCache缓存进行CRUD的API的基本使用，更细节的内容包括EhCache源代码和设计、实现原理在接下来的文章中进行介绍环境准备 1.新建Maven项目 2.添加EhCache的Maven依赖 <dependency> <groupId>ne
学习EJB3基础知识笔记白糖_ bean Hibernate jboss webservice ejb
最近项目进入系统测试阶段，全赖袁大虾领导有力，保持一周零bug记录，这也让自己腾出不少时间补充知识。花了两天时间把“传智播客EJB3.0”看完了，EJB基本的知识也有些了解，在这记录下EJB的部分知识，以供自己以后复习使用。 EJB是sun的服务器端组件模型，最大的用处是部署分布式应用程序。EJB (Enterprise JavaBean)是J2EE的一部分，定义了一个用于开发基
angular.bootstrap boyitech AngularJS AngularJS API angular中文api
angular.bootstrap 描述：手动初始化angular。这个函数会自动检测创建的module有没有被加载多次，如果有则会在浏览器的控制台打出警告日志，并且不会再次加载。这样可以避免在程序运行过程中许多奇怪的问题发生。使用方法： angular .
java-谷歌面试题-给定一个固定长度的数组，将递增整数序列写入这个数组。当写到数组尾部时，返回数组开始重新写，并覆盖先前写过的数 bylijinnan java
public class SearchInShiftedArray { /** * 题目：给定一个固定长度的数组，将递增整数序列写入这个数组。当写到数组尾部时，返回数组开始重新写，并覆盖先前写过的数。 * 请在这个特殊数组中找出给定的整数。 * 解答： * 其实就是“旋转数组”。旋转数组的最小元素见http://bylijinnan.iteye.com/bl
天使还是魔鬼？都是我们制造 ducklsl 生活教育情感
----------------------------剧透请原谅，有兴趣的朋友可以自己看看电影，互相讨论哦！！！从厦门回来的动车上，无意中瞟到了书中推荐的几部关于儿童的电影。当然，这几部电影可能会另大家失望，并不是类似小鬼当家的电影，而是关于“坏小孩”的电影！自己挑了两部先看了看，但是发现看完之后，心里久久不能平
[机器智能与生物]研究生物智能的问题 comsci 生物
我想,人的神经网络和苍蝇的神经网络,并没有本质的区别...就是大规模拓扑系统和中小规模拓扑分析的区别.... 但是,如果去研究活体人类的神经网络和脑系统,可能会受到一些法律和道德方面的限制,而且研究结果也不一定可靠,那么希望从事生物神经网络研究的朋友,不如把
获取Android Device的信息 dai_lm android
String phoneInfo = "PRODUCT: " + android.os.Build.PRODUCT; phoneInfo += ", CPU_ABI: " + android.os.Build.CPU_ABI; phoneInfo += ", TAGS: " + android.os.Build.TAGS; ph
最佳字符串匹配算法（Damerau-Levenshtein距离算法）的Java实现 datamachine java 算法字符串匹配
原文：http://www.javacodegeeks.com/2013/11/java-implementation-of-optimal-string-alignment.html------------------------------------------------------------------------------------------------------------
小学5年级英语单词背诵第一课 dcj3sjt126com english word
long 长的 show 给...看，出示 mouth 口，嘴 write 写 use 用，使用 take 拿，带来 hand 手 clever 聪明的 often 经常 wash 洗 slow 慢的 house 房子 water 水 clean 清洁的 supper 晚餐 out 在外 face 脸，
macvim的使用实战 dcj3sjt126com mac vim
macvim用的是mac里面的vim, 只不过是一个GUI的APP, 相当于一个壳 1. 下载macvim https://code.google.com/p/macvim/ 2. 了解macvim :h vim的使用帮助信息 :h macvim
java二分法查找蕃薯耀 java二分法查找二分法 java二分法
java二分法查找 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月23日 11:40:03 星期二 http:/
Spring Cache注解+Memcached hanqunfeng spring memcached
Spring3.1 Cache注解依赖jar包：  <dependency> <groupId>com.google.code.simple-spring-memcached</groupId> <artifactId>simple-s
apache commons io包快速入门 jackyrong apache commons
原文参考 http://www.javacodegeeks.com/2014/10/apache-commons-io-tutorial.html Apache Commons IO 包绝对是好东西，地址在http://commons.apache.org/proper/commons-io/，下面用例子分别介绍： 1）工具类 2
如何学习编程 lampcy java 编程 C++c
首先,我想说一下学习思想.学编程其实跟网络游戏有着类似的效果.开始的时候,你会对那些代码,函数等产生很大的兴趣,尤其是刚接触编程的人,刚学习第一种语言的人.可是,当你一步步深入的时候,你会发现你没有了以前那种斗志.就好象你在玩韩国泡菜网游似的,玩到一定程度,每天就是练级练级,完全是一个想冲到高级别的意志力在支持着你.而学编程就更难了,学了两个月后,总是觉得你好象全都学会了,却又什么都做不了,又没有
架构师之spring-----spring3.0新特性的bean加载控制@DependsOn和@Lazy nannan408 Spring3
1.前言。如题。 2.描述。 @DependsOn用于强制初始化其他Bean。可以修饰Bean类或方法，使用该Annotation时可以指定一个字符串数组作为参数，每个数组元素对应于一个强制初始化的Bean。 @DependsOn({"steelAxe","abc"}) @Comp
Spring4+quartz2的配置和代码方式调度 Everyday都不同代码配置 spring4 quartz2.x 定时任务
前言：这些天简直被quartz虐哭。。因为quartz 2.x版本相比quartz1.x版本的API改动太多，所以，只好自己去查阅底层API…… quartz定时任务必须搞清楚几个概念： JobDetail——处理类 Trigger——触发器，指定触发时间，必须要有JobDetail属性，即触发对象 Scheduler——调度器，组织处理类和触发器，配置方式一般只需指定触发
Hibernate入门 tntxia Hibernate
前言使用面向对象的语言和关系型的数据库，开发起来很繁琐，费时。由于现在流行的数据库都不面向对象。Hibernate 是一个Java的ORM（Object/Relational Mapping）解决方案。 Hibernte不仅关心把Java对象对应到数据库的表中，而且提供了请求和检索的方法。简化了手工进行JDBC操作的流程。如
Math类 xiaoxing598 Math
一、Java中的数字（Math）类是final类，不可继承。 1、常数 PI：double圆周率 E：double自然对数 2、截取（注意方法的返回类型） double ceil(double d) 返回不小于d的最小整数 double floor(double d) 返回不大于d的整最大数 int round(float f) 返回四舍五入后的整数 long round