水w

深度学习之 9 前馈神经网络2：实现前馈神经网络，模型调优

上一篇我们了解了前馈神经网络的基础概念知识之后，本文来实现前馈神经网络。本文是接着上一篇深度学习之 9 前馈神经网络基本概念_水w的博客-CSDN博客

目录

手动实现前馈神经网络

（1）数据集介绍

➢ Fashion-MNIST数据集下载

➢ 批量读取数据，采用torch.utils.data.DataLoader读取小批量数据

（2）模型设计（包含一个隐藏层）

（3）代码实现

➢ 模型参数定义及初始化

➢ 定义激活函数，我们选用ReLU作为激活函数

➢ 定义模型，随机梯度下降函数，交叉熵损失函数，

➢ 计算模型在某个数据集上的准确率

➢ 定义模型训练函数

➢ 训练模型

Torch.nn实现前馈神经网络

（3）代码实现

➢ 实现FlattenLayer层

➢ 模型定义和参数初始化

➢ 计算模型在某个数据集上的准确率和loss

➢ 设置训练轮次、学习率、损失函数和优化器

➢ 模型训练，保存训练集和验证集的loss

➢ 训练结果和loss曲线绘制

➢ 绘制loss曲线

模型调优

（1）实验数据划分

◼ 手动实现K折交叉验证

（2）模型选择、欠拟合、过拟合

◼ 多项式函数拟合实验探究影响欠拟合、过拟合的因素

（3）过拟合问题的常用方法——L 2 范数正则化

◼ 以高维线性回归为例来引入一个过拟合问题

◼ 手动实现范数正则化

◼ 利用torch.optim的weight_decay参数实现范数正则化

（4）应对过拟合问题的常用方法——Dropout

◼ 手动实现dropout

◼ 利用torch.nn.Dropout层实现dropout

手动实现前馈神经网络

（1）数据集介绍

采用Fashion-MNIST数据集完成多分类任务。

训练集：60,000 测试集：10,000

每个样本的数据格式为：28*28*1（高*宽*通道）

Fashion-MNIST中包含的10个类别分别为：

t-shirt（T恤）、trouser（裤⼦）、pullover（套衫）、dress（连⾐裙）、

coat（外套）、sandal（凉鞋）、shirt（衬衫）、sneaker（运动鞋）、bag（包）和ankle boot（短靴）。

➢ Fashion-MNIST数据集下载

➢ 批量读取数据，采用torch.utils.data.DataLoader读取小批量数据

采用torch.utils.data.DataLoader读取小批量数据：

        batch_size是超参数，表示一轮训练多少个样本

        shuffle是否打乱数据，True表示打乱数据

        num_workers=0表示不开启多线程读取数据

（2）模型设计（包含一个隐藏层）

输出层神经元个数：10（对应10个类别） W2∈R10*256

隐藏层神经元个数：256 W1∈R256*784

输入神经元个数：784 （每个样本是28*28*1）

（3）代码实现

➢ 模型参数定义及初始化

➢ 定义激活函数，我们选用ReLU作为激活函数

➢ 定义模型，随机梯度下降函数，交叉熵损失函数，

➢ 计算模型在某个数据集上的准确率

➢ 定义模型训练函数

➢ 训练模型

⚫ 设置训练轮次为10轮

⚫ 学习率为0.1

⚫ 优化器采用默认的SGD函数

Torch.nn实现前馈神经网络

（3）代码实现

➢ 实现FlattenLayer层

➢ 模型定义和参数初始化

➢ 计算模型在某个数据集上的准确率和loss

➢ 设置训练轮次、学习率、损失函数和优化器

➢ 模型训练，保存训练集和验证集的loss

➢ 训练结果和loss曲线绘制

➢ 绘制loss曲线

模型调优

◼ 训练过程中所用样本：训练集 —— 经验误差   → 经验误差最小化

◼ 进行预测中所用样本：测试集 —— 测试误差 ...… 泛化误差最小化

◼ 训练集与测试集应尽可能互斥

◼ 常用划分方法：

        ➢ 留出法：对于数据集D，SUT=D，S∩T=Φ

        ➢ 交叉验证法：将数据集D分成大小相似的K个互斥子集，然后每次用其中的K-1份训练，1份测试

        ➢ 自助法：自助采样

（1）实验数据划分

◼ 手动实现K折交叉验证

K折交叉验证：将数据集分层采样划分为k个大小相似的互斥子集，每次用k-1个子集的并集作为训练集，余下的子集作为测试集，最终返回k个测试结果的均值，k 最常用的取值是10。

➢ 创建数据集

➢ 获取k折交叉验证某一折的训练集和验证集

➢ 数据划分示例

➢ 依次对每一折数据进行训练和测试，并计算k折平均值

一个大概的框架：

（2）模型选择、欠拟合、过拟合

◼ 过拟合

        ⚫ 表现：模型在训练集上正确率很高，但是在测试集上正确率很低

        ⚫ 造成原因：由于训练数据少和噪声以及模型能力强等原因造成的过拟合

        ⚫ 解决办法：优化目标加正则项；Dropout；早停机制

◼ 欠拟合

        ⚫ 表现：模型在训练集和测试集上的正确率都很低

        ⚫ 造成原因：由于模型能力不足造成的

        ⚫ 解决办法：增加模型复杂度

◼ 多项式函数拟合实验探究影响欠拟合、过拟合的因素

◼ 给定样本特征，使用如下的三阶多项式函数来生成样本的标签

➢ 形成数据集：设置噪声项服从均值为0、标准差为0.1的正态分布。训练数据集和测试数据集的样本数都设为100

➢ 定义作图函数Draw_Loss_Curve

➢ 模型定义和训练函数定义

体会：

◼ 使用三阶多项式函数拟合（理想）

➢ 使用与数据生成函数同阶的三阶多项式函数拟合，学习到的模型参数接近真实值

◼ 使用线性函数拟合（用线性去拟合三阶的：欠拟合）

➢ 将模型复杂度降低：使用线性函数。训练集和测试集的loss在后期均很难下降，出现欠拟合

◼ 训练样本过少（过拟合）

➢ 只使用两个样本来训练模型，训练集loss持续下降，测试集loss上升，出现了过拟合

（3）过拟合问题的常用方法——L 2 范数正则化

⚫ 在模型原损失函数基础上添加2范数惩罚项，通过惩罚绝对值较大的模型参数为需要学习的模型增加限制，来应对过拟合问题。带有2范数惩罚项的模型的新损失函数为:

其中w是参数向量，是模型原损失函数，n是样本个数，是超参数

◼ 以高维线性回归为例来引入一个过拟合问题

◼ 以高维线性回归为例来引入一个过拟合问题，并使用权重衰减来应对过拟合设数据样本特征的维度为p，使用如下函数生成样本的标签：

其中噪声项服从均值为0、标准差为0.01的正态分布。设p=200，设置训练集样本数为20，测试集样本数位100来引入过拟合的情况。

➢ 生成数据集

◼ 手动实现范数正则化

◼ 手动实现范数正则化

➢ 定义随机初始化模型参数的函数，均方误差

➢ 定义2范数惩罚项，随机梯度下降函数

➢ 定义模型

➢ 定义训练函数

◼ 利用torch.optim的weight_decay参数实现范数正则化

◼ 利用torch.optim的weight_decay参数实现范数正则化

➢ 定义训练函数

（4）应对过拟合问题的常用方法——Dropout

每次选择丢弃的神经元是随机的。最简单的方法是设置一个固定的概率 p。对每一个神经元都以概率p来判定要不要保留。

◼ 手动实现dropout

◼ 手动实现dropout

以前馈神经网络为例，当使用dropout时，前馈神经网络隐藏层中的隐藏单元ℎ有一定概率被丢弃掉。

➢ 设丢弃概率为p，那么有p的概率会被清零，有1−p的概率会除以1−p做拉伸。由此定义进行dropout操作的函数

➢ 初始化一个向量X，对X进行dropout，分别设置丢弃率为0、0.5、1，实验结果如下：

➢ 定义模型参数（使用Fashion-MNIST数据集进行实验）

➢ 定义使用dropout的网络模型，两个隐藏层的丢弃率分别为0.2和0.5

➢ 定义计算准确率的函数

➢ 训练模型的部分与1.5中相同，此处不再赘述。实验结果如下

◼ 利用torch.nn.Dropout层实现dropout

◼ 利用torch.nn.Dropout层实现dropout

➢ 定义模型

➢ 定义计算准确率的函数（eval()和train()来切换模型的状态）

➢ 实验结果

你可能感兴趣的:(#,深度学习,深度学习,神经网络,人工智能,python)

使用python进行单因素方差分析（ANOVA）和事后多重比较(LSD) thinkwindows 数据分析 python 算法 excel
#idea来源#在使用spss帮朋友做单因素分析时，发现个别数据需要调整到符合显著性的要求，在spss中修改数据，再在spss中操作步骤太麻烦，于是有了这个想法。程序思路1、将数据放到excel里，确定两列数据，Group（分组数据）和B（对应数据列）2、程序读取excel数据3、整理数据格式，将数据分组，将数据从宽格式转换为长格式，以便于进行ANOVA分析。4、执行单因素方差分析（ANOVA），
linux-Openmanus本地部署-AI-Agent初探世转神风- manus manus
文章目录简介官网指导widows安装linux安装安装依赖项报错配置快速入门别急效果展示简介上来先不说其它的，先给你们稳定军心……要尝试的兄弟，放心尝试，占用空间并不大，部署下来，不超过10G。官网指导网址官网指导，比较全面。我只挑重点。widows安装在B站上，有人用过，我就不细讲了。condacreate-nopen_manuspython=3.12condaactivateopen_manu
从原理和公式出发：python实现One_Way_ANOVA ＾哪来的＆永远～ python 算法概率论
文章目录目的：python实现onewayANOVA单因素方差分析1.代码流程2.python代码实现0主要的函数1加载数据2查看数据统计结果3数据处理及可视化4方差分析4.1模型拟合4.2单因素方差分析5PostHoct-test组间比较分析6根据定义自行分解计算对比调用函数的结果7获取F分布对应的P值3.方差分析公式及原理参考目的：python实现onewayANOVA单因素方差分析方差分析(
2025年北京市海淀区信息奥赛真题解析（小学组）热爱编程的通信人 c++白名单信息学奥赛
欢迎大家订阅我的专栏：算法题解：C++与Python实现！本专栏旨在帮助大家从基础到进阶，逐步提升编程能力，助力信息学竞赛备战！专栏特色1.经典算法练习：根据信息学竞赛大纲，精心挑选经典算法题目，提供清晰的代码实现与详细指导，帮助您夯实算法基础。2.系统化学习路径：按照算法类别和难度分级，从基础到进阶，循序渐进，帮助您全面提升编程能力与算法思维。适合人群：准备参加蓝桥杯、GESP、CSP-J、CS
python anova_使用Python进行双向ANOVA的三种方法 cumei1658 python 机器学习深度学习人工智能数据分析
pythonanovaInanearlierpostIshowedfourdifferenttechniquesthatenablestwo-wayanalysisofvariance(ANOVA)usingPython.Inthispostwearegoingtolearnhowtodotwo-wayANOVAforindependentmeasuresusingPython.在较早的文章中，我
下一个十年财富风口？智享AI三代直播系统招商通道正式开启 V__17671155793 人工智能大数据人工智能 python
下一个十年财富风口？智享AI三代直播系统招商通道正式开启！2024年的商业世界正经历着百年未有的变局。当马斯克的脑机接口突破伦理边界，当ChatGPT重构知识生产关系，一个更宏大的叙事正在浮出水面——**人工智能不再是工具，而是新经济文明的操作系统**。在这场浪潮中，智享AI三代直播系统如同一枚核动力引擎，轰然开启了一个价值万亿的财富航道。它不仅是技术的集大成者，更是未来十年商业规则的制定者。此刻
pythonSTL---sys MzKyle python库服务器运维 python
sys是Python标准库中的一个内置模块，它提供了许多与Python解释器和系统环境进行交互的功能。1.导入sys模块在使用sys库的功能之前，需要先导入它：importsys2.命令行参数(sys.argv)sys.argv是一个包含命令行参数的列表。其中，sys.argv[0]是脚本的名称，后续的元素是传递给脚本的参数。importsys#打印脚本名称print(f"脚本名称:{sys.ar
ANOVA：在Python中构建和理解ANOVA（方差分析） python收藏家 python 数据科学 python
ANOVA（方差分析）是一种统计技术，用于确定三个或更多独立（不相关）组的平均值之间是否存在任何统计学显著差异。它有助于检验关于组间均值差异的假设，在比较多个组时特别有用。在Python中，可以使用scipy.stats模块中的f_oneway函数来执行单因素方差分析（one-wayANOVA），或者使用statsmodels库中的ANOVA类来进行更复杂的方差分析。重要概念总体均值（Popula
【实践】Python爬取豆瓣电影排行榜页面数据大数据张老师 Python程序设计 python 开发语言
在本节中，我们将使用requests库爬取豆瓣电影排行榜页面数据。通过一步步实操，学习如何使用requests库发送HTTP请求、获取网页HTML数据，并为后续的网页解析做好准备。1.目标：获取豆瓣电影排行榜的网页数据豆瓣电影提供了电影排行榜页面，网址如下：https://movie.douban.com/top250在本节中，我们的目标是：访问豆瓣电影排行榜页面。获取该页面的HTML数据。解析并
Python----计算机视觉处理（opencv：像素，RGB颜色，图像的存储，opencv安装，代码展示）蹦蹦跳跳真可爱589 Python opencv 图像处理计算机视觉 python opencv 人工智能
一、计算机眼中的图像像素像素是图像的基本单元，每个像素存储着图像的颜色、亮度和其他特征。一系列像素组合到一起就形成了完整的图像，在计算机中，图像以像素的形式存在并采用二进制格式进行存储。根据图像的颜色不同，每个像素可以用不同的二进制数表示。日常生活中常见的图像是RGB三原色图。RGB图上的每个点都是由红（R）、绿（G）、蓝（B）三个颜色按照一定比例混合而成的，几乎所有颜色都可以通过这三种颜色按照不
【python】修改 python pip install 镜像源非晓为骁 python python pip 开发语言
要在使用python-mpipinstall-rrequirements.txt时添加腾讯的镜像源，可以通过-i或--index-url参数指定镜像源地址。腾讯云的PyPI镜像源地址是：https://mirrors.cloud.tencent.com/pypi/simple具体命令将腾讯云的镜像源添加到命令中，如下所示：python-mpipinstall-rrequirements.txt-i
CentOS7 部署flask和paddleX M1412 系统运维 centos paddlepaddle flask
CentOS7部署flask和paddleX1、官网下载anaconda，部署python环境#权限chmod+xAnaconda3-2020.11-Linux-x86_64.sh#安装anacondabashAnaconda3-2020.11-Linux-x86_64.sh#生效启动condasource~/.bashrc#创建虚拟环境condacreate-nweb_devpython=3.7
AI双轨革命：DeepSeek与Manus 人工智能aigc
DeepSeek与Manus是当前人工智能领域备受关注的两款产品，它们在技术定位、核心能力及适用场景上存在显著差异，但并非直接竞争关系，而是形成互补。一、技术架构与核心能力DeepSeek：知识型“最强大脑”技术架构：基于混合专家模型（MoE），参数规模达6710亿，专注于语言模型的极致优化，擅长知识推理、文本生成与专业问题解答。核心优势：语言理解与生成：中文知识问答正确率达64.1%，在学术论文
Bottleneck、CSP、DP结构详细介绍 CV工程师小朱深度学习笔记人工智能深度学习 CSP 深度可分离残差网络
文章目录前言一、BottleneckDarknetBottleneck二、CSPCSP思想pp-picodet中的CSPLayerDP卷积前言本篇文章详细介绍了三种神经网络中常见的结构，bottleneck、CSP、DP，并附上了代码加深理解。一、BottleneckBottleneck出现在ResNet50/101/152这种深层网络中，基本思想就是先用1x1减少通道数再进行卷积最后再通过1x1
centos7正式服务器部署uwsgi+nginx+django项目-亲身研究[斜眼笑] pyswt Django centos python nginx centos
服务器是centos7的，首先从安装python3开始安装依赖包yuminstallzlib-develbzip2-developenssl-develncurses-develsqlite-develreadline-develtk-develgcc*make-y然后安装python3wgethttps://www.python.org/ftp/python/3.5.2/Python-3.5.2
鸿蒙生态下的AI革新：大模型如何重塑移动应用开发？从写代码到写Prompt，解锁鸿蒙原生应用高效开发秘籍 harmonyos
当前，大模型技术正在重新定义软件工程。一方面，大模型降低了软件开发门槛。在过去，软件开发者被划分为全民开发者、应用开发者和专业开发者，随着大模型技术的介入，软件开发变得触手可及，一些简单的应用甚至能够直接通过人工智能生成。另一方面，大模型技术显著提升了开发效率。它能够根据开发者的简单描述快速生成大量的代码片段，大幅度地缩短了编码时间，为软件开发领域带来了革命性的变化。在2024年12月14日AIC
【人工智能数学基础】——深入详解贝叶斯理论：掌握贝叶斯定理及其在分类和预测中的应用猿享天开人工智能数学基础专讲分类数据挖掘人工智能贝叶斯数学
深入详解贝叶斯理论：掌握贝叶斯定理及其在分类和预测中的应用贝叶斯理论（BayesianTheory）是概率论和统计学中的一个重要分支，它以托马斯·贝叶斯（ThomasBayes）命名，主要关注如何根据新的证据更新对某一事件的信念。贝叶斯定理作为贝叶斯理论的核心，在机器学习、数据分析、决策科学等多个领域中具有广泛的应用。本文将深入探讨贝叶斯定理的理论基础、数学表达及其在分类和预测中的应用，辅以实例和
文档处理的数字化和革新 - ComIDP
在当今快节奏的环境中，企业不断寻求创新解决方案以精简操作并自动化手动任务。ComIDP是由ComPDFKit提供的先进的智能文档处理（IDP）解决方案，它作为一个强大工具，旨在改变组织管理文档的方式。什么是智能文档处理？智能文档处理是一种结合了人工智能（AI）、机器学习（ML）和光学字符识别（OCR）的技术，用于自动提取各种文档格式中的有价值信息。与传统的数据捕获方法需要大量手动干预不同，IDP利
WWDC 2024 for iOS 18 - 高度自定义智能产品 wwdc-20wwdc
随着人工智能的风潮涌入移动电话行业，iOS18带来了许多重大变革，极大地增强了个性化定制的可能性。让我们一起探索在WWDC2024上针对iOS18所展示的变化，以及这些变化对我们有什么用处iOS18的变化1.壁纸AI：自由更换壁纸颜色，任何你想要的颜色2.iOS控制中心：访问你每天需要用到的功能（那你是否需要提前在你的iOS上录入你的行程呢？）从右上角滑动来自定义你的控制中心（每个控件都可以根据你
Centos部署Django 一万句的秘密 python 数据库开发 django 分布式 centos
1.安装miniconda(python3.7环境)wgethttps://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.shshMiniconda3-latest-Linux-x86_64.sh刷新环境变量（第3步）出现（base）即可2.给miniconda添加镜像源condaconfig--addchannelshttp
Python——程序设计方法上课不要睡觉了 Python知识体系 python 算法 c++
Python——程序设计方法程序是完成一定功能的指令的集合,用于解决特定的计算问题。按照软件工程的思想,程序设计可以分为分析、设计、实现、测试、运行等阶段。结构化程序设计是一种典型的程序设计方法,是程序设计的基础思想,它是把一个复杂程序逐级分解成若干个相互独立的程序,然后再对每个程序进行设计与实现。程序在具体实现上遵循了一定的模式,典型的程序设计模式是IPO模式,也就是程序由输入(Input)、处
python中lambda函数如何使用用完记得换回去 python 开发语言
在Python中，lambda函数是一种匿名函数，即没有名字的函数。lambda函数可以接受任意数量的参数，但只能有一个表达式，这个表达式的值会被自动返回。lambda函数通常用于需要简单函数对象的场合，比如排序、映射等。以下是lambda函数的基本语法：lambdaarguments:expression以下是一些lambda函数的使用示例：1.简单的lambda函数add=lambdax,y:
Python数据可视化自动化工具：让数据跃然纸上 Echo_Wish Python 算法 Python 笔记从零开始学Python人工智能信息可视化 python 自动化
友友们好！我是Echo_Wish，我的的新专栏《Python进阶》以及《Python！实战！》正式启动啦！这是专为那些渴望提升Python技能的朋友们量身打造的专栏，无论你是已经有一定基础的开发者，还是希望深入挖掘Python潜力的爱好者，这里都将是你不可错过的宝藏。在这个专栏中，你将会找到：●深入解析：每一篇文章都将深入剖析Python的高级概念和应用，包括但不限于数据分析、机器学习、Web开发
已解决FileNotFoundError: [Errno 2] No such file or directory: ‘xxx‘ 高质量海王哦 python python
在Python编程中，FileNotFoundError是一个常见的异常，通常意味着程序尝试访问一个不存在的文件或目录。这个错误可能会影响程序的正常运行，并让开发者困惑，尤其是当路径看似正确时。本文将深入探讨FileNotFoundError的成因，提供具体的代码示例，并详细阐述几种有效的解决方法，以帮助读者迅速定位和解决此问题。已成功解决FileNotFoundError:[Errno2]Nos
python能否控制plc_小说python操作PLC 狮子坤 python能否控制plc
PLC(ProgrammableLogicController)可编程逻辑控制器，可以理解为一个微型计算机，广泛应用于工业控制中，如楼宇智控、精密机床、汽车电子等等。随着物联网的兴起，越来越多的传统工业设备需要和外界通信，但很多情况下，类似PLC这种微控制器，由于自身硬件的因素，无法直接与外界互联互通，通过PC这种上位机作为一个中介桥梁，为PLC与外界沟通打开了一扇门。Python作为当前最火的语
Python - sys 库的详细介绍 wanglaqqqq #文件与系统操作 python 开发语言
Python的sys模块是一个与Python解释器交互的核心标准库，提供了对解释器参数、运行环境、系统资源的访问和控制。以下是sys模块的核心内容及常用函数详解：一、sys模块的核心功能类别功能描述命令行参数获取脚本启动时的命令行参数（sys.argv）。程序退出控制脚本退出状态（sys.exit()）。模块与路径管理管理模块导入路径（sys.path）和已加载模块（sys.modules）。系统
算力服务器主要是指什么？ wanhengidc 服务器运维
随着科技的快速发展，人工智能也逐渐兴起，算力服务器也受到了各个企业的重视，本文就来为大家介绍一下算力服务器主要都是指什么吧！算力服务器对于人工智能领域来说，在深度学习模型的训练和推理过程中扮演着非常重要的角色，算力服务器可以执行大规模的矩阵计算，加速神经网络的训练和推理过程，帮助企业使得模型训练的时间大幅度缩短。算力服务器通常会配备高速网络接口，以此来实现快速的数据信息传输速度和通信速度，同时高速
Sglang部署大模型常用参数详解小树苗m sglang vllm deepseek
Sglang部署大模型常用参数详解常用启动命令HTTP服务器配置API配置并行处理张量并行数据并行专家并行内存和调度其他运行时选项日志记录多节点分布式服务LoRA内核后端约束解码推测解码双稀疏性调试选项优化选项参数概览常用启动命令要启用多GPU张量并行性，请添加--tp2。如果报告错误“这些设备之间不支持对等访问”，请在服务器启动命令中添加--enable-p2p-check。python-msg
使用LangChain构建强大的对话机器人：详细指南 m0_57781768 langchain 机器人服务器
使用LangChain构建强大的对话机器人：详细指南引言在人工智能（AI）迅猛发展的今天，对话机器人已成为各行业不可或缺的一部分。无论是客服支持、虚拟助手还是智能家居系统，对话机器人都发挥着重要作用。本文将详细介绍如何使用LangChain构建一个功能强大的对话机器人，能够进行对话并记住先前的互动。我们将从环境设置开始，逐步讲解如何使用语言模型、提示模板、对话历史管理等关键技术，最终展示如何使用L
【Python】requests获取网络响应的时候，遇到url超过最大重试次数的解决方法翠花上酸菜 python Exception python 网络开发语言网络爬虫网络协议
我们在使用requests连接网址后，获取网络响应的时候，有时候可能会遇到这样的问题：问题：Maxretriesexceededwithurl:/tags-%E9%A1%B9%E7%9B%AE-5.html(CausedbySSLError(SSLEOFError(8,‘EOFoccurredinviolationofprotocol(ssl.c:1129)’)))这是指，在使用requests库
Java实现的基于模板的网页结构化信息精准抽取组件：HtmlExtractor yangshangchuan 信息抽取 HtmlExtractor 精准抽取信息采集
HtmlExtractor是一个Java实现的基于模板的网页结构化信息精准抽取组件，本身并不包含爬虫功能，但可被爬虫或其他程序调用以便更精准地对网页结构化信息进行抽取。 HtmlExtractor是为大规模分布式环境设计的，采用主从架构，主节点负责维护抽取规则，从节点向主节点请求抽取规则，当抽取规则发生变化，主节点主动通知从节点，从而能实现抽取规则变化之后的实时动态生效。如
java编程思想 -- 多态百合不是茶 java 多态详解
一: 向上转型和向下转型面向对象中的转型只会发生在有继承关系的子类和父类中（接口的实现也包括在这里）。父类：人子类：男人向上转型： Person p = new Man() ; //向上转型不需要强制类型转化向下转型： Man man =
[自动数据处理]稳扎稳打,逐步形成自有ADP系统体系 comsci dp
对于国内的IT行业来讲,虽然我们已经有了"两弹一星",在局部领域形成了自己独有的技术特征,并初步摆脱了国外的控制...但是前面的路还很长.... 首先是我们的自动数据处理系统还无法处理很多高级工程...中等规模的拓扑分析系统也没有完成,更加复杂的
storm 自定义日志文件商人shang storm cluster logback
Storm中的日志级级别默认为INFO，并且，日志文件是根据worker号来进行区分的，这样，同一个log文件中的信息不一定是一个业务的，这样就会有以下两个需求出现： 1. 想要进行一些调试信息的输出 2. 调试信息或者业务日志信息想要输出到一些固定的文件中不要怕，不要烦恼，其实Storm已经提供了这样的支持，可以通过自定义logback 下的 cluster.xml 来输
Extjs3 SpringMVC使用 @RequestBody 标签问题记录 21jhf
springMVC使用 @RequestBody(required = false) UserVO userInfo 传递json对象数据，往往会出现http 415，400,500等错误，总结一下需要使用ajax提交json数据才行，ajax提交使用proxy，参数为jsonData，不能为params；另外，需要设置Content-type属性为json，代码如下：（由于使用了父类aaa
一些排错方法文强chu 方法
1、java.lang.IllegalStateException: Class invariant violation at org.apache.log4j.LogManager.getLoggerRepository(LogManager.java:199)at org.apache.log4j.LogManager.getLogger(LogManager.java:228) at o
Swing中文件恢复我觉得很难小桔子 swing
我那个草了！老大怎么回事，怎么做项目评估的？只会说相信你可以做的，试一下，有的是时间！用java开发一个图文处理工具，类似word，任意位置插入、拖动、删除图片以及文本等。文本框、流程图等，数据保存数据库，其余可保存pdf格式。ok,姐姐千辛万苦，
php 文件操作 aichenglong PHP 读取文件写入文件
1 写入文件 @$fp=fopen("$DOCUMENT_ROOT/order.txt", "ab"); if(!$fp){ echo "open file error" ; exit; } $outputstring="date:"." \t tire:".$tire."
MySQL的btree索引和hash索引的区别 AILIKES 数据结构 mysql 算法
Hash 索引结构的特殊性，其检索效率非常高，索引的检索可以一次定位，不像B-Tree 索引需要从根节点到枝节点，最后才能访问到页节点这样多次的IO访问，所以 Hash 索引的查询效率要远高于 B-Tree 索引。可能很多人又有疑问了，既然 Hash 索引的效率要比 B-Tree 高很多，为什么大家不都用 Hash 索引而还要使用 B-Tree 索引呢
JAVA的抽象--- 接口 --实现百合不是茶
抽象接口实现接口 //抽象类 ,方法 //定义一个公共抽象的类 ,并在类中定义一个抽象的方法体抽象的定义使用abstract abstract class A 定义一个抽象类例如： //定义一个基类 public abstract class A{ //抽象类不能用来实例化，只能用来继承 //
JS变量作用域实例 bijian1013 作用域
<script> var scope='hello'; function a(){ console.log(scope); //undefined var scope='world'; console.log(scope); //world console.log(b);
TDD实践（二） bijian1013 java TDD
实践题目：分解质因数 Step1：单元测试： package com.bijian.study.factor.test; import java.util.Arrays; import junit.framework.Assert; import org.junit.Before; import org.junit.Test; import com.bijian.
[MongoDB学习笔记一]MongoDB主从复制 bit1129 mongodb
MongoDB称为分布式数据库，主要原因是1.基于副本集的数据备份， 2.基于切片的数据扩容。副本集解决数据的读写性能问题，切片解决了MongoDB的数据扩容问题。事实上，MongoDB提供了主从复制和副本复制两种备份方式，在MongoDB的主从复制和副本复制集群环境中，只有一台作为主服务器，另外一台或者多台服务器作为从服务器。本文介绍MongoDB的主从复制模式，需要指明
【HBase五】Java API操作HBase bit1129 hbase
import java.io.IOException; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.hbase.HBaseConfiguration; import org.apache.hadoop.hbase.HColumnDescriptor; import org.apache.ha
python调用zabbix api接口实时展示数据 ronin47
zabbix api接口来进行展示。经过思考之后，计划获取如下内容： 1、获得认证密钥 2、获取zabbix所有的主机组 3、获取单个组下的所有主机 4、获取某个主机下的所有监控项
jsp取得绝对路径 byalias 绝对路径
在JavaWeb开发中，常使用绝对路径的方式来引入JavaScript和CSS文件，这样可以避免因为目录变动导致引入文件找不到的情况，常用的做法如下：一、使用${pageContext.request.contextPath} 　　代码” ${pageContext.request.contextPath}”的作用是取出部署的应用程序名，这样不管如何部署，所用路径都是正确的。
Java定时任务调度：用ExecutorService取代Timer bylijinnan java
《Java并发编程实战》一书提到的用ExecutorService取代Java Timer有几个理由，我认为其中最重要的理由是：如果TimerTask抛出未检查的异常，Timer将会产生无法预料的行为。Timer线程并不捕获异常，所以 TimerTask抛出的未检查的异常会终止timer线程。这种情况下，Timer也不会再重新恢复线程的执行了;它错误的认为整个Timer都被取消了。此时，已经被
SQL 优化原则 chicony sql
一、问题的提出　在应用系统开发初期，由于开发数据库数据比较少，对于查询SQL语句，复杂视图的的编写等体会不出SQL语句各种写法的性能优劣，但是如果将应用系统提交实际应用后，随着数据库中数据的增加，系统的响应速度就成为目前系统需要解决的最主要的问题之一。系统优化中一个很重要的方面就是SQL语句的优化。对于海量数据，劣质SQL语句和优质SQL语句之间的速度差别可以达到上百倍，可见对于一个系统
java 线程弹球小游戏 CrazyMizzz java 游戏
最近java学到线程，于是做了一个线程弹球的小游戏，不过还没完善这里是提纲 1.线程弹球游戏实现 1.实现界面需要使用哪些API类 JFrame JPanel JButton FlowLayout Graphics2D Thread Color ActionListener ActionEvent MouseListener Mouse
hadoop jps出现process information unavailable提示解决办法 daizj hadoop jps
hadoop jps出现process information unavailable提示解决办法 jps时出现如下信息： 3019 -- process information unavailable3053 -- process information unavailable2985 -- process information unavailable2917 --
PHP图片水印缩放类实现 dcj3sjt126com PHP
<?php class Image{ private $path; function __construct($path='./'){ $this->path=rtrim($path,'/').'/'; } //水印函数，参数：背景图，水印图，位置，前缀,TMD透明度 public function water($b,$l,$pos
IOS控件学习：UILabel常用属性与用法 dcj3sjt126com ios UILabel
参考网站： http://shijue.me/show_text/521c396a8ddf876566000007 http://www.tuicool.com/articles/zquENb http://blog.csdn.net/a451493485/article/details/9454695 http://wiki.eoe.cn/page/iOS_pptl_artile_281
完全手动建立maven骨架 eksliang java eclipse Web
建一个 JAVA 项目： mvn archetype:create -DgroupId=com.demo -DartifactId=App [-Dversion=0.0.1-SNAPSHOT] [-Dpackaging=jar] 建一个 web 项目： mvn archetype:create -DgroupId=com.demo -DartifactId=web-a
配置清单 gengzg 配置
1、修改grub启动的内核版本 vi /boot/grub/grub.conf 将default 0改为1 拷贝mt7601Usta.ko到/lib文件夹拷贝RT2870STA.dat到 /etc/Wireless/RT2870STA/文件夹拷贝wifiscan到bin文件夹，chmod 775 /bin/wifiscan 拷贝wifiget.sh到bin文件夹，chm
Windows端口被占用处理方法 huqiji windows
以下文章主要以80端口号为例，如果想知道其他的端口号也可以使用该方法..........................1、在windows下如何查看80端口占用情况?是被哪个进程占用?如何终止等. 这里主要是用到windows下的DOS工具,点击"开始"--"运行",输入&
开源ckplayer 网页播放器，跨平台(html5, mobile)，flv, f4v, mp4, rtmp协议. webm, ogg, m3u8 ！天梯梦 mobile
CKplayer，其全称为超酷flv播放器，它是一款用于网页上播放视频的软件，支持的格式有：http协议上的flv,f4v,mp4格式，同时支持rtmp视频流格式播放，此播放器的特点在于用户可以自己定义播放器的风格，诸如播放/暂停按钮，静音按钮，全屏按钮都是以外部图片接口形式调用，用户根据自己的需要制作出播放器风格所需要使用的各个按钮图片然后替换掉原始风格里相应的图片就可以制作出自己的风格了，
简单工厂设计模式 hm4123660 java 工厂设计模式简单工厂模式
简单工厂模式（Simple Factory Pattern）属于类的创新型模式，又叫静态工厂方法模式。是通过专门定义一个类来负责创建其他类的实例，被创建的实例通常都具有共同的父类。简单工厂模式是由一个工厂对象决定创建出哪一种产品类的实例。简单工厂模式是工厂模式家族中最简单实用的模式，可以理解为是不同工厂模式的一个特殊实现。
maven笔记 zhb8015 maven
跳过测试阶段： mvn package -DskipTests 临时性跳过测试代码的编译： mvn package -Dmaven.test.skip=true maven.test.skip同时控制maven-compiler-plugin和maven-surefire-plugin两个插件的行为，即跳过编译，又跳过测试。指定测试类 mvn test
非mapreduce生成Hfile，然后导入hbase当中 Stark_Summer map hbase reduce Hfile path实例
最近一个群友的boss让研究hbase，让hbase的入库速度达到5w+/s，这可愁死了，4台个人电脑组成的集群，多线程入库调了好久，速度也才1w左右，都没有达到理想的那种速度，然后就想到了这种方式，但是网上多是用mapreduce来实现入库，而现在的需求是实时入库，不生成文件了，所以就只能自己用代码实现了，但是网上查了很多资料都没有查到，最后在一个网友的指引下，看了源码，最后找到了生成Hfile
jsp web tomcat 编码问题王新春 tomcat jsp pageEncode
今天配置jsp项目在tomcat上，windows上正常，而linux上显示乱码，最后定位原因为tomcat 的server.xml 文件的配置，添加 URIEncoding 属性： <Connector port="8080" protocol="HTTP/1.1" connectionTi

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他