奉系坤阀

过拟合与欠拟合

一、模型选择

1、问题导入

2、训练误差与泛化误差

3、验证数据集和测试数据集

4、K-折交叉验证

一般在没有足够多数据时使用。

二、过拟合与欠拟合

1、过拟合

过拟合的定义：

当学习器把训练样本学的“太好”了的时候，很可能已经把训练样本自身的一些特点当作了所有潜在样本都会具有的一般性质，这样就会导致泛化性能下降，这种现象称为过拟合。具体表现就是最终模型在训练集上效果好；在测试集上效果差。模型泛化能力弱。

过拟合的原因：

训练数据中噪音干扰过大，使得学习器认为部分噪音是特征从而扰乱学习规则。
建模样本选取有误，例如训练数据太少，抽样方法错误，样本label错误等，导致样本不能代表整体。
模型不合理，或假设成立的条件与实际不符。
特征维度/参数太多，导致模型复杂度太高。

2、欠拟合

欠拟合的定义：

欠拟合是指对训练样本的一般性质尚未学好。在训练集及测试集上的表现都不好。

欠拟合的原因：

模型复杂度过低
特征量过少

3、模型容量

4、数据复杂度

三、代码解释

我们可以通过多项式拟合来探索这些概念。

import math
import numpy as np
import torch
from torch import nn
from d2l import torch as d2l

1、生成数据集

给定，我们将使用以下三阶多项式来生成训练和测试数据的标签：

$y = 5 + 1.2x - 3.4\frac{x^2}{2!} + 5.6 \frac{x^3}{3!} + \epsilon \text{ where } \epsilon \sim \mathcal{N}(0, 0.1^2).$

噪声项 $\epsilon$ 服从均值为0且标准差为0.1的正态分布。在优化的过程中，我们通常希望避免非常大的梯度值或损失值。这就是我们将特征从调整为 $\frac{x^i}{i!}$ 的原因，这样可以避免很大的带来的特别大的指数值。我们将为训练集和测试集各生成100个样本。

max_degree = 20  # 多项式的最大阶数
n_train, n_test = 100, 100  # 训练和测试数据集大小
true_w = np.zeros(max_degree)  # 分配大量的空间
true_w[0:4] = np.array([5, 1.2, -3.4, 5.6])     # 注意true_w.shape = (max_degree,)，只是后面16个都为0
features = np.random.normal(size=(n_train + n_test, 1))
np.random.shuffle(features)     # features.shape = (n_train + n_test, 1)
# 使用 numpy.power 函数将 features 的每个元素分别与 np.arange(max_degree)（从0到max_degree-1的数组）进行幂运算。
poly_features = np.power(features, np.arange(max_degree).reshape(1, -1))    # ploy_feature.shape = (n_train + n_test, max_degree)
for i in range(max_degree):
    poly_features[:, i] /= math.gamma(i + 1)  # gamma(n)=(n-1)! 第i列数据除以i的阶乘
# labels的维度:(n_train+n_test,)
labels = np.dot(poly_features, true_w)  # labels.shape = (n_train + n_test,)  通过将多项式特征 poly_features 与真实系数 true_w 相乘得到标签。
labels += np.random.normal(scale=0.1, size=labels.shape)    # 向标签数据添加服从正态分布的噪声

# 下面4个分别对应: w x x^n/n! y=w*(x^n/n!)
true_w, features, poly_features, labels = [torch.tensor(x, dtype=       # 多项式："polynomial"
    torch.float32) for x in [true_w, features, poly_features, labels]]  # for训练遍历列表[true_w, features, poly_features, labels]中的4个元素，将NumPy ndarray转换为tensor

2、对模型进行训练和测试

首先让我们实现一个函数来评估模型在给定数据集上的损失。

def evaluate_loss(net, data_iter, loss):
    """评估给定数据集上模型的损失"""
    metric = d2l.Accumulator(2)  # 损失的总和,样本数量
    for X, y in data_iter:
        out = net(X)
        y = y.reshape(out.shape)
        l = loss(out, y)
        metric.add(l.sum(), l.numel())
    return metric[0] / metric[1]

现在定义训练函数。

def train(train_features, test_features, train_labels, test_labels,
          num_epochs=400):
    loss = nn.MSELoss(reduction='none')     # 使用均方根损失
    input_shape = train_features.shape[-1]  # input_shape=20
    # 不设置偏置，因为我们已经在多项式中实现了它
    net = nn.Sequential(nn.Linear(input_shape, 1, bias=False))
    batch_size = min(10, train_labels.shape[0])
    train_iter = d2l.load_array((train_features, train_labels.reshape(-1,1)),
                                batch_size)
    test_iter = d2l.load_array((test_features, test_labels.reshape(-1,1)),
                               batch_size, is_train=False)
    trainer = torch.optim.SGD(net.parameters(), lr=0.01)
    animator = d2l.Animator(xlabel='epoch', ylabel='loss', yscale='log',
                            xlim=[1, num_epochs], ylim=[1e-3, 1e2],
                            legend=['train', 'test'])
    for epoch in range(num_epochs):
        d2l.train_epoch_ch3(net, train_iter, loss, trainer)
        if epoch == 0 or (epoch + 1) % 20 == 0:
            animator.add(epoch + 1, (evaluate_loss(net, train_iter, loss),
                                     evaluate_loss(net, test_iter, loss)))
    print('weight:', net[0].weight.data.numpy())

3、拟合结果分析

（1）三阶多项式函数拟合(正常)

我们将首先使用三阶多项式函数，它与数据生成函数的阶数相同。结果表明，该模型能有效降低训练损失和测试损失。学习到的模型参数也接近真实值。

# 从多项式特征中选择前4个维度，即1,x,x^2/2!,x^3/3!
# poly_features每行的前4个值是线性相关的，因为此时已经进行了幂运算、阶乘运算，就差乘true_w了，也正因如此前面才能使用单线性层nn.Linear拟合
train(poly_features[:n_train, :4], poly_features[n_train:, :4],
      labels[:n_train], labels[n_train:])

（2）线性函数拟合(欠拟合)

让我们再看看线性函数拟合，减少该模型的训练损失相对困难。在最后一个迭代周期完成后，训练损失仍然很高。当用来拟合非线性模式（如这里的三阶多项式函数）时，线性模型容易欠拟合。不过这里的欠拟合是因为数据没给全（因为数据没给全而导致特征不明显），前4项weight的后面2项模型学不到，人为强制使模型欠拟合了，而不是模型容量不够。

# 从多项式特征中选择前2个维度，即1和x
train(poly_features[:n_train, :2], poly_features[n_train:, :2],
      labels[:n_train], labels[n_train:])

（3）高阶多项式函数拟合(过拟合)

现在，让我们尝试使用一个阶数过高的多项式来训练模型。在这种情况下，没有足够的数据用于学到高阶系数应该具有接近于零的值。因此，这个过于复杂的模型会轻易受到训练数据中噪声的影响。虽然训练损失可以有效地降低，但测试损失仍然很高。结果表明，复杂模型对数据造成了过拟合。其实就是给的数据太多（后面16项多余了），模型把不该学的（后面16项的weight）给学到了，于是就造成了过拟合。

# 从多项式特征中选取所有维度
train(poly_features[:n_train, :], poly_features[n_train:, :],
      labels[:n_train], labels[n_train:], num_epochs=1500)

你可能感兴趣的:(DeepLearning,人工智能,过拟合,欠拟合,算法,误差,数据集,模型容量)

探索LLMonitor：全面提升AI应用可观测性的开源平台 afTFODguAKBF 人工智能 python
引言在构建和部署大型语言模型（LLM）和聊天模型时，开发者通常面临数据追踪、使用情况分析、成本控制等各种挑战。LLMonitor是一个开源的可观测性平台，专注于解决这些挑战。它提供了成本和使用分析、用户跟踪、追踪和评估工具。本文将详细探讨如何设置和使用LLMonitor，以提高AI应用的透明度和效率。主要内容设置LLMonitor要开始使用LLMonitor，首先需要在llmonitor.com上
利用Langchain与Minimax进行自然语言处理的精彩指南 afTFODguAKBF langchain 自然语言处理 easyui python
#引言在人工智能的浪潮中，自然语言处理（NLP）成为了企业和个人用户的重要工具。Minimax作为一家中国初创企业，专注于提供优秀的语言模型服务。本篇文章将介绍如何使用Langchain库与Minimax进行交互，帮助开发者充分利用这一强大的AI工具。#主要内容##1.Minimax简介Minimax专注于自然语言处理，为企业和个人用户提供高效的语言模型服务。其API能处理多种自然语言任务，例如文
ChatGPT4.0最新功能和使用技巧，助力日常生活、学习与工作！ WangYan2022 教程人工智能 chatgpt 数据分析 ai绘画 AI写作
熟练掌握ChatGPT4.0在数据分析、自动生成代码等方面的强大功能，系统学习人工智能（包括传统机器学习、深度学习等）的基础理论知识，以及具体的代码实现方法，同时掌握ChatGPT4.0在科研工作中的各种使用方法与技巧，以及人工智能领域经典机器学习算法（BP神经网络、支持向量机、决策树、随机森林、变量降维与特征选择、群优化算法等）和热门深度学习方法（卷积神经网络、迁移学习、RNN与LSTM神经网络
华为OD机试E卷 --简易压缩算法--24年OD统一考试（Java & JS & Python & C & C++）飞码创造者最新华为OD机试题库2024 java 华为od javascript python c语言
文章目录题目描述输入描述输出描述用例题目解析JS算法源码Java算法源码python算法源码c算法源码题目描述有一种简易压缩算法Q∶针对全部由小写英文字母组成的字符串，将其中连续超过两个相同字母的部分压缩为连续个数加该字母，其他部分保持原样不变。例如:字符串“aaabbccccd"经过压缩成为字符串"3abb4cd”"。请您编写解压函数，根据输入的字符串，判断其是否为合法压缩过的字符串，若输入合法
【已解决】ImportError: libnvinfer.so.8: cannot open shared object file: No such file or directory 小小小小祥 python
问题描述：按照tensorrt官方安装文档：https://docs.nvidia.com/deeplearning/tensorrt/install-guide/index.html#installing-tar安装完成后，使用python测试导入tensorrtimporttensorrt上述代码报错：Traceback(mostrecentcalllast):File“main.py”,li
加速AI模型部署：深入探索Banana的无服务架构 afTFODguAKBF 人工智能架构 python
加速AI模型部署：深入探索Banana的无服务架构引言在AI模型的构建与部署中，无服务架构（ServerlessArchitecture）正逐渐成为开发者的首选方案。这种架构可以简化部署流程，提高扩展性，并降低成本。在本文中，我们将探讨如何利用Banana提供的无服务GPU推理来部署AI模型，并结合LangChain实现高效的模型推理。主要内容1.Banana生态系统的优势Banana提供了一套完
人工智能OpenCV计算机视觉技术 yzx991013 OpenCV基础全集 opencv 计算机视觉人工智能
5.3cand可调节边缘检测完整代码：importcv2importnumpyasnp#载入图像，并处理可能的读取错误img_original=cv2.imread('./image/lena.jpg')ifimg_originalisNone:print("无法读取图像文件")raiseSystemExit#创建可调整大小的窗口cv2.namedWindow('Canny',cv2.WINDOW
ASPICE 4.0引领自动驾驶未来：机器学习模型的特点与实践亚远景aspice 机器学习自动驾驶人工智能
ASPICE4.0-ML机器学习模型是针对汽车行业，特别是在汽车软件开发中，针对机器学习（MachineLearning,ML）应用的特定标准和过程。ASPICE（AutomotiveSPICE）是一种基于软件控制的系统开发过程的国际标准，旨在提升软件开发过程的质量、效率和可靠性。ASPICE4.0中的ML模型部分则进一步细化了机器学习在汽车软件开发中的具体要求和流程。以下是对ASPICE4.0-
深入解读ChatGPT的工作原理及底层逻辑 NAR_鱼丸 ChatGPT 程序人生
ChatGPT的工作原理和底层逻辑可以从多个方面进行解读，主要包括其基本原理、核心技术、训练过程以及应用能力。工作原理涉及了深度学习模型、自然语言处理技术和文本生成算法等多个方面。通过预训练和微调，模型能够理解语言的语法和语义，并能够根据上下文生成符合语境的文本回复。基本原理ChatGPT是一种基于自然语言处理（NLP）和深度学习技术的聊天机器人。其基本原理是使用大量文本数据来训练深度神经网络模型
软考信安04~网络安全体系与网络安全模型 jnprlxc 软考~信息安全工程师 web安全网络安全
1、网络安全体系概述1.1、网络安全体系概念网络安全体系是网络安全保障系统的最高层概念抽象，是由各种网络安全单元按照一定的规则组成的，共同实现网络安全的目标。网络安全体系包括法律法规政策文件、安全策略、组织管理、技术措施、标准规范、安全建设与运营、人员队伍、教育培训、产业生态、安全投入等多种要素。1.2、网络安全体系特征(1)整体性。网络安全体系从全局、长远的角度实现安全保障，网络安全单元按照一定
python中tensorflow_python机器学习TensorFlow框架弦歌缓缓
TensorFlow框架关注公众号“轻松学编程”了解更多。一、简介TensorFlow是谷歌基于DistBelief进行研发的第二代人工智能学习系统，其命名来源于本身的运行原理。Tensor(张量)意味着N维数组，Flow(流)意味着基于数据流图的计算，TensorFlow为张量从流图的一端流动到另一端的计算过程。TensorFlow是将复杂的数据结构传输至人工智能神经网中进行分析和处理过程的系统
Pytorch详解-模型模块(RNN,CNN,FNN,LSTM,GRU,TCN,Transformer) qq742234984 rnn pytorch cnn
Pytorch详解-模型模块Module¶meterModule初认识forward函数ParameterPytorch中的权重、参数和超参数Module容器-ContainersSequentialModuleListModuleDictParameterList&ParameterDict常用网络层LSTM输入和输出GRUConvolutionalLayers卷积层的基本概念常见的卷积
python火柴人毕业设计山语山 python 课程设计开发语言
1.引言火柴人（StickFigure）是一种极简风格的图形，通常由简单的线段和圆圈组成，却能生动地表达人物的姿态和动作。火柴人不仅广泛应用于动画、漫画和涂鸦中，还可以作为图形学、人工智能等领域的教学和研究工具。本文旨在介绍如何使用Python实现火柴人的设计与绘制，通过编程的方式，让读者了解火柴人背后的基本原理和实现方法。2.准备工作在开始实现火柴人之前，你需要确保已经安装了Python环境，并
算法随笔_6: 下一个排列程序趣谈算法
上一篇:算法随笔_5:接雨水-CSDN博客题目描述如下:整数数组的一个排列就是将其所有成员以序列或线性顺序排列。例如，arr=[1,2,3]，以下这些都可以视作arr的排列：[1,2,3]、[1,3,2]、[3,1,2]、[2,3,1]。整数数组的下一个排列是指其整数的下一个字典序更大的排列。更正式地，如果数组的所有排列根据其字典顺序从小到大排列在一个容器中，那么数组的下一个排列就是在这个有序容器
算法随笔_9:压缩字符串程序趣谈算法
上一篇:算法随笔_8:寻找重复数-CSDN博客题目描述如下:给你一个字符数组chars，请使用下述算法压缩：从一个空字符串s开始。对于chars中的每组连续重复字符：如果这一组长度为1，则将字符追加到s中。否则，需要向s追加字符，后跟这一组的长度。压缩后得到的字符串s不应该直接返回，需要转储到字符数组chars中。需要注意的是，如果组长度为10或10以上，则在chars数组中会被拆分为多个字符。请
基于单片机的开关电源设计(论文+源码) 沐欣工作室_lvyiyi 单片机嵌入式硬件 stm32 物联网开关电源
本次基于单片机的开关电源节能控制系统的设计中，在功能上设计如下：（1）系统输入220V；（2）系统.输出0-12V可调，步进0.1V;（3）LCD液晶显示实时电压，并且可以通过按键设定；（4）采用BUCK拓扑方式，系统效率大于85%（5）.采用PID算法实现闭环控制，具有过流，过压等保护功能根据上述设计目标的功能，确定了如图1所示的整体框图，在主控制器上拟采用51系列的STC12单片机，其运行速度
维度可变的UKF（无迹卡尔曼滤波），附有完整源代码 MATLAB卡尔曼 MATLAB创新性滤波方法 matlab 开发语言
本文分享的MATLAB代码实现了一个N维状态量的无迹卡尔曼滤波（UKF）算法，用于对动态系统的状态估计。代码的一个显著特点是滤波维度可以自由更改，便于适应不同的应用需求。文章目录代码简短介绍运行结果源代码代码简短介绍主要内容和流程如下：初始化：清空工作区和命令窗口，固定随机数种子以确保结果可重现。定义时间序列和状态维度（dim），可以灵活设置至任意值，以适应特定应用。设置过程和观测噪声的协方差矩阵
django笔记幸福诗歌 python django
init:初始化执行方法setting:配置文件urls:路由刚创建出来的项目分为两级：第一级：项目文件夹manage.py第二级是我们的关键：settings项目的总配置文件urlsurl链接文件wsgi服务器配置文件MVC全名是ModelViewController，是模型(model)－视图(view)－控制器(controller)的缩写，一种软件设计典范，用一种业务逻辑、数据、界面显示分
python&pygame随机迷宫基于A*算法自动寻路 Siiiiiiiiiiiii pygame python 开发语言
caidan_youxi.pyimportsysimportpygamefromPyQt5.QtWidgetsimportQApplication,QMainWindowimportloginif__name__=='__main__':pygame.init()pygame.mixer.init()pygame.mixer.music.load('bgm.mp3')#加载歌曲pygame.mix
厉害了，LSTM+Transformer王炸创新，精准度又高了！马拉AI LSTM transformer
【LSTM+Transformer】作为一种混合深度学习模型，近年来在学术界和工业界都受到了极大的关注。它巧妙地融合了长短期记忆网络（LSTM）在处理时序数据方面的专长和Transformer在捕捉长距离依赖关系上的优势，从而在文本生成、机器翻译、时间序列预测等多个领域取得了突破性的进展。这种创新的结合不仅提升了模型的预测精度，还优化了性能和训练效率，使其在序列分析任务中展现出卓越的能力。例如，最
ChatGPT原理及其应用场景编程小郭 chatgpt 人工智能 ai
ChatGPT的原理及应用场景一、ChatGPT的原理ChatGPT，全名ChatGenerativePre-trainedTransformer，是OpenAI研发的一款聊天机器人程序，其背后依托的是人工智能技术和自然语言处理（NLP）的深厚功底。其工作原理可以从以下几个方面进行解析：GPT系列模型基础ChatGPT基于GPT（GenerativePre-trainedTransformer）技
ChatGPT 在旅游和酒店服务中的实践应用计算机小陈 chatgpt 人工智能
摘要：ChatGPT是一种先进的对话生成技术，具备强大的语义理解和智能回答能力。在旅游和酒店服务领域，ChatGPT可以应用于在线客户咨询、预订管理、旅行建议等方面，为用户提供个性化、高效的服务体验。本文将探讨ChatGPT在旅游和酒店服务中的实践应用，并讨论其优势、挑战和未来发展。引言随着人工智能技术的快速发展，ChatGPT（ChatGenerativePre-trainedTransform
华为OD机试E卷 --智能成绩表--24年OD统一考试（Java & JS & Python & C & C++）飞码创造者最新华为OD机试题库2024 python java 华为od javascript c语言
文章目录题目描述输入描述输出描述用例题目解析JS算法源码Java算法源码python算法源码c算法源码c++算法源码题目描述小明来到某学校当老师，需要将学生按考试总分或单科分数进行排名，你能帮帮他吗？输入描述第1行输入两个整数，学生人数n和科目数量m。•0
构建高效GPU算力平台：挑战、策略与未来展望 Mr' 郑 gpu算力
引言随着深度学习、高性能计算和大数据分析等领域的快速发展，GPU（图形处理器）因其强大的并行计算能力和浮点运算速度而成为首选的计算平台。然而，随着模型规模的增长和技术的进步，构建高效稳定的GPU算力平台面临着新的挑战。本文旨在探讨这些挑战、应对策略以及对未来发展的展望。当前挑战算力分配与资源优化在多用户共享GPU集群的环境下，合理分配计算资源并确保每个任务能够高效运行是一项挑战。这不仅涉及到硬件资
详解深度学习中的Dropout nk妹妹深度学习深度学习人工智能
Dropout是一种在神经网络训练中常用的正则化技术，其操作是在每次训练迭代中随机“丢弃”一部分神经元（即将其输出置为零）。以下是对这一操作的详细解释：一、基本思想Dropout的基本思想是减少神经元之间的复杂共适应关系，迫使网络在训练过程中不依赖于特定的神经元子集。这有助于增加模型的泛化能力，防止过拟合。二、具体实现随机选择：在每次训练迭代中，以一定的概率p（通常设定为0.2到0.5之间）随机选
密码体制分类旧火车现代密码学密码学
密码体制从原理上可分为两大类，即单钥体制和双钥体制。1.单钥体制单钥体制的加密密钥和解密密钥相同。系统的保密性取决于密钥的安全性，与算法的保密性无关，即由密文和加密算法不能得到明文。换句话说，算法无须保密，需保密的仅是密钥。根据单钥密码体制的这种特性，单钥加解密算法可通过低费用的芯片来实现。密钥可由发方产生，然后再经一个安全可靠的途径(如信使递送)送至收方，或由第三方产生后安全可靠地分配给通信双方
Python学习之-Pydantic详解夏天Aileft Python python 学习 Pydantic
前言：Pydantic是一个Python库，用于数据解析和验证。它主要基于Python类型提示来实现数据的校验和设定限制条件。在Pydantic中，BaseModel是一个核心基类，用于创建数据模型。1BaseModel的主要作用包括：数据验证（Validation）:BaseModel类提供了自动数据验证的功能。当你创建一个基于BaseModel的子类并且为其字段添加类型注解（typeannot
计算机网络破译密码的题目,密码习题及部分参考答案.doc 耿礼勇计算机网络破译密码的题目
一、密码学概述部分：1、什么是密码体制的五元组。五元组(M,C,K,E,D)构成密码体制模型，M代表明文空间；C代表密文空间；K代表密钥空间；E代表加密算法；D代表解密算法2、简述口令和密码的区别。密码：按特定法则编成，用以对通信双方的信息进行明、密变换的符号。换而言之，密码是隐蔽了真实内容的符号序列。就是把用公开的、标准的信息编码表示的信息通过一种变换手段，将其变为除通信双方以外其他人所不能读懂
Java实现归并排序算法详解及优化捕风捉你从0开始学算法 java 排序算法算法
引言归并排序（MergeSort）是一种有效、稳定且常用的排序算法，尤其在处理大规模数据时表现良好。本文将详细讲解如何使用Java实现归并排序算法，并结合图解和实例代码，帮助您全面理解这一高级排序算法。同时，我们还将探讨归并排序的优化方法，以进一步提高其性能。归并排序算法的原理归并排序是一种分治算法，它将数组分成两个子数组，分别对两个子数组进行排序，然后将排好序的子数组合并成一个有序数组。算法步骤
计算机网络（48）P2P应用 IT 青年一研为定计算机网络
前言计算机网络中的P2P（PeertoPeer，点对点）应用是一种去中心化的网络通信模式，它允许设备（或节点）直接连接并共享资源，而无需传统的客户端-服务器模型。一、P2P技术原理去中心化架构：P2P网络不依赖单一的中心服务器，而是由所有参与者共同维护网络和资源。每个节点都可以充当客户端和服务器，可以直接与其他节点通信。资源共享：P2P网络允许参与者共享文件、带宽、计算资源等。这意味着用户可以从其
TOMCAT在POST方法提交参数丢失问题 357029540 java tomcat jsp
摘自http://my.oschina.net/luckyi/blog/213209 昨天在解决一个BUG时发现一个奇怪的问题，一个AJAX提交数据在之前都是木有问题的，突然提交出错影响其他处理流程。检查时发现页面处理数据较多，起初以为是提交顺序不正确修改后发现不是由此问题引起。于是删除掉一部分数据进行提交，较少数据能够提交成功。恢复较多数据后跟踪提交FORM DATA ，发现数
在MyEclipse中增加JSP模板删除-2008-08-18 ljy325 jsp xml MyEclipse
在D:\Program Files\MyEclipse 6.0\myeclipse\eclipse\plugins\com.genuitec.eclipse.wizards_6.0.1.zmyeclipse601200710\templates\jsp 目录下找到Jsp.vtl，复制一份，重命名为jsp2.vtl,然后把里面的内容修改为自己想要的格式，保存。然后在 D:\Progr
JavaScript常用验证脚本总结 eksliang JavaScript javaScript表单验证
转载请出自出处：http://eksliang.iteye.com/blog/2098985 下面这些验证脚本，是我在这几年开发中的总结，今天把他放出来，也算是一种分享吧，现在在我的项目中也在用！包括日期验证、比较，非空验证、身份证验证、数值验证、Email验证、电话验证等等...! &nb
微软BI（4） 18289753290 微软BI SSIS
1） Q:查看ssis里面某个控件输出的结果： A MessageBox.Show(Dts.Variables["v_lastTimestamp"].Value.ToString()); 这是我们在包里面定义的变量 2):在关联目的端表的时候如果是一对多的关系，一定要选择唯一的那个键作为关联字段。 3) Q：ssis里面如果将多个数据源的数据插入目的端一
定时对大数据量的表进行分表对数据备份酷的飞上天空大数据量
工作中遇到数据库中一个表的数据量比较大，属于日志表。正常情况下是不会有查询操作的，但如果不进行分表数据太多，执行一条简单sql语句要等好几分钟。。分表工具：linux的shell + mysql自身提供的管理命令原理：使用一个和原表数据结构一样的表，替换原表。 linux shell内容如下： =======================开始
本质的描述与因材施教永夜-极光感想随笔
不管碰到什么事,我都下意识的想去探索本质,找寻一个最形象的描述方式。我坚信,世界上对一件事物的描述和解释,肯定有一种最形象,最贴近本质,最容易让人理解 &
很迷茫。。。随便小屋随笔
小弟我今年研一，也是从事的咱们现在最流行的专业（计算机）。本科三流学校，为了能有个更好的跳板，进入了考研大军，非常有幸能进入研究生的行业（具体学校就不说了，怕把学校的名誉给损了）。先说一下自身的条件，本科专业软件工程。主要学习就是软件开发，几乎和计算机没有什么区别。因为学校本身三流，也就是让老师带着学生学点东西，然后让学生毕业就行了。对专业性的东西了解的非常浅。就那学的语言来说
23种设计模式的意图和适用范围 aijuans 设计模式
Factory Method 意图定义一个用于创建对象的接口，让子类决定实例化哪一个类。Factory Method 使一个类的实例化延迟到其子类。　　适用性当一个类不知道它所必须创建的对象的类的时候。　　当一个类希望由它的子类来指定它所创建的对象的时候。　　当类将创建对象的职责委托给多个帮助子类中的某一个，并且你希望将哪一个帮助子类是代理者这一信息局部化的时候。 Abstr
Java中的synchronized和volatile aoyouzi java volatile synchronized
说到Java的线程同步问题肯定要说到两个关键字synchronized和volatile。说到这两个关键字，又要说道JVM的内存模型。JVM里内存分为main memory和working memory。 Main memory是所有线程共享的，working memory则是线程的工作内存，它保存有部分main memory变量的拷贝，对这些变量的更新直接发生在working memo
js数组的操作和this关键字百合不是茶 js 数组操作 this关键字
js数组的操作; 一:数组的创建: 1、数组的创建 var array = new Array();　//创建一个数组 var array = new Array([size]);　//创建一个数组并指定长度，注意不是上限，是长度 var arrayObj = new Array([element0[, element1[, ...[, elementN]]]
别人的阿里面试感悟 bijian1013 面试分享工作感悟阿里面试
原文如下：http://greemranqq.iteye.com/blog/2007170 一直做企业系统，虽然也自己一直学习技术，但是感觉还是有所欠缺，准备花几个月的时间，把互联网的东西，以及一些基础更加的深入透析，结果这次比较意外，有点突然，下面分享一下感受吧！ &nb
淘宝的测试框架Itest Bill_chen spring maven 框架单元测试 JUnit
Itest测试框架是TaoBao测试部门开发的一套单元测试框架，以Junit4为核心，集合DbUnit、Unitils等主流测试框架，应该算是比较好用的了。近期项目中用了下，有关itest的具体使用如下： 1.在Maven中引入itest框架： <dependency> <groupId>com.taobao.test</groupId&g
【Java多线程二】多路条件解决生产者消费者问题 bit1129 java多线程
package com.tom; import java.util.LinkedList; import java.util.Queue; import java.util.concurrent.ThreadLocalRandom; import java.util.concurrent.locks.Condition; import java.util.concurrent.loc
汉字转拼音pinyin4j 白糖_ pinyin4j
以前在项目中遇到汉字转拼音的情况，于是在网上找到了pinyin4j这个工具包，非常有用，别的不说了，直接下代码： import java.util.HashSet; import java.util.Set; import net.sourceforge.pinyin4j.PinyinHelper; import net.sourceforge.pinyin
org.hibernate.TransactionException: JDBC begin failed解决方案 bozch ssh 数据库异常 DBCP
org.hibernate.TransactionException: JDBC begin failed: at org.hibernate.transaction.JDBCTransaction.begin(JDBCTransaction.java:68) at org.hibernate.impl.SessionImp
java-并查集（Disjoint-set）-将多个集合合并成没有交集的集合 bylijinnan java
import java.util.ArrayList; import java.util.Arrays; import java.util.HashMap; import java.util.HashSet; import java.util.Iterator; import java.util.List; import java.util.Map; import java.ut
Java PrintWriter打印乱码 chenbowen00 java
一个小程序读写文件，发现PrintWriter输出后文件存在乱码，解决办法主要统一输入输出流编码格式。读文件： BufferedReader 从字符输入流中读取文本，缓冲各个字符，从而提供字符、数组和行的高效读取。可以指定缓冲区的大小，或者可使用默认的大小。大多数情况下，默认值就足够大了。通常，Reader 所作的每个读取请求都会导致对基础字符或字节流进行相应的读取请求。因
[天气与气候]极端气候环境 comsci 环境
如果空间环境出现异变...外星文明并未出现,而只是用某种气象武器对地球的气候系统进行攻击,并挑唆地球国家间的战争,经过一段时间的准备...最大限度的削弱地球文明的整体力量,然后再进行入侵...... 那么地球上的国家应该做什么样的防备工作呢? &n
oracle order by与union一起使用的用法 daizj UNION oracle order by
当使用union操作时，排序语句必须放在最后面才正确，如下：只能在union的最后一个子查询中使用order by，而这个order by是针对整个unioning后的结果集的。So：如果unoin的几个子查询列名不同，如 Sql代码 select supplier_id, supplier_name from suppliers UNI
zeus持久层读写分离单元测试 deng520159 单元测试
本文是zeus读写分离单元测试,距离分库分表,只有一步了.上代码: 1.ZeusMasterSlaveTest.java package com.dengliang.zeus.webdemo.test; import java.util.ArrayList; import java.util.List; import org.junit.Assert; import org.j
Yii 截取字符串(UTF-8) 使用组件 dcj3sjt126com yii
1.将Helper.php放进protected\components文件夹下。 2.调用方法： Helper::truncate_utf8_string($content,20,false); //不显示省略号 Helper::truncate_utf8_string($content,20); //显示省略号 &n
安装memcache及php扩展 dcj3sjt126com PHP
安装memcache tar zxvf memcache-2.2.5.tgz cd memcache-2.2.5/ /usr/local/php/bin/phpize (?) ./configure --with-php-confi
JsonObject 处理日期 feifeilinlin521 java json JsonOjbect JsonArray JSONException
写这边文章的初衷就是遇到了json在转换日期格式出现了异常 net.sf.json.JSONException: java.lang.reflect.InvocationTargetException 原因是当你用Map接收数据库返回了java.sql.Date 日期的数据进行json转换出的问题话不多说直接上代码 &n
Ehcache（06）——监听器 234390216 监听器 listener ehcache
监听器 Ehcache中监听器有两种，监听CacheManager的CacheManagerEventListener和监听Cache的CacheEventListener。在Ehcache中，Listener是通过对应的监听器工厂来生产和发生作用的。下面我们将来介绍一下这两种类型的监听器。
activiti 自带设计器中chrome 34版本不能打开bug的解决 jackyrong Activiti
在acitivti modeler中，如果是chrome 34，则不能打开该设计器，其他浏览器可以，经证实为bug，参考 http://forums.activiti.org/content/activiti-modeler-doesnt-work-chrome-v34 修改为，找到 oryx.debug.js 在最头部增加 if (!Document.
微信收货地址共享接口-终极解决 laotu5i0 微信开发
最近要接入微信的收货地址共享接口，总是不成功，折腾了好几天，实在没办法网上搜到的帖子也是骂声一片。我把我碰到并解决问题的过程分享出来，希望能给微信的接口文档起到一个辅助作用，让后面进来的开发者能快速的接入，而不需要像我们一样苦逼的浪费好几天，甚至一周的青春。各种羞辱、谩骂的话就不说了，本人还算文明。如果你能搜到本贴，说明你已经碰到了各种 ed
关于人才 netkiller.github.com 工作面试招聘 netkiller 人才
关于人才每个月我都会接到许多猎头的电话，有些猎头比较专业，但绝大多数在我看来与猎头二字还是有很大差距的。与猎头接触多了，自然也了解了他们的工作，包括操作手法，总体上国内的猎头行业还处在初级阶段。总结就是“盲目推荐，以量取胜”。目前现状许多从事人力资源工作的人，根本不懂得怎么找人才。处在人才找不到企业，企业找不到人才的尴尬处境。企业招聘，通常是需要用人的部门提出招聘条件，由人
搭建 CentOS 6 服务器 - 目录 rensanning centos
(1) 安装CentOS ISO（desktop/minimal）、Cloud（AWS/阿里云）、Virtualization（VMWare、VirtualBox）详细内容 (2) Linux常用命令 cd、ls、rm、chmod...... 详细内容 (3) 初始环境设置用户管理、网络设置、安全设置...... 详细内容 (4) 常驻服务Daemon
【求助】mongoDB无法更新主键 toknowme mongodb
Query query = new Query(); query.addCriteria(new Criteria("_id").is(o.getId())); &n
jquery 页面滚动到底部自动加载插件集合 xp9802 jquery
很多社交网站都使用无限滚动的翻页技术来提高用户体验，当你页面滑到列表底部时候无需点击就自动加载更多的内容。下面为你推荐 10 个 jQuery 的无限滚动的插件： 1. jQuery ScrollPagination jQuery ScrollPagination plugin 是一个 jQuery 实现的支持无限滚动加载数据的插件。 2. jQuery Screw S

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他