Kanny广小隶

检验数据缺失的类型：《Statistical Analysis with Missing Data》习题1.6

题目

解答

由于题目要求需要重复三次类似的操作，故首先载入所需要的包，构造生成数据的函数以及绘图的函数：

library(tidyr)    # 绘图所需
library(ggplot2)  # 绘图所需

# 生成数据
GenerateData <- function(a = 0, b = 0, seed = 2018) {
  set.seed(seed)
  z1 <- rnorm(100)
  z2 <- rnorm(100)
  z3 <- rnorm(100)

  y1 <- 1 + z1
  y2 <- 5 + 2 * z1 + z2

  u <- a * (y1 - 1) + b * (y2 - 5) + z3
  m2 <- 1 * (u < 0)

  y2_na <- y2
  y2_na[u < 0] <- NA
  # y2_na[as.logical(m2)] <- NA

  dat_comp <- data.frame(y1 = y1, y2 = y2)
  dat_incomp <- data.frame(y1 = y1, y2 = y2_na)
  dat_incomp <- na.omit(dat_incomp)

  return(list(dat_comp = dat_comp, dat_incomp = dat_incomp))
}

# 展现缺失出具与未缺失数据的分布情况
PlotTwoDistribution <- function(dat) {
  p1 <- dat_comp %>%
    gather(y1, y2, key = "var", value = "value") %>%
    ggplot(aes(x = value)) +
    geom_histogram(aes(fill = factor(var), y = ..density..),
                   alpha = 0.3, colour = 'black') +
    stat_density(geom = 'line', position = 'identity', size = 1.5,
                 aes(colour = factor(var))) +
    facet_wrap(~ var, ncol = 2) +
    labs(y = '直方图与密度曲线', x = '值',
         title = '完整无缺失数据', fill = '变量') +
    theme(plot.title = element_text(hjust = 0.5)) +
    guides(color = FALSE)

  p2 <- dat_incomp %>%
    gather(y1, y2, key = "var", value = "value") %>%
    ggplot(aes(x = value)) +
    geom_histogram(aes(fill = factor(var), y = ..density..),
                   alpha = 0.3, colour = 'black') +
    stat_density(geom = 'line', position = 'identity', size = 1.5,
                 aes(colour = factor(var))) +
    facet_wrap(~ var, ncol = 2) +
    labs(y = '直方图与密度曲线', x = '值',
         title = '有缺失数据', fill = '变量') +
    theme(plot.title = element_text(hjust = 0.5)) +
    guides(color = FALSE)

  return(list(p_comp = p1, p_incomp = p2))
}

下面考虑三种情况：

1. a = 0, b = 0

a) 生成数据并绘图展示

# 生成数据并查看数据样式
dat <- GenerateData(a = 0, b = 0)
dat_comp <- dat$dat_comp
dat_incomp <- dat$dat_incomp

head(dat_comp)
head(dat_incomp)

# 绘图展示
p <- PlotTwoDistribution(dat)
p$p_comp
p$p_incomp

缺失数据与未缺失数据的分布如上图所示。可以发现，对于完整数据与缺失数据之间的 $Y_1$ 的分布与 $Y_2$ 的分布与期望相差不大。并且在采用 $a = 0, b = 0$ 这种构造时，从构造的公式可以看出， $Y_2$ 中样本的缺失情况与 $Y_1, Y_2$ 两者都无关（因为 $Z_3$ 与 $Y_1, Y_2$ 均独立），所以这种缺失机制是：MCAR。

b) 进行t检验

题设条件中说的是 $Y_1$ 的均值,所以考虑完整数据与缺失数据（这里的缺失指的是若 $Y_2$ 有缺失， $Y_1$ 也会进行相应地缺失处理）

t.test(dat_comp$y1, dat_incomp$y1)

这里进行t检验（其实不是非常严谨，因为不一定满足正态假设），比较缺失与否 $Y_1$ 的均值，这里p-value = 0.8334。在显著性水平为0.05的前提下，并不能断言有缺失与无缺失两个 $Y_1$ 之间的均值有差异，也就是说其实MCAR, MAR, NMAR三种情况都有可能，并不能断言哪种不可能发生。

2. a = 2, b = 0

a) 生成数据并绘图展示

# 生成数据并查看数据样式
dat <- GenerateData(a = 2, b = 0)
dat_comp <- dat$dat_comp
dat_incomp <- dat$dat_incomp

head(dat_comp)
head(dat_incomp)

# 绘图展示
p <- PlotTwoDistribution(dat)
p$p_comp
p$p_incomp

缺失数据与未缺失数据的分布如上图所示。可以发现，两个数据的期望以及分布（无论 $Y_1$ 还是 $Y_2$ ），整体都有一定差异。在采用 $a = 2, b = 0$ 这种构造时，从构造的公式可以看出， $Y_2$ 中样本的缺失情况与 $Y_1$ 有关，所以这种缺失机制是：MAR。

b) 进行t检验

t.test(dat_comp$y1, dat_incomp$y1)

这里进行t检验（其实不是非常严谨，因为不一定满足正态假设），比较缺失与否 $Y_1$ 的均值，这里p-value = $2.398 \times 10^{-5}$ ，p-value非常小，说明不是MCAR，但有可能是NMAR, MAR这两种情况。NMAR自不必提，有可能为MAR是因为，虽然是 $Y_2$ 缺失，但其如果为MAR是有可能与 $Y_1$ 有关的，这样就会出现对 $Y_1$ 进行t检验为显著的情况。

3. a = 0, b = 2

a) 生成数据并绘图展示

# 生成数据并查看数据样式
dat <- GenerateData(a = 0, b = 2)
dat_comp <- dat$dat_comp
dat_incomp <- dat$dat_incomp

head(dat_comp)
head(dat_incomp)

# 绘图展示
p <- PlotTwoDistribution(dat)
p$p_comp
p$p_incomp

缺失数据与未缺失数据的分布如上图所示。可以发现与上一种情况一样，两个数据的期望以及分布（无论 $Y_1$ 还是 $Y_2$ ），整体都有一定差异。在采用 $a = 0, b = 2$ 这种构造时，从构造的公式可以看出， $Y_2$ 中样本的缺失情况与 $Y_2$ 本身有关，所以这种缺失机制是：NMAR。

b) 进行t检验

t.test(dat_comp$y1, dat_incomp$y1)

这里进行t检验（其实不是非常严谨，因为不一定满足正态假设），比较缺失与否 $Y_1$ 的均值，这里p-value = $3.012 \times 10^{-5}$ ，p-value同样非常小，说明不是MCAR，但有可能是NMAR, MAR这两种情况。

你可能感兴趣的:(学习笔记,统计学习,R)

【Git使用】关联本地与远程仓库，并推送拉取 _水杉
场景情况是这样的，公司内部测试服务器上安装了一个Git，充当项目团队中的中央服务器。现在我本地已经创建了一个仓库A，也添加了一些文档，只是还没有推送到远程仓库。事实上，连远程仓库都还没创建呢。现在我要做的事：创建远程仓库R将本地仓库A中的内容推送到远程仓库R，以供项目团队内的其他人拉取创建远程仓库因为我们不会在Git中央服务器上工作（即写代码），所以只需创建一个裸仓库即可。一个远程仓库通常只是一个
阿里通义千问Qwen3深夜升级：架构革新+性能碾压俊哥V AI AI新闻热点由AI辅助创作 AI 人工智能
（以下借助DeepSeek-R1&Grok3辅助整理）北京时间2025年7月22日凌晨，阿里云通义千问团队发布了Qwen3旗舰模型的最新更新——Qwen3-235B-A22B-Instruct-2507-FP8。这一更新不仅在性能上实现了突破，还标志着开源大模型技术架构的重大进化。本报告基于官方发布信息、社区反馈以及相关分析，全面解读该更新的技术细节、性能表现、社区反应及未来展望。一、技术架构与战
Leetcode658. 找到 K 个最接近的元素 -春招冲刺 meeiuliuus #leetcode ---medium 算法
题目：代码(首刷自解2024年4月8日）：classSolution{public:vectorfindClosestElements(vector&arr,intk,intx){//数组两边指针向中intleft=0,right=arr.size()-1;//k=right+1-leftwhile(right+1-left>k){//比较距离，距离大的移动if(x-arr[left]>arr[r
leetcode 658. 找到 K 个最接近的元素
leetcode658.找到K个最接近的元素题目描述：给定一个排序好的数组arr，两个整数k和x，从数组中找到最靠近x（两数之差最小）的k个数。返回的结果必须要是按升序排好的。整数a比整数b更接近x需要满足：|a-x|findClosestElements(vector&arr,intk,intx){intn=arr.size()-1;intl=0,r=n;k--;while(r-l>k){if(
408考研逐题详解：2010年第35题——RIP协议
2010年第35题某自治系统内采用RIP协议，若该自治系统内的路由器R1收到其邻居路由器R2的距离矢量，距离矢量中包含信息，则能得出的结论是（）A.R2可以经过R1到达net1，跳数为17B.R2可以到达net1，跳数为16C.R1可以经过R2到达net1，跳数为17D.R1不能经过R2到达net1解析本题主要考查RIP（RoutingInformationProtocol）协议，相关内容如下：R
从 0 到 1 搞定nvidia 独显推流：硬件视频编码环境安装完整学习笔记 lxmyzzs 图像算法之音视频编解码音视频学习笔记
笔记用于安装和配置一套完整的媒体处理工具链，包括NVIDIA编码头文件、带CUDA加速的FFmpeg以及ZLMediaKit流媒体服务框架，适用于需要进行视频编解码、流媒体推流/拉流等场景的开发与部署。标题核心组件及版本说明nv-codec-headers来源：Gitee仓库jario-jin/nv-codec-headers版本：n11.1.5.0（对应NVIDIAVideoCodecSDK接口
新年逼自己一把，学会使用DeepSeek R1：从「翻车」到「封神」实战无数碎片寻妳杂谈人工智能
DeepSeekR1的发布就像是一颗闪亮的星星，瞬间照亮了整个AI领域。它不仅颠覆了我们对传统指令模型的认知，更带来了全新的推理能力，让我们在日常工作、学习中都能高效利用AI。然而，要想完全发挥R1的潜力，你必须掌握一些使用技巧，避免那些让AI“翻车”的错误。接下来，我们将通过一些经典案例和实用技巧，帮助你从入门到精通，让DeepSeekR1成为你工作中的得力助手。1.DeepSeekR1模型的独
学习笔记56-(已解决)pip指令下载超时Read timed out错误李卓璐报错整理 pip
(已解决)pip指令下载超时Readtimedout错误下了一上午卡到自闭然后查了很多帖子，最后更换国内安装源和设置超时时间可以解决。在pip3installXXX命令的后面加上–default-timeout=100-ihttps://pypi.tuna.tsinghua.edu.cn/simple
R语言使用glmnet包拟合lasso-cox回归模型（包含生存时间和结果标签）、使用lasso-cox模型进行特征筛选、使用sapply函数对特征数据进行标准化z-score statistics.insight R语言入门课机器学习人工智能 r语言数据挖掘数据分析
R语言使用glmnet包拟合lasso-cox回归模型（包含生存时间和结果标签）、使用lasso-cox模型进行特征筛选、使用sapply函数对特征数据进行标准化z-score目录R语言使用glmnet包拟合lasso-cox回归模型（包含生存时间和结果标签）、使用lasso-cox模型进行特征筛选、使用sapply函数对特征数据进行标准化z-score分类模型（classification）决策
R语言与临床模型预测——LASSO回归，单因素多因素cox，差异表达分析，Venn图，森林图，列线图，矫正曲线，ROC全套代码及解析——第九部分 lasso回归排除具有共线性的基因本专栏可免费答疑楷然教你学生信 r语言机器学习生物信息学数据挖掘 cox回归临床模型预测
1.下载数据2.匹配基因3.基因去重复4.匹配临床数据5.批量cox回归分析6.差异表达基因筛选7.取交集，选出预后相关的差异表达基因8.森林图绘制9.lasso回归进一步排除具有共线性的基因10.验证集验证，数据合并验证11.多因素cox回归建模12.列线图13.矫正曲线14.ROC曲线分析上次筛选了预后相关差异基因，下面我们开始对这些基因进行lasso-cox回归：下面数据准备：这是之前做批量
从0开始学习R语言--Day52--weibull Chef_Chen 学习
在分析带有状态变化特征的数据时（如医疗数据的结局特征，手机电池的寿命等等），我们需要分析得不只是什么时候什么时候出发结局，还要分析特征的稳定性，比如电池的续航在初期不稳定，预测里可能两个月就会坏，但用了一个月后手机稳定下来，预测可能就变成用一年都不会坏。weibull分布能帮我们捕捉这种特征，从而能够做后续的处理（比如维修计划，对病人的结局分析作进一步拆解）。以下是一个例子：#加载必要的包libr
从0开始学习R语言--Day53--AFT模型 Chef_Chen 学习
在分析医疗数据时，尽管用cox回归可以分析一切因素对风险的影响，但是有时候因素的影响是非常直接的，比如对于癌症患者的生存风险，治疗手段（如化疗），会直接让肿瘤的生长速度减半，也就相当于延长了患者的生存时间，这个时候如果还要去用cox回归去分析单位时间内风险的概率，就有点本末倒置了，直接用AFT模型分析对生存时间的影响就能得到结果，毕竟在这个背景下，我们用析的最终目的是为了得知因素的效果。以下是一个
AtCoder Beginner Contest 414(ABCD)
前言被数学建模分散精力后明显感觉状态不如月初了，这俩赛道看来只能选一个走。TT一、A-StreamerTakahashi#includeusingnamespacestd;typedeflonglongll;typedefpairpii;voidsolve(){intn,l,r;cin>>n>>l>>r;intcnt=0;for(inti=0,x,y;i>x>>y;if(x=r){cnt++;}}
OpenHarmony外设驱动移植指南你我皆是牛马星人鸿蒙开发 HarmonyOS OpenHarmony harmonyos OpenHarmony 鸿蒙开发源码分析迁移学习嵌入式硬件驱动开发
往期推文全新看点（文中附带最新·鸿蒙全栈学习笔记）鸿蒙（HarmonyOS）北向开发知识点记录~鸿蒙（OpenHarmony）南向开发保姆级知识点汇总~鸿蒙应用开发与鸿蒙系统开发哪个更有前景？嵌入式开发适不适合做鸿蒙南向开发？看完这篇你就了解了~对于大前端开发来说，转鸿蒙开发究竟是福还是祸？鸿蒙岗位需求突增！移动端、PC端、IoT到底该怎么选？记录一场鸿蒙开发岗位面试经历~持续更新中……外设驱动子
【OpenHarmony】鸿蒙开发：轻量系统服务管理|存储机制详解(一) 你我皆是牛马星人 HarmonyOS 鸿蒙开发 OpenHarmony harmonyos 鸿蒙开发 OpenHarmony 嵌入式硬件 SAStore模块物联网
往期推文全新看点（文中附带最新·鸿蒙全栈学习笔记）鸿蒙（HarmonyOS）北向开发知识点记录~鸿蒙（OpenHarmony）南向开发保姆级知识点汇总~鸿蒙应用开发与鸿蒙系统开发哪个更有前景？嵌入式开发适不适合做鸿蒙南向开发？看完这篇你就了解了~对于大前端开发来说，转鸿蒙开发究竟是福还是祸？鸿蒙岗位需求突增！移动端、PC端、IoT到底该怎么选？记录一场鸿蒙开发岗位面试经历~持续更新中……一、前言本
618第二波品类日是什么时候?618品类日什么意思? 一起高省
天猫第一波的活动已经结束了，现在开启的是第二波的活动了。第一波是预售，开门红。第二波是品类日，都是现货。那618第二波品类日是什么时候?时间：5.29日20点—6.20日每天抽三次红包，最高可领28888r‼️参与方式很简单，直接去桃宝搜官方密令即可领取，现在分享给大家！密令：【天降红包61666】这是官方密令，中大包的概率更高，现在就可以去搜一下有记录，5.29日20点准时，以后每天0点再去领就
Linux 基本指令详解 Cherl. Linux linux 运维服务器基本命令
1.pwd（PrintWorkingDirectory）显示当前工作目录的完整路径root@hcss-ecs-a3f4:~#pwd/root2.ls（List）列出目录内容ls#查看当前目录下文件和文件夹ls-l#长格式显示(显示权限、所有者、大小、修改时间等)ls-a#显示所有文件(包括隐藏文件)ls-la#长格式显示所有文件ls-lh#以人类可读的方式显示文件大小ls-R#递归显示子目录ll为
【TypeScript学习笔记】TypeScript 核心知识点 Zaly. Vue学习笔记 typescript 学习笔记
目录前言TypeScript核心概念基本类型与高级类型常用内置工具类型类型断言与类型守卫TypeScript在Vue3中的应用Vue3中TypeScript的作用范围Props和Emits的类型定义CompositionAPI中的类型支持前言TypeScript是微软开发的一个开源的编程语言，通过在JavaScript的基础上添加静态类型定义构建而成。TypeScript通过TypeScript编
ensp——动态路由OSPF实验配置 Fᴏʀ ʏ꯭ᴏ꯭ᴜ꯭. 华为
一划分网段先划分两个area的大网段192.168.1.0000-0000(即192.168.1.0/25)为area0192.168.1.1000-0000(即192.168.1.128/25)为area1在area0上继续划分小网段192.168.1.0000-0000(即192.168.1.0/27)为R1-R3的链接192.168.1.0010-0000(即192.168.1.32/27)
2023-08-21 de5ea6d11ab2
易佳npdp学习笔记NPDP（NewProductDevelopmentProfessional）是产品经理国际资格认证。NPDP由美国产品开发与管理协会（PDMA）所发起，是国际公认的唯一的新产品开发专业认证，集理论、方法与实践为一体的全方位知识体系，为公司组织层级进行规划、决策、执行提供良好的方法体系支撑。经IBM采用后来被华为公司引入并取得巨大商业成功的IPD（IntegratedProdu
MFC数字图像处理24位图转8位图等四种图像色彩转换方式 CurtainSystem 数字图像处理数字图像处理图像色彩转换 24位图转8位图
一、实验主要思路和基本操作本实验主要探究8位图和24位图的颜色转换。8位图具有调色板，调色板中有对应的256种不同的颜色，每种颜色所含的RGB值都不一样。24位图没有调色板，RGB三个颜色分量分别都有0-255可选择，属于真彩色图像。其中，两种不同位数的图形都有彩色图像和灰度图像两种，灰度图像中每个像素的颜色分量，R、G、值都一样。所以本实验核心分为两点：了解颜色的RGB组合和学会调色板的使用调色
AndResGuard使用 CurtainSystem android android studio
1、简介AndResGuard是一个帮助你缩小APK大小的工具，他的原理类似JavaProguard，但是只针对资源。他会将原本冗长的资源路径变短，例如将res/drawable/wechat变为r/d/a。AndResGuard不涉及编译过程，只需输入一个apk(无论签名与否，debug版，release版均可，在处理过程中会直接将原签名删除)，可得到一个实现资源混淆后的apk(若在配置文件中输
2/7 关于正念冥想的几点注意方知方行
这是得到课程《怎样学会正念冥想》的部分学习笔记，把平时我在冥想的桑侯没有注意和意识到的问题总结下，以备后续练习实践：1有意的关注（平时练习时，通过调整赞成注意力的方式在做）。2非评判的态度（这里的意思并不是说不评判，而是意识到到评判，不要被自己的评判牵着走。产生评判是自然的。我之前的认知是：不能产生评判）。3理解当下（“当下”是我们身心所体验到的一切。大体分为两类：一类是发生在我们的内在体验，也可
[源码和文档分享]基于C++实现的教职工信息管理系统 ggdd5151
一、实验内容教职工信息管理系统用于管理教职工信息，能够根据工号、姓名、科室精确查询职工信息；能分系部进行职称统计，计算各职称的人数；根据职工的职称排序输出；根据工号修改或删除职工信息。二、运行环境软件环境操作系统：windows8.1开发环境：visualstudio2015硬件环境处理器：Intel(R)Core(TM)[email protected]内存：4.00GB系统类
S早起晨读练习day11 贺笙
#day11#/ʌ/、/æ/第十一天的学习内容关于study的发音今天有学到，昨天确实是习惯造成的错误，有/r/音的是另一个单词sturdy：a、形容词，坚定地；强壮的，健全的；坚固的，耐用的；精力充沛的；b、名词，（羊的）晕倒病；第二个是关于published的尾音是/t/而不是/d/；第三是magazine的重音，以前没有读重音的意识，以后要多加注意；第四，S今天早上关于昨天大家联系问题的纠正
空间曲线正交投影及其距离计算的理论与实践老歌老听老掉牙 python 正交投影
引言：正交投影的几何本质在三维空间中，正交投影是一种基础而重要的几何变换，它将空间中的点沿特定方向映射到一个平面上。当我们考虑将空间曲线投影到由给定法向量n\mathbf{n}n定义的平面时，这一问题在计算机图形学、CAD/CAM系统和科学计算中具有广泛应用。本文将从数学原理、Python实现到距离计算的等价性问题，全面探讨这一几何操作的深层内涵。设空间曲线由参数方程r(t)=(x(t),y(t)
《数据结构》学习笔记二：算法（二）小曼blog
继续上节的学习，我们在这一篇文章里把“算法”这一章内容学习完。本节解决问题：算法的好坏到底是如何评估的？知识点：1.函数的渐进增长2.算法的时间复杂度3.常见的时间复杂度4.算法的空间复杂度1.函数的渐进增长这一知识点与数学相关，不过没关系都是很容易理解的内容。问题：假如两个算法的输入规模都是n,A的执行次数是2n+3,B的执行次数是3n+1,那么这两个算法哪一个更好呢？我们来分析一下，用数学的折
拼多多今年618几号开始拼多多618活动时间多久高省APP
即将进入6月份，各大电商平台都在做618的活动。那么一般来看每年都有提前预热，今天我们就一起来看看关于拼多多今年618几号开始，拼多多618活动时间多久的相关内容。时间：5.29日20点—6.20日每天抽三次红包，最高可领28888r‼️参与方式很简单，直接去桃宝搜官方密令即可领取，现在分享给大家！密令：【天降红包61666】这是官方密令，中大包的概率更高，现在就可以去搜一下有记录，5.29日20
你还在使用存储过程吗？
上周，reddit网r/dotnet区的网友technolang发帖：「你还在使用存储过程吗？」我很好奇为什么2024年了我们还在使用存储过程。难道网络应用中没有一个业务层来处理所有事情吗？依赖DBA并在数据库层创建依赖关系似乎没有必要。另外，存储过程调试起来很麻烦。所以它有什么好处呢？网友xabrol给出了非常用心的回答。他说：我不是说教，只是讲点事实。我从事咨询行业，曾在银行和抵押贷款公司工作
【科研绘图系列】R语言绘制堆积图生信学习者1 SCI科研绘图系列 (2024版)r语言数据可视化
文章目录介绍加载R包数据下载导入数据数据预处理画图系统信息参考介绍【科研绘图系列】R语言绘制堆积图加载R包library(tidyverse)library(ggplot2)library(ggsignif)library(reshape)library(ggalluvial)library(ggprism
TOMCAT在POST方法提交参数丢失问题 357029540 java tomcat jsp
摘自http://my.oschina.net/luckyi/blog/213209 昨天在解决一个BUG时发现一个奇怪的问题，一个AJAX提交数据在之前都是木有问题的，突然提交出错影响其他处理流程。检查时发现页面处理数据较多，起初以为是提交顺序不正确修改后发现不是由此问题引起。于是删除掉一部分数据进行提交，较少数据能够提交成功。恢复较多数据后跟踪提交FORM DATA ，发现数
在MyEclipse中增加JSP模板删除-2008-08-18 ljy325 jsp xml MyEclipse
在D:\Program Files\MyEclipse 6.0\myeclipse\eclipse\plugins\com.genuitec.eclipse.wizards_6.0.1.zmyeclipse601200710\templates\jsp 目录下找到Jsp.vtl，复制一份，重命名为jsp2.vtl,然后把里面的内容修改为自己想要的格式，保存。然后在 D:\Progr
JavaScript常用验证脚本总结 eksliang JavaScript javaScript表单验证
转载请出自出处：http://eksliang.iteye.com/blog/2098985 下面这些验证脚本，是我在这几年开发中的总结，今天把他放出来，也算是一种分享吧，现在在我的项目中也在用！包括日期验证、比较，非空验证、身份证验证、数值验证、Email验证、电话验证等等...! &nb
微软BI（4） 18289753290 微软BI SSIS
1） Q:查看ssis里面某个控件输出的结果： A MessageBox.Show(Dts.Variables["v_lastTimestamp"].Value.ToString()); 这是我们在包里面定义的变量 2):在关联目的端表的时候如果是一对多的关系，一定要选择唯一的那个键作为关联字段。 3) Q：ssis里面如果将多个数据源的数据插入目的端一
定时对大数据量的表进行分表对数据备份酷的飞上天空大数据量
工作中遇到数据库中一个表的数据量比较大，属于日志表。正常情况下是不会有查询操作的，但如果不进行分表数据太多，执行一条简单sql语句要等好几分钟。。分表工具：linux的shell + mysql自身提供的管理命令原理：使用一个和原表数据结构一样的表，替换原表。 linux shell内容如下： =======================开始
本质的描述与因材施教永夜-极光感想随笔
不管碰到什么事,我都下意识的想去探索本质,找寻一个最形象的描述方式。我坚信,世界上对一件事物的描述和解释,肯定有一种最形象,最贴近本质,最容易让人理解 &
很迷茫。。。随便小屋随笔
小弟我今年研一，也是从事的咱们现在最流行的专业（计算机）。本科三流学校，为了能有个更好的跳板，进入了考研大军，非常有幸能进入研究生的行业（具体学校就不说了，怕把学校的名誉给损了）。先说一下自身的条件，本科专业软件工程。主要学习就是软件开发，几乎和计算机没有什么区别。因为学校本身三流，也就是让老师带着学生学点东西，然后让学生毕业就行了。对专业性的东西了解的非常浅。就那学的语言来说
23种设计模式的意图和适用范围 aijuans 设计模式
Factory Method 意图定义一个用于创建对象的接口，让子类决定实例化哪一个类。Factory Method 使一个类的实例化延迟到其子类。　　适用性当一个类不知道它所必须创建的对象的类的时候。　　当一个类希望由它的子类来指定它所创建的对象的时候。　　当类将创建对象的职责委托给多个帮助子类中的某一个，并且你希望将哪一个帮助子类是代理者这一信息局部化的时候。 Abstr
Java中的synchronized和volatile aoyouzi java volatile synchronized
说到Java的线程同步问题肯定要说到两个关键字synchronized和volatile。说到这两个关键字，又要说道JVM的内存模型。JVM里内存分为main memory和working memory。 Main memory是所有线程共享的，working memory则是线程的工作内存，它保存有部分main memory变量的拷贝，对这些变量的更新直接发生在working memo
js数组的操作和this关键字百合不是茶 js 数组操作 this关键字
js数组的操作; 一:数组的创建: 1、数组的创建 var array = new Array();　//创建一个数组 var array = new Array([size]);　//创建一个数组并指定长度，注意不是上限，是长度 var arrayObj = new Array([element0[, element1[, ...[, elementN]]]
别人的阿里面试感悟 bijian1013 面试分享工作感悟阿里面试
原文如下：http://greemranqq.iteye.com/blog/2007170 一直做企业系统，虽然也自己一直学习技术，但是感觉还是有所欠缺，准备花几个月的时间，把互联网的东西，以及一些基础更加的深入透析，结果这次比较意外，有点突然，下面分享一下感受吧！ &nb
淘宝的测试框架Itest Bill_chen spring maven 框架单元测试 JUnit
Itest测试框架是TaoBao测试部门开发的一套单元测试框架，以Junit4为核心，集合DbUnit、Unitils等主流测试框架，应该算是比较好用的了。近期项目中用了下，有关itest的具体使用如下： 1.在Maven中引入itest框架： <dependency> <groupId>com.taobao.test</groupId&g
【Java多线程二】多路条件解决生产者消费者问题 bit1129 java多线程
package com.tom; import java.util.LinkedList; import java.util.Queue; import java.util.concurrent.ThreadLocalRandom; import java.util.concurrent.locks.Condition; import java.util.concurrent.loc
汉字转拼音pinyin4j 白糖_ pinyin4j
以前在项目中遇到汉字转拼音的情况，于是在网上找到了pinyin4j这个工具包，非常有用，别的不说了，直接下代码： import java.util.HashSet; import java.util.Set; import net.sourceforge.pinyin4j.PinyinHelper; import net.sourceforge.pinyin
org.hibernate.TransactionException: JDBC begin failed解决方案 bozch ssh 数据库异常 DBCP
org.hibernate.TransactionException: JDBC begin failed: at org.hibernate.transaction.JDBCTransaction.begin(JDBCTransaction.java:68) at org.hibernate.impl.SessionImp
java-并查集（Disjoint-set）-将多个集合合并成没有交集的集合 bylijinnan java
import java.util.ArrayList; import java.util.Arrays; import java.util.HashMap; import java.util.HashSet; import java.util.Iterator; import java.util.List; import java.util.Map; import java.ut
Java PrintWriter打印乱码 chenbowen00 java
一个小程序读写文件，发现PrintWriter输出后文件存在乱码，解决办法主要统一输入输出流编码格式。读文件： BufferedReader 从字符输入流中读取文本，缓冲各个字符，从而提供字符、数组和行的高效读取。可以指定缓冲区的大小，或者可使用默认的大小。大多数情况下，默认值就足够大了。通常，Reader 所作的每个读取请求都会导致对基础字符或字节流进行相应的读取请求。因
[天气与气候]极端气候环境 comsci 环境
如果空间环境出现异变...外星文明并未出现,而只是用某种气象武器对地球的气候系统进行攻击,并挑唆地球国家间的战争,经过一段时间的准备...最大限度的削弱地球文明的整体力量,然后再进行入侵...... 那么地球上的国家应该做什么样的防备工作呢? &n
oracle order by与union一起使用的用法 daizj UNION oracle order by
当使用union操作时，排序语句必须放在最后面才正确，如下：只能在union的最后一个子查询中使用order by，而这个order by是针对整个unioning后的结果集的。So：如果unoin的几个子查询列名不同，如 Sql代码 select supplier_id, supplier_name from suppliers UNI
zeus持久层读写分离单元测试 deng520159 单元测试
本文是zeus读写分离单元测试,距离分库分表,只有一步了.上代码: 1.ZeusMasterSlaveTest.java package com.dengliang.zeus.webdemo.test; import java.util.ArrayList; import java.util.List; import org.junit.Assert; import org.j
Yii 截取字符串(UTF-8) 使用组件 dcj3sjt126com yii
1.将Helper.php放进protected\components文件夹下。 2.调用方法： Helper::truncate_utf8_string($content,20,false); //不显示省略号 Helper::truncate_utf8_string($content,20); //显示省略号 &n
安装memcache及php扩展 dcj3sjt126com PHP
安装memcache tar zxvf memcache-2.2.5.tgz cd memcache-2.2.5/ /usr/local/php/bin/phpize (?) ./configure --with-php-confi
JsonObject 处理日期 feifeilinlin521 java json JsonOjbect JsonArray JSONException
写这边文章的初衷就是遇到了json在转换日期格式出现了异常 net.sf.json.JSONException: java.lang.reflect.InvocationTargetException 原因是当你用Map接收数据库返回了java.sql.Date 日期的数据进行json转换出的问题话不多说直接上代码 &n
Ehcache（06）——监听器 234390216 监听器 listener ehcache
监听器 Ehcache中监听器有两种，监听CacheManager的CacheManagerEventListener和监听Cache的CacheEventListener。在Ehcache中，Listener是通过对应的监听器工厂来生产和发生作用的。下面我们将来介绍一下这两种类型的监听器。
activiti 自带设计器中chrome 34版本不能打开bug的解决 jackyrong Activiti
在acitivti modeler中，如果是chrome 34，则不能打开该设计器，其他浏览器可以，经证实为bug，参考 http://forums.activiti.org/content/activiti-modeler-doesnt-work-chrome-v34 修改为，找到 oryx.debug.js 在最头部增加 if (!Document.
微信收货地址共享接口-终极解决 laotu5i0 微信开发
最近要接入微信的收货地址共享接口，总是不成功，折腾了好几天，实在没办法网上搜到的帖子也是骂声一片。我把我碰到并解决问题的过程分享出来，希望能给微信的接口文档起到一个辅助作用，让后面进来的开发者能快速的接入，而不需要像我们一样苦逼的浪费好几天，甚至一周的青春。各种羞辱、谩骂的话就不说了，本人还算文明。如果你能搜到本贴，说明你已经碰到了各种 ed
关于人才 netkiller.github.com 工作面试招聘 netkiller 人才
关于人才每个月我都会接到许多猎头的电话，有些猎头比较专业，但绝大多数在我看来与猎头二字还是有很大差距的。与猎头接触多了，自然也了解了他们的工作，包括操作手法，总体上国内的猎头行业还处在初级阶段。总结就是“盲目推荐，以量取胜”。目前现状许多从事人力资源工作的人，根本不懂得怎么找人才。处在人才找不到企业，企业找不到人才的尴尬处境。企业招聘，通常是需要用人的部门提出招聘条件，由人
搭建 CentOS 6 服务器 - 目录 rensanning centos
(1) 安装CentOS ISO（desktop/minimal）、Cloud（AWS/阿里云）、Virtualization（VMWare、VirtualBox）详细内容 (2) Linux常用命令 cd、ls、rm、chmod...... 详细内容 (3) 初始环境设置用户管理、网络设置、安全设置...... 详细内容 (4) 常驻服务Daemon
【求助】mongoDB无法更新主键 toknowme mongodb
Query query = new Query(); query.addCriteria(new Criteria("_id").is(o.getId())); &n
jquery 页面滚动到底部自动加载插件集合 xp9802 jquery
很多社交网站都使用无限滚动的翻页技术来提高用户体验，当你页面滑到列表底部时候无需点击就自动加载更多的内容。下面为你推荐 10 个 jQuery 的无限滚动的插件： 1. jQuery ScrollPagination jQuery ScrollPagination plugin 是一个 jQuery 实现的支持无限滚动加载数据的插件。 2. jQuery Screw S

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他