hehuanlin123

R语言学习笔记（三）

9 中级绘图

数据分析 BY 伦大锤阅读量 1,627

在“基本图形”中所接触的图形，主要用于展示单类别型或连续型变量的分布情况，此处将介绍更多用于展示双变量间关系（二元关系）和多变量间关系（多元关系）的绘图方法。

9.1 散点图

散点图可用来描述两个连续型变量间的关系，让我们从最简单的plot()函数出发。

 
      
 
      
 
      
 
      
 
      
 
   
 
     
      
       
           1 
         

           2 
         

           3 
         

           4 
         
 
        
          attach 
          ( 
          mtcars 
          ) 
         
 
          plot 
          ( 
          wt 
          , 
            
          mpg 
          , 
            
          main 
          = 
          "Basic Scatter Plot of MPG vs. Weight" 
          , 
            
          xlab 
          = 
          "Car Weight(lbs/1000)" 
          , 
            
          ylab 
          = 
          "Miles Per Gallon" 
          , 
            
          pch 
          = 
          19 
          ) 
         
 
          abline 
          ( 
          lm 
          ( 
          mpg 
          ~ 
          wt 
          ) 
          , 
            
          col 
          = 
          "red" 
          , 
            
          lwd 
          = 
          2 
          , 
            
          lty 
          = 
          1 
          ) 
         
 
          lines 
          ( 
          lowess 
          ( 
          wt 
          , 
            
          mpg 
          ) 
          , 
            
          col 
          = 
          "blue" 
          , 
            
          lwd 
          = 
          2 
          , 
            
          lty 
          = 
          2 
          ) 
         
 
      
 
     
   

生成的图形中包括散点图、一条最佳拟合直线（abline）和一条平滑曲线（lowess）。

现在使用car包中的scatterplot()函数绘制一个增强的版本，绘制不同气缸数量汽车每加仑英里数对车重的图形，包括散点图、拟合直线和平滑曲线。

散点图矩阵

散点图矩阵用于展示多幅散点图，pairs()函数可以创建基础的散点图矩阵，以下代码包含mpg、disp、drat和wt中任意两者的散点图。

 
           1 
         
          pairs 
          ( 
          ~ 
            
          mpg 
            
          + 
            
          disp 
            
          + 
            
          drat 
            
          + 
            
          wt 
          , 
            
          data 
          = 
          mtcars 
          , 
            
          main 
          = 
          "Basic Scatter Plot Matrix" 
          )

car包的scatterplotMatrix()函数也可以生成散点图矩阵，并支持以下操作：

以某个因子为条件绘制散点图矩阵；
包含线型和平滑拟合曲线；
在主对角线放置箱线图、密度图或者直方图；
在各单元格的边界添加轴须图。

spread=FALSE选项表示不添加展示分散度和对称信息的直线。

再来一个scatterplotMatrix()函数的使用例子，主对角线的核密度曲线改为了直方图，并且直方图以汽车气缸数为条件绘制。

 
           1 
         
           2 
         
          library 
          ( 
          car 
          ) 
         
          scatterplotMatrix 
          ( 
          ~ 
            
          mpg 
            
          + 
            
          disp 
            
          + 
            
          drat 
            
          + 
            
          wt 
          | 
          cyl 
          , 
            
          data 
          = 
          mtcars 
          , 
            
          spread 
          = 
          FALSE 
          , 
            
          diagonal 
          = 
          "histogram" 
          , 
            
          main 
          = 
          "Scatter Plot Matrix via car Package" 
          )

gclus包中的cpairs()函数提供了一个有趣的散点图矩阵变种，支持重排矩阵中变量的位置，让相关性更高的变量更靠近主对角线，还可以对各单元格进行颜色编码来展示变量间的相关性大小。

首先查看各个变量之间相关性的大小：

可以发现相关性最高（0.89）的是车重（wt）和排量（disp），以及车重（wt）和每加仑英里数（mpg）。相关性最低（0.68）的是每加仑英里数（mpg）和后轴比（drat）。以下代码根据相关性大小，对散点图矩阵中的这些变量重新排序并着色。

 
           1 
         
           2 
         
           3 
         
           4 
         
           5 
         
           6 
         
          library 
          ( 
          gclus 
          ) 
         
          mydata 
            
          < 
          - 
            
          mtcars 
          [ 
          c 
          ( 
          1 
          , 
          3 
          , 
          5 
          , 
          6 
          ) 
          ] 
         
          mydata 
          . 
          corr 
            
          < 
          - 
            
          abs 
          ( 
          cor 
          ( 
          mydata 
          ) 
          ) 
         
          mycolors 
            
          < 
          - 
            
          dmat 
          . 
          color 
          ( 
          mydata 
          . 
          corr 
          ) 
         
          myorder 
            
          < 
          - 
            
          order 
          . 
          single 
          ( 
          mydata 
          . 
          corr 
          ) 
         
          cpairs 
          ( 
          mydata 
          , 
            
          myorder 
          , 
            
          panel 
          . 
          colors 
          = 
          mycolors 
          , 
            
          gap 
          = 
          . 
          5 
          , 
            
          main 
          = 
          "Variables Ordered and Colored by Correlation" 
          )

高密度散点图

当散点图中点数量过大时，数据点的重叠将会导致绘图效果显著变差。对于这种情况，可以使用封箱、颜色和透明度等来指定图中任意点上重叠点的数目。

smoothScatter()函数可利用核密度估计生成用颜色密度来表示点分布的散点图。

 
   
 
     
      
       
           1 
         

           2 
         

           3 
         

           4 
         

           5 
         

           6 
         

           7 
         

           8 
         
 
        
          set 
          . 
          seed 
          ( 
          1234 
          ) 
         
 
          n 
           
          < 
          - 
           
          10000 
         
 
          c1 
           
          < 
          - 
           
          matrix 
          ( 
          rnorm 
          ( 
          n 
           
          , 
          mean 
          = 
          0 
          , 
           
          sd 
          = 
          . 
          5 
          ) 
          , 
           
          ncol 
          = 
          2 
          ) 
         
 
          c2 
           
          < 
          - 
           
          matrix 
          ( 
          rnorm 
          ( 
          n 
          , 
           
          mean 
          = 
          3 
          , 
           
          sd 
          = 
          2 
          ) 
          , 
           
          ncol 
          = 
          2 
          ) 
         
 
          mydata 
           
          < 
          - 
           
          rbind 
          ( 
          c1 
          , 
           
          c2 
          ) 
         
 
          mydata 
           
          < 
          - 
           
          as 
          . 
          data 
          . 
          frame 
          ( 
          mydata 
          ) 
         
 
          names 
          ( 
          mydata 
          ) 
           
          < 
          - 
           
          c 
          ( 
          "x" 
          , 
           
          "y" 
          ) 
         
 
          smoothScatter 
          ( 
          mydata 
          $ 
          x 
          , 
           
          mydata 
          $ 
          y 
          , 
           
          main 
          = 
          "Scatterplot Colored by Smoothed Densities" 
          ) 
         
 
      
 
     
   

hexbin包中的hexbin()函数将二元变量的封箱放到六边形单元格中。

 
           1 
         
           2 
         
           3 
         
          library 
          ( 
          hexbin 
          ) 
         
          bin 
            
          < 
          - 
            
          hexbin 
          ( 
          mydata 
          $ 
          x 
          , 
            
          mydata 
          $ 
          y 
          , 
            
          xbins 
          = 
          50 
          ) 
         
          plot 
          ( 
          bin 
          , 
            
          main 
          = 
          "Hexagonal Binning with 10000 Observations" 
          )

IDPmisc包中的iplot()函数也可以通过颜色来展示点的密度。

三维散点图

如果想一次性对三个定量变量的交互进行可视化，那么可以使用scatterplot3d中的scatterplot3d()函数进行绘制。

 
           1 
         
           2 
         
           3 
         
           4 
         
          library 
          ( 
          scatterplot3d 
          ) 
         
          attach 
          ( 
          mtcars 
          ) 
         
          scatterplot3d 
          ( 
          wt 
          , 
            
          disp 
          , 
            
          mpg 
          , 
            
          main 
          = 
          "Basic 3D Scatter Plot" 
          ) 
         
          detach 
          ( 
          mtcars 
          )

scatterplot3d()函数提供了许多选项，包括设置图形符号、轴、颜色、线条、网格线、突出显示和角度等功能。例如以下代码生成一幅突出显示效果的三维散点图，增强了纵深感并添加了连接点与水平面的垂直线。

还可以再加上一个回归面。

 
           1 
         
           2 
         
           3 
         
           4 
         
           5 
         
           6 
         
          library 
          ( 
          scatterplot3d 
          ) 
         
          attach 
          ( 
          mtcars 
          ) 
         
          s3d 
            
          < 
          - 
            
          scatterplot3d 
          ( 
          wt 
          , 
            
          disp 
          , 
            
          mpg 
          , 
            
          pch 
          = 
          16 
          , 
            
          highlight 
          . 
          3d 
          = 
          TRUE 
          , 
            
          type 
          = 
          "h" 
          , 
            
          main 
          = 
          "3D Scatter Plot with Vertical Lines and Regression Plane" 
          ) 
         
          fit 
            
          < 
          - 
            
          lm 
          ( 
          mpg 
            
          ~ 
            
          wt 
            
          + 
            
          disp 
          ) 
         
          s3d 
          $ 
          plane3d 
          ( 
          fit 
          ) 
         
          detach 
          ( 
          mtcars 
          )

使用rgl包中的plot3d()函数可创建交互式的三维散点图，通过鼠标即可对图形进行旋转。

Rcmdr包中的scatter3d()函数可以实现类似功能。

气泡图

三维散点图用z轴表示第三个变量的大小，另一种思路是：先创建一个二维散点图，然后用点的大小来代表第三个变量的值，即气泡图。

使用symbols()函数来创建气泡图，支持的形状包括圆圈图、方形图、星形图、温度计图和箱线图，以绘制圆圈图为例：

如果想用面积而不是半径来表示第三个变量，则需要进行转换：

以下代码中，x轴表示车重，y轴表示每加仑英里数，气泡大小表示发动机排量。

一般来说，统计人员使用R时都倾向于避免使用气泡图，原因和避免使用饼图一样：相对于长度的判断，人们对体积/面积的判断通常更加困难。

9.2 折线图

将散点图上的点从左往右连接起来，即可得到折线图。以基础安装中的Orange数据集为例，绘制第一种树数据的散点图和折线图。

 
      
 
      
 
      
 
      
 
      
 
   
 
     
      
       
           1 
         

           2 
         

           3 
         

           4 
         

           5 
         

           6 
         
 
        
          opar 
            
          < 
          - 
            
          par 
          ( 
          no 
          . 
          readonly 
          = 
          TRUE 
          ) 
         
 
          par 
          ( 
          mfrow 
          = 
          c 
          ( 
          1 
          , 
          2 
          ) 
          ) 
         
 
          t1 
            
          < 
          - 
            
          subset 
          ( 
          Orange 
          , 
            
          Tree 
          == 
          1 
          ) 
         
 
          plot 
          ( 
          t1 
          $ 
          age 
          , 
            
          t1 
          $ 
          circumference 
          , 
            
          xlab 
          = 
          "Age(days)" 
          , 
            
          ylab 
          = 
          "Circumference(mm)" 
          , 
            
          main 
          = 
          "Orange Tree 1 Growth" 
          ) 
         
 
          plot 
          ( 
          t1 
          $ 
          age 
          , 
            
          t1 
          $ 
          circumference 
          , 
            
          xlab 
          = 
          "Age(days)" 
          , 
            
          ylab 
          = 
          "Circumference(mm)" 
          , 
            
          main 
          = 
          "Orange Tree 1 Growth" 
          , 
            
          type 
          = 
          "b" 
          ) 
         
 
          par 
          ( 
          opar 
          ) 
         
 
      
 
     
   

两幅图的区别取决于参数type=”b”，折线图一般可用以下两个函数之一来创建：

type=可选值如下：

p：只有点；
l：只有线；
o：实心点和线（即线覆盖在点上）；
b、c：线连接点（c时不绘制点）；
s、S：阶梯线；
h：直方图式的垂直线；
n：不生成任何点和线（通常用来为后面的命令创建坐标轴）

以下展示一个更复杂的折线图创建过程，每种树都有自己独有的线条。

 
      
 
      
 
      
 
      
 
      
 
   
 
     
      
       
           1 
         

           2 
         

           3 
         

           4 
         

           5 
         

           6 
         

           7 
         

           8 
         

           9 
         

           10 
         

           11 
         

           12 
         

           13 
         

           14 
         
 
        
          Orange 
          $ 
          Tree 
            
          < 
          - 
            
          as 
          . 
          numeric 
          ( 
          Orange 
          $ 
          Tree 
          ) 
         
 
          ntrees 
            
          < 
          - 
            
          max 
          ( 
          Orange 
          $ 
          Tree 
          ) 
         
 
          xrange 
            
          < 
          - 
            
          range 
          ( 
          Orange 
          $ 
          age 
          ) 
         
 
          yrange 
            
          < 
          - 
            
          range 
          ( 
          Orange 
          $ 
          circumference 
          ) 
         
 
          plot 
          ( 
          xrange 
          , 
            
          yrange 
          , 
            
          type 
          = 
          "n" 
          , 
            
          xlab 
          = 
          "Age(days)" 
          , 
            
          ylab 
          = 
          "Circumference(mm)" 
          ) 
         
 
          colors 
            
          < 
          - 
            
          rainbow 
          ( 
          ntrees 
          ) 
         
 
          linetype 
            
          < 
          - 
            
          c 
          ( 
          1 
          : 
          ntrees 
          ) 
         
 
          plotchar 
            
          < 
          - 
            
          seq 
          ( 
          18 
          , 
            
          18 
          + 
          ntrees 
          , 
            
          1 
          ) 
         
 
          for 
          ( 
          i 
            
          in 
            
          1 
          : 
          ntrees 
          ) 
          {  
         
 
               
          tree 
            
          < 
          - 
            
          subset 
          ( 
          Orange 
          , 
            
          Tree 
          == 
          i 
          ) 
         
 
               
          lines 
          ( 
          tree 
          $ 
          age 
          , 
            
          tree 
          $ 
          circumference 
          , 
            
          type 
          = 
          "b" 
          , 
            
          lwd 
          = 
          2 
          , 
            
          lty 
          = 
          linetype 
          [ 
          i 
          ] 
          , 
            
          col 
          = 
          colors 
          [ 
          i 
          ] 
          , 
            
          pch 
          = 
          plotchar 
          [ 
          i 
          ] 
          ) 
         
 
          } 
         
 
          title 
          ( 
          "Tree Growth" 
          , 
            
          "example of line plot" 
          ) 
         
 
          legend 
          ( 
          xrange 
          [ 
          1 
          ] 
          , 
            
          yrange 
          [ 
          2 
          ] 
          , 
            
          1 
          : 
          ntrees 
          , 
            
          cex 
          = 
          . 
          8 
          , 
            
          col 
          = 
          colors 
          , 
            
          pch 
          = 
          plotchar 
          , 
            
          lty 
          = 
          linetype 
          , 
            
          title 
          = 
          "Tree" 
          ) 
         
 
      
 
     
   

9.3 相关图

相关图通过对相关系数矩阵的可视化，来回答多个被考察变量之间相关性强弱的问题。

以mtcars数据框为例，其包含了11个变量，每个变量都有32个观测，使用以下代码获得各变量间的相关系数。

仅凭借以上相关系数矩阵难以快速直观得反映出变量间相关性的强弱，corrgram包中的corrgram()函数可以用图形方式展示该相关系数矩阵。

 
           1 
         
           2 
         
          library 
          ( 
          corrgram 
          ) 
         
          corrgram 
          ( 
          mtcars 
          , 
            
          order 
          = 
          TRUE 
          , 
            
          lower 
          . 
          panel 
          = 
          panel 
          . 
          shade 
          , 
            
          upper 
          . 
          panel 
          = 
          panel 
          . 
          pie 
          , 
            
          text 
          . 
          panel 
          = 
          panel 
          . 
          txt 
          , 
            
          main 
          = 
          "Correlogram of matchers intercorrelations" 
          )

先解释左下方的单元格：蓝色单元格表示两变量呈正相关，红色单元格表示两变量呈负相关，颜色越深、饱和度越高，相关性越强。为了将有相似相关模式的变量聚集在一起，对矩阵的行和列都重新进行了排序（使用主成分法）。

右上方的饼图原理类似：蓝色表示正相关，红色表示负相关，相关性的强弱用饼图填充的大小来表示。

lower.panel和upper.panel参数指定了左下方和右上方图形的形式，可选的参数有：NULL（无内容）、panel.pie（饼图填充）、panel.shade（阴影深度）、panel.ellipse（置信椭圆）和panel.pts（平滑拟合曲线），还可以通过“diag.panel=panel.minmax”在对角线输出变量的最大最小值。不妨再试试以下例子：

9.4 马赛克图

以上讨论内容解决了可视化定量或连续型变量间关系的方法，如果是类别型变量，而且是多个（单个可以用柱状图或饼图、两个可以用三维柱状图）类别型变量间的关系，可以考虑马赛克图。

在马赛克图中，嵌套矩行面积正比于单元格频率，其中该频率即为多维列联表中的频率，颜色和/或阴影可表示拟合模型的残差值。

vcd包中的mosaic()函数可以绘制马赛克图（R基础安装中的mosaicplot()函数也可以绘制马赛克图，但是功能相对较弱），以基础安装中的Titanic数据集为例，它包含存活或死亡的乘客数、乘客的船舱等级（一等、二等、三等和船员）、性别（男性、女性），以及年龄层（儿童、成人）。

以多维列联表的形式查看Titanic数据集：

mosaic()函数调用格式如下：

其中table是数组形式的列联表，另外也可以用：

其中formula是标准的R表达式，data为数据框或表格，添加shade=TRUE将根据拟合模型的Pearson残差值对图形上色，添加legend=TRUE将展示残差值图例。以下两种方法都可以生成马赛克图，但是使用表达式允许对图形中变量的选择和摆放拥有更多的控制权。

可以从马赛克图中得到很多信息：

从船员到头等舱，存活率陡然提高；
大部分孩子都处在二等舱和三等舱中；
头等舱中的女性大部分都存活了下来，而三等舱中仅有一半女性存活；
船员中女性很少，导致该组的Survived标签重叠（No和Yes）；
在假定生存率和船舱等级、性别、年龄层无关的前提下，蓝色阴影表示实际值超过预期值，红色阴影表示实际值低于预期值。如头等舱女性存活率和男性船员死亡率超过预期值，而三等舱男性存活率比模型预期值低。

10 高级图形进阶

数据分析 BY 伦大锤阅读量 1,934

除了R中的基础图形之外，grid、lattice和ggplot2等软件包也提供了图形系统，它们克服了R基础图形系统的低效性，大大地扩展了R的绘图能力。

grid图形系统可以很容易地控制图形基础单元，给予编程者创作图形极大的灵活性。lattice包通过一维、二维或三维条件绘图，即所谓的栅栏（trellis）图形来对多元变量关系进行直观展示。ggplot2包则基于一种全面的图形“语法”，提供了一种全新的图形创建方法。

10.1 R中的四种图形系统

R中的四种图形系统即，基础图形系统、grid、lattice和ggplot2，基础图形无须安装和加载即可使用，grid和lattice使用前需要加载对应的包，而ggplot2还需要安装并加载。

10.2 Lattice包

在一个或多个其他变量的条件下，栅栏图形展示某个变量的分布或与其他变量间的关系。以lattice包中的singer数据集为例，其包含了合唱成员的身高和声部数据，来看以下代码：

 
            1 
          
            2 
          
           library 
           ( 
           lattice 
           ) 
          
           histogram 
           ( 
           ~ 
           height 
             
           | 
             
           voice 
           . 
           part 
           , 
             
           data 
           = 
           singer 
           , 
             
           main 
           = 
           "Distribution of Heights by Voice Pitch" 
           , 
             
           xlab 
           = 
           "Height(inches)" 
           )

height为因变量，voice.part被称为条件变量，以上代码对八个声部的每一个都创建一个直方图，图形显示男高音和男低音比女低音和女高音身高都要高。

在栅栏图形中，单个面板要依据条件变量的各个水平来创建。如果指定了多个条件变量，那么一个面板将按照各个因子水平的组合来创建。面板将被排成一个阵列以进行比较，用户可对每个面板中展示的图形、面板的格式和位置、面板的摆放、图例的内容和位置以及其他许多图形特征进行控制。

lattice包的高级绘图都服从以下格式：

其中formula指定要展示的变量和条件变量，data指定一个数据框，options为逗号分隔参数，用来修改图形的内容、摆放方式和标注，graph_function可以是以下函数：

contourplot()：三维等高线图；
levelplot()：三维水平图；
cloud()：三维散点图；
wireframe()：三维线框图；
barchart()：条形图；
bwplot()：箱线图；
dotplot()：点图：
histogram()：直方图；
densityplot()：核密度图；
parallel()：平行坐标图；
xyplot()：散点图；
splom()：散点图矩阵；
stripplot()：带状图。

设小写字母代表数值型变量，大写字母代表类别型变量（因子），在高级绘图函数中，表达式形式通常为：

竖线左边的变量为主要变量，右边的变量为条件变量。主要变量将变量映射到每个面板的坐标轴上。尝试运行以下代码，加深对以上表达式的理解，图形基于数据框mtcars中的小汽车数据绘制而成。

 
    
 
      
       
        
            1 
          

            2 
          

            3 
          

            4 
          

            5 
          

            6 
          

            7 
          

            8 
          

            9 
          

            10 
          

            11 
          

            12 
          
 
         
           library 
           ( 
           lattice 
           ) 
          
 
           attach 
           ( 
           mtcars 
           ) 
          
 
           gear 
            
           < 
           - 
            
           factor 
           ( 
           gear 
           , 
            
           levels 
           = 
           c 
           ( 
           3 
           , 
            
           4 
           , 
            
           5 
           ) 
           , 
            
           labels 
           = 
           c 
           ( 
           "3 gears" 
           , 
            
           "4 gears" 
           , 
            
           "5 gears" 
           ) 
           ) 
          
 
           cyl 
            
           < 
           - 
            
           factor 
           ( 
           cyl 
           , 
            
           levels 
           = 
           c 
           ( 
           4 
           , 
            
           6 
           , 
            
           8 
           ) 
           , 
            
           labels 
           = 
           c 
           ( 
           "4 cylinders" 
           , 
            
           "6 cylinders" 
           , 
            
           "8 cylinders" 
           ) 
           ) 
          
 
           densityplot 
           ( 
           ~ 
           mpg 
           , 
            
           main 
           = 
           "Density Plot" 
           , 
            
           xlab 
           = 
           "Miles Per Gallon" 
           ) 
          
 
           densityplot 
           ( 
           ~ 
           mpg 
            
           | 
            
           cyl 
           , 
            
           main 
           = 
           "Density Plot by Number of Cylinders" 
           , 
            
           xlab 
           = 
           "Miles Per Gallon" 
           ) 
          
 
           bwplot 
           ( 
           cyl 
            
           ~ 
            
           mpg 
            
           | 
            
           gear 
           , 
            
           main 
           = 
           "Box Plots by Cylinders and Gears" 
           , 
            
           xlab 
           = 
           "Miles Per Gallon" 
           , 
            
           ylab 
           = 
           "Cylinders" 
           ) 
          
 
           xyplot 
           ( 
           mpg 
            
           ~ 
            
           wt 
            
           | 
            
           cyl 
            
           * 
            
           gear 
           , 
            
           main 
           = 
           "Scatter Plots by Cylinders and Gears" 
           , 
            
           xlab 
           = 
           "Car Weight" 
           , 
            
           ylab 
           = 
           "Miles Per Gallon" 
           ) 
          
 
           cloud 
           ( 
           mpg 
            
           ~ 
            
           wt 
            
           * 
            
           qsec 
            
           | 
            
           cyl 
           , 
            
           main 
           = 
           "3D Scatter Plots by Cylinders" 
           ) 
          
 
           dotplot 
           ( 
           cyl 
            
           ~ 
            
           mpg 
            
           | 
            
           gear 
           , 
            
           main 
           = 
           "Dot Plots by Number of Gears and Cylinders" 
           , 
            
           xlab 
           = 
           "Miles Per Gallon" 
           ) 
          
 
           splom 
           ( 
           mtcars 
           [ 
           c 
           ( 
           1 
           , 
            
           3 
           , 
            
           4 
           , 
            
           5 
           , 
            
           6 
           ) 
           ] 
           , 
            
           main 
           = 
           "Scatter Plot Matrix for Mtcars Data" 
           ) 
          
 
           detach 
           ( 
           mtcars 
           ) 
          
 
       
 
      
    

可以将lattice包高级绘图函数生成的图形存储至变量，以进一步操作和管理。

 
            1 
          
            2 
          
           library 
           ( 
           lattice 
           ) 
          
           mygraph 
             
           < 
           - 
             
           densityplot 
           ( 
           ~ 
           height 
             
           | 
             
           voice 
           . 
           part 
           , 
             
           data 
           = 
           singer 
           )

以上代码创建了一个栅栏密度图并存储在mygraph对象中。此时不会展示任何图形，只有调用plot(mygraph)或mygraph时才会展示图形。通过使用options，可以轻松地修改lattice图形，或者在图形对象生成之后使用update()函数：

条件变量

lattice图形的一个最强大之处便是可以添加条件变量，并创建和每个条件变量水平对应的图形面板。

通常，条件变量是因子。如果希望以连续型变量为条件，那么一种方法是使用R的cut()函数将连续型变量转换为离散变量，另一种方法是使用lattice包中提供的函数。lattice包提供了一些将连续型变量转化为瓦块（shingle）数据结构的函数，特别的，连续型变量会被分割到一系列（可能）重叠的数值范围中。

 
            1 
          
           myshingle 
             
           < 
           - 
             
           equal 
           . 
           count 
           ( 
           x 
           , 
             
           number 
           = 
           #, overlap=proportion)

以上函数会把连续型变量x分割到#个区间中，重叠度为proportion，每个数值范围内观测数量相等，并返回为一个变量myshingle，输出或绘制该对象将会展示瓦块区间。

以mtcars为例，将发动机排量转化为一个三水平的瓦块变量并使用，代码还使用选项修改了面板的布局和宽高比，以便于比较。

面板函数

lattice包中的每个高级绘图函数都调用了一个默认的绘图函数来绘制面板，如以下两种形式是等价的：

 
            1 
          
            2 
          
           xyplot 
           ( 
           mpg 
             
           ~ 
             
           wt 
             
           | 
             
           displacement 
           , 
             
           data 
           = 
           mtcars 
           ) 
          
           xyplot 
           ( 
           mpg 
             
           ~ 
             
           wt 
             
           | 
             
           displacement 
           , 
             
           data 
           = 
           mtcars 
           , 
             
           panel 
           = 
           panel 
           . 
           xyplot 
           )

你可以使用自定义函数替换默认的函数，或者将一个或多个默认函数整合至自定义函数中，这意味着面板的绘制具备了极大的灵活性。

之前的例子绘制了mtcars数据集中mpg、wt和disp等变量间关系的散点图，如果需要添加回归线、轴须线和网格线，则需要创建自己的面板函数。

 
    
 
      
       
        
            1 
          

            2 
          

            3 
          

            4 
          

            5 
          

            6 
          

            7 
          

            8 
          
 
         
           displacement 
            
           < 
           -  
           equal 
           . 
           count 
           ( 
           mtcars 
           $ 
           disp 
           , 
            
           number 
           = 
           3 
           , 
            
           overlap 
           = 
           0 
           ) 
          
 
           mypanel 
            
           < 
           - 
            
           function 
           ( 
           x 
           , 
            
           y 
           ) 
           {  
          
 
                
           panel 
           . 
           xyplot 
           ( 
           x 
           , 
            
           y 
           , 
            
           pch 
           = 
           19 
           ) 
          
 
                
           panel 
           . 
           rug 
           ( 
           x 
           , 
            
           y 
           ) 
          
 
                
           panel 
           . 
           grid 
           ( 
           h 
           = 
           - 
           1 
           , 
            
           v 
           = 
           - 
           1 
           ) 
            
          
 
                
           panel 
           . 
           lmline 
           ( 
           x 
           , 
            
           y 
           , 
            
           col 
           = 
           "red" 
           , 
            
           lwd 
           = 
           1 
           , 
            
           lty 
           = 
           2 
           ) 
          
 
           } 
            
          
 
           xyplot 
           ( 
           mpg 
            
           ~ 
            
           wt 
            
           | 
            
           displacement 
           , 
            
           data 
           = 
           mtcars 
           , 
            
           layout 
           = 
           c 
           ( 
           3 
           , 
            
           1 
           ) 
           , 
            
           aspect 
           = 
           1.5 
           , 
            
           main 
           = 
           "Miles Per Gallon vs. Weight by Engine Displacement" 
           , 
            
           xlab 
           = 
           "Weight" 
           , 
            
           ylab 
           = 
           "Miles Per Gallon" 
           , 
            
           panel 
           = 
           mypanel 
           ) 
          
 
       
 
      
    

再来看一个例子，绘制以汽车传动类型为条件时每加仑英里数与发动机排量（连续型变量）的关系图。

 
       
 
       
 
       
 
       
 
       
 
    
 
      
       
        
            1 
          

            2 
          

            3 
          

            4 
          

            5 
          

            6 
          

            7 
          

            8 
          

            9 
          
 
         
           library 
           ( 
           lattice 
           ) 
          
 
           mtcars 
           $ 
           transmission 
             
           < 
           - 
             
           factor 
           ( 
           mtcars 
           $ 
           am 
           , 
             
           levels 
           = 
           c 
           ( 
           0 
           , 
             
           1 
           ) 
           , 
             
           labels 
           = 
           c 
           ( 
           "Automatic" 
           , 
             
           "Manual" 
           ) 
           ) 
          
 
           panel 
           . 
           smoother 
             
           < 
           - 
             
           function 
           ( 
           x 
           , 
             
           y 
           ) 
           {  
          
 
                
           panel 
           . 
           grid 
           ( 
           h 
           = 
           - 
           1 
           , 
             
           v 
           = 
           - 
           1 
           ) 
          
 
                
           panel 
           . 
           xyplot 
           ( 
           x 
           , 
             
           y 
           ) 
          
 
                
           panel 
           . 
           loess 
           ( 
           x 
           , 
             
           y 
           ) 
          
 
                
           panel 
           . 
           abline 
           ( 
           h 
           = 
           mean 
           ( 
           y 
           ) 
           , 
             
           lwd 
           = 
           2 
           , 
             
           lty 
           = 
           2 
           , 
             
           col 
           = 
           "green" 
           ) 
          
 
           } 
          
 
           xyplot 
           ( 
           mpg 
             
           ~ 
             
           disp 
             
           | 
             
           transmission 
           , 
             
           data 
           = 
           mtcars 
           , 
             
           scales 
           = 
           list 
           ( 
           cex 
           = 
           . 
           8 
           , 
             
           col 
           = 
           "red" 
           ) 
           , 
             
           panel 
           = 
           panel 
           . 
           smoother 
           , 
             
           xlab 
           = 
           "Displacement" 
           , 
             
           ylab 
           = 
           "Miles Per Gallon" 
           , 
             
           main 
           = 
           "MPG vs. Displacement by Transmission Type" 
           , 
             
           sub 
           = 
           "Dotted lines are Group Means" 
           , 
             
           aspect 
           = 
           1 
           ) 
          
 
       
 
      
    

分组变量

当一个lattice图形表达式含有条件变量时，将会生成在该变量各个水平下的面板。若希望将结果叠加在一起，则需要将变量设定为分组变量（grouping variable）。以下代码用核密度图展示手动档和自动挡汽车的每加仑英里数分布情况。

R 语言中的判断语句 lsx202406 开发语言
R语言中的判断语句在R语言编程中，判断语句是执行条件逻辑的基础。它们允许程序根据特定的条件执行不同的代码块。本文将深入探讨R语言中的几种常见判断语句，包括if语句、if-else语句和switch语句，并探讨它们的用法和场景。1.if语句if语句是R语言中最基本的条件判断结构。它的基本形式如下：if(条件){#条件为真时执行的代码块}当条件为真时，R会执行大括号内的代码块。如果条件为假，则不会执行
从0开始学习R语言--Day31--概率图模型 Chef_Chen 学习
在探究变量之间的相关性时，由于并不是每次分析数据时所用的样本集都能囊括所有的情况，所以单纯从样本集去下判断会有武断的嫌疑；同样的，我们有时候也想要在数据样本不够全面时就能对结果有个大概的了解。例如医生在给患者做诊断时，有些检查需要耗费的时间很久，但仅仅凭借一些其他的症状，他就可以对病人患某种病有个大概的猜想，从而先做出一些措施来降低风险，毕竟等到疾病真正发生时可能会来不及。概率图模型便是能够同时进
Jmeter使用过程中的一些总结 kanyun123 jmeter
以下总结使用的Jmeter版本为5.6.31、当把Jmeter语言转换为中文时，可能会出现jmeter日志不出现，当发现Jmeter不发送请求时，不显示日志，排查问题就会没有头绪，此时可以尝试将语言切换为英文，再尝试发现日志出现了。2、当你辛辛苦苦地的做完的稳定性测试，还没来得及截图，这个时候，你心血来潮想切换下语言，然后你面发现测好的数据都没了。3、有些数据使用csv或者jmeter的内置函数都
分类树/装袋法/随机森林算法的R语言实现廖致君 R
原文首发于简书于[2018.06.12]本文是我自己动手用R语言写的实现分类树的代码，以及在此基础上写的袋装法（bagging）和随机森林（randomforest）的算法实现。全文的结构是：分类树基本知识predginisplitrulesplitrule_bestsplitrule_randomsplittingbuildTreepredict装袋法与随机森林基本知识baggingpredic
flutter内容学习总结玖柒凯哲学习
Flutter语言学习引言随着移动互联网的快速发展，移动应用开发已成为软件开发领域的一个重要分支。为了满足日益增长的应用需求，开发者们寻求更高效、更便捷的开发工具。Flutter作为一个由Google推出的开源移动应用开发框架，它以其高效的编码体验、优秀的性能和可观的UI保真度吸引了众多开发者的关注。本学习内容总结报告将围绕Flutter开发环境的搭建、调试方法、核心组件和布局管理进行详细阐述。F
从0开始学习R语言--Day27--空间自相关 Chef_Chen 学习
有的时候，我们在数据进行分组时，会发现用正常的聚类分析的方法和思维，分组的情况不是很理想。其实这是因为我们常常会忽略一个问题：假设我们正在分析的数据是真实的，那么它也肯定在一定程度上符合客观规律。而如果我们正在分析的数据中，有真实的客观空间数据时，可以考虑用空间自相关的方法去分析。例如我们在分析城市犯罪率的时候，用聚类分析的思维，我们可能会思考不同城市的犯罪特征是什么，是否有相似点，亦或是试图把城
第100+42步 ChatGPT学习：R语言实现阈值调整 Jet4505 《100+X Steps to Get ML》学习 r语言开发语言 chatgpt
今天来说个机器学习分类的概念，阈值。一、何为阈值这个阈值（Threshold）在二分类问题中起到了关键作用，它决定了模型预测结果的分类边界。在二分类问题中，模型通常会输出一个概率值（介于0和1之间），表示样本属于某一类（通常为正类）的可能性。阈值的作用是将这个概率值转换为具体的分类结果（0或1）。如果预测概率**大于阈值**，则分类为正类（1）。如果预测概率**小于或等于阈值**，则分类为负类（0
从0开始学习R语言--Day26--因果推断
很多时候我们在探讨数据的相关性问题时，很容易会忽略到底是数据本身的特点还是真的是因为特征的区分导致的不同，从而误以为是特征起的效果比较大。这就好比测试一款新药是否真的能治病，假如吃药的患者康复的更快，那到底是因为药物本身的效果好，还是因为患者本身更健康，平时有控制饮食合理作息与运动，从而在患病后更快地凭借自身免疫力战胜病毒。这需要我们意识到对照试验还需要人为地补足某些条件，也就是探讨是否真的是X导
最新期刊影响因子，基本包含全部期刊 Bioinfo科研生信筆記影响因子 2024年期刊影响因子期刊因子因子 IF
原文链接：2024年期刊最新影响因子（IF）2024年期刊最新影响因子（IF）BioinfoR生信筆記，注于分享生物信息学相关知识和R语言绘图教程。
R语言文本探索与预处理：入门指南 Morpheon R r语言开发语言
今天是个阴雨连绵的夏日，因此带来今天的第二篇推文。祝您阅读愉快！文本探索和预处理是将非结构化文本转换为结构化数据进行分析的关键步骤。R语言中的正则表达式(Regex)正则表达式(Regex)是定义文本模式的字符序列，用于搜索、模式匹配和文本替换等任务。在处理搜索引擎和垃圾邮件过滤等应用中的非结构化文本时至关重要。R中常用的正则表达式函数：grep()/grepl()：定位匹配模式的字符串；grep
文本聚类分析：基于相似性的文档分组 Morpheon R R TextClustering
大家周一快乐！最近世界局势动荡，中东冲突不断。这种混乱可能会影响我们对世界的认知。就像法国人说的“C’estlavie”（这就是生活）。但无论未来如何，请记住瑞士人常说的“Lavieestbelle”（生活是美好的）。文本聚类分析通过内容相似性将文档分组，实现在R语言中自动对大型文本集合进行分类。什么是文本聚类分析？聚类分析将文档分组，使得同一组内的文档彼此之间的相似度高于与其他组中文档的相似度。
scanpy读取10x单细胞数据木与长清单细胞数据处理 python
做单细胞或空间组课题时经常会需要导入文献中的单细胞数据作为参考，市面上最常见的格式又以10xgenomics为主要代表，通常包括barcodes.tsv.gz、features.tsv.gz（或者genes.tsv.gz）、matrix.mtx.gz三种格式文件。在面对数据读取问题时，R语言Seurat包有Read10X函数，Python中scanpy包则对应scanpy.read_10x_mtx
Flutter 与原生技术（Objective-C/Swift，java）的关系 BAGAE cocoa macos objective-c 智慧城市 java 开发语言 hbase
在iOS开发中，Flutter与原生技术（Objective-C/Swift）的关系一、技术定位与核心差异Flutter语言：使用Dart语言开发，通过AOT（提前编译）将代码转换为原生ARM指令，无需依赖iOS原生UI组件。渲染：使用Skia图形引擎直接渲染UI，实现跨平台UI一致性。优势：一套代码同时支持iOS和Android，开发效率高；UI表现可控性强。iOS原生开发语言：主流语言为Swi
R语言非结构化文本挖掘入门指南 Morpheon R r语言开发语言
文本挖掘（TextMining），也称为文本分析（TextAnalytics），是从非结构化文本数据中提取有意义的见解。全球约80%的数据是非结构化的。本篇博客将探讨文本挖掘和网络爬取的关键概念及基于R的实用技术。什么是文本挖掘？文本挖掘利用计算技术从非结构化文本源（如书籍、报告、文章、博客和社交媒体帖子）中提取结构化信息。它能够自动化地从海量数据集中发现知识，实现文本摘要和分析。关键点：非结构化
从0开始学习R语言--Day20-ARIMA与格兰杰因果检验 Chef_Chen 学习 r语言开发语言
ARIMAARIMA模型的核心就藏在其名字里，AR（自回归）代表了要预测的数据可能跟历史数据有关系，I（差分）代表了历史数据点之间的差异，MA（移动平均）代表了在预测历史数据点产生的误差可以在预测未来数据时修正，这三个点加起来共同用历史数据来预测未来值。举个浅显的例子就是，假设要预测明天会不会下雨，首先我们查看过去的数据带你，如果过去连续三天都下雨，那么明天下雨的概率就会很高，对应着AR，即用过去
Anaconda 基础教程
一、什么是Anaconda？Anaconda是一个开源的Python和R语言的发行版本，致力于为数据科学、机器学习、大数据处理和科学计算提供便利的包管理和环境管理工具。它包含了conda包管理器和超过1500个数据科学常用的库。二、Anaconda的核心组成Conda：用于包管理和环境管理的工具。AnacondaNavigator：图形界面的包和环境管理工具。预装库：如NumPy、Pandas、M
R语言序列8——RMarkdown与数据报告自动化 theskylife R语言的修炼之路 r语言自动化开发语言
目录写在开头1.RMarkdown基础1.1开始第一个RMarkdown1.1.1安装R和RStudio1.1.2.安装pandoc1.1.3.创建一个新的RMarkdown文档1.1.4.编辑RMarkdown文档1.1.5.渲染文档1.1.6.导出文档1.2文档结构与语法1.3不同输出格式的配置（HTML、PDF、Word）2.动态报告与参数化报告2.1插入R代码和结果2.2使用参数化报告定制
【科研绘图系列】R语言绘制论文组图（multiple plots）生信学习者1 SCI科研绘图系列 r语言数据分析数据挖掘数据可视化
禁止商业或二改转载，仅供自学使用，侵权必究，如需截取部分内容请后台联系作者!文章目录介绍加载R包数据下载导入数据数据预处理画图1画图2画图3画图4输出图片总结系统信息介绍一个用于分析和可视化博茨瓦纳婴儿微生物组研究（BotswanaInfantMicrobiomeStudy）中呼吸道病毒和细菌数据的R脚本。代码的主要目的是生成论文中的Figure1，包括三个子图（a、b、c），并保存相关的数据和图
从0开始学习R语言--Day20--Wilcoxon秩和检验 Chef_Chen 学习 r语言开发语言
Wilcoxon秩和检验当数据不满足正态分布时，我们常常会苦恼于如何处理数据。即使是用缩进的方法，把数据缩进到（1-99%）或（1-95%）的范围内，假如有一些数据点集中在数据分布的尾端，这依然会影响到我们对数据特点的判断，尤其是需要探寻数据组之间的联系或关系的时候。而实际上，假设我们要探究的不是数据在统计上的数值关系，而是因果关系或比较，我们可以把数据处理成秩次的形式，从而去对比数据组，这样相当
从0开始学习R语言--Day19--连续变量的相关性检验 Chef_Chen 学习 r语言开发语言
昨天我们学习了分类变量的检验方法，今天我们来看看连续性变量的相关性检验方法。Pearson一般来说，person适用于两个变量之间满足线性的单调关系，像我们常说的单调递增或单调递减，且我们的变量是连续且正态分布的。简单来说，就是变量拥有无限的可能性，比如身高可能是160.1,160.9，185.32等等，且大部分的值都在平均值附近（比如一个城市成年男性的平均身高）。听起来似乎很简单，但有时候可以有
从0开始学习R语言--Day21--Kruskal-Wallis检验与Friedman检验 Chef_Chen 学习
Kruskal-Wallis检验Kruskal-Wallis检验一般用于比较常见的比较三个群体的水平，比如我们有一班、二班、三班的语文成绩，我们将三个班的学生成绩混合在一起进行排名，也就是我们平时所说的级排名。进一步通过计算班级的平均级排名来判断班级之间的班级水平，这个方法要求数据之间要独立分布，即不要有类似三个班之间会有互相辅导的情况，不互相影响。Friedman检验Friedman检验同样用于
300+SCI科研绘图系列教程（R和python）提供完整的数据和代码生信学习者1 SCI科研绘图系列 r语言 python 数据可视化
科研绘图系列：科研绘图系列：R语言分组柱状图三科研绘图系列：箱线图加百分比点图展示组间差异-CSDN博客科研绘图系列：箱线图加蜜蜂图展示组间数据分布-CSDN博客科研绘图系列：小提琴图和双侧小提琴图展示组间差异-CSDN博客科研绘图系列：组间差异的STAMP图的ggplot2实现-CSDN博客科研绘图系列：组间差异误差棒展示-CSDN博客科研绘图系列：甜圈圈donut图展示比例-CSDN博客科研绘
【科研绘图系列】R语言绘制论文组图（multiple plots）生信学习者1 SCI科研绘图系列 r语言数据分析数据挖掘数据可视化
禁止商业或二改转载，仅供自学使用，侵权必究，如需截取部分内容请后台联系作者!文章目录介绍加载R包数据下载导入数据数据预处理画图1画图2画图3画图4画图5画图6输出图片总结系统信息介绍这段代码是用于分析和可视化博茨瓦纳婴儿微生物组研究（BotswanaInfantMicrobiomeStudy）中呼吸道病毒和细菌定植数据的R脚本。代码的主要目的是生成论文中的Figure3，包括五个子图（a、b、c、
【R语言编程——数据调用】南瓜胖胖 r语言开发语言
这里写自定义目录标题可用库及数据集外部数据导入方法查看数据集信息在R语言中，有多个库支持调用内置数据集或外部数据，包括studentdata等教学或示例数据集。以下是常见的库和方法：可用库及数据集openintro库该库包含多个教学数据集，包括studentdata。安装并加载库后可直接调用：install.packages("openintro")library(openintro)data(s
go语言第三方包安装方法_GO富集分析可视化：R语言GOplot包
找R语言做弦图的教程的时候发现了这个包：GOplot。其主要功能是可视化GO富集分析的结果。自己应该会用得到。第一步是学习其帮助文档中的例子，然后学习如何准备自己的数据，并利用这个包中的函数来绘图查看帮助文档library(GOplot)help(package="GOplot")重复帮助文档中的教程data(EC)class(EC)dim(EC$david)dim(EC$genelist)cir
实验设计与分析（第6版，Montgomery著，傅珏生译) 第10章拟合回归模型10.9节思考题10.6 R语言解题 lishaoan77 实验设计与分析思考题回归 r语言实验设计与数据分析‘线性回归回归显著性
本文是实验设计与分析（第6版，Montgomery著，傅珏生译)第10章拟合回归模型10.9节思考题10.6R语言解题。主要涉及线性回归、回归的显著性。10-6vialsummary(lm.fit)Call:lm.default(formula=Viscosity~Temperature+Catalyst,data=visc)Residuals:123456-24.98724.30711.820-
实验设计与分析（第6版，Montgomery著，傅珏生译) 第10章拟合回归模型10.9节思考题10.12 R语言解题 lishaoan77 实验设计与分析思考题回归 r语言实验设计与数据分析线性回归回归显著性残差分析
本文是实验设计与分析（第6版，Montgomery著，傅珏生译)第10章拟合回归模型10.9节思考题10.12R语言解题。主要涉及线性回归、回归的显著性、残差分析。10-12vialsummary(lm.fit)Call:lm.default(formula=Viscosity~(Temperature)^2+(Catalyst)^2,data=visc)Residuals:Min1QMedian
R语言入门-学习笔记记录小狗狗跑数据 r语言
###第1章：基础入门##第1章-3.R扩展包的10个问题#安装某个扩展包#也可以在右下角的框中“packages”栏中的“install”项目中操作install.packages("devtools")#查看已安装的扩展包#也可以在右下角的框中“packages”栏中查看installed.packages()#更新：第一行查看未更新的扩展包；第二行执行更新指令。#也可以在右下角的框中“pac
【R语言编程绘图-mlbench】南瓜胖胖 r语言开发语言机器学习
mlbench库简介mlbench是一个用于机器学习的R语言扩展包，主要用于提供经典的基准数据集和工具，常用于算法测试、教学演示或研究场景。该库包含多个知名数据集，涵盖分类、回归、聚类等任务。包含的主要数据集BostonHousing波士顿房价数据集，包含506条记录和14个特征，用于回归任务。目标变量为房屋中位数价格。BreastCancer威斯康星州乳腺癌数据集（原始版），包含699个样本和1
R语言错误处理方法大全 weixin_49320263 常用方法 r语言开发语言
在R语言的批量运行中，常需要自动跳过错误，继续向下运行。1、使用tryCatch()捕获错误并返回占位符#示例：循环中跳过错误继续执行results<-numeric(5)#预分配结果向量for(iin1:5){#用tryCatch包裹可能出错的代码results[i]<-tryCatch({if(i==3)stop("故意制造的错误")#模拟错误log(i-1)#正常计算},error=func
jdk tomcat 环境变量配置 Array_06 java jdk tomcat
Win7 下如何配置java环境变量 1。准备jdk包，win7系统，tomcat安装包（均上网下载即可） 2。进行对jdk的安装，尽量为默认路径（但要记住啊！！以防以后配置用。。。） 3。分别配置高级环境变量。电脑-->右击属性-->高级环境变量-->环境变量。分别配置 : path &nbs
Spring调SDK包报java.lang.NoSuchFieldError错误 bijian1013 java spring
在工作中调另一个系统的SDK包，出现如下java.lang.NoSuchFieldError错误。 org.springframework.web.util.NestedServletException: Handler processing failed; nested exception is java.l
LeetCode[位运算] - #136 数组中的单一数 Cwind java 题解位运算 LeetCode Algorithm
原题链接：#136 Single Number 要求：给定一个整型数组，其中除了一个元素之外，每个元素都出现两次。找出这个元素注意：算法的时间复杂度应为O(n)，最好不使用额外的内存空间难度：中等分析：题目限定了线性的时间复杂度，同时不使用额外的空间，即要求只遍历数组一遍得出结果。由于异或运算 n XOR n = 0, n XOR 0 = n，故将数组中的每个元素进
qq登陆界面开发 15700786134 qq
今天我们来开发一个qq登陆界面，首先写一个界面程序，一个界面首先是一个Frame对象，即是一个窗体。然后在这个窗体上放置其他组件。代码如下： public class First { public void initul(){ jf=ne
Linux的程序包管理器RPM 被触发 linux
在早期我们使用源代码的方式来安装软件时，都需要先把源程序代码编译成可执行的二进制安装程序，然后进行安装。这就意味着每次安装软件都需要经过预处理-->编译-->汇编-->链接-->生成安装文件--> 安装，这个复杂而艰辛的过程。为简化安装步骤，便于广大用户的安装部署程序，程序提供商就在特定的系统上面编译好相关程序的安装文件并进行打包，提供给大家下载，我们只需要根据自己的
socket通信遇到EOFException 肆无忌惮_ EOFException
java.io.EOFException at java.io.ObjectInputStream$PeekInputStream.readFully(ObjectInputStream.java:2281) at java.io.ObjectInputStream$BlockDataInputStream.readShort(ObjectInputStream.java:
基于spring的web项目定时操作知了ing java Web
废话不多说，直接上代码，很简单配置一下项目启动就行 1，web.xml <?xml version="1.0" encoding="UTF-8"?> <web-app xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns="h
树形结构的数据库表Schema设计矮蛋蛋 schema
原文地址： http://blog.csdn.net/MONKEY_D_MENG/article/details/6647488 程序设计过程中，我们常常用树形结构来表征某些数据的关联关系，如企业上下级部门、栏目结构、商品分类等等，通常而言，这些树状结构需要借助于数据库完成持久化。然而目前的各种基于关系的数据库，都是以二维表的形式记录存储数据信息，
maven将jar包和源码一起打包到本地仓库 alleni123 maven
http://stackoverflow.com/questions/4031987/how-to-upload-sources-to-local-maven-repository <project> ... <build> <plugins> <plugin> <groupI
java IO操作与 File 获取文件或文件夹的大小，可读，等属性！！！百合不是茶
类 File File是指文件和目录路径名的抽象表示形式。 1，何为文件：标准文件（txt doc mp3...）目录文件（文件夹）虚拟内存文件 2，File类中有可以创建文件的 createNewFile（）方法,在创建新文件的时候需要try{} catch(）{}因为可能会抛出异常；也有可以判断文件是否是一个标准文件的方法isFile();这些防抖都
Spring注入有继承关系的类（2） bijian1013 java spring
被注入类的父类有相应的属性，Spring可以直接注入相应的属性，如下所例：1.AClass类 package com.bijian.spring.test4; public class AClass { private String a; private String b; public String getA() { retu
30岁转型期你能否成为成功人士 bijian1013 成长励志
很多人由于年轻时走了弯路，到了30岁一事无成，这样的例子大有人在。但同样也有一些人，整个职业生涯都发展得很优秀，到了30岁已经成为职场的精英阶层。由于做猎头的原因，我们接触很多30岁左右的经理人，发现他们在职业发展道路上往往有很多致命的问题。在30岁之前，他们的职业生涯表现很优秀，但从30岁到40岁这一段，很多人
【Velocity四】Velocity与Java互操作 bit1129 velocity
Velocity出现的目的用于简化基于MVC的web应用开发，用于替代JSP标签技术，那么Velocity如何访问Java代码.本篇继续以Velocity三http://bit1129.iteye.com/blog/2106142中的例子为基础， POJO package com.tom.servlets; public
【Hive十一】Hive数据倾斜优化 bit1129 hive
什么是Hive数据倾斜问题操作：join,group by,count distinct 现象：任务进度长时间维持在99%（或100%），查看任务监控页面，发现只有少量（1个或几个）reduce子任务未完成；查看未完成的子任务，可以看到本地读写数据量积累非常大，通常超过10GB可以认定为发生数据倾斜。原因：key分布不均匀倾斜度衡量：平均记录数超过50w且
在nginx中集成lua脚本：添加自定义Http头，封IP等 ronin47 nginx lua csrf
Lua是一个可以嵌入到Nginx配置文件中的动态脚本语言，从而可以在Nginx请求处理的任何阶段执行各种Lua代码。刚开始我们只是用Lua 把请求路由到后端服务器，但是它对我们架构的作用超出了我们的预期。下面就讲讲我们所做的工作。强制搜索引擎只索引mixlr.com Google把子域名当作完全独立的网站，我们不希望爬虫抓取子域名的页面，降低我们的Page rank。 location /{
java-3.求子数组的最大和 bylijinnan java
package beautyOfCoding; public class MaxSubArraySum { /** * 3.求子数组的最大和题目描述：输入一个整形数组，数组里有正数也有负数。数组中连续的一个或多个整数组成一个子数组，每个子数组都有一个和。求所有子数组的和的最大值。要求时间复杂度为O(n)。例如输入的数组为1, -2, 3, 10, -4,
Netty源码学习-FileRegion bylijinnan java netty
今天看org.jboss.netty.example.http.file.HttpStaticFileServerHandler.java 可以直接往channel里面写入一个FileRegion对象，而不需要相应的encoder： //pipeline（没有诸如“FileRegionEncoder”的handler）： public ChannelPipeline ge
使用ZeroClipboard解决跨浏览器复制到剪贴板的问题 cngolon 跨浏览器复制到粘贴板 Zero Clipboard
Zero Clipboard的实现原理 Zero Clipboard 利用透明的Flash让其漂浮在复制按钮之上，这样其实点击的不是按钮而是 Flash ，这样将需要的内容传入Flash，再通过Flash的复制功能把传入的内容复制到剪贴板。 Zero Clipboard的安装方法首先需要下载 Zero Clipboard的压缩包，解压后把文件夹中两个文件：ZeroClipboard.js
单例模式 cuishikuan 单例模式
第一种（懒汉，线程不安全）： public class Singleton { 2 private static Singleton instance; 3 pri
spring+websocket的使用 dalan_123
一、spring配置文件 <?xml version="1.0" encoding="UTF-8"?><beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http://www.w3.or
细节问题：ZEROFILL的用法范围。 dcj3sjt126com mysql
1、zerofill把月份中的一位数字比如1，2，3等加前导0 mysql> CREATE TABLE t1 (year YEAR(4), month INT(2) UNSIGNED ZEROFILL, -> day
Android开发10——Activity的跳转与传值 dcj3sjt126com Android开发
Activity跳转与传值，主要是通过Intent类，Intent的作用是激活组件和附带数据。一、Activity跳转方法一Intent intent = new Intent(A.this, B.class); startActivity(intent) 方法二Intent intent = new Intent();intent.setCla
jdbc 得到表结构、主键 eksliang jdbc 得到表结构、主键
转自博客：http://blog.csdn.net/ocean1010/article/details/7266042 假设有个con DatabaseMetaData dbmd = con.getMetaData(); rs = dbmd.getColumns(con.getCatalog(), schema, tableName, null); rs.getSt
Android 应用程序开关GPS gqdy365 android
要在应用程序中操作GPS开关需要权限： <uses-permission android:name="android.permission.WRITE_SECURE_SETTINGS" /> 但在配置文件中添加此权限之后会报错，无法再eclipse里面正常编译，怎么办？ 1、方法一：将项目放到Android源码中编译； 2、方法二：网上有人说cl
Windows上调试MapReduce zhiquanliu mapreduce
1.下载hadoop2x-eclipse-plugin https://github.com/winghc/hadoop2x-eclipse-plugin.git 把 hadoop2.6.0-eclipse-plugin.jar 放到eclipse plugin 目录中。 2.下载 hadoop2.6_x64_.zip http://dl.iteye.com/topics/download/d2b
如何看待一些知名博客推广软文的行为？ justjavac 博客
本文来自我在知乎上的一个回答：http://www.zhihu.com/question/23431810/answer/24588621 互联网上的两种典型心态：当初求种像条狗，如今撸完嫌人丑当初搜贴像条犬，如今读完嫌人软你为啥感觉不舒服呢？难道非得要作者把自己的劳动成果免费给你用，你才舒服？就如同 Google 关闭了 Gooled Reader，那是
sql优化总结 macroli sql
为了是自己对sql优化有更好的原则性，在这里做一下总结，个人原则如有不对请多多指教。谢谢！要知道一个简单的sql语句执行效率，就要有查看方式，一遍更好的进行优化。一、简单的统计语句执行时间 declare @d datetime ---定义一个datetime的变量set @d=getdate() ---获取查询语句开始前的时间select user_id
Linux Oracle中常遇到的一些问题及命令总结超声波 oracle linux
1.linux更改主机名 (1)#hostname oracledb　　　　临时修改主机名 (2) vi /etc/sysconfig/network 　　修改hostname (3) vi /etc/hosts　　　　　　　　修改IP对应的主机名 2.linux重启oracle实例及监听的各种方法（注意操作的顺序应该是先监听，后数据库实例） &nbs
hive函数大全及使用示例 superlxw1234 hadoop hive函数
具体说明及示例参见附件文档。文档目录：目录一、关系运算： 4 1. 等值比较: = 4 2. 不等值比较: <> 4 3. 小于比较: < 4 4. 小于等于比较: <= 4 5. 大于比较: > 5 6. 大于等于比较: >= 5 7. 空值判断: IS NULL 5
Spring 4.2新特性-使用@Order调整配置类加载顺序 wiselyman spring 4
4.1 @Order Spring 4.2 利用@Order控制配置类的加载顺序 4.2 演示两个演示bean package com.wisely.spring4_2.order; public class Demo1Service { } package com.wisely.spring4_2.order; public class