鲁鲁酱1996

R语言之数据操作

数据读写

对离散变量，我们会观测变量各个层级观测的频数，或者使用两个变量的交叉表格，对离散变量绘制条形图等；
对连续变量，我们会看某个变量的均值，标准差，分位数等
此外，summary(),str(),describe(()等函数（psych包里）做义工数据框的总结。
以上即为一些最基础的方法，但这些方法灵活性不高，输出的信息也是固定的，这时我们需要对数据进行整形。
在整合和整形操作前，我们介绍一个新的可以取代数据框的对象，tibble，一个可以高效读取数据集的包readr。最后会介绍两个用于数据整形的包：reshape2和tidyr包

取代传统数据框的tibble对象

> library(tibble)
> library(tibble)
> library(ggplot2)
> sim.dat=read.csv("https://raw.githubusercontent.com/happyrabbit/DataScientistR/master/Data/SegData.csv")
> df=data.frame(x=c(1:5),y=rep("a",5))
> as_tibble(df)
# A tibble: 5 x 2
      x      y
   
1     1      a
2     2      a
3     3      a
4     4      a
5     5      a
> tibble(x=1:5,y=rep("a",5))
# A tibble: 5 x 2
      x     y
   
1     1     a
2     2     a
3     3     a
4     4     a
5     5     a
> 
> tibble(x=1:5,y=1,z=x^2+y)
# A tibble: 5 x 3
      x     y     z
    
1     1     1     2
2     2     1     5
3     3     1    10
4     4     1    17
5     5     1    26
> tb=tibble(':)'="smile",' '="space",'2000'="number")
> print(tb)
# A tibble: 1 x 3
   `:)`   ` ` `2000`
     
1 smile space number
>

特别，如果你在其他包中使用tibble对象中的变量也需要加单引号。
tibble和传统数据框的不同主要在于输出显示和截取变量这两个方面
1.输出显示

> print(as_tibble(sim.dat))
# A tibble: 1,000 x 19
     age gender   income  house store_exp online_exp store_trans online_trans
   <int> <fctr>    <dbl> <fctr>     <dbl>      <dbl>       <int>        <int>
 1    57 Female 120963.4    Yes  529.1344   303.5125           2            2
 2    63 Female 122008.1    Yes  478.0058   109.5297           4            2
 3    59   Male 114202.3    Yes  490.8107   279.2496           7            2
 4    60   Male 113616.3    Yes  347.8090   141.6698          10            2
 5    51   Male 124252.6    Yes  379.6259   112.2372           4            4
 6    59   Male 107661.5    Yes  338.3154   195.6870           4            5
 7    57   Male 120483.3    Yes  482.5445   284.5363           5            3
 8    57   Male 110542.0    Yes  340.7368   135.2556          11            5
 9    61 Female 132060.5    Yes  608.2310   142.5503           6            1
10    60   Male 105048.8    Yes  470.3190   163.4663          12            1
# ... with 990 more rows, and 11 more variables: Q1 <int>, Q2 <int>, Q3 <int>,
#   Q4 <int>, Q5 <int>, Q6 <int>, Q7 <int>, Q8 <int>, Q9 <int>, Q10 <int>,
#   segment <fctr>

如上，它只展示头10行数据，而且会根据屏幕大小，自动调整列数，列名后还会显示每列的类型，更友好。
2.截取变量
从tibble对象中截取某一变量
用"$"和"[["符号
“[[”符号能够通过变量的名字或位置指针来截取
“$”只能通过变量名截取
“%>%"(管道操作符)也可进行数据截取

sim.dat$age
sim.dat[["age"]]
sim.dat[[1]]

library(dplyr)
sim.dat%>%.$age
sim.dat%>%.[["age"]]

若用"$"或"[["操作符从数据框中截取一个变量时，截取的变量可能不是数据框形式，从而可能会引起程序运行错误，但是从tibble中截取任何一个变量依旧是一个tibble对象
注意：由于tibble对象比较新，所以在清理了数据之后要对数据建模的话，可以将tibble对象转换成原始数据框格式

sim.dat=as.data.frame(sim.dat)
class(sim.dat)

高效数据读写 readr包
readr包中用于读入数据的函数：
read_csv()读入逗号分隔文件
read_csv2()读入分号分隔文件
read_tsv()读人制表符分隔文件
read_delim()读入任意分隔符文件
其中，read_csv()涵盖了大部分的数据读入需求。

#skip=2表示跳过两行
> dat=read_csv("这行是一个样本数据
+ 这行只是注释
+ x,y,z
+ 1,2,3",skip=2)
> print(dat)
# A tibble: 1 x 3
      x     y     z
  <int> <int> <int>
1     1     2     3

> dat=read_csv("1,2,3\n4,5,6",col_names=FALSE)
> print(dat)
# A tibble: 2 x 3
     X1    X2    X3
  <int> <int> <int>
1     1     2     3
2     4     5     6

对于分号分隔文件读取read_csv2()

> dat=read_csv2("x;y;z\n1;2;3")

> print(dat)
# A tibble: 1 x 3
      x     y     z
  <int> <int> <int>
1     1     2     3

对于制表符分隔文件，read_tsv()

> dat1=read_tsv("x\ty\tz\n1\t2\t3")
> print(dat1)
# A tibble: 1 x 3
      x     y     z
  <int> <int> <int>
1     1     2     3

读入任意分隔符read_delim()

> dat2=read_delim("x|y|z\n1|2|3",delim=
+                     "|")
> print(dat2)
# A tibble: 1 x 3
      x     y     z
  <int> <int> <int>
1     1     2     3
>

指定缺失值

> dat=read_csv("x,y,z\n1,2,99",na="99")
> print(dat)
# A tibble: 1 x 3
      x     y     z
  <int> <int> <chr>
1     1     2  
>

readr包也有两个存储数据的函数write_csv()和write_tsv()函数，它们的优点在于：
1.对于字符串采用utf-8编码
2.将日期和时间用ISO8601格式存储，便于其他软件解析y
也可以使用write_excel_csv()函数j将.csv格式数据导出成excel格式
对于其他类型的数据，可使用下面的包
Haven:读入SPASS,Stata和SAS数据
Readxl:读取Excel文档（.xls和xlsx)
DBI:在指定了相应数据库（mysql等)情况下，直接从数据库中通过SQL读取数据。
数据表对象读取：
我们可以用方括号对数据进行索引和搜索。
简单的数据整合也可以用tapply(),aggregate(),table()这些函数
数据框的方括号易于实现数据截取，但是对数据进一步整合，需要其他包的帮助，如果能在方括号中进行数据整合操作，便方便了许多。data.table就可以做到这一点
1、它能更有效处理大数据集
2、操作方式和数据框一样简便
3、能够快速实现数据截取，分组，合并
4、可以轻易将数据框结构转化为数据表结构

#注，传统的数据框无法进行该操作
> dt[,mean(online_trans)]
[1] 13.546
> dt[,mean(online_trans),by=gender]
   gender       V1
1: Female 15.38448
2:   Male 11.26233
> dt[,mean(online_trans),by=.(gender,house)]
   gender house        V1
1: Female   Yes 11.312030
2:   Male   Yes  8.771523
3: Female    No 19.145833
4:   Male    No 16.486111
> dt[,.(avg=mean(online_trans)),by=.(gender,house)]
   gender house       avg
1: Female   Yes 11.312030
2:   Male   Yes  8.771523
3: Female    No 19.145833
4:   Male    No 16.486111

数据表的操作类似于sql
如：select gender,avg(online_trans) from sim.dat groupby gender
等价于

> dt[,mean(online_trans),by=gender]
   gender       V1
1: Female 15.38448
2:   Male 11.26233
>

select gender,house,avg(online_trans) as avg from sim.dat group by gender,house

等价于

> dt[,.(avg=mean(online_trans)),by=.(gender,house)]
   gender house       avg
1: Female   Yes 11.312030
2:   Male   Yes  8.771523
3: Female    No 19.145833
4:   Male    No 16.486111
>

select gender,house,avg(online_trans) as avg from
sim.dat where age <40 groupby gender,house

> dt[age<40,.(avg=mean(online_trans)),by=.(gender,house)]
   gender house      avg
1:   Male   Yes 14.45977
2: Female   Yes 18.14062
3:   Male    No 18.24299
4: Female    No 20.10196

选择行

> dt[age<20&income>80000]
   age gender   income house store_exp online_exp store_trans online_trans Q1 Q2
1:  19 Female 83534.70    No  227.6686   1490.719           1           22  2  1
2:  18 Female 89415.97   Yes  209.5487   1926.470           3           28  2  1
3:  19 Female 92812.81    No  186.7475   1041.539           2           18  3  1
   Q3 Q4 Q5 Q6 Q7 Q8 Q9 Q10 segment
1:  1  2  4  1  4  2  4   1   Style
2:  1  1  4  1  4  2  4   1   Style
3:  1  2  4  1  4  3  4   1   Style
> dt[1:2]
   age gender   income house store_exp online_exp store_trans online_trans Q1 Q2
1:  57 Female 120963.4   Yes  529.1344   303.5125           2            2  4  2
2:  63 Female 122008.1   Yes  478.0058   109.5297           4            2  4  1
   Q3 Q4 Q5 Q6 Q7 Q8 Q9 Q10 segment
1:  1  2  1  4  1  4  2   4   Price
2:  1  2  1  4  1  4  1   4   Price
>

选择列：

> ans=dt[,age]
> head(ans)
[1] 57 63 59 60 51 59
> abs=dt[,.(age,online_exp)]
> head(abs)
   age online_exp
1:  57   303.5125
2:  63   109.5297
3:  59   279.2496
4:  60   141.6698
5:  51   112.2372
6:  59   195.6870
> ans=dt[,age:income,with=FALSE]
> head(ans,2)
   age gender   income
1:  57 Female 120963.4
2:  63 Female 122008.1
#删除某列,-可以换成!
> ans=dt[,-(age:online_exp),with=FALSE]

制表

> dt[,.N]
[1] 1000
> dt[,.N,by=gender]
   gender   N
1: Female 554
2:   Male 446
> dt[age<30,.(count=.N),by=gender]
   gender count
1: Female   292
2:   Male    86
> dt[,.N]
[1] 1000
> dt[,.N,by=gender]
   gender   N
1: Female 554
2:   Male 446
> dt[age<30,.(count=.N),by=gender]
   gender count
1: Female   292
2:   Male    86
> head(dt[order(-online_exp)],5)
   age gender   income house store_exp online_exp store_trans online_trans Q1 Q2
1:  40 Female 217599.7    No  7023.684   9479.442          10            6  1  4
2:  41 Female       NA   Yes  3786.740   8638.239          14           10  1  4
3:  36   Male 228550.1   Yes  3279.621   8220.555           8           12  1  4
4:  31 Female 159508.1   Yes  5177.081   8005.932          11           13  1  4
5:  43 Female 190407.4   Yes  4694.922   7875.562           6           11  1  4
   Q3 Q4 Q5 Q6 Q7 Q8 Q9 Q10     segment
1:  5  4  3  4  4  1  4   2 Conspicuous
2:  4  4  4  4  4  1  4   2 Conspicuous
3:  5  4  4  4  4  1  4   1 Conspicuous
4:  4  4  4  4  4  1  4   2 Conspicuous
5:  5  4  4  4  4  1  4   2 Conspicuous
> dt[order(-online_exp)][1:5]
   age gender   income house store_exp online_exp store_trans online_trans Q1 Q2
1:  40 Female 217599.7    No  7023.684   9479.442          10            6  1  4
2:  41 Female       NA   Yes  3786.740   8638.239          14           10  1  4
3:  36   Male 228550.1   Yes  3279.621   8220.555           8           12  1  4
4:  31 Female 159508.1   Yes  5177.081   8005.932          11           13  1  4
5:  43 Female 190407.4   Yes  4694.922   7875.562           6           11  1  4
   Q3 Q4 Q5 Q6 Q7 Q8 Q9 Q10     segment
1:  5  4  3  4  4  1  4   2 Conspicuous
2:  4  4  4  4  4  1  4   2 Conspicuous
3:  5  4  4  4  4  1  4   1 Conspicuous
4:  4  4  4  4  4  1  4   2 Conspicuous
5:  5  4  4  4  4  1  4   2 Conspicuous
> dt[order(gender,-online_exp)][1:5]
   age gender   income house store_exp online_exp store_trans online_trans Q1 Q2
1:  40 Female 217599.7    No  7023.684   9479.442          10            6  1  4
2:  41 Female       NA   Yes  3786.740   8638.239          14           10  1  4
3:  31 Female 159508.1   Yes  5177.081   8005.932          11           13  1  4
4:  43 Female 190407.4   Yes  4694.922   7875.562           6           11  1  4
5:  50 Female 263858.0   Yes  5813.802   7448.729          11           11  1  4
   Q3 Q4 Q5 Q6 Q7 Q8 Q9 Q10     segment
1:  5  4  3  4  4  1  4   2 Conspicuous
2:  4  4  4  4  4  1  4   2 Conspicuous
3:  4  4  4  4  4  1  4   2 Conspicuous
4:  5  4  4  4  4  1  4   2 Conspicuous
5:  5  4  4  4  4  1  4   1 Conspicuous
>

用fread()读取数据
data.table中的fread()函数读取速度比read_csv()更快！！！

数据整合

base包：apply()，lapply(),sapply()等

> sdat=sim.dat[,!lapply(sim.dat,class)=="factor"]
> apply(sim.dat,2,class)
> apply(sdat,MARGIN=2,function(x) mean(na.omit(x)))
> apply(sdat,MARGIN=2,function(x) sd(na.omit(x)))

plyr包：ddply()

#数据框显示
> ddply(sim.dat,"segment",summarize,avg_online=round(sum(online_exp)/sum(online_trans),2),avg_store=round(sum(store_exp)/sum(store_trans),2))
      segment avg_online avg_store
1 Conspicuous     442.27    479.25
2       Price      69.28     81.30
3     Quality     126.05    105.12
4       Style      92.83    121.07
>

dplyr包(专门处理数据框）–其主要功能：
1.数据框显示
2.数据截取
3.数据总结
4.生成新变量
5.合并数据集

> dplyr::tbl_df(sim.dat)
# A tibble: 1,000 x 19
     age gender   income house store_exp online_exp store_trans online_trans
                                    
 1    57 Female 120963.4   Yes  529.1344   303.5125           2            2
 2    63 Female 122008.1   Yes  478.0058   109.5297           4            2
 3    59   Male 114202.3   Yes  490.8107   279.2496           7            2
 4    60   Male 113616.3   Yes  347.8090   141.6698          10            2
 5    51   Male 124252.6   Yes  379.6259   112.2372           4            4
 6    59   Male 107661.5   Yes  338.3154   195.6870           4            5
 7    57   Male 120483.3   Yes  482.5445   284.5363           5            3
 8    57   Male 110542.0   Yes  340.7368   135.2556          11            5
 9    61 Female 132060.5   Yes  608.2310   142.5503           6            1
10    60   Male 105048.8   Yes  470.3190   163.4663          12            1
# ... with 990 more rows, and 11 more variables: Q1 , Q2 , Q3 ,
#   Q4 , Q5 , Q6 , Q7 , Q8 , Q9 , Q10 ,
#   segment 
> dplyr::glimpse(sim.dat)
Observations: 1,000
Variables: 19
$ age           57, 63, 59, 60, 51, 59, 57, 57, 61, 60, 58, 59, 64, 57,...
$ gender        "Female", "Female", "Male", "Male", "Male", "Male", "Ma...
$ income        120963.4, 122008.1, 114202.3, 113616.3, 124252.6, 10766...
$ house         "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes",...
$ store_exp     529.1344, 478.0058, 490.8107, 347.8090, 379.6259, 338.3...
$ online_exp    303.5125, 109.5297, 279.2496, 141.6698, 112.2372, 195.6...
$ store_trans   2, 4, 7, 10, 4, 4, 5, 11, 6, 12, 5, 6, 7, 7, 5, 5, 5, 5...
$ online_trans  2, 2, 2, 2, 4, 5, 3, 5, 1, 1, 4, 2, 4, 3, 5, 1, 3, 2, 2...
$ Q1            4, 4, 5, 5, 4, 4, 4, 5, 4, 4, 4, 4, 5, 4, 4, 5, 5, 5, 4...
$ Q2            2, 1, 2, 2, 1, 2, 1, 2, 1, 2, 1, 1, 1, 2, 2, 2, 2, 2, 2...
$ Q3            1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1...
$ Q4            2, 2, 2, 3, 3, 2, 2, 3, 2, 3, 3, 3, 3, 3, 2, 2, 2, 3, 3...
$ Q5            1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1...
$ Q6            4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4...
$ Q7            1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1...
$ Q8            4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4...
$ Q9            2, 1, 1, 2, 2, 1, 1, 2, 1, 1, 2, 1, 2, 1, 1, 1, 1, 2, 2...
$ Q10           4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4...
$ segment       "Price", "Price", "Price", "Price", "Price", "Price", "...

数据截取（按行/列)

> library(magrittr)
>  library(dplyr)
>  dplyr::filter(sim.dat,income>300000) %>%
+ dplyr::tbl_df()
# A tibble: 4 x 19
    age gender   income house store_exp online_exp store_trans online_trans
  <int>  <chr>    <dbl> <chr>     <dbl>      <dbl>       <int>        <int>
1    40   Male 301398.0   Yes  4840.461   3618.212          10           11
2    33   Male 319704.3   Yes  5998.305   4395.923           9           11
3    41   Male 317476.2   Yes  3029.844   4179.671          11           12
4    37 Female 315697.2   Yes  6548.970   4284.065          13           11
# ... with 11 more variables: Q1 <int>, Q2 <int>, Q3 <int>, Q4 <int>, Q5 <int>,
#   Q6 <int>, Q7 <int>, Q8 <int>, Q9 <int>, Q10 <int>, segment <chr>
Warning message:
package ‘bindrcpp’ was built under R version 3.4.3

此外，dinstinct()函数可以删除数据框中重复的行；sample_frac()函数随机选取一定比例的行，sample_n()函数随机选取一定数目的行，slice()函数选取指定位置的行，top_n()选取某变量取值最高的若干观测

> dplyr::distinct(sim.dat)
# A tibble: 1,000 x 19
     age gender   income house store_exp online_exp store_trans online_trans
   <int>  <chr>    <dbl> <chr>     <dbl>      <dbl>       <int>        <int>
 1    57 Female 120963.4   Yes  529.1344   303.5125           2            2
 2    63 Female 122008.1   Yes  478.0058   109.5297           4            2
 3    59   Male 114202.3   Yes  490.8107   279.2496           7            2
 4    60   Male 113616.3   Yes  347.8090   141.6698          10            2
 5    51   Male 124252.6   Yes  379.6259   112.2372           4            4
 6    59   Male 107661.5   Yes  338.3154   195.6870           4            5
 7    57   Male 120483.3   Yes  482.5445   284.5363           5            3
 8    57   Male 110542.0   Yes  340.7368   135.2556          11            5
 9    61 Female 132060.5   Yes  608.2310   142.5503           6            1
10    60   Male 105048.8   Yes  470.3190   163.4663          12            1
# ... with 990 more rows, and 11 more variables: Q1 <int>, Q2 <int>, Q3 <int>,
#   Q4 <int>, Q5 <int>, Q6 <int>, Q7 <int>, Q8 <int>, Q9 <int>, Q10 <int>,
#   segment <chr>
> dplyr::sample_frac(sim.dat,0.05,replace=TRUE)
# A tibble: 50 x 19
     age gender    income house store_exp online_exp store_trans online_trans
   <int>  <chr>     <dbl> <chr>     <dbl>      <dbl>       <int>        <int>
 1    22   Male  91553.21    No  200.7210  1777.4974           4           27
 2    34 Female  60521.76    No  299.3096  2054.1732           3           16
 3    33   Male        NA    No  265.6550  1892.5581           2           12
 4    38 Female 164506.62   Yes 3916.9309  5764.1235          11           10
 5    26 Female  89461.40    No  200.4784  2449.7965           1           23
 6    26 Female 105528.79   Yes  186.9383  2349.9275           5           17
 7    55   Male 128194.20   Yes  595.6952   156.9314           6            2
 8    35 Female 130108.64   Yes 6155.4803  6201.7090           9           13
 9    36   Male        NA   Yes  203.3036  2202.5147           2           15
10    38   Male 267564.87   Yes 5335.1143  6052.4377           8           10
# ... with 40 more rows, and 11 more variables: Q1 <int>, Q2 <int>, Q3 <int>,
#   Q4 <int>, Q5 <int>, Q6 <int>, Q7 <int>, Q8 <int>, Q9 <int>, Q10 <int>,
#   segment <chr>
> dplyr::sample_n(sim.dat,10,replace=TRUE)
# A tibble: 10 x 19
     age gender    income house store_exp online_exp store_trans online_trans
   <int>  <chr>     <dbl> <chr>     <dbl>      <dbl>       <int>        <int>
 1    34 Female  73234.49    No  349.5491  2081.4476           4           21
 2    25 Female  90856.12    No  203.7759  2228.4818           4           23
 3    37   Male 187062.94   Yes 5931.7494  1942.1789          18           11
 4    34   Male  53945.69   Yes  370.5065  2305.3430           3           14
 5    23 Female  81763.92    No  205.6662  1040.8967           3           24
 6   300   Male 208017.46   Yes 5076.8009  6053.4853          12           11
 7    56   Male        NA   Yes  419.6702   192.3719           3            1
 8    26 Female  95341.78    No  198.9729  2036.4738           3           21
 9    26   Male  78240.93    No  430.2481  2091.4694           3           14
10    27 Female  90303.46    No  198.9020  1870.3866           6           13
# ... with 11 more variables: Q1 <int>, Q2 <int>, Q3 <int>, Q4 <int>, Q5 <int>,
#   Q6 <int>, Q7 <int>, Q8 <int>, Q9 <int>, Q10 <int>, segment <chr>
> dplyr::top_n(sim.dat,2,income)
# A tibble: 2 x 19
    age gender   income house store_exp online_exp store_trans online_trans
  <int>  <chr>    <dbl> <chr>     <dbl>      <dbl>       <int>        <int>
1    33   Male 319704.3   Yes  5998.305   4395.923           9           11
2    41   Male 317476.2   Yes  3029.844   4179.671          11           12
# ... with 11 more variables: Q1 <int>, Q2 <int>, Q3 <int>, Q4 <int>, Q5 <int>,
#   Q6 <int>, Q7 <int>, Q8 <int>, Q9 <int>, Q10 <int>, segment <chr>
>

以及dplyr下的select()函数对列变量进行选择（代码略）
数据总结：（操作类似于apply()和ddply()）

> dplyr::summarise(sim.dat,avg_online=mean(online_trans))
# A tibble: 1 x 1
  avg_online
       
1     13.546

可以用group_by()函数根据某分类变量对观测进行分组总结

生成新变量
mutate()函数可以进行列计算
transmute()函数与mutate()类似

> dplyr::mutate(sim.dat,total_exp=store_exp+online_exp)
# A tibble: 1,000 x 20
     age gender   income house store_exp online_exp store_trans online_trans
   <int>  <chr>    <dbl> <chr>     <dbl>      <dbl>       <int>        <int>
 1    57 Female 120963.4   Yes  529.1344   303.5125           2            2
 2    63 Female 122008.1   Yes  478.0058   109.5297           4            2
 3    59   Male 114202.3   Yes  490.8107   279.2496           7            2
 4    60   Male 113616.3   Yes  347.8090   141.6698          10            2
 5    51   Male 124252.6   Yes  379.6259   112.2372           4            4
 6    59   Male 107661.5   Yes  338.3154   195.6870           4            5
 7    57   Male 120483.3   Yes  482.5445   284.5363           5            3
 8    57   Male 110542.0   Yes  340.7368   135.2556          11            5
 9    61 Female 132060.5   Yes  608.2310   142.5503           6            1
10    60   Male 105048.8   Yes  470.3190   163.4663          12            1
# ... with 990 more rows, and 12 more variables: Q1 <int>, Q2 <int>, Q3 <int>,
#   Q4 <int>, Q5 <int>, Q6 <int>, Q7 <int>, Q8 <int>, Q9 <int>, Q10 <int>,
#   segment <chr>, total_exp <dbl>

合并数据集

> x=data.frame(cbind(ID=c("A","B","C"),x1=c(1,2,3)))
> y=data.frame(cbind(ID=c("B","C","D"),y1=c(T,T,F)))
> x
  ID x1
1  A  1
2  B  2
3  C  3
> y
  ID    y1
1  B  TRUE
2  C  TRUE
3  D FALSE
> left_join(x,y,by="ID")
  ID x1   y1
1  A  1 <NA>
2  B  2 TRUE
3  C  3 TRUE
Warning message:
Column `ID` joining factors with different levels, coercing to character vector 
> inner_join(x,y,by="ID")
  ID x1   y1
1  B  2 TRUE
2  C  3 TRUE
Warning message:
Column `ID` joining factors with different levels, coercing to character vector 
> full_join(x,y,by="ID")
  ID   x1    y1
1  A    1  <NA>
2  B    2  TRUE
3  C    3  TRUE
4  D <NA> FALSE
Warning message:
Column `ID` joining factors with different levels, coercing to character vector 
> semi_join(x,y,by="ID")
  ID x1
1  B  2
2  C  3
Warning message:
Column `ID` joining factors with different levels, coercing to character vector 
> anti_join(x,y,by="ID")
  ID x1
1  A  1
Warning message:
Column `ID` joining factors with different levels, coercing to character vector 
>

此外，dplur包中还有对数据框交，并，补的运算（intersect(),union(),setdiff()),以及一个数据框按行或列加到另一个数据框(bind_rows(),bind_cols())等

数据整形

reshape2包
数据先通过melt()函数将数据揉开，再通过dcast()函数将数据重塑成想要的形状。
melt()函数能糅合数据框，列表，矩阵，表格等。

tidyr包
首先gather()函数，类似于melt()
spread()函数和gather()函数相反，后者将不同的列堆叠起来，前者将同一列分开。
separate(）和unite()也是tidyr包中两个互补函数，separate()可以将不同列分开成多列，unite()能将不同的列合并在一起。类似于paste()函数。

【5.1.1 漫画Java核心并发编程】钺商科技漫画Java java 开发语言
漫画Java核心并发编程人物介绍小明：对Java并发编程感兴趣的开发者架构师老王：Java并发编程专家，精通各种并发工具Java并发编程基础小明：“老王，Java并发编程为什么这么复杂？”架构师老王：“因为并发编程需要处理多个线程同时访问共享资源的问题！主要挑战包括：线程安全、死锁、性能优化等。但掌握了核心原理，就能写出高效的并发程序。”并发编程核心概念Java并发编程体系|+----------
利用反汇编技术将游戏《英雄无敌3》修改为硬盘版安联酋长汇编游戏汇编
最近好不容易找到我最喜欢的游戏《英雄无敌3之埃拉西亚的光复》，可惜是光盘版的，要用虚拟光驱来运行，感觉不爽，网上也找不到免CD补丁，于是决定自己动手。首先感谢这篇文章的作者http://bbs.pediy.com/showthread.php?t=101023是他引领我进入反汇编的大门。这篇文章的第一步，就是找到GetDriveType的调用（GetDriveType就是判断某盘符是光驱、硬盘或网
Docker 安装 Neo4j 保姆级教程
Docker安装Neo4j保姆级教程本教程适用于零基础用户，详细讲解如何在Windows或Linux环境下通过Docker安装并配置Neo4j图数据库。Neo4j官方Docker文档1.环境准备已安装Docker（DockerDesktop官网）Linux和Windows均可2.创建挂载目录在宿主机上新建以下目录，用于数据持久化和配置挂载（以Linux为例，Windows可用资源管理器新建文件夹）
面试必问之JVM原理 teayear 面试 jvm 职场和发展
1：什么是JVMJVM是JavaVirtualMachine（Java虚拟机）的缩写，JVM是一种用于计算设备的规范，它是一个虚构出来的计算机，是通过在实际的计算机上仿真模拟各种计算机功能来实现的。Java虚拟机包括一套字节码指令集、一组寄存器、一个栈、一个垃圾回收堆和一个存储方法域。JVM屏蔽了与具体操作系统平台相关的信息，使Java程序只需生成在Java虚拟机上运行的目标代码（字节码）,就可以
SIMULINK开发项目实例 1000 例专栏之第663例：基于simulink的SVPWM技术的研究的三相电压源逆变器建模仿真 xiaoheshang_123 MATLAB 开发项目实例 1000 例专栏手把手教你学 MATLAB 专栏 matlab simulink
目录准备工作步骤详解第一步：创建Simulink项目第二步：选择并添加合适的库组件第三步：构建基本的三相电压源逆变器模型第四步：实现SVPWM算法第五步：仿真与调试第六步：结果分析第七步：优化与改进第八步：导出与部署总结三相电压源逆变器（VoltageSourceInverter,VSI）在电力电子中是将直流电转换为交流电的一种重要设备，广泛应用于电机驱动、不间断电源（UPS）、可再生能源系统等领
jvm原理和调优实战故事很腻i java jvm java
一、JVM核心基础1.1JVM架构概述Java虚拟机（JavaVirtualMachine，JVM）是Java程序的运行核心，其核心架构包含四大模块：1.1.1类加载子系统功能：负责将class文件加载到JVM内存中，通过ClassLoader实现加载流程：加载：通过类的全限定名获取二进制字节流验证：确保字节流符合JVM规范准备：为类变量分配内存并设置初始值解析：将符号引用替换为直接引用初始化：执
Python Scrapy的爬虫中间件开发 AI天才研究院 python scrapy 爬虫 ai
PythonScrapy爬虫中间件开发：从原理到实战的深度解析关键词Scrapy中间件、爬虫扩展、请求响应处理、反爬绕过、中间件生命周期、钩子函数、分布式爬取摘要本文系统解析Scrapy爬虫中间件（SpiderMiddleware）的开发方法论，覆盖从基础概念到高级实践的全链路知识。通过第一性原理推导中间件的核心机制，结合层次化架构分析（理论→设计→实现→应用），提供生产级代码示例与可视化流程模型
0代码改动实现应用运行时数据库密码无损轮转阿里-于怀 oracle 数据库 nacos
作者：柳遵飞一.敏感数据的安全风险在应用程序中，访问数据库几乎是必须的，是实现业务功能的基础普遍场景，应用程序访问数据库，需要设置数据库的地址，端口，账号及密码。密码的安全性非常重要，业界密码泄漏导致资损的事件时有发生，根据相关统计，单次泄漏事件的发生平均导致488万美元（约合人民币3542万元），每条泄漏的数据记录平均导致169美元（约合人民币1226元），除了直观的资金损失外，对企业的形象和舆
【C#】MVVM基础知识及基本应用 Mike_Wuzy c#
以下是一些关于C#中MVVM（Model-View-ViewModel）模式的基础知识：1.模型(Model)模型负责表示数据和业务逻辑，通常包括数据库访问、文件操作等。它不包含任何用户界面相关的代码。publicclassPerson{publicintId{get;set;}publicstringName{get;set;}publicDateTimeBirthDate{get;set;}/
Assistant API 流式传输中的事件流原理细节上有晨光大模型Agent开发人工智能算法大模型 OpenAI Agent
一、AssistantAPI流式传输事件流基础OpenAIAssistantAPI的流式输出在特定操作时会生成新事件，每个事件由event和data构成。data存放如大模型回复等关键数据，event则表明大模型的处理阶段，像运行、排队、完成等状态信息。二、事件流核心流程整体流程：从创建assistant对象、thread对象并追加message开启run状态（即start模式）起，到获取模型回复
Assistant API 进阶应用方法介绍上有晨光大模型Agent开发人工智能算法大模型 Agent OpenAI
一、课程回顾之前博客内容围绕OpenAIAssistantAPI展开，详细讲解了其基本原理、构建对话或代理的完整生命周期，以及Assistant、Thread、Message和Run这四个抽象概念之间的关系。在此基础上，搭建了用户与大模型对话的基础通路，不过这只是该API最基础的应用形式。二、AssistantAPI概述（一）优势与特点AssistantAPI在性能和易用性方面表现卓越，超越了市面
Python设置国内镜像教程 wh3933 python 开发语言
####引言Python是一种广泛使用的高级编程语言，用于各种编程任务，从简单的脚本到复杂的机器学习算法。在安装Python包时，通常需要从Python包索引（PyPI）下载。由于网络原因，直接从PyPI下载可能速度较慢，因此，使用国内的镜像源可以显著提高下载速度。本文将详细介绍如何在Python中设置国内镜像。####文章目的本篇文章旨在指导用户如何将Python的包管理工具`pip`的默认源切
Java+Python智能化云盘【Day3】关沐吖 Java+Python Ai智能云盘项目开发专栏 java python 开发语言
提示词工程Prompt简介：大模型必备Prompt提示词工程讲解什么是PromptEngineering提示词工程通过特定格式的文本输入引导AI模型生成期望输出的技术，明确地告诉模型你想要解决的问题或完成的任务也是大语言模型理解用户需求并生成相关、准确回答或内容的基础类比：给Java程序员的任务需求文档（越清晰明确，结果越符合预期）为什么需要学习？大模型就是你的员工，你可以有多个助手，OpenAI
【TypeScript教程】 - 小白也能秒懂的TypeScript入门指南一个水瓶座程序猿. TypeScript JavaScript 系列文章 typescript javascript 前端
一、TS是什么？TypeScript（简称TS）是JavaScript的一个超集，由微软开发。简单来说，它就是在JavaScript的基础上增加了静态类型检查。那静态类型检查有啥好处呢？举个例子，在JavaScript里，我们写代码时可能会不小心把一个变量的类型用错，像这样：//JavaScript代码letnum=10;num="hello";//这里把数字类型的变量赋值为字符串，运行时可能会出
【超分辨率（Super-Resolution）】关于【超分辨率重建】专栏的相关说明，包含专栏简介、专栏亮点、适配人群、相关说明、阅读顺序、超分理解、实现流程、研究方向、论文代码数据集汇总等十小大超分辨率重建（理论+实战科研+应用）超分辨率重建人工智能图像处理深度学习计算机视觉图像超分 pytorch
文章目录专栏简介专栏亮点适配人群相关说明关于答疑环境配置超分理解实现流程文章目录基础知识三个常用的SR框架数据集相关可解释性（论文中的可视化说明）图像超分（ImageSuper-Resolution）经典超分（ClassicalSR）任意尺度超分（Arbitrary-ScaleSR）高效/轻量化超分（Efficient/LightweightSR，ESR）盲超分/真实世界图像超分辨率（Blind/
24Ghz毫米波微动雷达感应开关传感器，灯控节能又省心，人走灯灭飞睿科技人体感应器人体传感器跌倒探测微动雷达传感器照明控制节能
你是否曾经走进一栋楼，发现走廊的灯一直亮着，即使空无一人？又或者，你是否曾在夜晚离开办公室，却忘记关灯，结果第二天被同事提醒浪费了电？这些情况在日常生活中屡见不鲜，而背后隐藏的问题则是能源浪费。现在，飞睿智能毫米波微动雷达感应开关传感器的新技术，正悄然改变这一现状，它能够实现“人来灯亮，人走灯灭”的智能灯控，为楼区带来显著的节能效果。毫米波微动雷达感应开关传感器：节能的智慧之眼想象一下，如果楼区的
鸿蒙设备开发OpenHarmony深度解读之设备认证：HiChain机制部分源码解析1（推荐模块之外）
往期推文全新看点（文中附带最新·鸿蒙全栈学习笔记）鸿蒙（HarmonyOS）北向开发知识点记录~鸿蒙（OpenHarmony）南向开发保姆级知识点汇总~鸿蒙应用开发与鸿蒙系统开发哪个更有前景？嵌入式开发适不适合做鸿蒙南向开发？看完这篇你就了解了~对于大前端开发来说，转鸿蒙开发究竟是福还是祸？鸿蒙岗位需求突增！移动端、PC端、IoT到底该怎么选？记录一场鸿蒙开发岗位面试经历~持续更新中……一、概述H
【归纳】C++入门算法模版总结（超级详细！！！）（包括高精度，排序，枚举，二分，搜索，动态规划等）
0.前言本文针对有一定算法基础的选手制作，收录了大部分算法的模板，详细解说可以点进去我提供的链接了解。或者进入我的主页给一点支持！本人也是一名新手，如果这篇文章有不严谨的地方或者不懂的地方可以在评论区留言，我会为你们一一解答的。【归纳】C++入门算法模版总结（包括高精度，排序，枚举，二分，搜索，动态规划等）（超级详细！！！）0.前言1.高精度1.1.单独实现1.1.1.高精度加法1.1.2.高精度
（纯新手练习五）python基础代码，我手把手带你敲（类与对象，实例，构造函数__init__初始化对象属性，继承，方法重写，类的文档字符串，模块化）星期天要睡觉 python 开发语言
目录1.基本理论简述类与对象构造函数（Constructor）继承（Inheritance）方法重写（MethodOverriding）四者关系总结类的文档字符串（Docstring）2.练习开始3.代码模块化练习（纯新手练习五）python基础代码，我手把手带你敲（类与对象，实例，构造函数__init__初始化对象属性，继承，方法重写，类的文档字符串，模块化）（下一节课：文件操作）基本理论简述类
计算机毕业设计之springboot书法字典小程序的设计与实现 2301_77990509 课程设计 spring boot 小程序
本项目旨在设计与实现一个基于SpringBoot的书法字典小程序，通过整合现代互联网技术与传统书法艺术，为用户提供一个便捷的书法字典查询平台。该小程序主要功能包括书法字的查询、学习资料、字帖的存储及分享等。首先，项目采用SpringBoot框架进行后端开发，利用其简化的配置和强大的模块支持，提高开发效率。为了实现高效的数据存储与查询，系统使用了MySQL数据库，存储书法字的基本信息、释义及相关图片
【基础】C++中的关键词小熊猫爱编程重新学编程 c++开发语言
一、关键词的概念C++中的关键词是语言保留用来表示特定语法结构的单词，不能作为变量名、函数名或标识符使用。二、关键词有哪些在C++中有63个关键字，如下：关键词关键词关键词关键词关键词asmdoifreturntypedefautodoubleinlineshorttypeidbooldynamic_castintsignedtypenamebreakelselongsizeofunioncase
我国在AI、元宇宙、生成式AI赛道的竞争带来的投资机会数据与人工智能律师大数据区块链人工智能网络数据库
首席数据官高鹏律师团队编著中国在AI、元宇宙、生成式AI赛道的竞争已进入技术深化与商业落地并行的关键阶段，未来投资机会可围绕以下五大方向展开：一、基础设施与算力支撑1.云计算与混合云服务生成式AI对算力和云服务需求激增，联想集团等布局混合云的企业受益于企业数字化转型需求。IDC预测，到2025年，50%的企业将与生成式AI云提供商建立战略联系，云服务商需优化数据治理和成本控制能力。2.AI芯片与算
你以为的 () 只是函数调用？栈的战争：函数调用背后，编译器、链接器、CPU与黑客的四方博弈解剖CPU、内存与安全交织的底层真相了解函数调用的暗流：从C括号到CPU指令、栈帧攻防的生死时速 small_wh1te_coder c++c 算法 c语言 c++c 算法面试
作者：smallcodewhite更新：2025.6.4号下午6点13分小引子：在软件这行当里混久了，你会发现一个现象：很多人能用各种高级语言、框架写出复杂的业务，但一遇到诡异的崩溃、性能瓶颈，或者需要和底层硬件打交道时，就抓瞎了。究其原因，是对计算机体系最基础的运行模型理解得不够透。上一篇我们聊了点数据在内存里的存放问题，有兄弟说不够劲，没触及灵魂。说得好。今天，咱们就来干一件有挑战性的事：把C
机器学习宝典——第6章爱看烟花的码农机器学习人工智能
第6章：聚类算法(Clustering)你好，同学！欢迎来到无监督学习的世界。与监督学习不同，这里的我们没有“标准答案”（标签），我们的目标是在数据中发现隐藏的、内在的结构。聚类算法就是实现这一目标的核心工具，它试图将数据集中的样本划分为若干个不相交的子集，我们称之为“簇”(cluster)。本章我们将深入探讨三种最具代表性的聚类算法：K-均值(K-Means)、层次聚类(Hierarchical
百度地图开发之点聚合功能
}@OverrideprotectedvoidonPause(){mMapView.onPause();super.onPause();}@OverrideprotectedvoidonResume(){mMapView.onResume();super.onResume();}@OverrideprotectedvoidonDestroy(){mMapView.onDestroy();super
Socket编程——TCP 兰雪簪轩 Linux tcp/ip 网络协议网络
文章目录一、TCP编程基础TCPsocketAPIsocket二、EchoServer对于服务端对于客户端server.hppServer.ccClient.ccCommandExec.hpp一、TCP编程基础TCP协议和UDP协议都属于网络通信协议，TCP协议是面向字节流的，UDP协议是面向数据报，这个特点后面会详谈的。对于现在来说UDP和TCP的区别为：UDP协议不需要连接，即报文一来就立刻进
数据资产确权的法律路径：从原始数据到衍生产品的权利归属
首席数据官高鹏律师数字经济团队创作，AI辅助在数字经济时代，数据已成为堪比石油的战略资源。某新能源车企因驾驶数据归属争议损失数十亿，某电商平台用户画像被竞争对手“合法”窃取的案例频发，暴露出数据这座“金山银山”背后隐藏的法律暗礁。当原始数据的采集边界模糊不清，当衍生数据的价值裂变引发权属混战，如何用法律之钥打开数据资产的财富之门？这不仅是技术命题，更是数字时代的法律革命。一、原始数据：数字土壤上的
基于条件风险价值CVaR的微网动态定价与调度策略（Matlab代码实现） Ps.729 matlab 开发语言
‍个人主页欢迎来到本博客❤️❤️博主优势：博客内容尽量做到思维缜密，逻辑清晰，为了方便读者。⛳️座右铭：行百里者，半于九十。本文目录如下：目录1概述一、CVaR的理论基础及其在微网中的适用性1.CVaR的定义与优势2.微网应用场景适配性二、动态定价与调度模型的联合优化框架1.目标函数设计2.动态定价机制3.不确定性处理方法三、关键算法与求解策略1.随机规划与CVaR集成2.智能优化算法对比四、实证
Python 图像分类入门超龄超能程序猿机器学习 python 分类开发语言
一、介绍图像分类作为深度学习的基础任务，旨在将输入图像划分到预定义的类别集合中。在实际的业务中，图像分类技术是比较常用的一种技术技能。例如，在安防监控中，可通过图像分类识别异常行为；在智能交通系统中，实现对交通标志和车辆类型的快速识别等。本文将通过安装包已有数据带你逐步了解使用Python进行图像分类的全过程。二、环境搭建在开始图像分类项目前，需要确保Python环境中安装了必要的库。主要包括：T
向量运算、矩阵运算、线性变换相关运算超龄超能程序猿机器学习矩阵线性代数机器学习
一、向量核心运算1.向量加法与数乘（线性组合基础）定义：加法：若a=(a1,a2,…,an)，b=(b1,b2,…,bn)，则a+b=(a1+b1,a2+b2,…,an+bn)。数乘：若k为标量，则ka=(ka1,ka2,…,kan)。性质：满足交换律、结合律，构成向量空间的基本运算。应用：向量线性组合（如基向量表示任意向量）、物理中力的合成与分解。2.点积（内积，DotProduct）定义：a⋅
java观察者模式 3213213333332132 java 设计模式游戏观察者模式
观察者模式——顾名思义，就是一个对象观察另一个对象，当被观察的对象发生变化时，观察者也会跟着变化。在日常中，我们配java环境变量时，设置一个JAVAHOME变量,这就是被观察者，使用了JAVAHOME变量的对象都是观察者，一旦JAVAHOME的路径改动，其他的也会跟着改动。这样的例子很多，我想用小时候玩的老鹰捉小鸡游戏来简单的描绘观察者模式。老鹰会变成观察者，母鸡和小鸡是
TFS RESTful API 模拟上传测试 ronin47
TFS RESTful API 模拟上传测试。　　细节参看这里：https://github.com/alibaba/nginx-tfs/blob/master/TFS_RESTful_API.markdown 模拟POST上传一个图片： curl --data-binary @/opt/tfs.png http
PHP常用设计模式单例, 工厂, 观察者, 责任链, 装饰, 策略,适配,桥接模式 dcj3sjt126com 设计模式 PHP
// 多态, 在JAVA中是这样用的, 其实在PHP当中可以自然消除, 因为参数是动态的, 你传什么过来都可以, 不限制类型, 直接调用类的方法 abstract class Tiger { public abstract function climb(); } class XTiger extends Tiger { public function climb()
hibernate 171815164 Hibernate
main,save Configuration conf =new Configuration().configure(); SessionFactory sf=conf.buildSessionFactory(); Session sess=sf.openSession(); Transaction tx=sess.beginTransaction(); News a=new
Ant实例分析 g21121 ant
下面是一个Ant构建文件的实例，通过这个实例我们可以很清楚的理顺构建一个项目的顺序及依赖关系，从而编写出更加合理的构建文件。下面是build.xml的代码： <?xml version="1
[简单]工作记录_接口返回405原因 53873039oycg 工作
最近调接口时候一直报错，错误信息是: responseCode:405 responseMsg:Method Not Allowed 接口请求方式Post.
关于java.lang.ClassNotFoundException 和 java.lang.NoClassDefFoundError 的区别程序员是怎么炼成的
真正完成类的加载工作是通过调用 defineClass来实现的；而启动类的加载过程是通过调用 loadClass来实现的；就是类加载器分为加载和定义 protected Class<?> findClass(String name) throws ClassNotFoundExcept
JDBC学习笔记-JDBC详细的操作流程 aijuans jdbc
所有的JDBC应用程序都具有下面的基本流程：　　1、加载数据库驱动并建立到数据库的连接。　　2、执行SQL语句。　　3、处理结果。　　4、从数据库断开连接释放资源。下面我们就来仔细看一看每一个步骤：其实按照上面所说每个阶段都可得单独拿出来写成一个独立的类方法文件。共别的应用来调用。 1、加载数据库驱动并建立到数据库的连接： Html代码 St
rome创建rss antonyup_2006 tomcat cms xml struts Opera
引用 1.RSS标准 RSS标准比较混乱，主要有以下3个系列 RSS 0.9x / 2.0 : RSS技术诞生于1999年的网景公司(Netscape)，其发布了一个0.9版本的规范。2001年，RSS技术标准的发展工作被Userland Software公司的戴夫温那(Dave Winer)所接手。陆续发布了0.9x的系列版本。当W3C小组发布RSS 1.0后，Dave W
html表格和表单基础百合不是茶 html 表格表单 meta 锚点
第一次用html来写东西,感觉压力山大,每次看见别人发的都是比较牛逼的再看看自己什么都还不会, html是一种标记语言,其实很简单都是固定的格式 _----------------------------------------表格和表单表格是html的重要组成部分,表格用在body里面的主要用法如下; <table> &
ibatis如何传入完整的sql语句 bijian1013 java sql ibatis
ibatis如何传入完整的sql语句？进一步说，String str ="select * from test_table"，我想把str传入ibatis中执行，是传递整条sql语句。解决办法： <
精通Oracle10编程SQL(14)开发动态SQL bijian1013 oracle 数据库 plsql
/* *开发动态SQL */ --使用EXECUTE IMMEDIATE处理DDL操作 CREATE OR REPLACE PROCEDURE drop_table(table_name varchar2) is sql_statement varchar2(100); begin sql_statement:='DROP TABLE '||table_name;
【Linux命令】Linux工作中常用命令 bit1129 linux命令
不断的总结工作中常用的Linux命令 1.查看端口被哪个进程占用通过这个命令可以得到占用8085端口的进程号，然后通过ps -ef|grep 进程号得到进程的详细信息 netstat -anp | grep 8085 察看进程ID对应的进程占用的端口号 netstat -anp | grep 进程ID &
优秀网站和文档收集白糖_ 网站
集成 Flex, Spring, Hibernate 构建应用程序性能测试工具-JMeter Hmtl5-IOCN网站 Oracle精简版教程网站鸟哥的linux私房菜 Jetty中文文档 50个jquery必备代码片段 swfobject.js检测flash版本号工具
angular.extend boyitech AngularJS angular.extend AngularJS API
angular.extend 复制src对象中的属性去dst对象中. 支持多个src对象. 如果你不想改变一个对象，你可以把dst设为空对象{}: var object = angular.extend({}, object1, object2). 注意: angular.extend不支持递归复制. 使用方法: angular.extend(dst, src); 参数:
java-谷歌面试题-设计方便提取中数的数据结构 bylijinnan java
网上找了一下这道题的解答，但都是提供思路，没有提供具体实现。其中使用大小堆这个思路看似简单，但实现起来要考虑很多。以下分别用排序数组和大小堆来实现。使用大小堆： import java.util.Arrays; public class MedianInHeap { /** * 题目：设计方便提取中数的数据结构 * 设计一个数据结构，其中包含两个函数，1.插
ajaxFileUpload 针对 ie jquery 1.7+不能使用问题修复版本 Chen.H ajaxFileUpload ie6 ie7 ie8 ie9
jQuery.extend({ handleError: function( s, xhr, status, e ) { // If a local callback was specified, fire it if ( s.error ) { s.error.call( s.context || s, xhr, status, e ); }
[机器人制造原则]机器人的电池和存储器必须可以替换 comsci 制造
机器人的身体随时随地可能被外来力量所破坏,但是如果机器人的存储器和电池可以更换,那么这个机器人的思维和记忆力就可以保存下来,即使身体受到伤害,在把存储器取下来安装到一个新的身体上之后,原有的性格和能力都可以继续维持..... 另外,如果一
Oracle Multitable INSERT 的用法 daizj oracle
转载Oracle笔记-Multitable INSERT 的用法 http://blog.chinaunix.net/uid-8504518-id-3310531.html 一、Insert基础用法语法： Insert Into 表名 (字段1,字段2,字段3...） Values (值1,
专访黑客历史学家George Dyson datamachine on
20世纪最具威力的两项发明——核弹和计算机出自同一时代、同一群年青人。可是，与大名鼎鼎的曼哈顿计划（第二次世界大战中美国原子弹研究计划）相比，计算机的起源显得默默无闻。出身计算机世家的历史学家George Dyson在其新书《图灵大教堂》（Turing’s Cathedral）中讲述了阿兰·图灵、约翰·冯·诺依曼等一帮子天才小子创造计算机及预见计算机未来
小学6年级英语单词背诵第一课 dcj3sjt126com english word
always 总是 rice 水稻，米饭 before 在...之前 live 生活，居住 usual 通常的 early 早的 begin 开始 month 月份 year 年 last 最后的 east 东方的 high 高的 far 远的 window 窗户 world 世界 than 比...更
在线IT教育和在线IT高端教育 dcj3sjt126com 教育
codecademy http://www.codecademy.com codeschool https://www.codeschool.com teamtreehouse http://teamtreehouse.com lynda http://www.lynda.com/ Coursera https://www.coursera.
Struts2 xml校验框架所定义的校验文件蕃薯耀 Struts2 xml校验 Struts2 xml校验框架 Struts2校验
>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月11日 15:54:59 星期六 http://fa
mac下安装rar和unrar命令 hanqunfeng mac
1.下载：http://www.rarlab.com/download.htm 选择 RAR 5.21 for Mac OS X 2.解压下载后的文件 tar -zxvf rarosx-5.2.1.tar 3.cd rar sudo install -c -o $USER unrar /bin #输入当前用户登录密码 sudo install -c -o $USER rar
三种将list转换为map的方法 jackyrong list
在本文中，介绍三种将list转换为map的方法： 1）传统方法假设有某个类如下 class Movie { private Integer rank; private String description; public Movie(Integer rank, String des
年轻程序员需要学习的5大经验 lampcy 工作 PHP 程序员
在过去的7年半时间里，我带过的软件实习生超过一打，也看到过数以百计的学生和毕业生的档案。我发现很多事情他们都需要学习。或许你会说，我说的不就是某种特定的技术、算法、数学，或者其他特定形式的知识吗？没错，这的确是需要学习的，但却并不是最重要的事情。他们需要学习的最重要的东西是“自我规范”。这些规范就是：尽可能地写出最简洁的代码；如果代码后期会因为改动而变得凌乱不堪就得重构；尽量删除没用的代码，并添加
评“女孩遭野蛮引产致终身不育 60万赔偿款1分未得”医腐深入骨髓 nannan408
先来看南方网的一则报道：再正常不过的结婚、生子，对于29岁的郑畅来说，却是一个永远也无法实现的梦想。从2010年到2015年，从24岁到29岁，一张张新旧不一的诊断书记录了她病情的同时，也清晰地记下了她人生的悲哀。　　粗暴手术让人发寒　　2010年7月，在酒店做服务员的郑畅发现自己怀孕了，可男朋友却联系不上。在没有和家人商量的情况下，她决定堕胎。　　12月5日，
使用jQuery为input输入框绑定回车键事件 VS 为a标签绑定click事件 Everyday都不同 jsp input 回车键绑定 click enter
假设如题所示的事件为同一个，必须先把该js函数抽离出来，该函数定义了监听的处理： function search() { //监听函数略...... } 为input框绑定回车事件，当用户在文本框中输入搜索关键字时，按回车键，即可触发search(): //回车绑定 $(".search").keydown(fun
EXT学习记录 tntxia ext
1. 准备（1）官网：http://www.sencha.com/ 里面有源代码和API文档下载。 EXT的域名已经从www.extjs.com改成了www.sencha.com ，但extjs这个域名会自动转到sencha上。（2）帮助文档：想要查看EXT的官方文档的话，可以去这里h
mybatis3的mapper文件报Referenced file contains errors xingguangsixian mybatis
最近使用mybatis.3.1.0时无意中碰到一个问题： The errors below were detected when validating the file "mybatis-3-mapper.dtd" via the file "account-mapper.xml". In most cases these errors can be d

R语言之数据操作

数据读写

数据整合

数据整形

你可能感兴趣的:(机器学习之R语言基础)