FarmerJohn

R语言资源汇总

这是一个信息爆炸的时代，知识和技术变得越来越廉价，计算机技术门槛越来越低。无论是做数据分析还是应用开发，都不要将时间耗费在学习既有知识上面，学习能力不再是最重要的。迅速获得各方面资源、高效扩展知识面成为了重要的能力基础（尽量自顶向下地学习），不应当在这方面花费太多时间，更不要自己重头实现已有的方法（人生苦短，不要重复造轮子），而应将时间集中投入到两个层面上：一个是解决问题的架构设计，另一个是优化或创新技术方法。

必须指出：R是一门见多识广的语言，看得越多越显得厉害，需要思考的地方不会很多（当然要精通R也不是容易的事，比如能从头写一个ggplot体系就有点难度），而且基本上不会涉及到计算机的专业知识（比如内存管理技巧、网络协议、操作系统原理等），技术难点基本上都比较低，这一点与 C 和 Java 之类的很不一样。毕竟R的使用人群不是程序员，而是从事其他专业领域的数据分析人员和研究者。R中技能的更新是很重要的，R包日新月异，更新技能的学习成本不容小觑（知乎某用户提到R技能更新的问题说得确实很有道理：数据处理神器data.table）。

正如标题所述，本文仅仅是一个资源的汇总，本质上就是一些工具集合，会用这些工具并不代表就能善于数据分析。对于数据分析而言，更重要的是方法学的积累、领悟和进一步改进创新，这是需要多读文献多交流、了解别人如何分析、由浅而深地了解分析方法，需日积月累和勤于思考。

常规分析

本部分为R语言常规分析的常用工具，工欲善其事必先利其器，这些工具是熟练掌握的部分（尤其是数据整理系列工具）。

数据整理：tidyverse系列（数据整理的工具大集合）、data.table（新一代的数据表体系，高效且简洁，可参考：data.table文档、Introduction to data.table、Importing data.table、数据处理神器data.table）、vroom（基于索引的数据读取工具，比data.table更快）、rlist（处理非结构化list非常方便，可参考：github.io/rlist、rlist-tutorial、非结构化数据处理神器rlist包）、tidytext（文本挖掘工具，可参考：tidytext_introduction、R语言进行文本挖掘；还有readtext也可以文本数据挖掘）、sparklyr（使用dplyr操作Spark，可参考：sparklyr: R interface for Apache Spark、无缝对接Spark与R；此外还有个叫sparkR的包也不错）、rio（强大的数据导入导及格式转换工具，可参考：Import, Export, and Convert Data Files、github/rio）、vtreat（一个对预测模型进行变量预处理的工具）、stringi（字符串处理工具）、Matrix（著名的稀疏矩阵包，类似的还有MatrixModels。另外stats的model.matrix 常用来生成设计矩阵）。

特别介绍tidyverse系列，可参考tidyverse_packages。主要包有：

数据表操作类：tibble、dplyr、tidyr、purrr（一个扩展性的函数编程包，尤其是改善循环效率）、broom（将统计模型结果整理成数据框形式）、readr和readxl（读取数据表的优化版，即read_*()系列，区别于read.*()系列）

特殊数据操作类：stringr（字符串处理工具）、forcats（非常棒的因子变量相关处理的工具）、lubridate（时间类数据的分析及可视化）、hms、blob。

其他：rvest（R的爬虫工具，可参考：tidyverse/rvest、rvest包总结）、magrittr（高效的管道操作，我们见到的%>%源于此包）、glue（paste函数的高级版，可便捷地操作连接数据和string）

常用的作图工具ggplot2也属于tidyverse系列。

另外，还有一些包也属于，如readxl、jsonlite等（jsonlite比rjson更为好用）。这些包都可以在tidyverse官网找到文档。

还有个叫purrrlyr的包，是purrr和dplyr的交叉（“名副其实”），可参考： purrrlyr：purrr和dplyr的交叉

早期还有个叫plyr的工具，现在已经被dplyr和purrr等工具替代。reshape2的许多功能也能在tidyr中找到。

其他链接：

Relationship to base and plyr functions

R语言函数式编程purrr的应用

purrr_reference

purrr-tutorial

broom官方介绍（tidyverse官网的子网站，里面有各种链接，包括菜单栏的Article和Reference等，同tidyverse其他包的介绍）

broom和dplyr的配合使用

关于tidyverse系列由R语言大神Hadley Wickham缔造（可去Hadley个人主页和这篇文章膜拜下Hadley大神），另外，贴一下tidyverse部分核心成员的图以及Hadley出品的一本教程的封面图。

建模分析：Hmisc（提供各种用于数据分析的函数，且集成格式化和可视化处理）、car（提供了大量的增强版的拟合和评价回归模型的函数）、lme4和nlme（线性混合模型）、glmmTMB（广义线性混合模型）、Rstan（Stan概率编程语言的R语言接口，stan的数学库提供了可微的概率函数和线性代数，R包中还提供了基于表达式的线性建模，后验概率可视化和留一法交叉验证。Rstan介绍）、NMF（非负矩阵分解）、explore（建模预处理）、multcomp（各类线性模型的同时性检验）。

模型评价：pROC、ROCR、plotROC（绘制交互式ROC曲线图）。

其他：自助法（boot和bootstrap包）、JSON转换（rjson）、逐步回归系列（step、drop1、add1系列函数）、置换检验（coin和lmPerm包）、可视化数据挖掘（rattle包）、正则表达式辅助函数（可以使用stringr中的各种函数如str_match、str_extract、str_detect）、图像处理（EBImage为主、magick为辅）等、数据抓取（httr+xml2，但其实使用rvest就挺好）、处理PDF（pdftools可提取PDF文本信息及元数据信息，且兼容PDF中的表格数据，但对于换行操作仍是无可奈何；tabulizer可提取PDF中的表格数据，但是对于缺乏表格线的表格的提取效果不好）、并行运算（parallel、foreach以及future都不错）、数据分析工作流（tidycwl进行可视化）、其他文本工具（tidyxl整理excel、gridtext在网格中渲染文字、flextable为HTML和office绘制图表、jiebaR和chinese.misc处理中文分词）。

其他链接：use R for fun系列之玩转图像篇

生存分析

包括KM曲线、统计检验、各类生存模型、模型预测与评价、功效分析等等各个方面。

统计学生存模型：Cox模型、加法风险模型（相对Cox而言，Cox属于乘法风险模型）、Weibull模型、对数Logistic模型、加速失效时间模型（AFT）、竞争风险模型、重复事件分析、随机效应生存分析（混合效应模型）、贝叶斯生存分析、多状态模型等。

机器学习生存数据建模：正则化建模（glmnet）、决策树分析（包括条件推理树）、随机森林分析、Boosting建模（GBM）、Super Learner、SVM生存分析（survivalsvm）、神经网络生存分析（Python版本有个DeepSurv包）、复合协变量分析、监督主成分分析等等。基本上各种分类数据的机器学习方法和统计建模方法都可以推广到生存数据建模中来。

模型预测和评价：包括C-index、时间依赖ROC和AUC、NRI和IDI、预测误差等评估。

特别介绍的包

survminer：基于ggplot2，不仅能画出好看的KM曲线，还有各种辅助功能，比如选取连续变量的界值（surv_cutpoint），森林图（ggforest）、cox模型校正曲线（ggcoxadjustedcurves）、竞争风险（ggcompetingrisks）等。快速浏览可参考清单survminer_cheatsheet；具体文档可参考：survminer_rdocumentation、rpkgs_survminer、survminer R package: Survival Data Analysis and Visualization、Informative_Survival_Plots.Rmd等。

rms：相应地有一本书可以看看，Regression Modeling Strategies，很不错。

其他：npsurvSS可进行生存分析中的非参数检验（如5年时刻的生存率差异检验等）、样本量和功效估计等、RMST（restricted mean survival time，限制平均生存时间）的差异，可参考：npsurvSS

详细内容和其他包的介绍，请参考：CRAN Task View: Survival Analysis

机器学习和统计建模

包括各类机器学习模型，如：决策树（包括条件推理树）、随机森林、Boost类算法（包括xgboost）、SVM、神经网络算法、贝叶斯模型、遗传算法优化、正则化（惩罚）降维、模型选择和验证、集成建模（如 SuperLearner、各类综合性工具包）、可视化数据挖掘等，以及各种聚类分析（层次聚类、划分聚类（包括kmeans、k-medoids、pam、谱聚类等）、模型聚类 [如最大似然估计流派的EM聚类法、贝叶斯聚类]、二维聚类 [如样本和特征同时聚类]、马尔科夫聚类等），应有尽有。

特别介绍的包

caret：机器学习建模的大型工具集，官方文档为 caret、short_introduction_caret。涉及的模型200多个（可以查看：caret/available-models），涉及特征可视化（更直观地理解变量特点）、数据预处理（包括分类变量的处理 [哑变量化或因子化等] 、近似零方差特征的去除、相关特征和共线性特征的去除[当然个人觉得反而应当利用这种相关信息，不仅是pls]、变量的中心化和标准化、缺失值填补、特征变量变换 [包括PCA变换、Box-cox变换和Yeo-Johnnson变换 [正态化] 等；虽然一般说法是Box-cox变换只适用于因变量的转换，但笔者看了下一篇Yeo-Johnnson变换介绍的文章中提到这些方法也是可以对自变量进行转换的] ）、数据分割（包括创建平衡数据 [createDataPartition]、交叉验证数据分割 [createFolds]、Bootstrap分割 [createResample] 、时间序列的数据分割等）、模型训练（包括调参、模型性能度量、模型选择 [ tolerance、oneSE、best 等策略，又称“one standard error”规则，即不选择CV值最小的模型，而是选择高于最小CV值一个标准差之内的最简模型，比如glmnet通常推荐lambda.1se，参考：模型选择的一些基本思想和方法 ]、模型的比较和相应的可视化）、类别不平衡的处理（包括二次抽样等）等。有人对caret包的文档进行了翻译 R语言caret包应用

factoextra：可以轻松提取和可视化探索性多变量数据分析的输出,包括PCA和聚类等。可参考：rpkgs_factoextra

还有几个比较受欢迎的包：mlr3、xgboost、h2o

glmpca：PCA的广义版本，可用于非正态分布（如泊松分布等）的降维。

modelStudio：实现一个交互式平台帮助解释机器学习模型。

tfprobability：提供一个与TensorFlow Probability的接口。

mlr3pipelines：实现机器学习pipeline操作。

interpret：实现机器学习可解释性的Boosting Machine（EBM）框架。

DiffXTables：检测异常模式（如二维分布的检验）。

orf：有序森林，估计有序分类模型的条件概率及可视化。

详细内容和其他方法，可参考：

机器学习：CRAN Task View: Machine Learning & Statistical Learning

聚类分析：CRAN Task View: Cluster Analysis & Finite Mixture Models

缺失数据处理：CRAN Task View: Missing Data

多元统计：CRAN Task View: Multivariate Statistics

可视化

R语言的可视化主要基于base和grid这两个包，其余可视化包都是在这两个包的基础上扩展。

最常用的两个工具包：ggplot2 和 lattice。凡是可视化，都可以尝试搜索这两个包能否搞定。另外，由于很多工具包侧重于计算而忽略了可视化的美观优化，因此推荐将计算结果提取出来，重新使用ggplot2或lattice作图。

ggplot2：ggplot2的体系是非常庞大的（cheatsheet里只是列举了最简单基础的示例罢了），作图可以非常灵活，要学完整个ggplot2的体系是要花不少时间的。可以参考：ggplot2官方介绍（有张Cheatsheet可供快速查阅）、ggplot2主文档（这个是学习ggplot2的主要阵地）、如何使用 ggplot2、ggplot2图集汇总、ggplot2高效实用指南。

lattice：lattice官方介绍（书的代码和图）、Getting Started with Lattice Graphics、使用lattice进行高级绘图、R绘图lattice包

基于ggplot2进一步扩展的包（详细可参考官方扩展介绍：ggplot2 extensions）：

ggstatsplot：各类统计分析和可视化一行命令搞定，强力推荐（2020年补充：需R3.6版本，过段时间可更新R4.0）。

ggpubr: 生成杂志期刊等出版物的图形的包，是ggplot的一个补充

ggplotify：将其他类型的图转成ggplot类型

ggrepel：用于避免图形标签重叠

ggsci：SCI论文作图配色

ggtech：科技公司主题配色

ggthemes：提供扩展的图形风格主题

ggthemr：另一个惊艳的主题风格包，可参考：ggthemr助你制作惊艳美图

ggpomological：水果味的主题风格，很清新舒服。还有一个修改主题的包也不错：hrbrthemes。

ggtext：在ggplot中使用markdown/html语法构建文本（也支持插入图片），使用很舒服

ggcorrplot：相关性分析图的ggplot2版本

ggboxplot：箱线图的进一步加工

ggfortify：一行R代码来实现繁琐的可视化（有空的时候可以逛逛）

ggraph：用于绘制网络状、树状等特定形状的图形,用于绘制网络图等；

ggnetwork：网络状图形的geoms

ggradar：绘制雷达图

ggtree：树图可视化

ggVennDiagram：韦恩图

ggupset：韦恩图的upset版本

ggmap：提供Google Maps，Open Street Maps等流行的在线地图服务模块

ggiraph：绘制交互式的ggplot图形

ggthreed：ggplot画3D图

ggstance：实现常见图形的横向版本

ggalt：添加额外的坐标轴，geoms等

ggforce：添加额外geoms，比如桑基图、放大zoom图等

ggpmisc：各类ggplot相关扩展，还可以生成公式（拟合曲线）、各种图的组合、优化等等

geomnet：绘制网络状图形

ggExtra：绘制图形的边界直方图

gganimate：绘制动画图

ggspectra：绘制光谱图

ggTimeSeries：时间序列数据可视化

ggseas：季节调整工具

ggchicklet：圆角柱形图

ggvis：交互式图表多功能系统（Hadley Wickham出品的另一个强大的作图包，可参考ggvis 0.4 overview、ggvis包学习笔记之初识ggvis、ggvis交互式作图介绍）

ggdendro：画层次聚类树图（可参考：R画树状图：一种轻量级方法）

ggparty：扩展partykit可视化（树模型如决策树等）。

ggbubbles：各种气泡图，包括矩阵气泡图。

gghalves：对称ggplot图截取一般进行拼接。

ggRandomForests：随机森林（包括生存模型）的可视化工具。

ggforest：绘制森林图（如生存分析的森林图）。

plotrix：也是不错的作图工具，功能包括双坐标、坐标截断、3D饼图、扇图、钟表图、韦恩图、各种基本形状绘制等。

rayshader：一行代码将ggplot渲染为3D图（见过的最接近3D渲染效果），效果十分逼真，可从不同角度观看。

rayrender：也是一个3D渲染工具。

Complexheatmap：bioconductor出品的热图绘制工具，非常好用的热图绘制工具（可以借助其annotation的丰富功能，画出很多的图形组合，设置可以使用空矩阵绘制空热图从而仅保留annotation）。

corrplot：专注于画相关性图。

circlize：circos plot，可参考用circlize包绘制circos plot、根据vcf文件计算SNP密度并用circlize可视化结果

circular：环形可视化，可绘制各种环形图，包括windrose图（玫瑰图）。

scales：提供图片坐标的scaling操作，由Hadley Wickham出品，可参考scales。

packcircles：圆形树图。

gridExtra：图片布局，还有patchwork也可以实现一图多页。

gplots：一些作图的优化，包括热图、boxplot、barplot、韦恩图。

scatterplot3d：3D作图工具，当然还有很多其他不错的3D作图包，如barplot3d等；可到Task View或网上搜索。

rgdal：绘制地图（有个不错的示例，EasyChart），和ggmap类似，还有 leaflet（交互式地图）。

ape：遗传进化树。

igraph：各种网络图。同类的还有tidygraph（可能在github上）

diagram：流程图。

cairoDevice：支持cairo和GTK。

RColorBrewer：配色工具，同类的还有colorspace、viridis、munsell等

showtext：修改base包作图的字体，可以任意修改。

rggobi：交互式作图系统。

rgl：交互式3D绘图

altair：altair是python中的强大的可视化工具，R语言也有了接口，借鉴过来。

其他

dygraphs：绘制交互式时间序列图，利用htmlwidgets开发的时间序列交互图形RStudio出品。

plotly：交互式绘图包

rbokeh：用于创建交互式图表和地图

Highcharter：绘制交互式Highcharts图

visNetwork：绘制交互式网状图

networkD3：绘制交互式网状图

d3heatmap：绘制交互式热力图

DT：用于创建交互式表格

threejs：绘制交互式3d图形和地球仪

rglwidget：绘制交互式3d图形

DiagrammeR：绘制交互式图表

MetricsGraphics：绘制交互式MetricsGraphics图

rCharts：提供了对多个JS可视化库（highcharts/nvd3/polychart）的R封装，可参考：rcharts、rCharts_1、rCharts_2。

recharts:Recharts是百度echarts的接口封装，目前有recharts，echartr等。

coefplot：可视化统计模型结果

latticeExtra：lattice绘图系统扩展包

animation：可以用来做动画。

waffle：善于画各种各样的格子。

coefplot：可视化统计模型系数估计。

wordcloud2：绘制词云。

ggPMX和ggResidpanel：拟合模型的诊断函数和绘图工具包。

radarBoxplot：雷达箱式图，支持多变量可视化。

graphlayouts：网络可视化布局工具包。

tidymv：可视化广义加性模型。

ormPlot：扩展了RMS回归建模策略，并提供不错的可视化。

basetheme：为base绘图提供主题选择。

nomnoml：绘制UML的工具。

hpackedbubble：基于Highcharts的打包气泡图。

sankeywheel：擅长各类桑基图以及和弦图。

关于拼图：https://www.sohu.com/a/289245806_613208

图形的grid操作：R语言grid包使用笔记——viewport

上述工具包无法解决的问题，可以再到网上搜索，或查看 CRAN Task View: Graphic Displays & Dynamic Graphics & Graphic Devices & Visualization

格式化输出

rmarkdown：准确说，rmarkdown属于文档报告工具，所有格式化输出都可以基于此。官方介绍很详细：rmarkdown，里面可以找到cheatsheets，另外也可参考这个rmarkdown标记的介绍：Rmarkdown用法与R语言动态报告。其中还应包括一些小工具，如：Dashboards（或flexdashboard制作dashboard原型、flexdashboard）、htmlwidgets、各种输出格式（包括输出PPT，PPT除了Rstudio官网推荐的那几个外，还有个叫slidify的包也很不错；此外，还有个包叫officer可以操控已有的PPT和Word，至此真正实现了全方位的R里面操作PPT和Word，不再只是生成PPT和Word而已了）、多文档构建网站（可以方便地呈现整个项目的报告，不同文档之间可以通过导航栏切换，也可以使用child链接下划线开头的Rmd fragments [参考：Rmd partials]，或者试试使用html超链接中填入相对路径。此工具再结合flexdashboard就可以构建比较复杂的报告呈现了）、各种编程语言对接（见下文的“对接其他编程语言”）。

knitr：一款优秀的报告生成工具，以便数据分析可重复（分析报告敏捷的生成）。这个类似于Jupyter Notebook的功能。除了支持html以外，还支持Word、PDF的输出。据说这个比最初的Sweave好用很多。可参考：knitr、Overleaf guides、knitr 与可重复的统计研究、自动化报告。

kableExtra：输出美化的表格。可参考：kableExtra官方介绍、另一个类似的官方介绍。另外，flextable这个包也不错。输出表格的工具包还有很多，包括 Hmisc, NMOF, papeR, quantreg, rapport, reporttools, sparktex, tables, xtable, ztable等等，可以参考Task View介绍。

bookdown：可以用来写书（网络书本），确实是很方便的工具。还有blogdown用于快速构建博客。

tableone：快速构建统计论文的表1。可参考快速绘制文章“表一”

export：可输出至PPT、Word、Excel、PDF等各种文件（好像这个包被CRAN移除了）。

flextable：可绘制图表并导出至html和office系列文档中。

bibtex：文献管理工具，此外还有 RefManageR 也是类似的功能。

latex2exp：LaTeX转化工具。

R2wd：输出word，此外还有R2PPT输出PPT。

formatR：格式化R代码。此外类似的还有 humanFormat、lubridate、highlight等。

textreuse：可以进行论文查重（暂时归类到格式化这里）。

其他：resumer（生成简历）、exams（考试相关）、htmltools（html相关，这方面还有很多工具）、markdown和rmarkdown、bookdown（创建书籍）等。

crayon：可用于在输出端添加颜色。

wordmatch：用于两个word的文本对照。

gluedown：提供R向量和降价文本之间的转换功能，可将字符串和markdown语法粘合在一起，可将带格式的向量打印到文档。

有一个叫 RPUBS的网站有不少使用knitr输出的文档。

Task View上还有很多，包括LaTeX、HTML、MarkDown的处理，Pipeline Toolkits，Project Workflows，格式化工具和格式转换工具等等。请参考：CRAN Task View: Reproducible Research

对接其他编程语言

Rmarkdown 和 knitr 配合，可以很方便地在Rstudio里写别的编程语言，可参考：rmarkdown/language-engines。

而对接数据需要一些包，比如对接python可以用 reticulate（可参考：reticulate），C++可以用Rcpp等。

笔者暂时只尝试了如何在Rmarkdown里同时写R和Python，但数据的对接似乎有点问题，并不能像reticulate官方文档介绍的那样可以互相调用数据，总是报错说找不到指定路径中指定的python版本（暂时懒得折腾了，事情太多了，等以后要用的时候再搞搞，或者暂时用原来那种互相调用脚本的方式传递数据）。下面是一个OK的示例（无数据传递）：

如果数据传递OK的话，那么这个工具可以实现复杂的数据分析过程，举个栗子：

假如有两种语言A和B，每个语言分成不同的步骤，比如A1,A2,A3；B1,B2,B3... 执行顺序可以是A1-B1-A2-B2...
其中，A2可以继续继承A1的所有变量，因为属于同一个Session，如果传统pipeline的话，A2需要重新初始化和加载数据
B1可以查看A1所有的细节，也可以对A1的变量进行修改（可读可写），也就是A2中可以自动获得这些修改结果。当然计算上，A和B仍是串行的（子步骤的交叉串行。若是要A和B并行、互相实施监督，那就得自己写工具实现了）。当然，这种串行组合，只适用于动态语言（如R、Python及JavaScript等），对于需要编译的静态语言（如C和Java）来说，只能调用编译后的执行程序。

另外，注意到Rmarkdown支持JavaScript，这就使得复杂的前端设计也有可能可以在Rmarkdown里完成。

不得不感慨一下，Rmarkdown确实很厉害，我们可以再Rmarkdown里方便地编写和调试python等其他语言以及数据对接，可以在R里做PPT准备汇报，可以在R里制作交互式html页面（尤其是R的某些包 [如 networkD3、recharts等] 还集成了一些JavaScript里很不错的UI，这使得本来就擅长于可视化的R更加强大了）。

临床研究

参考：CRAN Task View: Clinical Trial Design, Monitoring, and Analysis

工具包很丰富，包括样本量计算、区组随机、各期临床试验设计（计量爬坡、3+3设计）、药代动力学分析、三臂研究、适应性设计、功效分析等，临床研究相关的计算需求，都可以尝试到这里找找解决方案。

生信分析

待补充，可参考Bioconductor系列包。

CRAN中的有GeneNet、pam、ape等。

代谢组学：MetabolicSurV（整合了生存分析的代谢组学分析工具）、cliqueMS（基于MS进行注释的工具，2019年发表于Bioinformatics，值得研究下）。

UCSCXenaTools：数据库连接工具。

其他可能要用的

开发测试（列举几个Hadley Wickham出品的工具包）：devtools（开发工具以及包管理）、testthat（测试工具）、Roxygen2（开发文档相关）、profvis（评估代码的运行时间和所需内存）。

R包的一次性加载和安装：pacman包，可参考：pacman包：在R中一次性安装加载多个包，这里面也提到了常规加载和安装多个包的方式（包比较多的时候不要一个个install和library）。

如下资源，在需要时到Task View界面查找即可（或Google百度搜索相关资料），无需进行额外汇总。

数据库：CRAN Task View: Databases with R

网络技术：CRAN Task View: Web Technologies and Services

贝叶斯：CRAN Task View: Bayesian Inference

概率分布：CRAN Task View: Probability Distributions

实验设计和分析：CRAN Task View: Design of Experiments (DoE) & Analysis of Experimental Data

遗传学：CRAN Task View: Statistical Genetics

并行与大数据：CRAN Task View: High-Performance and Parallel Computing with R

医学图像：CRAN Task View: Medical Image Analysis

Meta分析：CRAN Task View: Meta-Analysis

模型部署：CRAN Task View: Model Deployment with R

自然语言处理：CRAN Task View: Natural Language Processing

最优化问题：CRAN Task View: Optimization and Mathematical Programming

药代动力学：CRAN Task View: Analysis of Pharmacokinetic Data

系统发生学：CRAN Task View: Phylogenetics, Especially Comparative Methods

稳健建模：CRAN Task View: Robust Statistical Methods

时间序列分析：CRAN Task View: Time Series Analysis

CRAN Task View: gRaphical Models in R

琐碎记录

Nomogram的教程：Logistic、Cox回归之图形化呈现（R语言中绘制Nomogram）、教你用R画列线图，形象展示预测模型的结果、基于R的生存资料预测模型构建与Nomogram绘制

ggplot绘图细节汇总：ggplot2中如何设置坐标轴大小等绘图细节（总结整理）

生存分析的一些资料：

R语言-Survival analysis（生存分析）

Survival Analysis Basics

使用R进行生存分析

计算生存率和p值

R语言生存分析

R语言做热图：R语言绘制热图——pheatmap

R语言中各种假设检验：R语言各种假设检验实例整理（常用）

常用的数据可视化图表（当然这个内容不限于R语言）：数据可视化：基本图表

R教程：R语言教程

不错的R包：KableExtra包做复杂的表格比较棒（代码直接生成HTML表格或LaTeX式表格）。

shiny：R语言只做小网页的工具包。

Rmd：R文档工具。

将矩阵转为列表

如何将矩阵转换为R中列向量的列表

------------------------------------------------------------------------

比较两个模型C-index的差异：可以使用Hmisc包中的rcorrp.cens方法。

比较两个模型AUC的差异，也有类似的方法，也可以用AUC的差异比较统计量（有个公式）直接计算p值。

calibration的计算，有一个地方容易搞错，就是在cph构造时，应当设置time.inc参数，并且与之后的calibrate构造时的u参数一致。网上很多资料没注意到这个细节，所得结果实际上是有问题的。甚至有的资料直接以为calibrate中的u参数只要与surv构造时的time一致就行，这是有问题的。

有一个不是很理解的东西：psm——parametric survival model，参数生存模型，这个体系不了解。rms包中多次提及这个方法，之后可以研究下。比较psm与cox的优劣和适用场景。

------------------------------------------------------------------------

一个关于purrr包的应用实例

有人找我讨论这样一个问题，想对数据集进行分组划分后，对任意两个变量进行运算（如任意两个变量之间的回归或相关分析），并将所有的统计结果汇总成表，非循环的写法如何实现？

该问题的简单版是purrr包教程中的一个例子（代码来源不明，但purrr包官方介绍和各类教程中有很多类似的例子，可参考：purr官方网站、purrr-tutorial、reference_purrr、purrr、cheatsheets_purrr）：

mtcars %>%
  split(.$cyl) %>% ## from base package
  map(~ lm(mpg ~ wt, data = .)) %>%
  map(~broom::glance(.)) %>%
  reduce(bind_rows)

这个限定了回归的formula，能否改成任意两个变量之间的回归呢？于是笔者将原代码修改成如下代码：

matrix_1<-combn(c(1:5),2)
list_1<-split(matrix_1, rep(1:ncol(matrix_1), each = nrow(matrix_1)))
compute_<-function(d){
  return(map(list_1,~tibble(y=d[,.x[1]],x=d[,.x[2]])) %>%
           map(~lm(y ~ x, data = .)) %>%
           map(~broom::glance(.)) %>%
           reduce(bind_rows))
}

mtcars %>%
  split(.$cyl) %>%
  map(~compute_(.)) %>%
  reduce(bind_rows)

本质上就加了一行“重构数据表”，因为直接修改formula似乎行不通，笔者尝试了预处理formula列表再转命令行的方式，似乎在管道中某些数据传不进去：

eval(parse(text = formula))

问题解决了，这里再附几个关于tidyverse相关的链接可以瞅瞅：

purrr的一个官方例子讲解

purrr包的另一个例子（博主嵌套使用map实现需求）

------------------------------------------------------------------------

回想一下，笔者曾靠着R的基本函数，重复造了很多轮子，虽然各种需求都能实现，但是效率不高。还是要转变思维，不用动不动就重头写代码，多用用别人写好的工具，人生苦短啊。

资源链接

R语言的工具包真的很多，不可能全列举出来，还有很多很多不错的包没接触过，以及有很多包的文档没去了解，在需要的时候可以参考下面这些链接或工具。

R Packages各类文档收集

R语言packages列表 | 分类（里面列举了很多很多包，这个公众号会定期更新列表）

cran-packages

rOpenSci（收集了各类科研文献数据相关的工具包）

学习一个包，可以先到CRAN上找找看有没有包的文档官网链接（优先级为：Vignettes、URL、Reference manual）

搜介绍文档的另一种可能方法（以dplyr包为例）：在R中运行vignette("dplyr")或browseVignettes("dplyr")，或者将链接https://cran.r-project.org/web/packages/dplyr/vignettes/中的dplyr替换成需要的包名试试。

寻找R包的工具：cranly、dlstats和packagefinder，可以参考：如何搜索你想要的R包、cranly：你的R包管理工具。

github: awesome-R（末尾还有很多不错的资源链接和书的推荐）

rdocumentation

rdrr.io

rnotebook

R成精系列-R语言的常用的包

R/Python 数据科学实战

cheatsheets for R

与R无关的链接：github: awesome-cheatsheet、awesome-awesomeness（awesome的awesome）

CRAN Task Views：R资源的一个整理集合，需要寻找资源时可优先到这里找找。

CRAN Task View: Survival Analysis

CRAN Task View: Machine Learning & Statistical Learning

CRAN Task View: Bayesian Inference

CRAN Task View: Clinical Trial Design, Monitoring, and Analysis

CRAN Task View: Cluster Analysis & Finite Mixture Models

CRAN Task View: Databases with R

CRAN Task View: Probability Distributions

CRAN Task View: Design of Experiments (DoE) & Analysis of Experimental Data

CRAN Task View: Statistical Genetics

CRAN Task View: Graphic Displays & Dynamic Graphics & Graphic Devices & Visualization

CRAN Task View: High-Performance and Parallel Computing with R

CRAN Task View: Medical Image Analysis

CRAN Task View: Meta-Analysis

CRAN Task View: Missing Data

CRAN Task View: Model Deployment with R

CRAN Task View: Multivariate Statistics

CRAN Task View: Natural Language Processing

CRAN Task View: Optimization and Mathematical Programming

CRAN Task View: Analysis of Pharmacokinetic Data

CRAN Task View: Phylogenetics, Especially Comparative Methods

CRAN Task View: Reproducible Research

CRAN Task View: Robust Statistical Methods

CRAN Task View: Time Series Analysis

CRAN Task View: Web Technologies and Services

CRAN Task View: gRaphical Models in R

你可能感兴趣的:(统计学,R)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
android系统selinux中添加新属性property 辉色投像
1.定位/android/system/sepolicy/private/property_contexts声明属性开头：persist.charge声明属性类型：u:object_r:system_prop:s0图12.定位到android/system/sepolicy/public/domain.te删除neverallow{domain-init}default_prop:property
用Python实现读取统计单词个数程序媛了了 python 游戏 java
完整实例代码：fromcollectionsimportCounterdefpythonit():danci={}withopen("pythonit.txt","r",encoding="utf-8")asf:foriinf:words=i.strip().split()forwordinwords:ifwordnotindanci:danci[word]=1else:danci[word]+=
光盘文件系统 (iso9660) 格式解析穷人小水滴光盘文件系统 iso9660 deno GNU/Linux javascript
越简单的系统,越可靠,越不容易出问题.光盘文件系统(iso9660)十分简单,只需不到200行代码,即可实现定位读取其中的文件.参考资料:https://wiki.osdev.org/ISO_9660相关文章:《光盘防水嘛?DVD+R刻录光盘泡水实验》https://blog.csdn.net/secext2022/article/details/140583910《光驱的内部结构及日常使用》ht
《跃迁》5/7-5组-橙子-张静12.16 静言物于
【便签5】【片段来源】《跃迁：成为高手的技术》第四章【R原文】一位客户咨询时抱怨：“这个我做不到。”我问他：“如果我请你现在出去裸奔，你能做到吗？”“这个我也做不到”“其实并不是做不到，而是不愿意做，或者不想承担裸奔的代价吧。你不是做不到，而是选择不去做。如果有一天你裸奔能救自己家人、孩子，也许就能做到了。”为什么要做这个区分？如果一个人经常和自己说“做不到”，他的能力范围会越来越小，会成为一个无
✔2848. 与车相交的点程序员小小聪力扣 leetcode
代码实现：方法一：哈希表#definefmax(a,b)((a)>(b)?(a):(b))intnumberOfPoints(int**nums,intnumsSize,int*numsColSize){inthash[101]={0};intmax=0;for(inti=0;i=x){j--;}if(i=nums[i][0]){r=r>nums[i][1]?r:nums[i][1];}else{
【加密算法基础——RSA 加密】 XWWW668899 网络服务器笔记 python
RSA加密RSA（Rivest-Shamir-Adleman）加密是非对称加密，一种广泛使用的公钥加密算法，主要用于安全数据传输。公钥用于加密，私钥用于解密。RSA加密算法的名称来源于其三位发明者的姓氏：R:RonRivestS:AdiShamirA:LeonardAdleman这三位计算机科学家在1977年共同提出了这一算法，并发表了相关论文。他们的工作为公钥加密的基础奠定了重要基础，使得安全通
Acwing 区间合并 Curry_Math 算法学习算法 c++开发语言
区间合并主要思想：给定很多区间。若两个区间有交集，将二者合并成一个区间。具体做法:先按照区间的左端点进行排序然后遍历每个区间，根据不同的情况进行合并，有一下几种情况：第一种情况，区间不变；第二种情况，end更新为区间i的右端点；以上两种情况，可以归结为end更新为max（end，r）;r为区间右端点第三种情况，将当前维护的区间加入结果，并将维护的区间更新为区间i；下面给出区间合并的板子：//区间合
Android shell 常用 debug 命令晨春计 Audio debug android linux
目录1、查看版本2、am命令3、pm命令4、dumpsys命令5、sed命令6、log定位查看APK进程号7、log定位使用场景1、查看版本1.1、Android串口终端执行getpropro.build.version.release#获取Android版本uname-a#查看linux内核版本信息uname-r#单独查看内核版本1.2、linux服务器执行lsb_release-a#查看Lin
Windows安装ciphey编码工具，附一道ciscn编码题例 im-Miclelson CTF工具网络安全
TA是什么一款智能化的编码分析解码工具，对于CTF中复杂性编码类题目可以快速攻破。编码自动分析解码的神器。如何安装Windows环境Python3.864位（最新的版本不兼容，32位的也不行）PIP直接安装pipinstallciphey-ihttps://pypi.mirrors.ustc.edu.cn/simple/安装后若是出现报错请根据错误代码行数找到对应文件，r修改成rb即可。使用标准语
linux简单安装gcc和gdb chn-zgq Linux linux ubuntu
linux安装gcc以及环境配置和gdb安装gcc-10.0添加源:sudoadd-apt-repositoryppa:ubuntu-toolchain-r/ppa更新源:sudoaptupdate下载gcc:sudoaptinstallgcc-10g++-10默认GCC版本设置为gcc-10.0:sudoupdate-alternatives--install/usr/bin/gccgcc/us
梧桐数据库（WuTongDB）：数据库技术中都有哪些常见的优化器鲁鲁517 梧桐数据库梧桐数据库
以下是一些常见的数据库优化器：1.CBO（Cost-BasedOptimizer）应用场景：广泛应用于关系型数据库中，如Oracle、PostgreSQL、MySQL等。工作原理：通过计算不同执行计划的代价（如CPU、I/O等资源消耗），选择最低代价的执行计划。代表数据库：Oracle、PostgreSQL、MySQL。特点：CBO使用统计信息（如表大小、索引分布）来评估查询的代价。2.RBO（R
【机器人建模和控制】读书笔记 Piccab0o 机器人
机器人建模和控制——马克·斯庞A.x10=x1∙x0x^0_1=x_1\bulletx_0x10=x1∙x0，其实就是：1）x1x_1x1轴向量在O0O_0O0系下的坐标2）在x0x_0x0轴上的投影3）坐标变换矩阵的R10R_1^0R10的第一个元素B.点p在o1x1y1z1o_1x_1y_1z_1o1x1y1z1系下的坐标p1p^1p1可以表示为：p=ux1+vy1+wz1p=ux_1+vy_
如何做好人生的选择题？百科全书式天才——赫伯特·西蒙给你答案伽马有话说
赫伯特·西蒙是谁？想必知道的人非常少。但当看到他的履历后，相信没有人再怀疑他是个“天才”。西蒙出生于1916年6月15日，是个美国人，他的名字全称为赫伯特·亚历山大·西蒙，在2001年2月9日与世长辞，在这84年的岁月中，西蒙以27岁时取得的政治学博士学位为开端，先后步入了政治学、管理学、认知心理学、信息科学、人工智能、科学哲学、应用数学、统计学、运筹学、控制论、数理经济学、公共管理等领域，在这些
认识世界陈陈_19b4
9月16日，雨。阅读书目:《真相》。作者:瑞典统计学家和医学教授汉斯·罗斯林，他的儿子奥拉·罗斯林，google公共数据团队的负责人。汉斯·罗斯林还是一位全球知名的教育家，是世界健康组织和联合国儿童基金会的顾问。他与儿子儿媳共同创办了Gapminder基金会，开发了Trendalyzer软件，将国际统计数据转化成交互式的生动有趣的图表，帮助人们以事实为基础来观察世界，被称为“可视化数据之父”。图片
Python和R均方根误差平均绝对误差算法模型亚图跨际 Python 交叉知识 R 回归模型误差指标归一化均方根误差生态状态指标神经网络成本误差气体排放气候模型多项式拟合
要点回归模型误差评估指标归一化均方根误差生态状态指标神经网络成本误差计算气体排放气候算法模型Python误差指标均方根误差和平均绝对误差均方根偏差或均方根误差是两个密切相关且经常使用的度量值之一，用于衡量真实值或预测值与观测值或估计值之间的差异。估计器θ^\hat{\theta}θ^相对于估计参数θ\thetaθ的RMSD定义为均方误差的平方根：RMSD⁡(θ^)=MSE⁡(θ^)=E((θ^−θ
PCIe进阶之TL：Common Packet Header Fields & TLPs with Data Payloads Rules 芯芯之火，可以燎原 PCIe进阶 PCIe进阶硬件工程信息与通信
1TransactionLayerProtocol-PacketDefinitionTLP有四种事务类型：Memory、I/O、Configuration和Messages，两种地址格式：32bit和64bit。构成TLP时，所有标记为Reserved的字段（有时缩写为R）都必须全为0。接收者Rx必须忽略此字段中的值，PCIeSwitch必须对其进行原封不动的转发。请注意，对于某些字段，既有指定值
python下载pandas库镜像_下载pandas库 weixin_39791152
背景交代：在下载matplotlib库时，我已经将pip的下载源手动更改为清华的镜像，所以，如果有小伙伴在下载库遇到问题，如timeout，请先将下载源改为国内镜像，具体操作见我的另一篇文章：今天的主题是安装pandas库~首先，按田字格+R，打开cmd，输入：pipinstallpandas嗯，不出所料地报错了……主要原因：pip._vendor.urllib3.exceptions.ReadT
FlexibleBI系统是现代制造企业提升生产质量和效率的重要工具三坐标CMM质量数据系统制造
SPC（统计过程控制）系统是现代制造企业提升生产质量和效率的重要工具。我们的SPC系统通过一键生成全面的SPC分析报告，帮助企业快速、精准地完成质量分析，并大大减少了手动处理数据的复杂性。FlexibleBI实时更新的控制图在生产过程中，控制图可以实时自动更新，确保企业能够随时掌握生产状态，及时发现并处理潜在问题。系统支持多种标准SPC控制图，如X-bar、R、P等图表，全面覆盖所有常见生产场景。
ResNet的半监督和半弱监督模型 Valar_Morghulis
Billion-scalesemi-supervisedlearningforimageclassificationhttps://arxiv.org/pdf/1905.00546.pdfhttps://github.com/facebookresearch/semi-supervised-ImageNet1K-models/权重在timm中也有：https://hub.fastgit.org/r
node初奶瓶SAMA
www.nodejs.org下载nodejs的安装文件,然后就直接下一步，下一步，下一步傻瓜式安装（打开命令符widow+r输入cmd）node-v查单当前node的版本号安装nodejs时，会自动安装npm包管理工具npm-v查看npm的版本可以直接在黑窗口中输入node然后点击回车以后，就可以输入javascripnt的代码了既然在浏览器鼠标右键中console和在黑窗口中输入node点击回车
ros2中使用launch.xml启动时，怎么在命令行里设置参数，或者加载参数文件（params.yaml） code . Autoware 自动驾驶 ROS2 xml Ros2 自动驾驶机器人
在ROS2中使用launch.xml启动时，可以通过命令行设置参数或加载参数文件（如params.yaml）。以下是具体的方法：1.在命令行中设置参数你可以在运行ros2launch命令时直接设置参数，使用key:=value的语法。例如：ros2launchparam_name:=param_value例如，如果你有一个参数background_r，你可以这样设置：ros2launchmy_pa
【机器学习与R语言】1-机器学习简介苹果酱0567 面试题汇总与解析 java 中间件开发语言 spring boot 后端
1.基本概念机器学习：发明算法将数据转化为智能行为数据挖掘VS机器学习：前者侧重寻找有价值的信息，后者侧重执行已知的任务。后者是前者的先期准备过程：数据——>抽象化——>一般化。或者：收集数据——推理数据——归纳数据——发现规律抽象化：训练：用一个特定模型来拟合数据集的过程用方程来拟合观测的数据：观测现象——数据呈现——模型建立。通过不同的格式来把信息概念化一般化：一般化：将抽象化的知识转换成可用
商业预测初识R hongyanwin r语言预测
1.打开帮助文档首页，查阅其中的“IntroductiontoR”helpRhelp2.安装vcd包install.packages("vcd")3.列出此包中可用的函数和数据集ls("package:vcd")/data(package="vcd")4.载入包并阅读数据集Arthritis的描述library("v.d")/?Arthritis5.显示数据集Arthritis的内容查看数据集结构
【NLP5-RNN模型、LSTM模型和GRU模型】一蓑烟雨紫洛 nlp rnn lstm gru nlp
RNN模型、LSTM模型和GRU模型1、什么是RNN模型RNN（RecurrentNeuralNetwork)中文称为循环神经网络，它一般以序列数据为输入，通过网络内部的结构设计有效捕捉序列之间的关系特征，一般也是以序列形式进行输出RNN的循环机制使模型隐层上一时间步产生的结果，能够作为当下时间步输入的一部分（当下时间步的输入除了正常的输入外还包括上一步的隐层输出）对当下时间步的输出产生影响2、R
2024上半年软考系统架构设计师-综合知识选择题及答案不对法系统架构
1.操作系统先来先服务调度算法2.操作系统多道程序设计，利用率3.操作系统状态流转错误的，执行态到运行态4.数据库2NF每一个非主属性完全依赖主键5.数据库笛卡尔积m*n6.数据库不属于事务的特点，并发性7.数据库交集表达式R-(R-S)8.数据库反规范化属于逻辑设计9.网络没有加密功能，物理层10.网络二层交换机数据，数据链路层11.知识产权专利法是否属于民法12.知识产权商标不属于，其他几个是
python 判断 ‘NoneType’的方法 cuisidong1997 文本转换 python
的错误时说明需要进行判断，而对‘NoneType’进行判断时直接使用‘isNone’即可，如下：iftextisNone:print('testis’+None)else:print('testisnot’+None)a=re.match(r’主叫号码(.*)客户姓名’,r’2、主叫号码：15558191990;3、客户姓名：韩东远;')print(type(a))ifaisNone:print(
R 数据可视化 —— 韦恩图名本无名
前言对于数据集之间交叠关系的可视化，通常想到的是绘制韦恩图。韦恩图是一种关系型图表，通过图形之间的重叠来反映数据集之间的相交关系。下面，我们来简单介绍一下如何绘制韦恩图韦恩图绘制韦恩图的包有很多，比如gplots包的venn()函数、limma包的vennDiagram()函数、venneuler包的venneuler()函数。但是这些包绘制出来的图像效果都不是很好，所以我们使用比较成熟的包Ven
Mac清倒废纸篓提示“voicetrigger“在使用中 ReddingtonLin Mac Mac
删除Mac下的user以后，清倒废纸篓，提示“voicetrigger”在使用中。解决办法：重启Mac，开机的时候按住Cmd+R进入Recovery模式选择语言-简体中文从工具菜单中启动终端，输入密码。输入csrutildisable命令，即可关闭SIP服务。重启电脑。（正常重启即可，不用按住Cmd+R进入Recovery模式）再尝试清空废纸篓。如果还不行，就尝试用命令行删除。处理好后，再开启SI
大数据新视界 --大数据大厂之数据挖掘入门：用 R 语言开启数据宝藏的探索之旅青云交大数据新视界数据库大数据数据挖掘 R 语言算法案例未来趋势应用场景学习建议大数据新视界
亲爱的朋友们，热烈欢迎你们来到青云交的博客！能与你们在此邂逅，我满心欢喜，深感无比荣幸。在这个瞬息万变的时代，我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而我的博客，正是这样一个温暖美好的所在。在这里，你们不仅能够收获既富有趣味又极为实用的内容知识，还可以毫无拘束地畅所欲言，尽情分享自己独特的见解。我真诚地期待着你们的到来，愿我们能在这片小小的天地里共同成长，共同进步。本博客的精华专栏：Ja
Spring的注解积累 yijiesuifeng spring 注解
用注解来向Spring容器注册Bean。需要在applicationContext.xml中注册： <context:component-scan base-package=”pagkage1[,pagkage2,…,pagkageN]”/>。如：在base-package指明一个包 <context:component-sc
传感器百合不是茶 android 传感器
android传感器的作用主要就是来获取数据,根据得到的数据来触发某种事件下面就以重力传感器为例; 1,在onCreate中获得传感器服务 private SensorManager sm;// 获得系统的服务 private Sensor sensor;// 创建传感器实例 @Override protected void
[光磁与探测]金吕玉衣的意义 comsci
这是一个古代人的秘密:现在告诉大家信不信由你们: 穿上金律玉衣的人,如果处于灵魂出窍的状态,可以飞到宇宙中去看星星这就是为什么古代
精简的反序打印某个数沐刃青蛟打印
以前看到一些让求反序打印某个数的程序。比如：输入123，输出321。记得以前是告诉你是几位数的，当时就抓耳挠腮，完全没有思路。似乎最后是用到%和/方法解决的。而今突然想到一个简短的方法，就可以实现任意位数的反序打印（但是如果是首位数或者尾位数为0时就没有打印出来了）代码如下： long num, num1=0;
PHP：6种方法获取文件的扩展名 IT独行者 PHP 扩展名
PHP：6种方法获取文件的扩展名 1、字符串查找和截取的方法 1 $extension = substr ( strrchr ( $file , '.' ), 1); 2、字符串查找和截取的方法二 1 $extension = substr
面试111 文强chu 面试
1事务隔离级别有那些，事务特性是什么（问到一次） 2 spring aop 如何管理事务的，如何实现的。动态代理如何实现，jdk怎么实现动态代理的，ioc是怎么实现的，spring是单例还是多例，有那些初始化bean的方式，各有什么区别（经常问） 3 struts默认提供了那些拦截器（一次） 4 过滤器和拦截器的区别（频率也挺高） 5 final，finally final
XML的四种解析方式小桔子 dom jdom dom4j sax
在平时工作中，难免会遇到把 XML 作为数据存储格式。面对目前种类繁多的解决方案，哪个最适合我们呢？在这篇文章中，我对这四种主流方案做一个不完全评测，仅仅针对遍历 XML 这块来测试，因为遍历 XML 是工作中使用最多的（至少我认为）。　　预备　　测试环境：　　AMD 毒龙1.4G OC 1.5G、256M DDR333、Windows2000 Server
wordpress中常见的操作 aichenglong 中文注册 wordpress 移除菜单
1 wordpress中使用中文名注册解决办法 1)使用插件 2)修改wp源代码进入到wp-include/formatting.php文件中找到 function sanitize_user( $username, $strict = false
小飞飞学管理-1 alafqq 管理
项目管理的下午题，其实就在提出问题（挑刺），分析问题，解决问题。今天我随意看下10年上半年的第一题。主要就是项目经理的提拨和培养。结合我自己经历写下心得对于公司选拔和培养项目经理的制度有什么毛病呢？ 1，公司考察，选拔项目经理，只关注技术能力，而很少或没有关注管理方面的经验，能力。 2，公司对项目经理缺乏必要的项目管理知识和技能方面的培训。 3，公司对项目经理的工作缺乏进行指
IO输入输出部分探讨百合不是茶 IO
//文件处理在处理文件输入输出时要引入java.IO这个包； /* 1，运用File类对文件目录和属性进行操作 2，理解流，理解输入输出流的概念 3，使用字节/符流对文件进行读/写操作 4，了解标准的I/O 5，了解对象序列化 */ //1，运用File类对文件目录和属性进行操作 //在工程中线创建一个text.txt
getElementById的用法 bijian1013 element
getElementById是通过Id来设置/返回HTML标签的属性及调用其事件与方法。用这个方法基本上可以控制页面所有标签，条件很简单，就是给每个标签分配一个ID号。返回具有指定ID属性值的第一个对象的一个引用。语法： &n
励志经典语录 bijian1013 励志人生
经典语录1: 哈佛有一个著名的理论：人的差别在于业余时间，而一个人的命运决定于晚上8点到10点之间。每晚抽出2个小时的时间用来阅读、进修、思考或参加有意的演讲、讨论，你会发现，你的人生正在发生改变，坚持数年之后，成功会向你招手。不要每天抱着QQ/MSN/游戏/电影/肥皂剧……奋斗到12点都舍不得休息，看就看一些励志的影视或者文章，不要当作消遣；学会思考人生，学会感悟人生
[MongoDB学习笔记三]MongoDB分片 bit1129 mongodb
MongoDB的副本集(Replica Set)一方面解决了数据的备份和数据的可靠性问题，另一方面也提升了数据的读写性能。MongoDB分片(Sharding)则解决了数据的扩容问题，MongoDB作为云计算时代的分布式数据库，大容量数据存储，高效并发的数据存取，自动容错等是MongoDB的关键指标。本篇介绍MongoDB的切片(Sharding) 1.何时需要分片 &nbs
【Spark八十三】BlockManager在Spark中的使用场景 bit1129 manager
1. Broadcast变量的存储，在HttpBroadcast类中可以知道 2. RDD通过CacheManager存储RDD中的数据，CacheManager也是通过BlockManager进行存储的 3. ShuffleMapTask得到的结果数据，是通过FileShuffleBlockManager进行管理的，而FileShuffleBlockManager最终也是使用BlockMan
yum方式部署zabbix ronin47 yum方式部署zabbix
安装网络yum库#rpm -ivh http://repo.zabbix.com/zabbix/2.4/rhel/6/x86_64/zabbix-release-2.4-1.el6.noarch.rpm 通过yum装mysql和zabbix调用的插件还有agent代理#yum install zabbix-server-mysql zabbix-web-mysql mysql-
Hibernate4和MySQL5.5自动创建表失败问题解决方法 byalias J2EE Hibernate4
今天初学Hibernate4，了解了使用Hibernate的过程。大体分为4个步骤： ①创建hibernate.cfg.xml文件 ②创建持久化对象 ③创建*.hbm.xml映射文件 ④编写hibernate相应代码在第四步中，进行了单元测试，测试预期结果是hibernate自动帮助在数据库中创建数据表，结果JUnit单元测试没有问题，在控制台打印了创建数据表的SQL语句，但在数据库中
Netty源码学习-FrameDecoder bylijinnan java netty
Netty 3.x的user guide里FrameDecoder的例子，有几个疑问： 1.文档说：FrameDecoder calls decode method with an internally maintained cumulative buffer whenever new data is received. 为什么每次有新数据到达时，都会调用decode方法？ 2.Dec
SQL行列转换方法 chicony 行列转换
create table tb(终端名称 varchar(10) , CEI分值 varchar(10) , 终端数量 int) insert into tb values('三星' , '0-5' , 74) insert into tb values('三星' , '10-15' , 83) insert into tb values('苹果' , '0-5' , 93)
中文编码测试 ctrain 编码
循环打印转换编码 String[] codes = { "iso-8859-1", "utf-8", "gbk", "unicode" }; for (int i = 0; i < codes.length; i++) { for (int j
hive 客户端查询报堆内存溢出解决方法 daizj hive 堆内存溢出
hive> select * from t_test where ds=20150323 limit 2; OK Exception in thread "main" java.lang.OutOfMemoryError: Java heap space 问题原因： hive堆内存默认为256M 这个问题的解决方法为：修改/us
人有多大懒，才有多大闲 (评论『卓有成效的程序员』) dcj3sjt126com 程序员
卓有成效的程序员给我的震撼很大，程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可以那么勤奋，每天都孜孜不倦得做着重复单调的工作。在看这本书之前，我属于勤奋的人，而看完这本书以后，我要努力变成懒惰的人。不要在去庞大的开始菜单里面一项一项搜索自己的应用程序，也不要在自己的桌面上放置眼花缭乱的快捷图标
Eclipse简单有用的配置 dcj3sjt126com eclipse
1、显示行号 Window -- Prefences -- General -- Editors -- Text Editors -- show line numbers 2、代码提示字符 Window ->Perferences，并依次展开 Java -> Editor -> Content Assist，最下面一栏 auto-Activation
在tomcat上面安装solr4.8.0全过程 eksliang Solr solr4.0后的版本安装 solr4.8.0安装
转载请出自出处： http://eksliang.iteye.com/blog/2096478 首先solr是一个基于java的web的应用，所以安装solr之前必须先安装JDK和tomcat，我这里就先省略安装tomcat和jdk了第一步：当然是下载去官网上下载最新的solr版本，下载地址
Android APP通用型拒绝服务、漏洞分析报告 gg163 漏洞 android APP 分析
点评：记得曾经有段时间很多SRC平台被刷了大量APP本地拒绝服务漏洞，移动安全团队爱内测（ineice.com）发现了一个安卓客户端的通用型拒绝服务漏洞，来看看他们的详细分析吧。 0xr0ot和Xbalien交流所有可能导致应用拒绝服务的异常类型时，发现了一处通用的本地拒绝服务漏洞。该通用型本地拒绝服务可以造成大面积的app拒绝服务。针对序列化对象而出现的拒绝服务主要
HoverTree项目已经实现分层 hvt 编程 .net Web C#ASP.ENT
HoverTree项目已经初步实现分层，源代码已经上传到 http://hovertree.codeplex.com请到SOURCE CODE查看。在本地用SQL Server 2008 数据库测试成功。数据库和表请参考：http://keleyi.com/a/bjae/ue6stb42.htmHoverTree是一个ASP.NET 开源项目，希望对你学习ASP.NET或者C#语言有帮助，如果你对
Google Maps API v3: Remove Markers 移除标记天梯梦 google maps api
Simply do the following: I. Declare a global variable: var markersArray = []; II. Define a function: function clearOverlays() { for (var i = 0; i < markersArray.length; i++ )
jQuery选择器总结 lq38366 jquery 选择器
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40
基础数据结构和算法六：Quick sort sunwinner Algorithm Quicksort
Quick sort is probably used more widely than any other. It is popular because it is not difficult to implement, works well for a variety of different kinds of input data, and is substantially faster t
如何让Flash不遮挡HTML div元素的技巧_HTML/Xhtml_网页制作刘星宇 html Web
今天在写一个flash广告代码的时候，因为flash自带的链接，容易被当成弹出广告，所以做了一个div层放到flash上面，这样链接都是a触发的不会被拦截，但发现flash一直处于div层上面，原来flash需要加个参数才可以。让flash置于DIV层之下的方法，让flash不挡住飘浮层或下拉菜单，让Flash不档住浮动对象或层的关键参数：wmode=opaque。方法如下：
Mybatis实用Mapper SQL汇总示例 wdmcygah sql mysql mybatis 实用
Mybatis作为一个非常好用的持久层框架，相关资料真的是少得可怜，所幸的是官方文档还算详细。本博文主要列举一些个人感觉比较常用的场景及相应的Mapper SQL写法，希望能够对大家有所帮助。不少持久层框架对动态SQL的支持不足，在SQL需要动态拼接时非常苦恼，而Mybatis很好地解决了这个问题，算是框架的一大亮点。对于常见的场景，例如：批量插入/更新/删除，模糊查询，多条件查询，联表查询，

R语言资源汇总

常规分析

生存分析

机器学习和统计建模

可视化

格式化输出

对接其他编程语言

临床研究

生信分析

其他可能要用的

相关知识充电

琐碎记录

资源链接

你可能感兴趣的:(统计学,R)