baiyuzhong

R语言：优雅、卓越的统计分析及绘图环境

文 / 刘思喆

历史

R语言由新西兰奥克兰大学的Ross Ihaka和Robert Gentleman两人共同发明，其词法和语法分别源自Scheme和S语言，一般认为R语言是S语言【注：John Chambers，贝尔实验室，1972】的一种方言。

R是“GNU S”，一个能够自由有效地用于统计计算和绘图的语言和环境，它提供了广泛的统计分析和绘图技术，包括线性和非线性模型、统计检验、时间序列、分类、聚类等方法。我们更倾向于认为R是一个环境，在R环境里实现了很多经典的、现代的统计技术。

1992年，Ross Ihaka（图左）和Robert Gentleman（图右）在奥克兰大学成为同事。后来为了方便教授初等统计课程，二人开发了一种语言；而他们名字的首字母都是R，于是R便成为这门语言的名称。

作为R语言的前身——S语言的代码几乎不需要进行任何修改即可在R语言环境下运行，从这个角度讲两种语言几乎等价。S语言诞生于20世纪70年代由John M. Chambers领导的贝尔实验室统计研究部。它的诞生过程几乎就是现代统计分析方式的演化历程的写照【注：谢益辉，郑冰（2008）. R语言的历史背景、发展历程和现状. 1st China R Conference.】。

1975-1976年，贝尔实验室统计研究部使用一套文档齐全的Fortran库做统计研究，简称为SCS（Statistical Computing Subroutines）。
当时的商业统计软件采用的是批处理方式，一次性输出问题的所有相关信息【注：令人感叹的是，现代商业统计软件依然一成不变地遵循这种低效率的数据分析模式】，在那个时代，这个过程需要几个小时，并且商业软件的程序不能做任何修改。而贝尔实验室的统计学家们需要灵活的交互式数据分析方式，因此SCS在贝尔实验室非常受欢迎。
但统计学家们发现使用SCS做统计分析时需要大量的Fortran编程，花在编程上的时间与取得的分析效果相比有些得不偿失。慢慢地，大家达成了一个共识——统计分析不应该需要编写Fortran程序。
于是，为了同SCS进行交互，一套完整的高级语言系统——S诞生了。
S语言的理念，用它的发明者John Chambers的话说就是“to turn ideas into software，quickly and faithfully（快速、准确地把想法转化成软件）”。

1993年，S语言的许可证被MathSoft公司买断，S-PLUS成为其公司的主打数据分析产品。由于S-PLUS继承了S语言的优秀血统，所以被世界各国的统计学家广泛使用。但好景不长，1997年R语言正式成为GNU项目，大量优秀统计学家加入到R语言开发的行列。随着R语言的功能逐渐强大，S-PLUS的用户渐渐地转到了同承一脉的R语言。S语言的发明人之一——John M. Chambers最后也成为R语言的核心团队成员。S-PLUS这款优秀的软件也几经易手，最后花落TIBCO公司，当然，这是后话。

John M. Chambers老爷子一直不遗余力地致力于R语言的发展，至今仍然是活跃的R语言开发者。在2009年第一期《R Journal》上，John M. Chambers是这样定义R语言的：

an interface to computational procedures of many kinds（各类计算过程的接口）；
interactive, hands-on in real time（具有可交互性，可以实时手动操作）；
functional in its model of programming（函数式编程模式）；
object-oriented，“everythingisanobject”（面向对象，“所有东西都是对象”）；
modular，built from standardized pieces（模块化，由标准化块构建）；
collaborative，aworld-wide，open-source effort（协作性，全球范围的开源力量）。

当然，R语言的这些特点很难在一篇短文里细致地体现出来。下面我将简要描述一下R语言的现状和未来。

现状及应用

R语言在国际和国内的发展差异非常大，国际上R语言已然是专业数据分析领域的标准，但在国内依旧任重而道远，这固然有数据学科地位不高的原因，国人版权概念薄弱以及学术领域相对闭塞的原因也不容忽视。R语言之所以能够被广大的数据分析工作者接受，这其中有诸多原因。

优势及特点

从R语言的发展历史上看，R主要是统计学家为解决数据分析领域的问题而开发的语言，因此R具有一些独特的优势。

统计学家和前沿算法（3400+ 扩展包）。
开放的源代码（自由且免费），可以部署在任何操作系统，例如Windows、Linux、Mac OS X、BSD、Unix。
强大的社区支持。
高质量、广泛的统计分析、数据挖掘平台。
重复性的分析工作（Sweave = R + LaTeX），借助R语言的强大分析能力+LaTeX完美的排版能力，可以自动生成分析报告。
方便的扩展性。

–可通过相应接口连接数据库，例如Oracle、DB2、MySQL。

– 同Python、Java、C、C++等语言进行互调。

–提供API接口均可以调用，例如Google、Twitter、Weibo。

–其他统计软件大部分均可调用R，例如SAS、SPSS、Statistica等。

–甚至一些比较直接的商业应用，例如Oracle R Enterprise、R add-on for Teradata、Sybase RAP等。

荣誉

R语言拥有这么多优势，很大部分原因在于它同样继承了S语言的优秀血统。S语言在1998年被美国计算机协会（ACM）授予了软件系统奖，这是迄今为止众多统计软件中“唯一”被ACM授奖的统计系统。

当时ACM是这样评价S语言的：

永久地改变了人们分析、可视化、处理数据的方式；
是一个优雅的、被广泛接受的、不朽的软件系统。

我们也可以查询到历年ACM授予软件系统奖的列表，这些优秀的软件系统与我们的生活息息相关：

1983年，Unix

1986年，TeX

1989年，PostScript

1991年，TCP/IP

1995年，World-Wid-Web

1997年，Tcl/Tk

1998年，S

1999年，The Apache Group

2002年，Java

2009年，《纽约时报》发表了题为 “Data Analysts Captivated by R’s Power”的社评，集中讨论了R语言在数据分析领域的发展，并引发了SAS和R用户广泛而激烈的争论。期间，辉瑞公司（Pﬁzer）非临床数据部的副总监Max Kuhn提到：

R已成为人们走出学校后必修的第二门外语，并且在R中有太多令人惊奇的代码；
可以看看SAS的讨论列表，讨论量下降了很多。接下来的2010年，美国统计协会（American Statistical Association）将第一届 “统计计算及图形奖” 授予R语言，用于表彰其在统计应用和统计研究广泛的影响。

社团及活动

正如前文John M. Chambers所说，R也是一个社区，其线下活动非常活跃。在国际上，欧洲和美国每年会轮值举办一次“useR!”会议，届时来自世界各地的R用户齐聚一堂，讨论R语言的应用与科研方面的成果。

出于对统计计算的特殊考虑，每两年还会举办一次DSC会议（Directions in Statistical Computing），专门讨论R在统计计算方面的应用及理论研究。各大城市也会有相应的RGroup，方便本地的R用户聚会及交流。

在国内，每年会以统计之都【注：Capital of Statistics，是一个致力于传播统计学知识并将其应用于实际领域的网站，成立于2006年，宗旨是中国统计学门户网站、免费统计学服务平台】牵头，在北京和上海举办两次中国R语言会议，至2011年已在中国人民大学、华东师范大学等高校举办了四届R语言会议，历年的演讲主题涉及医药、金融、地理信息、统计图形、数据挖掘、制药、高性能计算、社会学、生物信息学、互联网等多个领域。从2012年起，台北将成为第三个举办中国R语言会议的城市——2012年6月的中华R语言会议台北场已经在筹划当中。

业界的认可

KDnuggets网站每年都会做一些数据分析、数据挖掘方面的专题问卷调查，在2011年8月的数据挖掘领域语言流行度的调查中，R语言位居数据挖掘领域所有语言之首（如下图所示），而紧随其后的SQL、Python、Java则在某一领域具有各自独到的优势。在数据挖掘范畴下，R语言同这些语言相互补足、相得益彰。

根据互联网搜索结果计算的TIOBE编程社区指数（Programming Community Index）【注：TIOBE (2011). http://www.tiobe.com/index.php/content/paperinfo/tpci/index.html.】可能更能代表编程语言的流行度。在2011年12月份排名中，R语言依旧是统计领域中最为流行的语言，位列第24（Ratings 0.522%），而时常被放在一起比较的SAS则排名第31（0.417%）。

虽然KDnuggets网站的调查存在样本有偏的嫌疑，但毕竟代表了某一类人群的偏好，并且排名前五位的语言在各自的领域确有代表性。（数据来源 http://www.kdnuggets.com/2011/08/poll-languages-for-data-mining-analytics.html）

挑战和未来

虽然R语言有诸多优势，但它并不是万能的——它毕竟是统计编程类语言。受到其算法架构的通用性以及速度性能方面的影响，因此其初始设计完全基于单线程和纯粹的内存计算。虽然一般情况下无关R的使用，但在当今大数据条件下，这两个设计思路的劣势逐渐变得愈加刺眼。好在R的一些优秀的扩展性包解决了上述问题，例如：

snow支持MPI、PVM、nws、Socket通信，解决单线程和内存限制；
multicore适合大规模计算环境，主要解决单线程问题；
parallel R 2.14.0版本增加的标准包，整合了snow和multicore功能；
R + Hadoop在Hadoop集群上运行R代码；
RHIPE提供了更友好的R代码运行环境，解决单线程和内存限制；
Segue利用Amazon’s Web Services（EC2）。

这里需要着重提一下parallel包，该包是R核心团队为了解决大数据计算问题而在标准安装程序下新增的功能包

一些误区

很多人认为R语言是GNU开源项目软件，因此软件的使用是“没有任何保证”的。但在美国，R的计算结果被FDA（Food and Drug Administration）所承认；并且有报告指出与其他商业软件相比，R的Bug数量非常少【注：UCLA (2006). R relative to statistical packages. Technical report, UCLA.】。

R开发的核心团队对于R的新功能持异常谨慎的态度，比如cairographics从2007年开始酝酿，直到上一个大版本（2011年）才引入到R标准安装程序；byte-compile功能更是经历了从1999-2011年近12年的孵化【注：Ripley，B. (2011). The r development process. Technical report，Department of Statistics，University of Oxford.】。从这个角度讲，R语言的代码质量以及运算结果的可信性是完全可以保证的。

当然，这里所说的是R的标准安装程序包，并不代表所有扩展包的质量。毕竟3400+的扩展包质量良莠不齐，虽然不乏一些优秀的包（如Rcpp、RODBC、VGAM、rattle），但必然存在一些扩展包质量不佳的情况。

应用的思考

R语言并不是人人都能接触到的语言，相对要小众很多，有些人即便接触到没准也搞不清楚R到底有什么用途。对于走上这条路的人，经常会有一些应用困难，比如从个人学习角度而言。

虽然R语言的设计之初就是避免通过大量编程实现统计算法，但最基本的编程能力还是需要的，因此对于一般非计算机专业的工作者来说无疑提高了难度。
还有很多人提到，R语言的学习曲线非常陡峭。但从我多年的使用经验上看，陡峭的学习曲线并不是因为R语言本身，而是隐藏在后面的统计知识很难在短时间内掌握的缘故。

从公司商业应用的角度而言，也存在一些不可回避的问题。

首先是人力资源成本如何核算。
软件成本问题，由于R是自由软件，可以随时随地下载，因此对于企业来说如何度量成本是一个问题。
R的技能核定并没有官方或机构标准，简历上“熟练使用R语言”可能没有任何意义。
实际上，即便没有上述两个问题，企业想招到R相关的人才也不那么简单。
对于大量工作已由其他软件实现（比如用SAS）的公司来讲，转化成本很高。
技术支持获取的问题。

结语

R语言虽然诞生于统计社区，服务于数据，但现在随着数据渗透到各行各业，R语言已经远远超过统计范畴，相信不久的将来会有更多的朋友加入到R语言社区。

作者刘思喆，神州数码思特奇首席数据挖掘专家。9年R语言使用经验，《153分钟学会R》作者。

本文选自《程序员》杂志2012年02期，更多精彩内容敬请关注02期杂志

《程序员》2012年杂志订阅送好礼活动火热进行中

heidisql连接远程数据库_【已解决】HeidiSQL连接（登录）MySQL数据库报错10061问题... weixin_39589511 heidisql连接远程数据库
windows核心编程---第六章线程的调度每个线程都有一个CONTEXT结构,保存在线程内核对象中.大约每隔20mswindows就会查看所有当前存在的线程内核对象.并在可调度的线程内核对象中选择一个,将其保存在CONTEXT结构的值载入c...【转】SQLite提示databasediskimageismalformed的解决方法SQLite有一个很严重的缺点就是不提供Repair命令.导致死
基于python使用scanpy分析单细胞转录组数据探序基因单细胞分析 python 开发语言
探序基因肿瘤研究院整理相关后缀的格式介绍：.h5ad：是一种用于存储单细胞数据的文件格式，可以通过anndata库在Python中处理.loom：高效的数据存储格式（.loom文件），使得用户可以轻松地存储、查询和分析大规模的单细胞数据集。Loompy的设计目标是提供一个快速、灵活且易于使用的工具，以支持生物信息学家和研究人员在单细胞水平上进行数据分析。python的单细胞转录组数据结构说明：da
鸢尾花分类项目 GUI 编织幻境的妖分类数据挖掘人工智能
1.机器学习的定义机器学习是一门人工智能的分支，专注于开发算法和统计模型，使计算机能够在没有明确编程的情况下从数据中自动学习和改进。通过识别数据中的模式和规律，机器学习系统可以做出预测或决策。常见的应用包括图像识别、语音识别、推荐系统等。2.为什么使用鸢尾花数据集（Irisdataset）鸢尾花数据集是一个经典的多类分类问题数据集，由英国统计学家和遗传学家RonaldFisher在1936年引入。
【学习笔记】Elasticsearch之环境搭建聪明马的博客 elasticsearch 学习笔记 elasticsearch
Elasticsearch官网本文是自己在学习Elasticsearch的过程中，记下的觉得非常有用的笔记，希望对大家认识Elasticsearch有一点点帮助。1.什么是Elasticsearch官网上是这么介绍的：Elasticsearchisadistributeddocumentstore.Insteadofstoringinformationasrowsofcolumnardata,El
chatgpt pro是什么？和chatgpt plus有什么区别？如何升级chatgpt pro? chatgpt
chatgptpro是什么？chatGPTPro是openAI推出的目前最高级别的付费订阅服务，一个月200美元.这对于一般用户来说是一个比较昂贵的费用。chatgptpro和chatgptplus有什么区别？chatGPTPlus官网原文：EverythinginFreeExtendedlimitsonmessaging,fileuploads,advanceddataanalysis,andi
瑞芯微平台RK3568系统开发（9）移远EC20 4G模块驱动调试龙猫不是猫！瑞芯微平台开发嵌入式硬件瑞芯微 RK
1.在RK3568开发板上调试4G(EC20)驱动1.1查看RK3568关于4G模块的原理图，获取需要配置的信息1.2需要配置的信息如下14G模块电源使能引脚GPIO4_C324G模块W_DISABLE1引脚GPIO4_B534G模块复位引脚GPIO4_B41.3DTS配置如下{rk_modem:rk-modem{compatible="4g-modem-platdata";pinctrl-nam
redis的主从复制配置 zhaikaiyun redis
通过持久化功能，redis保证了即使在服务器重启的情况下也不会丢失或少量丢失数据，但是由于数据存储在一台服务器上，如果这台服务器出现故障，比如磁盘坏了，也会导致数据丢失。为了避免这个单点故障，可以使用主从复制的方式，将主更新的数据，自动更新同步到其他服务器上。主从节点配置[root@k8smasterconfig]#moreredis6380.confinclude/data/redis/redi
uniapp 使用web-view 来套地址实现分离式打包 luckycoke uni-app javascript 前端
exportdefault{data(){return{title:'http://www.baidu.cn/'//你可以根据需要替换成你的URL};},mounted(){//在应用启动时清除本地缓存this.clearAppCache();},methods:{clearAppCache(){if(uni.getSystemInfoSync().platform==='android'){//
cesium 加载本地json、GeoJson数据前端熊猫 Cesium json 前端
GeoJSON是一种用于编码地理数据结构的格式{"type":"Feature","geometry":{"type":"Point","coordinates":[125.6,10.1]},"properties":{"name":"某地点"}}一、直接加载GeoJSON文件//方式1：通过GeoJsonDataSource加载viewer.dataSources.add(Cesium.GeoJ
Failed to initialize editor Mac Zhu android
今天遇到很奇葩的问题layout文件不能预览花了很长的时间处理，就是各种AndroidStudio相关的缓存文件的处理1.Invalidateandrestart2.删除Administrator下面的.android和.gradle3.删除Administrator\AppData\Local\Google\AndroidStudio2024.2目录4.重装AS5.升级降低AGPVersion和
Python's SQLAlchemy and Object-Relational Mapping zhanglizhuo Python
Acommontaskwhenprogramminganywebserviceistheconstructionofasoliddatabasebackend.Inthepast,programmerswouldwriterawSQLstatements,passthemtothedatabaseengineandparsethereturnedresultsasanormalarrayofrec
数据集 handpose_x_3d-wider_world V1 室外自然场景三维手势＞＞ DataBall Xian-HHappy DataBall数据集合（计算机视觉）-数据也可如此美好 3d
数据集handpose数据集handpose_x_3d-wider_worldV1室外自然场景三维手势>>DataBall数据特点：*场景多样性*包括有无遮挡多样性*有无拿物体多样性数据标注信息包括：二维21关键点，三维21关键点，三维网格点，图像相机内参。想要进一步了解，请联系。DataBall助力快速掌握数据集的信息和使用方式，会员享有百种数据集，持续增加中。示例：助力快速掌握数据集的信息和使
基于Kitti数据集实现MMDetection3D点云物体检测训练 Xian-HHappy 技术知识点 kitti三维点云无人驾驶 MMDetection3D 人工智能计算机视觉目标检测
DataBall助力快速掌握数据集的信息和使用方式，会员享有百种数据集，持续增加中。需要更多数据资源和技术解决方案，知识星球：“DataBall-X数据球(free)”贵在坚持！-----------------------------------------------------------------------------------------------MMDetection3D环境安
ECharts 柱状图X轴或Y轴空值无数据不占位不渲染不展示大橙子- echarts 前端 javascript
效果查看：将option复制到echarts解析垂直方向：//垂直方向代码示例option={legend:{//这里data省略echarts会自动匹配，也可自行配置},xAxis:[//关键点：多个X轴进行匹配{type:'category',position:'bottom',data:['2021','']//空字符串则不会展示},{type:'category',position:'bo
C# 使用 CSRedis 来操作 Redis 队列让梦想疯狂 C#Redis c#redis
Demo代码publicclassHomeController:Controller{[HttpGet("index")]publicasyncTaskIndex(){varcsredis=newCSRedis.CSRedisClient("127.0.0.1:6379,password=,defaultDatabase=1");RedisHelper.Initialization(csredis
(4)UART应用设计及仿真验证4 —— UART模块集成少卿不在大理寺数字IC设计从入门到实战 uart IC设计 verilog IC
四、模块集成1.UART模块集成这会儿你再来看这个uart模块构是不是就亲切了很多，归总一下TX和RX之后，我们发现整个的UART的模块输入输出都是定好了的。所以在结构上没有什么需要再分析和拆解了的。直接上代码：moduleuart(inputclk,inputrstn,inputrx,inputtx_data,inputtx_data_valid,outputtx,outputtx_ready,
mongodb 常用命令打瞌睡的小张 mongodb 数据库 nosql
命令行连接mongodb：mongosh“mongodb+srv://host”--apiVersion1--usernamexxxxx查看有哪些库：showdatabases切换到操作库：usename必须切换到指定数据库才可以进行下面的增删改查操作查看表：showcollections查询所有数据:db.collectionName.find()查询表中一条数据：db.collectionNa
mongoDB 命令行操作小胖_@ mongo mongodb 数据库命令行
mongoDBmongo命令MongoDBshellversionv4.4.15usage:mongo[options][dbaddress][filenames(endingin.js)]dbaddresscanbe:foofoodatabaseonlocalmachine192.168.0.5/foofoodatabaseon192.168.0.5machine192.168.0.5:9999
css给网页添加黑白滤镜 nqxcwl 前端 css 给网页添加黑白滤镜
/*给网页添加黑白滤镜*/html{/*兼容FF*/filter:url("data:image/svgxml;utf8,#grayscale");/*兼容IE内核*/filter:progid:DXImageTransform.Microsoft.BasicImage(grayscale=1);/*兼容其它，谷歌之类的*/-webkit-filter:grayscale(1);}
20250218 隨筆垂直分库分表（Vertical Sharding）和水平分库分表（Horizontal Sharding）靈臺清明 XdClass 网络数据库垂直分库分表和水平分库分表
垂直分库分表（VerticalSharding）和水平分库分表（HorizontalSharding）是数据库拆分的两种策略。它们在大规模数据库优化、分布式架构设计中至关重要，主要用于降低单库压力、提高查询效率、支持高并发。1.垂直分库分表（VerticalSharding）概念垂直分库和垂直分表的核心思想是按业务模块或功能拆分数据库，即：垂直分库（VerticalDatabasePartitio
【layui】layui表格过滤 weixin_43250628 layui 前端 layui javascript 前端
1.除了引用必要的layui的js和css，还需引入tableFilter.js。2.然后就是代码展示部分；layui.config({base:'../../layui/plugins2/',//扩展路径version:'v1.0.0'}).extend({tableFilter:'tableFilter'//模块别名});functionsetGridData(data){layui.use(
python panda下载_pandas python下载|Pandas for python v0.25.0官方版 v0.25.0官方版 - 哩咯下载站... weixin_39647458 python panda下载
Pandas是python的数据分析包，最初被作为金融数据分析工具而开发出来，提供pandas.whl包下载，有需要的赶快下载吧！软件介绍Pandas是python的一个数据分析包，最初由AQRCapitalManagement于2008年4月开发，并于2009年底开源出来，目前由专注于Python数据包开发的PyData开发team继续开发和维护，属于PyData项目的一部分。Pandas最初被
rook-ceph无法登录dashboard 时空无限 Kubernetes ceph ceph kubernetes
环境ubuntu22.04tlsk8s1.20.2现象搭建好ceph集群环境后，执行如下命令获取admin登录账号的密码kubectl-nrook-cephgetsecretrook-ceph-dashboard-password-ojsonpath="{['data']['password'
Rook-ceph(1.92最新版) 野猪佩挤 k8s 存储 ceph
安装前准备#确认安装lvm2yuminstalllvm2-y#启用rbd模块modproberbdcat>/etc/rc.sysinit/etc/sysconfig/modules/rbd.modulesfilesystem.yaml<
autojs使用nodejs调用sqlite数据库牙叔教程 nodejs autojs sqlite 数据库
牙叔教程简单易懂依赖"nodejs";require("rhino").install();const{device}=require("device");constpath=require("path");constfs=require("fs");constutil=require("util");constSQLiteDatabase=android.database.sqlite.SQLi
函数式编程倡导的「不可变数据结构」如何保证性能编程
在函数式编程（FunctionalProgramming，简称FP）中，不可变数据结构（ImmutableDataStructures）是一个核心概念。与传统的可变数据结构相比，不可变数据结构不可修改，而是通过创建新的数据结构来表达数据的变更。这一特点使得函数式编程能够简化并行计算、避免副作用，进而提高程序的可靠性和可维护性。然而，不可变数据结构可能带来的性能问题，例如内存的使用、数据复制的成本等
GSND 5345Q, Fundamentals of Data Science 后端
Homework4GSND5345Q,FundamentalsofDataScienceDueWednesday,February19th,2025Nowitstimetopracticewhatwehavelearnedinclassandlearnevenmore!NotethatfromnowonyourhomeworkshouldbewritteninRMarkdown.Turninyou
PHIDATA智能体AGENT构建框架何为标准 python
介绍Phidata是一个用于构建多模式代理和工作流的框架。利用记忆、知识、工具和推理构建代理。建立可以协同工作解决问题的代理团队。使用美观的AgentUI与您的代理和工作流程进行交互。安装pipinstallphidatapipinstallduckduckgo-search最基本的使用自主调用工具示例。使用duckduckgo搜索内容,需要自己定义.env文件可能需要科学上网，因为这个工具使用的
python环境的yolov11.rknn物体检测子正问题建模 #AI自由行部署 YOLO 机器学习运维
1.首先是我手里生成的一个yolo11的.rknn模型：2.比对一下yolov5的模型：2.1yolov5模型的后期处理：outputs=rknn.inference(inputs=[img2],data_format=['nhwc'])np.save('./onnx_yolov5_0.npy',outputs[0])np.save('./onnx_yolov5_1.npy',outputs[1]
neo4j社区版多图部署梦想成为大佬的王老八 neo4j 数据库 mysql
neo4j社区版不支持多图谱，可采用多安装文件或容器进行多图部署。（想法倒是很简单，就是有一个小问题浪费了我宝贵的半天时间）单图数据库安装、配置及部署：1.neo4j数据库运行需要JDK，首先要下载配置个JDK，此处不赘述了。2.下载neo4j安装包。链接：Neo4jDeploymentCenter-GraphDatabase&Analytics，注意选择社区版、版本号（文件版本越高，对JDK的版
怎么样才能成为专业的程序员？ cocos2d-x小菜编程 PHP
如何要想成为一名专业的程序员？仅仅会写代码是不够的。从团队合作去解决问题到版本控制，你还得具备其他关键技能的工具包。当我们询问相关的专业开发人员，那些必备的关键技能都是什么的时候，下面是我们了解到的情况。关于如何学习代码，各种声音很多，然后很多人就被误导为成为专业开发人员懂得一门编程语言就够了？！呵呵，就像其他工作一样，光会一个技能那是远远不够的。如果你想要成为
java web开发高并发处理 BreakingBad java Web 并发开发处理高
java处理高并发高负载类网站中数据库的设计方法（java教程,java处理大量数据，java高负载数据）一：高并发高负载类网站关注点之数据库没错,首先是数据库,这是大多数应用所面临的首个SPOF。尤其是Web2.0的应用，数据库的响应是首先要解决的。一般来说MySQL是最常用的，可能最初是一个mysql主机，当数据增加到100万以上，那么，MySQL的效能急剧下降。常用的优化措施是M-S（
mysql批量更新 ekian mysql
mysql更新优化：一版的更新的话都是采用update set的方式，但是如果需要批量更新的话，只能for循环的执行更新。或者采用executeBatch的方式，执行更新。无论哪种方式，性能都不见得多好。三千多条的更新，需要3分多钟。查询了批量更新的优化，有说replace into的方式，即： replace into tableName(id,status) values
微软BI（3） 18289753290 微软BI SSIS
1) Q：该列违反了完整性约束错误；已获得 OLE DB 记录。源:“Microsoft SQL Server Native Client 11.0” Hresult: 0x80004005 说明:“不能将值 NULL 插入列 'FZCHID'，表 'JRB_EnterpriseCredit.dbo.QYFZCH'；列不允许有 Null 值。INSERT 失败。”。 A：一般这类问题的存在是
Java中的List g21121 java
List是一个有序的 collection（也称为序列）。此接口的用户可以对列表中每个元素的插入位置进行精确地控制。用户可以根据元素的整数索引（在列表中的位置）访问元素，并搜索列表中的元素。与 set 不同，列表通常允许重复
读书笔记永夜-极光读书笔记
1. K是一家加工厂,需要采购原材料,有A,B,C,D 4家供应商,其中A给出的价格最低,性价比最高,那么假如你是这家企业的采购经理,你会如何决策? 传统决策: A:100%订单 B,C,D:0% &nbs
centos 安装 Codeblocks 随便小屋 codeblocks
1.安装gcc,需要c和c++两部分,默认安装下,CentOS不安装编译器的,在终端输入以下命令即可yum install gccyum install gcc-c++ 2.安装gtk2-devel,因为默认已经安装了正式产品需要的支持库,但是没有安装开发所需要的文档.yum install gtk2* 3. 安装wxGTK yum search w
23种设计模式的形象比喻 aijuans 设计模式
1、ABSTRACT FACTORY—追MM少不了请吃饭了，麦当劳的鸡翅和肯德基的鸡翅都是MM爱吃的东西，虽然口味有所不同，但不管你带MM去麦当劳或肯德基，只管向服务员说“来四个鸡翅”就行了。麦当劳和肯德基就是生产鸡翅的Factory 　　工厂模式：客户类和工厂类分开。消费者任何时候需要某种产品，只需向工厂请求即可。消费者无须修改就可以接纳新产品。缺点是当产品修改时，工厂类也要做相应的修改。如：
开发管理 CheckLists aoyouzi 开发管理 CheckLists
开发管理 CheckLists(23) -使项目组度过完整的生命周期开发管理 CheckLists(22) -组织项目资源开发管理 CheckLists(21) -控制项目的范围开发管理 CheckLists(20) -项目利益相关者责任开发管理 CheckLists(19) -选择合适的团队成员开发管理 CheckLists(18) -敏捷开发 Scrum Master 工作开发管理 C
js实现切换百合不是茶 JavaScript 栏目切换
js主要功能之一就是实现页面的特效,窗体的切换可以减少页面的大小,被门户网站大量应用思路: 1,先将要显示的设置为display:bisible 否则设为none 2,设置栏目的id ,js获取栏目的id,如果id为Null就设置为显示 3,判断js获取的id名字;再设置是否显示代码实现: html代码: <di
周鸿祎在360新员工入职培训上的讲话 bijian1013 感悟项目管理人生职场
这篇文章也是最近偶尔看到的，考虑到原博客发布者可能将其删除等原因，也更方便个人查找，特将原文拷贝再发布的。“学东西是为自己的，不要整天以混的姿态来跟公司博弈，就算是混，我觉得你要是能在混的时间里，收获一些别的有利于人生发展的东西，也是不错的，看你怎么把握了”，看了之后，对这句话记忆犹新。 &
前端Web开发的页面效果 Bill_chen html Web Microsoft
1.IE6下png图片的透明显示： <img src="图片地址" border="0" style="Filter.Alpha(Opacity)=数值(100),style=数值(3)"/> 或在<head></head>间加一段JS代码让透明png图片正常显示。 2.<li>标
【JVM五】老年代垃圾回收：并发标记清理GC(CMS GC) bit1129 垃圾回收
CMS概述并发标记清理垃圾回收(Concurrent Mark and Sweep GC）算法的主要目标是在GC过程中，减少暂停用户线程的次数以及在不得不暂停用户线程的请夸功能，尽可能短的暂停用户线程的时间。这对于交互式应用，比如web应用来说，是非常重要的。 CMS垃圾回收针对新生代和老年代采用不同的策略。相比同吞吐量垃圾回收，它要复杂的多。吞吐量垃圾回收在执
Struts2技术总结白糖_ struts2
必备jar文件早在struts2.0.*的时候，struts2的必备jar包需要如下几个： commons-logging-*.jar Apache旗下commons项目的log日志包 freemarker-*.jar
Jquery easyui layout应用注意事项 bozch jquery 浏览器 easyui layout
在jquery easyui中提供了easyui-layout布局，他的布局比较局限，类似java中GUI的border布局。下面对其使用注意事项作简要介绍：如果在现有的工程中前台界面均应用了jquery easyui，那么在布局的时候最好应用jquery eaysui的layout布局，否则在表单页面（编辑、查看、添加等等）在不同的浏览器会出
java-拷贝特殊链表：有一个特殊的链表，其中每个节点不但有指向下一个节点的指针pNext，还有一个指向链表中任意节点的指针pRand，如何拷贝这个特殊链表？ bylijinnan java
public class CopySpecialLinkedList { /** * 题目：有一个特殊的链表，其中每个节点不但有指向下一个节点的指针pNext，还有一个指向链表中任意节点的指针pRand，如何拷贝这个特殊链表？拷贝pNext指针非常容易，所以题目的难点是如何拷贝pRand指针。假设原来链表为A1 -> A2 ->... -> An，新拷贝
color Chen.H JavaScript html css
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <HTML> <HEAD>&nbs
[信息与战争]移动通讯与网络 comsci 网络
两个坚持:手机的电池必须可以取下来光纤不能够入户,只能够到楼宇建议大家找这本书看看:<&
oracle flashback query(闪回查询) daizj oracle flashback query flashback table
在Oracle 10g中，Flash back家族分为以下成员： Flashback Database Flashback Drop Flashback Table Flashback Query(分Flashback Query,Flashback Version Query，Flashback Transaction Query) 下面介绍一下Flashback Drop 和Flas
zeus持久层DAO单元测试 deng520159 单元测试
zeus代码测试正紧张进行中,但由于工作比较忙,但速度比较慢.现在已经完成读写分离单元测试了,现在把几种情况单元测试的例子发出来,希望有人能进出意见,让它走下去. 本文是zeus的dao单元测试: 1.单元测试直接上代码 package com.dengliang.zeus.webdemo.test; import org.junit.Test; import o
C语言学习三printf函数和scanf函数学习 dcj3sjt126com c printf scanf language
printf函数 /* 2013年3月10日20:42:32 地点：北京潘家园功能：目的：测试%x %X %#x %#X的用法 */ # include <stdio.h> int main(void) { printf("哈哈！\n"); // \n表示换行 int i = 10; printf
那你为什么小时候不好好读书? dcj3sjt126com life
dady, 我今天捡到了十块钱, 不过我还给那个人了 good girl! 那个人有没有和你讲thank you啊没有啦....他拉我的耳朵我才把钱还给他的, 他哪里会和我讲thank you 爸爸, 如果地上有一张5块一张10块你拿哪一张呢.... 当然是拿十块的咯... 爸爸你很笨的, 你不会两张都拿爸爸为什么上个月那个人来跟你讨钱, 你告诉他没
iptables开放端口 Fanyucai linux iptables 端口
1，找到配置文件 vi /etc/sysconfig/iptables 2，添加端口开放，增加一行，开放18081端口 -A INPUT -m state --state NEW -m tcp -p tcp --dport 18081 -j ACCEPT 3，保存 ESC :wq! 4，重启服务 service iptables
Ehcache（05）——缓存的查询 234390216 排序 ehcache 统计 query
缓存的查询目录 1. 使Cache可查询 1.1 基于Xml配置 1.2 基于代码的配置 2 指定可搜索的属性 2.1 可查询属性类型 2.2 &
通过hashset找到数组中重复的元素 jackyrong hashset
如何在hashset中快速找到重复的元素呢?方法很多，下面是其中一个办法： int[] array = {1,1,2,3,4,5,6,7,8,8}; Set<Integer> set = new HashSet<Integer>(); for(int i = 0
使用ajax和window.history.pushState无刷新改变页面内容和地址栏URL lanrikey history
后退时关闭当前页面 <script type="text/javascript"> jQuery(document).ready(function ($) { if (window.history && window.history.pushState) {
应用程序的通信成本 netkiller.github.com 虚拟机应用服务器陈景峰 netkiller neo
应用程序的通信成本什么是通信一个程序中两个以上功能相互传递信号或数据叫做通信。什么是成本这是是指时间成本与空间成本。时间就是传递数据所花费的时间。空间是指传递过程耗费容量大小。都有哪些通信方式全局变量线程间通信共享内存共享文件管道 Socket 硬件（串口，USB）等等全局变量全局变量是成本最低通信方法，通过设置
一维数组与二维数组的声明与定义恋洁e生二维数组一维数组定义声明初始化
/** * */ package test20111005; /** * @author FlyingFire * @date:2011-11-18 上午04:33:36 * @author ：代码整理 * @introduce :一维数组与二维数组的初始化 *summary： */ public c
Spring Mybatis独立事务配置 toknowme mybatis
在项目中有很多地方会使用到独立事务，下面以获取主键为例（1）修改配置文件spring-mybatis.xml  <tx:annotation-driven transaction-manager="transactionManager" /> &n
更新Anadroid SDK Tooks之后，Eclipse提示No update were found xp9802 eclipse
使用Android SDK Manager 更新了Anadroid SDK Tooks 之后，打开eclipse提示 This Android SDK requires Android Developer Toolkit version 23.0.0 or above, 点击Check for Updates 检测一会后提示 No update were found

R语言：优雅、卓越的统计分析及绘图环境

你可能感兴趣的:(Data,big,选题策划)