啄木指北

数据研发人员必备工具

欢迎加入互联网技术交流群：547147889

1、Hadoop套件和朋友们

Hadoop在过去的几年里，几乎成为大数据的代名词。这是数据科学家的兵器库中的主要支撑。知道Hadoop不只是一个程序是非常重要的，它更像一组工具（类似于微软的Office）。这个套件被用于传输，保存和处理大数据。它还包含有一个调度器（Oozie）、元数据和表格管理架构（HCatalog）。所有在Hadoop中处理数据的任务都是分布在安装了Hadoop的所有机器集群中的，这些任务可以是面向对象程序（OOP）代码、数据分析程序、数据图形化脚本以及其他具有有限处理时间（finite process time）特征和对数据分析有用的任务。Hadoop会确保不管你对数据做什么样的操作都能以高效的方式完成，并以直观的方式呈现。

Hadoop套件由以下几个组件组成，所有的组件都很重要。

MapReduce由Google创建，并且是Hadoop的主要组件。正如在之前的部分我们曾提到过的那样，这是任何大数据技术的核心。尽管这是Hadoop固有的特性，但它也可以在其他的大数据程序，例如MPP和NoSQL数据库（例如，MongoDB）。MapReduce最初是具有商业所有权的，但随着Yahoo在2006年提供了慷慨的资金支持，它以Hadoop的开源形式出现，并在两年内迅速受到广泛欢迎。作为一个著名的并行计算算法，它得以让数据库的查询建立在一个计算机集群上，任务可以分拆成小份，并跨越整个集群的节点。

HDFS是Hadoop 分布式文件系统的简称，这是Hadoop系统所使用的文件系统。被Hadoop所处理的数据必须先导入到HDFS中，并备份在运行了Hadoop的计算机网络中。它的数据极限大约在30PB。

Pig是针对Hadoop进行计算的一个高级编程语言（High-level programming language）。你可以将它视为Hadoop生态系统中各种操作的控制元件。它的性能是可扩展的。

Hive是一个数据仓库程序，是以“类-SQL”语言进行访问使用的，他是为横跨Hadoop集群的数据设计的。并且它的性能是可扩展的。

HBase、Sqoop以及Flume是Hadoop的数据库组件。HBase是一个可以运行在Hadoop环境上的列式数据库。它是基于Google的BigTable设计的，并且数据极限约为1PB。另外，它比直接在HDFS上访问数据要慢一些。这对于处理存在HBase里面的数据来说不是很好，对HBase对于归档和时间系列数据的计数很合适。Sqoop是一个将关系型数据库中的数据导入到HDFS中的程序。Flume与此类似，它关注于收集和导入各种数据源的日志和任务数据。

Mahout是一个机器学习和数据挖掘算法的函数库，用于对存储在HDFS的数据进行处理。

Zookeeper服务于Hadoop有一“群”各种各样功能的组件，所以调试管理以及协调程序是十分必要的。Zookeeper保证了整个套件的整合以及相对得简便操作。

Hadoop套件还有一些其他的组件用来补充以上这些核心组件。而熟悉它们最好的方法是去下载一个Hadoop玩一下。当需要确定基准（Benchmark）的时候，你可以选择去读一下教程（或者，如果你能读一下用户手册则更好）。

Hadoop并不是进入大数据技术的唯一选择。另有一个也很有意思但并不那么有名的备选方案是Storm（被Twitter、阿里巴巴、Groupon以及其他许多公司所使用）。Storm显著快于Hadoop，同样也是开源，而且使用起来相对简单，是一个值得选用的Hadoop备选方案。不像Hadoop， Storm 不执行MapReduce任务，而是运行topology（拓扑）。核心的差异在于MapReduce最终会将任务结束，而topology会永远运行或直到它被用户终止。（你可以将它类比为操作系统后台一直运行的进程）。topology可以被画成计算图，用以处理数据流。这些数据流的源被称为spout（形象化为“水龙头”），而它们会被接入bolt（形象化为“闪电”）。一个bolt可以使用任意数量的输入源，做一些处理，并输出新的数据流。

对数据使用Topology方法可以确保即使在出现故障的情况下也能处理出正确的结果（因为topology会持续地运行），也就是说如果计算机集群中的某一台计算机发生了问题也不会危害到在运行在整个集群上任务的一致性。需要注意的是，Storm topology 一般是由Java、Ruby、Python和Fancy语言编写而成。Storm软件则是由Java和Clojure（一个与Java配合良好的函数型语言）编写，同时它的源代码也是这个类型技术中最为流行的项目。

这个软件的优势在于它处理数据的实时性、简单的API、可扩展性、容错性、简单部署、免费且开源并能够确保数据处理，以及可以在其上使用各种编程语言。它有横跨美国东西海岸、伦敦以及其他地区，并持续壮大的用户社区。

除了Storm这个非常流行并且提供了灵活和简单地操作还很有前景的Hadoop的替代品之外，还有一些其他软件同样宣称自己具有类似特性并尝试挑战Hadoop在大数据世界的支配权。最值得推荐的几个软件（在编写本书的时候）有如下几个。

Spark由加利福尼亚大学伯克利分校的AMP Lab开发而成。Spark是MapReduce领域的最新玩家，它的目标是数据分析在写入和运行端的速度更加快速。不像许多在这个领域的系统，Spark使用内存查询数据，替代了磁盘的读写。这样，Spark在许多迭代算法上比Hadoop的表现更为优越。它是由Scala实现的（参见一下部分），在写作本书的时候，它的主要用户是UC Berkeley的研究者和Conviva公司。

BashReduce作为一个脚本工具，BashReduce可以用标准UNIX命令（如sort、awk、grep、join等执行MapReduce，成为了Hadoop的另一个备选工具。它支持映射/分割、规约以及合并等功能命令。尽管它根本没有一个分布式文件系统，BashReduce还是将文件分布到了工作节点中，但不可避免地缺少容错。它没有Hadoop那么复杂，同时可以进行快速开发。除了容错的问题之外，它还缺乏灵活性，因为BashReduce只能工作在特定的UNIX命令环境中。BashReduce是由Erik Frey（在线电台last.fm）以及他的助手们开发。

Disco Project最初是由诺基亚（Nokia）研究院开发，Disco已经默默无闻了很多年。MapReduce作业由简单的Python编写，而Disco的后端是以Erlang编写的，一个可扩展的函数型语言，内置支持并发、容错以及分布，使得它成为一个理想的MapReduce系统。与Hadoop类似，Disco分布并复制存放数据，但它没有自己的文件系统。由于它的高效，在作业调度方面也是值得称道的。

GraphLab由卡内基梅隆大学开发，为机器学习应用服务而设计，GraphLab旨在提高并行机器学习算法设计的执行效率和正确性。GraphLab拥有它自己版本的映射（map）阶段，称为更新阶段。不像MapReduce，更新阶段可以读取和修改数据的交集。它基于图的方法使得在图形的机器学习上更具可控性，同时提升了动态迭代算法。

HPCC 系统以它自己的大规模数据分析架构，HPCC试图用Enterprise Control Language语言（ECL）更近编写并行工作流，ECL语言是一个声名式语言，以数据为中心的语言（有些类似于SQL、Datalog和Pig）。HPCC是用C++写成的，根据一些人的说法，这样使得内存查询更快。HPCC由于拥有自己的分布式文件系统而也成为Hadoop一个有力地备选工具。

Sector/Sphere以C++开发，这个系统承诺了比Hadoop快2～4倍的性能。它由两部分组成：Sector，安全且可扩展的分布式文件系统，以及Sphere，在存储节点上可以通过简单的API接口处理Sector数据文件的并行数据处理引擎。它具有不错的容错性，支持广域网同时兼容旧系统（需要做一些修改）。从2006年诞生起，它就是一个不错的Hadoop替代方案。

还有一些并行于这些系统的项目，可以免费便利地开展Hadoop环境下的工作。所以，如果你想学Hadoop，并且把基础的部分都掌握以后可以看看这些工具。这些项目中最著名的有以下几个。

Drill是一个Hadoop插件，专注于提供一个存储在Hadoop集群环境下的数据集的交互分析接口。它常常利用MapReduce来执行Hadoop下的大数据的批量分析，并通过Dremel以更快的速度来处理更大规模的数据集。凭借它可以扩展到大规模服务器上的能力（它的设计目标是10000个服务器），使它成为处理真正的大数据的好选择。如果你计划使用Hadoop，那么它是一个值得你去研究的工具。

D3.js是数据驱动文档（Data Driven Documents）的缩写，D3.js是一个开源JavaScript函数库，可以让你编辑大数据的展示文档。这个工具可以让你利用网页技术（例如HTML5、SVG以及CSS）来创建动态图形。另外，它还提供可视化方法，例如和弦图、气泡图、树状图以及节点连接树。由于它是开源的，因此这个列表还在持续地扩展着。D3.js设计的目标是运行快速和兼容于跨硬件平台的程序。尽管它不一定会替代完全成熟的数据可视化程序（见4节），但这是一个你值得留意的好工具。D3.js是由纽约时报的图形编辑Michael Bostock开发的。

Kafka是最早由LinkedIn所开发的消息系统，作为社交媒体活动流和数据处理管道的基础。从那以后，它的用户群便逐渐扩大，涵盖了各种使用数据管道和消息服务的公司。它非常高效，同时与Hadoop生态系统集成良好，此外，它是运行在Java环境中的，是可以跨平台的。

Julia事实上，它不只是一个数据分析工具，而是被设计为运行在诸如Hadoop这样的分布式计算环境中。它很稳健，易于使用，类似于Matlab和R（见3节），同时又非常快速。它是与Hadoop套件相衬的扩展工具，如果你倾向于编写程序，那么这是一个可以加入你技能树中的好语言。

Impala是一个分布式查询执行引擎，是为原生存储在Apache HDFS 和Apache HBase的数据而设计的。由Cloudera开发，它聚焦于数据库而且不会使用到MapReduce。因为它避免了MapReduce作业的额外开销，所以可以实时地返回结果。

2、面向对象编程语言

数据科学家需要能够熟练处理面向对象编程（OOP），但比较各种面向对象编程语言已超出了本书所要讨论的范围，所以如果非要举个例子的话，Java是这一节中主要会讨论的语言，因为它被业界熟知。像大多数面向对象一样，Java不包含用户图形界面（GUI），这就是那么多人更爱用Python（它的开发者确实为它编写了一个体面的GUI）的原因。然而，Java运行快而优雅，同时不管是线上还是线下都有大量的学习资源。

注意，部分字句的颜色和高亮显示是由编辑器自动实现的（尽管不总是这样，例如当使用记事本工具打开程序时）。同样，间距也是可选的，用来帮助用户编写语句。注意大多数程序会比这段简单的例子要长一些，也更复杂一些，但它们也可以像例子中一样，被拆散成简单的语句块。

如果你花了大量的时间在编写脚本上面（通常如果你使用文本编辑器，例如Notepad++或者Textpad），编程会让你劳累不堪。为了减轻这种影响，在过去的许多年里，众多集成开发环境（Integrated development environments，IDE）被开发出来。这些IDE为编程语言提供了额外环境，将它的引擎、编译器以及其他组件和舒适的图形界面以更加友好的方式呈现。一个在Java世界里非常著名的IDE就是Eclipse，同时也可以作为其他语言的运行环境，甚至是像R一样的数据分析包（Data analysis packages）。

其他可供你参考的的面向对象语言包括：

C++是与Java齐名的编程语言，快速而流行
Ruby是强大的面向对象编程的备选语言
JavaScript是可与Java配合使用的基于网页的编程语言
Python是优秀的面向对象语言，特别适合初学编程的人
C#是由微软开发的业界知名的编程语言

所有这些都是免费而且可以通过免费教程学习的（C#的IDE是Visual Studio，它是商业软件[1]）。另外，它们都有一些共同点，如果你对面向对象编程（OOP）的概念很熟悉的话，例如封装、继承以及多态，你就能够处理它们中的任何一个。注意，所有这些编程语言都是命令型语言（相对于最近逐渐出名的声明/函数型编程语言而言）。这个类型编程语言的语句基本上都是在命令计算机采取什么样的行动。而声明/函数型语言，相对来说更多的关注最后的结果而对下一步采取什么动作的具体细节并不关心。

尽管在写作本书时，面向对象编程语言在专业编程领域是一个基本配置，但目前还是有一些向函数型语言变化的趋势（例如Haskell、Clojure、ML、Scala、Erlang、OCaml、Clean等）。这些语言基于另一种哲学，关注函数式表达式的求值而不是变量的使用或者实现它们命令的具体执行。

函数型语言的一个大加分项就在于它便捷的可扩展性（这对于处理大数据极有帮助）以及避免出错，因为它们不使用全局工作空间。不过，它们相比于面向对象编程语言，在大多数数据科学应用下要慢一些。尽管它们中有几个语言（例如OCaml和Clean）在做数值运算时，可以和C语言[2]一样快。如果未来峰回路转之后，函数型语言的情况逐渐好转，为了稳妥起见，那么你可能会希望把函数型语言添加到你的技能树中去。注意函数型语言和我们之前提到的一些传统的面向对象编程语言会有交叉的部分。例如，Scala就是一个函数型面向对象编程语言，这个语言值得大家好好研究。

3、数据分析软件

如果数据科学家耗费时间所参与的编程工作到最后得不到任何认同，或干脆就毫无意义，那数据科学家还有什么可当的？于是，数据分析软件就在此时登场了。在众多选择中，最有名的当属Matlab和R。它们都很棒，但是没有必要去计较谁比谁更好，因为用那一种工具更多是基于个人偏好。有趣的是，这两者之间的语法和功能函数非常相近，以至于如果你精通了其中任意一种，那么学习另一种的时间也就是2～3个星期。

由于R在某种程度上来说更受欢迎，主要由于它免费开源，庞大的用户群体定期地向其贡献新内容，因此，我们在本书中会更关注R。所以希望那些倾向于Matlab，并了解Matlab在哪些地方优于R和其他数据分析工具的人，理解我们的选择并保持开放的心态。R同样有优于其他数据分析工具的地方，并且它在编写和运行程序上都很直观，通常不使用循环结构（一种程序结构，一般来说会拖慢高级程序语言的分析时间），而是利用运用向量的一些操作，而且它还可以延展到矩阵，这种特性被称为向量化，向量化使得数据分析脚本易于阅读和理解（面向对象编程语言通常运行速度很快，因此循环对于它们并不是问题）。

R语言的运行环境十分简单（在某种方面上与Python类似），对用户使用来说也足够友好，特别是一些小程序。

R作为一款数据分析工具来说是十分强大的，而它的GUI（图形用户界面）也做得很好。然而，如果你真的想用这款软件，还是需要花点时间学习并调试一下IDE。市面上有很多款R语言的IDE（大多数是免费的），但其中有一个佼佼者，叫做RStudio

R语言之外的其他数据分析工具还有。

Matlab/Octave在R成名业界之前就已存在，并且Matlab就已经称王于数据分析领域。尽管Matlab是有商业所有权的软件（需要付费使用），他还是有几个开源的小伙伴们，其中最好的当属Octave。Matlab和Octave对于初学者而言都是很好的工具，它们有大量的应用，并且像R那样实现了向量化。但是，Matlab的工具箱（函数库）稍有些昂贵，而Octave则没有这些。

SPSS是现有最好的统计程序之一，而且广泛适用于研究领域。学习起来很简单，它可以做任何数据分析，尽管不像R语言那样高效。此外，和Matlab一样，它也是有商业所有权的，为学界与业界所推崇。

SAS是一个流行的统计程序，特别是在企业当中。学习起来相对简单，它也有一个不错的脚本语言工具，可以帮助创建更为复杂的数据分析。但是，它也是有商业所有权的。

Stata是选择统计程序包时的好选择。Stata 是最受统计学家所喜欢的工具之一，也是具有商业所有权的。自从R语言在数据分析世界变得广受欢迎以来，Stata就不再像以前那么受宠了。

注意，上面所提及的软件（除Octava以外），都是具有商业所有权的，所以他们并不像R那样能吸引巨量的用户群。如果你对统计和编程都很熟悉，那么对你来说，它们就会很容易学习。在Matlab的帮助下，你不需要为了使用而去熟悉很多统计学知识。我们会在10.5节再探讨R语言，那时，我们会讨论如何在机器学习架构中使用它。

4、可视化工具

数据分析结果可视化的重要性显而易见，这也就是增加一些可视化软件可以充实你的软件兵器库的原因。尽管所有的数据分析程序都能提供一些像样的可视化工具，但增加一些专用的工具总是好的。例如Tableau，它可以使整个处理过程都更加直观以及高效。

很遗憾地说，因为Tableau是一个具有商业所有权的软件，所以它有些贵。然而，他可以实现快速的数据可视化，混合以及图像导出。它的使用界面十分友好，易于学习，在网上有大量的资源，空间使用相当小（小于100MB）。另外，它的开发者们也乐于通过教程与实践来指导用户学习。它在Windows（XP之后的任何版本）上运行，同时还有两周的试用期。有趣的是，它是华盛顿大学“数据科学导论”的教学大纲的一部分。

在业界，Tableau较其他可视化程序取得了领跑者的地位。尽管它更适合于商业智能应用，但它还可以被用在任何数据可视化任务中，同时它实现了通过邮件和在线的图像简易共享。它也提供了交互式的映射以及能够同时处理不同来源的数据。

如果你对这款软件的同类产品感兴趣，你可以看看以下几款程序。

Spotfire是由TIBCO开发的优秀产品，可视化分析的理想工具。它可以与地理信息系统，建模及分析软件良好集成，同时具有无限的可扩展性，其价格与Tableau保持同一水平。

Qlikview是一款良好的备选工具，对数据可视化和深入钻取任务是理想的工具。它速度很快并且提供了出色的交互可视化及仪表盘支持。它有很棒的用户界面和视觉控制，而且还有在内存中处理大数据集的出色能力。然而，它受到内存大小的限制（具有扩展性问题），而且价格相对较高。

Prism是一款直观的商业智能（BI）软件，可以轻松地实施任务和学习。它主要专注于商业数据，除去一般类型的图表以外，它可以生成数据仪表盘、积分板、查询报告等。

InZite是一款有趣的替代方案，提供了吸引人的可视化及仪表盘特性，快速而且直观。

Birst是一个好选择，提供了大量交互性可视化以及分析工具。它可以生成透视表，还可以用精细直观的报表工具深入钻取数据。

SAP Business Objects提供了指向并点击数据可视化功能，以便能够生成交互并可分享的可视化图像和交互仪表盘，它直接集成了SAP的其他产品。

一般来说，数据可视化程序使用起来相对轻松，所以在你的“数据兵器库”中加入它们并不是个问题。在倾注大量时间掌握其中任何一个工具之前，确保它能与你使用的其他工具集成良好。此外，看看大部分你所感兴趣的软件广告中都包含了哪些其他的可视化软件。

5、集成大数据系统

尽管并不是必须的，但能够熟悉至少一个集成大数据系统是很好的。IBM的BigInsights平台就是其中一个很不错的例子，尽管事实上它还处于初期版本。它的设计思路是将Hadoop的大部分功能封装到一个对用户友好，并且有像样的图形界面的软件包中去。它的加分项是它还能执行数据的可视化和调度，类似这种“多合一”的套件包相当贴心，这样你就可以专注于数据科学工作的其他部分了。BigInsights运行在一个集群/服务器中，可以通过网页浏览器来访问。

集成大数据系统的一个巨大优势在于它图形化的用户界面，与优秀的文档结合在一起之后，使整个系统变得十分友好、直观，而且可以轻松地学会操作。此外，图形界面会很好地结合Hadoop相关操作命令，它可以让你专注于数据科学中更高级别的方面，将你从原本不得不做的大量底层编程中解放出来。

与BigInsights类似的另一个选择是Cloudera，它同样驰名于业界，同时更加稳健。其他值得你了解的软件还包括Knime、Alpine数据实验室套件、Pivotal套件，等等。在你读到这里的时候，很可能已经发布了其他一些集成大数据系统，所以请确保你了解它们是什么，以及它们都提供了哪些功能。

6、其他一些程序

如果不加上一些辅助工具的话，上面这个程序列表就显得不完整。因为发布的公司不同，这些程序可能也会各不相同，但当你需要优化你的“软件兵工厂”的时候，它们是一个好的起步。举个例子，Git版本控制程序绝对值得吸引你的目光，因为你很可能会需要用到它，特别是当你与其他人（通常是程序员）一起参与一个大型项目的时候。

Git版本控制程序不算是最直观的可用程序，但具有丰富的功能和高效的工作能力。

注意，Git有很多在主流操作系统下的图形界面的插件。有一个在Windows操作系统下非常好的开源图形界面插件叫Git扩展（Git Extensions），除此以外也还有许多在其他操作系统下运行得很好的Git图形界面。这个特别的图形界面插件让Git变得更加直观而且保留了它的命令提示行（但并不是每个Git图形界面都提供这个功能）。

如果在这里忽略了Oracle SQL开发软件，就简直是有悖神明，因为它经常用于访问公司Oracle数据库中的结构化数据。尽管这个特别的软件由于大数据技术的迅速扩张，在接下来的几年内可能会不胜从前，但在做数据科学任务时，它仍然十分重要。
这个软件最关键的部分就是SQL，所以为了使用它的全部潜力，你需要让自己熟悉这种查询语言。正如我们在前几章中看到的那样，这对数据科学家来说是一个非常有用的语言，即使你用得机会并不太多。这是因为它会以其他形式被使用到大数据的数据库程序中。

当你从事数据科学工作时，一些其他需要熟悉的程序如下。

MS Excel是微软Office套件中知名的电子表单应用。与其他的数据分析程序相比，Excel以其简单到不可思议的特性，一直沿用到今天，并且在检视csv（逗号分隔值，一组以逗号作为分隔符的数据值）文件形式的原始数据时迟早会派上用处（例如，创建分析结果报告的总结）。就像Office套件中的其他应用一样，它是具有商业所有权的，尽管还有很多具有类似功能的免费替代方案（例如，Open Office 的Calc应用）。

MS Outlook是微软Office套件中另一个同样知名的程序，它被设计用来处理电子邮件、日历、待做事宜以及联系人信息。当然也有很多免费的备选程序，但经常被用于工作场合。如果你每天都要处理内部和外部通信、预约等，它会显得非常有用。它也是具有商业所有权的软件。

Eclipse如早先提及的那样，这是面向对象语言以及其他编程语言（甚至是R）中最具人气的IDE。它非常稳健直观，使得编程的过程更加友好和高效。它是开源而且跨平台的。

Emcien能够处理复杂数据集，特别是半结构化数据和非数值类型时所使用的优秀的图像分析程序。如果你对更高级的数据分析，特别是基于图的分析感兴趣的话，这是一个不容错过的程序。它并不是一款其他数据分析程序的替代者，不过，它是具有商业所有权的。

Filezilla（或者其他的FTP客户端程序）能够传输大型文件或者在跨Internet进行文件传输时提供某一级别的安全性保障，此时这个程序就显得非常有用。它是一个开源软件。

7、要点

数据科学家在日常工作中会利用各类工具，本章介绍了其中最具有代表性的，包括：Hadoop/Spark、面向对象编程语言（例如Java）、数据分析平台（例如R）、可视化软件以及一些辅助工具（例如GIT和Oracle）。此外还有一些公司和行业所需求的特定程序。

Hadoop是大数据软件界的凯迪拉克，它的套件由几类组件组成，包括文件系统（HDFS）、将数据分布到计算机集群的方法（MapReduce）、机器学习程序（Mahout）、编程语言（Pig）、数据库程序（Hive、HBase等）、调度器（Oozie）、元数据和数据表管理框架（HCatalog）以及调试管理器和协同程序（Zookeeper）等。

Hadoop套件有很替代方案，例如Storm、Spark、BashReduce、Disco project，等等。

有几款可以并行帮助Hadoop开展工作的程序：Drill、Julia、D3.js、以及Impala等。

作为数据科学家，你应该能处理至少一个面向对象语言，例如Java、C++、Ruby、Python、C#等。面向对象语言目前是分布最广的编程语言范式，尽管最近有一股面向函数型语言的风潮涌动。

函数型编程语言（例如Clojure、OCaml、Clean、ML、Scala和Haskell）都是很优秀的资产，特别是如果你擅长编程而且想要扩展你的编程技能。
你必须对至少一种现下流行的分析工具极为熟悉，R、Matlab/Octave、SPS、SAS、Stata。其中只有R与Octave是开源的，而前者（R）是时下最为流行的选择。

Tableau则是数据可视化软件中的最好的选项，尽管还有类似于Spotfire、Qlikview、Brist、inZite、Prism和SAP Business Objects的工具。

集成大数据系统（例如IBM的BigInsights平台）同样值得去研究，因为它们使整体的数据科学流程更高效，同时将你从MapReduce所需的低层编程中解放出来。

其他一些程序值得你花时间去了解，GIT（或者其他的版本控制工具）、Oracle、MS Excel、MS Outloo、Eclipse、Emcien以及Filezilla（或者其他的FTP客户端程序）。很自然地，你会的程序越多（即使没有在本章中列举），也就越牛，只要你对它们掌握得足够好，它们也会在商业应用中展现出更大的价值。

欢迎技术工作者加入纯粹的技术交流群：547147889

你可能感兴趣的:(工具,hadoop,数据,软件,系统)

iPhone越狱基本流程王景程 github iphone xcode macos
目录一、什么是越狱（Jailbreak）？二、越狱前的准备工作三、越狱方式总览（按iOS版本划分）越狱类型：主流越狱工具一览：四、以Checkra1n为例讲解越狱流程（适合iPhoneX及更早）✅支持设备（iOS12–14）：步骤：五、越狱后的操作（以Cydia为例）⚠️六、越狱风险与注意事项总结流程图：一、iPhone16+iOS26：是否可以越狱？当前情况（截至2025年中）：二、为何新设备（
Next.js漏洞风暴：CVE-2025-29927全网爆发，你的项目躺枪了吗？前端菜鸡日常服务端渲染 javascript 开发语言后端 node.js
Next.js中间件鉴权绕过漏洞(CVE-2025-29927)全面解析与应急指南近日，Next.js框架曝出一个高危安全漏洞CVE-2025-29927，该漏洞允许攻击者通过构造特殊HTTP请求头绕过中间件的安全控制，可能导致未授权访问、数据泄露等严重后果。本文将全面剖析该漏洞的技术细节、影响范围、检测方法及修复方案，帮助开发者快速评估风险并采取应对措施。漏洞概述与技术原理CVE-2025-29
computed()、watch() 与 watchEffect() 前端岳大宝前端框架Vue vue.js javascript 前端
下面，我们来系统的梳理关于computed、watch与watchEffect的基本知识点：一、核心概念与响应式基础1.1响应式依赖关系Vue的响应式系统基于依赖收集和触发更新的机制：响应式数据依赖收集创建依赖关系数据变更触发更新执行副作用1.2三大API对比特性computedwatchwatchEffect返回值Ref对象停止函数停止函数依赖收集自动手动指定自动执行时机惰性求值响应变化立即执行
ref() 与 reactive() 前端岳大宝前端框架Vue javascript 前端 vue.js
下面，我们来系统的梳理关于ref()与reactive()的基本知识点：一、响应式编程核心概念1.1什么是响应式编程？响应式编程是一种声明式编程范式，它使数据变化能够自动传播到依赖它的代码部分。在Vue中，响应式系统实现了：数据驱动视图：数据变化自动更新DOM依赖追踪：自动跟踪数据依赖关系高效更新：最小化不必要的DOM操作1.2Vue响应式系统演进版本响应式实现特点Vue2Object.defin
常见的会话劫持攻击是指什么？ wanhengidc 安全网络 web安全
会话劫持攻击是一种常见的网络安全攻击，恶意攻击者通过窃取用户的会话标识符号来接管用户的会话，当攻击者或者有效的会话标识符，那么就可以借取正常用户的数据信息，来访问目标用户的账号，并进行各种操作，来修改或者盗取重要的数据信息，以此来给用户造成巨大的经济损失。所以企业对于会话劫持攻击，可以选择定期更新和修补系统漏洞来保护用户的数据安全，及时更新操作系统、应用程序和安全组件，以此来修复已知的服务器安全漏
Java中的批处理优化：使用Spring Batch处理大规模数据的实践微赚淘客系统开发者@聚娃科技 java spring batch
Java中的批处理优化：使用SpringBatch处理大规模数据的实践大家好，我是微赚淘客返利系统3.0的小编，是个冬天不穿秋裤，天冷也要风度的程序猿！在处理大规模数据的场景中，批处理是一个非常常见且必要的操作。Java中的SpringBatch是一个强大的框架，能够帮助我们高效地执行复杂的批处理任务。本文将带大家了解如何使用SpringBatch处理大规模数据，并通过代码示例展示如何实现高效的批
2025 VUE常见面试题 hmildj vue.js 面试前端
前言总结一些VUE面试的基础知识，共同学习1.什么是Vue？答案：Vue.js（通常简称为Vue）是一个用于构建用户界面的‌渐进式JavaScript框架，Vue3是Vue.js框架的最新版本，它引入了许多改进和优化，包括性能提升、更好的类型支持、组合API等。2.MVVM模式是什么？Vue如何体现这一模式？‌答案：MVVM将视图（View）与数据（Model）通过ViewModel层解耦，Vue
软件测试从业者必备的SQL知识十二测试录数据库 sql 数据库
作为职场人，学一门技能是用来解决日常工作问题的，没必要从头到尾把这块知识弄透，没那么多时间。基于此，十二根据自己的经验，把软件测试从业者需要掌握的SQL知识，整理如下；只要跟着这个顺序，从头到尾执行即可。前置准备事项：1、在自己电脑上安装一个mysql数据库，文章见->虚拟机Centos下安装Mysql完整过程（图文详解）_虚拟机安装mysql-CSDN博客2、找一个mysql客户端链接工具：初学
RPC：跨越代码与硅晶的“握手”——你每天都在用，却可能从未真正理解它老马爱知信息技术 #分布式计算 rpc 网络协议网络分布式系统微服务软件架构硬核科普
——从本地调用的幻觉到服务万物的底座，解析这个支配云原生时代的隐形协议引言：一个程序员的日常困境想象一下这个场景：你正在构建一个电商系统。用户服务（管理用户信息）在一台服务器上，订单服务在另一台，而支付服务，则由远在天边的第三方提供。当一个用户下单时，订单服务需要先向用户服务确认用户身份，再调用支付服务完成扣款。这三个服务如同三座孤岛，如何让它们高效、优雅地对话？难道你要手动编写Socket连接，
Java中的值传递 Obltv Java基础 java 开发语言
更多内容请看我的个人网站date:2025-06-01tags:八股基础Java中只有值传递什么是值传递值传递（PassbyValue）调用方法时，传递的是参数的值，是原始数据的一个副本。方法内部改变这个副本，不影响原始数据。什么是引用传递引用传递（PassbyReference）调用方法时，传递的是变量的地址（指针），方法内部对这个引用的任何更改，都会影响原始对象的引用。举例一个方法不能修改一个
高斯混合模型（Gaussian Mixture Model, GMM）不想秃头的程序神经网络语音识别人工智能深度学习网络
高斯混合模型（GaussianMixtureModel,GMM）是一种概率模型，用于表示数据点由多个高斯分布（GaussianDistribution）混合生成的过程。它广泛应用于聚类分析、密度估计、图像分割、语音识别等领域，尤其适合处理非球形簇或多模态数据。以下是GMM的详细介绍：一、核心思想GMM假设数据是由多个高斯分布混合生成的，每个高斯分布代表一个簇（Cluster），并引入隐变量（Lat
卷积神经网络（Convolutional Neural Network, CNN）不想秃头的程序神经网络语音识别人工智能深度学习网络卷积神经网络
卷积神经网络（ConvolutionalNeuralNetwork,CNN）是一种专门用于处理图像、视频等网格数据的深度学习模型。它通过卷积层自动提取数据的特征，并利用空间共享权重和池化层减少参数量和计算复杂度，成为计算机视觉领域的核心技术。以下是CNN的详细介绍：一、核心思想CNN的核心目标是从图像中自动学习层次化特征，并通过空间共享权重和平移不变性减少参数量和计算成本。其关键组件包括：卷积层（
《现代通信原理与技术》模拟调制与解调—FM 调制实验报告不想秃头的程序人工智能 matlab 信息与通信信号处理
摘要本实验旨在通过MATLAB软件进行模拟调制与解调的实践，加深对频率调制（FrequencyModulation,FM）原理的理解，并掌握FM调制与解调的实现方法。关键词：MATLAB引言在现代通信系统中，调制技术是实现信息传输的核心方法之一。频率调制（FrequencyModulation,FM）作为一种重要的模拟调制方式，通过改变载波信号的频率来传递信息，广泛应用于广播、电视、无线通信等领域
Spring Batch ：高效处理海量数据的利器一叶飘零_sweeeet Springboot spring boot
SpringBatch是Spring框架中一个功能强大的批处理框架，旨在帮助开发人员轻松处理大量数据的批量操作，比如数据的导入、导出、转换以及定期的数据清理等任务。它提供了一套完善且灵活的机制，使得原本复杂繁琐的数据批处理工作变得条理清晰、易于管理和扩展。接下来，我们将全方位深入探究SpringBatch，从其核心概念、架构组成，到具体的使用示例以及在不同场景下的应用优势等，带你充分领略它的魅力所
平台再升级！接入DeepSeek AI，三大能力一键生成橙武科技低代码 AI deepseek 人工智能
在数字化项目落地过程中，很多企业都会面临相同的问题：数据库建模要写SQL表结构；业务流程需要画LogicFlow流程图；前端页面还要写AMISJSON配置。从想法到实现，中间至少要经历产品经理、架构师、后端、前端多轮沟通。每个环节都耗时，改起来还要推翻重来。demo地址：https://admin.cwcode.top✨我们的平台，现在直接整合了DeepSeekAI大模型只要输入一句需求，就能：✅
P25：LSTM实现糖尿病探索与预测 ?Agony lstm 人工智能 rnn
本文为365天深度学习训练营中的学习记录博客原作者：K同学啊一、相关技术1.LSTM基本概念LSTM（长短期记忆网络）是RNN（循环神经网络）的一种变体，它通过引入特殊的结构来解决传统RNN中的梯度消失和梯度爆炸问题，特别适合处理序列数据。结构组成：遗忘门：决定丢弃哪些信息，通过sigmoid函数输出0-1之间的值，表示保留或遗忘的程度。输入门：决定更新哪些信息，同样通过sigmoid函数控制更新
什么是 QueryGPT？智能查询工具如何重塑信息检索的未来？镜舟科技 StarRocks QueryGPT 数据查询数据分析多模态交互
从客户行为数据到供应链信息，从市场趋势到内部运营指标，这些数据蕴含着巨大的商业价值。然而，数据量的激增也带来了前所未有的检索挑战：如何在海量信息中快速定位所需数据？如何确保查询结果的准确性和时效性？据统计，75%的企业正受困于低效的查询工具，这已成为阻碍企业数字化转型的关键痛点。传统的数据查询方式主要依赖SQL语句或特定的查询语言，这要求用户具备专业的编程知识和对数据结构的深入理解。即使对于数据分
installGo.sh
#!/bin/bash#检查是否以root用户运行if["$(id-u)"-ne0];thenecho"请使用root权限运行此脚本"exit1fi#检查是否安装了必要的工具forcmdincurlwgettar;doif!command-v$cmd&>/dev/null;thenecho"错误:需要安装$cmd"exit1fidone#获取最新版本号echo"正在获取最新Go版本..."LATE
＜script setup＞语法糖前端岳大宝前端框架Vue vue.js 前端 javascript
下面，我们来系统的梳理关于Vue3语法糖的基本知识点：一、核心概念1.1什么是？是Vue3中CompositionAPI的编译时语法糖，它通过简化组件声明方式，显著减少样板代码，提供更符合直觉的开发体验。1.2设计目标与优势目标实现方式优势减少样板代码自动暴露顶层绑定代码更简洁提升开发体验更自然的响应式写法开发更高效更好的类型支持原生TypeScript集成类型安全编译时优化编译阶段处理运行时更高
CG-05 角度传感器转动灵敏寿命长可长期用在灰尘等恶劣环境
产品概述本产品采用非接触原理360度传感，机械轴传动采用两个双密封式轴承，转动灵敏度高。连接轴采用不锈钢304制造，品质出色。该产品可取代早期塑料电阻产品，寿命长，能长期使用于灰尘等恶劣环境。功能特点◆检测精度高，系统采用低功耗节能设计，数字处理技术◆量程宽，稳定性好◆数据信息显示线性度好，信号传输距离长，抗外界干扰能力强适用范围角度传感器对角度有着极强的角度分辨率，对转动的位置进行稳定的信号输出
Ubuntu挂载新硬盘
Ubuntu挂载新硬盘的方法1、检查硬盘,确保系统能够正确识别它。可以使用以下命令查看已连接的硬盘列表：sudofdisk-l确保找到您要挂载的硬盘设备（例如，/dev/sdb）。2、创建挂载点：在Ubuntu系统中，通常将硬盘挂载到一个目录中。执行以下命令来创建挂载点目录：sudomkdir/mysdb这将在根目录创建名为"mysdb"的目录作为挂载点。3、执行以下命令来挂载硬盘到挂载点：sud
FastJSON 解析错误分析与解决方案小屁孩大帅-杨一凡服务器 linux 前端运维
常见原因及解决方案1.数据为空或非JSON格式原因：输入数据可能为空字符串、null或其他非JSON格式内容。解决方案：在解析前检查数据是否有效。if(jsonStr!=null&&!jsonStr.trim().isEmpty()){//检查是否以JSON对象或数组的符号开头if(jsonStr.trim().startsWith("{")||jsonStr.trim().startsWith(
【重构推荐系统】国产大模型驱动的电商个性化推荐完整实战：架构设计、推理优化与在线部署闭环观熵国产大模型部署实战全流程指南重构人工智能 Agent 智能体落地方案
个人简介作者简介：全栈研发，具备端到端系统落地能力，专注大模型的压缩部署、多模态理解与Agent架构设计。热爱“结构”与“秩序”，相信复杂系统背后总有简洁可控的可能。我叫观熵。不是在控熵，就是在观测熵的流动个人主页：观熵个人邮箱：[email protected]座右铭：愿科技之光，不止照亮智能，也照亮人心！专栏导航观熵系列专栏导航：AI前沿探索：从大模型进化、多模态交互、AIGC内容生成，到
MySQL事务深度解析：原理、优化及最佳实践木木丰 mysql mysql 数据库 java windows
MySQL中的事务（Transaction）是数据库操作的基本单位，它代表着一组逻辑上相互关联的操作，要么全部成功，要么全部失败。这种“要么全做，要么全不做”的特性确保了数据库的完整性和一致性。事务在MySQL中扮演着至关重要的角色，特别是在处理复杂业务逻辑和并发访问时。下面将详细探讨MySQL事务的概念、使用方法、注意事项以及在实际应用中的最佳实践。一、事务的概念事务是一个不可分割的工作逻辑单元
游戏研发高效利器：SVN资源动态项目管理解决方案还债大湿兄游戏项目管理
一、问题背景与解决方案传统资源分发痛点：人工打包耗时：平均每次版本发布需2小时版本隔离：不同团队无法同时使用多个版本资源冲突：美术/QA/策划资源版本不一致动态管理方案优势：二、系统核心流程//完整工作流控制器voidGameResourceManager::executeFullWorkflow(){//1.凭证验证if(!validateCredentials()){showError("认证
深入详解：决策树算法的概念、原理、实现与应用场景猿享天开算法决策树机器学习
深入详解：决策树算法的概念、原理、实现与应用场景决策树（DecisionTree）是机器学习中一种直观且广泛应用的监督学习算法，适用于分类和回归任务。其树形结构易于理解，特别适合初学者。本文将从概念、原理、实现到应用场景，全面讲解决策树，并通过流程图和可视化示例增强理解，通俗易懂，帮助小白快速掌握决策树算法相关知识。1.决策树的概念1.1什么是决策树？决策树通过一系列条件判断（决策节点）将输入数据
ArkTS与仓颉语言的深度解析（鸿蒙操作系统多设备）爱学习的小齐哥哥仓颉华为仓颉 HarmonyOS5
一、引言随着物联网和智能设备的飞速发展，多设备协同开发成为当前软件开发领域的重要课题。鸿蒙操作系统作为面向全场景的分布式操作系统，为开发者提供了ArkTS和仓颉语言两种强大的开发工具，助力实现高效的多设备应用开发。本文将全面剖析这两种语言在鸿蒙多设备开发中的应用，探讨其优势、开发环境、实现一次开发多端部署的方法以及在不同设备上的性能表现和适配策略，并结合智能驾驶应用场景进行实例分析。二、ArkTS
FB-OCC: 3D Occupancy Prediction based on Forward-BackwardView Transformation justtoomuchforyou 智驾
NVidia，CVPR20233DOccupancyPredictionChallengeworkshoppaper：https://arxiv.org/pdf/2307.1492code：https://github.com/NVlabs/FB-BEV大参数量imagebackboneInternImage-H，1B外部数据集预训练：object365nuscenes：有点云label，强化网络
[学习] PID算法原理与实践（代码示例）极客不孤独学习算法 c语言
PID算法原理与实践文章目录PID算法原理与实践一、PID算法原理1.1PID算法概述1.定义2.应用领域3.核心目标1.2基本原理1.3数学表达离散化实现（适用于数字控制）二、实践案例（C语言）1.电机转速控制2.温度控制系统3.时钟驯服系统三、常见问题与优化1.积分饱和（Windup）问题2.噪声干扰问题3.非线性系统适配问题四、扩展方向1.数字PID与模拟PID的差异2.变参数PID（如增益
[学习] C语言编程中线程安全的实现方法（示例）极客不孤独学习 c语言安全
C语言编程中线程安全的实现方法在多线程编程中，线程安全（ThreadSafety）是一个非常重要的概念。当多个线程同时访问共享资源时，如果没有合理的同步机制，就可能导致数据竞争、死锁甚至程序崩溃。本文将详细介绍在C语言中如何实现线程安全的几种主要方式，并提供可以实际运行的代码示例。文章目录C语言编程中线程安全的实现方法一、什么是线程安全？二、C语言中线程安全的实现方式方法一：互斥锁（Mutex）✅
eclipse maven IXHONG eclipse
eclipse中使用maven插件的时候，运行run as maven build的时候报错 -Dmaven.multiModuleProjectDirectory system propery is not set. Check $M2_HOME environment variable and mvn script match. 可以设一个环境变量M2_HOME指
timer cancel方法的一个小实例 alleni123 多线程 timer
package com.lj.timer; import java.util.Date; import java.util.Timer; import java.util.TimerTask; public class MyTimer extends TimerTask { private int a; private Timer timer; pub
MySQL数据库在Linux下的安装 ducklsl mysql
1.建好一个专门放置MySQL的目录 /mysql/db数据库目录 /mysql/data数据库数据文件目录 2.配置用户，添加专门的MySQL管理用户 >groupadd mysql ----添加用户组 >useradd -g mysql mysql ----在mysql用户组中添加一个mysql用户 3.配置，生成并安装MySQL >cmake -D
spring------>>cvc-elt.1: Cannot find the declaration of element Array_06 spring bean
将-------- <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http://www.w3
maven发布第三方jar的一些问题 cugfy maven
maven中发布第三方jar到nexus仓库使用的是 deploy:deploy-file命令有许多参数，具体可查看 http://maven.apache.org/plugins/maven-deploy-plugin/deploy-file-mojo.html 以下是一个例子： mvn deploy:deploy-file -DgroupId=xpp3
MYSQL下载及安装 357029540 mysql
好久没有去安装过MYSQL，今天自己在安装完MYSQL过后用navicat for mysql去厕测试链接的时候出现了10061的问题，因为的的MYSQL是最新版本为5.6.24，所以下载的文件夹里没有my.ini文件，所以在网上找了很多方法还是没有找到怎么解决问题，最后看到了一篇百度经验里有这个的介绍，按照其步骤也完成了安装，在这里给大家分享下这个链接的地址
ios TableView cell的布局张亚雄 tableview
cell.imageView.image = [UIImage imageNamed:[imageArray objectAtIndex:[indexPath row]]]; CGSize itemSize = CGSizeMake(60, 50); &nbs
Java编码转义 adminjun java 编码转义
import java.io.UnsupportedEncodingException; /** * 转换字符串的编码 */ public class ChangeCharset { /** 7位ASCII字符，也叫作ISO646-US、Unicode字符集的基本拉丁块 */ public static final Strin
Tomcat 配置和spring aijuans spring
简介 Tomcat启动时，先找系统变量CATALINA_BASE，如果没有，则找CATALINA_HOME。然后找这个变量所指的目录下的conf文件夹，从中读取配置文件。最重要的配置文件：server.xml 。要配置tomcat，基本上了解server.xml，context.xml和web.xml。 Server.xml -- tomcat主
Java打印当前目录下的所有子目录和文件 ayaoxinchao 递归 File
其实这个没啥技术含量，大湿们不要操笑哦，只是做一个简单的记录，简单用了一下递归算法。 import java.io.File; /** * @author Perlin * @date 2014-6-30 */ public class PrintDirectory { public static void printDirectory(File f
linux安装mysql出现libs报冲突解决 BigBird2012 linux
linux安装mysql出现libs报冲突解决安装mysql出现 file /usr/share/mysql/ukrainian/errmsg.sys from install of MySQL-server-5.5.33-1.linux2.6.i386 conflicts with file from package mysql-libs-5.1.61-4.el6.i686
jedis连接池使用实例 bijian1013 redis jedis连接池 jedis
实例代码： package com.bijian.study; import java.util.ArrayList; import java.util.List; import redis.clients.jedis.Jedis; import redis.clients.jedis.JedisPool; import redis.clients.jedis.JedisPoo
关于朋友 bingyingao 朋友兴趣爱好维持
成为朋友的必要条件：志相同，道不合，可以成为朋友。譬如马云、周星驰一个是商人，一个是影星，可谓道不同，但都很有梦想，都要在各自领域里做到最好，当他们遇到一起，互相欣赏，可以畅谈两个小时。志不同，道相合，也可以成为朋友。譬如有时候看到两个一个成绩很好每次考试争做第一，一个成绩很差的同学是好朋友。他们志向不相同，但他
【Spark七十九】Spark RDD API一 bit1129 spark
aggregate package spark.examples.rddapi import org.apache.spark.{SparkConf, SparkContext} //测试RDD的aggregate方法 object AggregateTest { def main(args: Array[String]) { val conf = new Spar
ktap 0.1 released bookjovi kernel tracing
Dear, I'm pleased to announce that ktap release v0.1, this is the first official release of ktap project, it is expected that this release is not fully functional or very stable and we welcome bu
能保存Properties文件注释的Properties工具类 BrokenDreams properties
今天遇到一个小需求：由于java.util.Properties读取属性文件时会忽略注释，当写回去的时候，注释都没了。恰好一个项目中的配置文件会在部署后被某个Java程序修改一下，但修改了之后注释全没了，可能会给以后的参数调整带来困难。所以要解决这个问题。 &nb
读《研磨设计模式》-代码笔记-外观模式-Facade bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* * 百度百科的定义： * Facade（外观）模式为子系统中的各类（或结构与方法）提供一个简明一致的界面， * 隐藏子系统的复杂性，使子系统更加容易使用。他是为子系统中的一组接口所提供的一个一致的界面 * * 可简单地
After Effects教程收集 cherishLC After Effects
1、中文入门 http://study.163.com/course/courseMain.htm?courseId=730009 2、videocopilot英文入门教程（中文字幕） http://www.youku.com/playlist_show/id_17893193.html 英文原址： http://www.videocopilot.net/basic/ 素
Linux Apache 安装过程 crabdave apache
Linux Apache 安装过程下载新版本： apr-1.4.2.tar.gz（下载网站：http://apr.apache.org/download.cgi） apr-util-1.3.9.tar.gz（下载网站：http://apr.apache.org/download.cgi） httpd-2.2.15.tar.gz（下载网站：http://httpd.apac
Shell学习之变量赋值和引用 daizj shell 变量引用赋值
本文转自：http://www.cnblogs.com/papam/articles/1548679.html Shell编程中，使用变量无需事先声明，同时变量名的命名须遵循如下规则：首个字符必须为字母（a-z，A-Z）中间不能有空格，可以使用下划线（_）不能使用标点符号不能使用bash里的关键字（可用help命令查看保留关键字）需要给变量赋值时，可以这么写：
Java SE 第一讲（Java SE入门、JDK的下载与安装、第一个Java程序、Java程序的编译与执行） dcj3sjt126com java jdk
Java SE 第一讲： Java SE：Java Standard Edition Java ME: Java Mobile Edition Java EE：Java Enterprise Edition Java是由Sun公司推出的（今年初被Oracle公司收购）。收购价格：74亿美金 J2SE、J2ME、J2EE JDK：Java Development
YII给用户登录加上验证码 dcj3sjt126com yii
1、在SiteController中添加如下代码： /** * Declares class-based actions. */ public function actions() { return array( // captcha action renders the CAPTCHA image displ
Lucene使用说明 dyy_gusi Lucene search 分词器
Lucene使用说明 1、lucene简介 1.1、什么是lucene Lucene是一个全文搜索框架，而不是应用产品。因此它并不像baidu或者googleDesktop那种拿来就能用，它只是提供了一种工具让你能实现这些产品和功能。 1.2、lucene能做什么要回答这个问题，先要了解lucene的本质。实际
学习编程并不难,做到以下几点即可! gcq511120594 数据结构编程算法
不论你是想自己设计游戏，还是开发iPhone或安卓手机上的应用，还是仅仅为了娱乐，学习编程语言都是一条必经之路。编程语言种类繁多，用途各异，然而一旦掌握其中之一，其他的也就迎刃而解。作为初学者，你可能要先从Java或HTML开始学，一旦掌握了一门编程语言，你就发挥无穷的想象，开发各种神奇的软件啦。 1、确定目标学习编程语言既充满乐趣，又充满挑战。有些花费多年时间学习一门编程语言的大学生到
Java面试十问之三：Java与C++内存回收机制的差别 HNUlanwei java C++finalize()堆栈内存回收
大家知道， Java 除了那 8 种基本类型以外，其他都是对象类型（又称为引用类型）的数据。 JVM 会把程序创建的对象存放在堆空间中，那什么又是堆空间呢？其实，堆（ Heap）是一个运行时的数据存储区，从它可以分配大小各异的空间。一般，运行时的数据存储区有堆（ Heap）和堆栈（ Stack），所以要先看它们里面可以分配哪些类型的对象实体，然后才知道如何均衡使用这两种存储区。一般来说，栈中存放的
第二章 Nginx+Lua开发入门 jinnianshilongnian nginx lua
Nginx入门本文目的是学习Nginx+Lua开发，对于Nginx基本知识可以参考如下文章： nginx启动、关闭、重启 http://www.cnblogs.com/derekchen/archive/2011/02/17/1957209.html agentzh 的 Nginx 教程 http://openresty.org/download/agentzh-nginx-tutor
MongoDB windows安装基本命令 liyonghui160com
windows安装安装目录： D:\MongoDB\ 新建目录 D:\MongoDB\data\db 4.启动进城： cd D:\MongoDB\bin mongod -dbpath D:\MongoDB\data\db &n
Linux下通过源码编译安装程序 pda158 linux
一、程序的组成部分　　Linux下程序大都是由以下几部分组成：　　二进制文件：也就是可以运行的程序文件　　库文件：就是通常我们见到的lib目录下的文件　　配置文件：这个不必多说，都知道　　帮助文档：通常是我们在linux下用man命令查看的命令的文档　　二、linux下程序的存放目录　　linux程序的存放目录大致有三个地方：　　/etc, /b
WEB开发编程的职业生涯４个阶段 shw3588 编程 Web 工作生活
觉得自己什么都会 2007年从学校毕业，凭借自己原创的ASP毕业设计，以为自己很厉害似的，信心满满去东莞找工作，找面试成功率确实很高，只是工资不高，但依旧无法磨灭那过分的自信，那时候什么考勤系统、什么OA系统、什么ERP，什么都觉得有信心，这样的生涯大概持续了约一年。根本不是自己想的那样 2008年开始接触很多工作相关的东西，发现太多东西自己根本不会，都需要去学，不管是asp还是js，
遭遇jsonp同域下变作post请求的坑 vb2005xu jsonp 同域post
今天迁移一个站点时遇到一个坑爹问题,同一个jsonp接口在跨域时都能调用成功,但是在同域下调用虽然成功,但是数据却有问题. 此处贴出我的后端代码片段 $mi_id = htmlspecialchars(trim($_GET['mi_id '])); $mi_cv = htmlspecialchars(trim($_GET['mi_cv '])); 贴出我前端代码片段: $.aj