人工智能爱好者俱乐部

干货丨不可错过的大数据学习资源推荐

今天为大家推荐一些翻译整理的大数据相关的非常棒的学习资源，希望能给大家一些帮助。

关系数据库管理系统（RDBMS）

MySQL：世界最流行的开源数据库；
PostgreSQL：世界最先进的开源数据库；
Oracle 数据库：对象-关系型数据库管理系统。

框架

Apache Hadoop：分布式处理架构，结合了 MapReduce（并行处理）、YARN（作业调度）和HDFS（分布式文件系统）；
Tigon：高吞吐量实时流处理框架。

分布式编程

AddThis Hydra ：最初在AddThis上开发的分布式数据处理和存储系统；
AMPLab SIMR：用在Hadoop MapReduce v1上运行Spark；
Apache Beam：为统一的模型以及一套用于定义和执行数据处理工作流的特定SDK语言；
Apache Crunch：一个简单的Java API，用于执行在普通的MapReduce实现时比较单调的连接、数据聚合等任务；
Apache DataFu：由LinkedIn开发的针对Hadoop and 和Pig的用户定义的函数集合；
Apache Flink：具有高性能的执行时间和自动程序优化；
Apache Gora：内存中的数据模型和持久性框架；
Apache Hama：BSP（整体同步并行）计算框架；
Apache MapReduce ：在集群上使用并行、分布式算法处理大数据集的编程模型；
Apache Pig ：Hadoop中，用于处理数据分析程序的高级查询语言；
Apache REEF ：用来简化和统一低层大数据系统的保留性评估执行框架；
Apache S4 ：S4中流处理与实现的框架；
Apache Spark ：内存集群计算框架；
Apache Spark Streaming ：流处理框架，同时是Spark的一部分；
Apache Storm ：Twitter流处理框架，也可用于YARN；
Apache Samza ：基于Kafka和YARN的流处理框架；
Apache Tez ：基于YARN，用于执行任务中的复杂DAG（有向无环图）；
Apache Twill ：基于YARN的抽象概念，用于减少开发分布式应用程序的复杂度；
Cascalog：数据处理和查询库；
Cheetah ：在MapReduce之上的高性能、自定义数据仓库；
Concurrent Cascading ：在Hadoop上的数据管理/分析框架；
Damballa Parkour ：用于Clojure的MapReduce库；
Datasalt Pangool ：可选择的MapReduce范例；
DataTorrent StrAM ：为实时引擎，用于以尽可能畅通的方式、最小的开支和对性能最小的影响，实现分布式、异步、实时的内存大数据计算；
Facebook Corona ：为Hadoop做优化处理，从而消除单点故障；
Facebook Peregrine ：MapReduce框架；
Facebook Scuba ：分布式内存数据存储；
Google Dataflow ：创建数据管道，以帮助其分析框架；
Netflix PigPen ：为MapReduce，用于编译成Apache Pig；
Nokia Disco ：由Nokia开发的MapReduc获取、转换和分析数据；
Google MapReduce ：MapReduce框架；
Google MillWheel ：容错流处理框架；
JAQL ：用于处理结构化、半结构化和非结构化数据工作的声明性编程语言；
Kite ：为一组库、工具、实例和文档集，用于使在Hadoop的生态系统上建立系统更加容易；
Metamarkets Druid ：用于大数据集的实时e框架；
Onyx ：分布式云计算；
Pinterest Pinlater ：异步任务执行系统；
Pydoop ：用于Hadoop的Python MapReduce和HDFS API；
Rackerlabs Blueflood ：多租户分布式测度处理系统；
Stratosphere ：通用集群计算框架；
Streamdrill ：用于计算基于不同时间窗口的事件流的活动，并找到最活跃的一个；
Tuktu ：易于使用的用于分批处理和流计算的平台，通过Scala、 Akka和Play所建；
Twitter Scalding：基于Cascading，用于Map Reduce工作的Scala库；
Twitter Summingbird ：在Twitter上使用Scalding和Storm串流MapReduce；
Twitter TSAR ：Twitter上的时间序列聚合器。

分布式文件系统

Apache HDFS：在多台机器上存储大型文件的方式；
BeeGFS：以前是FhGFS，并行分布式文件系统；
Ceph Filesystem：设计的软件存储平台；
Disco DDFS：分布式文件系统；
Facebook Haystack：对象存储系统；
Google Colossus：分布式文件系统(GFS2)；
Google GFS：分布式文件系统；
Google Megastore：可扩展的、高度可用的存储；
GridGain：兼容GGFS、Hadoop内存的文件系统；
Lustre file system：高性能分布式文件系统；
Quantcast File System QFS：开源分布式文件系统；
Red Hat GlusterFS：向外扩展的附网存储（Network-attached Storage）文件系统；
Seaweed-FS：简单的、高度可扩展的分布式文件系统；
Alluxio：以可靠的存储速率在跨集群框架上文件共享；
Tahoe-LAFS：分布式云存储系统；

文件数据模型

Actian Versant：商用的面向对象数据库管理系统；
Crate Data：是一个开源的大规模可扩展的数据存储，需要零管理模式；
Facebook Apollo：Facebook的Paxos算法，类似于NoSQL数据库；
jumboDB：基于Hadoop的面向文档的数据存储；
LinkedIn Espresso：可横向扩展的面向文档的NoSQL数据存储；
MarkLogic：模式不可知的企业版NoSQL数据库技术；
MongoDB：面向文档的数据库系统；
RavenDB：一个事务性的，开源文档数据库；
RethinkDB：支持连接查询和群组依据等查询的文档型数据库。

Key Map 数据模型

注意：业内存在一些术语混乱，有两个不同的东西都叫做“列式数据库”。这里列出的有一些是围绕“key-map”数据模型而建的分布式、持续型数据库，其中所有的数据都有（可能综合了）键，并与映射中的键-值对相关联。在一些系统中，多个这样的值映射可以与键相关联，并且这些映射被称为“列族”（具有映射值的键被称为“列”）。

另一组也可称为“列式数据库”的技术因其存储数据的方式而有别于前一组，它在磁盘上或在存储器中——而不是以传统方式，即所有既定键的键值都相邻着、逐行存储。这些系统也彼此相邻来存储所有列值，但是要得到给定列的所有值却不需要以前那么繁复的工作。

前一组在这里被称为“key map数据模型”，这两者和Key-value 数据模型之间的界限是相当模糊的。后者对数据模型有更多的存储格式，可在列式数据库中列出。若想了解更多关于这两种模型的区分，可阅读Daniel Abadi的博客：Distinguishing two major types of Column Stores。

Apache Accumulo：内置在Hadoop上的分布式键/值存储；
Apache Cassandra：由BigTable授权，面向列的分布式数据存储；
Apache HBase：由BigTable授权，面向列的分布式数据存储；
Facebook HydraBase：Facebook所开发的HBase的衍化品；
Google BigTable：面向列的分布式数据存储；
Google Cloud Datastore：为完全管理型的无模式数据库，用于存储在BigTable上非关系型数据；
Hypertable：由BigTable授权，面向列的分布式数据存储；
InfiniDB：通过MySQL的接口访问，并使用大规模并行处理进行并行查询；
Tephra：用于HBase处理；
Twitter Manhattan：Twitter的实时、多租户分布式数据库。

键-值数据模型

Aerospike：支持NoSQL的闪存优化，数据存储在内存。开源，“'C'（不是Java或Erlang）中的服务器代码可精确地调整从而避免上下文切换和内存拷贝”。
Amazon DynamoDB：分布式键/值存储，Dynamo论文的实现；
Edis：为替代Redis的协议兼容的服务器；
ElephantDB：专门研究Hadoop中数据导出的分布式数据库；
EventStore：分布式时间序列数据库；
GridDB：适用于存储在时间序列中的传感器数据；
LinkedIn Krati：简单的持久性数据存储，拥有低延迟和高吞吐量；
Linkedin Voldemort：分布式键/值存储系统；
Oracle NoSQL Database：Oracle公司开发的分布式键值数据库；
Redis：内存中的键值数据存储；
Riak：分散式数据存储；
Storehaus：Twitter开发的异步键值存储的库；
Tarantool：一个高效的NoSQL数据库和Lua应用服务器；
TiKV：由Google Spanner和HBase授权，Rust提供技术支持的分布式键值数据库；
TreodeDB：可复制、共享的键-值存储，能提供多行原子写入。

图形数据模型

Apache Giraph：基于Hadoop的Pregel实现；
Apache Spark Bagel：可实现Pregel，为Spark的一部分；
ArangoDB：多层模型分布式数据库；
DGraph：一个可扩展的、分布式、低时延、高吞吐量的图形数据库，旨在为Google生产水平规模和吞吐量提供足够的低延迟，用于TB级的结构化数据的实时用户查询；
Facebook TAO：TAO是facebook广泛用来存储和服务于社交图形的分布式数据存储；
GCHQ Gaffer：GCHQ中的Gaffer是一个易于存储大规模图形的框架，其中节点和边缘都有统计数据；
Google Cayley：开源图形数据库；
Google Pregel ：图形处理框架；
GraphLab PowerGraph：核心C ++ GraphLab API和建立在GraphLab API之上的高性能机器学习和数据挖掘工具包的集合；
GraphX：Spark中的弹性分布式图形系统；
Gremlin：图形追踪语言；
Infovore：以RDF为中心的Map / Reduce框架；
Intel GraphBuilder：在Hadoop上构建大规模图形的工具；
MapGraph：用于在GPU上大规模并行图形处理；
Neo4j：完全用Java写入的图形数据库；
OrientDB：文档和图形数据库；
Phoebus：大型图形处理框架；
Titan：建于Cassandra的分布式图形数据库；
Twitter FlockDB：分布式图形数据库。

NewSQL数据库

Actian Ingres：由商业支持，开源的SQL关系数据库管理系统；
Amazon RedShift：基于PostgreSQL的数据仓库服务；
BayesDB：面向统计数值的SQL数据库；
CitusDB：通过分区和复制横向扩展PostgreSQL；
Cockroach：可扩展、地址可复制、交易型的数据库；
Datomic：旨在产生可扩展、灵活的智能应用的分布式数据库；
FoundationDB：由F1授意的分布式数据库；
Google F1：建立在Spanner上的分布式SQL数据库；
Google Spanner：全球性的分布式半关系型数据库；
H-Store：是一个实验性主存并行数据库管理系统，用于联机事务处理（OLTP）应用的优化；
Haeinsa：基于Percolator，HBase的线性可扩展多行多表交易库；
HandlerSocket：MySQL/MariaDB的NoSQL插件；
InfiniSQL：无限可扩展的RDBMS；
MemSQL：内存中的SQL数据库，其中有优化的闪存列存储；
NuoDB：SQL / ACID兼容的分布式数据库；
Oracle TimesTen in-Memory Database：内存中具有持久性和可恢复性的关系型数据库管理系统；
Pivotal GemFire XD：内存中低延时的分布式SQL数据存储，可为内存列表数据提供SQL接口，在HDFS中较持久化；
SAP HANA：是在内存中面向列的关系型数据库管理系统；
SenseiDB：分布式实时半结构化的数据库；
Sky：用于行为数据的灵活、高性能分析的数据库；
SymmetricDS：用于文件和数据库同步的开源软件；
Map-D：为GPU内存数据库，也为大数据分析和可视化平台；
TiDB：TiDB是分布式SQL数据库，基于谷歌F1的设计灵感；
VoltDB：自称为最快的内存数据库。

列式数据库

注意：请在键-值数据模型阅读相关注释。

Columnar Storage：解释什么是列存储以及何时会需要用到它；
Actian Vector：面向列的分析型数据库；
C-Store：面向列的DBMS；
MonetDB：列存储数据库；
Parquet：Hadoop的列存储格式；
Pivotal Greenplum：专门设计的、专用的分析数据仓库，类似于传统的基于行的工具，提供了一个列式工具；
Vertica：用来管理大规模、快速增长的大量数据，当用于数据仓库时，能够提供非常快的查询性能；
Google BigQuery ：谷歌的云产品，由其在Dremel的创始工作提供支持；
Amazon Redshift ：亚马逊的云产品，它也是基于柱状数据存储后端。

时间序列数据库

Cube：使用MongoDB来存储时间序列数据；
Axibase Time Series Database：在HBase之上的分布式时间序列数据库，它包括内置的Rule Engine、数据预测和可视化；
Heroic：基于Cassandra和Elasticsearch的可扩展的时间序列数据库；
InfluxDB：分布式时间序列数据库；
Kairosdb：类似于OpenTSDB但会考虑到Cassandra；
OpenTSDB：在HBase上的分布式时间序列数据库；
Prometheus：一种时间序列数据库和服务监测系统；
Newts：一种基于Apache Cassandra的时间序列数据库。

类SQL处理

Actian SQL for Hadoop：高性能交互式的SQL，可访问所有的Hadoop数据；
Apache Drill：由Dremel授意的交互式分析框架；
Apache HCatalog：Hadoop的表格和存储管理层；
Apache Hive：Hadoop的类SQL数据仓库系统；
Apache Optiq：一种框架，可允许高效的查询翻译，其中包括异构性及联合性数据的查询；
Apache Phoenix：Apache Phoenix 是 HBase 的 SQL 驱动；
Cloudera Impala：由Dremel授意的交互式分析框架；
Concurrent Lingual：Cascading中的类SQL查询语言；
Datasalt Splout SQL：用于大数据集的完整的SQL查询工具；
Facebook PrestoDB：分布式SQL查询工具；
Google BigQuery：交互式分析框架，Dremel的实现；
Pivotal HAWQ：Hadoop的类SQL的数据仓库系统；
RainstorDB：用于存储大规模PB级结构化和半结构化数据的数据库；
Spark Catalyst：用于Spark和Shark的查询优化框架；
SparkSQL：使用Spark操作结构化数据；
Splice Machine：一个全功能的Hadoop上的SQL RDBMS，并带有ACID事务；
Stinger：用于Hive的交互式查询；
Tajo：Hadoop的分布式数据仓库系统；
Trafodion：为企业级的SQL-on-HBase针对大数据的事务或业务工作负载的解决方案。

数据摄取

Amazon Kinesis：大规模数据流的实时处理；
Apache Chukwa：数据采集系统；
Apache Flume：管理大量日志数据的服务；
Apache Kafka：分布式发布-订阅消息系统；
Apache Sqoop：在Hadoop和结构化的数据存储区之间传送数据的工具；
Cloudera Morphlines：帮助 Solr、HBase和HDFS完成ETL的框架；
Facebook Scribe：流日志数据聚合器；
Fluentd：采集事件和日志的工具；
Google Photon：实时连接多个数据流的分布式计算机系统，具有高可扩展性和低延迟性；
Heka：开源流处理软件系统；
HIHO：用Hadoop连接不同数据源的框架；
Kestrel：分布式消息队列系统；
LinkedIn Databus：对数据库更改捕获的事件流；
LinkedIn Kamikaze：压缩已分类整型数组的程序包；
LinkedIn White Elephant：日志聚合器和仪表板；
Logstash：用于管理事件和日志的工具；
Netflix Suro：像基于Chukwa 的Storm和Samza一样的日志聚合器；
Pinterest Secor：是实现Kafka日志持久性的服务；
Linkedin Gobblin：LinkedIn的通用数据摄取框架；
Skizze：是一种数据存储略图，使用概率性数据结构来处理计数、略图等相关的问题；
StreamSets Data Collector：连续大数据采集的基础设施，可简单地使用IDE。

服务编程

Akka Toolkit：JVM中分布性、容错事件驱动应用程序的运行时间；
Apache Avro：数据序列化系统；
Apache Curator：Apache ZooKeeper的Java库；
Apache Karaf：在任何OSGi框架之上运行的OSGi运行时间；
Apache Thrift：构建二进制协议的框架；
Apache Zookeeper：流程管理集中式服务；
Google Chubby：一种松耦合分布式系统锁服务；
Linkedin Norbert：集群管理器；
OpenMPI：消息传递框架；
Serf：服务发现和协调的分散化解决方案；
Spotify Luigi：一种构建批处理作业的复杂管道的Python包，它能够处理依赖性解析、工作流管理、可视化、故障处理、命令行一体化等等问题；
Spring XD：数据摄取、实时分析、批量处理和数据导出的分布式、可扩展系统；
Twitter Elephant Bird：LZO压缩数据的工作库；
Twitter Finagle：JVM的异步网络堆栈。

调度

Apache Aurora：在Apache Mesos之上运行的服务调度程序；
Apache Falcon：数据管理框架；
Apache Oozie：工作流作业调度程序；
Chronos：分布式容错调度；
Linkedin Azkaban：批处理工作流作业调度；
Schedoscope：Hadoop作业敏捷调度的Scala DSL；
Sparrow：调度平台；
Airflow：一个以编程方式编写、调度和监控工作流的平台。

机器学习

Apache Mahout：Hadoop的机器学习库；
brain：JavaScript中的神经网络；
Cloudera Oryx：实时大规模机器学习；
Concurrent Pattern：Cascading的机器学习库；
convnetjs：Javascript中的机器学习，在浏览器中训练卷积神经网络（或普通网络）；
Decider：Ruby中灵活、可扩展的机器学习；
ENCOG：支持多种先进算法的机器学习框架，同时支持类的标准化和处理数据；
etcML：机器学习文本分类；
Etsy Conjecture：Scalding中可扩展的机器学习；
Google Sibyl：Google中的大规模机器学习系统；
GraphLab Create：Python的机器学习平台，包括ML工具包、数据工程和部署工具的广泛集合；
H2O：Hadoop统计性的机器学习和数学运行时间；
MLbase：用于BDAS堆栈的分布式机器学习库；
MLPNeuralNet：针对iOS和Mac OS X的快速多层感知神经网络库；
MonkeyLearn：使文本挖掘更为容易，从文本中提取分类数据；
nupic：智能计算的Numenta平台，它是一个启发大脑的机器智力平台，基于皮质学习算法的精准的生物神经网络；
PredictionIO：建于Hadoop、Mahout和Cascading上的机器学习服务器；
SAMOA：分布式流媒体机器学习框架；
scikit-learn：scikit-learn为Python中的机器学习；
Spark MLlib：Spark中一些常用的机器学习（ML）功能的实现；
Vowpal Wabbit：微软和雅虎发起的学习系统；
WEKA：机器学习软件套件；
BidMach：CPU和加速GPU的机器学习库。

基准测试

Apache Hadoop Benchmarking：测试Hadoop性能的微基准；
Berkeley SWIM Benchmark：现实大数据工作负载基准测试；
Intel HiBench：Hadoop基准测试套件；
PUMA Benchmarking：MapReduce应用的基准测试套件；
Yahoo Gridmix3：雅虎工程师团队的Hadoop集群基准测试。

安全性

Apache Knox Gateway：Hadoop集群安全访问的单点；
Apache Sentry：存储在Hadoop的数据安全模块。

系统部署

Apache Ambari：Hadoop管理的运作框架；
Apache Bigtop：Hadoop生态系统的部署框架；
Apache Helix：集群管理框架；
Apache Mesos：集群管理器；
Apache Slider：一种YARN应用，用来部署YARN中现有的分布式应用程序；
Apache Whirr：运行云服务的库集；
Apache YARN：集群管理器；
Brooklyn：用于简化应用程序部署和管理的库；
Buildoop：基于Groovy语言，和Apache BigTop类似；
Cloudera HUE：和Hadoop进行交互的Web应用程序；
Facebook Prism：多数据中心复制系统；
Google Borg：作业调度和监控系统；
Google Omega：作业调度和监控系统；
Hortonworks HOYA：可在YARN上部署HBase集群的应用；
Marathon：用于长期运行服务的Mesos框架。

应用程序

Adobe spindle：使用Scala、Spark和Parquet处理的下一代web分析；
Apache Kiji：基于HBase，实时采集和分析数据的框架；
Apache Nutch：开源网络爬虫；
Apache OODT：用于NASA科学档案中数据的捕获、处理和共享；
Apache Tika：内容分析工具包；
Argus：时间序列监测和报警平台；
Countly：基于Node.js和MongoDB，开源的手机和网络分析平台；
Domino：运行、规划、共享和部署模型——没有任何基础设施；
Eclipse BIRT：基于Eclipse的报告系统；
Eventhub：开源的事件分析平台；
Hermes：建于Kafka上的异步消息代理；
HIPI Library：在Hadoop's MapReduce上执行图像处理任务的API；
Hunk：Hadoop的Splunk分析；
Imhotep：大规模分析平台；
MADlib：RDBMS的用于数据分析的数据处理库；
Kylin：来自eBay的开源分布式分析工具；
PivotalR：Pivotal HD / HAWQ和PostgreSQL中的R；
Qubole：为自动缩放Hadoop集群，内置的数据连接器；
Sense：用于数据科学和大数据分析的云平台；
SnappyData：用于实时运营分析的分布式内存数据存储，提供建立在Spark单一集成集群中的数据流分析、OLTP（联机事务处理）和OLAP（联机分析处理）；
Snowplow：企业级网络和事件分析，由Hadoop、Kinesis、Redshift 和Postgres提供技术支持；
SparkR：Spark的R前端；
Splunk：用于机器生成的数据的分析；
Sumo Logic：基于云的分析仪，用于分析机器生成的数据；
Talend：用于YARN、Hadoop、HBASE、Hive、HCatalog和Pig的统一开源环境；
Warp：利用大数据（OS X app）的实例查询工具。

搜索引擎与框架

Apache Lucene：搜索引擎库；
Apache Solr：用于Apache Lucene的搜索平台；
ElasticSearch：基于Apache Lucene的搜索和分析引擎；
Enigma.io：为免费增值的健壮性web应用，用于探索、筛选、分析、搜索和导出来自网络的大规模数据集；
Facebook Unicorn：社交图形搜索平台；
Google Caffeine：连续索引系统；
Google Percolator：连续索引系统；
TeraGoogle：大型搜索索引；
HBase Coprocessor：为Percolator的实现，HBase的一部分；
Lily HBase Indexer：快速、轻松地搜索存储在HBase的任何内容；
LinkedIn Bobo：完全由Java编写的分面搜索的实现，为Apache Lucene的延伸；
LinkedIn Cleo：为一个一个灵活的软件库，使得局部、无序、实时预输入的搜索实现了快速发展；
LinkedIn Galene：LinkedIn搜索架构；
LinkedIn Zoie：是用Java编写的实时搜索/索引系统；
Sphinx Search Server：全文搜索引擎

MySQL的分支和演化

Amazon RDS：亚马逊云的MySQL数据库；
Drizzle：MySQL的6.0的演化；
Google Cloud SQL：谷歌云的MySQL数据库；
MariaDB：MySQL的增强版嵌入式替代品；
MySQL Cluster：使用NDB集群存储引擎的MySQL实现；
Percona Server：MySQL的增强版嵌入式替代品；
ProxySQL：MySQL的高性能代理；
TokuDB：用于MySQL和 MariaDB的存储引擎；
WebScaleSQL：运行MySQL时面临类似挑战的几家公司，它们的工程师之间的合作。

PostgreSQL的分支和演化

Yahoo Everest - multi-peta-byte database / MPP derived by PostgreSQL.
HadoopDB：MapReduce和DBMS的混合体；
IBM Netezza：高性能数据仓库设备；
Postgres-XL：基于PostgreSQL，可扩展的开源数据库集群；
RecDB：完全建立在PostgreSQL内部的开源推荐引擎；
Stado：开源MPP数据库系统，只针对数据仓库和数据集市的应用程序；
Yahoo Everest：PostgreSQL可以推导多字节P比特数据库/MPP。

Memcached的分支和演化

Facebook McDipper：闪存的键/值缓存；
Facebook Memcached：Memcache的分支；
Twemproxy：Memcached和Redis的快速、轻型代理；
Twitter Fatcache：闪存的键/值缓存；
Twitter Twemcache：Memcache的分支。

嵌入式数据库

Actian PSQL：Pervasive Software公司开发的ACID兼容的DBMS，在应用程序中嵌入了优化；
BerkeleyDB：为键/值数据提供一个高性能的嵌入式数据库的一个软件库；
HanoiDB：Erlang LSM BTree存储；
LevelDB：谷歌写的一个快速键-值存储库，它提供了从字符串键到字符串值的有序映射；
LMDB：Symas开发的超快、超紧凑的键-值嵌入的式数据存储；
RocksDB：基于性LevelDB，用于快速存储的嵌入式持续性键-值存储。

商业智能

BIME Analytics：商业智能云平台；
Chartio：精益业务智能平台，用于可视化和探索数据；
datapine：基于云的自助服务商业智能工具；
Jaspersoft：功能强大的商业智能套件；
Jedox Palo：定制的商业智能平台；
Microsoft：商业智能软件和平台；
Microstrategy：商业智能、移动智能和网络应用软件平台；
Pentaho：商业智能平台；
Qlik：商业智能和分析平台；
Saiku：开源的分析平台；
SpagoBI：开源商业智能平台；
Tableau：商业智能平台；
Zoomdata：大数据分析；
Jethrodata：交互式大数据分析。

数据可视化

Airpal：用于PrestoDB的网页UI；
Arbor：利用网络工作者和jQuery的图形可视化库；
Banana：对存储在Kibana中Solr. Port的日志和时戳数据进行可视化；
Bokeh：一个功能强大的Python交互式可视化库，它针对要展示的现代web浏览器，旨在为D3.js风格的新奇的图形提供优雅简洁的设计，同时在大规模数据或流数据集中，通过高性能交互性来表达这种能力；
C3：基于D3可重复使用的图表库；
CartoDB：开源或免费增值的虚拟主机，用于带有强大的前端编辑功能和API的地理空间数据库；
chartd：只带Img标签的反应灵敏、兼容Retina的图表；
Chart.js：开源的HTML5图表可视化效果；
Chartist.js：另一个开源HTML5图表可视化效果；
Crossfilter：JavaScript库，用于在浏览器中探索多元大数据集，用Dc.js和D3.js.效果很好；
Cubism：用于时间序列可视化的JavaScript库；
Cytoscape：用于可视化复杂网络的JavaScript库；
DC.js：维度图表，和Crossfilter一起使用，通过D3.js呈现出来，它比较擅长连接图表/附加的元数据，从而徘徊在D3的事件附近；
D3：操作文件的JavaScript库；
D3.compose：从可重复使用的图表和组件构成复杂的、数据驱动的可视化；
D3Plus：一组相当强大的可重用的图表，还有D3.js的样式；
Echarts：百度企业场景图表；
Envisionjs：动态HTML5可视化；
FnordMetric：写SQL查询，返回SVG图表，而不是表；
Freeboard：针对IOT和其他Web混搭的开源实时仪表盘构建；
Gephi：屡获殊荣的开源平台，可视化和操纵大型图形和网络连接，有点像Photoshop，但是针对于图表，适用于Windows和Mac OS X；
Google Charts：简单的图表API；
Grafana：石墨仪表板前端、编辑器和图形组合器；
Graphite：可扩展的实时图表；
Highcharts：简单而灵活的图表API；
IPython：为交互式计算提供丰富的架构；
Kibana：可视化日志和时间标记数据；
Matplotlib：Python绘图；
Metricsgraphic.js：建立在D3之上的库，针对时间序列数据进行最优化；
NVD3：d3.js的图表组件；
Peity：渐进式SVG条形图，折线和饼图；
Plot.ly：易于使用的Web服务，它允许快速创建从热图到直方图等复杂的图表，使用图表Plotly的在线电子表格上传数据进行创建和设计；
Plotly.js：支持plotly的开源JavaScript图形库；
Recline：简单但功能强大的库，纯粹利用JavaScript和HTML构建数据应用；
Redash：查询和可视化数据的开源平台；
Shiny：针对R的Web应用程序框架；
Sigma.js：JavaScript库，专门用于图形绘制；
Vega：一个可视化语法；
Zeppelin：一个笔记本式的协作数据分析；
Zing Charts：用于大数据的JavaScript图表库。

物联网和传感器

TempoIQ：基于云的传感器分析；
2lemetry：物联网平台；
Pubnub：数据流网络；
ThingWorx：ThingWorx 是让企业快速创建和运行互联应用程序平台；
IFTTT：IFTTT 是一个被称为 “网络自动化神器” 的创新型互联网服务，它的全称是 If this then that，意思是“如果这样，那么就那样”；
Evrythng：Evrythng则是一款真正意义上的大众物联网平台，使得身边的很多产品变得智能化。

你可能感兴趣的:(干货丨不可错过的大数据学习资源推荐)

UniCloud 完整入门指南九情丶 uni-app 前端
UniCloud完整入门指南目录什么是UniCloud为什么选择UniCloud快速开始基础概念核心功能最佳实践常见问题高级功能详解开发工具部署和运维最新特性和更新什么是UniCloudUniCloud是DCloud推出的基于serverless模式和js编程的云开发平台。它让不会后端的前端工程师可以快速完成整栈开发，让开发者专注于业务实现，而无需关心服务器运维等繁琐事务。主要特点基于server
Git 规范化管理指南九情丶前端 gitee
Git规范化管理指南：打造优雅的协作流程本文将详细介绍如何在团队中规范化Git的使用，包括分支管理、提交规范、CodeReview流程等最佳实践。通过本文，您将学习到如何建立一个清晰、高效的Git工作流程。为什么需要Git规范化？在团队协作中，规范化的Git使用流程能带来以下好处：提高协作效率统一的分支命名便于理解和管理规范的提交信息方便追踪变更清晰的Review流程保证代码质量减少沟通成本标准化
vue项目打印网页功能-vue-print-nb 九情丶 vue.js 前端 javascript
Printtheentirepage描述:支持两种打印方式，直接打印页面HTML、打印URL简单易用，支持兼容Vue的浏览器版本在线Demo:测试DEMO地址安装:Vue2版本npminstallvue-print-nb--saveVue3版本npminstallvue3-print-nb--savev-printAPI使用方法打印整个页面：Printtheentirepage打印指定范围：Pri
NVM (Node Version Manager) 使用指南九情丶 node.js 前端
NVM(NodeVersionManager)使用指南简介NVM(NodeVersionManager)是一个用于管理多个Node.js版本的工具。它允许你在同一台计算机上安装和切换不同版本的Node.js。安装指南Windows安装下载安装包访问nvm-windowsreleases下载最新版本的nvm-setup.exe安装步骤运行nvm-setup.exe按照安装向导完成安装安装完成后，打开
【贪心算法】洛谷P4995 - 跳跳仟濹算法学习笔记贪心算法算法
2025-01-21-第44篇【洛谷】贪心算法题单-【贪心算法】-【学习笔记】作者(Author):郑龙浩/仟濹(CSND账号名)目录文章目录目录洛谷P4995跳跳！题目描述输入格式输出格式样例#1样例输入#1样例输出#1样例#2样例输入#2样例输出#2提示样例解释数据范围思路代码洛谷P4995跳跳！题目描述你是一只小跳蛙，你特别擅长在各种地方跳来跳去。这一天，你和朋友小F一起出去玩耍的时候，遇到
在VS-Code配置Anaconda环境 m0_47563195 配置 python conda 编辑器
准备工作：一台没有安装Python，Anaconda及VS-Code的window10系统的电脑第一步：安装Anaconda由于在官网下载安装包比较慢，所以可以选择在清华大学开源软件镜像站进行下载（Indexof/anaconda/archive/|清华大学开源软件镜像站|TsinghuaOpenSourceMirror），具体安装过程及环境配置可参考文章Anaconda环境与Python的配置方
分布式资源管理和调度架构 johnny233 架构架构
概述不管是计算任务还是数据存储都会涉及资源分配，资源包括但不限于硬件资源如CPU、内存、硬盘、网口。在单机环境中，资源管理相对简单；分布式环境中，资源分布相对分散，如何协调资源应对计算任务和数据存储就是亟待解决的问题。资源管理和调度是将计算任务分配到资源的过程，为了处理并发的计算任务，系统会通过集群的方式组织资源。集群中的资源可以按照服务器或者虚拟机的方式划分。注：本文是《分布式架构原理与实践》的
第八篇：监视`ref`定义的【基本类型】数据和对象类型小画家~ 前端 vue.js
一：【watch】监视`ref`定义的【基本类型】数据作用：监视数据的变化（和Vue2中的watch作用一致）特点：Vue3中的watch只能监视以下四种数据：ref定义的数据。reactive定义的数据。函数返回一个值（getter函数）。一个包含上述内容的数组。我们在Vue3中使用watch的时候，通常会遇到以下几种情况，在一定情况下，停止监控：stopWatchwatch(第一个参数，第二个
【Elasticsearch 】聚合分析：聚合概述程风破～ Elasticsearch elasticsearch 大数据搜索引擎
博主简介：CSDN博客专家，历代文学网（PC端可以访问：https://literature.sinhy.com/#/?__c=1000，移动端可微信小程序搜索“历代文学”）总架构师，15年工作经验，精通Java编程，高并发设计，Springboot和微服务，熟悉Linux，ESXI虚拟化以及云原生Docker和K8s，热衷于探索科技的边界，并将理论知识转化为实际应用。保持对新技术的好奇心，乐于分
ArcGIS API for JavaScript获取和配置-ArcGIS Web 开发学习（一）大海上飞翔 ArcGIS Web API javascript arcgis
ArcGISAPIforJavaScript获取和配置最近开始学习WebGIS开发，刚一接触就很是让人恼火，第一个问题就是：ArcGISAPIforJavaScript库和SDK的获取。（1）我直接访问的是ARCGIS的资源中心：http://resources.arcgis.com/zh-cn/home/，点击JavaScript，出现以下页面：https://developers.arcg
go语言安装与卸载 kankan231 golang golang linux
Linux下go语言的安装1在https://studygolang.com/dl上下载相应的系统版本下载Linux版本压缩包：wgethttps://studygolang.com/dl/golang/go1.17.linux-amd64.tar.gz2解压到/usr/local/gotar-C/usr/local-xzfgo1.17.linux-amd64.tar.gz3添加/usr/loca
Cesium-坐标转换（屏幕坐标、世界坐标、经纬度之间的转换）如影随从 Cesium Cesium 坐标转换
一、经纬度转换为世界坐标//方法一Cesium.Cartesian3.fromDegrees(longitude,latitude,height,ellipsoid,result)//方法二varellipsoid=viewer.scene.globe.ellipsoid;varcartographic=Cesium.Cartographic.fromDegrees(lng,lat,alt);va
ASP.NET Core JWT身份验证实战教程司莹嫣Maude
ASP.NETCoreJWT身份验证实战教程ASPNETCore2JwtAuthenticationJwtAuthenticationwithoutASP.NETCoreIdentity项目地址:https://gitcode.com/gh_mirrors/as/ASPNETCore2JwtAuthentication项目介绍本教程基于VahidN的ASPNETCore2JwtAuthentica
【Vim Masterclass 笔记22】S09L40 + L41：同步练习11：Vim 的配置与 vimrc 文件的相关操作（含点评课内容）安冬的码畜日常 Vim Masterclass vim 笔记 vim配置 vim同步练习 vim options vim option-list
文章目录S09L40Exercise11-VimSettingsandtheVimrcFile1训练目标2操作指令2.1.打开vimrc-sample文件2.2.尝试各种选项与设置2.3.将更改内容保存到vimrc-sample文件2.4.将文件vimrc-sample的内容复制到寄存器2.5.创建专属vimrc文件2.6.对于Mac、Linux或Unix用户2.7.对于Windows用户2.8.
服务端渲染（SSR）与客户端渲染（CSR）详解创意锦囊前端
1.背景与概念在早期Web时代，网页主要是静态HTML页面，用户点击链接后会刷新整个页面。随着网络与前端技术的发展，人们开始追求更好的页面性能与用户体验，尤其是在移动端和实时交互场景下，对于页面加载速度的要求不断提升。渲染是指如何将数据转换成可视化的页面输出给用户。渲染策略的不同主要体现在在哪个环节完成页面DOM结构的组装：服务端渲染（SSR，Server-SideRendering）：在服务器将
VPN是什么？高校为什么用？创意锦囊网络
虚拟专用网络（VPN）：隐私保护与安全上网的利器随着互联网的普及和网络安全威胁的增加，越来越多的人开始关注如何在网上保护自己的隐私和安全。虚拟专用网络（VPN，VirtualPrivateNetwork）作为一种有效的解决方案，正受到广泛关注和使用。本文将详细介绍VPN的工作原理及其优势，帮助您全面了解VPN的功能和应用场景。VPN的工作原理VPN是一种通过加密隧道技术将用户的设备与互联网资源连接
从SSL到TLS——互联网传输的护卫军创意锦囊 ssl 网络安全
在这个信息化高度发展的时代，我们每天都在不知不觉中接触到大量的网络传输协议，但大多数人对于这些协议背后的技术并不清楚。TLS（TransportLayerSecurity）就是这样一种守护网络传输安全的技术，悄然为我们保驾护航。TLS的前身是SSL（SecureSocketsLayer），如今已发展成互联网传输协议的基石。今天，我们就来聊聊TLS的发展历程，从SSL到TLS，它是如何一步步成为互联
C#远程获取标签方案，减少测试等人员重复配置或复制标签的功能：一次配置，终身使用小黄人软件 c#java android
减少测试等人员重复配置或复制标签的功能：一次配置，终身使用【开发人员】放标签到远程并手工配置好【使用人员】只需选择型号和group，点从远程获取，所有标签与pdf自动从远程复制到本地。(比如F20标准版)远程获取标签方案用C#写一个程序:读取config.ini文件里的Model和TEMPLATE_GROUP，在label.ini文件中读取[Model@TEMPLATE_GROUP]下所有key-
Mac下nvm无法安装node问题可爱发 macos
背景最近换用mac开发，然后使用nvm（版本0.40.1）进行node安装的时候出现了一些问题使用nvmls-remote发现只有iojs版本原因可能是nodejs升级了某个协议导致的解决方案可以使用NVM_NODEJS_ORG_MIRROR=http://nodejs.org/distnvmls-remote，安装的时候同样使用NVM_NODEJS_ORG_MIRROR=http://nodej
chatgpt赋能python：Python创建虚拟环境venv-环境隔离的必备工具 a058046 ChatGpt python chatgpt 人工智能计算机
Python创建虚拟环境venv-环境隔离的必备工具Python是一种非常流行的编程语言，拥有丰富的第三方库和工具。当我们在开发一个项目时，我们可能需要使用多个Python版本或多个第三方库版本来满足项目的需求。这时候，我们就需要一个工具来管理Python的环境隔离。venv就是Python自带的虚拟环境工具，它可以让我们轻松地创建一个Python环境隔离，以便于我们管理我们的Python环境。什
如何通过API接口获取体育数据？从入门到进阶全攻略 Tina0898 数据库
随着体育赛事和互联网的深度融合，实时获取赛事数据已经成为体育网站、直播平台以及相关应用开发中的重要环节。本文将从API接口的基本概念开始，全面讲解如何通过API获取体育数据，包括技术选型、实际操作以及未来扩展方向，帮助开发者快速上手。一、什么是API接口？API（ApplicationProgrammingInterface，应用程序接口）是应用程序之间进行通信的一种方式。对于体育数据来说，API
设计模式-单例设计模式 MrJianD 设计模式单例模式
问：什么事设计模式？答：能够最优解决问题的一种设计方式。那么今天来将单利设计模式，也是给自己巩固一下。概念见名知意，单例设计模式的单就是单个，例就是实例。也就是说该类只有一个实例的设计。那么这种设计的好处是什么呢？优化内存，减少不必要的对象创建。比如说win中的任务管理器，你只能打开一个，没办法打开多个，况且这个玩意还占用内存，打开多了也没用呀！对吧？那么好处说完了，就该说怎么去设计了分析：这个类
【水果识别】SVM水果成熟检测系统（含苹果香蕉橙子）【含GUI Matlab源码 11052期】含报告 Matlab武动乾坤 Matlab图像处理（进阶版）matlab
Matlab武动乾坤博客之家博主简介：985研究生，Matlab领域科研开发者；座右铭：行百里者，半于九十。代码获取方式：CSDNMatlab武动乾坤—代码获取方式更多Matlab图像处理仿真内容点击①Matlab图像处理（进阶版）⛳️关注CSDNMatlab武动乾坤，更多资源等你来！！⛄一、SVM水果成熟检测系统SVM（支持向量机）水果成熟检测系统的原理和流程如下：原理：1SVM是一种监督学习算
变量，数组，私有仓库的构建小菜刀刀 linux 运维服务器
1.理解函数调用，总结函数普通变量，环境变量和本地变量。关于函数的理解，可以将其比作是模块化编程中的独立组件（或者说是模块）。函数能够自治地完成特定的任务或功能。为了构建一个实现多种功能的程序，开发者可以将不同的功能分别封装成独立的函数模块。这样，在主程序流程中，通过调用这些函数模块，可以实现多个功能的集成与协同工作。本地变量：作用在函数内部，函数结束后被自动销毁（使用local来设置本地变量）普
分布式存储的技术选型之HDFS、Ceph、MinIO对比 Linux运维老纪勇敢向前迎接运维开发之挑战分布式 hdfs ceph 云原生运维开发大数据云计算
分布式存储的技术选型比：HDFS、Ceph、MinIO对比一文读懂分布式存储在当今数字化时代，数据呈爆炸式增长，分布式存储技术应运而生，成为大数据存储与管理的得力助手。它将数据分散存于多台独立设备，构建起一个庞大而可靠的虚拟存储体系，有效突破了传统集中式存储的性能瓶颈，大幅提升了可靠性、可用性及存取效率，轻松应对海量数据的存储挑战。分布式存储的应用场景极为广泛。在大数据处理领域，如互联网公司应对海
解决vscode连接docker容器没有权限的问题 Ivy_Hu677 vscode docker ide
问题描述为了用VSCode打开容器内的代码，方便调试，安装VSCode中的Docker扩展。但是发现显示如下报错：ERROR:GotpermissiondeniedwhiletryingtoconnecttotheDockerdaemonsocketatunix:///var/run/docker.sock:Gethttp://%2Fvar%2Frun%2Fdocker.sock/v1.24/in
Linux环境下删除Golang HoUnix golang
在Linux操作系统中，如果你决定删除Golang编程语言及其相关组件，需要执行一系列步骤。本文将为你提供详细的指导，并附上相应的源代码。卸载Golang首先，需要卸载已安装的Golang。在终端中执行以下命令：sudorm-rf/usr/local/go这将删除Golang的安装目录。移除环境变量下一步是从系统环境变量中移除与Golang相关的路径。打开终端，编辑~/.profile文件（或者是
ubuntu安装、升级、卸载go语言 aspirinnil linux golang linux ubuntu golang
ubuntu安装、升级、卸载golang一、安装go二、升级go1.卸载go2.重新安装新版本的golangubuntu安装、升级、卸载golang一、安装go下载go方法一：官网下载：https://golang.org/dl/方法二：打开ubuntu输入：wgethttps://dl.google.com/go/go1.15.3.linux-amd64.tar.gz
VIM的 YCM插件所有的坑和解决方法，都是自己总结的！不完美的程序员教程 VIM
相信大家都听说过大名鼎鼎的自动补全插件-YCM今天就让我们来装完这个插件。——————————————————————————建议大家用bundle，在你的VIMRC中添加Bundle'Valloric/YouCompleteMe'这里必须要注意，这是一个大坑，就是必须要耐心等它装完！！！否则报错！！！——————————————————————————现在，配置他：letg:ycm_seed_i
Label标签的属性 Cc_zhH GUI开发 python
Label标签的属性以下是TkinterLabel组件的一些常用属性，以及它们的详细说明：属性名说明text标签上显示的文本。font标签文本的字体，格式为(font_name,size)或(font_name,size,style)，其中style可以是"bold"、"italic"等。fg文本的前景色（即文本颜色）。bg标签的背景色。width标签的宽度，以文本单位（一个空格的宽度）为单位。h
java责任链模式 3213213333332132 java 责任链模式村民告县长
责任链模式，通常就是一个请求从最低级开始往上层层的请求，当在某一层满足条件时，请求将被处理，当请求到最高层仍未满足时，则请求不会被处理。就是一个请求在这个链条的责任范围内，会被相应的处理，如果超出链条的责任范围外，请求不会被相应的处理。下面代码模拟这样的效果：创建一个政府抽象类,方便所有的具体政府部门继承它。 package 责任链模式; /** *
linux、mysql、nginx、tomcat 性能参数优化 ronin47
一、linux 系统内核参数 /etc/sysctl.conf文件常用参数 net.core.netdev_max_backlog = 32768 #允许送到队列的数据包的最大数目 net.core.rmem_max = 8388608 #SOCKET读缓存区大小 net.core.wmem_max = 8388608 #SOCKET写缓存区大
php命令行界面 dcj3sjt126com PHP cli
常用选项 php -v php -i PHP安装的有关信息 php -h 访问帮助文件 php -m 列出编译到当前PHP安装的所有模块执行一段代码 php -r 'echo "hello, world!";' php -r 'echo "Hello, World!\n";' php -r '$ts = filemtime("
Filter&Session 171815164 session
Filter HttpServletRequest requ = (HttpServletRequest) req; HttpSession session = requ.getSession(); if (session.getAttribute("admin") == null) { PrintWriter out = res.ge
连接池与Spring,Hibernate结合 g21121 Hibernate
前几篇关于Java连接池的介绍都是基于Java应用的，而我们常用的场景是与Spring和ORM框架结合，下面就利用实例学习一下这方面的配置。 1.下载相关内容： &nb
[简单]mybatis判断数字类型 53873039oycg mybatis
昨天同事反馈mybatis保存不了int类型的属性,一直报错，错误信息如下: Caused by: java.lang.NumberFormatException: For input string: "null" at sun.mis
项目启动时或者启动后ava.lang.OutOfMemoryError: PermGen space 程序员是怎么炼成的 eclipse jvm tomcat catalina.sh eclipse.ini
在启动比较大的项目时，因为存在大量的jsp页面，所以在编译的时候会生成很多的.class文件，.class文件是都会被加载到jvm的方法区中，如果要加载的class文件很多，就会出现方法区溢出异常 java.lang.OutOfMemoryError: PermGen space. 解决办法是点击eclipse里的tomcat，在
我的crm小结 aijuans crm
各种原因吧，crm今天才完了。主要是接触了几个新技术： Struts2、poi、ibatis这几个都是以前的项目中用过的。 Jsf、tapestry是这次新接触的，都是界面层的框架，用起来也不难。思路和struts不太一样，传说比较简单方便。不过个人感觉还是struts用着顺手啊，当然springmvc也很顺手，不知道是因为习惯还是什么。jsf和tapestry应用的时候需要知道他们的标签、主
spring里配置使用hibernate的二级缓存几步 antonyup_2006 java spring Hibernate xml cache
．在spring的配置文件中 applicationContent.xml，hibernate部分加入 xml 代码 <prop key="hibernate.cache.provider_class">org.hibernate.cache.EhCacheProvider</prop> <prop key="hi
JAVA基础面试题百合不是茶抽象实现接口 String类接口继承抽象类继承实体类自定义异常
/* * 栈（stack）：主要保存基本类型（或者叫内置类型）（char、byte、short、 *int、long、 float、double、boolean）和对象的引用，数据可以共享，速度仅次于 * 寄存器（register），快于堆。堆（heap）：用于存储对象。 */ &
让sqlmap文件 "继承" 起来 bijian1013 java ibatis sqlmap
多个项目中使用ibatis , 和数据库表对应的 sqlmap文件（增删改查等基本语句)，dao, pojo 都是由工具自动生成的, 现在将这些自动生成的文件放在一个单独的工程中，其它项目工程中通过jar包来引用，并通过"继承"为基础的sqlmap文件，dao,pojo 添加新的方法来满足项
精通Oracle10编程SQL(13)开发触发器 bijian1013 oracle 数据库 plsql
/* *开发触发器 */ --得到日期是周几 select to_char(sysdate+4,'DY','nls_date_language=AMERICAN') from dual; select to_char(sysdate,'DY','nls_date_language=AMERICAN') from dual; --建立BEFORE语句触发器 CREATE O
【EhCache三】EhCache查询 bit1129 ehcache
本文介绍EhCache查询缓存中数据，EhCache提供了类似Hibernate的查询API，可以按照给定的条件进行查询。要对EhCache进行查询，需要在ehcache.xml中设定要查询的属性数据准备 @Before public void setUp() { //加载EhCache配置文件 Inpu
CXF框架入门实例白糖_ spring Web 框架 webservice servlet
CXF是apache旗下的开源框架，由Celtix + XFire这两门经典的框架合成，是一套非常流行的web service框架。它提供了JAX-WS的全面支持，并且可以根据实际项目的需要，采用代码优先（Code First）或者 WSDL 优先（WSDL First）来轻松地实现 Web Services 的发布和使用，同时它能与spring进行完美结合。在apache cxf官网提供
angular.equals boyitech AngularJS AngularJS API AnguarJS 中文API angular.equals
angular.equals 描述: 比较两个值或者两个对象是不是相等。还支持值的类型，正则表达式和数组的比较。两个值或对象被认为是相等的前提条件是以下的情况至少能满足一项：两个值或者对象能通过=== （恒等）的比较两个值或者对象是同样类型，并且他们的属性都能通过angular
java-腾讯暑期实习生-输入一个数组A[1,2,...n]，求输入B，使得数组B中的第i个数字B[i]=A[0]*A[1]*...*A[i-1]*A[i+1] bylijinnan java
这道题的具体思路请参看何海涛的微博：http://weibo.com/zhedahht import java.math.BigInteger; import java.util.Arrays; public class CreateBFromATencent { /** * 题目：输入一个数组A[1,2,...n]，求输入B，使得数组B中的第i个数字B[i]=A
FastDFS 的安装和配置修订版 Chen.H linux fastDFS 分布式文件系统
FastDFS Home:http://code.google.com/p/fastdfs/ 1. 安装 http://code.google.com/p/fastdfs/wiki/Setup http://hi.baidu.com/leolance/blog/item/3c273327978ae55f93580703.html 安装libevent (对libevent的版本要求为1.4.
[强人工智能]拓扑扫描与自适应构造器 comsci 人工智能
当我们面对一个有限拓扑网络的时候,在对已知的拓扑结构进行分析之后,发现在连通点之后,还存在若干个子网络,且这些网络的结构是未知的,数据库中并未存在这些网络的拓扑结构数据....这个时候,我们该怎么办呢? 那么,现在我们必须设计新的模块和代码包来处理上面的问题
oracle merge into的用法 daizj oracle sql merget into
Oracle中merge into的使用 http://blog.csdn.net/yuzhic/article/details/1896878 http://blog.csdn.net/macle2010/article/details/5980965 该命令使用一条语句从一个或者多个数据源中完成对表的更新和插入数据. ORACLE 9i 中，使用此命令必须同时指定UPDATE 和INSE
不适合使用Hadoop的场景 datamachine hadoop
转自：http://dev.yesky.com/296/35381296.shtml。　　Hadoop通常被认定是能够帮助你解决所有问题的唯一方案。当人们提到“大数据”或是“数据分析”等相关问题的时候，会听到脱口而出的回答：Hadoop! 实际上Hadoop被设计和建造出来，是用来解决一系列特定问题的。对某些问题来说，Hadoop至多算是一个不好的选择，对另一些问题来说，选择Ha
YII findAll的用法 dcj3sjt126com yii
看文档比较糊涂，其实挺简单的： $predictions=Prediction::model()->findAll("uid=:uid",array(":uid"=>10)); 第一个参数是选择条件：”uid=10″。其中:uid是一个占位符，在后面的array(“:uid”=>10)对齐进行了赋值；更完善的查询需要
vim 常用 NERDTree 快捷键 dcj3sjt126com vim
下面给大家整理了一些vim NERDTree的常用快捷键了，这里几乎包括了所有的快捷键了，希望文章对各位会带来帮助。切换工作台和目录 ctrl + w + h 光标 focus 左侧树形目录ctrl + w + l 光标 focus 右侧文件显示窗口ctrl + w + w 光标自动在左右侧窗口切换ctrl + w + r 移动当前窗口的布局位置 o 在已有窗口中打开文件、目录或书签，并跳
Java把目录下的文件打印出来蕃薯耀列出目录下的文件文件夹下面的文件目录下的文件
Java把目录下的文件打印出来 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月11日 11:02:
linux远程桌面----VNCServer与rdesktop hanqunfeng Desktop
windows远程桌面到linux，需要在linux上安装vncserver，并开启vnc服务，同时需要在windows下使用vnc-viewer访问Linux。vncserver同时支持linux远程桌面到linux。 linux远程桌面到windows，需要在linux上安装rdesktop，同时开启windows的远程桌面访问。下面分别介绍，以windo
guava中的join和split功能 jackyrong java
guava库中，包含了很好的join和split的功能，例子如下： 1）将LIST转换为使用字符串连接的字符串 List<String> names = Lists.newArrayList("John", "Jane", "Adam", "Tom");
Web开发技术十年发展历程 lampcy android Web 浏览器 html5
回顾web开发技术这十年发展历程： Ajax 03年的时候我上六年级，那时候网吧刚在小县城的角落萌生。传奇，大话西游第一代网游一时风靡。我抱着试一试的心态给了网吧老板两块钱想申请个号玩玩，然后接下来的一个小时我一直在，注，册，账，号。彼时网吧用的512k的带宽，注册的时候，填了一堆信息，提交，页面跳转，嘣，”您填写的信息有误，请重填”。然后跳转回注册页面，以此循环。我现在时常想，如果当时a
架构师之mima-----------------mina的非NIO控制IOBuffer(说得比较好) nannan408 buffer
1.前言。如题。 2.代码。 IoService IoService是一个接口，有两种实现：IoAcceptor和IoConnector；其中IoAcceptor是针对Server端的实现，IoConnector是针对Client端的实现；IoService的职责包括： 1、监听器管理 2、IoHandler 3、IoSession
ORA-00054:resource busy and acquire with NOWAIT specified Everyday都不同 oracle session Lock
[Oracle] 今天对一个数据量很大的表进行操作时，出现如题所示的异常。此时表明数据库的事务处于“忙”的状态，而且被lock了，所以必须先关闭占用的session。 step1，查看被lock的session： select t2.username, t2.sid, t2.serial#, t2.logon_time from v$locked_obj
javascript学习笔记 tntxia JavaScript
javascript里面有6种基本类型的值:number、string、boolean、object、function和undefined。number：就是数字值，包括整数、小数、NaN、正负无穷。string:字符串类型、单双引号引起来的内容。boolean:true、false object:表示所有的javascript对象，不用多说function:我们熟悉的方法，也就是
Java enum的用法详解 xieke90 enum 枚举
Java中枚举实现的分析：示例： public static enum SEVERITY{ INFO,WARN,ERROR } enum很像特殊的class，实际上enum声明定义的类型就是一个类。而这些类都是类库中Enum类的子类 (java.l