人月神话

SQL on Hadoop最新进展2-转载

原文：http://yanbohappy.sinaapp.com/?p=407

上篇主要讨论了Hive, Stinger/Tez, Impala, Shark这些SQL on Hadoop产品，这篇接着讨论Phoenix, Hadapt, Hawq。

Phoenix

Salesforce开源的基于HBase的SQL查询系统，建立在HBase client API, coprocessors, custom filter的基础之上。基本原理是将一个对于HBase client来说比较复杂的查询转换成一系列Region Scan，结合create table时hook的coprocessor和custom filter在多台Region Server上进行并行查询，汇总各个Scan结果输出给调用程序的ResultSet。说白了就是看大家用HBase client API开发程序太麻烦了，就弄了个JDBC包装，这样对于software engineer来说降低了开发成本，同时对于简单单表查询性能损失不大。

种种迹象表明，Phoenix应该不是个优化的OLAP系统，更像是一个用于简单单表查询，过滤，排序，检索的OLTP系统。

优点：

HBase默认存储的数据类型都是字符串，但Phoenix支持更多的数据类型(int, float, char, varchar, time, date)
使用JDBC操作数据，而不是HBase client API
在RegionServer端通过coprocessor过滤where条件，执行aggregation函数。Hive on HBase把SQL转化成MapReduce去查询HBase；Impala on HBase把SQL转化成PlanFragment执行计划去查询HBase； Phoenix把SQL转化成对HBase client API和coprocessor的调用，这三者的架构是相似的。不同点就是Hive on HBase和Impala on HBase都没有把coprocessor利用好，都是通过HBase client API把数据读到他们自己进程的内存之后才进行的filter, aggregation等操作。所以理论上讲前两种架构设计的产品性能不可能超过直接调用HBase Client的方式。
从查询的角度来看HBase的column主要分为两类：primary key(row key column)和other columns。主要的不同是row key column能够利用HBase Region Server的index, filter, sort等特性，而other columns没有这些特性，只能通过二级索引辅助做一些优化。Phoenix能够在HBase上创建二级索引用于优化non row key columns的条件查询（目前只支持在static table上建二级索引，一个更通用的HBase二级索引实现方法可以参考华为开源的这个实现https://github.com/Huawei-Hadoop/hindex）。
salting of row keys to evenly distribute write load
如果是row key column上的IN/OR/LIKE条件，可以通过Region Server的skip scan filter优化。
Dynamic columns支持（跟RDBMS的dynamic schema change类似），也就是用户不需要在create table的时候指定所有的column，后面什么时候需要随时添加。这个功能主要依赖于HBase的动态添加column的功能。
AutoCommit=false时(默认是false)把所有操作先缓存在客户端，只有你显示commit时才一次批量提交到HBase，SQL解析优化全是在客户端做，这个有点事务的意思。

缺点：

不支持JOIN，考虑到HBase的设计初衷是尽量用冗余数据减少复杂的JOIN操作，实际上可以把相关数据都放在同一个表里，而不需要为了减少数据冗余，拆分到多个表中，所以很大程度也可以认为这不是一个缺点。
从架构上看也仅是把SQL转成HBase Client的API和coprocessor的调用，而且coprocessor还不适合大规模数据的传输，所以如果中间结果的数据量还是比较大的话性能问题还是很明显的。
这个缺点是所有的基于HBase的SQL系统都有的（包括Hive on HBase和Impala on HBase）。不管什么请求到HBase Region Server这边都得通过RegionScanner，这个接口不是面向OLAP型应用优化的存储文件读取接口。例如RegionScanner的实现里好多条件比较，是不利于全表扫描的。所以全表扫描的应用不如一个一个地读HFile，当然前提是得离线把memstore的数据都dump到hfile。目前coprocessor也是走的RegionScanner。这部分要想改得改Region Server代码了，那就是Apache HBase社区的事了。
还有个问题就是coprocessor的问题了，由于coprocessor和HBase Region Server是在一个JVM里面，所以当coprocessor计算逻辑非常复杂，中间结果数据量很大的时候会占用大量内存。同时coprocessor不是流式地读取数据，某些节点数据积累过多也会造成内存不够用的问题。

RoadMap:

JOIN支持，虽然有点不符合设计初衷，但是大家都支持，就我不支持，太out of fashion了吧。
Transaction支持，通过参考https://github.com/yahoo/omid的方法。
Online Schema Evolution，动态改变column的类型，rename等。https://github.com/forcedotcom/phoenix/wiki

Hadapt/HadoopDB

http://hadapt.com/product/
http://db.cs.yale.edu/hadoopdb/hadoopdb.pdf

架构和Hive相似，底层存储引擎有两种：HDFS和RDBMS(PostgreSQL)，一个DataNode节点上有一个RDBMS节点。提供两种接口：SQL和MapReduce，SQL也是解析成MapReduce job来执行的，所以总的来说执行引擎都是MR。

把多个MapReduce任务，转换成单node上的SQL+一个MR（data shuffle），这个跟水平压缩，垂直压缩类似，尽量减少SQL解析出的MR task个数，减少任务之间写HDFS的IO数据量。把一个SQL拆解成两部分：适合SQL做的用单机SQL，不适合的用MR（data shuffle）

和Hive的不同点在于Hive只能操控HDFS上的数据，而Hadapt可以操控HDFS和RDBMS两种数据来源。对于RDBMS这个数据源来说，数据被预先load到分布式的RDBMS节点中，有统一的Catalog管理所有RDBMS中的数据。例如Map中的有些执行逻辑直接通过一个在RDBMS上执行的SQL来获得（修改InputFormat），然后使用MapReduce来做JOIN/Group By。而且如果在数据被load到分布式PostgreSQL节点上时分布情况正好符合group by/order by的条件，那么还省得通过MapReduce的shuffle来做了。

Hadapt的本质还是把SQL解析成MR任务来做，不是MPP的思想，所以Hive具备的有些缺点（启动时间长，JOIN效率较低）它也是具有的。还有如果想要join/group by/order by能够在RDBMS数据源之间高效执行，还得考虑数据预分布的问题。

需要统一的元数据和数据一致性服务用于管理HDFS上的数据导入分布式PostgreSQL以及分区。

在执行多个Query的时候，后面的query能够利用前面query的查询结果（已经把前面Query的查询结果可以写到RDBMS中，有点类似于数据仓库中的物化视图的概念），从而可以提高查询的性能。

Combine structured and unstructured data in single query。现在很多公司为了统一计算平台，把放到RDBMS中的数据也放到HDFS上存一份，要不没法和HDFS中的非结构化数据做JOIN。在Hadapt这里用户通过一个Query可以操控两种数据，不用分两个步骤走了。

现在企业级应用大多使用的方案（ebay使用的是Hadoop+Teradata）是Hadoop+MPP/open source+commercial software的方式，即通过Hadoop批处理unstructured data（进行ETL操作）然后通过connector导入MPP进行structure data的query操作。但是这只是临时的替代方案，Hadapt说invisible loading（http://hadapt.com/blog/2012/09/05/invisible-loading-a-new-paradigm-for-loading-from-unstructured-to-structured-storage/ ）才是最合理的，这样企业就有了一个unified analytic platform。但是用户把数据load到RDBMS之后就失去了在HDFS上存储的robust和scalable的特征，需要这个系统提供维护数据一致性相关的功能。

Hawq

a relational database that runs atop of HDFS （EMC发布Hadoop发行版Pivotal HD）

原来Greenplum Database中的存储是本地磁盘，现在改成HDFS，原来Greenplum Database的单节点的RDBMS只充当execution engine的功能，不再充当storage功能。

Query执行通过Greenplum Database的parallel execution engine（不再使用MR），每次查询开始把数据从HDFS中导入到Greenplum database，执行过程中通过内存交换数据而非MapReduce那样每次任务结束都写磁盘。

Hawq提供一个Universal Catalog Service管理分布在各个RDBMS节点的数据。

GP特有的cost-based parallel query optimizer and planner是它的一大优势，也是目前其他大多数的产品中没有的。它能够帮用户选出该SQL最高效的执行顺序。

使用Greenplum Database充当执行引擎的好处：标准SQL兼容（correlated sub query, window functions, rollups, cube, scalar and aggregate function）；支持ACID事务；JDBC/ODBC支持；JOIN顺序优化和索引支持（查询优化器）；支持row/column两种存储格式。

GPXF (Greenplum Extension Framework) 使得Hawq能够读取存储在HDFS上的任何格式的数据(delimited text, sequence files, protobuf and avro)以及存储在Cassandra, Mongodb, Isilon, Atom, MapR, Lustre, GPFS中的数据，无非就是多开发个读取接口。EMC是存储出身，肯定是希望这个analytic stack能够接入更多的存储产品，特别是他们卖的东西。

底层的HDFS需要支持trancate语义（https://issues.apache.org/jira/browse/HDFS-3107）和native C interface（不是JNI的，JNI的不适合大规模并行查询，所以应该hawq自己实现了一个基于C的RPC通信接口，与NameNode和DataNode直接通信）。所以说Hawq底层的HDFS跟Apache版本的到底有多大区别，我也不知道。

支持In-Database analytics ( http://madlib.net/ )

可以在Hawq内执行除了Query以外的分析任务，例如analytic functions(standard deviation, variance等)和off-the-shelf analytic package

支持数据挖掘算法：principal components analysis (PCA), enhanced support vector machines (SVM), linear models

性能相关：

Scott Yara（Greenplum老大）公开承认hawq比pure Greenplum database要慢。这么做的目的无非就是更好的利用HDFS的可扩展性，统一存储管理。和其他sql on hadoop产品的性能对比方面，hawq在group by和join操作上与其他方案相比优势明显，前提是数据量不是特别大。（是不是因为数据导入的时候partition做的好呢，是不是拿load的时间换group by/join的时间呢？）

http://www.dataintoresults.com/2013/09/big-data-benchmark-impala-vs-hawq-vs-hive/

不过hawq和hadapt都说明了一个问题：就是unified analytic platform的重要性。

从商业产品来看，大数据分析产品主要有：

Teradata/Aster Data
EMC/Greenplum/Hawq
HP/Vertica 列存数据仓库
SAP/HANA 内存分析
Google/BigQuery 典型的Analysis as a Service
Amazon/Redshif 和AWS结合比较紧密

而传统软件厂商IBM, Oracle, Microsoft也都有产品，不过从技术的角度对后面这些公司的产品了解不多。

说完数据仓库相关产品，我们也顺便看看机器学习相关产品。机器学习不像SQL那么普遍，但是非常重要。我所知道的目前互联网公司做机器学习的系统是这样的：

(1) twitter基于pig做Machine Learning

http://www.umiacs.umd.edu/~jimmylin/publications/Lin_Kolcz_SIGMOD2012.pdf

    在Hadoop/MapReduce基础上，通过Pig扩展，使该平台具有机器学习处理能力
    特征抽取通过UDF实现
    单个学习单元的内部循环封装在Pig Storage Function中
    预测是根据学习训练的模型，结合UDF实现

(2) 不过目前互联网公司大多使用Hadoop做feature selection，然后对于不同的问题采用两种思路：

    采样数据，然后跑单机模型。因为很多机器学习算法是非常不容易并行化的，所以在全量数据的子集上面跑单机模型。基于MPI开发大规模并行的机器学习算法。

(3) Spark是个非常适合迭代型机器学习算法的计算模型和框架

     Ecosystem非常完备(Shark,BlinkDB,MLbase)。特别是基于Spark的机器学习算法库MLbase(http://www.cs.berkeley.edu/~ameet/mlbase.pdf)更是给机器学习算法大规模应用提供了帮助。

由于Mahout是MR上的machine learning库,但是底层的MR天然不适合密集迭代计算的机器学习算法，导致Mahout的应用并不是很广泛。但是Spark却是非常适合迭代机器学习算法，那么MLbase的重要性就非常明显了。目前Berkeley的教授们已经搞了一个公司叫databricks来做Spark/Shark的商业化，我是非常看好Spark的前途的。

青春就应该这样绽放游戏测试：三国时期谁是你最好的兄弟！！你不得不信的星座秘密

OpenGL ES 如何渲染 16bit 图像？字节流动 OpenGL ES 3.0 OpenGLES 音视频图形渲染 Android c++
未经作者（微信ID：Byte-Flow）允许，禁止转载文章首发于公众号：字节流动最近有不少读者私信问OpenGLES如何处理16bit图像（P010）？然后我直接贴给他们一段在OpenGL环境下验证过的上传16bit图像数据的代码glTexImage2D(GL_TEXTURE_2D,0,GL_R16UI,width,height,0,GL_RED_INTEGER,GL_UNSIGNED_SHORT
CSDN快速转载文章的技巧（2025年最新方法）日薪月亿 CSDN工具指南学习方法
文章目录一、问题描述1.1排版杂乱1.2浏览器崩溃二、原因分析2.1HTML内容复杂2.2编辑器兼容性2.3性能问题三、解决办法3.1解决思路3.2解决办法一、问题描述最近尝试了多种网上流传的文章转载方法，多数是通过浏览器的DevTool工具找到网页的id值为article_content或content_views的内容，然后右键点击选择CopyouterHTML来获取文章的完整HTML内容。接
基于 Verilog 的经典数字电路设计（1）加法器新芯设计 1 专栏革新中禁止订阅！！！FPGA Verilog 加法器数字 IC 设计 IC
基于Verilog的经典数字电路设计（1）加法器版权所有，新芯设计，转载文章，请注来源引言一、半加器的Verilog代码实现和RTL电路实现一、全加器的Verilog代码实现和RTL电路实现引言加法器是非常重要的，它不仅是其它复杂算术运算的基础，也是CPU中ALU的核心部件（全加器）。两个二进制数之间的算术逻辑运算例如加减乘除，在数字计算机中都是化为若干步加法操作进行的，因此，学好数字电路，从
linux 权限的设置与查看 chmod 与 ls -l 等相关命令 drebander 脚本
本文为转载文章出处：http://blog.csdn.net/sinchb/article/details/11746427本文着重介绍与Linux文件权限相关等问题，比如用户与用户组，文件权限，文件默认权限和文件特殊权限等。Linux为什么需要那么多的权限限制呢？其实这些都是为了“安全起见”啊！如果你的Linux系统里存了你给心上人写的情书，或者是某亚洲岛国的动作大片，你总不希望谁都可以翻翻看吧
CSDN怎么获取积分？ CN.LG CSDN csdn
发布原创或转载文章‌：每发布一篇原创或翻译文章可以获得10分，每发布一篇转载文章可以获得2分。这意味着通过创作和分享有价值的内容，可以快速积累积分‌。参与论坛活动‌：参与论坛活动，如回复相关帖子，每天可以获得10积分，第二天入账。这鼓励用户积极参与社区讨论，提高自己的积分‌。评论他人博客‌：每评论一次他人的博客可以获得1分。通过积极参与评论，不仅可以提升自己的积分，还能促进社区的互动和交流‌。上传
mybatis xml文件中用 if 标签判断字符串是否相等斯南 mybatis xml java
方法一：推荐推荐a.del_flag=#{delFlag}方法二：a.del_flag=#{delFlag}注意test后面跟的是双引号（""）还是单引号（''）ps：用equals()亲测也可以方法三：a.del_flag=#{delFlag}注意：使用如下方式是错的12a.del_flag=#{delFlag}3转载文章关联查询删除表中指定的数据deleteafrombasic_mainale
不为昨天叹息，只为今天更好坚持星球小汤哥
【本文为转载文章】岁月，从来都是悄然无声，不问冷暖，不言悲喜，一天一天地往前走，它从不回头。山河广阔，烟火袅袅，蓦然回首，半生已过。生命，如同一场旅行，每段路都是风景，每段经历都是财富。感谢荆棘赠予的坚韧与饱满，感谢光阴赠予的豁达与明亮。人生本无常，何必苦强求生活就像万花筒，色彩斑斓，但不确定。每个人都在不确定中成长，成长，是一次次蜕变的阅历，阅历越深越明白，人生总是充满着分离、失去、悲痛欲绝，但
nRF52832 — ANCS协议介绍文化人Sugar nRF52832 ANCS nRF52832
文章出处：可不可以不取名（转载文章，如有不妥，通知后我会立即删除）1ANCS综述ANCS即AppleNotificationCenterService。是IOS系统中的一个通知服务。设备连接手机后，设备首先需要先使能IOS系统的通知功能，具体即设备上的GATT客户端发现IOS上的ANCS，并且使能其通知源Characteristics的notify功能。之后IOS系统就会通过ble推送消息给设备了
技术积累 — 函数可变形参整理：vsprintf和vs_list详解文化人Sugar 技术积累 list
写在前面：（转载文章，若有不妥，通知后我会立即删除）一、我们先来看几个宏：va_list、va_start、va_arg及va_end（va的意思应该是variable），在Linux-2.6.24.7内核源码里，其定义（内核里的定义与C语言库的定义是类似的）如下/**UselocaldefinitionsofClibrarymacrosandfunctions*NOTE:Thefunctioni
中国人为什么总比外国人活得累？（转载）小毛sunan293
2013-04-1820:22:35|分类：转载文章|字号订阅文/心悦白云前日看到一条微博说中国人为什么活着很累：1）贫富不均，增加心里压力2）一生只做三件事：培养孩子+供房子+存钱养老防病3）工作时间长，压力大，怕丢工作4）心思慎密，彼此缺乏信任感5）治安差，没有安全感6）个*力和财产没有保障7）对未来充满忧虑8）应酬太多9）虚情假意，违心做事。由此我很想全面地探讨一下中国人为何活得这么累？一、
晨行简得飞兔
图｜简得飞兔文｜简得飞兔朝阳斜照晨风暖行人匆匆车马行缓行踏步至班室开启平和又一天☞☞☞☞☞☞☞☞☞☞☞☞☞☞☞☞｜美源于发现，生活需要我们体味。｜用思考让自己成长，用写作记录生活！｜再回首，我们会为自己感动！｜我是一只热爱生活的兔子，｜在这里，期待与你相遇，一起记录美好生活！☞☞☞☞☞☞☞☞☞☞☞☞☞☞☞☞｜若非征得作者同意，禁止转载文章｜
OpenGL ES 如何实现图像锐化? 字节流动 OpenGL ES 3.0 计算机视觉人工智能 OpenGLES 图形渲染着色器 Android
未经作者（微信ID：Byte-Flow）允许，禁止转载文章首发于公众号：字节流动什么是图像锐化？图像锐化是一种图像处理技术，其目的是增强图像中的细节和边缘，使图像看起来更加清晰。这一过程通常涉及到突出图像中的高频信息，特别是强调像素之间的灰度变化。通过增强图像的高频细节，图像锐化可以改善图像在人类视觉系统和计算机视觉系统中的感知效果。图像锐化处理的目的是为了使图像的边缘、轮廓线以及图像的细节变得清
几种常用的卷积操作原理（标准卷积、深度卷积、组卷积、扩张卷积和反卷积 Never_Jiao DeepLearning 深度学习原理
本文为转载文章，原文链接0、标准卷积默认你已经对卷积有一定的了解，此处不对标准卷积细讲。举个例子，假设有一个3×3大小的卷积层，其输入通道为16、输出通道为32。那么一般的操作就是用32个3×3的卷积核来分别同输入数据卷积，这样每个卷积核需要3×3×16个参数，得到的输出是只有一个通道的数据。之所以会得到一通道的数据，是因为刚开始3×3×16的卷积核的每个通道会在输入数据的每个对应通道上做卷积，然
没有福德，你所得到的一切,都容易失去善财有茶
没有福德，你所得到的一切,都容易失去转载文章：《国语·晋语六》中说：“吾闻之，唯厚德者能受多福，无福而服者众，必自伤也。”由此可见，君子以厚德载物，少德无福者是无法载物的，甚至会导致严重的灾难。清华大学把“自强不息，厚德载物”作为其校训，就是因为厚福德者能更好地立足于社会，更好地完善自我。今天，我们来谈论一下福德对我们为人处事的作用与影响。第一：没有福德无法载物，很多事情付诸东流我们的福德从何而来
Ubuntu安装nodejs环境 CcaozzZ Ubuntu/Ros nodejs
转载博客园：feiquan此文是转载文章，此篇文章的版权归原创作者所属，如果侵权请与我联系，我会删除此文第一步，去nodejs官网https://nodejs.org看最新的版本号；也就是说此时此刻，12.6.0是最新的版本，不过你求稳的话建议选10.16.0的LTS版。第二步，添加源后安装，重点来了，nodejs的每个大版本号都有相对应的源，比如这里的10.x.x版本的源是https://deb
Introduction to Deterministic Policy Gradient (DPG) taoqick 机器学习人工智能
转载文章：https://medium.com/geekculture/introduction-to-deterministic-policy-gradient-dpg-e7229d5248e2论文正文：http://proceedings.mlr.press/v32/silver14.pdf论文补充材料：http://proceedings.mlr.press/v32/silver14-sup
CSDN中如何快速转载文章花草123 编辑器
在CSDN中如何快速转载文章：解决步骤：1.在CSDN中找到想要转载的文章，右击点击"检查"（或者快捷键F12）出现以下界面（图下图右侧所示）2.按住Ctrl+F快捷键，寻找"article_content"3.选中divid="article_content"那一行，如下图所示右击"Copy"—"CopyHTML"4.打开CSDN，依次点击’’‘管理博客’–’’‘博客设置’–MarkDown编辑
强烈推荐！15 个 Github 顶级 Java 教程类开源项目推荐！ yunzhonghefei 转载
转载文章：https://blog.csdn.net/qq_34337272/article/details/104423823
清华大学2023年毕业生去向数据公开！官方辟谣 80% 出国率夕小瑶人工智能
今天，清华官微的一则“辟谣”冲上微博热搜榜第一！清华大学官方发声！2023年清华毕业生出国（境）深造比例为8.0%，其中本科生出国（境）深造比例为15.6%，硕士生为5.9%。并且，根据清华校友会的统计，近20年出国留学的清华校友大部分都已归国工作，在各行各业发挥中坚力量。而这不是清华大学第一次关于这个数据进行辟谣，去年九月，清华大学学生记者团也转载文章，指出清华毕业生有80%都出国的消息为谣言。
洋吉随笔，生活2022.6.9 洋吉日记
今日工作很忙，上班时间几乎没有空余，昨晚在思考一些问题，所以比平时还晚睡了半个小时，十二点半睡，五点起。今日午休时间，没有午睡，利用午休时间拍了跳绳视频，用洗衣机洗了两次衣服，然后洗漱，整理下衣服，时间转眼即瞬，晚上下班后已是接近七点，坐在电脑前准备所有gzh转载文章，用手机补发了两个平台的昨日未发视频，正操作中，困意来叫我睡觉了，便躺床上小睡了一个小时，醒来赶紧完成跳绳5000个。发现上个礼拜去
面试你之前，我希望在简历上看到这些！程晓媛闯天涯
请各位读者添加一下作者的微信号，以后有新的文章，你最先接收哦！图片发自App另附：最近很多编辑私自将本文进行演绎，转载却并未获得任何授权。故现在本人将拒绝以任何方式的转载和演绎，请之前转载的机构即使将转载文章进行下架。计划进行转载的机构也就请勿打扰了。好多人问我，我的思维导图是怎么做的。这个是我用MAC上的MindNode书写的，用MAC的朋友可以点击下面的链接进行下载。MindNode那好，咱们
DA14531之基本介绍小武编程单片机嵌入式硬件物联网 mcu
基础入门版权归作者所有、未经允许、请勿转载文章目录基础入门版权归作者所有、未经允许、请勿转载前言一、DA14531简述二、DA14531技术特性三.DA14531应用场合四、DA14531基本架构4.1.芯片内部架构图4.2.最小系统图4.3.系统图5.DA14531开发工具5.1.硬件工具5.2.软件工具前言项目选择了DA14531这款芯片，首先需要对它有整体的认识，如芯片的技术特性、应用场合、
idea整合springboot+redis（转） sumingyou springBoot redis
以下转载文章经过本人亲测，具有可行性。转载地址：https://www.jianshu.com/p/19628db2e7ef1.前言这篇文章主要整合一下springboot和redis的框架，redis也是目前使用较多的nosql数据库。2.redis简介与环境搭建2.1redis简介redis是一个key-value。和Memcached类似，它支持存储的value类型相对更多，包括string
闭眼梦就来……… 简得飞兔
文｜简得飞兔图｜简得飞兔昨夜星辰入梦庵周游四海黎明归天亮鸟鸣催人醒两眼稀松起身来图片发自App昏花双眼蹒跚步小跑急扶去踏班强打精神撑开眼头重欲将桌砸穿熬到班点往回奔坐上车来游龙归双耳不问身边事回笼一觉梦春归美源于发现，生活需要我们体味。｜用思考让自己成长，用写作记录生活！｜再回首，我们会为自己感动！｜我是一只热爱生活的兔子，｜在这里，期待与你相遇，一起记录美好生活！若非征得作者同意，禁止转载文章
听力真的需要练好几年吗？提高听力的关键在哪里？一只向上爬的蜗牛
本篇为转载文章，我是为了收藏，而存在自己的文章了，最近打算慢慢开始实践起来。听力真的需要练好几年吗？提高听力的关键在哪里？回过头来看，答案很简单。我却走过了许多弯路，浪费了青春年华的大量时光。起初我的听力用了好几年的时间也没有明显提高，原因很简单，我靠的是耳濡目染。听各种英文歌、电影精彩片段、名人演讲等等。我幻想通过多听，听力自然会提高。多听自然会提高，这个没毛病，关键是性价比太低。提高的幅度和效
上善.小知——（1）公众号白名单怎么设置？上善seo
作者：上善SEO周三写了一篇《一次神奇的seo运营培训——上善seo有感》的文章，得到了白杨师傅的鼓励，超级高兴，刚刚师傅说可以帮我们转载文章到他的公众号，要开通一下白名单才行。瞬间蒙的一下，白名单是啥？经过师傅耐心的指点，设置完毕了。那么分享一下我是怎么设置的，如果你也碰巧刚开通公众号，也许会用的上。还要悄悄说一句，要是有厉害的人找你开通白名单，那么你要迅速去设置一下，这么好的机会怎么能错过呢。
廉江新闻数字报转载文章不署作者名，致抄袭者吴帅帅抄袭《记得自己是一朵花》麦淇琳
抄袭者猖獗，与报刊的不道德转载麦淇琳很久没有把发表杂志的文章贴上来，偶见之前的文章《记得自己是一朵花》被两家报纸抄袭。对于抄袭文章的鼠辈，我已经说烦说厌了。抄袭者把我写的一些小屁文，有全篇抄的，有抄片段的，有抄到公众号的，有抄到报纸副刊的。我就想问一句抄袭者，你们难道没有自己的脑子吗，这么舔不知耻，脸都不要了吗！把别人的作品随手拿来，然后妄称作者，这是不道德的抄袭行为。文贼与文人，一字之差，谬之千
如何获取积分 codeloverr servlet javascript java
相信不少新手都因为积分而困扰，那么接下来先给大家介绍一下最新的积分获取规则：积分规则具体如下：1、每发布一篇原创或者翻译文章：可获得10分2、每发布一篇转载文章：可获得2分3、博主的文章每被评论一次：可获得1分4、每发表一次评论：可获得1分（自己给自己评论、博主回复评论不获得积分）；5、每篇博文阅读次数每超过100次：可获得1分，阅读加分最高加到100分，即每篇文章点击上万次截止6、文章被投票：顶
如何获得CSDN积分 iPrints 分类
转载方法一http://blog.csdn.net/u013476542/article/details/53257806博客积分是衡量博客水平的重要标准，博客的排名也将按照积分排列。积分规则具体如下：1、每发布一篇原创或者翻译文章：可获得10分2、每发布一篇转载文章：可获得2分3、博主的文章每被评论一次：可获得1分4、每发表一次评论：可获得1分（自己给自己评论、博主回复别人对自己博文的评论不获得
Arduino 串口通讯参考笔记 - Serial 类库及相关函数介绍 saner686 单片机 stm32 物联网嵌入式硬件
@TOArduino串口通讯参考笔记-Serial类库及相关函数介绍C声明：本ID发布的所有文章及随笔均为原创，可随意转载，单转载文章必须注明作者saner686及包含原文出处地址https://editor.csdn.net/md？not_checkout=1&articleId=128343606未经本人许可，所有文章均不得用于商业用途。前言Arduino板通过串口（称为UART或USART串
Java开发中，spring mvc 的线程怎么调用？小麦麦子 spring mvc
今天逛知乎，看到最近很多人都在问spring mvc 的线程http://www.maiziedu.com/course/java/ 的启动问题，觉得挺有意思的，那哥们儿问的也听仔细，下面的回答也很详尽，分享出来，希望遇对遇到类似问题的Java开发程序猿有所帮助。问题：在用spring mvc架构的网站上，设一线程在虚拟机启动时运行，线程里有一全局
maven依赖范围 bitcarter maven
1.test 测试的时候才会依赖，编译和打包不依赖，如junit不被打包 2.compile 只有编译和打包时才会依赖 3.provided 编译和测试的时候依赖，打包不依赖，如：tomcat的一些公用jar包 4.runtime 运行时依赖，编译不依赖 5.默认compile 依赖范围compile是支持传递的，test不支持传递 1.传递的意思是项目A，引用
Jaxb org.xml.sax.saxparseexception : premature end of file darrenzhu xml premature JAXB
如果在使用JAXB把xml文件unmarshal成vo(XSD自动生成的vo)时碰到如下错误： org.xml.sax.saxparseexception : premature end of file 很有可能时你直接读取文件为inputstream，然后将inputstream作为构建unmarshal需要的source参数。InputSource inputSource = new In
CSS Specificity 周凡杨 html 权重 Specificity css
有时候对于页面元素设置了样式，可为什么页面的显示没有匹配上呢？ because specificity CSS 的选择符是有权重的，当不同的选择符的样式设置有冲突时，浏览器会采用权重高的选择符设置的样式。规则： HTML标签的权重是1 Class 的权重是10 Id 的权重是100
java与servlet g21121 servlet
servlet 搞java web开发的人一定不会陌生，而且大家还会时常用到它。下面是java官方网站上对servlet的介绍： java官网对于servlet的解释写道 Java Servlet Technology Overview Servlets are the Java platform technology of choice for extending and enha
eclipse中安装maven插件 510888780 eclipse maven
1.首先去官网下载 Maven： http://www.apache.org/dyn/closer.cgi/maven/binaries/apache-maven-3.2.3-bin.tar.gz 下载完成之后将其解压，我将解压后的文件夹：apache-maven-3.2.3，并将它放在 D:\tools目录下，即 maven 最终的路径是：D:\tools\apache-mave
jpa@OneToOne关联关系布衣凌宇 jpa
Nruser里的pruserid关联到Pruser的主键id，实现对一个表的增删改，另一个表的数据随之增删改。 Nruser实体类 //***************************************************************** @Entity @Table(name="nruser") @DynamicInsert @Dynam
我的spring学习笔记11-Spring中关于声明式事务的配置 aijuans spring 事务配置
这两天学到事务管理这一块，结合到之前的terasoluna框架，觉得书本上讲的还是简单阿。我就把我从书本上学到的再结合实际的项目以及网上看到的一些内容，对声明式事务管理做个整理吧。我看得Spring in Action第二版中只提到了用TransactionProxyFactoryBean和<tx:advice/>,定义注释驱动这三种，我承认后两种的内容很好，很强大。但是实际的项目当中
java 动态代理简单实现 antlove java handler proxy dynamic service
dynamicproxy.service.HelloService package dynamicproxy.service; public interface HelloService { public void sayHello(); } dynamicproxy.service.impl.HelloServiceImpl package dynamicp
JDBC连接数据库百合不是茶 JDBC编程 JAVA操作oracle数据库
如果我们要想连接oracle公司的数据库，就要首先下载oralce公司的驱动程序，将这个驱动程序的jar包导入到我们工程中; JDBC链接数据库的代码和固定写法; 1,加载oracle数据库的驱动; &nb
单例模式中的多线程分析 bijian1013 java thread 多线程 java多线程
谈到单例模式，我们立马会想到饿汉式和懒汉式加载，所谓饿汉式就是在创建类时就创建好了实例，懒汉式在获取实例时才去创建实例，即延迟加载。饿汉式： package com.bijian.study; public class Singleton { private Singleton() { } // 注意这是private 只供内部调用 private static
javascript读取和修改原型特别需要注意原型的读写不具有对等性 bijian1013 JavaScript prototype
对于从原型对象继承而来的成员，其读和写具有内在的不对等性。比如有一个对象A，假设它的原型对象是B，B的原型对象是null。如果我们需要读取A对象的name属性值，那么JS会优先在A中查找，如果找到了name属性那么就返回；如果A中没有name属性，那么就到原型B中查找name，如果找到了就返回；如果原型B中也没有
【持久化框架MyBatis3六】MyBatis3集成第三方DataSource bit1129 dataSource
MyBatis内置了数据源的支持，如： <environments default="development"> <environment id="development"> <transactionManager type="JDBC" /> <data
我程序中用到的urldecode和base64decode,MD5 bitcarter c MD5 base64decode urldecode
这里是base64decode和urldecode，Md5在附件中。因为我是在后台所以需要解码： string Base64Decode(const char* Data,int DataByte,int& OutByte) { //解码表 const char DecodeTable[] = { 0, 0, 0, 0, 0, 0
腾讯资深运维专家周小军：QQ与微信架构的惊天秘密 ronin47
社交领域一直是互联网创业的大热门，从PC到移动端，从OICQ、MSN到QQ。到了移动互联网时代，社交领域应用开始彻底爆发，直奔黄金期。腾讯在过去几年里，社交平台更是火到爆，QQ和微信坐拥几亿的粉丝，QQ空间和朋友圈各种刷屏，写心得，晒照片，秀视频，那么谁来为企鹅保驾护航呢？支撑QQ和微信海量数据背后的架构又有哪些惊天内幕呢？本期大讲堂的内容来自今年2月份ChinaUnix对腾讯社交网络运营服务中心
java-69-旋转数组的最小元素。把一个数组最开始的若干个元素搬到数组的末尾，我们称之为数组的旋转。输入一个排好序的数组的一个旋转，输出旋转数组的最小元素 bylijinnan java
public class MinOfShiftedArray { /** * Q69 旋转数组的最小元素 * 把一个数组最开始的若干个元素搬到数组的末尾，我们称之为数组的旋转。输入一个排好序的数组的一个旋转，输出旋转数组的最小元素。 * 例如数组{3, 4, 5, 1, 2}为{1, 2, 3, 4, 5}的一个旋转，该数组的最小值为1。 */ publ
看博客，应该是有方向的 Cb123456 反省看博客
看博客，应该是有方向的: 我现在就复习以前的，在补补以前不会的，现在还不会的，同时完善完善项目，也看看别人的博客. 我刚突然想到的: 1.应该看计算机组成原理，数据结构，一些算法，还有关于android,java的。 2.对于我，也快大四了，看一些职业规划的，以及一些学习的经验，看看别人的工作总结的. 为什么要写
[开源与商业]做开源项目的人生活上一定要朴素,尽量减少对官方和商业体系的依赖 comsci 开源项目
为什么这样说呢？因为科学和技术的发展有时候需要一个平缓和长期的积累过程，但是行政和商业体系本身充满各种不稳定性和不确定性，如果你希望长期从事某个科研项目，但是却又必须依赖于某种行政和商业体系，那其中的过程必定充满各种风险。。。所以，为避免这种不确定性风险，我
一个 sql优化（[精华] 一个查询优化的分析调整全过程！很值得一看） cwqcwqmax9 sql
见 http://www.itpub.net/forum.php?mod=viewthread&tid=239011 Web翻页优化实例提交时间: 2004-6-18 15:37:49 回复发消息环境： Linux ve
Hibernat and Ibatis dashuaifu Hibernate ibatis
Hibernate VS iBATIS 简介 Hibernate 是当前最流行的O/R mapping框架，当前版本是3.05。它出身于sf.net，现在已经成为Jboss的一部分了 iBATIS 是另外一种优秀的O/R mapping框架，当前版本是2.0。目前属于apache的一个子项目了。相对Hibernate“O/R”而言，iBATIS 是一种“Sql Mappi
备份MYSQL脚本 dcj3sjt126com mysql
#!/bin/sh # this shell to backup mysql #[email protected] (QQ:1413161683 DuChengJiu) _dbDir=/var/lib/mysql/ _today=`date +%w` _bakDir=/usr/backup/$_today [ ! -d $_bakDir ] && mkdir -p
iOS第三方开源库的吐槽和备忘 dcj3sjt126com ios
转自 ibireme的博客做iOS开发总会接触到一些第三方库，这里整理一下，做一些吐槽。目前比较活跃的社区仍旧是Github，除此以外也有一些不错的库散落在Google Code、SourceForge等地方。由于Github社区太过主流，这里主要介绍一下Github里面流行的iOS库。首先整理了一份 Github上排名靠
html wlwmanifest.xml eoems html xml
所谓优化wp_head()就是把从wp_head中移除不需要元素，同时也可以加快速度。步骤：加入到function.php remove_action('wp_head', 'wp_generator'); //wp-generator移除wordpress的版本号，本身blog的版本号没什么意义，但是如果让恶意玩家看到，可能会用官网公布的漏洞攻击blog remov
浅谈Java定时器发展 hacksin java 并发 timer 定时器
java在jdk1.3中推出了定时器类Timer,而后在jdk1.5后由Dou Lea从新开发出了支持多线程的ScheduleThreadPoolExecutor，从后者的表现来看，可以考虑完全替代Timer了。 Timer与ScheduleThreadPoolExecutor对比： 1. Timer始于jdk1.3,其原理是利用一个TimerTask数组当作队列
移动端页面侧边导航滑入效果 ini jquery Web html5 css javascirpt
效果体验：http://hovertree.com/texiao/mobile/2.htm可以使用移动设备浏览器查看效果。效果使用到jquery-2.1.4.min.js，该版本的jQuery库是用于支持HTML5的浏览器上，不再兼容IE8以前的浏览器，现在移动端浏览器一般都支持HTML5，所以使用该jQuery没问题。HTML文件代码： <!DOCTYPE html> <h
AspectJ+Javasist记录日志 kane_xie aspectj javasist
在项目中碰到这样一个需求，对一个服务类的每一个方法，在方法开始和结束的时候分别记录一条日志，内容包括方法名，参数名+参数值以及方法执行的时间。 @Override public String get(String key) { // long start = System.currentTimeMillis(); // System.out.println("Be
redis学习笔记 MJC410621 redis NoSQL
1)nosql数据库主要由以下特点：非关系型的、分布式的、开源的、水平可扩展的。 1，处理超大量的数据 2，运行在便宜的PC服务器集群上， 3，击碎了性能瓶颈。 1)对数据高并发读写。 2)对海量数据的高效率存储和访问。 3)对数据的高扩展性和高可用性。 redis支持的类型： Sring 类型 set name lijie get name lijie set na
使用redis实现分布式锁 qifeifei
在多节点的系统中，如何实现分布式锁机制，其中用redis来实现是很好的方法之一，我们先来看一下jedis包中，有个类名BinaryJedis,它有个方法如下： public Long setnx(final byte[] key, final byte[] value) { checkIsInMulti(); client.setnx(key, value); ret
BI并非万能，中层业务管理报表要另辟蹊径张老师的菜大数据 BI 商业智能信息化
BI是商业智能的缩写，是可以帮助企业做出明智的业务经营决策的工具，其数据来源于各个业务系统，如ERP、CRM、SCM、进销存、HER、OA等。 BI系统不同于传统的管理信息系统，他号称是一个整体应用的解决方案，是融入管理思想的强大系统：有着系统整体的设计思想，支持对所有
安装rvm后出现rvm not a function 或者ruby -v后提示没安装ruby的问题 wudixiaotie function
1.在~/.bashrc最后加入 [[ -s "$HOME/.rvm/scripts/rvm" ]] && source "$HOME/.rvm/scripts/rvm" 2.重新启动terminal输入： rvm use ruby-2.2.1 --default 把当前安装的ruby版本设为默

SQL on Hadoop最新进展2-转载

你可能感兴趣的:(转载文章)