javafan_303

hive选型讨论

网上两个人的牛人牛语，bigtable要淘汰了？google的数据挖掘基本上用的是MPI,而非mapreduce ？百度的hypertable真不行吗？

大家边看边学吧

梁建:    hive 主要用于结构化数据吗？
我:    结构化数据
梁建:    hadoop 0.19.1 和那个 hive 版本配置
我:    它走的是传统数据库, 有compiler解析sql,形成mapreduce任务
我:    hive都支持,不过要改下配置
hivefans: hive做数据仓库的分析/统计
我:    hive要做到数据仓库，还早着
梁建:     google 的三架马车不是 mapreduce, gfs , bigtable

我:    为什么一定要学google?你的思维太定势了
梁建:    正好对应 mapreduce hdfs hbase

我:    而且google还有很多没有公开的东西
梁建:    是呀

我:    google的数据挖掘基本上用的是MPI,而非mapreduce
我:    MPI从bigtable读数据了
梁建:    我的意思是   hive 对应 google 的什么
我:    没有
梁建:    哦
梁建:    那我也改用 hive
hivefans:\t ...
我:    你要看你的应用
我:    facebook的hive只限应用于日志分析
梁建:    我主要做大规模结构化数据表的查询
我:    那就合适了
我:    注意还有一个，不是实时的，是批量作业的
梁建:    一般都是几十亿行的oracle 数据
梁建:    那我点一个查询按钮，hive还不能实时的结果？
hivefans:\t 数据仓库一般不是实时的数据
我:    你想实时的那不靠谱
梁建:    你说的批量作业是什么意思
梁建:    我的意思是准实时 <2分钟

我:    那不是hive的特长

hivefans: 1 数据不是实时的
2 数据量大也要等半天...
梁建:    那在 hadoop 上什么东东能做大量的数据查询
梁建:    分布式的
hivefans: 如果你是想要Oracle的典型应用的话
hadoop上没有那种东东
hivefans: 如果你的数据是非结构化的
比如文档就用hbase吧
梁建:    我现在是结构化的数据
梁建:    就是想实现分布式计算
梁建:    和分布式存储
hivefans: 用mysql/PostgreSQL的集群吧
梁建:    郁闷，那我不是白学 hadoop 了
我:    推荐greenplum,或者直接mysql-proxy作shard得了
梁建:    我想用 hadoop
我:    [/擦汗]
hivefans: 或者Oracle的RAC...也凑合
我:    rac集群上不去
hivefans: greenplum也是数据仓库
梁建:    我想试试 hive

梁建:    hive 是分布式存储？
hivefans: 是
梁建:    那 hadoop + hive 就可以解决我的问题啊
梁建:    为什么不建议让我用呢
hivefans: 你是要从几亿条数据中查询一条或几条数据吗
梁建:    是在不行我先放上 1G 的表看看总能实时出吧
梁建:    我要从几亿条数据中查询200条左右数据吗
hivefans: 那就不适合
梁建:    我要从几亿条数据中查询200条左右数据
梁建:    为什么不适合
hivefans: hive是做统计的
梁建:    慢？
hivefans: 数据仓库和数据库是两码事
hivefans: 结构就不一样
梁建:    那 hbase 适合几亿条数据中查询200条左右数据

梁建:    ？
我:    hive实质上是hadoop的一个客户端,只是把产生mapreduce任务用一个sql编译器自动化了
hivefans: 嗯嗯
我:    数据仓库的东西一般不会删掉，而且不会改变
hivefans: 玩多了关系型数据库思想就有局限了哈
梁建:    数据库适合 update 事物操作
数据仓库适合查询操作
我说的不对吗？
hivefans: hbase是column-oriented的
传统关系数据库是row-oriented的
hivefans: 数据仓库适合聚合运算
hivefans: 比如sum avg这类的运算
梁建:    那你做报表和查询有什么区别，
大多数报表是把数据先算好，然后再展现出来呀
梁建:    我查询也可以有 sum avg 运算啊
hivefans: 数据仓库没有明细信息...
梁建:    啊，我们的oracle 数据仓库都有详细信息
梁建:    都20T了
梁建:    全是详细信息
hivefans: 放进去是详细信息
hivefans: 展现的不是
梁建:    展现的是汇总的
梁建:    我知道
梁建:    hive 做报表的案例有没有？
hivefans: 没见过
找facebook要吧....
梁建:    哎，你们都挺厉害的，技术很强
hivefans: 我技术一般只会忽悠
我:    facebook不在hive上直接做报表
梁建:    hive 好用吗？
我:    hive处理完数据后, 会传给oracle
梁建:    bug 多吗？
我:    bug 非常多
我:    不过还是可以用D

hivefans: facebook的特点嗯嗯
梁建:    啊，晕
梁建:    为什么要传给 oracle?
我:    oracle好查啊
我:    查得快,而且有BI工具可以连上去
hivefans: 这样啊才听说
梁建:    要用 orlce ,就直接用 oralce
梁建:    来回传麻烦
我:    oracle rac吃不消哦
我:    不是回传
我:    他们的日志先经过hive,再给oracle结果
我:    日志是文本的,oracle可吃不消。
梁建:    不过好多报表服务器就是 oracle 数据库的
我:    一天就有2T多
梁建:    想 congnos
我:    yep.
我:    MicroStrategy
梁建:    现在 hadoop 的应用主要有哪些
梁建:    和数据库有关的
梁建:    用 hive 不用写 mapreduce 程序？
我:    基本上是,但有时候你得写UDF或者python之类的程序
梁建:    我不会 UDF或者python ，能不能用 mapreduce 替代掉
我:    UDF就是用java写, 用户自定义函数的缩写
我:    sql的表意能力有限，你得扩展它
我:    cloudbase还支持UDT了
我:    用户自定义类型
梁建:    哦，多谢
梁建:    我现在就配置个环境试试
梁建:    你们经常用这个啊
梁建:    敢觉你们都很熟
梁建:    cloudbase 是另外一个东西吧，好像不是 hive 的
hivefans: 嗯嗯
我:    这东西我看过源码,不行
梁建:    那用那个好
梁建:    那个速度快
我:    hive好。　cloudbase设计上败笔太多,以后很麻烦
梁建:    好，多谢了
CYan羽: hypertable呢？
hivefans: 和hbase差不多
我:    hypertable性能nb, 稳定性极差。百度用这个
我:    而且百度是赞助商之一
CYan羽: 看了一下都0.9了，版本涨的神快
hivefans: 百度好差啊...
hivefans: 搞啥啥不行
梁建:    不是吧
CYan羽: 赞助商而已，也不是他们在搞吧
没有人: 测试过没有？
CYan羽: hypertable用C写的周期是要长一点，比hbase起步也晚
hivefans: cpp
我:    百度很早就在搞了
没有人: 谁在研究Hypertable？
comsci[神父]: 本文作者
CYan羽: 原本也是hbase里跑出来的一堆人
CYan羽: 最早的时候也没百度什么事
comsci[神父]: 21nw.com/2009/01/04/高性能数据库hypertable/
梁建:    你们在抖知道这些内幕
comsci[神父]: http://blog.csdn.net/xpspace/archive/2008/05/22/2470904.aspx
comsci[神父]: http://www.hudong.com/wiki/HyperTable
comsci[神父]: 搜索引擎公司Zvents以Google发布的BigTable为基础，推出的一款开源分布式数据储存系统。新软件MHypertable是按照1000节点比例设计，刚刚发布0.9 alpha测试版，已经在10个节点上测试过。
Hypertable 是由Zvents设计的BigTable clone开放原始码专案，以 C++撰写，可架在 HDFS 和 KFS 上。尽管还在初期阶段，但已有不错的效能：写入 28M 列的资料，各节点写入速率可达7MB/s，读取速率可达 1M cells/s。
Hypertable是根据Google的9位研究人员在2006年发表的一篇论文《Bigtable：结构化数据的分布存储系统》开发的，Bigtable 是Google内部使用的文件储存系统。
CYan羽: [图片] Bigtable是数据库......
Chen: google的文件系统是gfs
梁建:    hive 有没有 web 监控页面
梁建:    像 http:/localhost:50070/    这样的 namenode
梁建:    web监控页面
梁建:    hive load data 的 0.dat 文件是什么格式的，和oracle 的文本文档格式一样吗
梁建:    哪有hive 的语法文档
梁建:    hive 区分大小写？
梁建:    为什么我的 hive 只有 map100% reduce 0%
梁建:    load data local inpath .......
都对了
梁建:    select 结果都出来了，中文全是乱码
梁建:    hypertable 和 hive 的主要功能有区别吗?
梁建:    郁闷
梁建:    是不是一般的 select (不带 sum,avg) 都只有 map 没有 reduce 运算
我:    yep
我:    如果有join就不是了
我:    你想像一下，你要做到select的效果是怎么做的,就知道为什么是这样运行了
梁建:    那hive 更适合作那种经营分析应用
梁建:    hive 支持 join ?
我:    equal join
梁建:    那个地方有 hive 语法说明资料
梁建:    我找到的都是 api的
我:    http://wiki.apache.org/hadoop/Hive/LanguageManual
梁建:    多谢
我:    不客气
梁建:    我可以用 java 写前台程序调用后台的hadoop的hive 实现查询的操作，然后在用java 处理Hql查询的结果 ,并用 java 程序将结果显示在前台
梁建:    这样不就实现了准实时查询？
梁建:    我这样的想法对不对阿
梁建:    hive 好像不支持 delete
梁建:    ？
我:    to梁建,我貌似说过了数据仓库的特征之一，就是很少删东西
梁建:    哦，知道了
我:    共享里面可以下载了
梁建:    写的不错了
梁建:    现在知道这块东西的人少
梁建:    能写成这样已经不错了
梁建:    恩   咋样用自己写的 java 程序调用 hive 呢？
我:    hive有一个类 HiveServer
我:    它提供了一个thrift服务
梁建:    哦，就是直接写客户端的 java 类和 hive 的 HiveServer thrift服务交互访问
我:    to梁建:    right
梁建:    这样就能够实现 java 使用分布式数据仓库hive了
我:    呵呵. 但它那个HiveServer有问题
我:    session的处理, 而且不能用UDF
梁建:    呵呵，我觉得你还是走在大家的前面 HiveServer 有什么问题
我:    session的处理问题
梁建:    session的处理, 而且不能用UDF
有什么影响
我:    搞应用的话，没有UDF，那没法搞哦
我:    不过我已经解决了
梁建:    和 jsp 的 session 一样吗？
我:    不懂web
我:    一个client连server，就是一道session了
梁建:    我是做 web 的
我:    各session有自己状态的
梁建:    这个知道
我:    hive没处理好
梁建:    他是什么协议 socket?
我:    嗯
梁建:    那你是处理好了是用什么？也是socket ?
我:    socket不是协议吧, 只是IPC技术。协议是thrift, facebook开源出去的,挺方便的
梁建:    对，我刚说错了
梁建:    thrift 没有听说过
梁建:    UDF 又是什么东东
我:    UDF = user defined function
梁建:    哦，这回印象深刻了
梁建:    这个UDF 可有可无，只要有一个HiveServer 接口能让我拿到数据，我前台写函数也是一样能完成功能的
我:    definitely not

我:    你前台写的函数只运行在client
梁建:    是的
我:    这个UDF得在集群的每个计算节点都运行
梁建:    哦，知道了
梁建:    就是并行性能好
梁建:    网上有没有这样现成的 code
梁建:    我今天没有来的及看他自带的 example
我:    没有,事实上hive也没很好的实现。
梁建:    哦，他自带的 example 里有 HiveServer ?

梁建:    我有空看看学习一下
我:    哪个example?
梁建:    下载的安装文件里应该有
梁建:    理论上
梁建:    下载的安装文件里的 example 理论上
应该有
梁建:    不知道是不是这样的
我:    不知道你指的是
梁建:    hive 支持不支持存储过程
我:    [/流汗]
梁建:    在这里存储过程
就有点像 UDF
我:    你没掌握它的设计理念
梁建:    了
我:    UDF和存储过程两码事
我:    在任何数据库都是这样
梁建:    我知道 oracle 也有用户自定义函数
梁建:    我知道 oracle 也有用户自定义存储过程
梁建:    就是那个 hadoop/ contrib   /hive /example
梁建:     大概是这个目录吧我忘了
我:    [/流汗]
我:    hive已经独立出来了
梁建:    我还用的老版本的
梁建:    我用的 hadoop 0.19.1 上自带的 hive
梁建:    没太大区别吧
我:    我看看它的svn地址
我:    貌似不是一致的
我:    svn co http://svn.apache.org/repos/asf/hadoop/hive/ hive
梁建:    我今天试了一下 hql 都能用
梁建:    基本一致
梁建:    你用的 hadoop 那个版本的
梁建:    coderplay ？
我:    0.19.0 这个不大稳定
梁建:    就是我感觉到了
梁建:    你用的那个
梁建:    版本
梁建:    Hive 不是有 JDBC Interface ？
梁建:    干嘛还要 socket ?

我:    完全不能用
梁建:    JDBC Interface 完全不能用
？

我:    对
我:    仔细看它的代码
我:    我夜宵去了 -____-
梁建:    meta. server 是干什用的
梁建:    那个 meta. server 好
梁建:    hive 的 jdbc 咋不能用
梁建:    是 derby 的问题？
梁建:    meta. server 和 derby   是什么关系？
梁建:    求助啊
我:    metaserver是一个为hive提供元数据服务的server
我:    derby是一个嵌入式的数据库
我:    metaserver从derby中取出的数据就是hive的元数据
我:    不一定非得使用derby, hive使用了jpox,使得可以连接derby, mysql, orcale等数据库
我:    它们存储了hive的元数据信息
梁建:    元数据信息是什么信息？能不能举个例子
我:    元数据是指hive的表,列等相关信息
我:    你的DDL语句,会改变元数据
梁建:    那就表结构的信息？
梁建:    好像通过 jdbc 可以执行hive 查询？

我:    不可以
我:    目前的不成熟
hivefans: 那目前hive的jdbc能做什么
梁建:    咋样知道 jdbc 是否配置好了
梁建:    我的 web interface 调证好了

梁建:    但是 web页面里有个 browse schema 报错
梁建:    其它的 hwi 都可以用
梁建:    报错好像就是 jpox 连 derby 的问题

梁建:    但是我在 hive> show tables ; 都是好的
梁建:    hive > create table .....也是好的
梁建:    这说明了是我的 derby 没有配置好？
梁建:    对吗
梁建:    我看官方现在给了一个 jdbc l链接的例子，上面说可以直接链接
我:    没有用了. 你看它的jdbc代码就知道了
我:    没有获取metadata
我:    还有很多接口没实现
我:    比ResulSet.getString(String label),没实现
梁建:      if (standAloneServer) {

            // get connection

        con = DriverManager.getConnection("jdbc:hive://localhost:10000/default", "", "");

      }
else {

        con = DriverManager.getConnection("jdbc:hive://", "", "");

      }
梁建:    res = stmt.executeQuery("select * from " + tableName);

我:    没有用了. 你看它的jdbc代码就知道了
        没有获取metadata
    还有很多接口没实现
    比如ResulSet.getString(String label),没实现

梁建:
那怎样才能把 derby 和hive 调通呢
梁建:    derby 和hive 之间还夹了一个 jpox 是把
我:    yep
梁建:    英文的配置文档说的太简单了
梁建:    那我的环境中现在就是 derby 没有配置好，或者是 jpox 的问题

但是 derby 没有配置好得可能性大
梁建:    理论上通过 jdbc 连接 derby 和 Thrift Hive Server   能够实现的功能是一样的吧？
梁建:    Thrift Hive Server 不需要 derby 吧？
我:    jdbc就是HiveServer的一个特殊的客户端
我:    你没理解哦
梁建:    啊，那我要先启动 HiveServer 才能用 jdbc 啊
梁建:    这么说 HiveServer 也用 derby 数据库了？你不是说 Thrift Hive Server 是socket ?
梁建:    难到   Thrift Hive Server 是建立在数据库上的？
梁建:    derby 数据库可以分布在各各 slave 上？
梁建:    derby 数据库实现的并行计算？
hivefans: 只是Name Node要derby吧
hivefans: derby 数据库只是存metadata
我:    hivefans说对了后面那句
梁建:    我用hive web interface 的时候浏览文件目录时报错就是 jpox 连接 derby失败
我:    查wiki,有教怎么配置
梁建:    好
那就是derby 数据库只能安装在一个机器上，derby 数据库没有并行计算的能力，hadoop 帮derby 完成了并行计算
对吗？
我:    no
hivefans: no
梁建:    那应该是什么呢？
我:    derby只是存metadata, HDFS上存大文件, 不适合随机读取,所以把metadata的信息存在别的数据库(如derby, mysql)之上,这样更好查询.
我:    查询的是metadata
hivefans: http://rdc.taobao.com/blog/dw/archives/266
我:    当然也可以不是derby,可以用不jpox, 文本都可以
hivefans: 那连接是个配置hive的
梁建:    hivefans(8615615) 15:31:20
那连接是个配置hive的

这个我已经测通了
梁建:    hive 里的表里的内容（如： 200901梁建: 男 00000001 ）是存储在 HDFS上的大文件里还是 derby里？
我:    hdfs
梁建:    哦，这样的啊
hivefans: derby里大约存的是某个块存在哪个机
我:    create table profile(name string, id string)
        那表名 profile, 列名name,id,都存在derby里
梁建:    知道了
梁建:    既然我 hive> show tables ; 都能用就说明我 derby 没有问题
问题在 jpox 连接 derby
梁建:    多谢
梁建:    hadoop 这样的存储有点像 cognos
梁建:    把报表的结构样式全存在 oracle 数据库中
我:    我夜宵去了 -___-
梁建:    好
我:    bye

ubuntu FreeRadius服务器安装 flowHEHE ubuntu系统安装 ubuntu 服务器
1、获取安装源（1）wgethttps://github.com/FreeRADIUS/freeradius-server/archive/v3.0.x.zip（2）unzipv3.0.x.zip（3）cdfreeradius-server-3.0.x/2、创建ubuntu相关依赖（1）sudoapt-getinstalldevscriptsquiltdebhelperfakerootequivs
Hbase和关系型数据库、HDFS、Hive的区别别这么骄傲 hive hbase 数据库
目录1.Hbase和关系型数据库的区别2.Hbase和HDFS的区别3.Hbase和Hive的区别1.Hbase和关系型数据库的区别关系型数据库Hbase存储适合结构化数据，单机存储适合结构化和半结构数据的松散数据，分布式存储功能（1）支持ACID（2）支持join（3）使用主键PK（4）数据类型：int、varchar等（1）仅支持单行事务（2）不支持join，把数据糅合到一张大表（3）行键ro
大数据基础知识-Hadoop、HBase、Hive一篇搞定原来是猪猪呀 hadoop 大数据分布式
HadoopHadoop是一个由Apache基金会所开发的分布式系统基础架构，其核心设计包括分布式文件系统（HDFS）和MapReduce编程模型；Hadoop是一个开源的分布式计算框架，旨在帮助用户在不了解分布式底层细节的情况下，开发分布式程序。它通过利用集群的力量，提供高速运算和存储能力，特别适合处理超大数据集的应用程序。Hadoop生态圈Hadoop生态圈是一个由多个基于Hadoop开发的相
Hadoop、HDFS、Hive、Hbase区别及联系静心观复大数据 hadoop hdfs hive
Hadoop、HDFS、Hive和HBase是大数据生态系统中的关键组件，它们都是由Apache软件基金会管理的开源项目。下面将深入解析它们之间的区别和联系。HadoopHadoop是一个开源的分布式计算框架，它允许用户在普通硬件上构建可靠、可伸缩的分布式系统。Hadoop通常指的是整个生态系统，包括HadoopCommon（共享库和工具）、HadoopDistributedFileSystem(
Python 进攻性渗透测试（一）
原文：annas-archive.org/md5/dccde1d96c9ad81f97529d78e3e69c9b译者：飞龙协议：CCBY-NC-SA4.0序言Python是一种易学的跨平台编程语言，具有无限的第三方库。许多开源黑客工具都是用Python编写的，可以轻松地集成到你的脚本中。本书被分成了清晰的小部分，你可以按照自己的节奏学习，并专注于对你最有兴趣的领域。你将学会如何编写自己的脚本，并
Python 进攻性渗透测试（二）
原文：annas-archive.org/md5/dccde1d96c9ad81f97529d78e3e69c9b译者：飞龙协议：CCBY-NC-SA4.0第四章：追捕我吧！在今天的世界里，绕过和劫持软件在互联网上到处都是。然而，明确的使用和执行方式才是让你成为一名优秀的业余黑客的关键。这可以通过正确选择工具并遵循必要的过程，完美地完成手头的任务来实现。在本章中，我们将涵盖以下主题，帮助你实现这一
大数据面试题之Hive(1) 小的~~ 大数据大数据 hive hadoop
说下为什么要使用Hive?Hive的优缺点?Hive的作用是什么?说下Hive是什么?跟数据仓库区别?Hive架构Hive内部表和外部表的区别?为什么内部表的删除，就会将数据全部删除，而外部表只删除表结构?为什么用外部表更好?Hive建表语句?创建表时使用什么分隔符?Hive删除语句外部表删除的是什么?Hive数据倾斜以及解决方案Hive如果不用参数调优，在map和reduce端应该做什么Hive
centos使用wget下载jdk8 任意放逐 centos java linux
首先官网找需要的的jdk版本https://www.oracle.com/java/technologies/javase/javase8u211-later-archive-downloads.html我这里选择的是弹出下载提示框：勾选点Downloadjdk…这里需要使用一个账号登录，可以自行在网上搜一个账号，我就不给了。然后退回原来的页面下载，用一个能看到下载链接的软件下载，我使用的是idm
Qt Creator 11.0创建ROS2 Humble工程余加木 ROS2 Qt qt 开发语言
QtCreator11.0创建ROS2Humble项目工程安装ROSProjectManager插件创建ROS2项目在src下添加packagegitcloneROS2功能包编译运行安装ROSProjectManager插件安装ROSProjectManager的主要流程参考官方的流程，地址（ros_qtc_plugin）。此处采用二进制安装：sudoaptinstalllibarchive-to
ORACLE 正确删除归档日志的方法俗尘某某程序员记录 oracle 归档日志
ORACLE正确删除归档日志的方法我们都知道在controlfile中记录着每一个archivelog文件的相关信息，当然们在OS下把这些物理文件delete掉后，在我们的controlfile中仍然记录着这些archivelog文件的相关信息，在oracle的OEM管理器中有可视化的日志展现出，当我们手工清除archive目录下的文件后，这些记录并没有被我们从controlfile中清除掉，也就
Java web开发常见中间件多版本下载备用却诚Salong 安装问题和解决方法 java 中间件开发语言
备注：每次换电脑都要重新构建一下环境，下载找资源很麻烦，官网英文网页找个历史版本看不懂，还要慢慢去搜，所以直接整理一波，需要的自行收藏。1.nodejs自选版本下载：地址：https://nodejs.org/download/release/网速快，自选任何版本下载。2.maven自选版本下载：地址：https://archive.apache.org/dist/maven/maven-3/网速
GUI框架：谈谈框架 baozi3026 框架 command mfc button class string
转帖请注明出处http://www.cppblog.com/cexer/archive/2009/11/15/100988.html1开篇废话我喜欢用C++写GUI框架，因为那种成就感是实实在在地能看到的。从毕业到现在写了好多个了，都是实验性质的。什么拳脚飞刀毒暗器，激光核能反物质，不论是旁门左道的阴暗伎俩，还是名门正派的高明手段，只要是C++里有的技术都试过了。这当中接触过很多底层或是高级的技术
2024年Python最新统信UOS_麒麟KYLINOS上安装特定版本python_统信uos安装python 2401_84558914 程序员 python linux 服务器
准备解压…/16-libidn2-dev_2.0.5.1-1+dde_amd64.deb…正在解压libidn2-dev:amd64(2.0.5.1-1+dde)…/var/cache/apt/archives/libidn2-dev_2.0.5.1-1+dde_amd64.deb正在选中未选择的软件包libp11-kit-dev:amd64。准备解压…/17-libp11-kit-dev_0.2
鲲鹏CPU+麒麟操作系统arm环境安装MySQL 运维小乔 mysql 数据库
系统环境背景：CPU：鲲鹏920操作系统：Ky10SP3MySQL版本：8.4.2一、下载MySQL官网地址：https://downloads.mysql.com/archives/community/二：MySQL安装前准备2.1关闭防火墙[root@ky-b~]#systemctlstopfirewalld[root@ky-b~]#systemctldisablefirewalldRemov
如何在Ubuntu上运行Jar包？ wljslmz Linux技术 ubuntu jar linux
Java，一种广泛使用的面向对象编程语言，以其“编写一次，到处运行”的理念著称，是跨平台应用程序开发的首选。其核心优势在于Java虚拟机（JVM），它使得编写的Java代码能够在任何安装了JVM的设备上运行，无需重新编译。Ubuntu作为Linux发行版中的佼佼者，凭借其开源、稳定、易用的特性，成为了众多开发者部署Java应用的优选平台。Jar（JavaArchive）文件是一种归档文件格式，用于
织梦DedeCMS转WordPress asqq8
最近，有个用户找模板兔迁移网站，源站用的dede，需要转成wp，文章数量大概7000-8000篇，其中有个需求是保证旧文章的链接有效，在wp上的新文章与旧文章的链接类型不一样，所以这涉及到伪静态来处理跳转。虽然网上都很多教程，但是在这次导入过程中还是遇到过一些问题。以下教程是dede的数据表得与wp的数据表在同一个数据库下！要是不在，可以将dede_archives先导入到wp的数据库里。一般流程
拥抱Linux Mint，安装迅雷和微信 zhqh100 linux 运维服务器
迅雷的下载地址http://archive.kylinos.cn/kylin/partner/pool/com.xunlei.download_1.0.0.1_amd64.debLinuxMint自带的Transmission今天下载速度还可以，几兆的速度，挺满意的微信的下载地址https://linux.weixin.qq.com/搜狗拼音输入法虽然有官网，但官网最后说是支持Ubuntu20.0
使用datax进行mysql的表恢复是桃萌萌鸭~ mysql 数据库
DataXDataX是阿里巴巴集团内被广泛使用的离线数据同步工具/平台，实现包括MySQL、SQLServer、Oracle、PostgreSQL、HDFS、Hive、HBase、OTS、ODPS等各种异构数据源之间高效的数据同步功能。FeaturesDataX本身作为数据同步框架，将不同数据源的同步抽象为从源头数据源读取数据的Reader插件，以及向目标端写入数据的Writer插件，理论上Dat
spark写入hive表问题 qq_42265026 spark hive 大数据
1、httpclient发送post请求，当返回的数据过大时，报错socketclosed这个原因是客户端主动将连接关闭，根本原因是将httpclient。execute的返回结果closeableResponse作为a方法的返回结果，在b方法中进行解析虽然在b方法中没有关闭closeableResponse，但是在a方法中返回closeableResponse后，会进行httppost.real
spark解析压缩包数据，写入到hive表中 dbbigdata spark 大数据 hive
spark解析xxxxx.tar.gz形式的压缩包。压缩包里面是一个个的json文件或者zip的文件，zip里面是json文件。先用spark读取tar.gz的路径，然后开流传给newTarArchiveInputStream(newGZIPInputStream(file))去处理，大概的代码如下defmain(args:Array[String]):Unit={valroot:String=a
phpexcel 读取数据
http://extjs.org.cn/fatjames/archives/379require_once'/home/PHPExcel_1.8.0/PHPExcel/IOFactory.php';$reader=PHPExcel_IOFactory::createReader('Excel2007');//设置以Excel5格式(Excel97-2003工作簿)$PHPExcel=$reader
三七互娱GO面经及参考答案大模型大数据攻城狮 golang epoll B树原理幻读 go面试 go面经 mysql性能
MySQL有哪些存储引擎？MyISAM如何存储数字类型数据？MySQL拥有多种存储引擎，每种都有其独特的特性和适用场景。常见的存储引擎包括InnoDB、MyISAM、Memory、CSV、Archive、Federated等。InnoDB是MySQL5.5版本之后的默认存储引擎，它支持事务、外键、行级锁和崩溃恢复功能，适合处理高并发事务型应用。MyISAM是早期MySQL的默认存储引擎，不支持事务
统信UOS（Linux）安装nvm node管理工具高高i linux 运维服务器 UOS 统信 nvm安装
整篇看完再操作，有坑！！官网nvm官网按照官网方式安装，一直报错经过不断研究，正确步骤如下1、下载安装包可能因为网络安全不能访问github，我是链接热点下载的wgethttps://github.com/nvm-sh/nvm/archive/refs/tags/v0.39.1.tar.gz2、解压可能报mkdir无权限，所以需要使用sudo执行解压命令，可能报找不到文件【v0.39.1.tar.
cydia软件路径_在Cydia中提取Deb格式安装包文件
大家都知道越狱后可以安装deb格式的文件包了，并且我们经常看到一些大神在论坛分享一些deb格式的文件或插件，他们是如何提取出来的呢？本文就给大家介绍一下在Cydia中提取Deb格式安装包文件教程。Cydia下载的deb文件在哪，怎么提取出来？cydia下载的deb在/private/var/cache/apt/archives目录下，提取方式：1、用cydia安装软件后，系统提示“重新启动设备”或
Spark教程3：SparkSQL最全介绍 Cachel wood 大数据开发 spark 大数据分布式计算机网络 AHP 需求分析
文章目录SparkSQL最全介绍一、SparkSQL概述二、SparkSession：入口点三、DataFrame基础操作四、SQL查询五、SparkSQL函数六、与Hive集成七、数据源操作八、DataFrame与RDD互转九、高级特性十、性能优化十一、Catalyst优化器十二、SparkSQL应用场景十三、常见问题与解决方法SparkSQL最全介绍一、SparkSQL概述SparkSQL是A
打造个性化HiveSQL格式化插件：Hql_formatter实战大思兄的视界
本文还有配套的精品资源，点击获取简介：在软件开发中，代码格式化对于保持代码整洁和提升可读性至关重要。对于HiveSQL，一种用于大数据处理的查询语言，格式化工具可以显著提高开发效率。本项目名为Hql_formatter，是一个为SublimeText定制的HiveSQL格式化插件，通过改良现有的Python库sqlbutifier和sqlparse，实现了满足特定HiveSQL格式化需求的功能。开
编译gcc踩坑记录——libtool: error: ‘/usr/local/lib/libgmp.la‘ is not a valid libtool archive feige4242 linux 运维服务器
安装gcc依赖过程中出现错误，解决方法在google找到的。三个依赖如下：libgmplibmpfr依赖libgmplibmpc依赖libgmp、libmpfr直接就无脑（网上很多教程，这里就不赘述了）./configure--prefix=/home/xx/make&&makeinstall然后在libmpc时候就报错了：libtool:error:'/usr/local/lib/libgmp.
libtool: error: ‘/usr/.local/lib/libgmp.la‘ is not a valid libtool archive WSSWWWSSW 服务器 linux 运维
背景：安装gcc时提示需要vc++11，然后安装gcc依赖gmp、mpfr、mpc。到mpcmake时出错：libtool:error:‘/usr/.local/lib/libgmp.la’isnotavalidlibtoolarchive详细：/usr/bin/grep:/usr/.local/lib/libgmp.la:Nosuchfileordirectory/usr/bin/sed:can
新版azkaban4.0编译安装教程码农界的老油条 azkaban4.0 java
新版azkaban4.0编译安装教程由于官方没有提供安装包所以需要下载源码，按照本文安装可以完美运行解压wgethttps://github.com/azkaban/azkaban/archive/refs/tags/4.0.0.tar.gztar-zxvf4.0.0.tar.gz-C/opt/software/cdazkaban-4.0.0没有安装git的话需要先安装https://gradle
Harmony中的HAP、HAR、HSP区别云杰zd harmonyos 动画华为
HarmonyOS中的HAP、HAR、HSP区别详解1.基本概念HAP(HarmonyAbilityPackage)定义：应用安装和运行的基本单元特点：包含代码、资源、第三方库及配置文件支持声明Ability和Page分为Entry（主模块）和Feature（特性模块）两种类型HAR(HarmonyArchive)定义：静态共享包特点：编译态复用不支持声明Ability和Page适用于二三方库共享
ASM系列六利用TreeApi 添加和移除类成员 lijingyao8206 jvm 动态代理 ASM 字节码技术 TreeAPI
同生成的做法一样，添加和移除类成员只要去修改fields和methods中的元素即可。这里我们拿一个简单的类做例子，下面这个Task类，我们来移除isNeedRemove方法，并且添加一个int 类型的addedField属性。 package asm.core; /** * Created by yunshen.ljy on 2015/6/
Springmvc-权限设计 bee1314 spring Web jsp
万丈高楼平地起。权限管理对于管理系统而言已经是标配中的标配了吧，对于我等俗人更是不能免俗。同时就目前的项目状况而言，我们还不需要那么高大上的开源的解决方案，如Spring Security，Shiro。小伙伴一致决定我们还是从基本的功能迭代起来吧。目标： 1.实现权限的管理（CRUD） 2.实现部门管理（CRUD) 3.实现人员的管理（CRUD） 4.实现部门和权限
算法竞赛入门经典（第二版）第2章习题 CrazyMizzz c 算法
2.4.1 输出技巧 #include <stdio.h> int main() { int i, n; scanf("%d", &n); for (i = 1; i <= n; i++) printf("%d\n", i); return 0; } 习题2-2 水仙花数(daffodil
struts2中jsp自动跳转到Action 麦田的设计者 jsp webxml struts2 自动跳转
1、在struts2的开发中，经常需要用户点击网页后就直接跳转到一个Action，执行Action里面的方法，利用mvc分层思想执行相应操作在界面上得到动态数据。毕竟用户不可能在地址栏里输入一个Action（不是专业人士） 2、＜jsp:forward page="xxx.action" /＞，这个标签可以实现跳转，page的路径是相对地址,不同与jsp和j
php 操作webservice实例 IT独行者 PHP webservice
首先大家要简单了解了何谓webservice，接下来就做两个非常简单的例子，webservice还是逃不开server端与client端。我测试的环境为：apache2.2.11 php5.2.10做这个测试之前，要确认你的php配置文件中已经将soap扩展打开，即extension=php_soap.dll; OK 现在我们来体验webservice //server端 serve
Windows下使用Vagrant安装linux系统 _wy_ windows vagrant
准备工作：下载安装 VirtualBox ：https://www.virtualbox.org/ 下载安装 Vagrant ：http://www.vagrantup.com/ 下载需要使用的 box ：官方提供的范例：http://files.vagrantup.com/precise32.box 还可以在 http://www.vagrantbox.es/
更改linux的文件拥有者及用户组(chown和chgrp) 无量 c linux chgrp chown
本文（转） http://blog.163.com/yanenshun@126/blog/static/128388169201203011157308/ http://ydlmlh.iteye.com/blog/1435157 一、基本使用：使用chown命令可以修改文件或目录所属的用户：命令
linux下抓包工具矮蛋蛋 linux
原文地址： http://blog.chinaunix.net/uid-23670869-id-2610683.html tcpdump -nn -vv -X udp port 8888 上面命令是抓取udp包、端口为8888 netstat -tln 命令是用来查看linux的端口使用情况 13 . 列出所有的网络连接 lsof -i 14. 列出所有tcp 网络连接信息 l
我觉得mybatis是垃圾！：“每一个用mybatis的男纸，你伤不起” alafqq mybatis
最近看了每一个用mybatis的男纸，你伤不起原文地址：http://www.iteye.com/topic/1073938 发表一下个人看法。欢迎大神拍砖；个人一直使用的是Ibatis框架，公司对其进行过小小的改良；最近换了公司，要使用新的框架。听说mybatis不错；就对其进行了部分的研究；发现多了一个mapper层；个人感觉就是个dao；
解决java数据交换之谜百合不是茶数据交换
交换两个数字的方法有以下三种，其中第一种最常用 /* 输出最小的一个数 */ public class jiaohuan1 { public static void main(String[] args) { int a =4; int b = 3; if(a<b){ // 第一种交换方式 int tmep =
渐变显示 bijian1013 JavaScript
<style type="text/css"> #wxf { FILTER: progid:DXImageTransform.Microsoft.Gradient(GradientType=0, StartColorStr=#ffffff, EndColorStr=#97FF98); height: 25px; } </style>
探索JUnit4扩展：断言语法assertThat bijian1013 java 单元测试 assertThat
一.概述 JUnit 设计的目的就是有效地抓住编程人员写代码的意图，然后快速检查他们的代码是否与他们的意图相匹配。 JUnit 发展至今，版本不停的翻新，但是所有版本都一致致力于解决一个问题，那就是如何发现编程人员的代码意图，并且如何使得编程人员更加容易地表达他们的代码意图。JUnit 4.4 也是为了如何能够
【Gson三】Gson解析{"data":{"IM":["MSN","QQ","Gtalk"]}} bit1129 gson
如何把如下简单的JSON字符串反序列化为Java的POJO对象? {"data":{"IM":["MSN","QQ","Gtalk"]}} 下面的POJO类Model无法完成正确的解析： import com.google.gson.Gson;
【Kafka九】Kafka High Level API vs. Low Level API bit1129 kafka
1. Kafka提供了两种Consumer API High Level Consumer API Low Level Consumer API(Kafka诡异的称之为Simple Consumer API，实际上非常复杂) 在选用哪种Consumer API时，首先要弄清楚这两种API的工作原理，能做什么不能做什么，能做的话怎么做的以及用的时候，有哪些可能的问题
在nginx中集成lua脚本：添加自定义Http头，封IP等 ronin47 nginx lua
Lua是一个可以嵌入到Nginx配置文件中的动态脚本语言，从而可以在Nginx请求处理的任何阶段执行各种Lua代码。刚开始我们只是用Lua 把请求路由到后端服务器，但是它对我们架构的作用超出了我们的预期。下面就讲讲我们所做的工作。强制搜索引擎只索引mixlr.com Google把子域名当作完全独立的网站，我们不希望爬虫抓取子域名的页面，降低我们的Page rank。 location /{
java-归并排序 bylijinnan java
import java.util.Arrays; public class MergeSort { public static void main(String[] args) { int[] a={20,1,3,8,5,9,4,25}; mergeSort(a,0,a.length-1); System.out.println(Arrays.to
Netty源码学习-CompositeChannelBuffer bylijinnan java netty
CompositeChannelBuffer体现了Netty的“Transparent Zero Copy” 查看API（ http://docs.jboss.org/netty/3.2/api/org/jboss/netty/buffer/package-summary.html#package_description）可以看到，所谓“Transparent Zero Copy”是通
Android中给Activity添加返回键 hotsunshine Activity
// this need android:minSdkVersion="11" getActionBar().setDisplayHomeAsUpEnabled(true); @Override public boolean onOptionsItemSelected(MenuItem item) {
静态页面传参 ctrain 静态
$(document).ready(function () { var request = { QueryString : function (val) { var uri = window.location.search; var re = new RegExp("" + val + "=([^&?]*)", &
Windows中查找某个目录下的所有文件中包含某个字符串的命令 daizj windows 查找某个目录下的所有文件包含某个字符串
findstr可以完成这个工作。 [html] view plain copy >findstr /s /i "string" *.* 上面的命令表示，当前目录以及当前目录的所有子目录下的所有文件中查找"string&qu
改善程序代码质量的一些技巧 dcj3sjt126com 编程 PHP 重构
有很多理由都能说明为什么我们应该写出清晰、可读性好的程序。最重要的一点，程序你只写一次，但以后会无数次的阅读。当你第二天回头来看你的代码时，你就要开始阅读它了。当你把代码拿给其他人看时，他必须阅读你的代码。因此，在编写时多花一点时间，你会在阅读它时节省大量的时间。让我们看一些基本的编程技巧：尽量保持方法简短尽管很多人都遵
SharedPreferences对数据的存储 dcj3sjt126com
SharedPreferences简介： &nbs
linux复习笔记之bash shell (2) bash基础 eksliang bash bash shell
转载请出自出处： http://eksliang.iteye.com/blog/2104329 1.影响显示结果的语系变量（locale） 1.1locale这个命令就是查看当前系统支持多少种语系，命令使用如下： [root@localhost shell]# locale LANG=en_US.UTF-8 LC_CTYPE="en_US.UTF-8"
Android零碎知识总结 gqdy365 android
1、CopyOnWriteArrayList add(E) 和remove(int index)都是对新的数组进行修改和新增。所以在多线程操作时不会出现java.util.ConcurrentModificationException错误。所以最后得出结论：CopyOnWriteArrayList适合使用在读操作远远大于写操作的场景里，比如缓存。发生修改时候做copy，新老版本分离，保证读的高
HoverTree.Model.ArticleSelect类的作用 hvt Web .net C#hovertree asp.net
ArticleSelect类在命名空间HoverTree.Model中可以认为是文章查询条件类，用于存放查询文章时的条件，例如HvtId就是文章的id。HvtIsShow就是文章的显示属性，当为-1是，该条件不产生作用，当为0时，查询不公开显示的文章，当为1时查询公开显示的文章。HvtIsHome则为是否在首页显示。HoverTree系统源码完全开放，开发环境为Visual Studio 2013
PHP 判断是否使用代理 PHP Proxy Detector 天梯梦 proxy
1. php 类 I found this class looking for something else actually but I remembered I needed some while ago something similar and I never found one. I'm sure it will help a lot of developers who try to
apache的math库中的回归——regression（翻译） lvdccyb Math apache
这个Math库，虽然不向weka那样专业的ML库，但是用户友好，易用。多元线性回归，协方差和相关性（皮尔逊和斯皮尔曼），分布测试（假设检验，t，卡方，G），统计。数学库中还包含，Cholesky，LU，SVD，QR，特征根分解，真不错。基本覆盖了：线代，统计，矩阵，最优化理论曲线拟合常微分方程遗传算法（GA），还有3维的运算。。。
基础数据结构和算法十三：Undirected Graphs (2) sunwinner Algorithm
Design pattern for graph processing. Since we consider a large number of graph-processing algorithms, our initial design goal is to decouple our implementations from the graph representation
云计算平台最重要的五项技术 sumapp 云计算云平台智城云
云计算平台最重要的五项技术 1、云服务器云服务器提供简单高效，处理能力可弹性伸缩的计算服务，支持国内领先的云计算技术和大规模分布存储技术，使您的系统更稳定、数据更安全、传输更快速、部署更灵活。特性机型丰富通过高性能服务器虚拟化为云服务器，提供丰富配置类型虚拟机，极大简化数据存储、数据库搭建、web服务器搭建等工作；仅需要几分钟，根据CP
《京东技术解密》有奖试读获奖名单公布 ITeye管理员活动
ITeye携手博文视点举办的12月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 12月试读活动回顾： http://webmaster.iteye.com/blog/2164754 本次技术图书试读活动获奖名单及相应作品如下：一等奖（两名） Microhardest：http://microhardest.ite

hive选型讨论

你可能感兴趣的:(hive)