smile0198

数据导入HBase最常用的三种方式及实践分析

【编者按】要使用Hadoop，数据合并至关重要，HBase应用甚广。一般而言，需要针对不同情景模式将现有的各种类型的数据库或数据文件中的数据转入至HBase 中。常见方式为：使用HBase的API中的Put方法；使用HBase 的bulk load 工具；使用定制的MapReduce Job方式。《HBase Administration Cookbook》一书对这三种方式有着详尽描述，由 ImportNew 的陈晨进行了编译，很有收获，推荐给大家。

HBase数据迁移（1）-使用HBase的API中的Put方法

使用HBase的API中的Put是最直接的方法，用法也很容易学习。但针对大部分情况，它并非都是最高效的方式。当需要将海量数据在规定时间内载入HBase中时，效率问题体现得尤为明显。待处理的数据量一般都是巨大的，这也许是为何我们选择了HBase而不是其他数据库的原因。在项目开始之前，你就该思考如何将所有能够很好的将数据转移进HBase，否则之后可能面临严重的性能问题。

HBase有一个名为 bulk load的功能支持将海量数据高效地装载入HBase中。Bulk load是通过一个MapReduce Job来实现的，通过Job直接生成一个HBase的内部HFile格式文件来形成一个特殊的HBase数据表，然后直接将数据文件加载到运行的集群中。使用bulk load功能最简单的方式就是使用importtsv 工具。importtsv 是从TSV文件直接加载内容至HBase的一个内置工具。它通过运行一个MapReduce Job，将数据从TSV文件中直接写入HBase的表或者写入一个HBase的自有格式数据文件。

尽管importtsv 工具在需要将文本数据导入HBase的时候十分有用，但是有一些情况，比如导入其他格式的数据，你会希望使用编程来生成数据，而MapReduce是处理海量数据最有效的方式。这可能也是HBase中加载海量数据唯一最可行的方法了。当然我们可以使用MapReduce向HBase导入数据，但海量的数据集会使得MapReduce Job也变得很繁重。若处理不当，则可能使得MapReduce的job运行时的吞吐量很小。

在HBase中数据合并是一项频繁执行写操作任务，除非我们能够生成HBase的内部数据文件，并且直接加载。这样尽管HBase的写入速度一直很快，但是若合并过程没有合适的配置，也有可能造成写操作时常被阻塞。写操作很重的任务可能引起的另一个问题就是将数据写入了相同的族群服务器（region server），这种情况常出现在将海量数据导入到一个新建的HBase中。一旦数据集中在相同的服务器，整个集群就变得不平衡，并且写速度会显著的降低。我们将会在本文中致力于解决这些问题。我们将从一个简单的任务开始，使用API中的Put方法将MySQL中的数据导入HBase。接着我们会描述如何使用 importtsv 和 bulk load将TSV数据文件导入HBase。我们也会有一个MapReduce样例展示如何使用其他数据文件格式来导入数据。上述方式都包括将数据直接写入HBase中，以及在HDFS中直接写入HFile类型文件。本文中最后一节解释在向HBase导入数据之前如何构建好集群。本文代码均是以Java编写，我们假设您具有基本Java知识，所以我们将略过如何编译与打包文中的Java示例代码，但我们会在示例源码中进行注释。

通过单个客户端导入MySQL数据

数据合并最常见的应用场景就是从已经存在的关系型数据库将数据导入到HBase中。对于此类型任务，最简单直接的方式就是从一个单独的客户端获取数据，然后通过HBase的API中Put方法将数据存入HBase中。这种方式适合处理数据不是太多的情况。

本节描述的是使用Put方法将MySQL数据导入HBase中的方式。所有的操作均是在一个单独的客户端执行，并且不会使用到MapReduce。本节将会带领你通过HBase Shell创建HBase表格，通过Java来连接集群，并将数据导入HBase。

准备

公共数据集合是个练习HBase数据合并的很好数据源。互联网上有很多公共数据集合。我们在本文中奖使用 “美国国家海洋和大气管理局 1981-2010气候平均值”的公共数据集合。访问http://www1.ncdc.noaa.gov/pub/data/normals/1981-2010/下载。

这些气候报表数据是由美国国家海洋和大气管理局（NOAA）生成的。在本文中，我们使用在目录 products | hourly 下的小时温度数据（可以在上述链接页面中找到）。下载hly-temp-normal.txt文件。
需要一个MySQL实例，在MySQL数据库中创建hly_temp_normal表格，使用如下的SQL命令：

[sql]  view plain copy   
     
    
 create table hly_temp_normal (  
 id INT NOT NULL AUTO_INCREMENT PRIMARY KEY,  
 stnid CHAR(11),  
 month TINYINT,  
 day TINYINT,  
 value1 VARCHAR(5),  
 value2 VARCHAR(5),  
 value3 VARCHAR(5),  
 value4 VARCHAR(5),  
 value5 VARCHAR(5),  
 value6 VARCHAR(5),  
 value7 VARCHAR(5),  
 value8 VARCHAR(5),  
 value9 VARCHAR(5),  
 value10 VARCHAR(5),  
 value11 VARCHAR(5),  
 value12 VARCHAR(5),  
 value13 VARCHAR(5),  
 value14 VARCHAR(5),  
 value15 VARCHAR(5),  
 value16 VARCHAR(5),  
 value17 VARCHAR(5),  
 value18 VARCHAR(5),  
 value19 VARCHAR(5),  
 value20 VARCHAR(5),  
 value21 VARCHAR(5),  
 value22 VARCHAR(5),  
 value23 VARCHAR(5),  
 value24 VARCHAR(5)  
 );  

本文提供了一些脚本将txt中的数据导入到MySQL表中。你可以使用 insert_hly.py 来加载每小时的NOAA数据。只需要修改脚本中的主机（host），用户（user），密码（password）以及数据名称（database name）。完成修改后就能够将下载的hly-temp-normal.txt数据导入到mysql的hly_temp_normal 表中，使用命令如下：
$ python insert_hly.py -f hly-temp-normal.txt -t hly_temp_normal

译者注：此处给出python脚本下载地址（https://github.com/uprush/hac-book/blob/master/2-data-migration/script/insert_hly.py）

（译者注：由于对于python的了解有限以及环境限制，所以单独另写了一段Java的代码，可以直接使用的：

[java]  view plain copy   
     
    
 import java.io.FileInputStream; import java.io.IOException; import java.io.InputStreamReader;  
     import java.io.Reader; import java.sql.Connection; import java.sql.DriverManager;  
     import java.sql.PreparedStatement; import java.sql.SQLException; import  
     java.util.ArrayList; import java.util.List; public class InsertHly { static  
     String user="root"; static String pwd="root123"; static String driver="com.mysql.jdbc.Driver";  
     static String url="jdbc:mysql://127.0.0.1:3306/htom?useUnicode=true&characterEncoding=UTF-8";  
     public static void main(String[] args) throws SQLException { Connection  
     baseCon = null; String sqlStr="insert into hly_temp_normal (stnid,month,day,value1,value2,value3,value4,value5,value6,value7,value8,value9,value10,value11,value12,value13,value14,value15,value16,value17,value18,value19,value20,value21,value22,value23,value24)  
     values (?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?)"; List parasValues=new  
     ArrayList(); try { baseCon = DriverManager.getConnection(url, user, pwd);  
     } catch (SQLException e) { // TODO Auto-generated catch block e.printStackTrace();  
     } // 替换为文件地址 String allRowsStr=readFileByChars("d:\\TestZone\\hly-temp-normal.txt",  
     "gbk"); String[] rows=allRowsStr.split("\n"); for(String row : rows){ parasValues.add(row.split("\\s+"));  
     } PreparedStatement basePsm = null; try { baseCon.setAutoCommit(false);  
     basePsm = baseCon.prepareStatement(sqlStr); for (int i = 0; i < parasValues.size();  
     i++) { Object[] parasValue = parasValues.get(i); for (int j = 0; j <  
     parasValue.length; j++) { basePsm.setObject(j + 1, parasValue[j]); } basePsm.addBatch();  
     } basePsm.executeBatch(); baseCon.commit(); } catch (SQLException e) {  
     baseCon.rollback(); throw e; } finally { if (basePsm != null) { basePsm.close();  
     basePsm = null; } if (baseCon != null) { baseCon.close(); } } } public  
     static String readFileByChars(String fileName, String enc) { StringBuffer  
     content=new StringBuffer(); Reader reader = null; try { // 一次读多个字符 char[]  
     tempchars = new char[30]; int charread = 0; reader = new InputStreamReader(new  
     FileInputStream(fileName),enc); // 读入多个字符到字符数组中，charread为一次读取字符数 while  
     ((charread = reader.read(tempchars)) != -1) { // 同样屏蔽掉\r不显示 if ((charread  
     == tempchars.length) && (tempchars[tempchars.length - 1] != '\r'))  
     { content.append(tempchars); } else { for (int i = 0; i < charread;  
     i++) { if (tempchars[i] == '\r') { continue; } else { content.append(tempchars[i]);  
     } } } } return content.toString(); } catch (Exception e1) { e1.printStackTrace();  
     } finally { if (reader != null) { try { reader.close(); } catch (IOException  
     e1) { } } } return null; } } ）  

为使得下一节中的Java源码能够编译，你需要下列库支持：
hadoop-core-1.0.2.jar
hbase-0.92.1.jar
mysql-connector-java-5.1.18.jar

你可以将他们手动加入classpath中，或者使用本文中的可用的示例代码。

在导入数据之前，确认HDFS， ZooKeeper,和HBase集群均正常运行。在HBase的客户端节点记录日志。

如何实施

通过单节点客户端将数据从MySQL导入HBase：
1.从HBase的客户端服务器从过HBase的Shell命令行，连接到HBase的集群。
hadoop$ $HBASE_HOME/bin/hbase shell
2.在HBase中创建 hly_temp 表
hbase> create ‘hly_temp’, {NAME => ‘n’, VERSIONS => 1}
3.写一个Java程序将数据从MySQL中导入HBase，并将其打包成jar。在Java中按照下列步骤导入数据:
i. 使用Java创建一个connectHBase() 方法来连接到指定的HBase表：
$ vi Recipe1.java

[java]  view plain copy   
     
    
 private static HTable connectHBase(String tablename) \  
 throws IOException {  
 HTable table = null;  
 Configuration conf = HBaseConfiguration.create();  
 table = new HTable(conf, tablename);  
 return table;  
 }  

ii. 使用Java创建一个 connectDB() 方法来 MySQL :
$ vi Recipe1.java

[java]  view plain copy   
     
    
 private static Connection connectDB() \  
 throws Exception {  
 String userName = "db_user";  
 String password = "db_password";  
 String url = "jdbc:mysql://db_host/database";  
 Class.forName("com.mysql.jdbc.Driver").newInstance();  
 Connection conn = DriverManager.getConnection(url,  
 userName, password);  
 return conn;  
 }  

此处是Java类中的main() 方法，在其中我们从MySQL获取数据并存入HBase中：
$ vi Recipe1.java

[java]  view plain copy   
     
    
 public class Recipe1 {  
  public static void main(String[] args) {  
    Connection dbConn = null;  
    HTable htable = null;  
    Statement stmt = null;  
    String query = "select * from hly_temp_normal";  
    try {  
      dbConn = connectDB();  
      htable = connectHBase("hly_temp");  
      byte[] family = Bytes.toBytes("n");  
      stmt = dbConn.createStatement();  
      ResultSet rs = stmt.executeQuery(query);  
      // time stamp for all inserted rows  
      // 所有插入数据的时间戳  
      long ts = System.currentTimeMillis();  
      while (rs.next()) {  
        String stationid = rs.getString("stnid");  
        int month = rs.getInt("month");  
        int day = rs.getInt("day");  
        String rowkey = stationid + Common.lpad(String.   
        valueOf(month), 2,    
        '0') + Common.lpad(String.valueOf(day), 2, '0');  
        Put p = new Put(Bytes.toBytes(rowkey));  
        // get hourly data from MySQL and put into hbase  
        //从MySQL中获取小时数据并存入HBase  
        for (int i = 5; i < 29; i++) {  
          String columnI = "v" + Common.lpad   
          (String.valueOf(i - 4), 2, '0');  
          String valueI = rs.getString(i);  
          p.add(family, Bytes.toBytes(columnI), ts,    
          Bytes.toBytes(valueI));  
        }  
        htable.put(p);  
      }  
    } catch (Exception e) {  
      e.printStackTrace();  
    } finally {  
      try {  
        if (stmt != null) {  
          stmt.close();  
        }  
        if (dbConn != null) {  
          dbConn.close();  
        }  
        if (htable != null) {  
          htable.close();  
        }  
      } catch (Exception e) {  
        // ignore  
      }  
    }  
  }  
 }  

4.运行导入任务，下面的脚本就是用于执行JAR文件：

[java]  view plain copy   
     
    
 #/bin/bash  
 bin=`dirname $0`  
 bin=`cd $bin;pwd`  
 cp=$HBASE_HOME/conf:$HBASE_HOME/hbase-0.92.1.jar:$bin/build/hac-  
 chapter2.jar  
 for jar in $bin/lib/*.jar  
 do  
    cp=$cp:$jar  
 done  
 for jar in $HBASE_HOME/lib/*.jar  
 do  
    cp=$cp:$jar  
 done  

$JAVA_HOME/bin/java -classpath $cp “hac.chapter2.Recipe1″

5.验证HBase中导入的数据，通过HBase的Shell连接至HBase：
hadoop$ $HBASE_HOME/bin/hbase shell

6.验证数据已经被导入了HBase的对应表中：
hbase> count ‘hly_temp’
95630 row(s) in 8.9850 seconds
hbase> scan ‘hly_temp’, {LIMIT => 10}
…
AQW000617050110 column=n:v23,
timestamp=1322958813521, value=814S
AQW000617050110 column=n:v24,
timestamp=1322958813521, value=811C
10 row(s) in 0.6730 seconds

运行原理

在步骤1和2中，我们在HBase中创建了目标表用于插入数据。目标表名称为hly_temp，且只有单个列族（column family） n。我们将列族名称设计为一个字母的原因，是因为列族名称会存储在HBase的每个键值对中。使用短名能够让数据的存储和缓存更有效率。我们只需要保留一个版本的数据，所以为列族指定VERSION属性。

在Java代码中，为了连接到HBase，我们首先创建一个配置（Configuration ）对象，使用该对象创建一个HTable实例。这个HTable对象用于处理所有的客户端API调用。如你所见，我们在代码没有设置任何ZooKeeper或HBase的连接配置。所以程序该如何连接到运行的HBase集群呢？这或许是因为我们在步骤4中将 $HBase/conf目录添加到classpath中了。通过上述设置，HBase的客户端API会classpath中的hbase-site.xml加载配置信息。连接配置信息在hbase-site.xml中设置。

在使用JDBC中MySQL中获取数据之后，我们循环读取结果集，将MySQL中的一行映射为HBase表中的一行。此处我们使用stationid，月份和日期栏位来生成HBase数据的row key。我们在月份和日期左边也填充0，补足2位数。这样做很重要，因为HBase的row key是按照字典排序的，意味着12将排序在2之前，这样可能会导致一些意外的情况发生。

我们创建了Put对象，利用row key添加一行数据。每小时的数据的添加需要调用Put.add()方法，传入参数包括列族（column family）, 限定符（qualifier）,时间戳（ timestamp）, and 值（value）。再次声明，我们使用很短的列族名称能够让存储数据更高效。所有的数据都被添加之后，我们调用HTable.put() 方法会将数据保存进HBase的table中。

最后，所有打开的资源都需要手动关闭。我们在代码中的final块中结束了MySQL和HBase的连接，这样确保即时导入动作中抛出异常仍然会被调用到。
你能够通过对比MySQL和HBase的数据行数来验证导入是否正确。你可以在扫描（scan）结果集中发现数据都准确的导入了HBase。

http://www.csdn.net/article/2014-01-07/2818046

JBDev - Theos下一代越狱开发工具 lichao890427 ios
JBDev-Theos下一代越狱开发工具自越狱诞生以来，Theos一直是越狱开发的主流工具，大多数开发者使用Theos编译代码，再用lldb手动调试。JBDev简化了这个过程，项目地址https://github.com/lich4/JBDev简介JBDev用于Xcode越狱开发及巨魔开发，提供和普通App一样的开发体验，使用Xcode进行编译——安装——调试，已测试环境：Xcode12-15iO
使用matlab进行分位数回归 uy9994 回归数据挖掘人工智能
对于使用MATLAB、R语言或者STATA执行带有虚拟变量的分位数回归，这三个工具都带有强大的分析功能。在核心观点上，首先需要理解分位数回归的基本原理、其次要掌握如何在各个统计软件中实现该分析、最后，需要熟悉虚拟变量在模型中的应用并合理加以实施。分位数回归与传统的最小二乘法（OLS）回归不同，它关注于条件分位数的建模，比如条件中位数或其他非中心位置的分位数，这使得分位数回归在处理非对称分布的数据上
基于核选择融合注意力机制TCN-MTLATTENTION-MAMBA模型（Python\matlab代码）清风AI YOLO算法魔改系列深度学习算法详解及代码复现毕业设计代码实现人工智能 matlab python 深度学习神经网络 pytorch
首先声明，该模型为原创！原创！原创！且该思路还未有成果发表，感兴趣的小伙伴可以借鉴！需要完整代码可私信或评论！本方案可用于医疗、金融、交通、零售、光伏功率预测、故障检测等领域！目录首先声明，该模型为原创！原创！原创！且该思路还未有成果发表，感兴趣的小伙伴可以借鉴！需要完整代码可私信或评论！本方案可用于医疗、金融、交通、零售、光伏功率预测、故障检测等领域！模型组成部分模型结构图模块原理及作用Pyth
《计算机网络》课程大作业- 《小区局域网的设计和规划》 lisangsimida 计算机网络课程设计 php
摘要本文围绕小区局域网设计与规划展开。通过合理技术选型保障居民娱乐、生活和物业管理业务开展；网络安全措施得力，防火墙、入侵检测预防系统及设备安全配置等保障网络安全；具备良好可扩展性，分层拓扑和合适设备选型便于网络规模与功能扩展。此方案在实际建设中有很强可行性与实用性，依据小区实际，技术与设备成熟，布线合理，维护管理策略便捷。展望未来，6G技术发展可能促使小区网络设备无线模块升级、提升网络性能，物联
AI技术学习笔记系列006：一文了解MCP前因后果新说一二人工智能学习笔记
MCP协议发布与开源（2024年11月）主体：Anthropic时间：2024年11月事件：Anthropic正式发布并开源MCP协议，旨在解决大型语言模型（LLM）与外部数据源、工具集成的标准化问题。协议采用客户端-服务器架构，定义Host、Client、Server三大核心组件，并通过JSON-RPC实现通信136。关键产出：开源代码库及规范文档（GitHub地址：[modelcontextp
淘宝 “猜你喜欢” 数据挖掘：基于用户行为 API 的个性化推荐算法探究 API_technology 开发后端数据挖掘推荐算法人工智能
摘要：随着电子商务的蓬勃发展，个性化推荐系统成为提升用户购物体验、增加平台销售额的关键技术。本文聚焦淘宝“猜你喜欢”板块，深入探讨基于用户行为API的个性化推荐算法。通过分析用户行为数据的收集、预处理，算法模型的构建与优化，以及该算法在淘宝平台的实际应用效果与挑战，为电商个性化推荐领域的进一步发展提供参考。一、引言在信息爆炸的时代，淘宝作为全球知名的电商平台，拥有海量的商品和庞大的用户群体。如何让
淘宝API高并发优化：突破QPS限制的异步请求与分布式架构设计 API_technology 开发后端分布式前端数据挖掘数据库
一、异步请求优化（一）异步请求原理传统的同步请求模式下，程序发送API请求后会阻塞等待响应，期间线程处于闲置状态，浪费系统资源。而异步请求则不同，当发起API请求后，线程不会等待回应，而是继续执行后续任务，待服务器返回结果时，再通过回调函数或事件通知机制来处理响应数据。例如，在一个商品详情页展示场景中，需要同时获取商品基本信息、图片、评论等多个API数据。若采用同步方式，依次请求各个接口，总耗时为
Linux文件搜索与文本过滤全攻略：find、locate、grep深度解析 jay丿 linux chrome 运维
Linux文件搜索与文本过滤全攻略：find、locate、grep深度解析在Linux系统运维中，高效的文件搜索和内容过滤是提升工作效率的关键技能。本文将系统讲解find、locate、grep三大核心指令及管道符|的应用场景，帮助读者构建多维度搜索能力。一、find指令：精准文件定位1.1工作原理find通过递归遍历目录树，实时搜索满足条件的文件/目录。支持文件名、类型、大小、时间等复杂条件组
Python 爬虫实战：足球比赛数据抓取与球队表现分析西攻城狮北 python 爬虫开发语言
作为一名体育爱好者和数据分析师，我决定利用Python爬虫技术抓取足球比赛数据，并对球队表现进行深入分析。这对于了解球队的实力、战术风格和比赛趋势具有重要意义，也能为足球迷和相关研究人员提供有价值的信息。一、项目背景足球作为世界上最受欢迎的运动之一，每年都有大量的比赛和赛事。足球比赛数据包含了丰富的信息，如比赛结果、进球数、射门次数、控球率、球员表现等。通过抓取这些数据，我们可以分析球队在不同比赛
rsync，inotify，sersync（rsync+sersync实时双向同步） xxxxxx0_0 Linux工具运维 linux
一、简介rsync：一款linux系统下的数据镜像备份工具，采用C/S模式，可以在不同主机之间进行同步，类似于cp功能，数据的传输借助于ssh服务，以守护进程的方式进型传输。inotify：inotify是Linux内核提供的一个接口，用于监控文件系统事件，如文件的创建、删除、修改等。当监控的目录发生变化时，inotify会触发相应的事件。结合rsync，可以在检测到文件系统变化后立即执行同步操作
ZLMediaKit尝试解决GB28181(UDP方式)的视频花屏问题月蚀～ video udp ZLMediaKit
问题现象:视频出现大量花屏,无法观看日志中出现大量的丢包输出排查ZLMediaKit的解决方案https://github.com/ZLMediaKit/ZLMediaKit/issues/1221已尝试的方案try1服务器调优增加服务器的缓存接收大小,减少UDP的丢包,尝试无效1.下面的代码添加到/etc/sysctl.conf的末尾，然后保存net.core.rmem_default=8388
Linux搭建NFS服务零一客 linux 运维云计算
1.概述NetworkFileSystem的缩写，它最大的功能是可以通过网络使用挂载的方式，让不同的机器、不同的操作系统可以共享彼此的文件2.名称软件名nfs-utils服务名nfs或者nfs-server3.端口nfs-servertcp/2049负责建立连接rpcbindtcp/111负责传输数据4.配置文件主配置文件/etc/nfs.conf存储配置文件/etc/exports#书写格式：共
R语言堆叠占比柱状图_R语言统计篇：单因素方差分析 weixin_39628063 R语言堆叠占比柱状图 r语言多重对应分析 r语言径向柱状图做方差分析需要正态性检验吗用R语言做词频统计
点击蓝字就可以关注"R语言与统计"哦~~：大家好~~~又是干货满满的一天！往期文章介绍过独立样本t检验(R语言统计篇：独立样本t检验)，可以用于两个独立样本的均数比较。今天的内容是单因素方差分析(one-factorANOVA或one-wayANOVA)，与独立样本t检验非常类似，都属于参数性检验。不同点在于：单因素方差分析可以用于大于两个样本的均数比较。与所有的参数性检验类似，使用单因素方差分析
【C++】string类的模拟实现愚润泽 C++学习笔记 c++STL string 开发语言
前言：上篇文章C++中string常用方法总结我们讲解了string中常用的方法和接口，这篇文章我们来模拟实现一下string类：个人简介：努力学习ing个人专栏：C++学习笔记CSDN主页愚润求学其他专栏：C语言入门基础，python入门基础，python刷题专栏string的模拟实现一，实现的功能汇总二，具体操作实现输入输出构造，析构迭代器iterator修改操作容量操作运算符重载查找，插入，
房地产数据可视化管理详细设计基于Spring Boot SSM原创 QQ1978519681计算机程序信息可视化计算机毕设 spring boot 毕设 java
目录摘要‌1.系统概述2.系统功能2.1用户管理2.2房产信息管理2.3交易管理2.4统计分析2.5系统设置3.技术选型4.系统架构5.数据库设计6.系统实现7.系统测试与优化8.总结摘要‌本文详细阐述了基于JAVA的房地产数据可视化管理系统的设计与实现过程。系统采用JAVA作为主要开发语言，结合SpringBoot框架和MySQL数据库技术，实现了房地产数据的采集、存储、处理、分析和可视化展示。
ElasticSearch 楚楚ccc Java系列 elasticsearch
1.elasticsearch、Kibana概念，elasticsearch相关术语1.1ElasticStackElasticSearch:基于json的分布式搜索和分析引擎搜索、聚合分析、大数据存储分布式、高性能、高可用、可伸缩、易维护支持文本搜索、结构化数据、非结构化数据、地址位置搜索等Logstash:动态数据收集管道，生态丰富。可进行采集、过滤、输出。ElasticSearch是官方首选
rsync+sersync实现实时文件同步蜜糖伴午茶运维 linux 服务器
目录一、背景二、环境三、实验步骤1、备份服务器操作2、数据源服务器操作3、测试数据同步4、安装sersync工具，实时触发rsync进行同步5、测试数据实时同步四、总结五、注意事项一、背景rsync是一个用于文件同步和传输的工具，它可以在本地和远程文件系统之间同步文件。rsync通过增量传输的方式，只传输源和目标之间不同的部分，这使其在网络传输时非常高效。它通常用于备份、镜像和迁移任务。二、环境备
前沿技术洞察（四）：异构GPU池化实现边缘计算高实时强交互体验平行云PVT 边缘计算人工智能云计算图形渲染 xr gpu算力去中心化
实时云渲染在服务端一侧的核心技术点之一，在于如何将云端资源最大化利用。首先需要将云资源创建为满足要求的独立运行环境，虚拟化技术可以实现这一目标。通过软件模拟和硬件耦合，提供虚拟化的容器计算空间，用于资源与应用的隔离和分配。为了保障云端GPU算力的可用性，可将云端资源虚拟化，静态切片方式分配算力资源，给XR应用预留启动算力。当客户端请求发出后，第一时间调度云端资源计算渲染，在流推至客户端。通常包括G
短视频 NFC 碰一碰发视频靠谱吗?源码搭建，OEM贴牌 18538162800余。音视频
在移动社交与内容分享的浪潮中，创新的交互方式不断涌现。短视频NFC碰一碰发视频功能，以其便捷、高效的特点，为用户带来了全新的分享体验。通过简单的手机触碰，即可快速完成视频传输，极大地提升了社交互动的趣味性与即时性。本文将详细介绍如何搭建实现这一功能的源码。一、功能需求分析NFC设备识别与连接：系统需精准识别附近开启NFC功能的设备，并建立稳定的连接通道，确保数据传输的可靠性。视频选择与传输：用户能
Rsync+Sersync实时同步详细配置活捉一个坏小孩文件备份类服务器 ssh 运维
Rsync+Sersync实时同步一、基本介绍1.什么是Rsync？Rsync（RemoteSynchronize）是一款开源的、快速的、多功能的、可以实现全量及增量的本地或远程数据同步备份的优秀工具，并且支持多种操作系统平台运行。2.Rsync简介Rsync具有本地与远程两台主机之间的数据快速复制同步镜像、远程备份等功能，该功能类似scp，但是优于scp功能，还具有本地不同分区目录之间全量及增量
如何通过R语言制作出漂亮的统计图（包括动态gif）武晓兵 r语言开发语言
在Windows系统下安装RStudio的步骤如下：1.安装R语言环境RStudio是R的集成开发环境（IDE），需先安装R：下载R访问CRAN官方镜像（推荐国内镜像如清华源加速下载）。选择Windows版本→点击base→下载R-4.x.x-win.exe（最新版）。安装R双击下载的安装包，按向导操作（默认选项即可，安装路径建议不要包含中文或空格）。完成后，可在开始菜单找到R的快捷方式。2.安装
相机租赁网站基于Spring Boot SSM QQ1978519681计算机程序数码相机 spring boot 后端计算机毕设毕设
目录摘要‌1.项目背景与意义2.功能需求分析3.技术需求分析‌3.1开发语言‌：Java‌13。3‌.2其他技术‌：4.系统设计与实现5.市场分析6.创新点与优势7.预期成果与展望摘要‌随着摄影技术的普及和摄影爱好者数量的增加，相机租赁市场需求不断增长。为满足这一需求，并提升用户体验和管理效率，本文设计并实现了一个基于SpringBoot的相机租赁网站。该系统采用前后端分离的设计模式，前端使用Vu
快速入手-基于Django-rest-framework的限流操作（十二）神奇侠2024 django python DRF 限流
限流：对接口访问的频次进行限制，以减轻服务器压力或者实现特定的业务。一般用于付费购买次数、投票等场景使用。配置方式有两种：全局配置和局部配置。1、全局配置REST_FRAMEWORK={"DEFAULT_AUTHENTICATION_CLASSES":("rest_framework_simplejwt.authentication.JWTAuthentication",),"DEFAULT_TH
Python 缓存系统全景解析：基于 Redis 与 Memcached 构建高效缓存解决方案清水白石008 python Python题库缓存 python redis
Python缓存系统全景解析：基于Redis与Memcached构建高效缓存解决方案在互联网时代，高并发、低延迟已成为各类应用和服务的标配。为了满足快速响应和高吞吐量的需求，缓存技术成为优化系统性能的重要策略。本文将深入解析如何利用Python构建一个简单而高效的缓存系统，分别介绍基于Redis与Memcached的实现方案，并通过充足的代码示例和实践案例，帮助初学者掌握基本概念，同时也为资深开发
Django基础知识及用法摸鱼艺术家_ python django sqlite 数据库 python
1.Django项目文件结构1.项目级文件manage.py作用：Django项目的命令行工具，用于启动本地服务器、运行测试、创建数据库、执行迁移等操作。这是与项目交互的主要方式之一。来源：Django自动生成settings.py作用：Django项目的全局配置文件，包含了数据库配置、静态文件路径、模板路径、中间件、时区设置、SESSION设置、DEBUG配置等。几乎所有的项目级配置都在这里进行
HarmonyOS NEXT 中级开发笔记：基于ArkTS的消费记账应用实践 harmonyos-next
最近在尝试用ArkTS应用开发语言为HarmonyOSNEXT开发一款金融理财类的消费记账应用，记录一下开发过程中的一些心得体会。作为HarmonyOS的主力开发语言，ArkTS确实在保持TypeScript语法风格的同时，通过静态类型检查提升了代码的可靠性。在开发消费记账功能时，这种类型安全特性特别有用，能有效避免财务数据计算中的类型错误。下面分享一个简单的记账列表组件实现，兼容HarmonyO
Django+Vue+AntDesign实现RBAC权限管理系统沙拉.伊万卡 django python vue.js
项目介绍一款Python语言基于Django、Vue3.x、AntDesign、MySQL等框架精心打造的一款模块化、高性能、企业级的敏捷开发框架，本着简化开发、提升开发效率的初衷触发，框架自研了一套个性化的组件，实现了可插拔的组件式开发方式：单图上传、多图上传、下拉选择、开关按钮、单选按钮、多选按钮等等一系列个性化、轻量级的组件，是一款真正意义上实现低代码开发的敏捷开发框架。内置模块用户管理：用
Audacity：高级音频编辑：自动化与插件使用_2024-07-16_23-22-31.Tex chenjj4003 游戏开发自动化运维网络前端服务器 xbox
Audacity：高级音频编辑：自动化与插件使用高级音频编辑基础Audacity界面深度解析自定义工具栏在Audacity中，自定义工具栏可以让您的音频编辑工作更加高效。Audacity的工具栏包含了各种常用的编辑工具，如选择、剪切、复制、粘贴、撤销等。要自定义工具栏，您可以：点击菜单栏中的“查看”选项。选择“工具栏”子菜单中的“自定义工具栏”。在弹出的窗口中，您可以勾选或取消勾选不同的工具，以根
Nyquist插件基础：打印格式化字符串(LISP语言) 脚本小玩家音频处理 #Audacity lisp 开发语言音频处理 Audacity
1Nyquist插件基础：打印格式化字符串(LISP语言) 由于Audacity的Nyquist插件使用了Lisp语法，做为编程开发，最基础的技能就是打印信息，它可以为后面的复杂程序的调试打下基本，因此，格式化字符串是一个极为重要的功能，它能够依据特定格式生成字符串。接下来将对Lisp格式化字符串展开详细讲解。说明：由于Audacity的Nyquist插件对SAL语法的支持是后来者，可能会出
Spring Boot 3.4.3 基于 SpringDoc 2 和 Swagger 3 实现项目接口文档管理专业WP网站开发-Joyous spring boot Java 学习 spring boot 后端 java
在现代企业级应用开发中，前后端分离已成为主流模式，前端负责界面呈现，后端专注提供RESTfulAPI接口。然而，接口文档的编写和维护往往是开发过程中的痛点。SpringBoot3.4.3结合SpringDoc2和Swagger3，为开发者提供了一种高效的方式，通过OpenAPI3标准自动生成和管理接口文档。本文将详细介绍如何在SpringBoot3.4.3中集成SpringDoc2和Swagger
多线程编程之卫生间周凡杨 java 并发卫生间线程厕所
如大家所知，火车上车厢的卫生间很小，每次只能容纳一个人，一个车厢只有一个卫生间，这个卫生间会被多个人同时使用，在实际使用时，当一个人进入卫生间时则会把卫生间锁上，等出来时打开门，下一个人进去把门锁上，如果有一个人在卫生间内部则别人的人发现门是锁的则只能在外面等待。问题分析：首先问题中有两个实体，一个是人，一个是厕所，所以设计程序时就可以设计两个类。人是多数的，厕所只有一个（暂且模拟的是一个车厢）。
How to Install GUI to Centos Minimal sunjing linux Install Desktop GUI
http://www.namhuy.net/475/how-to-install-gui-to-centos-minimal.html I have centos 6.3 minimal running as web server. I’m looking to install gui to my server to vnc to my server. You can insta
Shell 函数 daizj shell 函数
Shell 函数 linux shell 可以用户定义函数，然后在shell脚本中可以随便调用。 shell中函数的定义格式如下： [function] funname [()]{ action; [return int;] } 说明： 1、可以带function fun() 定义，也可以直接fun() 定义,不带任何参数。 2、参数返回
Linux服务器新手操作之一周凡杨 Linux 简单操作
1.whoami 当一个用户登录Linux系统之后，也许他想知道自己是发哪个用户登录的。此时可以使用whoami命令。 [ecuser@HA5-DZ05 ~]$ whoami e
浅谈Socket通信（一）朱辉辉33 socket
在java中ServerSocket用于服务器端，用来监听端口。通过服务器监听，客户端发送请求，双方建立链接后才能通信。当服务器和客户端建立链接后，两边都会产生一个Socket实例，我们可以通过操作Socket来建立通信。首先我建立一个ServerSocket对象。当然要导入java.net.ServerSocket包 ServerSock
关于框架的简单认识西蜀石兰框架
入职两个月多，依然是一个不会写代码的小白，每天的工作就是看代码，写wiki。前端接触CSS、HTML、JS等语言，一直在用的CS模型，自然免不了数据库的链接及使用，真心涉及框架，项目中用到的BootStrap算一个吧，哦，JQuery只能算半个框架吧，我更觉得它是另外一种语言。后台一直是纯Java代码，涉及的框架是Quzrtz和log4j。都说学前端的要知道三大框架，目前node.
You have an error in your SQL syntax; check the manual that corresponds to your 林鹤霄
You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'option,changed_ids ) values('0ac91f167f754c8cbac00e9e3dc372
MySQL5.6的my.ini配置 aigo mysql
注意：以下配置的服务器硬件是：8核16G内存 [client] port=3306 [mysql] default-character-set=utf8 [mysqld] port=3306 basedir=D:/mysql-5.6.21-win
mysql 全文模糊查找便捷解决方案 alxw4616 mysql
mysql 全文模糊查找便捷解决方案 2013/6/14 by 半仙 alxw4616@Msn.com 目的: 项目需求实现模糊查找. 原则: 查询不能超过 1秒. 问题: 目标表中有超过1千万条记录. 使用like '%str%' 进行模糊查询无法达到性能需求. 解决方案: 使用mysql全文索引. 1.全文索引 : MySQL支持全文索引和搜索功能。MySQL中的全文索
自定义数据结构链表(单项 ,双向,环形) 百合不是茶单项链表双向链表
链表与动态数组的实现方式差不多, 数组适合快速删除某个元素链表则可以快速的保存数组并且可以是不连续的单项链表;数据从第一个指向最后一个实现代码: //定义动态链表 clas
threadLocal实例 bijian1013 java thread java多线程 threadLocal
实例1： package com.bijian.thread; public class MyThread extends Thread { private static ThreadLocal tl = new ThreadLocal() { protected synchronized Object initialValue() { return new Inte
activemq安全设置—设置admin的用户名和密码 bijian1013 java activemq
ActiveMQ使用的是jetty服务器, 打开conf/jetty.xml文件，找到 <bean id="adminSecurityConstraint" class="org.eclipse.jetty.util.security.Constraint"> <p
【Java范型一】Java范型详解之范型集合和自定义范型类 bit1129 java
本文详细介绍Java的范型，写一篇关于范型的博客原因有两个，前几天要写个范型方法(返回值根据传入的类型而定)，竟然想了半天，最后还是从网上找了个范型方法的写法；再者，前一段时间在看Gson, Gson这个JSON包的精华就在于对范型的优雅简单的处理，看它的源代码就比较迷糊，只其然不知其所以然。所以，还是花点时间系统的整理总结下范型吧。范型内容范型集合类范型类
【HBase十二】HFile存储的是一个列族的数据 bit1129 hbase
在HBase中，每个HFile存储的是一个表中一个列族的数据，也就是说，当一个表中有多个列簇时，针对每个列簇插入数据，最后产生的数据是多个HFile，每个对应一个列族，通过如下操作验证 1. 建立一个有两个列族的表 create 'members','colfam1','colfam2' 2. 在members表中的colfam1中插入50*5
Nginx 官方一个配置实例 ronin47 nginx 配置实例
user www www; worker_processes 5; error_log logs/error.log; pid logs/nginx.pid; worker_rlimit_nofile 8192; events { worker_connections 4096;} http { include conf/mim
java-15.输入一颗二元查找树，将该树转换为它的镜像，即在转换后的二元查找树中，左子树的结点都大于右子树的结点。用递归和循环 bylijinnan java
//use recursion public static void mirrorHelp1(Node node){ if(node==null)return; swapChild(node); mirrorHelp1(node.getLeft()); mirrorHelp1(node.getRight()); } //use no recursion bu
返回null还是empty bylijinnan java apache spring 编程
第一个问题，函数是应当返回null还是长度为0的数组（或集合）？第二个问题，函数输入参数不当时，是异常还是返回null？先看第一个问题有两个约定我觉得应当遵守： 1.返回零长度的数组或集合而不是null（详见《Effective Java》）理由就是，如果返回empty，就可以少了很多not-null判断： List<Person> list
[科技与项目]工作流厂商的战略机遇期 comsci 工作流
在新的战略平衡形成之前，这里有一个短暂的战略机遇期，只有大概最短6年，最长14年的时间，这段时间就好像我们森林里面的小动物，在秋天中，必须抓紧一切时间存储坚果一样，否则无法熬过漫长的冬季。。。。在微软，甲骨文，谷歌，IBM,SONY
过度设计-举例 cuityang 过度设计
过度设计，需要更多设计时间和测试成本，如无必要，还是尽量简洁一些好。未来的事情，比如访问量，比如数据库的容量，比如是否需要改成分布式都是无法预料的再举一个例子，对闰年的判断逻辑：　　1、 if($Year%4==0) return True; else return Fasle; 　　2、if ( ($Year%4==0 &am
java进阶，《Java性能优化权威指南》试读 darkblue086 java性能优化
记得当年随意读了微软出版社的.NET 2.0应用程序调试，才发现调试器如此强大，应用程序开发调试其实真的简单了很多，不仅仅是因为里面介绍了很多调试器工具的使用，更是因为里面寻找问题并重现问题的思想让我震撼，时隔多年，Java已经如日中天，成为许多大型企业应用的首选，而今天，这本《Java性能优化权威指南》让我再次找到了这种感觉，从不经意的开发过程让我刮目相看，原来性能调优不是简单地看看热点在哪里，
网络学习笔记初识OSI七层模型与TCP协议 dcj3sjt126com 学习笔记
协议：在计算机网络中通信各方面所达成的、共同遵守和执行的一系列约定　　计算机网络的体系结构：计算机网络的层次结构和各层协议的集合。　　两类服务：　　面向连接的服务通信双方在通信之前先建立某种状态，并在通信过程中维持这种状态的变化，同时为服务对象预先分配一定的资源。这种服务叫做面向连接的服务。　　面向无连接的服务通信双方在通信前后不建立和维持状态，不为服务对象
mac中用命令行运行mysql dcj3sjt126com mysql linux mac
参考这篇博客：http://www.cnblogs.com/macro-cheng/archive/2011/10/25/mysql-001.html 感觉workbench不好用（有点先入为主了）。 1，安装mysql 在mysql的官方网站下载 mysql 5.5.23 http://www.mysql.com/downloads/mysql/，根据我的机器的配置情况选择了64
MongDB查询（1）——基本查询[五] eksliang mongodb mongodb 查询 mongodb find
MongDB查询转载请出自出处：http://eksliang.iteye.com/blog/2174452 一、find简介 MongoDB中使用find来进行查询。 API:如下 function ( query , fields , limit , skip, batchSize, options ){.....} 参数含义： query:查询参数 fie
base64，加密解密经融加密，对接 y806839048 经融加密对接
String data0 = new String(Base64.encode(bo.getPaymentResult().getBytes(("GBK")))); String data1 = new String(Base64.decode(data0.toCharArray()),"GBK"); // 注意编码格式，注意用于加密，解密的要是同
JavaWeb之JSP概述 ihuning javaweb
什么是JSP？为什么使用JSP？ JSP表示Java Server Page，即嵌有Java代码的HTML页面。使用JSP是因为在HTML中嵌入Java代码比在Java代码中拼接字符串更容易、更方便和更高效。 JSP起源在很多动态网页中，绝大部分内容都是固定不变的，只有局部内容需要动态产生和改变。如果使用Servl
apple watch 指南啸笑天 apple
1. 文档 WatchKit Programming Guide（中译在线版 By @CocoaChina）译文译者原文概览 - 开始为 Apple Watch 进行开发 @星夜暮晨 Overview - Developing for Apple Watch 概览 - 配置 Xcode 项目 - Overview - Configuring Yo
java经典的基础题目 macroli java 编程
1.列举出 10个JAVA语言的优势 a:免费，开源，跨平台(平台独立性)，简单易用，功能完善，面向对象，健壮性，多线程，结构中立，企业应用的成熟平台, 无线应用 2.列举出JAVA中10个面向对象编程的术语 a:包，类，接口，对象，属性，方法，构造器，继承，封装，多态，抽象，范型 3.列举出JAVA中6个比较常用的包 Java.lang;java.util;java.io;java.sql;ja
你所不知道神奇的js replace正则表达式 qiaolevip 每天进步一点点学习永无止境纵观千象 regex
var v = 'C9CFBAA3CAD0'; console.log(v); var arr = v.split(''); for (var i = 0; i < arr.length; i ++) { if (i % 2 == 0) arr[i] = '%' + arr[i]; } console.log(arr.join('')); console.log(v.r
[一起学Hive]之十五-分析Hive表和分区的统计信息(Statistics) superlxw1234 hive hive分析表 hive统计信息 hive Statistics
关键字：Hive统计信息、分析Hive表、Hive Statistics 类似于Oracle的分析表，Hive中也提供了分析表和分区的功能，通过自动和手动分析Hive表，将Hive表的一些统计信息存储到元数据中。表和分区的统计信息主要包括：行数、文件数、原始数据大小、所占存储大小、最后一次操作时间等； 14.1 新表的统计信息对于一个新创建
Spring Boot 1.2.5 发布 wiselyman spring boot
Spring Boot 1.2.5已在7月2日发布，现在可以从spring的maven库和maven中心库下载。这个版本是一个维护的发布版，主要是一些修复以及将Spring的依赖提升至4.1.7(包含重要的安全修复)。官方建议所有的Spring Boot用户升级这个版本。项目首页 | 源

数据导入HBase最常用的三种方式及实践分析

你可能感兴趣的:(数据导入HBase最常用的三种方式及实践分析)