萧邦主

HBase学习之路(八)：HBase协处理器+Hadoop的表操作行为日志监控案例实战

内容简介

一、协处理的基本概念
二、基于协处理器的行为表操作行为监控

0.实战内容与思路
1.在HBase中创建两张表用于测试
2. 创建普通的Java工程引入Maven支持
3.创建MyRegionObserver类，继承BaseRegionObserver
4.将代码打包并提交到HBase集群
5.配置Hbase的配置文件并重启HBase
6.测试并查看行为监控

三、总结

一、协处理的基本概念

使用客户端的API，配合过滤器可以对数据进行限制，使得返回客户端的数据更加精确。如果更近一步，将数据的某些处理流程直接放到服务端执行，然后仅仅返回一个小的处理结果集，类似于在服务端开启一个小型的MapReduce作业来分布式处理数据，这就是HBase的协处理器机制。
协处理器允许用户在region服务器执行自己的代码，即在允许用户执行region级别的操作。协处理器分为两大类：observer与endpoint。observer类似于关系型数据库中的触发器，endpoint则类似于关系型数据库中的存储过程，简单理解就是observer是一个观察者，当某些行为比如插入数据发生或者结束时，可以对应做出何种行为，属于被动调用，而endpoint则类似于调用一个函数，或者自定义的代码，属于主动调用。
observer分为三类：
(1).RegionObserver：用户可以利用这种协处理器处理数据修改事件，与表的region紧密相连，是针对表数据做出修改时的协处理器。
(2).MasterObserver：可以被用于管理或DDL类型的操作，比如创建、修改表属性等，这是针对集群事件的协处理器。
(3).WALObserver：供控制WAL的钩子函数。
不同的observer提供了针对本observer的回调函数，供不同的事件进行回调。
endpoint：除了事件处理之外，有时候还需要将用户的自定义操作添加到服务端，endpoint通过远程过程调用来扩展RPC协议，与关系型数据库的存储过程功能相似。

二、基于协处理器的行为表操作行为监控

0.实战内容与思路

本次案例HBase版本是hbase-1.2.0-cdh5.7.0，Hadoop版本是hadoop-2.6.0-cdh5.7.0 开发工具是IDEA2018。
实战内容：在操作HBase的表的过程中，可以对某些操作，比如put，get操作进行监控，一旦发生了此类的行为，就把操作该行为的时间、操作的表名以及操作行为所涉及的RowKey记录到一个HDFS上的文件上。
自定义一个类来继承BaseRegionObserver类，此类已经实现了所有的有关Region级别的所有方法，如果直接实现RegionObserver接口则要实现接口里面的所有方法，非常多，默认情况下继承BaseRegionObserver类没有任何的功能，用户则可以找对应要使用的方法进行重写就可以了。然后将代码打包并提交到HBase的集群中，最后配置HBase并重启即可。

1.在HBase中创建两张表用于测试

在Linux终端输入命令hbase shell进入HBase的终端。执行命令create 'table1','info'来创建一张表名为table1，列族为info的表，再执行命令create 'table2','info'来创建一张表名为table1，列族为info的表：

2. 创建普通的Java工程引入Maven支持

完整Maven依赖如下：

	 <properties>
	    <project.build.sourceEncoding>UTF-8</project.build.sourceEncoding>
	    <maven.compiler.source>1.7</maven.compiler.source>
	    <maven.compiler.target>1.7</maven.compiler.target>
	    <hadoop.version>2.6.0-cdh5.7.0</hadoop.version>
	    <hbase.version>1.2.0-cdh5.7.0</hbase.version>
  </properties>

  <repositories>
	    <repository>
	      <id>cloudera</id>
	      <url>https://repository.cloudera.com/artifactory/cloudera-repos</url>
	    </repository>
	  </repositories>
	
	  <dependencies>
	    <dependency>
	      <groupId>org.apache.hbase</groupId>
	      <artifactId>hbase-client</artifactId>
	      <version>${hbase.version}</version>
	    </dependency>
	
	    <dependency>
	      <groupId>org.apache.hbase</groupId>
	      <artifactId>hbase-server</artifactId>
	      <version>${hbase.version}</version>
	    </dependency>
	
	    <dependency>
	      <groupId>org.apache.hadoop</groupId>
	      <artifactId>hadoop-client</artifactId>
	      <version>${hadoop.version}</version>
	    </dependency>
	
	    <dependency>
	      <groupId>junit</groupId>
	      <artifactId>junit</artifactId>
	      <version>4.11</version>
	    </dependency>
  </dependencies>

  <build>
    <pluginManagement><!-- lock down plugins versions to avoid using Maven defaults (may be moved to parent pom) -->
      <plugins>
        <!-- clean lifecycle, see https://maven.apache.org/ref/current/maven-core/lifecycles.html#clean_Lifecycle -->
        <plugin>
          <artifactId>maven-clean-plugin</artifactId>
          <version>3.1.0</version>
        </plugin>
        <!-- default lifecycle, jar packaging: see https://maven.apache.org/ref/current/maven-core/default-bindings.html#Plugin_bindings_for_jar_packaging -->
        <plugin>
          <artifactId>maven-resources-plugin</artifactId>
          <version>3.0.2</version>
        </plugin>
        <plugin>
          <artifactId>maven-compiler-plugin</artifactId>
          <version>3.8.0</version>
        </plugin>
        <plugin>
          <artifactId>maven-surefire-plugin</artifactId>
          <version>2.22.1</version>
        </plugin>
        <plugin>
          <artifactId>maven-jar-plugin</artifactId>
          <version>3.0.2</version>
        </plugin>
        <plugin>
          <artifactId>maven-install-plugin</artifactId>
          <version>2.5.2</version>
        </plugin>
        <plugin>
          <artifactId>maven-deploy-plugin</artifactId>
          <version>2.8.2</version>
        </plugin>
        <!-- site lifecycle, see https://maven.apache.org/ref/current/maven-core/lifecycles.html#site_Lifecycle -->
        <plugin>
          <artifactId>maven-site-plugin</artifactId>
          <version>3.7.1</version>
        </plugin>
        <plugin>
          <artifactId>maven-project-info-reports-plugin</artifactId>
          <version>3.0.0</version>
        </plugin>
      </plugins>
    </pluginManagement>
  </build>
</project>

3.创建MyRegionObserver类，继承BaseRegionObserver

在MyRegionObserver类中编写HDFS文件写入方法，用于将协处理器生成的日志信息写入HDFS中。有一点需要注意，日志是不断产生的，因此需要追加写入，但是HDFS的API不支持追加写入，因此会判断日志文件是否存在，若存在则会先创建一个输入流，然后将旧的文件内容复制到新文件上，然后追加新日志。

private void outWrite(String str) {
    try {
        // 判断文件是否存在标志
        boolean isExist = false;
        // 创建HDFS的输入流
        Configuration configuration = new Configuration();
        // 初始化HDFS文件系统写入路径，该路径为你Hadoop集群的URL地址
        FileSystem fs = FileSystem.get(new URI("hdfs://hadoop000:8020"),configuration);
        FSDataInputStream inputStream = null;
        // 如果存在该文件则先读取
        // 该路径为你存放日志文件的HDFS目录
        if(fs.exists(new Path("/data/MyRegionObserver.txt"))){
             inputStream = fs.open(new Path("/data/MyRegionObserver.txt"));
             isExist = true;
        }
        FSDataOutputStream outputStream = fs.create(new Path("/data/MyRegionObserver.txt"),true);
        // 将旧的行为日志复制到新文件中
        if(isExist) {
            IOUtils.copyBytes(inputStream, outputStream, 1024);
        }
        // 将新的行为信息追加写入HDFS
        outputStream.write((str + "\r\n").getBytes());
        outputStream.close();
    }catch (Exception e){
        e.printStackTrace();
    }
}

MyRegionObserver类中编写日期格式方法，用于格式化表操作行为发生时的时间戳。

 private String dateFormat(Date date){
    String formatDate = "YYYY/MM/dd HH:mm:ss";
    SimpleDateFormat dateFormat = new SimpleDateFormat();
    dateFormat.applyPattern(formatDate);
    return dateFormat.format(date);
}

MyRegionObserver类完整代码如下：

/**
 * 自定义协处理器，区域观察者
 * 对表的行为进行日志监控
 */
public class MyRegionObserver extends BaseRegionObserver {

    private void outWrite(String str) {
        try {
            // 判断文件是否存在标志
            boolean isExist = false;
            // 创建HDFS的输入流
            Configuration configuration = new Configuration();
            // 初始化HDFS文件系统写入路径，该路径为你Hadoop集群的URL地址
            FileSystem fs = FileSystem.get(new URI("hdfs://hadoop000:8020"),configuration);
            FSDataInputStream inputStream = null;
            // 如果存在该文件则先读取
            // 该路径为你存放日志文件的HDFS目录
            if(fs.exists(new Path("/data/MyRegionObserver.txt"))){
                 inputStream = fs.open(new Path("/data/MyRegionObserver.txt"));
                 isExist = true;
            }
            FSDataOutputStream outputStream = fs.create(new Path("/data/MyRegionObserver.txt"),true);
            // 将旧的行为日志复制到新文件中
            if(isExist) {
                IOUtils.copyBytes(inputStream, outputStream, 1024);
            }
            // 将新的行为信息追加写入HDFS
            outputStream.write((str + "\r\n").getBytes());
            outputStream.close();
        }catch (Exception e){
            e.printStackTrace();
        }
    }

    // 时间格式化工具类
    private String dateFormat(Date date){
        String formatDate = "YYYY/MM/dd HH:mm:ss";
        SimpleDateFormat dateFormat = new SimpleDateFormat();
        dateFormat.applyPattern(formatDate);
        return dateFormat.format(date);
    }

    @Override
    public void preGetOp(ObserverContext<RegionCoprocessorEnvironment> e, Get get, List<Cell> results) throws IOException {
        super.preGetOp(e, get, results);
        String tableName = e.getEnvironment().getRegion().getTableDesc().getNameAsString();
        outWrite("[" + dateFormat(new Date()) + "] " + "表" + tableName + "开始执行Get操作,RowKey：" +
                new String(get.getRow()));
    }

    @Override
    public void postGetOp(ObserverContext<RegionCoprocessorEnvironment> e, Get get, List<Cell> results) throws IOException {
        super.postGetOp(e, get, results);
        String tableName = e.getEnvironment().getRegion().getTableDesc().getNameAsString();
        outWrite("[" + dateFormat(new Date()) + "] " + "表" + tableName + "结束执行Get操作,RowKey：" +
                new String(get.getRow()));
    }

    @Override
    public void prePut(ObserverContext<RegionCoprocessorEnvironment> e, Put put, WALEdit edit, Durability durability) throws IOException {
        super.prePut(e, put, edit, durability);
        String tableName = e.getEnvironment().getRegion().getTableDesc().getNameAsString();
        outWrite("[" + dateFormat(new Date()) + "] " + "表" + tableName + "开始执行Put操作,RowKey：" +
                new String(put.getRow()));
    }

    @Override
    public void postPut(ObserverContext<RegionCoprocessorEnvironment> e, Put put, WALEdit edit, Durability durability) throws IOException {
        super.postPut(e, put, edit, durability);
        String tableName = e.getEnvironment().getRegion().getTableDesc().getNameAsString();
        outWrite("[" + dateFormat(new Date()) + "] " + "表" + tableName + "结束执行Put操作,RowKey：" +
                new String(put.getRow()));
    }

}

4.将代码打包并提交到HBase集群

使用IDEA的Maven自带的打包工具，或者直接使用Maven来打包也可以，以下是使用IDEA的Maven自带的打包工具打包：
将打包好的jar包放到HBase所有节点的$HBASE_HOME/lib路径下。

5.配置Hbase的配置文件并重启HBase

进入所有HBase节点的$HBASE_HOME/conf目录下，编辑hbase-site.xml文件，加入如下配置：
```
<property>
 <name>hbase.coprocessor.region.classes</name>
 <value>com.train.hbase.MyRegionObserver</value>
</property>
```
value标签的值为你编写MyRegionObserver类的全类名。
确保jar包已经分发到所有HBase节点指定的目录下，且配置文件正确配置并分发到所有节点后，重新启动HBase服务。

6.测试并查看行为监控

进入HBase的终端，首先在表table1中插入一条数据：put 'table1','xiao-bang-zhu','info:column','12345'
然后读取该数据：get 'table1','xiao-bang-zhu'
再在表table2中插入一条数据：put 'table2','xiao-bang-zhu','info:column','wewdd'
然后读取该数据：get 'table2','xiao-bang-zhu'
因为日志文件在HDFS上，所以可以在终端直接输入命令：hdfs dfs -cat 日志文件的HDFS目录查看日志文件：

可以看到我们刚才的对table1和table2表的操作已经被详细记录到日志中，包括操作的具体时间和RowKey等。除此之外还有许多HBase内部的操作也会被记录进去，比如我们执行get操作时会在meta表中寻找get操作RowKey所对应的region的位置，而meta表本身也在某个region中，因此也会触发协处理器进行日志的记录。

三、总结

本文简单阐述了HBase中协处理器的概念，其核心思想可以概括为：将某些数据的处理工作直接交由服务端去完成，并将处理结果以小数据结果集的形式返回给客户端。事实上，协处理器的内容非常多，其中有更为细致的知识，碍于篇幅，这里没有给出。过滤器、计数器、协处理器为HBase的三大高级特性，如果配合来使用可以完成很多复杂的业务。感谢你的阅读，如有错误请不吝赐教！
更多内容请查看萧邦主的技术博客导航

共筑智慧城市新生态！YashanDB与荣科科技完成兼容互认证科技圈快讯 oracle 数据库
近日，深圳计算科学研究院的崖山数据库系统YashanDB与荣科科技股份有限公司的智慧工程移动管理平台V1.0与不动产智能管理系统V1.0成功完成了兼容性互认证，标志着双方在智慧城市建设领域实现关键突破，以国产化高性能数据库技术为核心，为工程建设与不动产管理领域提供安全可控、高效稳定的数字化解决方案。‌在兼容性互认证过程中，双方针对功能、性能、兼容性以及稳定性等关键指标进行了多轮严格测试，验证了Ya
支付宝MAU全解析：小程序生态的核心指标 ckx666666cky 小程序性能优化支付宝搜索引擎支付宝mau 支付宝mau优化
支付宝作为中国领先的移动支付和生活服务平台，其月活跃用户数（MonthlyActiveUsers，简称MAU）是衡量平台活力和商业价值的关键指标。MAU不仅反映了用户对平台的黏性和活跃度，还直接影响支付宝的商业潜力和市场竞争力。支付宝MAU概况截至最近公开数据，支付宝的MAU已突破9亿，这一庞大的用户基础为支付宝小程序生态提供了强大的流量支持。与微信支付等竞争对手相比，支付宝用户群体具有更强的消费
#Hadoop全分布式安装 #mysql安装 #hive安装砸吧砸吧 hadoop hive yarn mysql
分布式（多台机器部署不同组件）与集群（多台机器部署相同组件）概念。Linux基础命令linux具有文件数：目录、文件，从根目录开始，路径具有唯一性。pwd：显示当前路径特殊符号：/：根目录.：隐藏文件，如果路径以.开始，表示当前目录下..：当前目录下的上一级~：当前目录的home目录--help：帮助命令使用linux常用操作命令tab键：自动补全ls：显示指定目录内容默认：当前路径-a：显示所有
探索 ESP32：物联网时代的全能微控制器菜只因C 物联网
引言：从ESP8266到ESP32的进化之路在物联网(IoT)蓬勃发展的今天，嵌入式设备需要兼具高性能、低功耗和联网能力。乐鑫科技(RobinLi)推出的ESP32系列芯片，正是这一需求下的产物。自2016年发布以来，ESP32凭借其卓越的综合性能，迅速成为物联网开发者的首选平台。本文将从硬件架构、核心功能、开发生态到实际应用，全面解析这款"物联网心脏"的奥秘。一、ESP32的硬件架构解析1.1双
从 0 到 1 搭建一个 Web 应用项目：详细步骤与踩坑记录算法探索者前端
一、引言在当今数字化时代，Web应用无处不在。对于开发者而言，掌握从0到1搭建Web应用项目的技能至关重要。本指南将带你逐步完成一个简单Web应用项目的搭建，分享技术选型思路以及在过程中遇到的问题和解决方案，助力你开启Web开发之旅。二、技术选型（一）前端框架：选择React.js。它具有高效的虚拟DOM机制，能够快速更新页面，提升用户体验。同时，React生态系统丰富，有大量现成的组件库和工具可
Hadoop（在Linux中安装jdk）錠诗味 linux hadoop 运维
安装之前需准备：1.需要远程连接软件2.需要jdk3.需要准备两个文件夹01/export/software安装包02/export/servers解压文件夹现在正式开始安装1.将压缩包存放在/export/software目录下2.进入到software目录进行解压cd/export/software（切换目录）tar-zxvfjdk-8u202-linux-x64.tar.gz-C/expor
数据仓库和非结构化数据。 weixin_30631587 数据库
数据仓库包含标准化数据。还包含外部数据/非结构化数据如果外部数据量小可以保持数据库内部或者专用服务器。如果量大只能记住地址，在etl加载当然也有需求是实时数据比如股票汇率拿只能etl过程处理非结构化数据包含图片，视频音频如果是传统数据库db2oracle存在里面是不合适的。存储影响性能如果是hadoop无所谓影响不大，但是从使用者的角度非结构化数据只能转换关系使用建一张元数据表存储非结构化存储位置
CentOS 7系统中hadoop的安装和环境配置代码小张z centos hadoop linux
1.创建Hadoop安装解压路径：mkdir-p/usr/hadoop2.进入路径：cd/usr/hadoop3.下载安装包（我这里用的是阿里云镜像压缩包）：wgethttps://mirrors.aliyun.com/apache/hadoop/common/hadoop-3.3.5/hadoop-3.3.5.tar.gz4.解压安装包到hadoop文件路径：tar-zxvf/usr/hadoo
算力融合创新与多场景应用生态构建智能计算研究中心其他
内容概要算力作为数字经济的核心驱动力，正经历从单一计算范式向融合架构的跨越式演进。随着异构计算、光子计算等底层技术的突破，算力资源逐步形成跨架构协同、多模态联动的智能供给体系，支撑工业互联网、医疗影像、智能安防等场景实现效率跃升。与此同时，量子计算与神经形态计算的前沿探索，正在重塑科学计算与实时决策的技术边界。建议行业关注算力可扩展性与安全标准的协同设计，通过动态调度算法与分布式架构优化，构建弹性
Spring Boot 3 新特性实战：从理论到实践潘多编程网络 java 开发语言
引言SpringBoot自发布以来，凭借其简洁的配置和强大的功能，迅速成为Java开发者的首选框架。随着SpringBoot3的发布，开发者们迎来了更多令人兴奋的新特性。本文将深入探讨SpringBoot3的新特性，并通过实战示例展示如何在实际项目中应用这些新功能。1.支持Java17SpringBoot3全面支持Java17，这是Java生态系统中的一个重要里程碑。Java17带来了许多新特性，
【第9章】“基础工作流”怎么用？（图生图/局部重绘/VAE/更多基础工作流）ComfyUI基础入门教程聚梦小课堂 ComfyUI基础入门课 comfyui 基础教程工作流教程 AI绘画教程 AI作画人工智能 stable diffusion
引言学到这里，大家是不是会比较纠结，好像还在持续学习新的东西，未来还有多少基础的东西要学习，才能正常使用ComfyUI呢？这其实需要转变一个心态。AI绘画还处于一个快速迭代的过程，隔三岔五的就会有很多新技术、新模型出现，ComfyUI目前同样处于一个快速更新的阶段，从更新记录上也可以看到，几乎每一两天都会更新新版本。同样，生态的各种自定义节点也在持续更新。所以，不可能有个教程把所有未来会用到的知识
【网易雷火秋招】前端面经分享编程自学-领绿学长前端求职招聘面试
网易网易雷火是国内一流且最有创新力的游戏研发团队，是网易杭州的第一个游戏工作室。雷火开创性的打造了《逆水寒》、《永劫无间》、《倩女幽魂》、《全明星街球派对》等一众爆款游戏；并在二次元、FPS、主机游戏等方向上持续探索，《代号：无限大》等在研项目收到玩家广泛关注。与此同时，我们与全球合作伙伴一起共同构建开放、协同、共荣共生的产业生态，致力于让中国游戏走出去，让世界听见雷火声音。雷火还拥有国内专业从事
尚硅谷电商数仓6.0，hive on spark,spark启动不了新时代赚钱战士 hive spark hadoop
在datagrip执行分区插入语句时报错[42000][40000]Errorwhilecompilingstatement:FAILED:SemanticExceptionFailedtogetasparksession:org.apache.hadoop.hive.ql.metadata.HiveException:FailedtocreateSparkclientforSparksessio
ArkTS 基础语法介绍怀男孩笔记 harmonyos
ArkTS基础语法编程语言介绍什么是ArkTS？ArkTS是HarmonyOS生态的应用开发语言。它基于TypeScript（TS），并在此基础上进行了增强和优化，提供了声明式UI范式、状态管理支持等能力，帮助开发者以更简洁、自然的方式开发应用。ArkTS强化了静态类型检查，支持并发编程增强，并与TS/JS生态高效互操作，兼容性良好。ArkTS的主要特点包括：静态类型检查：在编译阶段检测更多错误，
OSPO Summit 2025 正式定档！议题征集同步开启开源
历经二十余年的发展，OSPO已然成为企业数字化转型的战略枢纽、产学研协同创新的关键桥梁、公共领域开放生态建设的核心引擎。作为这一进程的重要见证者和推动者，OSPOSummit也将在2025年6月12日迎来它的第三次进化。会议信息时间：2025年6月12日地点：北京议题征集，期待你的声音现在，我们面向全球开源社区决策者、企业技术管理者、学术机构研究者及一线开发者，发起议题征集！诚邀您分享OSPO如何
火山云与腾讯云的优势对比苹果企业签名分发腾讯云云计算
首先，我需要确定用户的需求是什么。可能他们是在选择云服务提供商，或者在做市场调研。用户可能是企业的IT决策者，或者是开发人员，需要了解哪个平台更适合他们的项目。接下来，我得收集火山云和腾讯云的基本信息。火山云是字节跳动旗下的，虽然进入市场较晚，但可能有字节的技术支持，比如大数据和AI方面的优势。腾讯云作为老牌厂商，生态完善，产品线全，尤其在游戏、社交等领域有优势。需要对比的方面包括：背景与市场地位
Hugging Face 模型格式全解析：从 PyTorch 到 GGUF mingo_敏 Deep Learning pytorch 人工智能 python
HuggingFace模型格式全解析：从PyTorch到GGUFHuggingFace生态支持多种模型格式，以满足不同场景下的存储、部署和推理需求。以下是主流格式的技术解析与演进脉络：1.PyTorch原生格式（.pt/.pth）特性：直接保存PyTorch的state_dict（模型参数）或完整模型（含结构）。兼容性强，与PyTorch训练/推理流程深度集成。文件体积较大，加载速度较慢，存在安全
Python助力区块链互通——跨链桥接的实现与实践 Echo_Wish Python！实战！区块链 python 开发语言
Python助力区块链互通——跨链桥接的实现与实践区块链技术的繁荣发展带来了巨大的生态创新，但也因各链之间的割裂局面限制了它们的潜力。例如，你或许想在以太坊上使用来自比特币的资产，却因两条链不互通而不得不求助于中心化交易所。要打破“链间壁垒”，跨链桥接（Cross-chainBridge）应运而生。今天，我以Echo_Wish的视角，通过Python代码实践，带你深入了解跨链桥接的工作原理，技术实
提升敏感力，“工具人”破圈的唯一解！技能咖 GAI认证生成式人工智能认证人工智能
在当今这个日新月异的数字化时代，个人与组织面临着前所未有的挑战与机遇。随着科技的飞速发展，尤其是生成式人工智能（GenerativeAI）的兴起，职场生态正在发生深刻变革。如何在这场变革中提升敏感力，实现从“工具人”到行业佼佼者的跨越，成为了众多职场人士关注的焦点。本文将探讨提升敏感力的重要性，并引入生成式人工智能认证（GAI认证），为您揭示“工具人”破圈的唯一解。提升敏感力：职场竞争的关键什么是
Moodle + Websoft9：创新教育的强大组合，助力教学与学习开源软件
Moodle+Websoft9：构建未来课堂的技术基石一、Moodle：开源生态的深度解析•模块化设计：支持超800个官方插件，如H5P交互内容创作、BigBlueButton虚拟课堂，满足个性化教学需求。•学习分析引擎：内置LearningAnalyticsAPI，可集成Python/R语言进行深度学习，预测学生学业风险。•移动优先战略：MoodleApp支持离线学习、扫码签到，2023年新增A
拓数派荣获上海数据交易所“数据治理服务商”认证数据库大数据云原生数字化转型
近期，杭州拓数派科技发展有限公司（以下简称“拓数派”）荣获上海数据交易所“数据治理服务商”认证，标志着拓数派正式加入上海数据交易所数商生态，成为上海数据交易所官方认证的数据治理服务商。拓数派企业发展部总监吴琪代表公司出席授牌仪式。上海数据交易所是由上海市人民政府指导下组建的准公共服务机构。上海数据交易所以构建数据要素市场、推进数据资产化进程为使命，正在围绕打造全球数据要素配置的重要枢纽节点的目标，
从 DeepSeek 到 AI 工具箱：Websoft9 应用托管平台赋能高校教学与科研人工智能deepseek
从DeepSeek到AI工具箱：Websoft9应用托管平台赋能高校教学与科研人工智能技术的快速发展正在重塑高校的教学与科研生态。从智能教学辅助到跨学科研究，AI工具的应用场景不断扩展，而技术落地的复杂性也带来新的挑战。在这一背景下，如何将大模型能力与多样化AI工具无缝整合，构建安全、易用的科研教学环境，成为高校数字化转型的关键命题。一、高校智能化转型的三大痛点技术门槛高•AI工具部署依赖专业运维
Websoft9 开源多应用平台：培养学生数字化能力的实战工具开源实践
引言数字化教育转型的核心在于将技术工具与教学场景深度融合，但传统模式常因环境配置复杂、工具链割裂等问题阻碍实践教学效率。Websoft9开源多应用平台以标准化部署、多工具集成、轻量化运维为核心能力，为教育场景提供了一种技术门槛更低、协作效率更高的解决方案。本文基于实际教学需求与技术验证，探讨如何通过该平台构建数字化能力培养体系。一、技术特性与教育场景的适配性开源生态覆盖全技术栈，缩短教学准备周期平
华为仓颉编程语言与医疗领域的深度融合：技术与实践想成为高手499 华为人工智能服务器
引言在数字化浪潮席卷全球的背景下，医疗行业的智能化转型已成为一种不可逆的趋势。从电子病历（EMR）、医疗影像分析，到远程手术和个性化健康管理，技术创新正在不断推动医疗领域的变革。然而，这一过程对底层技术提出了更高的要求：高效的计算性能、强大的硬件适配性、分布式计算能力以及生态系统的支持。华为推出的自研编程语言仓颉（Cangjie）正是在此背景下应运而生。仓颉语言以其高效、灵活和强大的硬件整合能力，
智慧交通是什么，可以帮助我们解决什么问题? Guheyunyi 运维大数据人工智能信息可视化前端
智慧交通是什么？智慧交通（SmartTransportation）是指利用物联网（IoT）、大数据、人工智能（AI）、云计算、5G通信等先进技术，对交通系统进行智能化管理和优化，以提高交通效率、减少拥堵、降低事故率、提升出行体验，并实现交通资源的合理配置和可持续发展。智慧交通的核心是通过数据采集、分析和应用，实现交通系统的智能化、自动化和协同化，从而构建一个高效、安全、绿色、便捷的交通生态系统。智
工业级应用无人机及机巢/机场选择对比 yychen_java 无人机
一、主流无人机厂商及产品性能对比大疆创新（DJI）代表型号：Mavic3行业版：续航45分钟，支持RTK厘米级定位，热成像相机，适用于电力巡检电力巡检电力巡检、消防救灾消防救灾消防救灾。Matrice300RTK：载重2.7kg，IP45防护，支持多传感器协同，用于测绘测绘测绘、安防监控安防监控安防监控。核心优势：生态完善，软件适配性强（如无人机管理平台无人机管理平台无人机管理平台），性价比高。极
基于Puppeteer与Selenium的跨浏览器自动化测试全攻略——从环境搭建到实战优化，万字详解自动化测试落地追寻向上 selenium 测试工具
自动化测试的价值与工具选型为什么需要自动化测试？效率提升：减少重复人工操作，回归测试耗时降低80%精准覆盖：支持高频次、多场景、多设备验证质量保障：避免人为疏忽导致的漏测问题Puppeteer与Selenium的互补性Puppeteer：专精Chrome生态，适用于高性能截图、动态渲染、复杂交互场景Selenium：支持多浏览器（Firefox/Safari/Edge），适合跨平台兼容性测试协同方
智能费用审核平台：赋能千行百业，重塑财务审查新生态人工智能
在数字经济浪潮席卷全球的今天，企业财务管理正经历着前所未有的变革。传统费用审核模式已难以应对日益复杂的商业环境和海量数据处理需求，低效、高错、高风险成为制约企业发展的桎梏。北京中烟创新科技有限公司（简称：中烟创新）智能费用审核平台应运而生，以技术创新重塑财务审查生态，为企业开启智能化财务管理的新纪元。这不仅是一场技术革新，更是一次管理理念的跃迁——通过AI赋能，实现从"事后纠错"到"事前预防"、从
NestJS Bull 和 BullMQ 模块：高效、可扩展的后端应用框架严微海
NestJSBull和BullMQ模块：高效、可扩展的后端应用框架bullBullmoduleforNestframework(node.js):cow:项目地址:https://gitcode.com/gh_mirrors/bul/bull项目介绍NestJS是一个基于Node.js的渐进式框架，专为构建高效且可扩展的服务器端应用程序而设计。NestJSBull和BullMQ模块是其生态系统中的
21.7 ChatGLM3-6B私有化部署实战：2小时快速搭建200 QPS高可用模型服务少林码僧 AI大模型应用实战专栏人工智能 gpt 语言模型
ChatGLM3-6B私有化部署实战：2小时快速搭建200QPS高可用模型服务ChatGLM3-6B私有化部署实战指南关键词：ChatGLM3-6B部署，私有化模型服务，性能优化，容器化部署，API服务封装1.部署环境准备与硬件规划ChatGLM3-6B私有化部署需要充分考虑算力资源与软件生态的适配性，以下是推荐配置方案：
对于规范和实现，你会混淆吗？ yangshangchuan HotSpot
昨晚和朋友聊天，喝了点咖啡，由于我经常喝茶，很长时间没喝咖啡了，所以失眠了，于是起床读JVM规范，读完后在朋友圈发了一条信息： JVM Run-Time Data Areas：The Java Virtual Machine defines various run-time data areas that are used during execution of a program. So
android 网络百合不是茶网络
android的网络编程和java的一样没什么好分析的都是一些死的照着写就可以了,所以记录下来方便查找 , 服务器使用的是TomCat 服务器代码; servlet的使用需要在xml中注册 package servlet; import java.io.IOException; import java.util.Arr
[读书笔记]读法拉第传 comsci 读书笔记
1831年的时候,一年可以赚到1000英镑的人..应该很少的... 要成为一个科学家,没有足够的资金支持,很多实验都无法完成但是当钱赚够了以后....就不能够一直在商业和市场中徘徊......
随机数的产生沐刃青蛟随机数
c++中阐述随机数的方法有两种：一是产生假随机数（不管操作多少次，所产生的数都不会改变）这类随机数是使用了默认的种子值产生的，所以每次都是一样的。 //默认种子 for (int i = 0; i < 5; i++) { cout<<
PHP检测函数所在的文件名 IT独行者 PHP 函数
很简单的功能，用到PHP中的反射机制，具体使用的是ReflectionFunction类，可以获取指定函数所在PHP脚本中的具体位置。创建引用脚本。代码： [php] view plain copy // Filename: functions.php <?php&nbs
银行各系统功能简介文强chu 金融
银行各系统功能简介　业务系统核心业务系统业务功能包括：总账管理、卡系统管理、客户信息管理、额度控管、存款、贷款、资金业务、国际结算、支付结算、对外接口等清分清算系统以清算日期为准，将账务类交易、非账务类交易的手续费、代理费、网络服务费等相关费用，按费用类型计算应收、应付金额，经过清算人员确认后上送核心系统完成结算的过程国际结算系
Python学习1(pip django 安装以及第一个project) 小桔子 python django pip
最近开始学习python,要安装个pip的工具。听说这个工具很强大，安装了它，在安装第三方工具的话so easy!然后也下载了，按照别人给的教程开始安装，奶奶的怎么也安装不上！第一步：官方下载pip-1.5.6.tar.gz, https://pypi.python.org/pypi/pip easy! 第二部：解压这个压缩文件，会看到一个setup.p
php 数组 aichenglong PHP 排序数组循环多维数组
1 php中的创建数组 $product = array('tires','oil','spark');//array()实际上是语言结构而不是函数 2 如果需要创建一个升序的排列的数字保存在一个数组中，可以使用range()函数来自动创建数组 $numbers=range(1,10)//1 2 3 4 5 6 7 8 9 10 $numbers=range(1,10,
安装python2.7 AILIKES python
安装python2.7 1、下载可从 http://www.python.org/进行下载#wget https://www.python.org/ftp/python/2.7.10/Python-2.7.10.tgz 2、复制解压 #mkdir -p /opt/usr/python #cp /opt/soft/Python-2
java异常的处理探讨百合不是茶 JAVA异常
//java异常 /* 1，了解java 中的异常处理机制，有三种操作 a,声明异常 b,抛出异常 c,捕获异常 2，学会使用try-catch-finally来处理异常 3，学会如何声明异常和抛出异常 4，学会创建自己的异常 */ //2，学会使用try-catch-finally来处理异常
getElementsByName实例 bijian1013 element
实例1： <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/x
探索JUnit4扩展：Runner bijian1013 java 单元测试 JUnit
参加敏捷培训时，教练提到Junit4的Runner和Rule，于是特上网查一下，发现很多都讲的太理论，或者是举的例子实在是太牵强。多搜索了几下，搜索到两篇我觉得写的非常好的文章。文章地址：http://www.blogjava.net/jiangshachina/archive/20
[MongoDB学习笔记二]MongoDB副本集 bit1129 mongodb
1. 副本集的特性 1)一台主服务器(Primary),多台从服务器(Secondary) 2)Primary挂了之后，从服务器自动完成从它们之中选举一台服务器作为主服务器，继续工作，这就解决了单点故障，因此，在这种情况下，MongoDB集群能够继续工作 3)挂了的主服务器恢复到集群中只能以Secondary服务器的角色加入进来 2
【Spark八十一】Hive in the spark assembly bit1129 assembly
Spark SQL supports most commonly used features of HiveQL. However, different HiveQL statements are executed in different manners: 1. DDL statements (e.g. CREATE TABLE, DROP TABLE, etc.)
Nginx问题定位之监控进程异常退出 ronin47
nginx在运行过程中是否稳定，是否有异常退出过？这里总结几项平时会用到的小技巧。 1. 在error.log中查看是否有signal项，如果有，看看signal是多少。比如，这是一个异常退出的情况： $grep signal error.log 2012/12/24 16:39:56 [alert] 13661#0: worker process 13666 exited on s
No grammar constraints (DTD or XML schema).....两种解决方法 byalias xml
方法一：常用方法关闭XML验证工具栏：windows => preferences => xml => xml files => validation => Indicate when no grammar is specified:选择Ignore即可。方法二：（个人推荐）添加内容如下 <?xml version=
Netty源码学习-DefaultChannelPipeline bylijinnan netty
package com.ljn.channel; /** * ChannelPipeline采用的是Intercepting Filter 模式 * 但由于用到两个双向链表和内部类，这个模式看起来不是那么明显，需要仔细查看调用过程才发现 * * 下面对ChannelPipeline作一个模拟，只模拟关键代码： */ public class Pipeline {
MYSQL数据库常用备份及恢复语句 chicony mysql
备份MySQL数据库的命令，可以加选不同的参数选项来实现不同格式的要求。 mysqldump -h主机 -u用户名 -p密码数据库名 > 文件备份MySQL数据库为带删除表的格式，能够让该备份覆盖已有数据库而不需要手动删除原有数据库。 mysqldump -–add-drop-table -uusername -ppassword databasename > ba
小白谈谈云计算--基于Google三大论文 CrazyMizzz Google 云计算 GFS
之前在没有接触到云计算之前，只是对云计算有一点点模糊的概念，觉得这是一个很高大上的东西，似乎离我们大一的还很远。后来有机会上了一节云计算的普及课程吧，并且在之前的一周里拜读了谷歌三大论文。不敢说理解，至少囫囵吞枣啃下了一大堆看不明白的理论。现在就简单聊聊我对于云计算的了解。我先说说GFS &n
hadoop 平衡空间设置方法 daizj hadoop balancer
在hdfs-site.xml中增加设置balance的带宽，默认只有1M： <property> <name>dfs.balance.bandwidthPerSec</name> <value>10485760</value> <description&g
Eclipse程序员要掌握的常用快捷键 dcj3sjt126com 编程
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可以那么勤奋，每天都孜孜不倦得
Android学习之路 dcj3sjt126com Android学习
转自：http://blog.csdn.net/ryantang03/article/details/6901459 以前有J2EE基础，接触JAVA也有两三年的时间了，上手Android并不困难，思维上稍微转变一下就可以很快适应。以前做的都是WEB项目，现今体验移动终端项目，让我越来越觉得移动互联网应用是未来的主宰。下面说说我学习Android的感受，我学Android首先是看MARS的视
java 遍历Map的四种方法 eksliang java HashMap java 遍历Map的四种方法
转载请出自出处： http://eksliang.iteye.com/blog/2059996 package com.ickes; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Map.Entry; /** * 遍历Map的四种方式
【精典】数据库相关相关 gengzg 数据库
package C3P0; import java.sql.Connection; import java.sql.SQLException; import java.beans.PropertyVetoException; import com.mchange.v2.c3p0.ComboPooledDataSource; public class DBPool{
自动补全 huyana_town 自动补全
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"><html xmlns="http://www.w3.org/1999/xhtml&quo
jquery在线预览PDF文件，打开PDF文件天梯梦 jquery
最主要的是使用到了一个jquery的插件jquery.media.js，使用这个插件就很容易实现了。核心代码 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.
ViewPager刷新单个页面的方法 lovelease android viewpager tag 刷新
使用ViewPager做滑动切换图片的效果时，如果图片是从网络下载的，那么再子线程中下载完图片时我们会使用handler通知UI线程，然后UI线程就可以调用mViewPager.getAdapter().notifyDataSetChanged()进行页面的刷新，但是viewpager不同于listview，你会发现单纯的调用notifyDataSetChanged()并不能刷新页面
利用按位取反（~）从复合枚举值里清除枚举值草料场 enum
以 C# 中的 System.Drawing.FontStyle 为例。如果需要同时有多种效果，如：“粗体”和“下划线”的效果，可以用按位或（|） FontStyle style = FontStyle.Bold | FontStyle.Underline; 如果需要去除 style 里的某一种效果，
Linux系统新手学习的11点建议刘星宇编程工作 linux 脚本
　　随着Linux应用的扩展许多朋友开始接触Linux，根据学习Windwos的经验往往有一些茫然的感觉：不知从何处开始学起。这里介绍学习Linux的一些建议。　　一、从基础开始：常常有些朋友在Linux论坛问一些问题，不过，其中大多数的问题都是很基础的。例如：为什么我使用一个命令的时候，系统告诉我找不到该目录，我要如何限制使用者的权限等问题，这些问题其实都不是很难的，只要了解了 Linu
hibernate dao层应用之HibernateDaoSupport二次封装 wangzhezichuan DAO Hibernate
/** * 方法描述:sql语句查询返回List<Class> * 方法备注: Class 只能是自定义类 * @param calzz * @param sql * @return * 创建人：王川 * 创建时间：Jul