有语忆语

kettle的基本介绍和使用

1、 kettle概述

1.1 什么是kettle

Kettle是一款开源的ETL工具，纯java编写，可以在Window、Linux、Unix上运行，绿色无需安装，数据抽取高效稳定。

1.2 Kettle核心知识点

1.2.1 Kettle工程存储方式

以XML形式存储
以资源库方式存储(数据库资源库和文件资源库)

1.2.2 Kettle的两种设计

1.2.3 Kettle的组成

1.3 kettle特点

2、 kettle安装部署和使用

2.1 kettle安装地址

官网地址
https://community.hitachivantara.com/docs/DOC-1009855
下载地址
https://sourceforge.net/projects/pentaho/files/Data%20Integration/

2.2 Windows下安装使用

2.2.1 概述

在实际企业开发中，都是在本地环境下进行kettle的job和Transformation开发的，可以在本地运行，也可以连接远程机器运行

2.2.2 安装

安装jdk
下载kettle压缩包，因kettle为绿色软件，解压缩到任意本地路径即可
双击Spoon.bat，启动图形化界面工具，就可以直接使用了

2.2.3 案例

案例一把stu1的数据按id同步到stu2，stu2有相同id则更新数据
(1)在mysql中创建两张表
mysql> create database kettle;
mysql> use kettle;
mysql> create table stu1(id int,name varchar(20),age int);
mysql> create table stu2(id int,name varchar(20));
(2)往两张表中插入一些数据
mysql> insert into stu1 values(1001,‘zhangsan’,20),(1002,‘lisi’,18), (1003,‘wangwu’,23);
mysql> insert into stu2 values(1001,‘wukong’);

(3)在kettle中新建转换

(4)分别在输入和输出中拉出表输入和插入/更新

(5)双击表输入对象，填写相关配置，测试是否成功

(6)双击更新/插入对象，填写相关配置

(7)保存转换，启动运行，去mysql表查看结果
注意：如果需要连接mysql数据库，需要要先将mysql的连接驱动包复制到kettle的根目录下的lib目录中，否则会报错找不到驱动。

案例2：使用作业执行上述转换，并且额外在表student2中添加一条数据
(1)新建一个作业

(2) 按图示拉取组件

(3)双击Start编辑Start

(4)双击转换，选择案例1保存的文件

(5)双击SQL，编辑SQL语句

(6)保存执行
3）案例3：将hive表的数据输出到hdfs
(1)因为涉及到hive和hbase的读写，需要修改相关配置文件。
修改解压目录下的data-integration\plugins\pentaho-big-data-plugin下的plugin.properties，设置active.hadoop.configuration=hdp26，并将如下配置文件拷贝到data-integration\plugins\pentaho-big-data-plugin\hadoop-configurations\hdp26下

(2)启动hdfs，yarn，hbase集群的所有进程，启动hiveserver2服务

[ybb@hadoop102 ~]$ /opt/module/hadoop-2.7.2/sbin/start-all.sh

开启HBase前启动Zookeeper

[ybb@hadoop102 ~]$ /opt/module/hbase-1.3.1/bin/start-hbase.sh
[ybb@hadoop102 ~]$ /opt/module/hive/bin/hiveserver2

(3)进入beeline，查看10000端口开启情况

[ybb@hadoop102 ~]$ /opt/module/hive/bin/beeline
Beeline version 1.2.1 by Apache Hive
beeline> !connect jdbc:hive2://hadoop102:10000（回车）
Connecting to jdbc:hive2://hadoop102:10000
Enter username for jdbc:hive2://hadoop102:10000: ybb（输入ybb）
Enter password for jdbc:hive2://hadoop102:10000:（直接回车）
Connected to: Apache Hive (version 1.2.1)
Driver: Hive JDBC (version 1.2.1)
Transaction isolation: TRANSACTION_REPEATABLE_READ
0: jdbc:hive2://hadoop102:10000>（到了这里说明成功开启10000端口）

(4)创建两张表dept和emp

CREATE TABLE dept(deptno int, dname string,loc string)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY '\t';

CREATE TABLE emp(
empno int,
ename string,
job string,
mgr int,
hiredate string,
sal double,
comm int,
deptno int)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY '\t';

(5)插入数据

insert into dept values(10,'accounting','NEW YORK'),(20,'RESEARCH','DALLAS'),(30,'SALES','CHICAGO'),(40,'OPERATIONS','BOSTON');

insert into emp values
(7369,'SMITH','CLERK',7902,'1980-12-17',800,NULL,20),
(7499,'ALLEN','SALESMAN',7698,'1980-12-17',1600,300,30),
(7521,'WARD','SALESMAN',7698,'1980-12-17',1250,500,30),
(7566,'JONES','MANAGER',7839,'1980-12-17',2975,NULL,20);

(6)按下图建立流程图

(7)设置表输入，连接hive

(8)设置排序属性

(9)设置连接属性

(10)设置字段选择

(11)设置文件输出

(12)保存并运行查看hdfs

2.3 创建资源库

2.3.1 数据库资源库

数据库资源库是将作业和转换相关的信息存储在数据库中，执行的时候直接去数据库读取信息，很容易跨平台使用
1)点击右上角connect，选择Other Resporitory

2) 选择Database Repository

3) 建立新连接

4) 填好之后，点击finish，会在指定的库中创建很多表，至此数据库资源库创建完成

5) 连接资源库

默认账号密码为admin

6) 将之前做过的转换导入资源库
(1)选择从xml文件导入

(2)随便选择一个转换

(3)点击保存，选择存储位置及文件名

(4)打开资源库查看保存结果

2.3.2 文件资源库

将作业和转换相关的信息存储在指定的目录中，其实和XML的方式一样
创建方式跟创建数据库资源库步骤类似，只是不需要用户密码就可以访问，跨
平台使用比较麻烦
1)选择connect

2)点击add后点击Other Repositories

3)选择File Repository

4)填写信息

2.4 Linux下安装使用

2.4.1 单机

1)jdk安装
2)安装包上传到服务器，解压
注意：1. 把mysql驱动拷贝到lib目录下
2. 将本地用户家目录下的隐藏目录C:\Users\自己用户名.kettle，整个上传到linux的家目录/home/ybb/下
3)运行数据库资源库中的转换：
[ybb@hadoop102 data-integration]$./pan.sh -rep=my_repo -user=admin -pass=admin -trans=stu1tostu2 -dir=/
参数说明：
-rep 资源库名称
-user 资源库用户名
-pass 资源库密码
-trans 要启动的转换名称
-dir 目录(不要忘了前缀 /)

4)运行资源库里的作业：
记得把作业里的转换变成资源库中的资源
[ybb@hadoop102 data-integration]$./kitchen.sh -rep=repo1 -user=admin -pass=admin -job=jobDemo1 -logfile=./logs/log.txt -dir=/
参数说明：
-rep - 资源库名
-user - 资源库用户名
-pass – 资源库密码
-job – job名
-dir – job路径
-logfile – 日志目录

2.4.2 集群模式

准备三台服务器，hadoop102作为Kettle主服务器，服务器端口号为8080，hadoop103和hadoop104作为两个子服务器，端口号分别为8081和8082。
安装部署jdk
hadoop完全分布式环境搭建，并启动进程(因为要使用hdfs)
上传解压kettle的安装包
进到/opt/module/data-integration/pwd目录，修改配置文件
修改主服务器配置文件carte-config-master-8080.xml


    master</name>
    hadoop102</hostname>
    8080</port>
    Y</master>
    cluster</username>
    cluster</password>
  </slaveserver>

修改从服务器配置文件carte-config-8081.xml
  
    
      master</name>
      hadoop102</hostname>
      8080</port>
      cluster</username>
      cluster</password>
      Y</master>
    </slaveserver>
  </masters>
  Y</report_to_masters>
  
    slave1</name>
    hadoop103</hostname>
    8081</port>
    cluster</username>
    cluster</password>
    N</master>
  </slaveserver>
修改从配置文件carte-config-8082.xml

    
      master</name>
      hadoop102</hostname>
      8080</port>
      cluster</username>
      cluster</password>
      Y</master>
    </slaveserver>
  </masters>
  Y</report_to_masters>
  
    slave2</name>
    hadoop104</hostname>
    8082</port>
    cluster</username>
    cluster</password>
    N</master>
  </slaveserver>

分发整个kettle的安装目录，xsync data-integration
启动相关进程，在hadoop102,hadoop103,hadoop104上执行
[ybb@hadoop102 data-integration] $./ c a r t e . s hha d oo p 1028080 [y bb @ ha d oo p 103 d a t a - in t e g r a t i o n]$ ./carte.sh hadoop103 8081
[ybb@hadoop104 data-integration]$./carte.sh hadoop104 8082
访问web页面
http://hadoop102:8080
案例：读取hive中的emp表，根据id进行排序，并将结果输出到hdfs上
注意：因为涉及到hive和hbase的读写，需要修改相关配置文件。
修改解压目录下的data-integration\plugins\pentaho-big-data-plugin下的plugin.properties，设置active.hadoop.configuration=hdp26，并将如下配置文件拷贝到data-integration\plugins\pentaho-big-data-plugin\hadoop-configurations\hdp26下

(1) 创建转换，编辑步骤，填好相关配置

(2) 创建子服务器，填写相关配置，跟集群上的配置相同

(3) 创建集群schema，选中上一步的几个服务器

(4) 对于要在集群上执行的步骤，右键选择集群，选中上一步创建的集群schema

(5) 创建Run Configuration,选择集群模式，直接运行

3、调优

1、调整JVM大小进行性能优化，修改Kettle根目录下的Spoon脚本。

参数参考：
-Xmx2048m：设置JVM最大可用内存为2048M。
-Xms1024m：设置JVM促使内存为1024m。此值可以设置与-Xmx相同，以避免每次垃圾回收完成后JVM重新分配内存。
-Xmn2g：设置年轻代大小为2G。整个JVM内存大小=年轻代大小 + 年老代大小 + 持久代大小。持久代一般固定大小为64m，所以增大年轻代后，将会减小年老代大小。此值对系统性能影响较大，Sun官方推荐配置为整个堆的3/8。
-Xss128k：设置每个线程的堆栈大小。JDK5.0以后每个线程堆栈大小为1M，以前每个线程堆栈大小为256K。更具应用的线程所需内存大小进行调整。在相同物理内存下，减小这个值能生成更多的线程。但是操作系统对一个进程内的线程数还是有限制的，不能无限生成，经验值在3000~5000左右。
2、调整提交（Commit）记录数大小进行优化，Kettle默认Commit数量为：1000，可以根据数据量大小来设置Commitsize：1000~50000
3、尽量使用数据库连接池；
4、尽量提高批处理的commit size；
5、尽量使用缓存，缓存尽量大一些（主要是文本文件和数据流）；
6、Kettle是Java做的，尽量用大一点的内存参数启动Kettle；
7、可以使用sql来做的一些操作尽量用sql；
Group , merge , stream lookup,split field这些操作都是比较慢的，想办法避免他们.，能用sql就用sql；
8、插入大量数据的时候尽量把索引删掉；
9、尽量避免使用update , delete操作，尤其是update,如果可以把update变成先delete, 后insert；
10、能使用truncate table的时候，就不要使用deleteall row这种类似sql合理的分区，如果删除操作是基于某一个分区的，就不要使用delete row这种方式（不管是deletesql还是delete步骤）,直接把分区drop掉，再重新创建；
11、尽量缩小输入的数据集的大小（增量更新也是为了这个目的）；
12、尽量使用数据库原生的方式装载文本文件(Oracle的sqlloader, mysql的bulk loader步骤)。

你可能感兴趣的:(大数据之Flume,kettle)

编程语言发展史之：编程语言的未来趋势 AI天才研究院 AI大模型企业级应用开发实战大数据人工智能语言模型 Java Python 架构设计
作者：禅与计算机程序设计艺术文章目录1.简介概述计算编程语言发展的主要里程碑2.编程语言的历史2.1编程语言的出现2.2第一代编程语言——FORTRAN2.3第二代编程语言——COBOL2.4第三代编程语言——PASCAL2.5第四代编程语言——C++、Java、C#、Python、Ruby等2.6模块化编程语言2.7跨平台语言2.8编程语言的分类3.编程语言的发展阶段及其性质编程语言的发展阶段及
赛博算卦之周易六十四卦JAVA实现：六幺算尽天下事，梅花化解天下苦。钮钴禄·爱因斯晨 java学习 java
佬们过年好呀~新年第一篇博客让我们来场赛博算命吧！更多文章：个人主页系列文章：JAVA专栏欢迎各位大佬来访哦~互三必回！！！文章目录#一、文化背景概述1.文化起源2.起卦步骤#二、卦象解读#三、justdoit!代码展示1.解析2.代码实现#四、总结#参考文献#一、文化背景概述1.文化起源六爻和六十四卦的文化起源可追溯至远古，那时人们为预测未来开展占卜，从龟甲兽骨裂纹到蓍草竹签筮法，逐步孕育了爻的
线性表之链表蚂蚁不吃土& C 数据结构链表数据结构
线性表之链表：头结点和头指针的区分：不管带不带头结点，头指针都始终指向链表的第一个结点；而头结点是带头结点的链表中的第一个结点，结点内通常不存储信息。注意：以下代码均是C环境下，不支持C++中的引用传递&typedef在C、C++中对struct的影响typedef表示类型定义的意思，typedefstruct是为了使用这个结构体方便，给结构体起个别名。（1）在C中的区别是使用时，是否可以省去st
move移动语义详解 Say-hai C++c++面试
move移动语义移动语义是C++11引入的一种机制，用于提高程序的性能和资源管理效率，特别是在涉及大数据对象的场景下。移动语义通过转移资源所有权，而不是复制资源，减少了不必要的拷贝操作。一、为什么需要移动语义？当对象需要被复制时（如函数返回值或传参），通常会调用复制构造函数（copyconstructor）。复制操作往往意味着需要分配新资源并将原资源的数据拷贝到新资源中；而如果不需要保留原对象的内
咱们一起学C++第二十七篇：之C++程序结构与“Hello, World!”深度剖析一杯年华@编程空间咱们一起学习C++visual studio vim emacs docker vscode
咱们一起学C++第二十七篇：之C++程序结构与“Hello,World!”深度剖析在C++学习的征程中，我们共同探索，不断深入理解这门语言的奥秘。此前，我们学习了编写第一个C++程序所需的基础知识，包括iostream类的使用和命名空间的初步概念。今天，我们将进一步剖析C++程序的基本结构，详细解读经典的“Hello,World!”程序，深入理解其背后的原理和C++语言的特性，这对于我们掌握C++
面向切面之集中式登录架构设计 roy_xing android 架构
普通登录流程图集中式登录流程图把共有的业务通过AOP统一管理这里我们就需要使用AspectJ来实现面向切面的集中式登录什么是AspectJAspectJ是一个面向切面的框架，它扩展了Java语言。AspectJ定义了AOP语法，它有一个专门的编译器用来生成遵守Java字节编码规范的Class文件。Aspect是切面是切入点(PointCuts)和通知(Advice)的集合。Pointcut切入点通
速算技巧之平方 *Major* 数学
速算技巧之平方一11-19进行速算技巧一对于11~19的平方，可以使用一个简单的公式进行快速计算：(1A)2=(1A+A)+A2(1A)^2=(1A+A)+A^2(1A)2=(1A+A)+A2(1A+A)表示前置位A^2表示后置位，逢10进位其中：111是11~19之间的数的1AAA，是11~19之间的数的1,2,3,4,5,6,7,8,9案例1：12212^2122A=2A=2A=2计算前置位：
大数据毕业设计hadoop+spark+hive豆瓣图书数据分析可视化大屏豆瓣图书爬虫图书推荐系统 qq_79856539 javaweb java 大数据 hadoop 课程设计
系统总体目标基于Spark的个性化书籍推荐系统是一种基于大数据技术的智能推荐系统，它可以根据用户的历史行为和偏好，为用户提供个性化的书籍推荐。该系统采用Spark技术，可以实现大数据的实时处理，从而提高推荐系统的准确性和可靠性。此外，该系统还可以根据用户的习惯和偏好，提供更加个性化的书籍推荐，从而满足用户的需求。系统的使用者包含普通用户和管理员两类，普通用户是系统的主要服务对象，主流人群是经常查看
长沙旅游新打卡路线之湘江双层观光巴士？WebGIS带你一睹为快夜郎king leaflet TrackPlayer追踪 leaflet动态轨迹 Leaflet动态轨迹模拟
目录前言一、观光巴士路线及沿途风景1、互联网上的观光巴士信息2、沿途商圈、景点3、途径公交车站二、Leaflet.TrackPlayer简介1、Leaflet.TrackPlayer是什么？2、Leaflet.TrackPlayer方法和参数三、集成Leaflet.TrackPlayer到观光路线1、代码实现过程2、动态控制3、成果展示四、总结前言今天是大年初一，在蛇年的第一天里，给各位朋友拜个年
企业数字化规划蓝图、企业数字化运营分析管理大数据平台建设方案公众号：优享智库数字化转型数据治理主数据数据仓库大数据
**企业数字化规划蓝图及运营分析管理大数据平台建设方案****一、企业数字化规划蓝图**1.**数字化目标设定**企业在规划数字化进程时，首先需要明确数字化目标。这些目标应当与企业的整体战略和发展规划相一致，包括但不限于提高运营效率、优化客户体验、创新业务模式等。同时，目标应具体、可衡量，以便于后续的实施和评估。2.**技术平台规划**技术平台是支撑企业数字化的基础。在规划阶段，需要确定所需的技术
使用Flink进行流式图处理 AI天才研究院大数据AI人工智能 AI大模型企业级应用开发实战计算计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
使用Flink进行流式图处理1.背景介绍1.1大数据时代的到来随着互联网、物联网和移动互联网的快速发展,数据呈现出爆炸式增长。根据IDC的预测,到2025年,全球数据量将达到175ZB。传统的批处理系统已经无法满足对实时数据处理的需求。因此,流式计算应运而生,成为大数据处理的重要组成部分。1.2流式计算的概念流式计算是一种新兴的数据处理范式,它能够持续不断地处理来自各种数据源的数据流。与传统的批处
AI编译器之——为什么大模型需要Relax？ FF-Studio 人工智能深度学习自然语言处理机器学习语言模型
放在最前：Relax的关键创新深度学习模型（比如ChatGPT这种大模型）在运行时经常遇到“输入尺寸不固定”的情况。比如你问它一个问题，这次输入是10个字，下次可能是100个字。传统编译器处理这种“变来变去”的尺寸很笨——要么只能按固定尺寸优化（导致变尺寸时性能暴跌），要么每次都要重新编译（慢到没法用）。Relax的创新：符号形状：让编译器学会“代数”Relax允许编译器用“符号变量”（比如n）表
Vue2之 v-if VS v-show 问老大前端 javascript 开发语言 vue.js
Vue2中的v-if和v-show都是用来实现条件性渲染的指令，用于控制元素显示与隐藏的指令，但它们在实现机制和使用场景上有所不同：一、实现机制：1.1、v-if当条件表达式为真时，Vue.js会根据条件动态地创建或销毁对应的DOM元素。当条件为假时，Vue.js会销毁对应的DOM元素，并且从DOM中移除。每次条件改变时，Vue.js都会重新进行DOM的创建或销毁，这可能会导致性能开销较高，尤其是
python与excel整合全教程刘同学Python学习日记 python excel 开发语言
Python与Excel的整合非常强大，尤其适合处理大数据、自动化表格操作以及进行高级数据分析。以下是一个全教程，涵盖常用的Python库及其应用：1.准备工作安装必要的库：使用以下命令安装常用库：pipinstallopenpyxlpandasxlrdxlsxwriterpywin32openpyxl:用于操作Excel的.xlsx文件（推荐）。pandas:强大的数据分析工具，支持读取和写入E
数据结构与算法之排序: LeetCode 1356. 根据数字二进制下 1 的数目排序 (Ts版) Wang's Blog Data Structure and Algorithms 动态规划 leetcode 算法
根据数字二进制下1的数目排序https://leetcode.cn/problems/sort-integers-by-the-number-of-1-bits/description/描述给你一个整数数组arr。请你将数组中的元素按照其二进制表示中数字1的数目升序排序如果存在多个数字二进制中1的数目相同，则必须将它们按照数值大小升序排列请你返回排序后的数组示例1输入：arr=[0,1,2,3,4
java笔记--设计模式之装饰模式 2401_89693697 java 笔记设计模式
packagecom.example.design.decorate;publicclassConcreteComponentimplementsComponent{@OverridepublicvoiddoThingA(){//TODO自动生成的方法存根System.out.println("具体构件实现的抽象接口，dothingA");}}(3)装饰类角色packagecom.example.
[创业之路-269]：《创业讨论会》- 系统之韵：从麻雀到5G系统的共通性探索文火冰糖的硅基工坊创业之路创业架构
关键词：从系统的角度，麻雀、人体系统、企业系统、软硬件系统、软件系统、通信系统、5G系统是类似的：都有：内在看不见的规律、外在显性各种现象都是：输入、处理、输出都是：静态、要素、组成、结构、组织都是：运行、场景、流程、时序都是：规则、准则、规章、制度都是：目标、功能、性能、绩效、指标都是：不变、稳定、易变、随变都是：自顶向下设计、分解、分层、模块都是：自底向上实现、聚合、集成都是：需求、规划、设计
如何写一份合格的大数据简历（附简历模板）教程 itLeeyw573 老板必点的高分简历 sqlite oracle mysql sql zookeeper kafka big data
一、简历的重要性简历是求职者给招聘者的第一印象，一份合格的简历能够快速让招聘者了解你的基本信息、工作经历、技能特长等，从而决定是否给予你面试机会。它是开启理想工作大门的钥匙，所以一定要重视起来。【编辑/下载】：大数据开发简历范文二、简历结构基本信息：包含姓名、性别、联系方式（电话、邮箱）、求职意向。姓名要突出显示，联系方式务必准确无误，求职意向明确且具体，比如“Java开发工程师”，让招聘者一眼就
Android车机DIY开发之硬件篇(三)—NXP开发板介绍勿忘初心91 车机DIY android 单片机 mcu 嵌入式硬件 arm开发
Android车机DIY开发之硬件篇(三)—NXP开发板介绍1.讯为iTOP-iMX8MMini开发板官网介绍MINIPCIE可外接miniPCIE接口的4G模块,具备PCIE2.0单通道WIFI/BT支持4G模块支持（选配）MIPI-DSI1个无HDMISpeaker2路MIC支持MIC输入PHONE支持耳机输出CAN1路Speaker2路SDIO/GPIO接口20PINAndroid9.0系统
Android车机DIY开发之软件篇(三)编译Automotive OS错误(1) 勿忘初心91 android 嵌入式硬件 mcu github 单片机
Android车机DIY开发之软件篇(三)编译AutomotiveOS错误(1)问题FAILED:out/soong/build.ninjacd“KaTeXparseerror:Expected'EOF',got'&'atposition49:…soong_build")"&̲&BUILDER="PWD/KaTeXparseerror:Expected'EOF',got'&'atposition5
【llm对话系统】大模型源码分析之llama模型的long context更长上下文支持 kakaZhui llama 深度学习 pytorch AIGC chatgpt
1.引言Llama模型的一个重要特性是支持长上下文处理。本文将深入分析Llama源码中实现长上下文的关键技术点，包括位置编码(positionembedding)的外推方法、注意力机制的优化等。我们将通过详细的代码解析来理解其实现原理。2.位置编码的外推实现2.1旋转位置编码(RoPE)基础Llama采用旋转位置编码(RoPE,RotaryPositionEmbedding)来编码token的位置
基础渗透测试实验—永恒之蓝漏洞复现锅盖'awa' 网络安全小白之路 linux windows 系统安全安全性测试
文章目录概述一、漏洞简述二、组件概述三、漏洞影响四、漏洞复现4.1环境搭建4.2复现过程：1.查看上线主机2.使用Metasploit（MSF）工具3.选择一个编码技术，用来绕过杀毒软件的查杀4.远程控制目标机缓解措施概述永恒之蓝是指2017年4月14日晚，黑客团体ShadowBrokers（影子经纪人）公布一大批网络攻击工具，其中包含“永恒之蓝”工具，“永恒之蓝”利用Windows系统的SMB漏
备赛蓝桥杯之第十五届职业院校组省赛第三题：产品360度展示云端·目前学前端备赛蓝桥杯蓝桥杯职场和发展
提示：本篇文章仅仅是作者自己目前在备赛蓝桥杯中，自己学习与刷题的学习笔记，写的不好，欢迎大家批评与建议由于个别题目代码量与题目量偏大，请大家自己去蓝桥杯官网【连接高校和企业-蓝桥云课】去寻找原题，在这里只提供部分原题代码本题目为：2024年十五届省赛职业院校组真题第三题：产品360度展示题目：需要考生作答的代码段如下：/***@param{*}initialValue初始值*@param{Arra
C++之for循环黄皮大仙 C++c++
>>>>>记录几种常用for循环//循环for(变量类型变量名称:数组)循环内容;for(auto变量名称:数组)循环内容;intstudentid[]{10001,10002,10003,10004,10005};for(intvalue:studentid)std::cout>>>>
MongoDB 大俗大雅，上来问分片真三俗 -- 4 分什么分 Austindatabases mongodb 数据库
开头还是介绍一下群，如果感兴趣PolarDB,MongoDB,MySQL,PostgreSQL,Redis,OceanBase,SqlServer等有问题，有需求都可以加群群内有各大数据库行业大咖，可以解决你的问题。加群请联系liuaustin3，（共2710人左右1+2+3+4+5+6+7+8+9）(123456群均已爆满，7群400+，开8群9群)这是MongoDB宣传周的第五篇，这周真漫长，
大数据技术在数据安全治理中的应用罗思付之技术屋综合技术探讨及方案专栏大数据
摘要面对新形势下的数据安全治理挑战，顺应数据安全领域的技术发展趋势，针对大型国企在数据安全治理实际应用中突出的关键权限人员识别问题，提出了一种基于图算法的关键权限人员识别技术。该技术可以发现系统中潜在的权限影响因素，并可从多个角度衡量不同含义的权重影响力，识别结果可解释性强。针对数据安全治理中的用户与实体行为异常检测问题，提出一种基于生成对抗网络的用户与实体行为异常检测方法，实验结果表明，所提方法
【llm对话系统】大模型 RAG 之回答生成：融合检索信息，生成精准答案 kakaZhui 人工智能 AIGC chatgpt llama
今天，我们将深入RAG流程的最后一步，也是至关重要的一步：回答生成(AnswerGeneration)。在这一步，LLM将融合用户问题和检索到的文档片段，生成最终的答案。这个过程不仅仅是简单的文本拼接，更需要LLM对检索结果进行理解、推理和整合，才能输出准确、流畅且符合用户需求的答案。一、回答生成的目标RAG中回答生成的目标主要包括：准确性(Accuracy):生成的答案需要准确回答用户的问题，并
Python 包管理之 poetry 奔跑的大西吉 Python
poetry是一个Python虚拟环境和依赖管理的工具。poetry和pipenv类似，另外还提供了打包和发布的功能。官方文档：python-poetry.org/docs/python项目部署：poetry管理本地环境,上线用dockerpoetry安装poetry提供多种安装方式，个人推荐从以下2种方式中选择：方式一：（推荐）$curl-sSLhttps://raw.githubusercon
为AI聊天工具添加一个知识系统之75 详细设计之16 正则表达式之3 正则表达式模板一水鉴天人工智能正则表达式
本文要点概念图式schema：。处理“我”立“每一个新提概念的提出都首先是语言的-含糊概念Notion{Yes，Unkown,No}，然后才是程序的-模糊符号Notation{True，False}，最后会是数据的-近似值Approximation{Good,Fair,Poor}。”。每一次旧概念的废除（破）则正好相反。一个概念的每一个区域的形成都需要三化方的通力合作。1启动破、立过程互翻；2集成
为AI聊天工具添加一个知识系统之77 详细设计之18 正则表达式之5 一水鉴天人工语言软件智能智能制造人工智能正则表达式
本文要点昨天讨论了本项目（AI聊天工具添加一个知识系统）中正则表达式模板的设计中可能要考虑到的一些问题（讨论到的内容比较随意，暂时无法确定那些考虑是否应该是正则表达式模板设计要考虑的以及是否完整）。今天我们在正则表达式更高设计层次上看看本项目的整个正则表达式应该是怎样的。先给出综述：开发时/运行时/生产时（三世归一化时间投影X-piece-scale，三代连坐时间并行升级换代）的三界标准化空间(位
Js函数返回值 _wy_ js return
一、返回控制与函数结果，语法为：return 表达式;作用: 结束函数执行，返回调用函数，而且把表达式的值作为函数的结果二、返回控制语法为：return;作用: 结束函数执行，返回调用函数，而且把undefined作为函数的结果在大多数情况下,为事件处理函数返回false,可以防止默认的事件行为.例如,默认情况下点击一个<a>元素,页面会跳转到该元素href属性
MySQL 的 char 与 varchar bylijinnan mysql
今天发现，create table 时，MySQL 4.1有时会把 char 自动转换成 varchar 测试举例： CREATE TABLE `varcharLessThan4` ( `lastName` varchar(3) ) ; mysql> desc varcharLessThan4; +----------+---------+------+-
Quartz——TriggerListener和JobListener eksliang TriggerListener JobListener quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208624 一.概述 listener是一个监听器对象，用于监听scheduler中发生的事件，然后执行相应的操作；你可能已经猜到了，TriggerListeners接受与trigger相关的事件，JobListeners接受与jobs相关的事件。二.JobListener监听器 j
oracle层次查询 18289753290 oracle；层次查询；树查询
.oracle层次查询(connect by) oracle的emp表中包含了一列mgr指出谁是雇员的经理，由于经理也是雇员，所以经理的信息也存储在emp表中。这样emp表就是一个自引用表，表中的mgr列是一个自引用列，它指向emp表中的empno列，mgr表示一个员工的管理者， select empno,mgr,ename,sal from e
通过反射把map中的属性赋值到实体类bean对象中酷的飞上天空 javaee 泛型类型转换
使用过struts2后感觉最方便的就是这个框架能自动把表单的参数赋值到action里面的对象中但现在主要使用Spring框架的MVC，虽然也有@ModelAttribute可以使用但是明显感觉不方便。好吧，那就自己再造一个轮子吧。原理都知道，就是利用反射进行字段的赋值，下面贴代码主要类如下： import java.lang.reflect.Field; imp
SAP HANA数据存储：传统硬盘的瓶颈问题蓝儿唯美 HANA
SAPHANA平台有各种各样的应用场景，这也意味着客户的实施方法有许多种选择，关键是如何挑选最适合他们需求的实施方案。在《Implementing SAP HANA》这本书中，介绍了SAP平台在现实场景中的运作原理，并给出了实施建议和成功案例供参考。本系列文章节选自《Implementing SAP HANA》，介绍了行存储和列存储的各自特点，以及SAP HANA的数据存储方式如何提升空间压
Java Socket 多线程实现文件传输随便小屋 java socket
高级操作系统作业，让用Socket实现文件传输，有些代码也是在网上找的，写的不好，如果大家能用就用上。客户端类： package edu.logic.client; import java.io.BufferedInputStream; import java.io.Buffered
java初学者路径 aijuans java
学习Java有没有什么捷径?要想学好Java，首先要知道Java的大致分类。自从Sun推出Java以来，就力图使之无所不包，所以Java发展到现在，按应用来分主要分为三大块：J2SE,J2ME和J2EE,这也就是Sun ONE(Open Net Environment)体系。J2SE就是Java2的标准版，主要用于桌面应用软件的编程；J2ME主要应用于嵌入是系统开发，如手机和PDA的编程；J2EE
APP推广 aoyouzi APP 推广
一，免费篇 1，APP推荐类网站自主推荐最美应用、酷安网、DEMO8、木蚂蚁发现频道等,如果产品独特新颖，还能获取最美应用的评测推荐。PS：推荐简单。只要产品有趣好玩，用户会自主分享传播。例如足迹APP在最美应用推荐一次，几天用户暴增将服务器击垮。 2，各大应用商店首发合作老实盯着排期，多给应用市场官方负责人献殷勤。 3，论坛贴吧推广百度知道，百度贴吧，猫扑论坛，天涯社区，豆瓣（
JSP转发与重定向百合不是茶 jsp servlet Java Web jsp转发
在servlet和jsp中我们经常需要请求,这时就需要用到转发和重定向; 转发包括;forward和include 例子;forwrad转发; 将请求装法给reg.html页面关键代码; req.getRequestDispatcher("reg.html
web.xml之jsp-config bijian1013 java web.xml servlet jsp-config
1.作用：主要用于设定JSP页面的相关配置。 2.常见定义： <jsp-config> <taglib> <taglib-uri>URI(定义TLD文件的URI,JSP页面的tablib命令可以经由此URI获取到TLD文件)</tablib-uri> <taglib-location> TLD文件所在的位置
JSF2.2 ViewScoped Using CDI sunjing CDI JSF 2.2 ViewScoped
JSF 2.0 introduced annotation @ViewScoped; A bean annotated with this scope maintained its state as long as the user stays on the same view(reloads or navigation - no intervening views). One problem w
【分布式数据一致性二】Zookeeper数据读写一致性 bit1129 zookeeper
很多文档说Zookeeper是强一致性保证，事实不然。关于一致性模型请参考http://bit1129.iteye.com/blog/2155336 Zookeeper的数据同步协议 Zookeeper采用称为Quorum Based Protocol的数据同步协议。假如Zookeeper集群有N台Zookeeper服务器(N通常取奇数，3台能够满足数据可靠性同时
Java开发笔记白糖_ java开发
1、Map<key,value>的remove方法只能识别相同类型的key值 Map<Integer,String> map = new HashMap<Integer,String>(); map.put(1,"a"); map.put(2,"b"); map.put(3,"c"
图片黑色阴影 bozch 图片
.event{ padding:0; width:460px; min-width: 460px; border:0px solid #e4e4e4; height: 350px; min-heig
编程之美-饮料供货-动态规划 bylijinnan 动态规划
import java.util.Arrays; import java.util.Random; public class BeverageSupply { /** * 编程之美饮料供货 * 设Opt（V’，i）表示从i到n-1种饮料中，总容量为V’的方案中，满意度之和的最大值。 * 那么递归式就应该是：Opt（V’，i）=max{ k * Hi+Op
ajax大参数（大数据）提交性能分析 chenbowen00 Web Ajax 框架浏览器 prototype
近期在项目中发现如下一个问题项目中有个提交现场事件的功能，该功能主要是在web客户端保存现场数据（主要有截屏，终端日志等信息）然后提交到服务器上方便我们分析定位问题。客户在使用该功能的过程中反应点击提交后反应很慢，大概要等10到20秒的时间浏览器才能操作，期间页面不响应事件。根据客户描述分析了下的代码流程，很简单，主要通过OCX控件截屏，在将前端的日志等文件使用OCX控件打包，在将之转换为
[宇宙与天文]在太空采矿,在太空建造 comsci
我们在太空进行工业活动...但是不太可能把太空工业产品又运回到地面上进行加工,而一般是在哪里开采,就在哪里加工,太空的微重力环境,可能会使我们的工业产品的制造尺度非常巨大.... 地球上制造的最大工业机器是超级油轮和航空母舰,再大些就会遇到困难了,但是在空间船坞中,制造的最大工业机器,可能就没
ORACLE中CONSTRAINT的四对属性 daizj oracle CONSTRAINT
ORACLE中CONSTRAINT的四对属性 summary:在data migrate时,某些表的约束总是困扰着我们,让我们的migratet举步维艰,如何利用约束本身的属性来处理这些问题呢?本文详细介绍了约束的四对属性: Deferrable/not deferrable, Deferred/immediate, enalbe/disable, validate/novalidate,以及如
Gradle入门教程 dengkane gradle
一、寻找gradle的历程一开始的时候，我们只有一个工程，所有要用到的jar包都放到工程目录下面，时间长了，工程越来越大，使用到的jar包也越来越多，难以理解jar之间的依赖关系。再后来我们把旧的工程拆分到不同的工程里，靠ide来管理工程之间的依赖关系，各工程下的jar包依赖是杂乱的。一段时间后，我们发现用ide来管理项程很不方便，比如不方便脱离ide自动构建，于是我们写自己的ant脚本。再后
C语言简单循环示例 dcj3sjt126com c
# include <stdio.h> int main(void) { int i; int count = 0; int sum = 0; float avg; for (i=1; i<=100; i++) { if (i%2==0) { count++; sum += i; } } avg
presentModalViewController 的动画效果 dcj3sjt126com controller
系统自带(四种效果)： presentModalViewController模态的动画效果设置： [cpp] view plain copy UIViewController *detailViewController = [[UIViewController al
java 二分查找 shuizhaosi888 二分查找 java二分查找
需求：在排好顺序的一串数字中，找到数字T 一般解法：从左到右扫描数据，其运行花费线性时间O(N)。然而这个算法并没有用到该表已经排序的事实。 /** * * @param array * 顺序数组 * @param t * 要查找对象 * @return */ public stati
Spring Security（07）——缓存UserDetails 234390216 ehcache 缓存 Spring Security
Spring Security提供了一个实现了可以缓存UserDetails的UserDetailsService实现类，CachingUserDetailsService。该类的构造接收一个用于真正加载UserDetails的UserDetailsService实现类。当需要加载UserDetails时，其首先会从缓存中获取，如果缓存中没
Dozer 深层次复制 jayluns VO maven po
最近在做项目上遇到了一些小问题，因为架构在做设计的时候web前段展示用到了vo层，而在后台进行与数据库层操作的时候用到的是Po层。这样在业务层返回vo到控制层，每一次都需要从po-->转化到vo层，用到BeanUtils.copyProperties(source, target)只能复制简单的属性，因为实体类都配置了hibernate那些关联关系，所以它满足不了现在的需求，但后发现还有个很
CSS规范整理（摘自懒人图库） a409435341 html UI css 浏览器
刚没事闲着在网上瞎逛，找了一篇CSS规范整理，粗略看了一下后还蛮有一定的道理，并自问是否有这样的规范，这也是初入前端开发的人一个很好的规范吧。一、文件规范 1、文件均归档至约定的目录中。具体要求通过豆瓣的CSS规范进行讲解：所有的CSS分为两大类：通用类和业务类。通用的CSS文件，放在如下目录中：基本样式库 /css/core
C++动态链接库创建与使用你不认识的休道人 C++dll
一、创建动态链接库 1.新建工程test中选择”MFC [dll]”dll类型选择第二项"Regular DLL With MFC shared linked"，完成 2.在test.h中添加 extern “C” 返回类型 _declspec(dllexport)函数名(参数列表); 3.在test.cpp中最后写 extern “C” 返回类型 _decls
Android代码混淆之ProGuard rensanning ProGuard
Android应用的Java代码，通过反编译apk文件（dex2jar、apktool）很容易得到源代码，所以在release版本的apk中一定要混淆一下一些关键的Java源码。 ProGuard是一个开源的Java代码混淆器（obfuscation）。ADT r8开始它被默认集成到了Android SDK中。官网： http://proguard.sourceforge.net/
程序员在编程中遇到的奇葩弱智问题 tomcat_oracle jquery 编程 ide
　　现在收集一下：　　排名不分先后，按照发言顺序来的。 1、Jquery插件一个通用函数一直报错，尤其是很明显是存在的函数，很有可能就是你没有引入jquery。。。或者版本不对 2、调试半天没变化：不在同一个文件中调试。这个很可怕，我们很多时候会备份好几个项目，改完发现改错了。有个群友说的好：在汤匙
解决maven-dependency-plugin (goals "copy-dependencies","unpack") is not supported xp9802 dependency
解决办法：在plugins之前添加如下pluginManagement，二者前后顺序如下： [html] view plain copy <build> <pluginManagement

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他