提莫_

大数据项目实践过程笔记

开发工具intelijidea 2.19.3
目前围绕Hadoop体系的大数据架构包括：
传统大数据架构
数据分析的业务没有发生任何变化，但是因为数据量、性能等问题导致系统无法正常使用，需要进行升级改造，那么此类架构便是为了解决这个问题。依然保留了ETL的动作，将数据经过ETL动作进入数据存储。数据分析需求依旧以BI场景为主，但是因为数据量、性能等问题无法满足日常使用。
流式架构
在传统大数据架构的基础上，流式架构数据全程以流的形式处理，在数据接入端将ETL替换为数据通道。经过流处理加工后的数据，以消息的形式直接推送给了消费者。存储部分在外围系统以窗口的形式进行存储。适用于预警、监控、对数据有有效期要求的情况。
Lambda架构
Lambda架构算大数据系统里面举足轻重的架构，数据通道分为两条分支：实时流和离线。实时流依照流式架构，保障了其实时性，而离线则以批处理方式为主，保障了最终一致性。适用于同时存在实时和离线需求的情况。
Kappa架构
Kappa架构在Lambda的基础上进行了优化，将实时和流部分进行了合并，将数据通道以消息队列进行替代。因此对于Kappa架构来说，依旧以流处理为主，但是数据却在数据湖层面进行了存储，当需要进行离线分析或者再次计算的时候，则将数据湖的数据再次经过消息队列重播一次则可。
Unifield架构
Unifield架构将机器学习和数据处理揉为一体，在流处理层新增了机器学习层。数据在经过数据通道进入数据湖后，新增了模型训练部分，并且将其在流式层进行使用。同时流式层不单使用模型，也包含着对模型的持续训练。适用于有着大量数据需要分析，同时对机器学习方便又有着非常大的需求或者有规划的情况。

###eclipse maven 打包jar

最近写项目需要将其打成jar上传到服务器上，之前一直写到是web，打的是war包，这次写的是游戏服务器，是jar包。顺便记之。
maven打包
关于打包有两种类型：①不带依赖的打包，②带依赖的打包
默认情况下我们使用maven install打包生成的是第①种，如果想要第②种，可以使用插件实现

使用插件：

    
        
            maven-assembly-plugin
            2.2
            
                
                    
                        
                        com.lhcc.weblog.ReadWebLog
                    
                
                
                    
                        
                        jar-with-dependencies
                    
                
            
        
    

注意：需要在run build运行的时候添加如下参数：
	assembly:assembly
这样，将会生成①不带依赖的打包和②带依赖的打包。

插件生成的jar.png

生成带依赖jar主要两个步骤
①在pom中添加plugin依赖
②build的时候添加assembly:assembly参数

###myeclipse maven 打包jar

第一步：pom.xml


	4.0.0
	com.lhcc
	hadoop-word-count
	1.0
	
		
			
				org.apache.maven.plugins
				maven-compiler-plugin
				3.3
				
					8
					8
				
			
		
	
	
	
		UTF-8
		2.6.0-cdh5.15.2
	


	
	
		
			cloudera
			https://repository.cloudera.com/artifactory/cloudera-repos/
		
	

	
		
		
			org.apache.hadoop
			hadoop-client
			${hadoop.version}
		

		
			org.apache.commons
			commons-lang3
			3.8.1
		
	

第二步
maven install

###在ubuntu环境下面运行上面的jar

java -cp weblog.jar com.lhcc.weblog.ReadWebLog /home/fgq/codec/SogouQ.log /home/fgq/codec/weblogs.log 
注意 SogouQ.log 网上下载的sogo的日志数据https://www.sogou.com/labs/resource/q.php

-----------------------------------------【flume】---------------------------------------------------------------
###flume 从[监听文件]中获取数据信息且下沉Sink到另一个监听ip(192.168.146.100)和端口（4545）中

1.  [agent0.properties]
	a0.sources = s1
	a0.sinks = k1
	a0.channels = c1
	 
	a0.sources.s1.type = avro
	a0.sources.s1.channels = c1
	#可以写死成192.168.146.100 也可以写成0.0.0.0
	a0.sources.s1.bind = 0.0.0.0
	a0.sources.s1.port = 4545
	 
	a0.channels.c1.type = memory
	a0.channels.c1.capacity = 1000
	a0.channels.c1.transactionCapacity = 100
	 
	a0.sinks.k1.type = logger
	a0.sinks.k1.channel = c1
	
2.先启动Avro[agent1.properties]的Source的监听端口(192.168.146.100:4545)
	flume-ng agent --conf conf --name a0 --conf-file conf/agent0.properties -Dflume.root.logger=INFO,console -Dorg.apache.flume.log.printconfig=true -Dorg.apache.flume.log.rawdata=true
	或
	flume-ng agent --conf conf --name a0 --conf-file conf/agent0.properties -Dflume.root.logger=INFO,console
3.[agent2.properties]
	a2.sources = r2
	a2.channels = c2
	a2.sinks = k2

	a2.sources.r2.type = exec
	#来源于监听文件weblogs.log文件
	a2.sources.r2.command = tail -F /home/fgq/codec/weblogs.log
	a2.sources.r2.channels = c2

	a2.channels.c2.type = memory
	a2.channels.c2.capacity = 1000
	a2.channels.c2.transactionCapacity = 100
	a2.channels.c2.keep-alive = 30

	a2.sinks.k2.type = avro
	a2.sinks.k2.channel = c2

	# 落地点是master机器的5555端口（主机名和端口号都必须与agent0.properties中开启的一致，否则会报错192.168.146.100：4545无法连接）
	a2.sinks.k2.hostname=192.168.146.100
	a2.sinks.k2.port=4545
4.再启动Avro的Sink
	flume-ng agent --conf conf --name a2 --conf-file conf/agent2.properties -Dflume.root.logger=INFO,console -Dorg.apache.flume.log.printconfig=true -Dorg.apache.flume.log.rawdata=true
	或
	flume-ng agent --conf conf --name a2 --conf-file conf/agent2.properties -Dflume.root.logger=INFO,console

*注意一定要先开启监听端口，后开启Avro的sink

-----------------------------------------【hbase】---------------------------------------------------------------
###在hbase shell中使用list命令报错：ERROR: Can’t get master address from ZooKeeper; znode data == null原因及解决方法

原因：运行hbase(zookeeper)的用户无法写入zookeeper文件，导致znode data为空。
解决方法：
方法一：重启hbase（可能是zookeeper或hbase不稳定造成的 重启不一定起作用）
方法二：在hbase-site.xml指定一个运行hbase的用户有写入文件权限的目录作为zookeeper数据目录，如
  
	hbase.zookeeper.property.dataDir
	/opt/zk_data
  
方法三：格式化NameNode
（1）删除所有虚拟机上hadoop配置文件core-site.xml文件中指定的hadoop的临时目录

（2）在slave1 slave2 slave3上启动journalnode  在两个NameNode（master或slave3）中选择一个（如master）执行hdfs格式化命令：

	hadoop namenode -format

（3）把master上的fsimage文件拷贝到slave3上：scp -r /opt/hadoop-2.5.1 root@slave3:/opt

（4）在两个NameNode（master slave3）中选择一个（如master）进行zookeeper格式化: hdfs zkfc -formatZK

（5） 启动zookeeper

（6）启动hdfs

（7）启动hbase

（8）进入hbase shell 命令行界面

（9）输入list命令 就可以正常显示了

###s101: WARNING: /home/fgq/soft/hadoop-3.2.0/logs does not exist. Creating.
s102: /home/fgq/soft/hadoop/etc/hadoop/hadoop-env.sh: line 140: hbase: command not found
s102: WARNING: /home/fgq/soft/hadoop-3.2.0/logs does not exist. Creating.
Starting secondary namenodes [s103]
s103: /home/fgq/soft/hadoop/etc/hadoop/hadoop-env.sh: line 140: hbase: command not found

原因是 hbase的jar包没有正确导入到hadoop的classpath目录下面
参看 笔记hbase-day5的 hbase mr编程

hbase shell ERROR: Connection refused

确认一下是否启动了Hbase服务 start-hbase.sh

###阶段一操作

flume-ng agent --conf conf --name a0 --conf-file conf/agent0.properties -Dflume.root.logger=INFO,console
flume-ng agent --conf conf --name a2 --conf-file conf/agent2.properties -Dflume.root.logger=INFO,console
java -cp weblog.jar com.lhcc.weblog.ReadWebLog /home/fgq/codec/SogouQ.log /home/fgq/codec/weblogs.log

###阶段二操作

flume-ng agent --conf conf --name a1 --conf-file conf/agent1.properties -Dflume.root.logger=INFO,console
flume-ng agent --conf conf --name a2 --conf-file conf/agent2.properties -Dflume.root.logger=INFO,console
kafka-console-consumer.sh --zookeeper s101:2181,s102:2181,s103:2181 --topic weblogs  --from-beginning
java -cp weblog.jar com.lhcc.weblog.ReadWebLog /home/fgq/codec/SogouQ.log /home/fgq/codec/weblogs.log

###阶段三操作

kafka-create-topic.sh --zookeeper s101:2181,s102:2181,s103:2181 --replica 3 --partition 2 --topic weblogs

访问时间\t用户ID\t[查询词]\t该URL在返回结果中的排名\t用户点击的顺序号\t用户点击的URL
 datatime,userid,searchname,retorder,cliorder,cliurl
 column=info:datatime,userid,searchname,retorder,cliorder,cliurl, timestamp=1574927730292, 
               value=00:01:06\x0967069526
               65130084\x09[\xE7\x81\xAB\xE7\xAE\xAD\xE4\xBD\x95\xE6\x97\
                  xB6vs\xE6\xB9\x96\xE4\xBA\xBA\xE5\x95\x8A]\x094 6\x09wenwe
                  n.soso.com/z/q52390704.htm    
 kafka-server-start.sh config/s1.properties 
 kafka-server-start.sh config/s2.properties 
 kafka-server-start.sh config/s3.properties

[2019-11-28 01:06:06,607] ERROR Closing socket for /192.168.146.100 because of error (kafka.network.Processor)

kafka.common.KafkaException: Wrong request type 18
at kafka.api.RequestKeys $. d e s e r i a l i z e r F o r K e y (R e q u e s t K e y s . s c a l a : 53) a t k a f k a . n e t w o r k . R e q u e s t C h a n n e l$ Request.(RequestChannel.scala:49)
at kafka.network.Processor.read(SocketServer.scala:353)
at kafka.network.Processor.run(SocketServer.scala:245)
at java.lang.Thread.run(Thread.java:745)
INFO conflict in /controller data: { “brokerid”:1, “timestamp”:“1574932456824”, “version”:1 } stored data: { “brokerid”:1, “timestamp”:“1574932455346”, “version”:1 } (kafka.utils.ZkUtils $2019-11-28 01:20:49,220] INFO I wrote this conflicted ephemeral node [{ "brokerid":1, "timestamp":"1574932456824", "version":1 }] at /controller a while back in a different session, hence I will backoff for this node to be deleted by Zookeeper and retry (kafka.utils.ZkUtils$ )

###hbase数据如何查看(存入后是编码后的内容)

###[2019-11-28 00:44:18,726] ERROR Closing socket for /192.168.146.100 because of error (kafka.network.Processor)
kafka.common.KafkaException: Wrong request type 18

###查看内存使用情况

 free -m

###maven启动storm+hbase程序时（或spark） tried to access method com.google.common.base.Stopwatch.()V from class org.apache.hadoop.hbase.zookeeper.MetaTableLocator

解决方法  guava 冲突了，版本不一致，参考 http://www.luyixian.cn/news_show_4252.aspx，感谢这位作者
一般来说这样的问题是因为 pom 文件中有 google 的 guava 依赖吧？或者其他地方引用到了。 这个问题就是 guava 冲突了，版本不一致。所以大家优先去 pom 文件中排查。
有可能你会发现POM中并没有任何问题，那就去依赖包管理界面，比如idea的external Libraries查看以来的jar是否有guava，我的项目里面能看见有一个19版本的。这个貌似和spark不兼容，需要低版本到的guava，在pom里面添加一个15版本的，再次运行，发现没问题了。

    com.google.guava
    guava
    15.0

###Phoenix4.14.0-cdh5.14.2 Java api操作HBase
报错org.apache.hadoop.fs.FileSystem: Provider org.apache.hadoop.hdfs.DistributedFileSystem could not be instantiated

1.从集群拷贝以下文件：core-site.xml、hbase-site.xml、hdfs-site.xml文件放到工程src下
2.pom.xml配置内容
  
	UTF-8
  
  
  
	
	  cloudera
	  https://mvnrepository.com/artifact/org.apache.phoenix/phoenix-core/
	
  
  
	
	  org.apache.phoenix
	  phoenix-core
	  4.14.0-cdh5.14.2
	
  


注意* 使用maven时 版本如果不更新的话 可以使用一下两步解决
	1.更改版本 
	2.删掉本地repository中的相关包内容 再次更新下载

-----------------------------------------【hive】---------------------------------------------------------------
###hive_异常_01_ Terminal initialization failed; falling back to unsupported

jar版本包冲突
Hadoop lib 下已经存在了 jline 0.9x ，但是在hive中将Jline升级到了Jline2。
启动hive的时候，由于hive依赖hadoop，启动hive，会将hadoop的配置以及jar包等等导入到hive中，导致jar包版本冲突。
这个报错需要删除hadoop目录下，需要删除下面目录下的文件，重启hadoop和hive即可
$HADOOP_HOME/share/hadoop/yarn/lib/jline-0.9.94.jar
将Hive根目录下jline-2.12.jar替换到hadoop中
注意*hive-2.3.6 hadoop-3.2.0 实现上述步骤依然不行
换hive-1.2.2版本

###hive_2.x不在支持 hive–MR 要想用必须降到hive_1.x版本

###hive> show databases; FAILED: SemanticException org.apache.hadoop.hive.ql.metadata.HiveException: java.lang.RuntimeException: Unable to instantiate org.apache.hadoop.hive.ql.metadata.SessionHiveMetaStoreClient

这个应该是元数据的问题,hive的元数据存在mysql里面，所以如果你没有弄好mysql的权限,你的show databases是不可以用的。
解决办法：
1.首先检查你自己的hive-site.xml配置文件中的mysql账号和自己的创建hive_database的mysql账号是否一致。若不一致修改为创建了hive数据库的mysql账号。	
	
	  
		javax.jdo.option.ConnectionURL
		jdbc:mysql://192.168.1.195:3306/hadoop_hive?createDatabaseIfNotExist=true
	  
	  
	  
		javax.jdo.option.ConnectionDriverName
		com.mysql.jdbc.Driver
	  
	  
	  
		javax.jdo.option.ConnectionUserName
		root
	  
	  
	  
		javax.jdo.option.ConnectionPassword
		123456
	  
	  
	  
		datanucleus.schema.autoCreateAll
		true
	  
	
2.mysql的权限问题
	在mysql中：
	grant all privileges on *.* to 'root'@'%' identified by '123456' with grant option;
	grant all privileges on *.* to 'root'@'192.168.1.195' identified by '123456' with grant option;
	flush privileges; 刷新权限
3.hive的服务端没有打开	//做完前两步可以试试环境是否已经可以，可以后此步可以忽略
	1）hive --service metastore &
	2）然后Ctrl+C
	3）再hive,进去

-----------------------------------------【maven】---------------------------------------------------------------
###maven pom中的repository节点配置没有起作用

我的maven中的setting.xml配置文件里面关于mirror部分的配置如下：

	ibiblio
	*
	Human Readable Name for this Mirror.
	http://mirrors.ibiblio.org/pub/mirrors/maven2/

错误就出在mirrorOf节点了，如果写*会覆盖掉所有的，不管是哪个repository，
最后都被这个镜像所mirror掉了，导致pom文件中的repository不生效了。
解决方案也很简单，把这个mirrorOf改掉就好了。具体修改建议参考maven官方说明：
	maven的私服配置：http://my.oschina.net/liangbo/blog/195739
	深入比较几种maven仓库的优先级：http://toozhao.com/2012/07/13/compare-priority-of-maven-repository/
	http://maven.apache.org/guides/mini/guide-mirror-settings.html
	Maven最佳实践--Maven仓库：http://juvenshun.iteye.com/blog/359256
	Maven仓库管理之Nexus：http://my.oschina.net/aiguozhe/blog/101537
	
注意*myeclipse 也许反应比较慢 maven install 然后更新local Repository 然后update project
	或者重启myeclipse 醒目有错号没什么 只要编译成功了也可以运行

###Could not get the value for parameter encoding for plugin execution
default-resources Plugin org.apache.maven.plugins:maven-resources-plugin:2.5 or one of its dependencies
could not be resolved: Failed to collect dependencies for org.apache.maven.plugins:maven-resources-plugin:jar:2.5 ()

  01．　　先关闭eclipse

  02．　　找到maven的本地仓库路径、例如（C:\Users\YourUserName.m2）

  03．　　删除文件夹：repository

  04．　　重新打开eclipse

  05．　　clean 有问题的maven项目、点击Project → clean...

  06．　　右键有问题的maven项目、依次点击Maven → Update Project...

  07．　　关闭eclipse

  08．　　打开eclipse

  09．　　在Project Explorer中选中有问题的project

  10．　　按F5键刷新一会

  11．　　大功告成

###Unable to create project from archetype [org.scala-tools.archetypes:scala-archetype-simple:1.2 -> http://scala-tools.org/repo-releases]
The desired archetype does not exist (org.scala-tools.archetypes:scala-archetype-simple:1.2)

1.为了方便地创建Scala Maven项目，我们在Eclipse配置远程的Maven Archetype，ArcheType相当于项目模板。在Preference页面中选择Maven->Archetypes： 
2.点击 Add Remote Catelog，在弹出框的catlog file输入：http://repo1.maven.org/maven2/archetype-catalog.xml
3.OK，完成。
4.可以新建maven创建scala项目 选择的archetype为scala-archetype-simple

###Error:scalac: Error: Error compiling the sbt component ‘compiler-interface-2.11.2-55.0’
sbt.internal.inc.CompileFailed: Error compiling the sbt component ‘compiler-interface-2.11.2-55.0’
at sbt.internal.inc.AnalyzingCompiler$.handleCompilationError $1 (A n a l y z i n g C o m p i l e r . s c a l a : 331) a t s b t . i n t e r n a l . i n c . A n a l y z i n g C o m p i l e r$ . $a n o n f u n$ compileSources $4 (A n a l y z i n g C o m p i l e r . s c a l a : 346) a t s b t . i n t e r n a l . i n c . A n a l y z i n g C o m p i l e r$ . $a n o n f u n$ compileSources $4$ adapted(AnalyzingCompiler.scala:341)
at sbt.io.IO $. w i t h T e m p o r a r y D i r e c t o r y (I O . s c a l a : 376) a t s b t . i o . I O$ .withTemporaryDirectory(IO.scala:383)
at sbt.internal.inc.AnalyzingCompiler $.$ anonfun$compileSources $2 (A n a l y z i n g C o m p i l e r . s c a l a : 341) a t s b t . i n t e r n a l . i n c . A n a l y z i n g C o m p i l e r$ . $a n o n f u n$ compileSources $2$ adapted(AnalyzingCompiler.scala:335)
at sbt.io.IO $. w i t h T e m p o r a r y D i r e c t o r y (I O . s c a l a : 376) a t s b t . i o . I O$ .withTemporaryDirectory(IO.scala:383)
at sbt.internal.inc.AnalyzingCompiler $. c o m p i l e S o u r c e s (A n a l y z i n g C o m p i l e r . s c a l a : 335) a t o r g . j e t b r a i n s . j p s . i n c r e m e n t a l . s c a l a . l o c a l . C o m p i l e r F a c t o r y I m p l$ .getOrCompileInterfaceJar(CompilerFactoryImpl.scala:113)
at org.jetbrains.jps.incremental.scala.local.CompilerFactoryImpl. $a n o n f u n$ getScalac $1 (C o m p i l e r F a c t o r y I m p l . s c a l a : 49) a t s c a l a . O p t i o n . m a p (O p t i o n . s c a l a : 146) a t o r g . j e t b r a i n s . j p s . i n c r e m e n t a l . s c a l a . l o c a l . C o m p i l e r F a c t o r y I m p l . g e t S c a l a c (C o m p i l e r F a c t o r y I m p l . s c a l a : 47) a t o r g . j e t b r a i n s . j p s . i n c r e m e n t a l . s c a l a . l o c a l . C o m p i l e r F a c t o r y I m p l . c r e a t e C o m p i l e r (C o m p i l e r F a c t o r y I m p l . s c a l a : 25) a t o r g . j e t b r a i n s . j p s . i n c r e m e n t a l . s c a l a . l o c a l . C a c h i n g F a c t o r y .$ anonfun$createCompiler $3 (C a c h i n g F a c t o r y . s c a l a : 24) a t o r g . j e t b r a i n s . j p s . i n c r e m e n t a l . s c a l a . l o c a l . C a c h e .$ anonfun$getOrUpdate $2 (C a c h e . s c a l a : 20) a t s c a l a . O p t i o n . g e t O r E l s e (O p t i o n . s c a l a : 121) a t o r g . j e t b r a i n s . j p s . i n c r e m e n t a l . s c a l a . l o c a l . C a c h e . g e t O r U p d a t e (C a c h e . s c a l a : 19) a t o r g . j e t b r a i n s . j p s . i n c r e m e n t a l . s c a l a . l o c a l . C a c h i n g F a c t o r y . c r e a t e C o m p i l e r (C a c h i n g F a c t o r y . s c a l a : 24) a t o r g . j e t b r a i n s . j p s . i n c r e m e n t a l . s c a l a . l o c a l . L o c a l S e r v e r . c o m p i l e (L o c a l S e r v e r . s c a l a : 27) a t o r g . j e t b r a i n s . j p s . i n c r e m e n t a l . s c a l a . r e m o t e . M a i n$ .make(Main.scala:88)
at org.jetbrains.jps.incremental.scala.remote.Main$.nailMain(Main.scala:36)
at org.jetbrains.jps.incremental.scala.remote.Main.nailMain(Main.scala)
at java.base/jdk.internal.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
at java.base/jdk.internal.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:62)
at java.base/jdk.internal.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
at java.base/java.lang.reflect.Method.invoke(Method.java:566)
at com.martiansoftware.nailgun.NGSession.run(NGSession.java:319)

(scala1_2.11.2时)可能是Java  jdk的版本过低(或过高)，更改Java jdk的版本(1.8)
Project structure->修改jdk版本

###idea 运行Hadoop或spark程序时报有关winutils的错误

使用idea在windows上连接远程hadoop开发
一.前置环境准备

1.下载一份hadoop本地解压，配置HADOOP_HOME的环境变量   

idea运行时会读这个环境变量然后找到他里面的bin文件，其实不需要启动 只要有bin这个目录就行,不然会报错 找不到HADOOP_HOME这个环境变量

2.bin里面缺少了winutils.exe和hadoop.dll 需要额外下载

https://github.com/steveloughran/winutils 下载后把bin替换hadoop的bin即可

也可以不下载hadoop直接下载这个bin把环境变量配置成这个bin的上一级目录

3.将hadoop.dll 复制到C:\Windows\System32中 否则 会报 Exception in thread "main"java.lang.UnsatisfiedLinkError:org.apache.hadoop.io.nativeio.NativeIO$Windows.access0(Ljava/lang/String;I)Z

-----------------------------------------【storm】---------------------------------------------------------------
###如何在ui上查看storm集群和任务

主页面上，
cluster summary：集群的概况
nimbus summary：
Supervisor Summary：
Nimbus Configuration
Topology Summary：最重要的有个search窗口，根据storm任务的topology name，搜索到对应任务，点击进入一个storm集群上跑的任务的topology name 是唯一的，否则提交会出错
点击到一个具体topology页面之后，
	Topology summary：概况
		Topology actions：对topology可以在页面进行操作
		Topology stats：最近不同时间段的统计数据
		spouts：所有的不同的spout，每个spout对应总共有多少executor，总共有多少个task，每个executor运行的task数量等于两者相除 想查看具体某个spout或者bolt (都属于component)的运行情况，只需要点击对应id上的链接        
		Component summary：        
		Component actions：对这个component进行操作        
		Spout stats：不同时间窗口的统计结果        
		Output stats：总的输出的统计        
		Executors：具体的执行线程，这个很重要 点击具体某个executor的port连接，可以查看日志 这个上面打出来的日志，是包含整个worker进程所有executor线程的日志
		bolts：同上
		Worker Resources：具体的worker进程
		Topology Visualization：可视化
		Topology Configuration：整个topology的配置

-----------------------------------------【flink】---------------------------------------------------------------
###命令生成的flink项目 cmd下

mvn archetype:generate -DarchetypeGroupId=org.apache.flink -DarchetypeArtifactId=flink-quickstart-scala -DarchetypeVersion=1.9.0

###flink编译报错：could not find implicit value for evidence parameter of type org.apache.flink.api.common…

这种异常的发生通常是因为程序需要一个隐式参数(implicit parameter)，解决方法
	import org.apache.flink.api.scala.ExecutionEnvironment  改为=》import org.apache.flink.api.scala._

###java.lang.ClassNotFoundException: org.apache.flink.api.common.typeinfo.TypeInformation

类没有找到，勾选maven面板中的profiles选项

###Cannot resolve method ‘socketTextStream’ in ‘ExecutionEnvironment’

1.因为没有区分环境(java,scala),不同环境导入的jar包不同
2.没有区分流处理(StreamExecutionEnvironment)和批处理(ExecutionEnvironment)环境

###Unhandled exception: java.lang.Exception

对承载的错误地方进行 try cache 或者承载的方法直接抛出异常(throws Exception)

原理分析

代码分析运行

-----------------------------------------【zookeeper】---------------------------------------------------------------
###zookeeper的日志路径

默认在zookeeper安装路径bin文件夹里，文件名是zookeeper.out。可以通过修改bin/zkEnv.sh文件来指定日志路径。
默认设置
if ["x${ZOO_LOG_DIR}"="x"]
then
ZOO_LOG_DIR="."
fi
修改成
if ["x${ZOO_LOG_DIR}"="x"]
then
ZOO_LOG_DIR="$ZOOBINDIR/../logs"
fi

最后日志文件就生成到安装目录的logs文件夹根目录下

mapreduce

切片数 map数 reduce数 三者之间关系

你可能感兴趣的:(BigData,大数据)

Python爬虫基础知识：从零开始的抓取艺术 egzosn python 爬虫开发语言
在大数据时代，网络数据成为宝贵的资源，而Python爬虫则是获取这些数据的重要工具。本文旨在为初学者提供一份Python爬虫的入门指南，涵盖基础知识、常用库介绍、实战案例以及注意事项，帮助你快速上手，成为一名合格的“网络矿工”。一、Python爬虫概述1.1什么是爬虫？爬虫，也称为网络爬虫或蜘蛛，是一种自动抓取互联网信息的程序。它通过模拟人类浏览网页的行为，自动地遍历和抓取网络上的数据，常用于数据
探索Oracle数据库的多租户特性：架构、优势与实践 2401_85812026 数据库 oracle 架构
在云计算和大数据时代，多租户架构成为数据库设计中的一个重要趋势。Oracle数据库的多租户选项（Multitenant）允许单个数据库实例支持多个独立数据库（称为容器数据库和可插拔数据库），每个数据库都有自己的数据、配置和资源。这种设计提高了资源利用率、简化了数据库管理，并增强了安全性。本文将深入探讨Oracle多租户选项的架构、优势以及如何在实际环境中部署和使用。1.多租户选项概述Oracle多
「大数据」Kappa架构吴维炜 AIGC架构设计师大数据架构 kappa AIGC
Kappa架构是一种处理大数据的架构，它作为Lambda架构的替代方案出现。Kappa架构的核心思想是简化数据处理流程，通过使用单一的流处理层来同时处理实时和批量数据，从而避免了Lambda架构中需要维护两套系统（批处理层和速度层）的复杂性。核心功能：单一处理层：Kappa架构使用单一的流处理层来处理所有数据，无论是实时数据还是批量数据。数据重放：通过重放历史数据，Kappa架构能够重新计算出与批
新零售社交电商系统小程序功能开发详细解析 v.15889726201 零售小程序
现在的购物方式是越来越有趣了，新零售社交电商系统是互联网、大数据、人工智能的技术和咱们熟悉的传统零售深度结合后产生的。它整合线上线下渠道及数据，带来全方位、多渠道、个性化购物体验。借助实时库存管理、智能推荐和无缝购物体验等功能，打破传统电商与实体店界限，其具备以下显著特点：一、系统主要功能分销管理独家推广代码机制：在这个新零售社交电商系统里，每个经销商都有一个只属于自己的推广代码。把这个代码分享给
Spark性能调优大数据侠客 spark相关问题汇总及解决 spark 性能调优
1、前言在大数据计算领域，Spark已经成为了越来越流行、越来越受欢迎的计算平台之一。Spark的功能涵盖了大数据领域的离线批处理、SQL类处理、流式/实时计算、机器学习、图计算等各种不同类型的计算操作，应用范围与前景非常广泛。在美团•大众点评，已经有很多同学在各种项目中尝试使用Spark。大多数同学（包括笔者在内），最初开始尝试使用Spark的原因很简单，主要就是为了让大数据计算作业的执行速度更
Python学习-九大数据类型整合，详细讲解小伙儿. Python python 开发语言学习
目录1.int(整型)2.float(浮点型)3.Bool(布尔类型)4.Str(字符串类型)5.None(空值)6.List(列表)7.Tuple(元组)8.Dict(字典)9.Set(集合)（字典，列表，元组，字符串知识点可能不全，可以参考本人之前发的博客进行学习，加油。）1.int(整型)特点和用途：1.可以表示正整数、负整数和零，没有小数部分。2.取值范围取决于您所使用的Python版本和
[碎碎念] 重启学习与博客之旅-我的每日计划言午coding 碎碎念碎碎念
好久没在写博客了，今天我下定决心，要重新开始。我给自己定了个小目标，从今天起，每天都要写一篇博客，然后发布到CSDN和掘金上。以下是我的计划。一、每天学点新东西以后每天早上，我都得抽出至少一个小时专门用来学新技术。我打算先列个学习清单，把一直想学但没时间学的技术都写上去，然后按照自己的兴趣和工作需要，一项一项地去攻克。比如说，我最近对人工智能和大数据分析特别感兴趣，所以打算每天看点相关的专业书，或
Java 性能优化与新特性来恩1003 Java 从入门到精通 java
Java学习资料Java学习资料Java学习资料一、引言Java作为一门广泛应用于企业级开发、移动应用、大数据等多个领域的编程语言，其性能和特性一直是开发者关注的重点。随着软件系统的规模和复杂度不断增加，对Java程序性能的要求也越来越高。同时，Java语言也在不断发展，每个版本都引入了许多新特性，这些新特性不仅提高了开发效率，还改善了代码的可读性和可维护性。本文将分别介绍Java性能优化的方法和
pandas读取大数据量的Excel文件兮知 python基础数据分析 pandas excel 数据分析
使用pandas快速读取百万行Excel数据的一种方法是使用pandas中的read_excel函数。可以使用以下代码读取Excel文件：importpandasaspddf=pd.read_excel('file_name')这个适合少量数据，如果一旦数据几十万或者上百万，那么程序就很慢有几种优化方法只读取需要的列：使用read_excel函数的usecols参数来指定需要读取的列。这可以减少读
林子雨《大数据技术原理与应用》第五讲——NoSQL数据库天才代号23 大数据数据库 hadoop nosql 大数据
林子雨《大数据技术原理与应用》第五讲——NoSQL数据库林子雨《大数据技术原理与应用》第五讲笔记NoSQL数据库特点灵活的可扩展性灵活的数据模型和云计算结合查询性能差未形成通用的行业标准维护更加复杂NoSQL数据库有四大类型键值数据库：redis列族数据库：HBase、Cassandra文档数据库：MongoDB图数据库：Neo4j键值数据库数据模型：键是一个字符串对象，值可以是任意类型的对象典型
OLAP引擎比较小手追梦 hadoop rpc java
一，sparksql与dorisspark虽然是一个计算引擎，但sparksql也支持符合通用语法的sql查询，延迟为分钟级。doris是一个OLAP数据库，支持对大数据的复杂查询，延迟为秒级。doris比sparksql快，主要原因在于针对场景不同导致的架构不同。sparksql启动一个查询，需要进行资源调度、任务调度、任务分发，耗时更久。doris是常驻进程，启动一个doris查询后，快速的对
大数据组件ClickHouse介绍（场景、优劣势、性能）坚持是一种态度大数据开发 ClickHouse 大数据 clickhouse 数据库列式数据库
大数据组件ClickHouse介绍简介使用场景优势与劣势优势劣势性能单个查询吞吐量处理短查询的延时时间处理大量短查询数据写入性能查询性能简介clickhouse是一个高性能的列式存储分析数据库管理系统，由俄罗斯搜索引擎公司yandex开发。clickhouse具有以下特点高性能：clickhouse优化了查询和数据压缩算法，支持多维度数据分析和快速聚合查询。分布式：clickhouse采用共享无状
DB2-Db2StreamingChangeEventSource DataLu DB2-debezium 数据库数据库开发大数据开源
提示：Db2StreamingChangeEventSource类主要用于从IBMDb2数据库中读取变更数据捕获(CDC,ChangeDataCapture)信息。CDC是一种技术，允许系统跟踪数据库表中数据的更改，这些更改可以是插入、更新或删除操作。在大数据和实时数据处理场景中，CDC可以用来同步数据到其他系统，比如数据仓库、数据湖或者流处理平台如ApacheKafka。文章目录前言一、核心功能
MySQL实战教程：从小白到大神的进阶之路！奔跑吧邓邓子项目实战 mysql 数据库
目录一、MySQL概述1、MySQL简介1.1MySQL的历史背景1.2MySQL的特点1.3MySQL的应用场景1.4MySQL的版本2、MySQL发展历程2.1MySQL的起源2.2MySQL的早期发展2.3MySQL的成熟与普及2.4MySQL的商业化与收购2.5MySQL的持续创新3、MySQL应用场景3.1Web应用程序3.2企业级应用3.3大数据分析3.4移动应用3.5云计算3.6物联
【详细讲解】hive优化 songqq27 大数据 hive
1、开启本地模式大多数的HadoopJob是需要Hadoop提供的完整的可扩展性来处理大数据集的。不过，有时Hive的输入数据量是非常小的。在这种情况下，为查询触发执行任务消耗的时间可能会比实际job的执行时间要多的多。对于大多数这种情况，Hive可以通过本地模式在单台机器上处理所有的任务。对于小数据集，执行时间可以明显被缩短。用户可以通过设置hive.exec.mode.local.auto的值
大规模分布式存储（1）-- 概念、挑战和分类叹了口丶气 HDFS全方位实战分布式分类数据库
随着数据的激增，我们已经进入到了一个数据时代，无论是云计算，大数据还是互联网公司的各种应用，其后台存储平台的目标都是要构建低成本、高性能、可扩展、易用的分布式存储系统。相比传统的分布式存储系统，互联网公司的分布式存储系统具有两个特点：规模大和成本低。本文主要介绍一下什么是大规模分布式存储系统，以及分布式存储系统有哪些类别。一、分布式存储的概念1.1大规模分布式存储系统的定义大规模分布式存储系统的定
大数据分析案例-基于逻辑回归算法构建抑郁非抑郁推文识别模型艾派森大数据分析案例合集机器学习人工智能 python 数据挖掘回归
‍♂️个人主页：@艾派森的个人主页✍作者简介：Python学习者希望大家多多支持，我们一起进步！如果文章对你有帮助的话，欢迎评论点赞收藏加关注+喜欢大数据分析项目的小伙伴，希望可以多多支持该系列的其他文章大数据分析案例合集
move移动语义详解 Say-hai C++c++面试
move移动语义移动语义是C++11引入的一种机制，用于提高程序的性能和资源管理效率，特别是在涉及大数据对象的场景下。移动语义通过转移资源所有权，而不是复制资源，减少了不必要的拷贝操作。一、为什么需要移动语义？当对象需要被复制时（如函数返回值或传参），通常会调用复制构造函数（copyconstructor）。复制操作往往意味着需要分配新资源并将原资源的数据拷贝到新资源中；而如果不需要保留原对象的内
大数据毕业设计hadoop+spark+hive豆瓣图书数据分析可视化大屏豆瓣图书爬虫图书推荐系统 qq_79856539 javaweb java 大数据 hadoop 课程设计
系统总体目标基于Spark的个性化书籍推荐系统是一种基于大数据技术的智能推荐系统，它可以根据用户的历史行为和偏好，为用户提供个性化的书籍推荐。该系统采用Spark技术，可以实现大数据的实时处理，从而提高推荐系统的准确性和可靠性。此外，该系统还可以根据用户的习惯和偏好，提供更加个性化的书籍推荐，从而满足用户的需求。系统的使用者包含普通用户和管理员两类，普通用户是系统的主要服务对象，主流人群是经常查看
企业数字化规划蓝图、企业数字化运营分析管理大数据平台建设方案公众号：优享智库数字化转型数据治理主数据数据仓库大数据
**企业数字化规划蓝图及运营分析管理大数据平台建设方案****一、企业数字化规划蓝图**1.**数字化目标设定**企业在规划数字化进程时，首先需要明确数字化目标。这些目标应当与企业的整体战略和发展规划相一致，包括但不限于提高运营效率、优化客户体验、创新业务模式等。同时，目标应具体、可衡量，以便于后续的实施和评估。2.**技术平台规划**技术平台是支撑企业数字化的基础。在规划阶段，需要确定所需的技术
使用Flink进行流式图处理 AI天才研究院大数据AI人工智能 AI大模型企业级应用开发实战计算计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
使用Flink进行流式图处理1.背景介绍1.1大数据时代的到来随着互联网、物联网和移动互联网的快速发展,数据呈现出爆炸式增长。根据IDC的预测,到2025年,全球数据量将达到175ZB。传统的批处理系统已经无法满足对实时数据处理的需求。因此,流式计算应运而生,成为大数据处理的重要组成部分。1.2流式计算的概念流式计算是一种新兴的数据处理范式,它能够持续不断地处理来自各种数据源的数据流。与传统的批处
python与excel整合全教程刘同学Python学习日记 python excel 开发语言
Python与Excel的整合非常强大，尤其适合处理大数据、自动化表格操作以及进行高级数据分析。以下是一个全教程，涵盖常用的Python库及其应用：1.准备工作安装必要的库：使用以下命令安装常用库：pipinstallopenpyxlpandasxlrdxlsxwriterpywin32openpyxl:用于操作Excel的.xlsx文件（推荐）。pandas:强大的数据分析工具，支持读取和写入E
如何写一份合格的大数据简历（附简历模板）教程 itLeeyw573 老板必点的高分简历 sqlite oracle mysql sql zookeeper kafka big data
一、简历的重要性简历是求职者给招聘者的第一印象，一份合格的简历能够快速让招聘者了解你的基本信息、工作经历、技能特长等，从而决定是否给予你面试机会。它是开启理想工作大门的钥匙，所以一定要重视起来。【编辑/下载】：大数据开发简历范文二、简历结构基本信息：包含姓名、性别、联系方式（电话、邮箱）、求职意向。姓名要突出显示，联系方式务必准确无误，求职意向明确且具体，比如“Java开发工程师”，让招聘者一眼就
MongoDB 大俗大雅，上来问分片真三俗 -- 4 分什么分 Austindatabases mongodb 数据库
开头还是介绍一下群，如果感兴趣PolarDB,MongoDB,MySQL,PostgreSQL,Redis,OceanBase,SqlServer等有问题，有需求都可以加群群内有各大数据库行业大咖，可以解决你的问题。加群请联系liuaustin3，（共2710人左右1+2+3+4+5+6+7+8+9）(123456群均已爆满，7群400+，开8群9群)这是MongoDB宣传周的第五篇，这周真漫长，
大数据技术在数据安全治理中的应用罗思付之技术屋综合技术探讨及方案专栏大数据
摘要面对新形势下的数据安全治理挑战，顺应数据安全领域的技术发展趋势，针对大型国企在数据安全治理实际应用中突出的关键权限人员识别问题，提出了一种基于图算法的关键权限人员识别技术。该技术可以发现系统中潜在的权限影响因素，并可从多个角度衡量不同含义的权重影响力，识别结果可解释性强。针对数据安全治理中的用户与实体行为异常检测问题，提出一种基于生成对抗网络的用户与实体行为异常检测方法，实验结果表明，所提方法
阿里巴巴大数据系统体系架构大连赵哥大数据架构
数据应用层：这是最顶层，面向不同的用户群体提供服务，包括对内（公司内部使用）、对平台（平台用户）、对商家（商家使用）、对公众（普通消费者）。数据服务与基础工具层：这一层提供了一些基础服务和工具，例如：OneService：可能是一种服务或工具，用于统一数据服务。TDDL+MySQL：TDDL是淘宝分布式数据层的缩写，与MySQL结合使用，提供数据库服务。HBase：一个分布式列存储系统，适合于存储
python 分布式集群_Python搭建Spark分布式集群环境小国阁下 python 分布式集群
前言ApacheSpark是一个新兴的大数据处理通用引擎，提供了分布式的内存抽象。Spark最大的特点就是快，可比HadoopMapReduce的处理速度快100倍。本文没有使用一台电脑上构建多个虚拟机的方法来模拟集群，而是使用三台电脑来搭建一个小型分布式集群环境安装。本教程采用Spark2.0以上版本(比如Spark2.0.2、Spark2.1.0等)搭建集群，同样适用于搭建Spark1.6.2
【硬刚大数据】2021年从零到大数据专家之Hbase八股文王知无(import_bigdata)
欢迎关注博客主页：https://blog.csdn.net/u013411339欢迎点赞、收藏、留言，欢迎留言交流！本文由【王知无】原创，首发于CSDN博客！本文首发CSDN论坛，未经过官方和本人允许，严禁转载！本文是对《【硬刚大数据之学习路线篇】2021年从零到大数据专家的学习指南(全面升级版)》的面试部分补充。硬刚大数据系列文章链接：2021年从零到大数据专家的学习指南(全面升级版)
史上最强！Spring Boot 3.3 高效批量插入万级数据的多种方案 m0_74825074 面试学习路线阿里巴巴 spring boot 后端 java
SpringBoot3.3多种方式实现高效批量插入万级数据，史上最强！在大数据处理场景下，如何高效地将大量数据插入数据库是一个重要课题。本文基于SpringBoot3.3及MyBatis-Plus，介绍几种高效的批量插入数据的方法，包括：使用JDBC批处理使用自定义SQL批处理单条插入（for循环）拼接SQL语句插入MyBatis-Plus的saveBatch方法循环插入+开启批处理模式每种方式都
多租户架构未提供足够的租户安全培训和教育图幻未来网络安全
多租户架构下租户安全培训与教育的需求分析与解决方案引言随着云计算和大数据技术的飞速发展，多租户架构已成为企业数字化转型的重要基石。多租户架构允许一个应用程序实例为多个租户提供服务，从而降低了企业的运营成本。然而，这种架构也带来了一系列的安全挑战。为了解决这些问题，企业需要加强对租户的安全培训和教育，确保租户了解如何在使用多租户架构时保护自己的数据和应用程序。本文将探讨多租户架构下的租户安全培训和教
springmvc 下 freemarker页面枚举的遍历输出杨白白 enum freemarker
spring mvc freemarker 中遍历枚举 1枚举类型有一个本地方法叫values（），这个方法可以直接返回枚举数组。所以可以利用这个遍历。 enum public enum BooleanEnum { TRUE(Boolean.TRUE, "是"), FALSE(Boolean.FALSE, "否");
实习简要总结 byalias 工作
来白虹不知不觉中已经一个多月了，因为项目还在需求分析及项目架构阶段，自己在这段时间都是在学习相关技术知识，现在对这段时间的工作及学习情况做一个总结：（1）工作技能方面大体分为两个阶段，Java Web 基础阶段和Java EE阶段 1）Java Web阶段在这个阶段，自己主要着重学习了 JSP, Servlet, JDBC, MySQL，这些知识的核心点都过了一遍，也
Quartz——DateIntervalTrigger触发器 eksliang quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208559 一.概述 simpleTrigger 内部实现机制是通过计算间隔时间来计算下次的执行时间，这就导致他有不适合调度的定时任务。例如我们想每天的 1：00AM 执行任务，如果使用 SimpleTrigger，间隔时间就是一天。注意这里就会有一个问题，即当有 misfired 的任务并且恢复执行时，该执行时间
Unix快捷键 18289753290 unix Unix；快捷键;
复制，删除，粘贴： dd:删除光标所在的行 &nbs
获取Android设备屏幕的相关参数酷的飞上天空 android
包含屏幕的分辨率以及屏幕宽度的最大dp 高度最大dp TextView text = (TextView)findViewById(R.id.text); DisplayMetrics dm = new DisplayMetrics(); text.append("getResources().ge
要做物联网？先保护好你的数据蓝儿唯美数据
根据Beecham Research的说法，那些在行业中希望利用物联网的关键领域需要提供更好的安全性。在Beecham的物联网安全威胁图谱上，展示了那些可能产生内外部攻击并且需要通过快速发展的物联网行业加以解决的关键领域。 Beecham Research的技术主管Jon Howes说：“之所以我们目前还没有看到与物联网相关的严重安全事件，是因为目前还没有在大型客户和企业应用中进行部署，也就
Java取模（求余）运算随便小屋 java
整数之间的取模求余运算很好求，但几乎没有遇到过对负数进行取模求余，直接看下面代码： /** * * @author Logic * */ public class Test { public static void main(String[] args) { // TODO A
SQL注入介绍 aijuans sql注入
二、SQL注入范例这里我们根据用户登录页面 <form action="" > 用户名：<input type="text" name="username"><br/> 密码：<input type="password" name="passwor
优雅代码风格 aoyouzi 代码
总结了几点关于优雅代码风格的描述：代码简单：不隐藏设计者的意图，抽象干净利落，控制语句直截了当。接口清晰：类型接口表现力直白，字面表达含义，API 相互呼应以增强可测试性。依赖项少：依赖关系越少越好，依赖少证明内聚程度高，低耦合利于自动测试，便于重构。没有重复：重复代码意味着某些概念或想法没有在代码中良好的体现，及时重构消除重复。战术分层：代码分层清晰，隔离明确，
布尔数组百合不是茶 java 布尔数组
androi中提到了布尔数组; 布尔数组默认的是false, 并且只会打印false或者是true 布尔数组的例子; 根据字符数组创建布尔数组 char[] c = {'p','u','b','l','i','c'}; //根据字符数组的长度创建布尔数组的个数 boolean[] b = new bool
web.xml之welcome-file-list、error-page bijian1013 java web.xml servlet error-page
welcome-file-list 1.定义： <welcome-file-list> <welcome-file>login.jsp</welcome> </welcome-file-list> 2.作用：用来指定WEB应用首页名称。 error-page1.定义： <error-page&g
richfaces 4 fileUpload组件删除上传的文件 sunjing clear Richfaces 4 fileupload
页面代码 <h:form id="fileForm"> <rich:
技术文章备忘 bit1129 技术文章
Zookeeper http://wenku.baidu.com/view/bab171ffaef8941ea76e05b8.html http://wenku.baidu.com/link?url=8thAIwFTnPh2KL2b0p1V7XSgmF9ZEFgw4V_MkIpA9j8BX2rDQMPgK5l3wcs9oBTxeekOnm5P3BK8c6K2DWynq9nfUCkRlTt9uV
org.hibernate.hql.ast.QuerySyntaxException: unexpected token: on near line 1解决方案白糖_ Hibernate
文章摘自：http://blog.csdn.net/yangwawa19870921/article/details/7553181 在编写HQL时，可能会出现这种代码： select a.name,b.age from TableA a left join TableB b on a.id=b.id 如果这是HQL，那么这段代码就是错误的，因为HQL不支持
sqlserver按照字段内容进行排序 bozch 按照内容排序
在做项目的时候，遇到了这样的一个需求：从数据库中取出的数据集，首先要将某个数据或者多个数据按照地段内容放到前面显示，例如:从学生表中取出姓李的放到数据集的前面； select * fro
编程珠玑-第一章-位图排序 bylijinnan java 编程珠玑
import java.io.BufferedWriter; import java.io.File; import java.io.FileWriter; import java.io.IOException; import java.io.Writer; import java.util.Random; public class BitMapSearch {
Java关于==和equals chenbowen00 java
关于==和equals概念其实很简单，一个是比较内存地址是否相同，一个比较的是值内容是否相同。虽然理解上不难，但是有时存在一些理解误区，如下情况： 1、 String a = "aaa"; a=="aaa"; ==> true 2、 new String("aaa")==new String("aaa
[IT与资本]软件行业需对外界投资热情保持警惕 comsci it
我还是那个看法,软件行业需要增强内生动力,尽量依靠自有资金和营业收入来进行经营,避免在资本市场上经受各种不同类型的风险,为企业自主研发核心技术和产品提供稳定,温和的外部环境... 如果我们在自己尚未掌握核心技术之前,企图依靠上市来筹集资金,然后使劲往某个领域砸钱,然
oracle 数据块结构 daizj oracle 块数据块块结构行目录
oracle 数据块是数据库存储的最小单位，一般为操作系统块的N倍。其结构为：块头－－〉空行－－〉数据，其实际为纵行结构。块的标准大小由初始化参数DB_BLOCK_SIZE指定。具有标准大小的块称为标准块（Standard Block）。块的大小和标准块的大小不同的块叫非标准块（Nonstandard Block）。同一数据库中，Oracle9i及以上版本支持同一数据库中同时使用标
github上一些觉得对自己工作有用的项目收集 dengkane github
github上一些觉得对自己工作有用的项目收集技能类 markdown语法中文说明回到顶部全文检索 elasticsearch bigdesk elasticsearch管理插件回到顶部 nosql mapdb 支持亿级别map, list, 支持事务. 可考虑做为缓存使用 C
初二上学期难记单词二 dcj3sjt126com english word
dangerous 危险的 panda 熊猫 lion 狮子 elephant 象 monkey 猴子 tiger 老虎 deer 鹿 snake 蛇 rabbit 兔子 duck 鸭 horse 马 forest 森林 fall 跌倒；落下 climb 爬；攀登 finish 完成；结束 cinema 电影院；电影 seafood 海鲜；海产食品 bank 银行
8、mysql外键(FOREIGN KEY)的简单使用 dcj3sjt126com mysql
一、基本概念 1、MySQL中“键”和“索引”的定义相同，所以外键和主键一样也是索引的一种。不同的是MySQL会自动为所有表的主键进行索引，但是外键字段必须由用户进行明确的索引。用于外键关系的字段必须在所有的参照表中进行明确地索引，InnoDB不能自动地创建索引。 2、外键可以是一对一的，一个表的记录只能与另一个表的一条记录连接，或者是一对多的，一个表的记录与另一个表的多条记录连接。 3、如
java循环标签 Foreach shuizhaosi888 标签 java循环 foreach
1. 简单的for循环 public static void main(String[] args) { for (int i = 1, y = i + 10; i < 5 && y < 12; i++, y = i * 2) { System.err.println("i=" + i + " y="
Spring Security（05）——异常信息本地化 234390216 exception Spring Security 异常信息本地化
异常信息本地化 Spring Security支持将展现给终端用户看的异常信息本地化，这些信息包括认证失败、访问被拒绝等。而对于展现给开发者看的异常信息和日志信息（如配置错误）则是不能够进行本地化的，它们是以英文硬编码在Spring Security的代码中的。在Spring-Security-core-x
DUBBO架构服务端告警Failed to send message Response javamingtingzhao 架构 DUBBO
废话不多说，警告日志如下，不知道有哪位遇到过，此异常在服务端抛出(服务器启动第一次运行会有这个警告)，后续运行没问题，找了好久真心不知道哪里错了。 WARN 2015-07-18 22:31:15,272 com.alibaba.dubbo.remoting.transport.dispatcher.ChannelEventRunnable.run(84)
JS中Date对象中几个用法 leeqq JavaScript Date 最后一天
近来工作中遇到这样的两个需求 1. 给个Date对象，找出该时间所在月的第一天和最后一天 2. 给个Date对象，找出该时间所在周的第一天和最后一天需求1中的找月第一天很简单，我记得api中有setDate方法可以使用使用setDate方法前，先看看getDate var date = new Date(); console.log(date); // Sat J
MFC中使用ado技术操作数据库你不认识的休道人 sql mfc
1.在stdafx.h中导入ado动态链接库 #import"C:\Program Files\Common Files\System\ado\msado15.dll" no_namespace rename("EOF","end")2.在CTestApp文件的InitInstance()函数中domodal之前写::CoIniti
Android Studio加速 rensanning android studio
Android Studio慢、吃内存！启动时后会立即通过Gradle来sync & build工程。（1）设置Android Studio a) 禁用插件 File -> Settings... Plugins 去掉一些没有用的插件。比如：Git Integration、GitHub、Google Cloud Testing、Google Cloud
各数据库的批量Update操作 tomcat_oracle java oracle sql mysql sqlite
MyBatis的update元素的用法与insert元素基本相同，因此本篇不打算重复了。本篇仅记录批量update操作的 sql语句，懂得SQL语句，那么MyBatis部分的操作就简单了。　　注意：下列批量更新语句都是作为一个事务整体执行，要不全部成功，要不全部回滚。 MSSQL的SQL语句　WITH R AS（　　SELECT 'John' as name, 18 as
html禁止清除input文本输入缓存 xp9802 input
多数浏览器默认会缓存input的值，只有使用ctl+F5强制刷新的才可以清除缓存记录。如果不想让浏览器缓存input的值，有2种方法：方法一：在不想使用缓存的input中添加 autocomplete="off"; eg: <input type="text" autocomplete="off" name