wliufu

Hadoop MapReduce开发环境搭建

开发MR程序一般需要用到JDK，Eclipse，Hadoop集群，网上已经有不少的博文已经有这方面的记载，但是还是想把整个过程好好的整理和记录下来。

一.基于Windows 7 平台搭建hadoop集群及MR开发环境

需要安装的软件及版本：

OS:win 7

shell支持：cygwin

JDK:1.6.0_38

hadoop:0.20.2

eclipse:Juno Service Release 1

软件安装及环境变量设置：

1）cygwin 安装

可以到官网下载最新版安装 http://cygwin.com/setup.exe

安装过程需要安装openssh，openssl

2）cygwin配置

设置cygwin环境变量

把D:\cygwin\bin;D:\cygwin\usr\sbin;D:\cygwin\usr\i686-pc-cygwin\bin加到path变量中

3）无密码ssh配置

wuliufu@wuliufu-PC ~
$ ssh-host-config

*** Info: Generating /etc/ssh_host_key
*** Info: Generating /etc/ssh_host_rsa_key
*** Info: Generating /etc/ssh_host_dsa_key
*** Info: Generating /etc/ssh_host_ecdsa_key
*** Info: Creating default /etc/ssh_config file
*** Info: Creating default /etc/sshd_config file
*** Info: Privilege separation is set to yes by default since OpenSSH 3.3.
*** Info: However, this requires a non-privileged account called 'sshd'.
*** Info: For more info on privilege separation read /usr/share/doc/openssh/README.privsep.
*** Query: Should privilege separation be used? (yes/no) no
*** Info: Updating /etc/sshd_config file

*** Info: Sshd service is already installed.

*** Info: Host configuration finished. Have fun!

在控制面板里打开服务：

控制面板\所有控制面板项\管理工具\服务

应该能找到cygwin sshd服务，启动服务

注:win7下可能会出现无法启动sshd服务，提示服务启动后又停止什么的，可以按下面的设置进行设置

在cygwin sshd右键点属性->登录->此账户->浏览->高级->选中administrator，确定，然后返回此账户出填写密码

如果administrator没有启用，请控制面板\所有控制面板项\管理工具\本地安全策略->本地策略->安全选项

，右边选中账户:管理员账户状态，启用即可

然后重新启动sshd，如果还是无法启动，尝试重新执行ssh-host-config,执行如下的yes or no

wuliufu@wuliufu-PC ~
$ ssh-host-config

*** Query: Overwrite existing /etc/ssh_config file? (yes/no) yes
*** Info: Creating default /etc/ssh_config file
*** Query: Overwrite existing /etc/sshd_config file? (yes/no) yes
*** Info: Creating default /etc/sshd_config file
*** Info: Privilege separation is set to yes by default since OpenSSH 3.3.
*** Info: However, this requires a non-privileged account called 'sshd'.
*** Info: For more info on privilege separation read /usr/share/doc/openssh/READ                                                                                                                ME.privsep.
*** Query: Should privilege separation be used? (yes/no) yes
*** Info: Note that creating a new user requires that the current account have
*** Info: Administrator privileges.  Should this script attempt to create a
*** Query: new local account 'sshd'? (yes/no) yes
*** Info: Updating /etc/sshd_config file

*** Info: Sshd service is already installed.

*** Info: Host configuration finished. Have fun!

然后再次重新启动sshd，我的到这步就成功启动了，呵呵

配置无密码ssh登录

$ ssh-keygen -t rsa -P ""
Generating public/private rsa key pair.
Enter file in which to save the key (/home/wuliufu/.ssh/id_rsa):
Created directory '/home/wuliufu/.ssh'.
Your identification has been saved in /home/wuliufu/.ssh/id_rsa.
Your public key has been saved in /home/wuliufu/.ssh/id_rsa.pub.
The key fingerprint is:
1c:c7:f2:e1:11:76:0f:a8:66:44:f3:30:4b:98:08:86 wuliufu@wuliufu-PC
The key's randomart image is:
+--[ RSA 2048]----+
| .o. . +* o.o    |
|E.  . o..O.o o   |
|       .+.*   .  |
|       .+* o     |
|       oS o      |
|                 |
|                 |
|                 |
|                 |
+-----------------+

$ cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys

$ ssh localhost
The authenticity of host 'localhost (::1)' can't be established.
ECDSA key fingerprint is be:be:31:a7:83:28:66:82:f7:25:33:4c:98:79:4d:47.
Are you sure you want to continue connecting (yes/no)? yes

4）JDK和eclipse的安装和环境变量配置(略)

5）hadoop安装

下载：http://archive.apache.org/dist/hadoop/core/hadoop-0.20.2/hadoop-0.20.2.tar.gz

把压缩包放到D:\cygwin\home\wuliufu目录下

wuliufu@wuliufu-PC ~
$ tar -zxvf hadoop-0.20.2.tar.gz
$ ln -s ~/hadoop-0.20.2 ~/hadoop

6）hadoop配置

先简单设置一些核心属性如下，其他属性请参考开发文档

$ cd ~/hadoop/conf
vi hadoop-env.sh
#设置jdk和hadoop home，添加类似如下变量赋值
export JAVA_HOME="/cygdrive/d/Program Files/Java/jdk1.6.0_38"
export HADOOP_HOME=/home/wuliufu/hadoop
export PATH=$PATH:$HADOOP_HOME/bin:$JAVA_HOME/bin

vi core-site.xml

	     
    fs.default.name     
    hdfs://localhost:9000    
     
       
    hadoop.tmp.dir    
    /home/wuliufu/hadoop/hadoop-root    
  


vi hadf-site.xml

 	    
    dfs.namenode.name.dir    
    /home/wuliufu/hadoop/data/dfs/name   
    true   
      
     
    dfs.namenode.data.dir   
    /home/wuliufu/hadoop/data/dfs/data    
    true   
      
        
    dfs.replication   
    1    
     
     
    dfs.permission   
    false  
   


vi mapred-site.xml

	
		mapred.job.tracker
		localhost:9001

7）hadoop格式化及启动

1.格式化namenode

$ hadoop namenode -format
cygwin warning:
  MS-DOS style path detected: D:\cygwin\home\wuliufu\hadoop-0.20.2/build/native
  Preferred POSIX equivalent is: /home/wuliufu/hadoop-0.20.2/build/native
  CYGWIN environment variable option "nodosfilewarning" turns off this warning.
  Consult the user's guide for more details about POSIX paths:
    http://cygwin.com/cygwin-ug-net/using.html#using-pathnames
13/04/23 22:42:47 INFO namenode.NameNode: STARTUP_MSG:
/************************************************************
STARTUP_MSG: Starting NameNode
STARTUP_MSG:   host = wuliufu-PC/192.168.1.100
STARTUP_MSG:   args = [-format]
STARTUP_MSG:   version = 0.20.2
STARTUP_MSG:   build = https://svn.apache.org/repos/asf/hadoop/common/branches/branch-0.20 -r 911707; compiled by 'chrisdo' on Fri Feb 19 08:07:34 UTC 2010
************************************************************/
Re-format filesystem in \home\wuliufu\hadoop\hadoop-root\dfs\name ? (Y or N) y
Format aborted in \home\wuliufu\hadoop\hadoop-root\dfs\name
13/04/23 22:42:55 INFO namenode.NameNode: SHUTDOWN_MSG:
/************************************************************
SHUTDOWN_MSG: Shutting down NameNode at wuliufu-PC/192.168.1.100
************************************************************/

启动

$ cd hadoop/bin
$ ./start-all.sh
starting namenode, logging to /home/wuliufu/hadoop/logs/hadoop-wuliufu-namenode-wuliufu-PC.out
localhost: starting datanode, logging to /home/wuliufu/hadoop/logs/hadoop-wuliufu-datanode-wuliufu-PC.out
localhost: starting secondarynamenode, logging to /home/wuliufu/hadoop/logs/hadoop-wuliufu-secondarynamenode-wuliufu-PC.out
starting jobtracker, logging to /home/wuliufu/hadoop/logs/hadoop-wuliufu-jobtracker-wuliufu-PC.out
localhost: starting tasktracker, logging to /home/wuliufu/hadoop/logs/hadoop-wuliufu-tasktracker-wuliufu-PC.out

Eclipse 插件编译（试用于eclipse SDK 3.3+）：

在cygwin下执行编译，具体见：

http://wliufu.iteye.com/blog/1851164

另附件上传了我针对当前的eclipse编译好的插件

另对cdh3u4的编译可以参见：http://yzyzero.iteye.com/blog/1845396

Eclipse Hadoop MapReduce环境配置

1.把上个步骤编译好的插件hadoop- 0.20.2-eclipse-plugin.jar 拷贝到eclipse的plugins内，重启eclise

window->Preferences,点左侧的Hadoop Map/Reduce,在右侧配置hadoop安装位置，如：

D:\cygwin\home\wuliufu\hadoop-0.20.2

2.点window->show view->other,搜索map，然后点击Map/Reduce Location,点OK

这样就能看到Map/Reduce Location的视图了

在该视图右上角有一个大象的蓝色图标，点击新建一个location

填写上相关信息，具体参数和上述配置hadoop的参数一致

其中 map/reduce master 的后视图对应于mapred-site.xml 里的mapred.job.tracker属性值

DFS Master对应于core-site.xml的fs.default.name属性值

然后确认返回

点击eclipse右上角的open perspective,切换至map/reduce

这时左侧会如下

如果能看到这里，说明插件能够正常连接上hadoop集群了

来个简单的MR程序吧

在eclipse内点击File->NEW->other,选择map/reduce project,随便取个名wordcount

把hadoo-0.20.2里面的Wordcount.java赋值到demo下(D:\cygwin\home\wuliufu\hadoop-0.20.2\src\examples\org\apache\hadoop\examples\WordCount.java)

回到cygwin 下，我们编辑一个文件word.txt(可以选取一段英文，如附件)，然后把该文件上传到hdfs

wuliufu@wuliufu-PC ~
$ hadoop fs -ls /
Found 2 items
drwxr-xr-x   - wuliufu-pc\wuliufu supergroup          0 2013-04-23 22:44 /home
drwxr-xr-x   - wuliufu-pc\wuliufu supergroup          0 2013-04-24 00:42 /tmp

wuliufu@wuliufu-PC ~
$ hadoop fs -copyFromLocal ./word.txt /tmp/

在eclipse里面的左侧的DFS Location里面的Hadoop(大象图标)右键刷新就可以看到上传的文件了

接下来准备执行以下WordCount 了

改成需要传入两个参数，分别是输入路径和输出目录

右键run configxx。。。

接着右键->Run As->Run on hadoop

控制台会出现类似如下的log

13/04/24 00:49:45 INFO jvm.JvmMetrics: Initializing JVM Metrics with processName=JobTracker, sessionId=
13/04/24 00:49:46 WARN mapred.JobClient: No job jar file set.  User classes may not be found. See JobConf(Class) or JobConf#setJar(String).
13/04/24 00:49:47 INFO input.FileInputFormat: Total input paths to process : 1
13/04/24 00:49:48 INFO mapred.JobClient: Running job: job_local_0001
13/04/24 00:49:48 INFO input.FileInputFormat: Total input paths to process : 1
13/04/24 00:49:48 INFO mapred.MapTask: io.sort.mb = 100
13/04/24 00:49:49 INFO mapred.MapTask: data buffer = 79691776/99614720
13/04/24 00:49:49 INFO mapred.MapTask: record buffer = 262144/327680
13/04/24 00:49:49 INFO mapred.JobClient:  map 0% reduce 0%
13/04/24 00:49:49 INFO mapred.MapTask: Starting flush of map output
13/04/24 00:49:49 INFO mapred.MapTask: Finished spill 0
13/04/24 00:49:49 INFO mapred.TaskRunner: Task:attempt_local_0001_m_000000_0 is done. And is in the process of commiting
13/04/24 00:49:49 INFO mapred.LocalJobRunner: 
13/04/24 00:49:49 INFO mapred.TaskRunner: Task 'attempt_local_0001_m_000000_0' done.
13/04/24 00:49:49 INFO mapred.LocalJobRunner: 
13/04/24 00:49:49 INFO mapred.Merger: Merging 1 sorted segments
13/04/24 00:49:49 INFO mapred.Merger: Down to the last merge-pass, with 1 segments left of total size: 870 bytes
13/04/24 00:49:49 INFO mapred.LocalJobRunner: 
13/04/24 00:49:50 INFO mapred.TaskRunner: Task:attempt_local_0001_r_000000_0 is done. And is in the process of commiting
13/04/24 00:49:50 INFO mapred.LocalJobRunner: 
13/04/24 00:49:50 INFO mapred.TaskRunner: Task attempt_local_0001_r_000000_0 is allowed to commit now
13/04/24 00:49:50 INFO mapred.JobClient:  map 100% reduce 0%
13/04/24 00:49:50 INFO output.FileOutputCommitter: Saved output of task 'attempt_local_0001_r_000000_0' to hdfs://localhost:9000/tmp/out
13/04/24 00:49:50 INFO mapred.LocalJobRunner: reduce > reduce
13/04/24 00:49:50 INFO mapred.TaskRunner: Task 'attempt_local_0001_r_000000_0' done.
13/04/24 00:49:51 INFO mapred.JobClient:  map 100% reduce 100%
13/04/24 00:49:51 INFO mapred.JobClient: Job complete: job_local_0001
13/04/24 00:49:51 INFO mapred.JobClient: Counters: 14
13/04/24 00:49:51 INFO mapred.JobClient:   FileSystemCounters
13/04/24 00:49:51 INFO mapred.JobClient:     FILE_BYTES_READ=34718
13/04/24 00:49:51 INFO mapred.JobClient:     HDFS_BYTES_READ=1108
13/04/24 00:49:51 INFO mapred.JobClient:     FILE_BYTES_WRITTEN=70010
13/04/24 00:49:51 INFO mapred.JobClient:     HDFS_BYTES_WRITTEN=604
13/04/24 00:49:51 INFO mapred.JobClient:   Map-Reduce Framework
13/04/24 00:49:51 INFO mapred.JobClient:     Reduce input groups=66
13/04/24 00:49:51 INFO mapred.JobClient:     Combine output records=66
13/04/24 00:49:51 INFO mapred.JobClient:     Map input records=1
13/04/24 00:49:51 INFO mapred.JobClient:     Reduce shuffle bytes=0
13/04/24 00:49:51 INFO mapred.JobClient:     Reduce output records=66
13/04/24 00:49:51 INFO mapred.JobClient:     Spilled Records=132
13/04/24 00:49:51 INFO mapred.JobClient:     Map output bytes=903
13/04/24 00:49:51 INFO mapred.JobClient:     Combine input records=87
13/04/24 00:49:51 INFO mapred.JobClient:     Map output records=87
13/04/24 00:49:51 INFO mapred.JobClient:     Reduce input records=66

再在右侧的DFS Location刷新一下

点击part-r-00000,如上图右侧，这就是最终结果了

基本流程结束。

准备睡觉了。。。。。。

二.基于Linux平台搭建hadoop集群及MR开发环境

三.基于MRUnit测试

四.MR程序调试

hadoop-0.20.2-eclipse-plugin.jar (2.8 MB)
下载次数: 11

hadoop-eclipse-plugin-0.20.2-cdh3u4.jar (5.3 MB)
下载次数: 10

hadoop-eclipse-plugin-0.20.2-cdh3u4_for_Juno_Service_Release_1_.jar (7 MB)
下载次数: 7

查看图片附件

最好Wordpree+Apache+PHP安装教程伶星37 apache php 开发语言
前提需要PHP的安装最少需要7.4以上Mysql的安装，直接默认最新版就行APache服务器（HTTP服务器，只有用这个你的软件才能在服务器上运行）安装apache安装sudoaptinstallapache2查看防火墙sudoufwapplist如果有Apache那么就可以直接访问安装PHP版本7.4就可以sudoaptinstallphp-mysqlsudosystemctlrestartap
php composer 私有包,手把手教你如何搭建Composer私有仓库超级小嬲 php composer 私有包
现在网上到处充斥这各种搭建私有仓库文档，但对于新手来说，总是有那么多的坑。这里我把我的摸索历程写出来给大家参考，希望大家能少踩一些坑。现在网上到处充斥这各种搭建私有仓库文档，但对于新手来说，总是有那么多的坑。这里我把我的摸索历程写出来给大家参考，希望大家能少踩一些坑。一，安装ComposerComposer的安装已经有很完善的教程，这里我就不重复造轮子了。安装Composer安装好之后就能直接在命
Nginx 请求转发配置指南 web13093320398 面试学习路线阿里巴巴 nginx linux 运维
Nginx请求转发配置指南1.简介Nginx是一款高性能的HTTP和反向代理服务器，也是一个IMAP/POP3/SMTP代理服务器。本文档将介绍如何使用Nginx配置请求转发，并解释一些常用的配置参数。2.Nginx安装在配置之前，确保你的系统已经安装了Nginx。如果未安装，可以使用以下命令进行安装：在CentOS/RHEL上：sudoyuminstallnginx-y在Ubuntu/Debia
Python连接SQL SEVER数据库全流程 m0_74824865 面试学习路线阿里巴巴数据库 python sql
背景介绍在数据分析领域，经常需要从数据库中获取数据进行分析和处理。而SQLServer是一种常用的关系型数据库管理系统，因此学习如何使用Python连接SQLServer数据库并获取数据是非常有用的。以下是Python使用pymssql连接SQLServer数据库的全流程：安装pymssql库本地账号设置脚本连接数据导入函数实现一、安装pymssqlpymssql是Python连接SQLServe
使用 acme.sh 申请和管理免费SSL 证书：告别 certbot 的繁琐 lihuang319 linux ssl
使用acme.sh申请和管理SSL证书：告别certbot的繁琐引言介绍SSL证书的重要性传统certbot的痛点（如live目录、复杂的配置）acme.sh的优势（轻量、灵活、自动化）一、acme.sh简介什么是acme.shacme.sh的主要特点支持多种DNS服务商自动化续期直接指定证书路径无需额外依赖二、安装acme.sh基本安装curlhttps://get.acme.sh|sh-sem
Llama.cpp 服务器安装指南（使用 Docker，GPU 专用）田猿笔记 AI 高级应用 llama 服务器 docker llama.cpp
前置条件在开始之前，请确保你的系统满足以下要求：操作系统：Ubuntu20.04/22.04（或支持Docker的Linux系统）。硬件：NVIDIAGPU（例如RTX4090）。内存：16GB+系统内存，GPU需12GB+显存（RTX4090有24GB）。存储：15GB+可用空间（用于源码、镜像和模型文件）。网络：需要互联网连接以下载源码和依赖。软件：已安装并运行Docker。已安装NVIDIA
PyTorch使用常见异常和解决办法汇总东哥说AI 机器学习与深度学习实战 PyTorch 异常解决办法
文章目录1.使用conda安装PyTorch后同时在Jupyter导入失败Nomodulenamed'torch'2.PyTorch使用张量时报错expectedscalartypeDoublebutfoundFloat3.PyTorch创建Embedding时报错IndexError:indexoutofrangeinself1.使用conda安装PyTorch后同时在Jupyter导入失败No
Spark技术系列（一）：初识Apache Spark——大数据处理的统一分析引擎数据大包哥 #Spark 大数据
Spark技术系列（一）：初识ApacheSpark——大数据处理的统一分析引擎1.背景与核心价值1.1大数据时代的技术演进MapReduce的局限性：磁盘迭代计算、中间结果落盘导致的性能瓶颈Spark诞生背景：UCBerkeleyAMPLab实验室为解决复杂迭代计算需求研发（2010年开源）技术定位：基于内存的通用分布式计算框架（支持批处理、流计算、机器学习、图计算等）1.2Spark内置模块S
记录更换电脑硬盘并克隆数据鱼干～电脑
1.傲梅安装在c盘2.删除旧机械硬盘里无用的软件以及数据3.删除新固态硬盘里的无用数据，并备份数据到其他电脑硬盘或存储设备4.打开傲梅==》克隆硬盘==>选择源旧机械硬盘》目标新固态硬盘》弹窗提示点击是==》设置里选中“让分区适应整个硬盘大小”》点击保存》提交里点击执行即可5.执行完毕后关机，拆掉旧机械硬盘，换上新固态硬盘6.开机后，在计算机管理–》存储==》磁盘管理==》更改新固态硬盘的驱动器号
Composer如何通过GitHub Personal Access Token安装私有包：完整教程 lihuang319 composer github php
使用Composer安全管理您的PHP私有依赖包一、前言在PHP开发中，我们经常需要将内部工具包托管为私有仓库。传统的账号密码验证方式存在安全隐患，而GitHubPersonalAccessToken（PAT）提供了一种更安全的鉴权方案。本文将通过4个核心步骤+3个避坑指南，手把手教您在Composer中优雅地使用PAT安装私有包。二、为什么要用PAT？安全性：细粒度权限控制（可设置过期时间/单仓
Linux查看端口占用情况的几种方式 liu_caihong linux 服务器网络
Linux查看端口占用情况的几种方式概述测试环境为Centos7.9，本文简单给出了几种检测端口的例子。一、查看本机端口占用1、netstat#安装netstatyum-yinstallnet-tools#检测端口占用netstat-npl|grep"端口"[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-FFUW0j6I-1655191692938)(C:%5CUse
go install 报错 cannot find package“xxx/xxx“ 柠是柠檬的檬 go golang github git
问题：goinstall安装包的时候，如果本地环境没有对应的包，就会报错cannotfindpackage“xxx/xxx“。解决：如果可以的话可以执行goget来获取对应的包。mkdir-p$GOPATH/src/google.golang.org/cd$GOPATH/src/google.golang.org/gogetgoogle.golang.org/grpc没有工具的话，就需要把对应的包
python导出结果_Python连接Oracle数据查询导出结果 weixin_39712821 python导出结果
python连接oracle，需用用到模块cx_oracle，可以直接pip安装，如网络不好，可下载离线后本地安装本人由于工作需要，期望便捷查询所得结果，且固定输出某个格式具体代码如下：#!coding:utf-8importcx_Oracleconn=cx_Oracle.connect('username/password@IP/连接名')cur=conn.cursor()cur.execute
Python—kafka操作蓝魔Y Python编程 kafka
文档结构1、概念简介2、环境搭建3、操作实践1、概念简介2、环境搭建接口手册：https://kafka-python.readthedocs.io/en/master/Python操作kafka的模块为：kafka-python模块安装pipinstallkafka-python3、操作实践=============================================over====
【spug】使用勤不了一点 CI/CD python django ci/cd 运维 devops
目录简介下载与安装初始化配置启动与日志版本更新登录与使用工作台主机管理批量执行配置中心应用发布系统管理监控与告警使用问题简介手动部署|Spugwalle的升级版本轻量级无Agent主机管理主机批量执行主机在线终端文件在线上传下载应用发布部署在线任务计划配置中心监控报警如果有测试错误请指出。下载与安装测试环境：Python3.7.8CentOSLinuxrelease7.4.1708(Core)sp
nginx 安装（下载解压就行，免安装）当归1024 nginx nginx 运维
nginx是一个高性能的HTTP和反向代理web服务器，同时也提供了IMAP/POP3/SMTP服务。nginx由C语言编写，内存占用少，性能稳定，并发能力强，功能丰富；可以在大多数UnixLinuxOS上编译运行，并有Windows移植版。1、nginx下载地址：nginx:download2、windows安装及启动nginx是绿色免安装的，解压后可以直接启动双击nginx.exe即可启动服务
python调用kafka smile__su python python kafka
先启动hadoop，zookeeper，kafka启动命令hadoop启动命令sbin/start-all.shzookeeper启动命令./bin/zkServer.shstart每台机器都要启动kafka启动命令bin/kafka-server-start.shconfig/server.properties每台机器都要启动进行以下操作的前提是将hadoop，zookeeper，kafka安装
module object has no attribute WebSocketApp 灿灿的金服务器 python
安装好websocket之后，在使用websocket.WebSocketApp()函数的时候报错原因是没有这个函数是少了包，执行以下操作即可解决pipinstallwebsocket-client
pip 与当前python环境版本不匹配，python安装库成功，还是提示没有该库灿灿的金 python pip 开发语言
解决pip版本不一致在使用pip命令前加上python-m即可让pip版本和当前python版本一致因此,当使用pip安装依赖时,需要在命令前添加python-m来配合使用,比如安装一个pillow库,命令如下python-mpipinstallpillow你同时安装了python2和python3pipinstallPillow可能下载的是python3的库，而你代码跑的是python2可以通过
python操作kafka 您懂我意思吧 python开发 kafka 分布式 python
一、参考阿里云的官方链接：使用PythonSDK接入Kafka收发消息_云消息队列Kafka版(Kafka)-阿里云帮助中心二、安装python环境三、添加python依赖库pipinstallconfluent-kafka==1.9.2四、新建一个setting.py文件配置信息kafka_setting={'sasl_plain_username':'XXX',#如果是默认接入点实例，请删除该
opencv 自适应阈值虚假程序设计 opencv 人工智能计算机视觉
需要安装扩展库opencv-contrib-pythonCV_class.pyimportcv2importnumpyasnp#importserialimportos,sysfromdatetimeimportdatetimeimport_threadimportthreadingimporttimeimportwin32ui#只有windows能用.#fromCV_classimport*de
Python -- asyncio库鹿夏
asyncio协程前言问题的引出多线程版本多进程版本生成器版本事件循环协程FutureTask任务协程的使用回调的使用多个任务执行使用回调,如下新语法TCPEchoServer举例aiohttp库安装文档开发前言3.4版本加入标准库。asyncio底层基于selectors实现，看似库，其实就是个框架，包含异步IO、事件循环、协程、任务等内容问题的引出defa():forxinrange(3):p
别再 pip install 了！一个绝佳的包管理器：pipx 西坡不是东坡 python学习 pip
在Python开发过程中，我们常常需要安装各种各样的工具库。有些库是项目级别的，比如Django或者Flask，而有些库是我们在整个系统中都可能用到的命令行工具，比如black、flake8、httpie等。对于后者，传统的pip安装方式可能会引发一些版本冲突或者环境污染的问题。这时，pipx就成了我们的救星。什么是pipx？pipx是一个用于安装和管理Python命令行工具的工具。它的主要优势在
MRtrix3安装报错2则：Checking for Qt: ERROR: error linking Qt application! 皎皎如月明 linux 运维服务器
服了，mrtrix3官网现在只推荐了conda安装这种方法，但是conda安装我一直报错，报错代码如下：Solvingenvironment:failedwithinitialfrozensolve.Retryingwithflexiblesolve.Collectingpackagemetadata(repodata.json):donePackagesNotFoundError:Thefoll
爬虫学习第六篇轻松搞定网络请求笨鸟笃行 python学习爬虫学习 python
嘿，小伙伴们！今天咱们来聊聊用Python进行网络请求，这是爬虫学习的敲门砖哦。别怕，跟着我一步步来，保证让你轻松上手！（一）安装requests模块首先，得把requests模块装上。看过上一篇的小伙伴应该都搞定了吧，这玩意儿超好用，能帮我们轻松发起网络请求。如果没搞定的，跟着我重新安装一遍，在vscode的终端里输入pipinstallrequests，回车，搞定！就像给手机装了个APP一样简
Wireshark详解靖节先生 wireshark 测试工具网络
Wireshark使用详解1.Wireshark简介2.下载与安装1.下载地址2.安装步骤（以Windows为例）3.界面与核心功能1.主界面布局2.常用菜单功能4.过滤功能详解1.过滤类型2.常用过滤命令5.过滤命令与网络结构对应6.使用注意事项7.案例分析TCP三次握手1.实验目标2.操作步骤3.预期结果8.扩展学习1.Wireshark简介Wireshark是一款开源的网络协议分析工具，支持
如何收集k8s pod的服务日志（rancher）一方有点方 kubernetes rancher 容器
一、环境情况说明当前环境是k8s+rancher+filebeat+es+kibana本文只讲解部署filebeat收集容器日志的过程、使用daemonset的方式部署filebeat，es+kibana+k8s已提前创建好的二、部署安装1、在已创建完成的k8s环境中，用kubectl先创建一个命名空间elk-log，新增一个filebeat目录,上传一下4个代码文件filebeat.daemon
使用 Python 实现基于 AGA8 GERG - 2008 方程计算掺氢天然气压缩因子的示例代码 go5463158465 python 算法 python 算法开发语言
AGA8GERG-2008方程是用于计算天然气混合物热力学性质的一种方法，下面是一个使用Python实现基于AGA8GERG-2008方程计算掺氢天然气压缩因子的示例代码。需要注意的是，AGA8GERG-2008方程非常复杂，完整实现需要大量的系数和详细的计算步骤。这里我们简化了部分过程，使用CoolProp库来完成计算，因为CoolProp已经实现了GERG-2008方程。安装依赖库首先确保你已
（一文搞定）使用sd卡，往野火EBF6UL/LL-pro板子，移植官方uboot、kernel以及构建rootfs 又摆有菜嵌入式硬件 arm开发 linux
0、事先声明1、我的pc是Linux操作系统，接下来的操作也都是在linux系统上的。不是windows操作系统。（如若你是win系统，可安装虚拟机，解决这个问题。此帖不讨论如何在win上安装虚拟机）。2、只在win下面使用了串口软件mobaxterm。（此操作，事先请先安装usb转串口ch340驱动）1、EBF6UL/LL-pro简介这是野火的开发版，芯片使用的nxp的imx6ull。其他不在介
手把手带你初始化一个angular库 angular
在使用angular的过程中，我们希望将一些公共的组件等剥离到一个单独的库中，然后供我们在其它的angular项目中直接导入。本文将展示如何初始化并集成测试一个angular库。angularcli首先我们需要确认angular的版本，比如我当前计划初始化适用于angular18版本的库，则需要在全局先安装18版本的angular-cli，然后使用ngversion来进行版本确认：命令如下:npm
apache ftpserver-CentOS config gengzg apache
<server xmlns="http://mina.apache.org/ftpserver/spring/v1" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation=" http://mina.apache.o
优化MySQL数据库性能的八种方法 AILIKES sql mysql
1、选取最适用的字段属性　　MySQL可以很好的支持大数据量的存取，但是一般说来，数据库中的表越小，在它上面执行的查询也就会越快。因此，在创建表的时候，为了获得更好的性能，我们可以将表中字段的宽度设得尽可能小。例如，在定义邮政编码这个字段时，如果将其设置为CHAR(255),显然给数据库增加了不必要的空间，甚至使用VARCHAR这种类型也是多余的，因为CHAR(6)就可以很
JeeSite 企业信息化快速开发平台 Kai_Ge JeeSite
JeeSite 企业信息化快速开发平台平台简介 JeeSite是基于多个优秀的开源项目，高度整合封装而成的高效，高性能，强安全性的开源Java EE快速开发平台。 JeeSite本身是以Spring Framework为核心容器，Spring MVC为模型视图控制器，MyBatis为数据访问层， Apache Shiro为权限授权层，Ehcahe对常用数据进行缓存，Activit为工作流
通过Spring Mail Api发送邮件 120153216 邮件 main
原文地址：http://www.open-open.com/lib/view/open1346857871615.html 使用Java Mail API来发送邮件也很容易实现，但是最近公司一个同事封装的邮件API实在让我无法接受，于是便打算改用Spring Mail API来发送邮件，顺便记录下这篇文章。【Spring Mail API】 Spring Mail API都在org.spri
Pysvn 程序员使用指南 2002wmj SVN
源文件:http://ju.outofmemory.cn/entry/35762 这是一篇关于pysvn模块的指南. 完整和详细的API请参考 http://pysvn.tigris.org/docs/pysvn_prog_ref.html. pysvn是操作Subversion版本控制的Python接口模块. 这个API接口可以管理一个工作副本, 查询档案库, 和同步两个. 该
在SQLSERVER中查找被阻塞和正在被阻塞的SQL 357029540 SQL Server
SELECT R.session_id AS BlockedSessionID , S.session_id AS BlockingSessionID , Q1.text AS Block
Intent 常用的用法备忘 7454103 .net android Google Blog F#
Intent 应该算是Android中特有的东西。你可以在Intent中指定程序要执行的动作（比如：view,edit,dial），以及程序执行到该动作时所需要的资料。都指定好后，只要调用startActivity()，Android系统会自动寻找最符合你指定要求的应用程序，并执行该程序。下面列出几种Intent 的用法显示网页:
Spring定时器时间配置 adminjun spring 时间配置定时器
红圈中的值由6个数字组成，中间用空格分隔。第一个数字表示定时任务执行时间的秒，第二个数字表示分钟，第三个数字表示小时，后面三个数字表示日，月，年，< xmlnamespace prefix ="o" ns ="urn:schemas-microsoft-com:office:office" /> 测试的时候，由于是每天定时执行，所以后面三个数
POJ 2421 Constructing Roads 最小生成树 aijuans 最小生成树
来源：http://poj.org/problem?id=2421 题意：还是给你n个点，然后求最小生成树。特殊之处在于有一些点之间已经连上了边。思路：对于已经有边的点，特殊标记一下，加边的时候把这些边的权值赋值为0即可。这样就可以既保证这些边一定存在，又保证了所求的结果正确。代码： #include <iostream> #include <cstdio>
重构笔记——提取方法（Extract Method） ayaoxinchao java 重构提炼函数局部变量提取方法
提取方法（Extract Method）是最常用的重构手法之一。当看到一个方法过长或者方法很难让人理解其意图的时候，这时候就可以用提取方法这种重构手法。下面是我学习这个重构手法的笔记：提取方法看起来好像仅仅是将被提取方法中的一段代码，放到目标方法中。其实，当方法足够复杂的时候，提取方法也会变得复杂。当然，如果提取方法这种重构手法无法进行时，就可能需要选择其他
为UILabel添加点击事件 bewithme UILabel
默认情况下UILabel是不支持点击事件的，网上查了查居然没有一个是完整的答案，现在我提供一个完整的代码。 UILabel *l = [[UILabel alloc] initWithFrame:CGRectMake(60, 0, listV.frame.size.width - 60, listV.frame.size.height)]
NoSQL数据库之Redis数据库管理(PHP-REDIS实例) bijian1013 redis 数据库 NoSQL
一.redis.php <?php //实例化 $redis = new Redis(); //连接服务器 $redis->connect("localhost"); //授权 $redis->auth("lamplijie"); //相关操
SecureCRT使用备注 bingyingao secureCRT 每页行数
SecureCRT日志和卷屏行数设置一、使用securecrt时，设置自动日志记录功能。 1、在C:\Program Files\SecureCRT\下新建一个文件夹(也就是你的CRT可执行文件的路径），命名为Logs； 2、点击Options -> Global Options -> Default Session -> Edite Default Sett
【Scala九】Scala核心三：泛型 bit1129 scala
泛型类 package spark.examples.scala.generics class GenericClass[K, V](val k: K, val v: V) { def print() { println(k + "," + v) } } object GenericClass { def main(args: Arr
素数与音乐 bookjovi 素数数学 haskell
由于一直在看haskell，不可避免的接触到了很多数学知识，其中数论最多，如素数，斐波那契数列等，很多在学生时代无法理解的数学现在似乎也能领悟到那么一点。闲暇之余，从图书馆找了<<The music of primes>>和<<世界数学通史>>读了几遍。其中素数的音乐这本书与软件界熟知的&l
Java-Collections Framework学习与总结-IdentityHashMap BrokenDreams Collections
这篇总结一下java.util.IdentityHashMap。从类名上可以猜到，这个类本质应该还是一个散列表，只是前面有Identity修饰，是一种特殊的HashMap。简单的说，IdentityHashMap和HashM
读《研磨设计模式》-代码笔记-享元模式-Flyweight bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.Collection; import java.util.HashMap; import java.util.List; import java
PS人像润饰&调色教程集锦 cherishLC PS
1、仿制图章沿轮廓润饰——柔化图像，凸显轮廓 http://www.howzhi.com/course/retouching/ 新建一个透明图层，使用仿制图章不断Alt+鼠标左键选点，设置透明度为21%，大小为修饰区域的1/3左右（比如胳膊宽度的1/3），再沿纹理方向（比如胳膊方向）进行修饰。所有修饰完成后，对该润饰图层添加噪声，噪声大小应该和
更新多个字段的UPDATE语句 crabdave update
更新多个字段的UPDATE语句 update tableA a set (a.v1, a.v2, a.v3, a.v4) = --使用括号确定更新的字段范围
hive实例讲解实现in和not in子句 daizj hive not in in
本文转自：http://www.cnblogs.com/ggjucheng/archive/2013/01/03/2842855.html 当前hive不支持 in或not in 中包含查询子句的语法，所以只能通过left join实现。假设有一个登陆表login(当天登陆记录,只有一个uid),和一个用户注册表regusers(当天注册用户，字段只有一个uid)，这两个表都包含
一道24点的10+种非人类解法（2,3,10,10） dsjt 算法
这是人类算24点的方法？！！！事件缘由：今天晚上突然看到一条24点状态，当时惊为天人，这NM叫人啊？以下是那条状态朱明西 : 24点，算2 3 10 10，我LX炮狗等面对四张牌痛不欲生，结果跑跑同学扫了一眼说，算出来了，2的10次方减10的3次方。。我草这是人类的算24点啊。。然后么。。。我就在深夜很得瑟的问室友求室友算刚出完题，文哥的暴走之旅开始了 5秒后
关于YII的菜单插件 CMenu和面包末breadcrumbs路径管理插件的一些使用问题 dcj3sjt126com yii framework
在使用 YIi的路径管理工具时，发现了一个问题。 <?php
对象与关系之间的矛盾：“阻抗失配”效应[转] come_for_dream 对象
概述 “阻抗失配”这一词组通常用来描述面向对象应用向传统的关系数据库（RDBMS）存放数据时所遇到的数据表述不一致问题。C++程序员已经被这个问题困扰了好多年，而现在的Java程序员和其它面向对象开发人员也对这个问题深感头痛。 “阻抗失配”产生的原因是因为对象模型与关系模型之间缺乏固有的亲合力。“阻抗失配”所带来的问题包括：类的层次关系必须绑定为关系模式（将对象
学习编程那点事 gcq511120594 编程互联网
一年前的夏天，我还在纠结要不要改行，要不要去学php？能学到真本事吗？改行能成功吗？太多的问题，我终于不顾一切，下定决心，辞去了工作，来到传说中的帝都。老师给的乘车方式还算有效，很顺利的就到了学校，赶巧了，正好学校搬到了新校区。先安顿了下来，过了个轻松的周末，第一次到帝都，逛逛吧！接下来的周一，是我噩梦的开始，学习内容对我这个零基础的人来说，除了勉强完成老师布置的作业外，我已经没有时间和精力去
Reverse Linked List II hcx2013 list
Reverse a linked list from position m to n. Do it in-place and in one-pass. For example:Given 1->2->3->4->5->NULL, m = 2 and n = 4, return
Spring4.1新特性——页面自动化测试框架Spring MVC Test HtmlUnit简介 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
Hadoop集群工具distcp liyonghui160com
1. 环境描述两个集群：rock 和 stone rock无kerberos权限认证，stone有要求认证。 1. 从rock复制到stone，采用hdfs Hadoop distcp -i hdfs://rock-nn:8020/user/cxz/input hdfs://stone-nn:8020/user/cxz/运行在rock端，即源端问题：报版本
一个备份MySQL数据库的简单Shell脚本 pda158 mysql 脚本
　　主脚本（用于备份mysql数据库）：　　该Shell脚本可以自动备份数据库。只要复制粘贴本脚本到文本编辑器中，输入数据库用户名、密码以及数据库名即可。我备份数据库使用的是mysqlump 命令。后面会对每行脚本命令进行说明。　　 1. 分别建立目录“backup”和“oldbackup” 　　#mkdir /backup 　　#mkdir /oldbackup 　
300个涵盖IT各方面的免费资源（中）——设计与编码篇 shoothao IT资源图标库图片库色彩板字体
A. 免费的设计资源 Freebbble:来自于Dribbble的免费的高质量作品。 Dribbble:Dribbble上“免费”的搜索结果——这是巨大的宝藏。 Graphic Burger:每个像素点都做得很细的绝佳的设计资源。 Pixel Buddha:免费和优质资源的专业社区。 Premium Pixels:为那些有创意的人提供免费的素材。
thrift总结 - 跨语言服务开发 uule thrift
官网官网JAVA例子 thrift入门介绍 IBM-Apache Thrift - 可伸缩的跨语言服务开发框架 Thrift入门及Java实例演示 thrift的使用介绍 RPC POM： <dependency> <groupId>org.apache.thrift</groupId>