缘定三石

日志采集框架Flume

在一个完整的大数据处理系统中，除了hdfs+mapreduce+hive组成分析系统的核心之外，还需要数据采集、结果数据导出、任务调度等不可或缺的辅助系统，而这些辅助工具在hadoop生态体系中都有便捷的开源框架，如图所示：

1. 日志采集框架Flume

1.1 Flume介绍

日志采集框架Flume_第2张图片

1.1.1 概述

u Flume是一个分布式、可靠、和高可用的海量日志采集、聚合和传输的系统。

u Flume可以采集文件，socket数据包等各种形式源数据，又可以将采集到的数据输出到HDFS、hbase、hive、kafka等众多外部存储系统中

u 一般的采集需求，通过对flume的简单配置即可实现

u Flume针对特殊场景也具备良好的自定义扩展能力，因此，flume可以适用于大部分的日常数据采集场景

1.1.2 运行机制

1、 Flume分布式系统中最核心的角色是agent，flume采集系统就是由一个个agent所连接起来形成

2、 每一个agent相当于一个数据传递员，内部有三个组件：

a) Source：采集源，用于跟数据源对接，以获取数据

b) Sink：下沉地，采集数据的传送目的，用于往下一级agent传递数据或者往最终存储系统传递数据

c) Channel：angent内部的数据传输通道，用于从source将数据传递到sink

日志采集框架Flume_第3张图片

1.1.4 Flume采集系统结构图

1. 简单结构

单个agent采集数据

Source：接受数据，类型有多种。

Channel：临时存放地，对Source中来的数据进行缓冲，直到sink消费掉。

Sink：从channel提取数据存放到中央化存储(hadoop / hbase)。

日志采集框架Flume_第4张图片

2. 复杂结构

多级agent之间串联

日志采集框架Flume_第5张图片

1.2 Flume实战案例

1.2.0需求分析

我们想通过电商的日志分析用户的行为，这需要把这些数据移植到hdfs上面，我们可以通过Flume进行移植

1.2.1 Flume的安装部署

1、Flume的安装非常简单，只需要解压即可，当然，前提是已有hadoop环境

上传安装包到数据源所在节点上

然后解压

1)tar -zxvf apache-flume-1.7.0-bin.tar.gz -C /soft

2)ln -s apache-flume-1.7.0-bin flume

3)配置环境变量/etc/profile

export FLUME_HOME=/soft/flume

export PATH=$PATH:$FLUME_HOME/bin

4)source /etc/profile

5)验证：

flume-ng version

然后进入flume的目录，修改conf下的flume-env.sh，在里面配置JAVA_HOME

2、根据数据采集的需求配置采集方案，描述在配置文件中(文件名可任意自定义)

3、指定采集方案配置文件，在相应的节点上启动flume

案例使用：

先用一个最简单的例子来测试一下程序环境是否正常

1、先在flume的conf目录下新建一个文件

vi netcat-logger.conf

# 定义这个agent中各组件的名字
a1.sources = r1
a1.sinks = k1
a1.channels = c1

# 描述和配置source组件：r1
a1.sources.r1.type = netcat
a1.sources.r1.bind = localhost
a1.sources.r1.port = 44444

# 描述和配置sink组件：k1
a1.sinks.k1.type = logger

# 描述和配置channel组件，此处使用是内存缓存的方式
a1.channels.c1.type = memory
a1.channels.c1.capacity = 1000 内存里面存放1000个事件
a1.channels.c1.transactionCapacity = 100

# 描述和配置source  channel   sink之间的连接关系
a1.sources.r1.channels = c1
a1.sinks.k1.channel = c1

1、启动agent去采集数据

bin/flume-ng agent -c conf -f conf/netcat-logger.conf -n a1 -Dflume.root.logger=INFO,console

-c conf 指定flume自身的配置文件所在目录

-f conf/netcat-logger.con 指定我们所描述的采集方案

-n a1 指定我们这个agent的名字

2、测试

1 )启动nc的客户端

$>nc localhost 44444

$nc>hello world

2)在flume的终端输出hello world.

先要往agent采集监听的端口上发送数据，让agent有数据可采

随便在一个能跟agent节点联网的机器上

3、补充安装nc

$>sudo yum install nmap-ncat.x86_64

清除仓库缓存

$>修改ali.repo --> ali.repo.bak文件。

$>sudo yum clean all

$>sudo yum makecache

#例如阿里基本源 $>sudo wget -O /etc/yum.repos.d/CentOS-Base.repo http://mirrors.aliyun.com/repo/Centos-7.repo

#阿里epel源

$>sudo wget -O /etc/yum.repos.d/epel.repo http://mirrors.aliyun.com/repo/epel-7.repo

1.2.2 采集案例

0.数据收集flume source

1.netcat

2.exec 实时日志收集

3.批量收集

监控一个文件夹，静态文件

收集完之后，会重新命名成新文件.compeleted.

1、采集目录到HDFS

采集需求：某服务器的某特定目录下，会不断产生新的文件，每当有新文件出现，就需要把文件采集到HDFS中去

根据需求，首先定义以下3大要素

l 采集源，即source——监控文件目录 : spooldir

l 下沉目标，即sink——HDFS文件系统 : hdfs sink

l source和sink之间的传递通道——channel，可用file channel 也可以用内存channel

配置文件编写：

#定义三大组件的名称
agent1.sources = source1
agent1.sinks = sink1
agent1.channels = channel1

# 配置source组件
agent1.sources.source1.type = spooldir
agent1.sources.source1.spoolDir = /home/centos/logs/
agent1.sources.source1.fileHeader = false

#配置拦截器
agent1.sources.source1.interceptors = i1
agent1.sources.source1.interceptors.i1.type = host
agent1.sources.source1.interceptors.i1.hostHeader = hostname

# 配置sink组件
agent1.sinks.sink1.type = hdfs
agent1.sinks.sink1.hdfs.path =hdfs://s201/weblog/flume-collection/%y-%m-%d/%H-%M
agent1.sinks.sink1.hdfs.filePrefix = access_log
agent1.sinks.sink1.hdfs.maxOpenFiles = 5000
agent1.sinks.sink1.hdfs.batchSize= 100
agent1.sinks.sink1.hdfs.fileType = DataStream
agent1.sinks.sink1.hdfs.writeFormat =Text
agent1.sinks.sink1.hdfs.rollSize = 102400
agent1.sinks.sink1.hdfs.rollCount = 1000000
agent1.sinks.sink1.hdfs.rollInterval = 60
#agent1.sinks.sink1.hdfs.round = true
#agent1.sinks.sink1.hdfs.roundValue = 10
#agent1.sinks.sink1.hdfs.roundUnit = minute
agent1.sinks.sink1.hdfs.useLocalTimeStamp = true
# Use a channel which buffers events in memory
agent1.channels.channel1.type = memory
agent1.channels.channel1.keep-alive = 120
agent1.channels.channel1.capacity = 500000
agent1.channels.channel1.transactionCapacity = 600

# Bind the source and sink to the channel
agent1.sources.source1.channels = channel1
agent1.sinks.sink1.channel = channel1

Channel参数解释：

capacity：默认该通道中最大的可以存储的event数量

trasactionCapacity：每次最大可以从source中拿到或者送到sink中的event数量

keep-alive：event添加到通道中或者移出的允许时间

2、采集文件到HDFS

采集需求：比如业务系统使用log4j生成的日志，日志内容不断增加，需要把追加到日志文件中的数据实时采集到hdfs

根据需求，首先定义以下3大要素

l 采集源，即source——监控文件内容更新 : exec ‘tail -F file’

l 下沉目标，即sink——HDFS文件系统 : hdfs sink

l Source和sink之间的传递通道——channel，可用file channel 也可以用内存channel

配置文件编写：

agent1.sources = source1
agent1.sinks = sink1
agent1.channels = channel1

# Describe/configure tail -F source1
agent1.sources.source1.type = exec
agent1.sources.source1.command = tail -F /home/centos/logs/access_log
agent1.sources.source1.channels = channel1

#configure host for source
agent1.sources.source1.interceptors = i1
agent1.sources.source1.interceptors.i1.type = host
agent1.sources.source1.interceptors.i1.hostHeader = hostname

# Describe sink1
agent1.sinks.sink1.type = hdfs
#a1.sinks.k1.channel = c1
agent1.sinks.sink1.hdfs.path =hdfs://s201/weblog/flume-collection/%y-%m-%d/%H-%M
agent1.sinks.sink1.hdfs.filePrefix = access_log
agent1.sinks.sink1.hdfs.maxOpenFiles = 5000
agent1.sinks.sink1.hdfs.batchSize= 100
agent1.sinks.sink1.hdfs.fileType = DataStream
agent1.sinks.sink1.hdfs.writeFormat =Text
agent1.sinks.sink1.hdfs.rollSize = 102400
agent1.sinks.sink1.hdfs.rollCount = 1000000
agent1.sinks.sink1.hdfs.rollInterval = 60
agent1.sinks.sink1.hdfs.round = true
agent1.sinks.sink1.hdfs.roundValue = 10
agent1.sinks.sink1.hdfs.roundUnit = minute
agent1.sinks.sink1.hdfs.useLocalTimeStamp = true

# Use a channel which buffers events in memory
agent1.channels.channel1.type = memory
agent1.channels.channel1.keep-alive = 120
agent1.channels.channel1.capacity = 500000
agent1.channels.channel1.transactionCapacity = 600

# Bind the source and sink to the channel
agent1.sources.source1.channels = channel1
agent1.sinks.sink1.channel = channel1

你可能感兴趣的:(Flume实战)

【机器学习实战入门项目】基于机器学习的鸢尾花分类项目精通代码大仙数据挖掘 python 深度学习机器学习分类人工智能大数据数据挖掘算法 python
基于机器学习的鸢尾花分类项目介绍：本项目利用机器学习模型对鸢尾花进行分类。鸢尾花数据集是一个著名的机器学习数据集，包含三种类别的花朵：Setosa、Versicolor和Virginica，每种类别由四个特征描述：萼片长度、萼片宽度、花瓣长度和花瓣宽度。什么是机器学习？机器学习是关于从数据中学习预测或提取知识的过程。它是人工智能的一个子领域。机器学习算法基于样本数据（即训练数据）构建模型，并根据训
Electron 开发者的 Tauri 2.0 实战指南：安全实践
在桌面应用开发中，安全性至关重要。相比Electron，Tauri2.0提供了更严格的安全模型和更完善的权限系统。本文将帮助你理解和实践Tauri的安全特性。权限系统对比Electron的安全模型在Electron中，我们通常这样处理安全：//main.jsconst{app,BrowserWindow}=require('electron')functioncreateWindow(){cons
精准洞察：B端产品业务调研的实战策略团队协作
B端产品做好业务调研是一个系统而细致的过程，它涉及多个步骤和关键点，以确保能够深入理解业务场景、明确用户需求，并为后续的产品设计和开发提供坚实的基础。以下是一些关键步骤和策略：一、明确调研目标在开始调研之前，首先要明确调研的目标。这有助于确保调研的方向性和可执行性。调研目标可能包括了解整体业务情况、深入挖掘具体业务问题、验证产品方案等。二、确定调研对象和形式调研对象：○内部人员：如一线业务人员、项
Chatbot 不是“万金油”：企业级生成式 AI 如何真正创造价值
编者按：企业在引入生成式AI时，是否陷入了盲目追随聊天机器人的误区，如何真正发挥AI的价值潜力？本文作者提出了一个观点：企业应该首先关注业务流程，而非简单地将AI聊天机器人作为万能解决方案。作者认为企业需要深入分析现有业务流程，识别可以应用AI的具体环节，而不是为了使用AI而找寻应用场景。同时作者基于十余个生成式AI应用的实战经验，详细阐述了如何通过"流程编排"而非"对话交互"，系统性地重塑企业A
倒计时 4 天！2024年压轴技术盛宴来了！云计算
亲爱的社区小伙伴们，大家好！2024年，KubeSphere社区已成功在北京、上海、深圳、杭州、成都五座城市举办线下Meetup。现在，年度压轴之站即将开启——12月28日（本周六下午），我们将在广州与您相聚，共赴一场精彩纷呈的云原生与AI技术盛会！诚邀您一同探索云原生与AI的最新趋势与实战应用，共享技术交流的巅峰时刻！活动概览时间：2024年12月28日（本周六）13:30-17:30地点：广州
拒绝 Helm？如何在 K8s 上部署 KRaft 模式 Kafka 集群？后端
首发：运维有术今天分享的主题是：不使用Helm、Operator，如何在K8s集群上手工部署一个开启SASL认证的KRaft模式的Kafka集群？本文，我将为您提供一份全面的实战指南，逐步引导您完成以下关键任务：配置KafkaSecret：管理用户密码和集群ID配置KafkaService：使用NodePort对外发布Kafka服务使用StatefulSet部署KRaft模式Kafka集群如何测试
电商项目管理优化新视角：看板的实战智慧与策略团队协作团队协作工具
在电商行业，项目管理是企业运营的核心环节之一，它直接关系到企业的运营效率、市场竞争力和长期发展。随着市场需求的快速变化和竞争的日益激烈，电商企业需要不断探索和实践新的项目管理方法，以提升自身的竞争力。看板管理作为一种直观、高效的项目管理工具，为电商项目管理带来了新的视角和智慧。一、看板管理的概念与特点看板管理源自制造业，是一种精益生产方式，旨在通过可视化的方式来管理工作和流程。其核心在于，通过对每
轨迹优化 | 基于贝塞尔曲线的无约束路径平滑与粗轨迹生成(附ROS C++/Python仿真) Mr.Winter` 运动规划实战进阶：轨迹优化篇人工智能机器人 ROS ROS2 自动驾驶轨迹优化几何学
目录0专栏介绍1从路径到轨迹2基于贝塞尔曲线的粗轨迹生成2.1路径关键点提取2.2路径点航向角计算2.3贝塞尔曲线轨迹生成3算法仿真3.1ROSC++仿真3.2Python仿真0专栏介绍课设、毕设、创新竞赛必备！本专栏涉及更高阶的运动规划算法轨迹优化实战，包括：曲线生成、碰撞检测、安全走廊、优化建模(QP、SQP、NMPC、iLQR等)、轨迹优化(梯度法、曲线法等)，每个算法都包含代码实现加深理解
鸿蒙开发实战：鸿蒙应用开发中的页面管理工具类详解二蛋和他的大花 harmony harmonyos 华为
一、引言在鸿蒙应用开发的征程中，如何高效地管理页面布局与显示，以满足用户对于沉浸式体验、个性化StatusBar颜色等界面特性的需求，一直是开发者们关注的焦点。为此，我特别设计了一款实用的“页面管理工具类”，它具备强大的功能，能帮助开发者轻松应对各种页面管理挑战。二、页面管理工具类：你的界面掌控利器页面管理工具类如同一位界面掌控的利器，为开发者提供了一系列专业的静态属性与方法。借助这些功能，开发者
【论文投稿】解锁Vue.js组件开发的神奇密码小周不想卷艾思科蓝学术会议投稿 vue.js
目录一、引言：Vue.js组件化的魅力之源二、初窥门径：组件的基础架构（一）组件的构成要素（二）创建首个Vue组件实例三、进阶之路：组件通信的艺术（一）父子组件间的通信之道（二）兄弟组件与跨层级通信的谋略四、实战演练：打造Vue.js组件库（一）规划组件库架构（二）开发实用组件五、总结：Vue.js组件开发的智慧结晶一、引言：Vue.js组件化的魅力之源在当今的前端开发领域，Vue.js已然成为备
ufw入门实战:在Ubuntu下通过ufw命令开放端口让外网访问明庭 ubuntu linux 运维
最近使用阿贝云的免费云服务器,1核1G内存10G硬盘5M带宽,配置不错，完全够用搞些轻量级项目，但是在搭建项目过程中发现无法访问已经部署的服务，经过检查发现是UFW防火墙的问题，所以，今天给大家介绍下在ubuntu系统下如何开放端口让外网访问我们的服务。端口管理是服务器安全的重要一环,ubuntu系统默认使用ufw来管理防火墙规则。首先我们检查下它现在的状态:sudoufwstatus是否显示为i
Python爬取豆瓣图书网Top250 实战有杨既安然 python 开发语言爬虫网络爬虫爬虫实战
Python爬取豆瓣图书网Top250实战只是用于学习，请不要恶意攻击别人的网站，尊重他人。1.引言豆瓣图书Top250是一个经典的图书排行榜，包含了大量优质图书的信息。本文将深入探讨如何使用Python爬取豆瓣图书Top250的内容，并将数据分别保存到数据库（SQLite）和文本文档中。我们将涵盖反爬虫策略、异常处理、数据清洗等技术细节，并提醒大家在爬取数据时尊重他人的劳动成果。2.技术栈与工具
「实战应用」如何为DHTMLX JavaScript 甘特图添加进度线 CodeCraft Studio 项目管理 javascript 甘特图算法
DHTMLXGantt是用于跨浏览器和跨平台应用程序的功能齐全的Gantt图表。可满足项目管理应用程序的所有需求，是最完善的甘特图图表库。今天，您将学习如何使用进度线补充JavaScript甘特图，以便于监控项目进度。DHTMLXGantt最新试用版下载什么是进度线，以及它如何为甘特图带来好处在复杂的甘特图场景中，项目团队成员或利益相关者可能难以及时准确地估计多个任务的当前状态。这时进度线就派上用
Three.js实现动态水泡效果逐步解析GLSL着色器贵州数擎科技有限公司 javascript 着色器开发语言
大家好！我是[数擎AI]，一位热爱探索新技术的前端开发者，在这里分享前端和Web3D、AI技术的干货与实战经验。如果你对技术有热情，欢迎关注我的文章，我们一起成长、进步！开发领域：前端开发|AI应用|Web3D|元宇宙技术栈：JavaScript、React、ThreeJs、WebGL、Go经验经验：6年+前端开发经验，专注于图形渲染和AI技术经验经验：演示地址开源项目：智简未来、晓智元宇宙、数字
Java并发编程：线程池优化实战指南莫非技术栈 java java 开发语言
Java并发编程：线程池优化实战指南1.线程池的核心概念在Java并发编程中，线程池是管理线程的利器。它通过复用线程、减少线程创建和销毁的开销，显著提升了系统性能和资源利用率。Java的java.util.concurrent包提供了强大的线程池支持，尤其是ThreadPoolExecutor类，它是实现线程池的核心。1.1线程池的关键参数核心线程数（corePoolSize）：线程池中始终保持存
Java网络爬虫技术之路：从基础构建到实战应用 Yori_22 java 爬虫开发语言
在当今信息爆炸的时代，数据已成为一种宝贵的资源。如何从海量的网络数据中提取有价值的信息，成为了众多开发者和数据科学家的共同挑战。Java网络爬虫技术，作为一种自动化采集数据的工具，正逐渐成为解决这一问题的关键。本文将带您踏上Java网络爬虫技术之路，从基础构建到实战应用，一步步揭开其神秘面纱。一、Java网络爬虫技术基础网络爬虫，又称网络蜘蛛或网络机器人，是一种按照一定规则自动抓取互联网信息的程序
kafka直接对接nginx Lu_Xiao_Yue nginx kafka
很多时候我们要对nginx产生的日志进行分析都是通过flume监控nginx产生的日志，通过flume把日志文件发送该kafka，flume作为生产者，但是这种方式的缺点就是可能效率会比较慢，除此之外还可以使用kafka直接对接nginx，nginx作为生产者，把log日志直接对接到kafka的某些分区中，这种方法的效率比较高，但是缺点就是可能会出现数据丢失，可以通过把nginx的日志进行一份给k
Python爬虫入门教程：超级简单的Python爬虫教程梦子mengy7762 爬虫 python 数据分析 python 爬虫 html pycharm visualstudio
这是一篇详细介绍[Python]爬虫入门的教程，从实战出发，适合初学者。读者只需在阅读过程紧跟文章思路，理清相应的实现代码，30分钟即可学会编写简单的Python爬虫。这篇Python爬虫教程主要讲解以下5部分内容：了解网页；使用requests库抓取网站数据；使用BeautifulSoup解析网页；清洗和组织数据；爬虫攻防战；了解网页以中国旅游网首页为例，抓取中国旅游网首页首条信息（标题和链接）
Java HTTP POST请求工具方法详解：架构、实践与最佳实践（可变参数）码农阿豪@新空间代码工作室好“物”分享 java http 架构
个人名片作者简介：java领域优质创作者个人主页：码农阿豪工作室：新空间代码工作室（提供各种软件服务)个人邮箱：[[email protected]]个人微信：15279484656个人导航网站：www.forff.top座右铭：总有人要赢。为什么不能是我呢？专栏导航：码农阿豪系列专栏导航面试专栏：收集了java相关高频面试题，面试实战总结️Spring5系列专栏：整理了Spring5重要知识点与
Java中的高效集合操作：Stream API实战指南莫非技术栈 java java 开发语言
Java中的高效集合操作：StreamAPI实战指南1.引言：集合操作的痛点在日常开发中，我们经常需要对集合进行各种操作，比如过滤、映射、排序、聚合等。传统的做法是使用for循环或Iterator，代码冗长且容易出错。比如：Listnames=newArrayList18){names.add(user.getName().toUpperCase());}}这样的代码不仅难以维护，还容易引入bug
跟我一起学 Python 数据处理（三十九）：数据库世界的探秘之旅 lilye66 python 数据库开发语言决策树随机森林数据结构线性回归
跟我一起学Python数据处理（三十九）：数据库世界的探秘之旅在数据的广袤天地中，我们始终秉持着共同学习、共同进步的理念，希望能引领大家逐步深入Python数据处理的核心领域。上一篇博客我们了解了数据存储的基础要点和案例实战，今天将聚焦于数据库这个关键部分，为大家详细剖析其奥秘。一、关系型数据库深度解析关系型数据库如MySQL和PostgreSQL，对于具有复杂关联性的数据处理十分有效。就像一个庞
Spring中的@Cacheable 注解基本知识点码农研究僧 Java spring java 后端 Cacheable
目录前言1.基本知识2.实战详解前言找工作，来万码优才：#小程序://万码优才/r6rqmzDaXpYkJZF对于Java的基本知识推荐阅读：java框架零基础从入门到精通的学习路线附开源项目面经等（超全）【Java项目】实战CRUD的功能整理（持续更新）1.基本知识@Cacheable是Spring提供的注解，用于声明一个方法的返回结果会被缓存当方法被调用时，Spring会先检查缓存中是否存在该
详解JAVA中的@ApiModel和@ApiModelProperty注解码农研究僧 Java java python 开发语言
目录前言1.@ApiModel注解2.@ApiModelProperty注解3.实战前言在Java中，@ApiModel和@ApiModelProperty是Swagger框架（用于API文档的工具）提供的注解，用于增强API文档的生成和展示。这两者搭配使用更佳使用两者注解，需导入swagger的依赖包：io.swagger.core.v3swagger-annotations2.2.19主要作用
微信小程序加载H5页面及与H5页面通信的实战教程 Jiaberrr 小程序微信小程序前端 javascript webview
在微信小程序的开发过程中，我们有时需要在小程序中嵌入H5页面。本文将详细介绍如何在微信小程序中通过webview加载H5页面，并实现小程序与H5页面的通信。一、准备工作搭建微信小程序开发环境，具体步骤请参考官方文档：https://developers.weixin.qq.com/miniprogram/dev/framework/quickstart.html准备一个H5页面，可以是本地文件或线
Redis 中 TTL 的基本知识与禁用缓存键的实现策略（Java）码农研究僧 Java 缓存 redis java 缓存策略
目录前言1.基本知识2.Java代码前言找工作，来万码优才：#小程序://万码优才/r6rqmzDaXpYkJZF单纯学习Redis可以看我前言的Java基本知识路线！！对于Java的基本知识推荐阅读：java框架零基础从入门到精通的学习路线附开源项目面经等（超全）【Java项目】实战CRUD的功能整理（持续更新）在Java项目中，Redis配置了全局的TTL时间，后续想到可以通过设定单个key的
红队工具使用全解析：揭开网络安全神秘面纱一角渗透小白鼠 web安全安全
红队工具使用全解析：揭开网络安全神秘面纱一角B站红队公益课：https://space.bilibili.com/350329294学习网盘资源链接：https://pan.quark.cn/s/4079487939e8嘿，各位网络安全爱好者们！在风云变幻的网络安全战场上，红队宛如一支神秘且精锐的特种兵部队，手持一系列超厉害的工具，冲锋陷阵在虚拟世界，挖掘系统潜藏漏洞，模拟实战攻击情境，为筑牢网络
Docker容器管理实战：从入门到精通 docker
在当今的软件开发与部署中，Docker作为一种流行的容器化技术，极大地简化了应用的打包、分发和运行过程。接下来，就带你深入了解Docker容器管理的实战技巧。安装Docker非常简单，以Ubuntu系统为例，只需在终端执行几条命令，就能快速完成安装。安装完成后，便可以开启容器之旅。首先是镜像的获取，通过dockerpull命令，如dockerpullubuntu，就能从DockerHub上拉取Ub
从头到尾快速学习一遍Linux，高级工程师多年实践实战经验精华总结和实例示例，第七章：Linux精通学习路线及各个大厂优秀的学习资料代码讲故事服务器学习 linux 服务器运维网络资料教程
从头到尾快速学习一遍Linux，高级工程师多年实践实战经验精华总结和实例示例，第七章：Linux精通学习路线及各个大厂优秀的学习资料。Linux精通学习路线及各个大厂优秀的学习资料看见好东西先收集起来，待时间充裕集中消灭他们。tcp_wrappers################################Linux系统下的防火墙主要分为两层：第一层是对IP进行过滤的iptables，第二层
Electron 开发者的 Tauri 2.0 实战指南：快速入门与思维转换
作为一名经验丰富的Electron开发者，当你第一次接触Tauri时，可能会感到有些不适应。本文将帮助你快速理解Tauri2.0的核心概念，并通过实际案例完成从Electron到Tauri的思维转换。架构对比Electron的架构在Electron中，我们习惯了以下架构：Electron应用├──主进程(MainProcess)│├──窗口管理│├──系统API调用│└──IPC通信└──渲染进程
Vue 开发者的 React 实战指南：表单处理篇
作为Vue开发者，在迁移到React开发时，表单处理的差异是一个重要的适应点。本文将从Vue开发者熟悉的角度出发，详细介绍React中的表单处理方式和最佳实践。基础表单处理对比Vue的表单处理在Vue中，我们习惯使用v-model进行双向绑定：用户名：密码：记住我：登录exportdefault{data(){return{form:{username:'',password:'',remembe
java的(PO,VO,TO,BO,DAO,POJO) Cb123456 VO TO BO POJO DAO
转: http://www.cnblogs.com/yxnchinahlj/archive/2012/02/24/2366110.html ------------------------------------------------------------------- O/R Mapping 是 Object Relational Mapping（对象关系映
spring ioc原理（看完后大家可以自己写一个spring） aijuans spring
最近，买了本Spring入门书：spring In Action 。大致浏览了下感觉还不错。就是入门了点。Manning的书还是不错的，我虽然不像哪些只看Manning书的人那样专注于Manning,但怀着崇敬的心情和激情通览了一遍。又一次接受了IOC 、DI、AOP等Spring核心概念。先就IOC和DI谈一点我的看法。IO
MyEclipse 2014中Customize Persperctive设置无效的解决方法 Kai_Ge MyEclipse2014
高高兴兴下载个MyEclipse2014，发现工具条上多了个手机开发的按钮，心生不爽就想弄掉他！结果发现Customize Persperctive失效！！有说更新下就好了，可是国内Myeclipse访问不了，何谈更新... so~这里提供了更新后的一下jar包，给大家使用！ 1、将9个jar复制到myeclipse安装目录\plugins中 2、删除和这9个jar同包名但是版本号较
SpringMvc上传 120153216 springMVC
@RequestMapping(value = WebUrlConstant.UPLOADFILE) @ResponseBody public Map<String, Object> uploadFile(HttpServletRequest request,HttpServletResponse httpresponse) { try { //
Javascript----HTML DOM 事件何必如此 JavaScript html Web
HTML DOM 事件允许Javascript在HTML文档元素中注册不同事件处理程序。事件通常与函数结合使用，函数不会在事件发生前被执行！注：DOM：指明使用的 DOM 属性级别。 1.鼠标事件属性
动态绑定和删除onclick事件 357029540 JavaScript jquery
因为对JQUERY和JS的动态绑定事件的不熟悉，今天花了好久的时间才把动态绑定和删除onclick事件搞定!现在分享下我的过程。在我的查询页面，我将我的onclick事件绑定到了tr标签上同时传入当前行(this值)参数，这样可以在点击行上的任意地方时可以选中checkbox，但是在我的某一列上也有一个onclick事件是用于下载附件的，当
HttpClient|HttpClient请求详解 7454103 apache 应用服务器网络协议网络应用 Security
HttpClient 是 Apache Jakarta Common 下的子项目，可以用来提供高效的、最新的、功能丰富的支持 HTTP 协议的客户端编程工具包，并且它支持 HTTP 协议最新的版本和建议。本文首先介绍 HTTPClient，然后根据作者实际工作经验给出了一些常见问题的解决方法。HTTP 协议可能是现在 Internet 上使用得最多、最重要的协议了，越来越多的 Java 应用程序需
递归逐层统计树形结构数据 darkranger 数据结构
将集合递归获取树形结构: /** * * 递归获取数据 * @param alist:所有分类 * @param subjname:对应统计的项目名称 * @param pk:对应项目主键 * @param reportList: 最后统计的结果集 * @param count:项目级别 */ public void getReportVO(Arr
访问WEB-INF下使用frameset标签页面出错的原因 aijuans struts2
<frameset rows="61,*,24" cols="*" framespacing="0" frameborder="no" border="0">
MAVEN常用命令 avords
Maven库： http://repo2.maven.org/maven2/ Maven依赖查询： http://mvnrepository.com/ Maven常用命令： 1. 创建Maven的普通java项目： mvn archetype:create -DgroupId=packageName
PHP如果自带一个小型的web服务器就好了 houxinyou apache 应用服务器 Web PHP 脚本
最近单位用PHP做网站，感觉PHP挺好的，不过有一些地方不太习惯，比如，环境搭建。PHP本身就是一个网站后台脚本，但用PHP做程序时还要下载apache，配置起来也不太很方便，虽然有好多配置好的apache+php+mysq的环境，但用起来总是心里不太舒服，因为我要的只是一个开发环境，如果是真实的运行环境，下个apahe也无所谓，但只是一个开发环境，总有一种杀鸡用牛刀的感觉。如果php自己的程序中
NoSQL数据库之Redis数据库管理(list类型) bijian1013 redis 数据库 NoSQL
3.list类型及操作 List是一个链表结构，主要功能是push、pop、获取一个范围的所有值等等，操作key理解为链表的名字。Redis的list类型其实就是一个每个子元素都是string类型的双向链表。我们可以通过push、pop操作从链表的头部或者尾部添加删除元素，这样list既可以作为栈，又可以作为队列。 &nbs
谁在用Hadoop？ bingyingao hadoop 数据挖掘公司应用场景
Hadoop技术的应用已经十分广泛了，而我是最近才开始对它有所了解，它在大数据领域的出色表现也让我产生了兴趣。浏览了他的官网，其中有一个页面专门介绍目前世界上有哪些公司在用Hadoop，这些公司涵盖各行各业，不乏一些大公司如alibaba,ebay,amazon,google,facebook,adobe等，主要用于日志分析、数据挖掘、机器学习、构建索引、业务报表等场景,这更加激发了学习它的热情。
【Spark七十六】Spark计算结果存到MySQL bit1129 mysql
package spark.examples.db import java.sql.{PreparedStatement, Connection, DriverManager} import com.mysql.jdbc.Driver import org.apache.spark.{SparkContext, SparkConf} object SparkMySQLInteg
Scala: JVM上的函数编程 bookjovi scala erlang haskell
说Scala是JVM上的函数编程一点也不为过，Scala把面向对象和函数型编程这两种主流编程范式结合了起来，对于熟悉各种编程范式的人而言Scala并没有带来太多革新的编程思想，scala主要的有点在于Java庞大的package优势，这样也就弥补了JVM平台上函数型编程的缺失，MS家.net上已经有了F#，JVM怎么能不跟上呢？对本人而言
jar打成exe bro_feng java jar exe
今天要把jar包打成exe，jsmooth和exe4j都用了。遇见几个问题。记录一下。两个软件都很好使，网上都有图片教程，都挺不错。首先肯定是要用自己的jre的，不然不能通用，其次别忘了把需要的lib放到classPath中。困扰我很久的一个问题是，我自己打包成功后，在一个同事的没有装jdk的电脑上运行，就是不行，报错jvm.dll为无效的windows映像，如截图最后发现
读《研磨设计模式》-代码笔记-策略模式-Strategy bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* 策略模式定义了一系列的算法，并将每一个算法封装起来，而且使它们还可以相互替换。策略模式让算法独立于使用它的客户而独立变化简单理解： 1、将不同的策略提炼出一个共同接口。这是容易的，因为不同的策略，只是算法不同，需要传递的参数
cmd命令值cvfM命令 chenyu19891124 cmd
cmd命令还真是强大啊。今天发现jar -cvfM aa.rar @aaalist 就这行命令可以根据aaalist取出相应的文件例如：在d：\workspace\prpall\test.java 有这样一个文件，现在想要将这个文件打成一个包。运行如下命令即可比如在d：\wor
OpenJWeb(1.8) Java Web应用快速开发平台 comsci java 框架 Web 项目管理企业应用
OpenJWeb(1.8) Java Web应用快速开发平台的作者是我们技术联盟的成员，他最近推出了新版本的快速应用开发平台 OpenJWeb(1.8)，我帮他做做宣传 OpenJWeb快速开发平台以快速开发为核心，整合先进的java 开源框架，本着自主开发+应用集成相结合的原则，旨在为政府、企事业单位、软件公司等平台用户提供一个架构透
Python 报错：IndentationError: unexpected indent daizj python tab 空格缩进
IndentationError: unexpected indent 是缩进的问题，也有可能是tab和空格混用啦 Python开发者有意让违反了缩进规则的程序不能通过编译，以此来强制程序员养成良好的编程习惯。并且在Python语言里，缩进而非花括号或者某种关键字，被用于表示语句块的开始和退出。增加缩进表示语句块的开
HttpClient 超时设置 dongwei_6688 httpclient
HttpClient中的超时设置包含两个部分： 1. 建立连接超时，是指在httpclient客户端和服务器端建立连接过程中允许的最大等待时间 2. 读取数据超时，是指在建立连接后，等待读取服务器端的响应数据时允许的最大等待时间在HttpClient 4.x中如下设置： HttpClient httpclient = new DefaultHttpC
小鱼与波浪 dcj3sjt126com
一条小鱼游出水面看蓝天，偶然间遇到了波浪。　　小鱼便与波浪在海面上游戏，随着波浪上下起伏、汹涌前进。　　小鱼在波浪里兴奋得大叫：“你每天都过着这么刺激的生活吗？简直太棒了。”　　波浪说：“岂只每天过这样的生活，几乎每一刻都这么刺激！还有更刺激的，要有潮汐变化，或者狂风暴雨，那才是兴奋得心脏都会跳出来。”　　小鱼说：“真希望我也能变成一个波浪，每天随着风雨、潮汐流动，不知道有多么好！”　　很快，小鱼
Error Code: 1175 You are using safe update mode and you tried to update a table dcj3sjt126com mysql
快速高效用：SET SQL_SAFE_UPDATES = 0；下面的就不要看了！今日用MySQL Workbench进行数据库的管理更新时，执行一个更新的语句碰到以下错误提示： Error Code: 1175 You are using safe update mode and you tried to update a table without a WHERE that
枚举类型详细介绍及方法定义 gaomysion enum javaee
转发 http://developer.51cto.com/art/201107/275031.htm 枚举其实就是一种类型，跟int, char 这种差不多，就是定义变量时限制输入的，你只能够赋enum里面规定的值。建议大家可以看看，这两篇文章，《java枚举类型入门》和《C++的中的结构体和枚举》，供大家参考。枚举类型是JDK5.0的新特征。Sun引进了一个全新的关键字enum
Merge Sorted Array hcx2013 array
Given two sorted integer arrays nums1 and nums2, merge nums2 into nums1 as one sorted array. Note:You may assume that nums1 has enough space (size that is
Expression Language 3.0新特性 jinnianshilongnian el 3.0
Expression Language 3.0表达式语言规范最终版从2013-4-29发布到现在已经非常久的时间了；目前如Tomcat 8、Jetty 9、GlasshFish 4已经支持EL 3.0。新特性包括：如字符串拼接操作符、赋值、分号操作符、对象方法调用、Lambda表达式、静态字段/方法调用、构造器调用、Java8集合操作。目前Glassfish 4/Jetty实现最好，对大多数新特性
超越算法来看待个性化推荐 liyonghui160com 超越算法来看待个性化推荐
一提到个性化推荐，大家一般会想到协同过滤、文本相似等推荐算法，或是更高阶的模型推荐算法，百度的张栋说过，推荐40%取决于UI、30%取决于数据、20%取决于背景知识，虽然本人不是很认同这种比例，但推荐系统中，推荐算法起的作用起的作用是非常有限的。就像任何
写给Javascript初学者的小小建议 pda158 JavaScript
　　一般初学JavaScript的时候最头痛的就是浏览器兼容问题。在Firefox下面好好的代码放到IE就不能显示了，又或者是在IE能正常显示的代码在firefox又报错了。　　如果你正初学JavaScript并有着一样的处境的话建议你：初学JavaScript的时候无视DOM和BOM的兼容性，将更多的时间花在了解语言本身（ECMAScript）。只在特定浏览器编写代码（Chrome/Fi
Java 枚举 ShihLei java enum 枚举
注：文章内容大量借鉴使用网上的资料，可惜没有记录参考地址，只能再传对作者说声抱歉并表示感谢！一基础 1）语法枚举类型只能有私有构造器（这样做可以保证客户代码没有办法新建一个enum的实例）枚举实例必须最先定义 2）特性 &nb
Java SE 6 HotSpot虚拟机的垃圾回收机制 uuhorse java HotSpot GC 垃圾回收 VM
官方资料，关于Java SE 6 HotSpot虚拟机的garbage Collection，非常全，英文。 http://www.oracle.com/technetwork/java/javase/gc-tuning-6-140523.html Java SE 6 HotSpot[tm] Virtual Machine Garbage Collection Tuning &

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他