CnosDB

高效数据传输：轻松上手将Kafka实时数据接入CnosDB

本篇我们将主要介绍如何在 Ubuntu 22.04.2 LTS 环境下，实现一个Kafka+Telegraf+CnosDB 同步实时获取流数据并存储的方案。在本次操作中，CnosDB 版本是2.3.0，Kafka 版本是2.5.1，Telegraf 版本是1.27.1

随着越来越多的应用程序架构转向微服务或无服务器结构，应用程序和服务的数量每天都在增加。用户既可以通过实时聚合，也可以通过输出为测量或指标的计算，来处理数量不断增加的时间序列数据。面对产生的海量数据，用户可以通过多种方式来捕获和观察系统中数据的变化，在云原生环境中，最流行的一种是使用事件。

Apache Kafka是一个耐用、高性能的消息系统，也被认为是分布式流处理平台。它可应用于许多用例，包括消息传递、数据集成、日志聚合和指标。而就指标而言，仅有消息主干或代理是不够的。虽然 Apache Kafka 很耐用，但它并不是为运行指标和监控查询而设计的。这恰恰正是 CnosDB 的长处。

架构方案

通过将这Kafka、Telegraf和CnosDB 三者结合起来，可以实现数据的完整流程：

数据生成：使用传感器、设备或其他数据源产生数据，并将其发送到Kafka主题。
Kafka 消息队列：Kafka 接收并存储数据流，确保数据安全和可靠性。
Telegraf 消费者：Telegraf 作为 Kafka 的消费者，订阅 Kafka 主题并获取数据流。
CnosDB 数据存储：经过预处理的数据由 Telegraf 发送到 CnosDB 中进行时序数据的存储。

整体的应用程序架构如图所示：

Kafka

Apache Kafka 是一个开源分布式流处理平台，它被设计用于处理实时数据流，具有高可靠性、高吞吐量和低延迟的特点，目前已经被大多数公司使用。它的使用方式非常多样化，包括：

流处理：它通过存储实时事件以进行聚合、丰富和处理来提供事件主干。
指标：Apache Kafka 成为许多分布式组件或应用程序（例如微服务）的集中聚合点。这些应用程序可以发送实时指标以供其他平台使用，包括 CnosDB。
数据集成：可以捕获数据和事件更改并将其发送到 Apache Kafka，任何需要对这些更改采取行动的应用程序都可以使用它们。
日志聚合：Apache Kafka 可以充当日志流平台的消息主干，将日志块转换为数据流。

几个核心概念

实例（Broker）：Kafka的Broker是Kafka集群中的服务器节点，负责存储和转发消息，提供高可用性、容错性和可靠性。
主题（Topic）：Apache Kafka 中的 topic ，是逻辑存储单元，就像关系数据库的表一样。主题通过分区通过代理进行分发，提供可扩展性和弹性。
生产者（Producer）：生产者将消息发布到Kafka的指定主题。生产者可以选择将消息发送到特定的分区，也可以让Kafka自动决定分配策略。
消费者（Consumer）：消费者从指定主题的一个或多个分区中读取消息。消费者可以以不同的方式进行组织，如单播、多播、消费者组等。
发布-订阅模式：是指生产者将消息发布到一个或多个主题，而消费者可以订阅一个或多个主题，从中接收并处理消息。

简单来说就是，当客户端将数据发送到 Apache Kafka 集群实例时，它必须将其发送到某个主题。

此外，当客户端从 Apache Kafka 集群读取数据时，它必须从主题中读取。向 Apache Kafka 发送数据的客户端成为生产者，而从 Kafka 集群读取数据的客户端则成为消费者。数据流向示意图如下：

注：这里没有引入更复杂的概念，如topic分区、偏移量、消费者组等，用户可自行参考官方指导文档学习：

Kafka：【https://kafka.apache.org/documentation/#gettingStarted】

部署 Kafka

下载并安装Kafka【https://kafka.apache.org/】

1.前提：需确保有 JDK 环境和 Zookeeper 环境，如果没有可以使用下面的命令进行安装：

sudo apt install openjdk-8-jdk
sudo apt install zookeeper

2.下载 Kafka 安装包并解压

wget https://archive.apache.org/dist/kafka/2.5.1/kafka_2.12-2.5.1.tgz
tar -zxvf kafka_2.12-2.5.1.tgz

3.进入解压后的 Kafka 目录

cd  kafka_2.12-2.5.1

4.修改$KAFKA_HOME/config/server.properties的配置文件（可按需修改端口、日志路径等配置信息）

5.保存并关闭编辑器。运行下面的命令来启动Kafka：

bin/kafka-server-start.sh config/server.properties

Kafka 将在后台运行，并通过默认的 9092 端口监听连接。

Telegraf

Telegraf 是一个开源的服务器代理程序，用于收集、处理和传输系统和应用程序的指标数据。Telegraf 支持多种输入插件和输出插件，并且能够与各种不同类型的系统和服务进行集成。它可以从系统统计、日志文件、API 接口、消息队列等多个来源采集指标数据，并将其发送到各种目标，如 CnosDB 、Elasticsearch、Kafka、Prometheus 等。这使得 Telegraf 非常灵活，可适应不同的监控和数据处理场景。

轻量级：Telegraf被设计为一个轻量级的代理程序，对系统资源的占用相对较小，可以高效运行在各种环境中。
插件驱动：Telegraf使用插件来支持各种输入和输出功能。它提供了丰富的插件生态系统，涵盖了众多的系统和服务。用户可以根据自己的需求选择合适的插件来进行指标数据的采集和传输。
数据处理和转换：Telegraf具有灵活的数据处理和转换功能，可以通过插件链（Plugin Chain）来对采集到的指标数据进行过滤、处理、转换和聚合，从而提供更加精确和高级的数据分析。

部署 Telegraf

1.安装 Telegraf

sudo apt-get update && sudo apt-get install telegraf

2.切换到 Telegraf 的默认配置文件所处目录 /etc/telegraf 下

3.在配置文件 telegraf.config 中添加目标 OUTPUT PLUGIN

[[outputs.http]]
  url = "http://127.0.0.1:8902/api/v1/write?db=telegraf"
  timeout = "5s"
  method = "POST"
  username = "root"
  password = ""
  data_format = "influx"
  use_batch_format = true
  content_encoding = "identity"
  idle_conn_timeout = 10

按需修改的参数：

url：CnosDB 地址和端口
username：连接 CnosDB 的用户名
password：连接 CnosDB 的用户名对应的密码

注：其余参数可与上述配置示例中保持一致

4.在配置文件中将下面的配置注释放开，可按需修改

[[inputs.kafka_consumer]]
brokers = ["127.0.0.1:9092"]
topics = ["oceanic"]
data_format = "json"

参数：

brokers：Kafka 的 broker list 
topics：指定写入 Kafka 目标的 topic
data_format：写入数据的格式

注：其余参数可与上述配置示例中保持一致

5.启动 Telegraf

telegraf -config /etc/telegraf/telegraf.conf

CnosDB

部署 CnosDB

详细操作请参考： CnosDB 安装

【https://docs.cnosdb.com/zh/latest/start/install.html】

整合

Kafka创建topic

1.进入 kafka 的 bin 文件夹下

2.执行命令，创建 topic

./kafka-topics.sh --create --topic oceanic --bootstrap-server localhost:9092 --partitions 1 --replication-factor 1

Python 模拟写入数据到Kakfa

1.编写代码：

import time
import json
import random


from kafka import KafkaProducer


def random_pressure():
    return round(random.uniform(0, 10), 1)


def random_tempreture():
    return round(random.uniform(0, 100), 1)


def random_visibility():
    return round(random.uniform(0, 100), 1)


def get_json_data():
    data = {}


    data["pressure"] = random_pressure()
    data["temperature"] = random_temp_cels()
    data["visibility"] = random_visibility()


    return json.dumps(data) 


def main():
    producer = KafkaProducer(bootstrap_servers=['ip:9092'])


    for _ in rang(2000):
        json_data = get_json_data()
        producer.send('oceanic', bytes(f'{json_data}','UTF-8'))
        print(f"Sensor data is sent: {json_data}")
        time.sleep(5)




if __name__ == "__main__":
    main()

2.运行Python脚本

python3 test.py

查看 kafka topic 中的数据

1.执行下面查看指定 topic 数据的命令

./kafka-console-consumer.sh --bootstrap-server localhost:9092 --topic oceanic --from-beginning

查看同步到 CnosDB 中的数据

1.使用工具连接到CnosDB

cnosdb-cli

2.切换到指定库

\c public

3.查看数据

select * from kafka_consumer;

补充阅读

1.使用 Telegraf 采集数据并写入 CnosDB:

https://docs.cnosdb.com/zh/latest/versatility/collect/telegraf.html

2.Python 连接器:

https://docs.cnosdb.com/zh/latest/reference/connector/python.html

3.CnosDB 快速开始:

https://docs.cnosdb.com/zh/latest/start/quick_start.html

你可能感兴趣的:(工程师有话说,kafka,分布式)

探秘HarmonyOS驱动平台：开启万物互联新时代大雨淅淅 #HarmonyOS开发 harmonyos 华为
目录一、HarmonyOS驱动平台初印象二、HarmonyOS驱动平台的架构解析三、HarmonyOS驱动框架（HDF）的特点3.1统一外设访问能力3.2驱动开发与管理框架优势3.3组件化的驱动模型四、HarmonyOS驱动平台的技术特性4.1分布式软总线奠定连接基础4.2分布式设备虚拟化整合资源4.3分布式数据管理保障数据流转4.4分布式任务调度优化任务执行五、HarmonyOS驱动平台的应用场
2025年，华为物联网认证还值得考吗？一篇说透！博睿谷IT99_ 华为物联网深度学习
万物互联的时代，一张权威的“通行证”能否照亮职业之路？作为一名深耕IT培训领域的博主，今天咱们聊聊华为物联网认证在2025年的含金量。不吹不黑，只用官方信息和行业现状说话。一、华为物联网认证是什么？简单说，它是华为官方推出的物联网领域专业技术认证体系，聚焦培养符合产业需求的物联网人才。目前核心分为两个等级：1.HCIA-IoT(华为认证物联网工程师)（1）定位：物联网领域入门级认证。（2）目标：普
华为数通认证：适合谁的技术进阶之路？博睿谷IT99_ 华为服务器运维
在当今高度互联的世界里，数据通信网络构成了信息流动的基石。华为数通认证（HuaweiCertifiedICTAssociate/Professional/Expert-Datacom）正是华为公司推出的、针对数据通信网络领域构建、运维与优化的专业能力认证体系。一、划分三个层级，为不同阶段的从业者提供进阶路径1.HCIA-Datacom(华为认证ICT工程师-数据通信)：基础起点。聚焦于中小型网络的
考取华为HCIE-AI有什么用？博睿谷IT99_ 华为人工智能华为认证职业规划
在人工智能技术重塑各行各业的浪潮中，掌握核心AI能力成为专业人士的制胜关键。华为推出的HCIE-AISolutionArchitect（华为认证ICT专家-AI解决方案架构师），正是面向这一领域顶尖人才设立的最高级别认证。主要是为了培养和认证掌握人工智能解决方案架构、设计与应用知识，具备大模型业务场景分析、大模型训练与微调、模型推理部署能力的专家级人才。一、HCIE-AI：专家级能力的权威认证HC
华为物联网认证：开启万物互联的钥匙
在智能家居、智慧工厂、智慧城市逐渐普及的今天，物联网（IoT）技术成为推动数字化转型的核心力量。作为全球领先的ICT解决方案提供商，华为构建了完整的物联网技术认证体系，为行业输送专业人才。本文将带你客观了解华为物联网认证是什么、有哪些等级、以及考取的价值。一、什么是华为物联网认证？华为物联网认证是华为官方推出的物联网领域专业技术认证体系，聚焦物联网基础设施建设与开发能力培养。该认证基于华为云IoT
python以下划线开头的变量名含义 weixin_30359021 python
Python核心风格：避免用下划线作为变量名的开始。因为下划线对解释器有特殊的意义，而且是内建标识符所使用的符号，我们建议程序员避免用下划线作为变量名的开始。一般来讲，变量名_xxx被看作是“私有的”，在模块或类外不可以使用。当变量是私有的时候，用_xxx来表示变量是很好的习惯。因为变量名__xxx__对Python来说有特殊含义，对于普通的变量应当避免这种命名风格。"单下划线""单下划线"开始的
Exception: This server is not the leader for that topic-partition. uplinker java java kafka
异常：2016081718:58:48ERRORcom.xxx.lac.service.impl.ComparePriceServiceImpl-307kafka-producer-network-thread|lac_compare_price_service_producer_3-sendCompleteexecptionThisserverisnottheleaderforthattopic
《量化开发》系列第 1 篇：金融知识基础入门指南（附 GitHub 学习项目） Natsume1710 金融 github 学习
本文为《量化开发学习路线与知识点》专栏的第一篇参考项目：Awesome-QuantDev-Learn量化金融是金融经济学与计算机科学交叉融合形成的新兴行业，越来越多的技术人才正积极投身其中。然而，面对纷繁复杂的金融概念与专业的开发技能，许多人常常感到无从下手。本专栏将为C++/Python工程师、自学者、量化岗求职者提供系统清晰的学习路径。本篇文章聚焦于量化开发所需的金融基础知识，帮助技术人打下坚
Pytest自动化测试框架pytest-xdist分布式测试插件（超详细）一个小小的测试人 pytest 分布式职场和发展功能测试软件测试自动化测试
平常我们功能测试用例非常多时，比如有1千条用例，假设每个用例执行需要1分钟，如果单个测试人员执行需要1000分钟才能跑完；当项目非常紧急时，会需要协调多个测试资源来把任务分成两部分，于是执行时间缩短一半，如果有10个小伙伴，那么执行时间就会变成十分之一，大大节省了测试时间；为了节省项目测试时间，10个测试同时并行测试，这就是一种分布式场景；同样道理，当我们自动化测试用例非常多的时候，一条条按顺序执
分布式系统的强一致性基石：Raft共识算法深度解析与技术实现 LCG元 Python 信息系统共识算法 python 区块链
目录一、Raft设计哲学与核心概念1.1可理解性设计三原则1.2核心数据结构定义二、核心机制实现解析2.1领导选举机制2.2日志复制机制三、异常处理与工程优化3.1典型故障场景处理3.2性能优化策略四、工业级实现关键代码4.1日志一致性检查4.2状态机应用逻辑五、Raft与其他协议对比六、生产环境最佳实践在分布式系统领域，Raft算法通过强领导者模型和模块化分解设计，将复杂的一致性难题转化为可落地
二分查找快速理解
作为数据结构接触到的入门第一个算法，很多人对它不以为然，但是作为小白学习还是很有必要的，循序渐进，打开算法的大门假如你要登录王者荣耀，当你这样做时，QQ或者微信必须核实你是否有其游戏的账户，因此在数据库中查找你的用户名和账号。如果你的用户名为king，腾讯可以从以A开头的部分开始查找，但更合乎逻辑的做法是从中间开始查找。二分查找是一种算法，要求输入是一个有序的元素列表，我们结合程序的话，如果要查找
自学Python笔记开篇奔跑吧茄子 python
自学Python笔记开篇突然喜欢上了Python，大体研究了一下，写了一个excel数据比对的小工具，边学边写，收获很多。这期间学习了xlrd、openpyxl、pandas处理excel文件的基本常识，有时间整理一下，对菜鸟入门或许有帮助。
高效执行自动化用例：分布式执行工具pytest-xdist实战测试界兮兮软件测试自动化分布式 pytest 压力测试单元测试功能测试程序人生
01声明在介绍pytest-xdist时，不讲任何原理，需要看原理的请移至官方：pytest-xdist·PyPI当我们自动化测试用例非常多的时候，一条条按顺序执行会非常慢，pytest-xdist的出现就是为了让自动化测试用例可以分布式执行，从而节省自动化测试时间，pytest-xdist是属于进程级别的并发。pytest-xdist插件在测试过程中可以使我们的测试用例一起并行测试，运行情况是根
环境搭建：从零开始——Windows 环境下 Kafka 集群的 Docker 安装与配置全指南 DR. BULL ELECTRONICS #环境搭建 windows kafka docker
环境搭建：从零开始——Windows环境下Kafka集群的Docker安装与配置全指南本博客详细介绍了如何在Windows环境下使用Docker安装和配置Kafka集群。通过提供具体的操作步骤和命令示例，从零开始帮助用户配置Docker、启动Kafka集群、并在SpringBoot应用程序中使用Kafka进行消息传递。该指南包括Docker安装、Kafka集群搭建、启动Kafka服务、创建主题、配
【Java入门】入门第一天-开发环境的搭建-为什么要搭建环境-搭建步骤头秃仙女 java jvm
了解过Java的发展历史之后，相信大家对Java是什么有了一定的了解。那么现在我们就可以开始Java的入门第一步啦---下载软件，搭建环境。首先了解一下JVM、JRE、JDKJVM(JavaVirtualMachine):Java虚拟机，Java程序运行在其中.java语言编译程序只需生成在Java虚拟机上运行的目标代码(字节码)，就可以在多种平台上不加修改地运行.JVM对上层的Java源文件是不
【软考中级·软件评测师】下午题·面向对象测试之架构考点全析：分层、分布式、微内核与事件驱动 June bug 软考中级：软件评测师知识架构分布式职场和发展学习方法经验分享软考测试
一、分层架构：分层独立与质量特性的双向约束分层架构通过“垂直分层（表示层→服务层→业务逻辑层→数据层）”实现职责隔离，是Web应用、企业级系统的主流架构模式。1.父类成员函数重测场景子类继承父类时，若父类已测成员函数需在子类重测，触发条件分两类：场景1：继承的成员函数在子类中被修改（如逻辑分支新增、算法替换）；场景2：成员函数调用了被修改的子类成员函数（父类函数依赖子类重写方法，需验证调用逻辑）。
InteraXon 与 Muse 脑波头环：开启脑机交互与脑健康新时代 Scivaro_陈耀栋 InteraXon 脑机接口人因工程人工智能 EEG InteraXon Muse 脑电
作者：科采通|CSDN专栏一、公司简介InteraXon成立于2009年，总部位于加拿大多伦多，是一家专注于神经科技（Neurotechnology）的创新企业。其旗舰产品Muse脑波头环，是一款面向普通消费者和科研人员的脑电（EEG）设备，致力于通过脑机接口（BCI）技术帮助用户提升认知功能、减轻压力和改善睡眠。InteraXon由神经科学家、工程师和设计师组成的小团队起步，现已发展为拥有全球用
通过range和view来解实际应用题写写闲篇儿数据结构
我们先来看题：有n座山排成一列，每座山都有一个高度。给你一个整数数组height，其中height[i]表示第i座山的高度，再给你一个整数threshold。对于下标不为0的一座山，如果它左侧相邻的山的高度严格大于threshold，那么我们称它是稳定的。我们定义下标为0的山不是稳定的。请你返回一个数组，包含所有稳定山的下标，你可以以任意顺序返回下标数组。经过对题意的分析，可以分析出三个关键要点。
heic图像转jpg有什么简单的方法？苹果手机图片转成常用图片这辈子谁会真的心疼你 heic转jpg heic转换 heic格式转换
heic图片是苹果手机上专用的一种图片格式，在特定的手机上可以正常展示。如果放到别的设备上就不能正常查看。为了顺利分享图片，所以我们需要把heic转换成常用的jpg图片格式。使用编程的方式实现转换。示例代码：importosimportargparsefromPILimportImageimportpillow_heif#注册HEIF图像插件pillow_heif.register_heif_op
P2P内网穿透之Nat类型介绍及Nat类型检测16种NAT组合穿透操作指南整理左眼看成爱服务器技术 p2p 服务器网络协议 NAT udp穿透
目录根据RFC3489规定Nat共分以下类型：第一部分：NAT类型介绍FullConeNAT:RestrictedConeNAT:PortRestrictedConeNAT:SymmetricNAT:特殊情况：第二部分：STUNNAT类型检测前提条件：第一步：检测客户端是否有能力进行UDP通信以及客户端是否位于NAT后？第二步：检测客户端NAT是否是FullConeNAT？第三步：检测客户端NAT
开发个直播APP需要多少钱？京南科技夜微凉其他
直播行业的盛行，也使得直播软件受到了众多企业的欢迎，因此，想要制作该软件实现流量变现的需求量也在不断递增，因此，开发的费用也成了很多人比较关心的公司，下边我们就这个问题一起来了解一下吧。1、开发方式不同，收费标准就不一样，如开发方已经有了直播程序，并且直播源码已经根据客户需求做好了二次开发，这样原有的直播程序就不需要更改，消耗的时间和人力成本就会下降，在软件搭建完成后，如果客户需要购买源码，那整套
leedCode：地图分析卖报的火柴人算法 java
题目：你现在手里有一份大小为nxn的网格grid，上面的每个单元格都用0和1标记好了。其中0代表海洋，1代表陆地。请你找出一个海洋单元格，这个海洋单元格到离它最近的陆地单元格的距离是最大的，并返回该距离。如果网格上只有陆地或者海洋，请返回-1。我们这里说的距离是「曼哈顿距离」（ManhattanDistance）：(x0,y0)和(x1,y1)这两个单元格之间的距离是|x0-x1|+|y0-y1|
Linux云计算和云计算运维的区别! 老男孩IT教育 Linux 云计算
Linux云计算和云计算运维对于很多人来讲并不陌生，而且它们都涉及到云计算技术，那么二者之间有何区别?主要区别在于职责、技能要求、工作领域和发展趋势，接下来通过这篇文章来看看吧。职责与技能要求：Linux云计算的工作内容主要包括公司运维团队和运维系统的建设，制定并不断优化各项工作流程，深入了解各种云计算产品，建立运维规范，保证运维质量。此外，还需要熟练掌握Linux操作系统和相关命令行工具，以及网
2025年中总结 Just Jump 人生经历思考反思认知方法 2025年中总结
2025年中总结。一如往年惯例，总结近半年工作中的体悟和经验。一、把大而难的事拆解成小而具体的小目标。专注解决小目标，每周迭代交付，先完成再完善。1.1把大任务拆解成具体可执行的小目标2025年5月起我开始做大模型相关的技术调研、技术升级和开发工作。传统的机器学习、深度学习算法和大模型的算法在技术知识上还是有很大的差异的。想要快速转型使用大模型做开发、训练，是需要些时间和精力投入的，这并不是一个简
深入了解大数据领域Zookeeper的ACL权限管理 AGI大模型与大数据研究院大数据 zookeeper wpf ai
深入了解大数据领域Zookeeper的ACL权限管理关键词：Zookeeper、ACL权限管理、大数据安全、分布式系统、访问控制、权限模型、数据保护摘要：本文深入探讨了Zookeeper中的ACL(AccessControlList)权限管理系统。作为分布式协调服务的核心组件，Zookeeper的ACL机制对于保障大数据环境中的数据安全至关重要。文章将从基础概念出发，详细解析ZookeeperAC
Mac 安装 Xcode工具软件
安装Xcode工具软件1.安装Xcode有2种方式1）直接在Appstore中搜索xcode，下载安装。这种方式比较简单粗暴，推荐2）官方的网址下载2.安装不当可能出现的问题1.安装Xcode有2种方式1）直接在Appstore中搜索xcode，下载安装。这种方式比较简单粗暴，推荐2）官方的网址下载链接奉上：https://developer.apple.com/download/more/这个过
【PaddleOCR】快速集成 PP-OCRv5 的 Python 实战秘籍--- PaddleOCR实例化 OCR 对象的参数介绍云天徽上 PaddleOCR python ocr 开发语言人工智能文字识别
博主简介：曾任某智慧城市类企业算法总监，目前在美国市场的物流公司从事高级算法工程师一职，深耕人工智能领域，精通python数据挖掘、可视化、机器学习等，发表过AI相关的专利并多次在AI类比赛中获奖。CSDN人工智能领域的优质创作者，提供AI相关的技术咨询、项目开发和个性化解决方案等服务，如有需要请站内私信或者联系任意文章底部的的VX名片（ID：xf982831907）博主粉丝群介绍：①群内初中生、
C++必看：C++构造函数的初始化顺序 Littlewith C++的那些事儿 c++开发语言服务器 c语言
关键规则如果派生类有基类（单继承或多继承），基类的构造函数会首先被调用。1.对基类进行处理多继承时，按照派生类继承列表中声明的顺序（从左到右）依次调用基类的构造函数。如果有虚继承，虚基类的构造函数优先于非虚基类调用，且只调用一次。虚基类只在最远派生类中进行处理，并且只有最远派生类调用，其他虚继承的派生类调用被忽略，并且只执行一次2.对成员对象进行处理在基类构造函数调用完成后，派生类中声明的成员对象
Java流程控制while循环详解思诚代码块 Java系列笔记+源码展示 java 开发语言后端 while循环
大家好，我来给大家分享一下Java流程while循环在之前讲解的if选择结构当中，程序都是执行一遍就结束了，这样子在真实环境中肯定不行，顺序结构的东西只可以执行一次，而想让一个东西重复的执行，循环结构就解释了这个问题在Java当中，循环结构有三种1.while循环2.do…while循环3.for循环在Java5中引入了一种主要用于数值的增加型for循环这篇博客，主要讲解while循环while是
场景题：有40亿个QQ号如何去重？仅1GB内存卷福同学社招面试面试阿里云京东云 java
场景题也有一些套路可以考虑，比如去重、判断给定数据是否存在1.大数据去重1.1现在有40亿个QQ号如何去重？仅1GB内存参考链接：https://juejin.cn/post/7396332696660131849介绍2种方法：Bitmap和布隆过滤器方法一：Bitmap首先介绍下什么是位图Bitmap位图是使用bit数组表示的，它只存储0或者1，因此我们可以把全部的QQ号放到位图中，当index
ASM系列五利用TreeApi 解析生成Class lijingyao8206 ASM 字节码动态生成 ClassNode TreeAPI
前面CoreApi的介绍部分基本涵盖了ASMCore包下面的主要API及功能，其中还有一部分关于MetaData的解析和生成就不再赘述。这篇开始介绍ASM另一部分主要的Api。TreeApi。这一部分源码是关联的asm-tree-5.0.4的版本。在介绍前，先要知道一点， Tree工程的接口基本可以完
链表树——复合数据结构应用实例 bardo 数据结构树型结构表结构设计链表菜单排序
我们清楚：数据库设计中，表结构设计的好坏，直接影响程序的复杂度。所以，本文就无限级分类（目录）树与链表的复合在表设计中的应用进行探讨。当然，什么是树，什么是链表，这里不作介绍。有兴趣可以去看相关的教材。需求简介：经常遇到这样的需求，我们希望能将保存在数据库中的树结构能够按确定的顺序读出来。比如，多级菜单、组织结构、商品分类。更具体的，我们希望某个二级菜单在这一级别中就是第一个。虽然它是最后
为啥要用位运算代替取模呢 chenchao051 位运算哈希汇编
在hash中查找key的时候，经常会发现用&取代%，先看两段代码吧， JDK6中的HashMap中的indexFor方法： /** * Returns index for hash code h. */ static int indexFor(int h, int length) {
最近的情况麦田的设计者生活感悟计划软考想
今天是2015年4月27号整理一下最近的思绪以及要完成的任务 1、最近在驾校科目二练车，每周四天，练三周。其实做什么都要用心，追求合理的途径解决。为
PHP去掉字符串中最后一个字符的方法 IT独行者 PHP 字符串
今天在PHP项目开发中遇到一个需求，去掉字符串中的最后一个字符原字符串1,2,3,4,5,6, 去掉最后一个字符","，最终结果为1,2,3,4,5,6 代码如下： $str = "1,2,3,4,5,6,"; $newstr = substr($str,0,strlen($str)-1); echo $newstr;
hadoop在linux上单机安装过程 _wy_ linux hadoop
1、安装JDK jdk版本最好是1.6以上，可以使用执行命令java -version查看当前JAVA版本号，如果报命令不存在或版本比较低，则需要安装一个高版本的JDK，并在/etc/profile的文件末尾，根据本机JDK实际的安装位置加上以下几行： export JAVA_HOME=/usr/java/jdk1.7.0_25
JAVA进阶----分布式事务的一种简单处理方法无量多系统交互分布式事务
每个方法都是原子操作：提供第三方服务的系统，要同时提供执行方法和对应的回滚方法 A系统调用B,C,D系统完成分布式事务 =========执行开始======== A.aa(); try { B.bb(); } catch(Exception e) { A.rollbackAa(); } try { C.cc(); } catch(Excep
安墨移动广告：移动DSP厚积薄发引领未来广告业发展命脉矮蛋蛋 hadoop 互联网
　　“谁掌握了强大的DSP技术，谁将引领未来的广告行业发展命脉。”2014年，移动广告行业的热点非移动DSP莫属。各个圈子都在纷纷谈论，认为移动DSP是行业突破点，一时间许多移动广告联盟风起云涌，竞相推出专属移动DSP产品。　　到底什么是移动DSP呢? 　　DSP(Demand-SidePlatform)，就是需求方平台，为解决广告主投放的各种需求，真正实现人群定位的精准广
myelipse设置 alafqq IP
在一个项目的完整的生命周期中，其维护费用，往往是其开发费用的数倍。因此项目的可维护性、可复用性是衡量一个项目好坏的关键。而注释则是可维护性中必不可少的一环。注释模板导入步骤安装方法：打开eclipse/myeclipse 选择 window-->Preferences-->JAVA-->Code-->Code
java数组百合不是茶 java数组
java数组的声明创建初始化； java支持C语言数组中的每个数都有唯一的一个下标一维数组的定义声明： int[] a = new int[3];声明数组中有三个数int[3] int[] a 中有三个数，下标从0开始，可以同过for来遍历数组中的数
javascript读取表单数据 bijian1013 JavaScript
利用javascript读取表单数据，可以利用以下三种方法获取： 1、通过表单ID属性：var a = document.getElementByIdx_x_x("id"); 2、通过表单名称属性：var b = document.getElementsByName("name"); 3、直接通过表单名字获取：var c = form.content.
探索JUnit4扩展：使用Theory bijian1013 java JUnit Theory
理论机制（Theory）一.为什么要引用理论机制（Theory）当今软件开发中，测试驱动开发（TDD — Test-driven development）越发流行。为什么 TDD 会如此流行呢？因为它确实拥有很多优点，它允许开发人员通过简单的例子来指定和表明他们代码的行为意图。 TDD 的优点： &nb
[Spring Data Mongo一]Spring Mongo Template操作MongoDB bit1129 template
什么是Spring Data Mongo Spring Data MongoDB项目对访问MongoDB的Java客户端API进行了封装，这种封装类似于Spring封装Hibernate和JDBC而提供的HibernateTemplate和JDBCTemplate，主要能力包括 1. 封装客户端跟MongoDB的链接管理 2. 文档-对象映射，通过注解:@Document(collectio
【Kafka八】Zookeeper上关于Kafka的配置信息 bit1129 zookeeper
问题： 1. Kafka的哪些信息记录在Zookeeper中 2. Consumer Group消费的每个Partition的Offset信息存放在什么位置 3. Topic的每个Partition存放在哪个Broker上的信息存放在哪里 4. Producer跟Zookeeper究竟有没有关系？没有关系！！！ //consumers、config、brokers、cont
java OOM内存异常的四种类型及异常与解决方案 ronin47 java OOM 内存异常
　OOM异常的四种类型：　　　　　一：　StackOverflowError ：通常因为递归函数引起（死递归，递归太深）。-Xss 128k 一般够用。　二：　out Of memory: PermGen Space：通常是动态类大多，比如web 服务器自动更新部署时引起。-Xmx
java-实现链表反转-递归和非递归实现 bylijinnan java
20120422更新：对链表中部分节点进行反转操作，这些节点相隔k个： 0->1->2->3->4->5->6->7->8->9 k=2 8->1->6->3->4->5->2->7->0->9 注意1 3 5 7 9 位置是不变的。解法：将链表拆成两部分： a.0-&
Netty源码学习-DelimiterBasedFrameDecoder bylijinnan java netty
看DelimiterBasedFrameDecoder的API，有举例：接收到的ChannelBuffer如下： +--------------+ | ABC\nDEF\r\n | +--------------+ 经过DelimiterBasedFrameDecoder(Delimiters.lineDelimiter())之后，得到： +-----+----
linux的一些命令 -查看cc攻击-网口ip统计等 hotsunshine linux
Linux判断CC攻击命令详解 2011年12月23日 ⁄ 安全 ⁄ 暂无评论查看所有80端口的连接数 netstat -nat|grep -i '80'|wc -l 对连接的IP按连接数量进行排序 netstat -ntu | awk '{print $5}' | cut -d: -f1 | sort | uniq -c | sort -n 查看TCP连接状态 n
Spring获取SessionFactory ctrain sessionFactory
String sql = "select sysdate from dual"; WebApplicationContext wac = ContextLoader.getCurrentWebApplicationContext(); String[] names = wac.getBeanDefinitionNames(); for(int i=0; i&
Hive几种导出数据方式 daizj hive 数据导出
Hive几种导出数据方式 1.拷贝文件如果数据文件恰好是用户需要的格式，那么只需要拷贝文件或文件夹就可以。 hadoop fs –cp source_path target_path 2.导出到本地文件系统 --不能使用insert into local directory来导出数据，会报错 --只能使用
编程之美 dcj3sjt126com 编程 PHP 重构
我个人的 PHP 编程经验中，递归调用常常与静态变量使用。静态变量的含义可以参考 PHP 手册。希望下面的代码，会更有利于对递归以及静态变量的理解 header("Content-type: text/plain"); function static_function () { static $i = 0; if ($i++ < 1
Android保存用户名和密码 dcj3sjt126com android
转自：http://www.2cto.com/kf/201401/272336.html 我们不管在开发一个项目或者使用别人的项目，都有用户登录功能，为了让用户的体验效果更好，我们通常会做一个功能，叫做保存用户，这样做的目地就是为了让用户下一次再使用该程序不会重新输入用户名和密码，这里我使用3种方式来存储用户名和密码 1、通过普通的txt文本存储 2、通过properties属性文件进行存
Oracle 复习笔记之同义词 eksliang Oracle 同义词 Oracle synonym
转载请出自出处：http://eksliang.iteye.com/blog/2098861 1.什么是同义词同义词是现有模式对象的一个别名。概念性的东西，什么是模式呢？创建一个用户，就相应的创建了一个模式。模式是指数据库对象，是对用户所创建的数据对象的总称。模式对象包括表、视图、索引、同义词、序列、过
Ajax案例 gongmeitao Ajax jsp
数据库采用Sql Server2005 项目名称为:Ajax_Demo 1.com.demo.conn包 package com.demo.conn; import java.sql.Connection;import java.sql.DriverManager;import java.sql.SQLException; //获取数据库连接的类public class DBConnec
ASP.NET中Request.RawUrl、Request.Url的区别 hvt .net Web C#asp.net hovertree
如果访问的地址是：http://h.keleyi.com/guestbook/addmessage.aspx?key=hovertree%3C&n=myslider#zonemenu那么Request.Url.ToString() 的值是：http://h.keleyi.com/guestbook/addmessage.aspx?key=hovertree<&
SVG 教程（七）SVG 实例，SVG 参考手册天梯梦 svg
SVG 实例在线实例下面的例子是把SVG代码直接嵌入到HTML代码中。谷歌Chrome，火狐，Internet Explorer9，和Safari都支持。注意：下面的例子将不会在Opera运行，即使Opera支持SVG - 它也不支持SVG在HTML代码中直接使用。 SVG 实例 SVG基本形状一个圆矩形不透明矩形一个矩形不透明2 一个带圆角矩
事务管理 luyulong java spring 编程事务
事物管理 spring事物的好处为不同的事物API提供了一致的编程模型支持声明式事务管理提供比大多数事务API更简单更易于使用的编程式事务管理API 整合spring的各种数据访问抽象 TransactionDefinition 定义了事务策略 int getIsolationLevel()得到当前事务的隔离级别 READ_COMMITTED
基础数据结构和算法十一：Red-black binary search tree sunwinner Algorithm Red-black
The insertion algorithm for 2-3 trees just described is not difficult to understand; now, we will see that it is also not difficult to implement. We will consider a simple representation known
centos同步时间 stunizhengjia linux 集群同步时间
做了集群，时间的同步就显得非常必要了。以下是查到的如何做时间同步。在CentOS 5不再区分客户端和服务器，只要配置了NTP，它就会提供NTP服务。 1)确认已经ntp程序包： # yum install ntp 2)配置时间源（默认就行，不需要修改） # vi /etc/ntp.conf server pool.ntp.o
ITeye 9月技术图书有奖试读获奖名单公布 ITeye管理员 ITeye
ITeye携手博文视点举办的9月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 9月试读活动回顾：http://webmaster.iteye.com/blog/2118112本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《NFC：Arduino、Andro

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他