Rosanu

java服务端监控平台设计

转自：http://blog.arganzheng.me/posts/java-monitor-platform.html

作者：arganzheng

需求

功能性监控(availability)：我们希望能够及时的发现线上的bug，异常。
性能监控与调优(performance)：我们希望能够识别可能的性能瓶颈，并且有数据支撑方便对性能进行调优。比如慢速SQL，缓存命中率，链接池等。
预警报警：我们希望能够第一时间收到线上异常，进行处理。
辅助线上故障定位、故障分析
运维支持：我们系统能够有数据支撑我们进行容量规划、报警和扩容，等。
自动化运维：比如自动扩容；或者根据监控的数据和配置的SLA进行服务降级。等等。

性能监控平台

提供一站式的性能数据收集、计算、存储和展示服务
支持自定义的数据指标名称和数据纬度
提供任意指标任意纬度的实时数据查询

监控对象

1、模块调用监控（URI监控）

URI
调用总数
最大并发
总耗时
平均耗时
最快
最慢
错误数
URIProfile（每个URL访问的具体调用信息，即使Tracer功能）
- URI请求方法
- 类型：Service/URL/DAO/IBATIS
- 总数
- 总耗时
- 平均耗时
- 耗时
- 错误数

2、Spring监控

类
方法
调用次数
总耗时
平均耗时
最大并发
最慢
错误次数

3、数据源监控

链接池中链接数
链接池链接数峰值
池中连接数峰值时间
活跃连接数
活跃连接数峰值

4、JDBC访问统计监控

SQL语句
执行数
执行时间
错误数
读取行数
更行行数

5、Exception监控

异常类型：java.io.IOException, etc.
异常方法：
URI
产生时间
异常数量
堆栈信息

6、JVM监控

Overview
Threading
GC
CPU
Heap

7、其他信息

业务自定义信息，比如订单数量，支持成功数，点击次数，下载次数，等。
Cache命中率
队列大小
...

监控方案设计

监控方案决策

1、每个应用自监控或者统一上报监控？

应用自监控，就是每个应用实例的监控数据存放在应用本身，比如一个Map。然后通过JMX或者其他方式暴露出去。然后开发人员可以通过JConsole或者API（一般是Web界面）得到这些监控数据。比如Druid就是这种做法。访问: hk01-xxxx-mob03.hk01:8090/druid/index.html 得到hk01-xxxx-mob03.hk01:8090这个应用的监控数据。

而统一上报监控方式，就是所有的应用监控数据都上报到监控中心，由监控中心负责接收、分析、合并、存储、可视化查询、报警等逻辑。这种方式是瘦客户端模型，客户端的职责就是埋点上报监控数据。所有的监控逻辑都在中心处理。

结论

自监控的话实现起来简单，并且没有与监控中心的网络交互，性能也会好很多。但是缺点就是缺乏全局的统计和监控。从实用角度来说还是集中式监控好一些。

2、如何避免key冲突？如何区分各个应用实例？

为了监控简单，我们希望监控项是不需要预定义的，监控项是一个 key => value 的形式。其中key是监控项的唯一ID，而value可以为数值类型（比如counter, timeInterval），文本类型（如exceptionMessage）。如果不预定义监控项，那么就是由客户端按需创建key，然后上报监控项，服务器检测如果改监控项不存在就创建，否则根据监控项类型进行相应的操作（叠加 for counter，计算平均值 for timer等）。这个特性很方便客户端监控自动化，但是这样也带来两个可能的问题：

不同的应用，有可能上报一样的key，这样会导致监控项冲突。
想要查看相同的应用的不同实例的上报情况。这种情形主要发生在查找集群短板的时候。Dragoon的监控上也有实例筛选项。

但是最理想的情况是我们既希望能够合并统计,又希望能够在需要的时候区分查看。比如我们希望统计NanTianMen这个应用的所有实例的监控数据,同时又希望能够单独查看每个实例的监控数据。Google和OpenTSDB提供了一种解决方案——对metrics打tags。这样相同key的 metrics会合并统计,又可以根据tags进行区分。对于上面的例子,假如上报的metric含有一个host=xxx的tag和一个port=xxx的tag就可以区分出来了。但是这种情况会导致key对应的数据特别多。根据tag过来会影响查询速度。所以需要trade off。

结论

对于key冲突，可以强制每个应用的客户端必须分配一个独立的appName/projectName `作为前缀。这个是合理的要求，这个appName也有利于区分应用各自的监控。如果处于安全考虑，不同应用还应该有appKey。对于同一个应用不同实例的区分，可以在上报接口增加上报来源作为tag。可以让应用传递参数，也可以自动根据ip来。比如Google和OpenTSDB就是通过对metrics打tags来解决这个问题。这样相同key的 metrics会合并统计,又可以根据tags进行区分。对于上面的例子,假如上报的metric含有一个host=xxx的tag。但是这种情况会导致key对应的数据特别多。根据tag过来会影响查询速度。所以需要tradeoff。比如OpenTSDB就是支持并且要求必须有一个tag，比如host=webserver01。

3、监控中心与客户端应用之间要不要通过本地Agent上报？

采用集中式监控中心，意味着客户端与监控中心有交互。很多监控平台，比如阿里的Dragoon、新浪微博的Watchman，Stackify都是有个本地agent的概念。Agent是OPS安装系统的时候预先安装好，每台机器一个Agent，负责该机器的所有监控数据上报。相当于应用与监控中心之间的一个通讯网关。应用通过JMX获取采集的数据，然后将数据上报给Agent，Agent再统一上报给Monitor。

这样的好处就是Client上报速度非常的快，而且基本不会失败。另外，同一机器上的多个client可以共用一个Agent通讯。而且Agent往往还承当了一个角色，就是主动收集机器监控信息（拉的方式）。缺点是需要预先按照Agent。所有也有很多监控平台是不走Agent的，直接client上报监控中心的方式。比如腾讯的ITIL和模块调用监控、Etsy的StatsD、Google的Cloud Monitor。大部分处于性能的考虑都是走UDP协议的，Google估计是因为是开发平台，走的是HTTP协议(Thus TCP协议)。这种方式简化了对客户端的预设要求和监控逻辑，实现起来比较简单。

结论

如果客户端与监控中心网络顺畅的情况下，绕开agent会简单很多。如果跨机房上报，那么异步化可能是很有必要的。采用agent是一个不错的方案。

4、存储最终状态还是事件序列

比如监控一个URL的请求数，每次+1，最终我们能够得到请求总数。这样的好处是节省存储空间和计算时间。但是由于只有一个最终状态，我们没有办法得到在什么时间段请求数最多。于是有另一种记录方式：对于每次请求都记录一次，而不是简单的+1。然后我们根据所有的签到记录，就可以统计出总请求数，和分布状况。但是缺点也很显然，就是浪费存储，并且每次都需要执行统计计算。

结论

最终状态还是弱了一些，事件序列会好一些，存储可以采用HBase这样的分布式存储系统，性能问题可以采用预聚合等方式解决。Google Cloud Monitor就是采用这个这种方式的：

The Google Cloud Monitoring API lets you access monitoring data for Google Cloud services. The data is organized as metrics and stored as data points that represent information at a specific time or over a specific time period. Examples include the current CPU utilization of your virtual machine, the number of requests received by you web server, or custom metrics you define yourself. A list of data points measured at successive times is called a time series.

5、数据模型

数据模型非常重要，它决定了监控系统的能力。比如我们为什么不使用NOAH，其中一个原因就是NOAH的监控项只是简单的key-value形式。当然，它会自动记录请求源IP。但是其他的参数，比如应用等，就没有办法上报存储了。

根据上面的描述，其实我们的metrics基本就是抽象为带tags/labels标签的key-value格式。这个也是Google Cloud Monitor和OpenTSDB对metrics的定义:

key
timestamp
value - 这个OpenTSDB支持数值型的:integer和floating point。而Google Cloud Monitor支持的类型要丰富一些,见下面描述。
tag(s) - A key/value pair consisting of a tagk (the key) and a tagv (the value). OpenTSDB要求至少要有一个tag。

Google Cloud Mnoitor对Metric进行分类,支持的metricType有(@see metric-types):

cumulative: The value is a total, accumulated since a given start time. For example, the total number of errors detected since a process started.
delta: The value is a change over a specified time period. For example, the number of errors detected in a minute.
gauge: The value is an instantaneous sample of a continuously-varying metric at a specific time. For example, a CPU's current temperature.

而metric的valueType有:

bool: A Boolean value, either "true" or "false".
distribution: A distribution, consisting of a list of buckets and optionally an underflow bucket and an overflow bucket. Each bucket has an upper bound, a lower bound, and a count. The distribution can be used to create a histogram.
double: A double-precision floating-point value.
int64: An integer value in the range [-263..263-1].
string: A Unicode string with backslash escaping.

6、数据存储

因为Events或者Metrics的特殊性，一般都会采用一种专门的存储结构——Distributed time series database。比较有名的开源产品有如下这些:

RRD(round-robin-database): RRDtool使用的底层存储。C语言编写的。性能比较高
whisper: Graphite底层的存储,Python写的
prometheus: An open-source service monitoring system and time series database. 目前只有单机版本。
InfluxDB: 开源distributed time series, metrics, and events database。Go语言编写, 不依赖于其他外部服务。底层支持多种存储引擎，目前是LevelDB, RocksDB, HyberLevelDB和LMDB(0.9之后将只支持Bolt)。
OpenTSDB: 基于HBase编写的Time Series Database

具体可以参考这篇论文: tsdb: A Compressed Database for Time Series。

结论

如果要存储事件序列，那么InfluexDB和OpenTSDB是个非常不错的选择。都是可扩展，分布式存储，文档很详细，还是开源的。 influexDB 0.9.0之后支持tag，使用风格跟Google Cloud Monitor很相似，而且支持String类型。并且最重要的是不需要额外搭建HBase(Thus Hadoop & Zookeeper)，看起来非常值得期待，不过截至今天0.9.0还是RC阶段(非Stable)。OpenTSDBvalue不支持String类型，这意味着日志不能上报到OpenTSDB，需要另外处理。

由于这个比较复杂而且非常重要，我们在后面再单独详细讨论。

7、如果服务器挂掉了，统计数据怎么处理？缓存本地，等服务器起来再发送？还是丢弃？

前期可以先丢弃，后续要缓存起来。受影响比较大的是counter接口。

存储的话，可以考虑使用本地存储在RRD文件或者BDB中，或者消息队列中(RabbitMQ, ie.)，最后再异步批量上报给中心的TSDB。

timestamp   metrics     value   tags..
1366399993 mysql.Binlog_cache_disk_use 0 host=mydb.example.com
1366399993 mysql.Bytes_received 19453687 host=mydb.example.com
1366399993 mysql.Bytes_sent 1238166682 host=mydb.example.com

8、网络通信和协议

如何高性能的接收大量客户端的上报请求。以及使用什么通讯协议。

有几种选择：

HTTP
TCP
UDP: fire and forget, 主要需要注意MTU问题。

同时要考虑同步和异步接口。

应用监控平台概要设计

初步决定采用基于metrics上报的中心监控(无Agent)模式。

业务监控流程

业务对需要监控的地方埋点监控逻辑
监控统计数据通过某种方式上报到监控中心（或者监控中心通过某种方式采集业务监控数据）
监控中心对监控数据提供可视化查询界面，方便查看监控结果
如果监控结果满足配置的报警条件，会自动通知相关的负责人进行处理

监控系统模块

1、Client

主要职责是提供便利的方式让用户添加监控项。包括如下几个模块：

Metrics 监控项：counter, timer, etc.
AOP拦截配置或者注解方便业务埋点(提供缺省的采集实现，业务通过配置开启相应的监控项)
监控数据上报客户端(Reporter)
当监控中心挂掉的时候，将消息先存储在本地(BDB?)

2、监控中心(MonitorCenter)

监控中心应该提供接收客户端监控统计数据的上报接口。接收数据包，并且对这些数据进行存储，分析和可视化。可抽象为一个事件状态机，接收客户端发送的事件，对事件进行响应。主要包含如下模块：

上报API接口服务(事件接收器，receive packets, UDP is prefered)
事件处理器
- EventHandlers, Pipeline模式
- 内建的EventHandler: metrics(increment counters, timer, etc.)、Storage(periodically save the metrics to disk)、Analizer、Notifier
缓存和存储：对事件进行存储(需要考虑性能和容量)
定时任务处理器：Triggers, Actions, Scheduler
可视化界面(dashboards)：Visualizer
配置管理界面，配置事件相应的负责人 && 事件处理工作流程。

上报API接口

Counter接口: A counter is a value that never decreases.

 void increment(String key);
 void increment(String key, Integer delta);

Gauges接口：A gauge is a value that has a discrete value at any given moment, like "heap_used" or "current_temperature".
```
 void addGauge(String key, Double value);
```
Metrics接口：A metric is tracked via distribution, and is usually used for timings. Metrics are collected by tracking the count, min, max, mean (average), and a simple bucket-based histogram of the distribution. This distribution can be used to determine median, 90th percentile, etc.
```
 void addMetric(String key, T value);
```
其中针对时间的监控可以提供一个便利函数：
```
 void addTimeMetric(String key, long timeInMillis);
```
日志上报接口: A label is just a key/value pair of strings, usually used to report a subsystem's state, like "boiler=offline".
```
 void log(LoggerLevel level, String key, String message);
```

They have no real statistical value, but can be used to raise flags in logging and monitoring. 增加一个日志级别，可以根据日志级别来做相应的action。

大概是这样子的使用方式：

import me.arganzheng.study.monitor.*;

Agent agent = new Agent("yourAppName");

agent.increment("myapp.login");
agent.gauge("heap_free", 8675309);
agent.time("some.longProcess", new Runnable() {
    public void run() {
        // Do something....
    });
agent.addMetric("Maintenance Now.", 600);

可以考虑使用注解简化客户端上报逻辑newrelic：

@Trace(metricName=”YouMetricName”)

By default, the metric name will include the class name followed by the method name

时序数据库讨论

这里我们以两大开源的时序数据库：influxDB和OpenTSDB做对比讨论。

就文档看起来，influexDB使用起来更像传统的RDB。需要创建DB，但是不需要schema，columns是动态创建的。感觉columns就是OpenTSDB的tags键值对。

InfluxDB的抽象更类似于传统的关系型数据库，只是schemeless：Database, shard space, series(table), column。

写入格式：

OpenTSDB:
influxDB: name [columns] [points]。其中timestamp由服务端生成。columns和points类似于SQL的insert columns values(..)语法。

例如：统计mysql.Bytes_received，

OpenTSDB是这样子：

1385327470774 mysql.Bytes_received 19453687 host=mydb.example.com app=mysql

HTTP格式是：

{
    "metric": "mysql.Bytes_received",
    "timestamp": 1385327470774,
    "value": 19453687,
    "tags": {
       "hostName": "mydb.example.com",
       "app": "mysql"
    }
},

influxDB则是：

[
  {
    "name" : "mysql.Bytes_received",
    "columns" : ["app", "value", "host"],
    "points" : [
      ["mysql",19453687, "mydb.example.com"]
    ]
  }
]

0.9之后支持tags:

{
    "database": "mydb",
    "retentionPolicy": "default",
    "points": [
        {
            "name": "Bytes_received",
            "tags": {
                "host": "mydb.example.com",
                "app": "mysql",
                "region": "us-west"
            },
            "time": "2009-11-10T23:00:00Z",
            "fields": {
                "value": 19453687
            }
        }
    ]
}

需要注意的是influxDB的tags是默认索引的，但是fields(columns)则是没有索引的。也就是说我们无法高效的执行：响应时间(value) > 1000ms的记录。

另外值得注意的是influxDB的value值可以是String类型，这个OpenTSDB目前是不支持的。这意味着我们可以将错误日志也放在influxDB中。

可视化组件

如果我们采用了一站式的监控平台，像 Relic，moskito，prometheus，或者graphite（严格来说，Graphite其实只是包含存储和可视化展示，并没有包含收集），那么你就不太需要关心可视化的事情（那可是相当烦人的，特别是对于一个后端开发工程师来说）。但是如果采用了OpenTSDB或者influxDB，那么其实它们只是解决了数据存储而已。数据收集和数据展示这块还是需要另外的组件来解决。有需求就有产品。在监控可视化这块，Grafana貌似是唯一的选择。而且默认支持Graphite, InfluxDB & OpenTSDB。节目风格看起来非常像kibana，试试上就是在kibana的基础上二次开发的，原来是为了Graphite创建的。

这里有一篇文章介绍influxDB和grafana整合的，非常详细，可以参考一下：OBIEE Monitoring and Diagnostics with InfluxDB and Grafana。

日志事件收集组件

fluentd
logstash
collectd C写的一个系统参数收集

参考文章

Application Monitoring 收费产品，功能很强大。
moskito 开源监控产品，思路跟我的挺match的。
OpenTSDB2.0 非常好的PPT
influxDB
Grafana
Relic

基于单片机的住宅防火防盗报警系统设计启初科技 51单片机毕业设计单片机毕业设计单片机嵌入式硬件
文章目录一、系统概述二、项目内容和功能介绍三、效果图四、资料获取一、系统概述基于单片机的住宅防火防盗报警系统设计介绍一、系统设计背景与意义随着城市化进程的加快和居民生活水平的提高，住宅安全已成为人们关注的焦点。火灾和盗窃是威胁住宅安全的两大主要因素，传统的人工巡查和简单的安防设备已难以满足现代住宅的安全需求。基于单片机的住宅防火防盗报警系统集成了传感器技术、单片机控制技术和无线通信技术，能够实时监
缺乏项目进度可视化手段，如何提升展示效果
要提升项目进度的展示效果，需聚焦于选择合适的可视化工具、构建标准化的展示模板、结合数据进行动态更新、明确受众与场景匹配展示内容、推动进度展示与管理系统集成。其中，选择合适的可视化工具最为关键。项目展示效果的好坏，很大程度上取决于所使用工具的表达能力与交互性。选择具备图表支持、实时协作、数据集成能力的工具（如PowerBI、JiraDashboard、ClickUp等），能显著提升项目可视化水平和数
基于大模型的急性出血坏死性胰腺炎预测技术方案 LCG元人工智能 python
目录一、算法实现伪代码1.数据预处理与特征工程2.大模型训练（以Transformer为例）3.实时预测与动态调整二、模块流程图1.术前预测流程2.术中动态决策流程3.术后护理流程三、系统集成方案1.系统架构图2.核心模块交互流程四、系统部署拓扑图1.物理部署拓扑2.部署说明五、技术验证方案1.交叉验证流程2.实验验证设计六、健康教育模块示例一、算法实现伪代码1.数据预处理与特征工程#数据清洗与归
解锁WSL：Windows下的Linux新世界奔跑吧邓邓子必备核心技能 windows linux WSL 跨平台开发
目录一、WSL是什么二、WSL的功能特点2.1运行Linux环境2.2开发工具支持2.3文件系统集成2.4命令行交互2.5性能和兼容性三、WSL的版本区别3.1WSL1介绍3.2WSL2介绍3.3两者对比四、WSL的安装教程4.1安装前准备4.2安装步骤4.3安装Linux分发版五、WSL的常用命令5.1系统镜像管理5.2系统启动与关闭5.3镜像导出与导入5.4其他常用命令六、WSL的应用场景6.
OneCode技术架构深度解析：自主UI体系、注解驱动与全栈开发的协同优势低代码老李 OneCode产品介绍 OneCode实战软件行业架构 ui
引言：低代码平台的技术基石在AIGC与数字化转型的双重驱动下，企业级低代码平台已从简单的界面搭建工具演进为全栈业务开发环境。OneCode作为国内领先的低代码开发平台，其核心竞争力源于三大技术支柱：自主可控的UI体系、注解驱动的开发模式和端到端的全栈支持能力。这三大支柱形成有机整体，使OneCode在开发效率、系统集成和业务适应性方面建立起显著优势。本文将深入剖析这些技术特性的实现原理与应用价值，
动手实践OpenHands系列学习笔记15：无头模式架构 JeffWoodNo.1 笔记架构
笔记15：无头模式架构一、引言无头模式(HeadlessMode)是现代软件系统中的重要架构模式，允许应用程序在没有图形界面的情况下运行，特别适用于自动化场景、CI/CD流水线和系统集成。OpenHands作为先进的AI驱动开发代理平台，提供了强大的无头模式支持。本笔记将探讨无头架构设计原则，分析OpenHands的无头模式实现，并通过实践构建一个使用无头模式API的自动化工作流。二、无头架构设计
CentOS-7的“ifupdown“与Debian的“ifupdown“对比笔记250706 kfepiza OS操作系统 Windows Linux 等 #控制台命令行 Shell bash cmd 等网络通讯传输协议 IP TCP UDP 物联 centos debian 笔记 linux 网络
CentOS-7的"ifupdown"与Debian的"ifupdown"对比笔记250706CentOS7和Debian的ifupdown工具名称相同，但在实现机制、配置文件语法和系统集成上存在显著差异。以下是核心对比分析：⚙️一、核心差异概览对比维度CentOS7Debian工具定位network-scripts套件的一部分，依赖传统ifcfg文件独立包(ifupdown)，使用/etc/ne
搬运机器人系列编程：Fanuc M-20iA_20.搬运机器人系统的集成与安装 zhubeibei168 机器人及导航机器人数据挖掘人工智能
20.搬运机器人系统的集成与安装20.1系统集成概述在汽车制造行业中，搬运机器人系统的集成是一个复杂而多步骤的过程，涉及机械、电气、软件等多个方面的专业知识。FanucM-20iA搬运机器人以其高效、精准的特点，在这一领域中得到了广泛应用。本节将详细介绍如何将FanucM-20iA机器人集成到汽车制造生产线中，包括硬件安装、软件配置、系统调试等关键步骤。20.1.1机器人系统集成的重要性机器人系统
Spinnaker 4 SDK助力扩展多工业相机成像系统 51camera 工业相机机器视觉产品资料查询平台工业相机
扩展多相机成像系统是系统集成商和机器制造商面临的一项技术挑战。网络拥堵、CPU过载、同步错误以及配置复杂性等问题常常会给成功构建包含大量GigE相机的系统造成诸多阻碍。最近，Teledyne通过交换机将40多台GigE相机连接到一台PC，成功运行了相机系统。即使在极限压力下，系统依然连续运行了数天，期间没有出现帧丢失或错误。这一成就得益于Spinnaker4SDK，它基于TeledyneGigE框
基于大模型的胆囊结石全流程预测与诊疗系统技术方案
目录一、系统架构设计1.1数据采集与预处理模块1.2大模型核心算法模块二、全流程系统流程图三、系统集成方案3.1模块交互流程3.2数据流示意图四、系统部署拓扑图五、核心模块实现细节5.1术前风险预测算法5.2术中监测算法5.3术后并发症预测模型六、关键技术验证方案6.1模型验证流程6.2临床试验设计框架七、典型应用场景流程7.1腹腔镜手术决策流程一、系统架构设计1.1数据采集与预处理模块#数据采集
CAN转Modbus TCP网关赋能食品搅拌机智能协同控制 JIANGHONGZN 工业通讯协议网关 CAN MODBUS MODBUS TCP
在食品搅拌机的自动化控制系统中，设备通信协议的多样性给系统集成带来挑战。JH-CAN-TCP疆鸿智能CAN主站转ModbusTCP从站的网关，成为连接西门子PLC与伺服系统的关键桥梁。西门子PLC常采用ModbusTCP协议，用于实现与上位机、人机界面等设备的数据交互。而伺服系统多使用CAN协议，因其具备高速、可靠、抗干扰能力强等特点，能精准控制电机运行。该网关可将西门子PLC发出的ModbusT
如何在pytorch中使用tqdm：优雅实现训练进度监控 Ven% 简单入门pytorch pytorch 人工智能 python
文章目录为什么需要进度条？tqdm简介基础用法示例深度学习中的实战应用1.数据加载进度监控2.训练循环增强版3.验证阶段集成高级技巧与最佳实践1.自定义进度条样式2.嵌套进度条（多任务）3.分布式训练支持4.与日志系统集成性能优化建议完整训练流程示例常见问题解决方案总结掌握训练进度监控是深度学习工程师的基本功。本文将带你从零开始，深入探索如何用tqdm为深度学习训练添加专业级进度条。为什么需要进度
《短剧CPS分销系统开发全攻略：打造高效变现的智能分销体系》 wx_ywyy6798 数据库短剧推客小程序 java 短剧分销系统短剧CPS系统短剧系统
系统概述与市场背景随着短视频行业的蓬勃发展，短剧内容已成为流量变现的新蓝海。短剧CPS分销系统是专为短剧内容提供商设计的高效分销管理平台，采用创新的"按销售付费"(CostPerSale)商业模式，通过构建完善的分销网络，帮助内容方快速拓展市场渠道，实现内容价值的最大化变现。本系统集成了内容管理、分销商管理、订单跟踪、智能分润等核心功能，为短剧行业提供一站式数字化分销解决方案。详细功能模块解析1.
从指令设计到系统集成：提示词工具链与GPTs插件的效率革命 charles666666 人工智能自然语言处理语言模型知识图谱 transformer
一、提示词工程工具链：概念与架构解析1.1为什么需要工具链？大模型交互的本质是“指令设计”，但人工编写提示词存在三大痛点：效率低（重复调试耗时）、质量不稳定（依赖个人经验）、复用性差（场景迁移成本高）。例如，某电商企业要求AI生成500种商品描述时，人工逐条调整提示词需耗费数周，且风格难以统一。工具链的价值在于通过模块化设计与自动化流程解决上述问题。其核心架构包含三个层级：需求解析层：将用户需求拆
specpu2017安装/编译/运行测试总结 So_shine linux调试工具和性能量化 linux
目录前言一、源码镜像获取二、安装三、配置修改四、编译五、运行测试六、结果查看七、遇到的问题前言SPEC是标准性能评估公司（StandardPerformanceEvaluationCorporation）的简称。SPEC是由计算机厂商、系统集成商、大学、研究机构、咨询等多家公司组成的非营利性组织，这个组织的目标是建立、维护一套用于评估计算机系统的标准。SPECCPU测试中，测试系统的处理器、内存子
specpu2017在arm64环境下的部署/测试 So_shine specpu 性能测试 arm64 环境部署
目录前言一、源码镜像获取二、安装三、配置修改四、编译五、运行测试六、结果查看七、遇到的问题前言SPEC是标准性能评估公司（StandardPerformanceEvaluationCorporation）的简称。SPEC是由计算机厂商、系统集成商、大学、研究机构、咨询等多家公司组成的非营利性组织，这个组织的目标是建立、维护一套用于评估计算机系统的标准。SPECCPU测试中，测试系统的处理器、内存子
【软件系统架构】系列四：嵌入式软件开发流程全解析（包含示例） 34号树洞自学软件系统架构大数据系统架构嵌入式
目录一、需求分析阶段二、系统架构设计阶段：三、开发准备阶段四、底层驱动开发阶段（HAL/BSP）五、操作系统集成阶段（RTOS/OS）六、中间件与协议栈集成阶段七、应用逻辑开发阶段八、调试与测试阶段：九、集成与联调阶段十、发布与维护阶段总结：完整开发流程图附：ESP32智能锁完整开发流程（含源码结构与文档模板）1.项目概述项目名称：功能特性：2.项目源码结构（推荐）3.开发流程分解（与上文流程对齐
ROS系列（三）：从零构建机器人通信系统 --- 包创建+发布订阅+Launch实战 & RViz/rqt可视化利器拆解！
引言机器人操作系统（ROS）的核心在于其模块化通信架构与高效的开发流程。本指南直击ROS开发的核心技术环节，助你快速构建功能节点并实现系统集成。你将从理解工作空间（catkin_ws）这一代码与编译的容器开始，掌握使用catkin_create_pkg创建功能包（Package）的方法，并深入关键配置文件CMakeLists.txt与package.xml的作用。核心在于编写节点（Node）：通过
物联网与AI驱动的智能宿舍管理解决方案
本文还有配套的精品资源，点击获取简介：智能宿舍管理系统通过物联网、云计算和人工智能技术相结合，提高宿舍管理效率和学生住宿体验。该系统集成了智能门锁、传感器、能源管理系统等硬件设备，并与软件平台结合实现远程监控、自动化控制和数据分析。它还包含了实时监控、数据处理、远程操作、智能分析、异常检测和用户画像等功能，以确保高效管理、安全性和个性化服务。此外，系统设计注重加密通信、访问控制和隐私保护，以保障数
从楼宇到园区：IBMS 智能化系统打造 24 小时无忧智控生态 houhuan128 IBMS智能化集成系统 3D可视化 BIM建模数字孪生管理平台智能化集成系统建筑设备管理系统楼宇自控
当楼宇与园区不再是分散的个体，当时间的流转不再成为管理盲区，IBMS智能化系统以全域覆盖、全时响应的智控体系，打破空间与时间的限制，构建起高效、安全、省心的智能生态，让每一寸空间、每一秒运行都尽在掌控。亚川科技专注于IBMS系统集成3D可视化数字孪生管理平台、建筑设备一体化监控系统、建筑设备楼宇自控系统、制冷机房群控系统、强弱电一体化控制柜、空气流向管理系统、数据中心基础设施管理系统、空气质量监控
小程序领域设计的知识付费小程序设计技巧
小程序领域设计的知识付费小程序设计技巧关键词：知识付费、小程序设计、用户体验、支付系统、内容管理、社交裂变、数据分析摘要：本文深入探讨知识付费小程序的设计技巧，从产品定位到技术实现，全面解析如何打造一个成功的知识付费平台。文章将详细讲解核心功能模块设计、用户体验优化、支付系统集成、内容管理系统构建等关键技术点，并提供实际代码示例和最佳实践建议。通过分析典型应用场景和行业案例，帮助开发者掌握知识付费
Unity AR构建维护系统的以AI驱动增强现实知识检索系统 Morpheon unity ar 人工智能
本博客概述了为维护开发的AI驱动增强现实（AR）知识检索系统的开发过程，该系统集成了Unity用于AR、Python服务器用于后端处理，以及ChatGPT用于自然语言处理。该系统允许维护工人通过AR设备（如HoloLens2）查询特定任务的知识（例如，故障排除步骤），并以全息图形式显示上下文感知的响应。Unity账户注册中文账户注册比较困难。它需要额外的验证码验证步骤，有时即使验证成功也不会重定向
设计模式系列（09）：结构型模式 - 适配器模式码农秋设计模式设计模式适配器模式
系列导读：完成创建型模式后，我们进入结构型模式的学习。适配器模式是结构型模式的开篇，解决接口不兼容的问题。解决什么问题：将一个类的接口转换成客户希望的另一个接口，使原本不兼容的类可以一起工作。用于系统集成和第三方库对接。在软件开发中，我们经常需要使用第三方库或者对接外部系统，但它们的接口往往与我们的系统不兼容。比如，老系统使用XML格式数据，新系统使用JSON格式；或者需要集成的支付接口与现有的支
多行业活动管理小程序
一佳门户活动报名系统是基于微擎开源生态开发的多功能活动管理解决方案，依托微擎系统基于PHP开发的开源特性，实现多行业活动的在线报名与全流程管理。该系统支持PC端应用部署，同时兼容微信生态场景，为企业、机构及行业商户提供从活动创建、报名收集到数据统计的一站式服务，适用于家政、餐饮、教育、票务等多领域活动场景。核心功能模块与技术特性多行业活动场景适配十行业集群支持：系统集成家政服务、餐饮预订、电商促销
三方系统集成（低代码）平台实践后端java架构低代码
作者：vivoIT平台团队-WangQin本文从作者实际痛点出发，到产生愿景，最后再到落地的全过程，并结合实例案例，介绍了一些核心设计思路，希望读者阅读后对vivo分销业务，能有一些了解，也希望能对读者在应用的认证鉴权、流程编排、低代码等方面有所启发。一、背景和痛点本文首先对vivo分销业务系统（简称V-Work，V-Work是分销系统的Portal，非1个系统）做个简单的介绍，V-Work作为v
AR眼镜与3D建模社区建设大霸王龙系统分析业务 ar 3d
AR眼镜与3D建模社区建设：结构化分析报告1.技术架构与系统集成1.1AR眼镜核心功能实时空间叠加：通过透明显示屏将虚拟模型与现实环境无缝融合，支持多层叠加（如设计模型、标注信息、参考线等）。手势与语音交互：利用眼动追踪、手势识别和语音命令实现沉浸式操作，例如旋转模型、调整参数无需触控设备。6DoF定位精度：支持六自由度定位，确保虚拟对象在三维空间中的精准放置与移动，适用于复杂建模场景。1.2与3
AI原生应用架构设计：如何优雅地集成LLM到现有系统 AGI大模型与大数据研究院 AI-native 网络 ai
AI原生应用架构设计：如何优雅地集成LLM到现有系统关键词：AI原生应用、架构设计、大语言模型（LLM）、系统集成、优雅集成摘要：本文主要探讨了在AI原生应用架构设计中，如何将大语言模型（LLM）优雅地集成到现有系统。首先介绍了相关背景知识，包括目的、预期读者等；接着解释了核心概念，如LLM、系统集成等，并阐述了它们之间的关系；然后详细讲解了核心算法原理、数学模型和公式；通过项目实战给出代码实际案
万物互联时代的工业数据中枢——iGR-IMS多场景适配体系 Qdgr_ 数据分析
一、工业数据接入的世纪挑战随着新能源装机容量突破12亿千瓦，工业数据采集面临三大技术瓶颈：协议碎片化：某300MW风电场需同时接入西门子SCADA、远景风机、华为逆变器等12类设备，通信协议涵盖IEC60870-5-104、ModbusTCP、CANopen等九种标准，系统集成成本占项目总投资的23%。部署环境极端化：西北光伏电站昼夜温差达70℃，海上风电平台湿度100%，传统设备年均故障频次超过
XML在线格式化工具 weixin_43680407 xml
XML格式化免费在线XML格式化与压缩工具，一键美化、校验、压缩和优化您的XML代码。支持自定义缩进、节点折叠，提升可读性，减小文件体积，加速数据传输。https://toolshu.com/xml本工具是一款专为处理XML（可扩展标记语言）数据的开发者、数据分析师及系统集成人员精心打造的XML代码处理工具，致力于提供专业、高效的格式化、美化、压缩及优化解决方案。无论是对既有的XML文档进行梳理，
基于通义大模型的智能客服系统构建实战：从模型微调到API部署大熊计算机开发实战语言模型人工智能
1引言本文将深入探讨基于通义大模型的智能客服系统构建全流程，从数据准备、模型微调、性能优化到API部署和系统集成。不同于理论概述，本文将通过实战案例、代码演示和性能数据对比，展示每个环节的技术细节与工程实践。文章面向具备Python和深度学习基础的开发者，重点解决以下核心问题：如何针对客服场景准备和优化训练数据？如何高效微调通义大模型以适配特定业务需求？如何解决大模型部署中的延迟和并发挑战？如何构
枚举的构造函数中抛出异常会怎样 bylijinnan java enum 单例
首先从使用enum实现单例说起。为什么要用enum来实现单例？这篇文章（ http://javarevisited.blogspot.sg/2012/07/why-enum-singleton-are-better-in-java.html）阐述了三个理由： 1.enum单例简单、容易，只需几行代码： public enum Singleton { INSTANCE;
CMake 教程 aigo C++
转自：http://xiang.lf.blog.163.com/blog/static/127733322201481114456136/ CMake是一个跨平台的程序构建工具，比如起自己编写Makefile方便很多。介绍：http://baike.baidu.com/view/1126160.htm 本文件不介绍CMake的基本语法，下面是篇不错的入门教程： http:
cvc-complex-type.2.3: Element 'beans' cannot have character Cb123456 spring Webgis
cvc-complex-type.2.3: Element 'beans' cannot have character Line 33 in XML document from ServletContext resource [/WEB-INF/backend-servlet.xml] is i
jquery实例:随页面滚动条滚动而自动加载内容 120153216 jquery
<script language="javascript"> $(function (){ var i = 4;$(window).bind("scroll", function (event){ //滚动条到网页头部的高度，兼容ie,ff,chrome var top = document.documentElement.s
将数据库中的数据转换成dbs文件何必如此 sql dbs
旗正规则引擎通过数据库配置器（DataBuilder）来管理数据库，无论是Oracle，还是其他主流的数据都支持，操作方式是一样的。旗正规则引擎的数据库配置器是用于编辑数据库结构信息以及管理数据库表数据，并且可以执行SQL 语句，主要功能如下。 1)数据库生成表结构信息：主要生成数据库配置文件(.conf文
在IBATIS中配置SQL语句的IN方式 357029540 ibatis
在使用IBATIS进行SQL语句配置查询时，我们一定会遇到通过IN查询的地方，在使用IN查询时我们可以有两种方式进行配置参数：String和List。具体使用方式如下： 1.String:定义一个String的参数userIds，把这个参数传入IBATIS的sql配置文件，sql语句就可以这样写： <select id="getForms" param
Spring3 MVC 笔记（一） 7454103 spring mvc bean REST JSF
自从 MVC 这个概念提出来之后 struts1.X struts2.X jsf 。。。。。这个view 层的技术一个接一个！都用过！不敢说哪个绝对的强悍！要看业务，和整体的设计！最近公司要求开发个新系统！
Timer与Spring Quartz 定时执行程序 darkranger spring bean 工作 quartz
有时候需要定时触发某一项任务。其实在jdk1.3，java sdk就通过java.util.Timer提供相应的功能。一个简单的例子说明如何使用，很简单： 1、第一步，我们需要建立一项任务，我们的任务需要继承java.util.TimerTask package com.test; import java.text.SimpleDateFormat; import java.util.Date;
大端小端转换，le32_to_cpu 和cpu_to_le32 aijuans C语言相关
大端小端转换，le32_to_cpu 和cpu_to_le32 字节序 http://oss.org.cn/kernel-book/ldd3/ch11s04.html 小心不要假设字节序. PC 存储多字节值是低字节为先(小端为先, 因此是小端), 一些高级的平台以另一种方式(大端)
Nginx负载均衡配置实例详解 avords
[导读] 负载均衡是我们大流量网站要做的一个东西，下面我来给大家介绍在Nginx服务器上进行负载均衡配置方法，希望对有需要的同学有所帮助哦。负载均衡先来简单了解一下什么是负载均衡，单从字面上的意思来理解就可以解负载均衡是我们大流量网站要做的一个东西，下面我来给大家介绍在Nginx服务器上进行负载均衡配置方法，希望对有需要的同学有所帮助哦。负载均衡先来简单了解一下什么是负载均衡
乱说的 houxinyou 框架敏捷开发软件测试
从很久以前，大家就研究框架，开发方法，软件工程，好多！反正我是搞不明白！这两天看好多人研究敏捷模型，瀑布模型！也没太搞明白. 不过感觉和程序开发语言差不多，瀑布就是顺序，敏捷就是循环. 瀑布就是需求、分析、设计、编码、测试一步一步走下来。而敏捷就是按摸块或者说迭代做个循环，第个循环中也一样是需求、分析、设计、编码、测试一步一步走下来。也可以把软件开发理
欣赏的价值——一个小故事 bijian1013 有效辅导欣赏欣赏的价值
　　第一次参加家长会，幼儿园的老师说："您的儿子有多动症，在板凳上连三分钟都坐不了，你最好带他去医院看一看。"　　回家的路上，儿子问她老师都说了些什么，她鼻子一酸，差点流下泪来。因为全班30位小朋友，惟有他表现最差；惟有对他，老师表现出不屑，然而她还在告诉她的儿子："老师表扬你了，说宝宝原来在板凳上坐不了一分钟，现在能坐三分钟。其他妈妈都非常羡慕妈妈，因为全班只有宝宝
包冲突问题的解决方法 bingyingao eclipse maven exclusions 包冲突
包冲突是开发过程中很常见的问题：其表现有： 1.明明在eclipse中能够索引到某个类，运行时却报出找不到类。 2.明明在eclipse中能够索引到某个类的方法，运行时却报出找不到方法。 3.类及方法都有，以正确编译成了.class文件，在本机跑的好好的，发到测试或者正式环境就抛如下异常： java.lang.NoClassDefFoundError: Could not in
【Spark七十五】Spark Streaming整合Flume-NG三之接入log4j bit1129 Stream
先来一段废话：实际工作中，业务系统的日志基本上是使用Log4j写入到日志文件中的，问题的关键之处在于业务日志的格式混乱，这给对日志文件中的日志进行统计分析带来了极大的困难，或者说，基本上无法进行分析，每个人写日志的习惯不同，导致日志行的格式五花八门，最后只能通过grep来查找特定的关键词缩小范围，但是在集群环境下，每个机器去grep一遍，分析一遍，这个效率如何可想之二，大好光阴都浪费在这上面了
sudoku solver in Haskell bookjovi sudoku haskell
这几天没太多的事做，想着用函数式语言来写点实用的程序，像fib和prime之类的就不想提了（就一行代码的事），写什么程序呢？在网上闲逛时发现sudoku游戏，sudoku十几年前就知道了，学生生涯时也想过用C/Java来实现个智能求解，但到最后往往没写成，主要是用C/Java写的话会很麻烦。现在写程序，本人总是有一种思维惯性，总是想把程序写的更紧凑，更精致，代码行数最少，所以现
java apache ftpClient bro_feng java
最近使用apache的ftpclient插件实现ftp下载，遇见几个问题，做如下总结。 1. 上传阻塞，一连串的上传，其中一个就阻塞了，或是用storeFile上传时返回false。查了点资料，说是FTP有主动模式和被动模式。将传出模式修改为被动模式ftp.enterLocalPassiveMode();然后就好了。看了网上相关介绍，对主动模式和被动模式区别还是比较的模糊，不太了解被动模
读《研磨设计模式》-代码笔记-工厂方法模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 工厂方法模式：使一个类的实例化延迟到子类 * 某次，我在工作不知不觉中就用到了工厂方法模式（称为模板方法模式更恰当。2012-10-29）： * 有很多不同的产品，它
面试记录语 chenyu19891124 招聘
或许真的在一个平台上成长成什么样，都必须靠自己去努力。有了好的平台让自己展示，就该好好努力。今天是自己单独一次去面试别人，感觉有点小紧张，说话有点打结。在面试完后写面试情况表，下笔真的好难，尤其是要对面试人的情况说明真的好难。今天面试的是自己同事的同事，现在的这个同事要离职了，介绍了我现在这位同事以前的同事来面试。今天这位求职者面试的是配置管理，期初看了简历觉得应该很适合做配置管理，但是今天面
Fire Workflow 1.0正式版终于发布了 comsci 工作 workflow Google
Fire Workflow 是国内另外一款开源工作流，作者是著名的非也同志，哈哈.... 官方网站是 http://www.fireflow.org 经过大家努力,Fire Workflow 1.0正式版终于发布了正式版主要变化: 1、增加IWorkItem.jumpToEx(...)方法，取消了当前环节和目标环节必须在同一条执行线的限制，使得自由流更加自由 2、增加IT
Python向脚本传参 daizj python 脚本传参
如果想对python脚本传参数，python中对应的argc, argv(c语言的命令行参数)是什么呢？需要模块：sys 参数个数：len(sys.argv) 脚本名： sys.argv[0] 参数1： sys.argv[1] 参数2： sys.argv[
管理用户分组的命令gpasswd dongwei_6688 passwd
NAME： gpasswd - administer the /etc/group file SYNOPSIS： gpasswd group gpasswd -a user group gpasswd -d user group gpasswd -R group gpasswd -r group gpasswd [-A user,...] [-M user,...] g
郝斌老师数据结构课程笔记 dcj3sjt126com 数据结构与算法
<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<
yii2 cgridview加上选择框进行操作 dcj3sjt126com GridView
页面代码 <?=Html::beginForm(['controller/bulk'],'post');?> <?=Html::dropDownList('action','',[''=>'Mark selected as: ','c'=>'Confirmed','nc'=>'No Confirmed'],['class'=>'dropdown',])
linux mysql fypop linux
enquiry mysql version in centos linux yum list installed | grep mysql yum -y remove mysql-libs.x86_64 enquiry mysql version in yum repositoryyum list | grep mysql oryum -y list mysql* install mysq
Scramble String hcx2013 String
Given a string s1, we may represent it as a binary tree by partitioning it to two non-empty substrings recursively. Below is one possible representation of s1 = "great":
跟我学Shiro目录贴 jinnianshilongnian 跟我学shiro
历经三个月左右时间，《跟我学Shiro》系列教程已经完结，暂时没有需要补充的内容，因此生成PDF版供大家下载。最近项目比较紧，没有时间解答一些疑问，暂时无法回复一些问题，很抱歉，不过可以加群（334194438/348194195）一起讨论问题。 ----广告-----------------------------------------------------
nginx日志切割并使用flume-ng收集日志 liyonghui160com
nginx的日志文件没有rotate功能。如果你不处理，日志文件将变得越来越大，还好我们可以写一个nginx日志切割脚本来自动切割日志文件。第一步就是重命名日志文件，不用担心重命名后nginx找不到日志文件而丢失日志。在你未重新打开原名字的日志文件前，nginx还是会向你重命名的文件写日志，linux是靠文件描述符而不是文件名定位文件。第二步向nginx主
Oracle死锁解决方法 pda158 oracle
　select p.spid,c.object_name,b.session_id,b.oracle_username,b.os_user_name from v$process p,v$session a, v$locked_object b,all_objects c where p.addr=a.paddr and a.process=b.process and c.object_id=b.
java之List排序 shiguanghui list排序
在Java Collection Framework中定义的List实现有Vector，ArrayList和LinkedList。这些集合提供了对对象组的索引访问。他们提供了元素的添加与删除支持。然而，它们并没有内置的元素排序支持。　　你能够使用java.util.Collections类中的sort()方法对List元素进行排序。你既可以给方法传递
servlet单例多线程 utopialxw 单例多线程 servlet
转自http://www.cnblogs.com/yjhrem/articles/3160864.html 和 http://blog.chinaunix.net/uid-7374279-id-3687149.html Servlet 单例多线程 Servlet如何处理多个请求访问？Servlet容器默认是采用单实例多线程的方式处理多个请求的：1.当web服务器启动的