Abandon_first

详解 TensorFlow TFLite 移动端（安卓）部署物体检测 demo（3）——训练模型

文章目录

- 写在前面
- 开箱 README
- `tf1.md` 和 `tf1_detection_zoo.md`
- - `tf1.md`
  - `tf1_detection_zoo.md`
- `tf1_training_and_evaluation.md`
- - Local Traing
  - Tensorboard
- `model_main.py` 和 pipeline config
- - 先说 pipeline config
  - 再说 `model_main.py`
  - - （1）实例 estimator
    - （2）实例 train_spec
    - （3）实例 eval_spec
- 上面 3 个实例的源信息哪里来？
- - 创建 RunConfig 实例
  - 创建实例 estimator 以及各种 input_fn
  - 创建实例 train_spec 和 eval_spec
  - 训练

写在前面

前面已有两篇主干内容记录使用 TFLite 在安卓移动端部署物体检测模型，分别是照本宣科按照官方 demo 部署以及如何替换其他模型部署。本篇承接前面两篇，主要记录如何通过 tensorflow object detection API 来训练自己的模型，当完成了这一步获得自己的模型以后，就可以按照前一篇的流程将其部署到移动端，识别某些特定种类的物体，完成你自定义的某些任务。

需要说明的是，在写这篇记录的过程中，发现有关于 object detection API 本身的很多细节要讲述。但如果陷入 API 本身，那么这篇记录就又臭又长了。在使用过程中就会慢慢熟悉了解这个 API，因此本篇在涉及 API 相关的细节可能会简述，重点仅放在用这个 API 训练自定义任检测模型的整体流程上。

所有参考资料均来自 tensorflow 官方（哎就是有时候相关的资料没有及时更新也引导得不是很好……），主要就是前两篇多次提到的 models 项目下的 object detection API /models/research/object_detection/，后面不再特意说明的时候，约定好默认就在这个 obejct_detection 文件夹下。本篇基本就在这里摸爬滚打了，好了关门，谁也别想出去了(^ __^) ~~~

仍然考虑过先简略说明本篇的流程和能达成的效果，但是经过多次浏览还是苦于这个 part 该怎么说。想要真的“自定义”模型结构、训练和验证涉及的细节很多，写了感觉很杂乱，不写又感觉不明所以。

总之，如果你想要训练自定义的模型（任务自定义，不是完全从 0 自定义，比如至少特征提取部分一般都用现有的），如果遵循“拿来主义”什么都尽量简化先用现成的，那么至少你需要以下几部分工作：

（1）针对移动端的话，根据对速度和质量的要求，选择整体的模型结构。模型结构可以直接按照 ./samples/configs/ 路径下给定的很多 feature extractor 样例来选择，比如 faster_rcnn_resnet50 或 ssd_mobilenet_v2 等等。如果这些不能满足需求，也可以把自己的 feature extractor “注册”进 object detection API，可参考 ./g3doc/defining_your_own_model.md。

（2）准备适合自己任务的数据集，我是用 labelimg Pascal 格式标注，然后对应参考 ./dataset_tools/create_pascal_tf_record.py 创建 tfrecords 用于训练和验证即可。

（3）根据你的任务需求，可以改动 config 文件来设定模型相关或者训练相关的参数。config 中细节较多，比如分类类别、预训练模型、batch_size、数据路径等等。

（4）训练，完事儿。

python model_main.py -- 给参数

后面就记录些细节。

开箱 README

它多处强调了更新了 tf2 支持 tflite，整得我以为以前的模型全都支持了，但并没有。tf1 tf2 都有各自支持的模型，需要先查看好了再确定你用 tf1 还是 tf2。比如前两篇中 SSD MobileNet V2 这个 feature extractor 的话，还要用 tf1。所以本篇中，全都按照 tf1 的相关文档来。

但是吧，目前更新后向移动端部署的 examples 项目下的 demo 和实际使用中，那个 API 又是按照更新后的来的，也就是必须写入 metadata，而写入 metadata 的引导只在 models 的 tf2.md 文件中有聊到……

要疯了，可能先接触 models 这个项目再接触 examples 移动端部署的同学会更省点资料查看的力气。像我一开始就本着移动端部署先接触的 examples 再来细看 models 的，真的吐槽 tf 文档一百遍……

言归正传，长期来看肯定会 tf2 的，1 和 2 的相关文档我都截了一下，可以多关注。按照 README 的引导，我们需要参考 g3doc/tf1.md 和 g3doc/tf1_detection_zoo.md。

不可忽略的是 g3doc 下还有很多其他的说明文件，在本篇流程中，还会涉及其中的相关资料。

`tf1.md` 和 `tf1_detection_zoo.md`

`tf1.md`

tf1.md 中先介绍了 object_detection API 的安装（我没安装啦，也能通过测试）。然后关于本篇主题使用 object detection API 训练自己的模型相关信息如下：

Training and Evaluation:
To train and evaluate your models either locally or on Google Cloud see instruction -> tf1_training_and_evaluation.md.

Guides:
Configuring an object detection pipeline -> configuring_jobs.md
Preparing inputs -> preparing_inputs.md
Defining your own model architecture -> defining_your_own_model.md
Bringing in your own dataset -> using_your_own_dataset.md
Supported object detection evaluation protocols -> evaluation_protocols.md
TPU compatible detection pipelines -> tpu_compatibility.md
Training and evaluation guide (CPU, GPU, or TPU) -> tf1_training_and_evaluation.md

所以需要跳转参考文件 tf1_training_and_evaluation.md。同时，训练自己的模型用于自定义任务，不可避免地想对训练数据、训练过程、模型结构、前后处理等细节进行修改，而这些就可以参考 configuring_jobs.md 等文件。

`tf1_detection_zoo.md`

其中介绍了 tf1 支持的各种 detection 模型，这些模型或基于不同的模型骨架，或使用不同的数据集训练。在文档的前面部分还重点介绍了 examples 项目下移动端部署 object detection demo 中的默认自带模型，即 ssd_mobilenet_v1_coco。模型比较多，只截取了前面一点：

历史原因，之前做这部分工作时更看重速度，所以我们选择了 ssd 系列而非 faster rcnn 等系列。

我们选择了 ssd_mobilenet_v2_coco 来训练自己的模型。在训练过程中，和常见训练方式一样，可以选择完全从头训，也可以利用预训练好的模型初始化 feature extractor 部分的参数，然后再 finetuning。预训练好的模型就可以在这里找，如果要用 ssd_mobilenet_v2_coco 就应该在这里找 ssd_mobile_v2_coco 对应的模型下载下来供训练用（后面还会再谈）。

插播：可以继续向下查看，就能找到 demo 中更换的模型即 ssd_mobilenetv2_oid4 ，它在 tf1 支持的模型类型中，而不在 tf2 中。

`tf1_training_and_evaluation.md`

本文档主要讲述有关训练和验证的内容，包括目录结构、训练和验证数据、模型的 configuration 等，针对训练方式有本地训练和使用 Google Cloud AI 平台，也包括 GPU 和 TPU 训练等，我选择的 local 本地 GPU 训练。

文档建议 data 和 models 分开放置，数据使用 tfrecords 格式，模型中 train 存储模型，eval 为验证记录。

关于如何准备 tfrecords 的训练和验证数据，参考 preparing_inputs.md；
关于如何配置模型训练和验证各个细节参数，参考 configuring_jobs.md，在此处重点强调了，建议使用预训练模型的参数来初始化，然后针对自己的任务进行 finetuning，提供的预训练模型可以在 tf1_detection_zoo.md 中来找。

Local Traing

训练过程必须给定配置文件 pipeline config，文档直接给了训练代码：

# From the tensorflow/models/research/ directory
PIPELINE_CONFIG_PATH={path to pipeline config file}
MODEL_DIR={path to model directory}
NUM_TRAIN_STEPS=50000
SAMPLE_1_OF_N_EVAL_EXAMPLES=1
python object_detection/model_main.py \
    --pipeline_config_path=${PIPELINE_CONFIG_PATH} \
    --model_dir=${MODEL_DIR} \
    --num_train_steps=${NUM_TRAIN_STEPS} \
    --sample_1_of_n_eval_examples=${SAMPLE_1_OF_N_EVAL_EXAMPLES} \
    --alsologtostderr

那么训练的细节过程就需要参考上面的 model_main.py 了。

Tensorboard

训练过程中，你可以查看已经写好的 tensorboard 文件，来查看模型的训练效果：

tensorboard --logdir=${MODEL_DIR}

API 已经向 tensorboard 写入了较为详细的信息，比如这是我之前训练中的一个剪影：

`model_main.py` 和 pipeline config

model_main.py 主要任务就是根据 pipeline config 中指定的信息，使用 tf.estimator 来训练和验证模型。

先说 pipeline config

根据需要修改 config 中的信息，以 SSD_Mobielnet_v2 为例，config 中包含的信息以及需要修改或注意的最基本信息如下：

(1) model/ssd

num_classes
box_coder
matcher
similarity_calculator
anchor_generator
image_resizer
box_predictor
feature_extractor
loss
normalize_loss_by_num_matches
post_processing

(2) train_config

batch_size
optimizer
fine_tune_checkpoint 推荐迁移训练节省时间
fine_tune_checkpoint_type
num_steps 默认给了 200,000
data_augmentation_options

(3) train_input_reader

tf_record_input_reader
label_map_path

(4) eval_config

num_examples
max_evals

(5) eval_input_reader

tf_record_input_reader
label_map_path
shuffle
num_readers

再说 `model_main.py`

tf.estimator 是 tensorflow 的一个高级 API，能大大简化多平台训练、模型共享等多个方面的复杂程度。但是无论 API 如何高级，训练和验证过程中所需要的参数设定、模型结构、数据准备等也都是需要指定的，只不过 tf.estimator 能让这个过程更“优雅”～

可以先一睹为快 model_main.py 中如何优雅地完成训练和验证，核心代码就一行：

tf.estimator.train_and_evaluate(estimator, train_spec, eval_specs[0])

这一行根据训练规范 tf.estimator.TrainSpec 的实例 train_spec 和验证规范 tf.estimator.EvalSpec 的实例 eval_spec ，使用 tf.estimator.train_and_evaluate 对 tf.estimator.Estimator 的实例 estimator 进行训练和验证。所以可以先按照创建实例分为 3 个部分，分别是：

实例 estimator；
实例 train_spec；
实例 eval_spec。

（1）实例 estimator

那么想要用 tf.estimator 来训练和验证，首先你要实例化一个 tf.estimator.Estimator 类，这个类可以使用 tf 预定义好的，也可以自己定义。这个对象包装一个由 model_fn 指定的模型，该模型在给定输入和许多其他参数的情况下，返回执行训练、评估或预测所需的操作。实例化一个 estimator 如下：

tf.estimator.Estimator(
model_fn, model_dir=None, config=None, params=None, warm_start_from=None
)

也就是你必须提供这个描述模型的 model_fn 才可以完成实例化，此部分先说到这里。

（2）实例 train_spec

TrainSpec 包含了训练过程中的各种配置信息，通过以下代码可以得到 TrainSpec 的一个实例：

tf.estimator.TrainSpec(
input_fn, max_steps=None, hooks=None, saving_listeners=None
)

其中的 input_fn 为训练过程提供训练数据的一个 batch，可以是 tf.data.Dataset' 的对象，肯定会包含 features 和 labels；max_stpes 就是训练的步数，如果不加设置默认为 None 意味着训练永不停止。

（3）实例 eval_spec

EvalSpec 包含了验证性能以及存储模型的各种配置信息，通过以下代码可以得到 EvalSpec 的实例：

tf.estimator.EvalSpec(
    input_fn, steps=100, name=None, hooks=None, exporters=None,
    start_delay_secs=120, throttle_secs=600
)

这里的 input_fn 和 train_spec 里的类型一样，也包含 features 和 labels，只不过是用来验证的。而另一个需要特别指出的是 exporter 负责导出模型，需要设置为 tf.estimator.FinalExporter。

tf.estimator.FinalExporter(
    name, serving_input_receiver_fn, assets_extra=None, as_text=False
)

这里的 serving__input_receiver_fn 就只产生 features （待预测），没有 labels 信息。

上面 3 个实例的源信息哪里来？

先简答：pipeline config。

然后再细看下 model_main.py 如何一步步从 pipeline_config 拿到训练和验证需要的信息。其实这部分内容非常多细节，顺着细节一步步爬下去就能找到这个 object detection API 给的很多最基本的定义。比如构建模型、构建过程中使用的各种工具函数。但是实际记录的过程感觉不能再写下去了（捂脸，已经又臭又长没有阅读性了/(ㄒoㄒ)/~~

model_main.py 直接调用 model_lib.py 文件，也就是几乎所有处理所需信息的工具函数都在 model_lib.py 中。

from object_detection import model_lib

接着，model_main.py 定义了多个命令行参数，其中有多个仅仅与 “单独验证” 模型有关，此处不聊～我关注的只有其中 3 个也是前 3 个，如下：

flags.DEFINE_string(
    'model_dir', None,
    'Path to output model directory where event and checkpoint files will be written.')
flags.DEFINE_string(
    'pipeline_config_path', None,
    'Path to pipeline config file.')
flags.DEFINE_integer(
    'num_train_steps', None,
    'Number of train steps.')

FLAGS = flags.FLAGS

其中 num_train_steps 如果不设定，就会从 pipeline_config 当中读取。

接下来，model_main.py 就真的开始干活儿了。

创建 RunConfig 实例

包含训练过程的配置信息：

config = tf.estimator.RunConfig(model_dir=FLAGS.model_dir)

tf.estimator.RunConfig 的使用如下。可以看到 save_checkpoints_steps 和 save_checkpoints_secs 均被设置为 _USE_DEFAULT，此时每隔 600s 就会保存一次模型。keep_checkpoint_max 为 5 也就是最多就保存最新的 5 个模型。

tf.estimator.RunConfig(
    model_dir=None, tf_random_seed=None, save_summary_steps=100,
    save_checkpoints_steps=_USE_DEFAULT, save_checkpoints_secs=_USE_DEFAULT,
    session_config=None, keep_checkpoint_max=5, keep_checkpoint_every_n_hours=10000,
    log_step_count_steps=100, train_distribute=None, device_fn=None, protocol=None,
    eval_distribute=None, experimental_distribute=None,
    experimental_max_worker_delay_secs=None, session_creation_timeout_secs=7200,
    checkpoint_save_graph_def=True
)

创建实例 estimator 以及各种 input_fn

train_and_eval_dict = model_lib.create_estimator_and_inputs(
        run_config=config,
        pipeline_config_path=FLAGS.pipeline_config_path,
        train_steps=FLAGS.num_train_steps,
        sample_1_of_n_eval_examples=FLAGS.sample_1_of_n_eval_examples,
        sample_1_of_n_eval_on_train_examples=(FLAGS.sample_1_of_n_eval_on_train_examples))
    
estimator = train_and_eval_dict['estimator']
train_input_fn = train_and_eval_dict['train_input_fn']
eval_input_fns = train_and_eval_dict['eval_input_fns']
eval_on_train_input_fn = train_and_eval_dict['eval_on_train_input_fn']
predict_input_fn = train_and_eval_dict['predict_input_fn']
train_steps = train_and_eval_dict['train_steps']

创建实例 train_spec 和 eval_spec

train_spec, eval_specs = model_lib.create_train_and_eval_specs(
    train_input_fn,
    eval_input_fns,
    eval_on_train_input_fn,
    predict_input_fn,
    train_steps,
    eval_on_train_data=False)

训练

回到最开始的“先睹为快”，一行核心代码训练：

tf.estimator.train_and_evaluate(estimator, train_spec, eval_specs[0])

去输出路径拿到训练的模型，再把它 froze、convert 再添加 metadata 就可以放在移动端了。

【人工智能】大模型的幻觉问题：DeepSeek 的解决策略与实践蒙娜丽宁 Python杂谈人工智能人工智能
《PythonOpenCV从菜鸟到高手》带你进入图像处理与计算机视觉的大门！解锁Python编程的无限可能：《奇妙的Python》带你漫游代码世界大语言模型（LLM）的“幻觉”问题，即模型生成与事实不符或脱离上下文的内容，是限制其广泛应用的关键挑战之一。本文深入探讨了幻觉问题的成因，包括训练数据的偏差、推理过程中的过度泛化以及缺乏外部验证机制。以DeepSeek系列模型为研究对象，我们分析了其在解
Yolo系列之Yolo的基本理解是十一月末 YOLO python 开发语言 yolo
YOLO的基本理解目录YOLO的基本理解1YOLO1.1概念1.2算法2单、多阶段对比2.1FLOPs和FPS2.2one-stage单阶段2.3two-stage两阶段1YOLO1.1概念YOLO(YouOnlyLookOnce)是一种基于深度学习的目标检测算法，由JosephRedmon等人于2016年提出。它的核心思想是将目标检测问题转化为一个回归问题，通过一个神经网络直接预测目标的类别和位
HCIA-AI人工智能笔记3：数据预处理噗老师华为认证人工智能笔记 wpf 数据处理 AI 华为认证
统讲解数据预处理的核心技术体系，通过Python/Pandas与华为MindSpore双视角代码演示，结合特征工程优化实验，深入解析数据清洗、标准化、增强等关键环节。一、数据预处理技术全景图graphTDA[原始数据]-->B{数据清洗}B-->B1[缺失值处理]B-->B2[异常值检测]B-->B3[重复值删除]A-->C{特征工程}C-->C1[标准化/归一化]C-->C2[离散化分箱]C--
Android Compose 线性布局（Row、Column）源码深度剖析(十) &有梦想的咸鱼& Androiod Compose原理 Android开发大全 android
AndroidCompose线性布局（Row、Column）源码深度剖析一、引言在Android应用开发的领域中，UI布局是构建用户界面的核心工作之一。良好的布局设计不仅能提升用户体验，还能使应用在不同设备上保持一致的视觉效果。随着Android开发技术的不断演进，JetpackCompose作为新一代的声明式UI框架应运而生。它以简洁的代码、高效的性能和强大的可维护性，逐渐成为开发者的首选。线性
网页版 123 分身数字人源码搭建，OEM贴牌 18538162800=余音视频矩阵
在数字化时代的浪潮下，数字人技术蓬勃发展，网页版123分身数字人源码搭建为众多开发者和企业提供了实现个性化数字人应用的可能。本文将深入探讨其技术开发过程，从底层架构到关键技术实现，全方位解析如何构建一个功能强大的网页版数字人系统。技术架构设计前端展示层HTML5与CSS3：构建数字人的可视化界面，实现流畅的动画效果和交互元素。利用CSS3的过渡、动画属性，为数字人的动作、表情变化提供细腻的视觉呈现
IPv6网络的可操作安全考虑——RFC9099解析（四）黑带架构湿 IPv6安全网络安全安全
2.6记录和监控为了在发生安全事件或检测到异常行为的情况下进行取证（forensic）研究，网络运营商应记录多个信息片段。在某些情况下，这需要通过网络管理站对设备进行频繁的轮询。日志包括但不限于：在可用时，使用网络的所有应用程序（包括用户空间和内核空间）的日志(例如，网络运营商管理的web服务器；IPFIX数据【RFC7011】；SNMPMIBs或来自RESTCONF/NETCONF的YANG数据
yolov8实战第七天——pyqt5-yolov8实现车牌识别系统（参考论文（约7000字）+环境配置+完整部署代码+代码使用说明+训练好的模型）学术菜鸟小晨 yolov8实战100天 python YOLO pyqt5 车牌识别毕业设计论文
基于pyqt5-yolov8实现车牌识别系统，包括图片车牌识别，视频车牌识别，视频流车牌识别。效果展示（图片检测，检测到的内容添加到历史记录）：效果展示（视频检测，视频车辆只会添加一条记录，下文更多实际应用中的优化策略）：新增功能：批量图片检测（2024/5/7更新代码）
什么是护网（HVV）？需要什么技术？网络安全零基础入门到精通教程建议收藏！程序员晓晓 web安全干货分享计算机网络安全黑客技术护网行动渗透测试
什么是护网行动？护网行动是以公安部牵头的，用以评估企事业单位的网络安全的活动。具体实践中。公安部会组织攻防两方，进攻方会在一个月内对防守方发动网络攻击，检测出防守方（企事业单位）存在的安全漏洞。通过与进攻方的对抗，企事业单位网络、系统以及设备等的安全能力会大大提高。“护网行动”是国家应对网络安全问题所做的重要布局之一。“护网行动”从2016年开始，随着我国对网络安全的重视，涉及单位不断扩大，越来越
TensorFlow和Pytorch在功能上的区别以及优势 Honeysea_70 #算法 tensorflow pytorch 人工智能
功能上的区别1.计算图TensorFlow：使用静态计算图（StaticGraph）。在运行模型之前，需要先构建完整的计算图，然后通过会话（Session）运行图。优点是性能优化更高效，适合大规模分布式训练和生产环境部署。缺点是调试相对复杂，因为计算图的构建和运行是分离的。PyTorch：使用动态计算图（DynamicGraph）。计算图是动态构建和执行的，每次迭代都会重新构建图。优点是调试方便，
AI时代个人财富增长实战指南：从零基础到精通变现的完整路径 A达峰绮人工智能
（本文基于人工智能技术发展规律，结合互联网经济底层逻辑，为普通从业者构建系统性AI应用框架）一、建立AI认知基础：技术理解与工具掌握技术分类认知人工智能工具分为四大功能模块：自然语言处理（文本生成、对话交互）、计算机视觉（图像视频处理）、数据分析（预测建模）、自动化控制（流程优化）。建议新手首先掌握语言类工具的基础操作，逐步扩展到其他领域。工具操作逻辑通用AI工具通常包含三大核心功能模块：输入界面
【北上广深杭大厂AI算法面试题】计算机视觉篇...如何解决多尺度问题？努力毕业的小土博^_^ AI算法题库人工智能算法计算机视觉深度学习神经网络
【北上广深杭大厂AI算法面试题】计算机视觉篇…如何解决多尺度问题？【北上广深杭大厂AI算法面试题】计算机视觉篇…如何解决多尺度问题？文章目录【北上广深杭大厂AI算法面试题】计算机视觉篇...如何解决多尺度问题？前言数据级别的多尺度模型架构上的多尺度表示FPN代码示例（PyTorch）说明其他多尺度处理方法总结欢迎铁子们点赞、关注、收藏！祝大家逢考必过！逢投必中！上岸上岸上岸！upupup大多数高校
大语言模型学习路线：从入门到实战大模型官方资料语言模型学习人工智能产品经理自然语言处理搜索引擎
大语言模型学习路线：从入门到实战在人工智能领域，大语言模型（LargeLanguageModels,LLMs）正迅速成为一个热点话题。本学习路线旨在为有基本Python编程和深度学习基础的学习者提供一个清晰、系统的大模型学习指南，帮助你在这一领域快速成长。本学习路线更新至2024年02月，后期部分内容或工具可能需要更新。适应人群已掌握Python基础具备基本的深度学习知识学习步骤本路线将通过四个核
深度学习与目标检测系列(六) 本文约(4.5万字) | 全面解读复现ResNet | Pytorch | 小酒馆燃着灯深度学习目标检测 pytorch 人工智能 ResNet 残差连接残差网络
文章目录解读Abstract—摘要翻译精读主要内容Introduction—介绍翻译精读背景RelatedWork—相关工作ResidualRepresentations—残差表达翻译精读主要内容ShortcutConnections—短路连接翻译精读主要内容DeepResidualLearning—深度残差学习ResidualLearning—残差学习翻译精读ResNet目的以前方法本文改进本质
深度学习与目标检测系列(三) 本文约(4万字) | 全面解读复现AlexNet | Pytorch | 小酒馆燃着灯深度学习目标检测 pytorch AlexNet 人工智能
文章目录解读Abstract-摘要翻译精读主要内容1.Introduction—前言翻译精读主要内容：本文主要贡献：2.TheDataset-数据集翻译精读主要内容：ImageNet简介：图像处理方法：3.TheArchitecture—网络结构3.1ReLUNonlinearity—非线性激活函数ReLU翻译精读传统方法及不足本文改进方法本文的改进结果3.2TrainingonMultipleG
信号传输与通信：光纤通信中的信号处理_（11）.相干光通信技术 kkchenkx 信号处理技术仿真模拟信号处理
相干光通信技术相干光通信技术是一种在光纤通信系统中广泛应用的技术，通过使用相干检测方法来提高信号的传输性能。与传统的强度调制/直接检测（IM/DD）系统相比，相干光通信技术能够实现更高的数据传输速率和更长的传输距离，这是因为相干检测技术能够有效地提取信号的相位和幅度信息，从而在接收端实现更精确的信号恢复。1.相干光通信的基本概念相干光通信系统的核心在于相干检测，通过使用本地振荡器（LocalOsc
基于STM32设计的健康检测设备(测温心率计步)（局域网） DS小龙哥智能家居与物联网项目实战 stm32 嵌入式单片机
1.项目介绍1.1开发背景本项目设计一款基于STM32F103RCT6微控制器的便携式健康监测设备，该设备能够实时监测并记录用户的生理参数，包括人体温度、心率以及日常活动中的步数，并具备将这些数据可视化显示在设备自带的OLED屏幕上的能力。此外，该设备还提供了通过Wi-Fi模块ESP8266将收集到的数据无线传输至用户的智能手机或个人计算机的功能，以便用户能够更加方便地管理自己的健康信息。为了实现
不搞花里胡哨！CMU最新开源：极简风格的LiDAR全景分割+跟踪！ 3Ｄ视觉工坊 3D视觉从入门到精通 3D视觉
来源：3D视觉工坊在公众号「3D视觉工坊」后台，回复「原论文」可获取论文pdf、代码链接添加微信：dddvisiona，备注：三维点云，拉你入群。文末附行业细分群1.笔者个人体会激光雷达全景分割（LPS）一般遵循自下而上的以分割为中心的范式，利用聚类获得对象实例来建立语义分割网络。但是最近CMU&Meta等大佬们重新思考了这种方法，并提出了一个简单而有效的检测中心网络，用于LPS和跟踪。这项工作也
用故事与视觉化打造“高光“统计报告：5个实战技巧梦想画家数据分析工程数据工程分析工程
你是否有过这样的经历？花费数小时整理的数据报告，却被同事评价为"又厚又臭"？别担心，这绝不是你的错——90%的统计报告都毁在不会讲故事。本文将带你用叙事经济学+视觉设计思维，把冷冰冰的数据变成让人欲罢不能的"数据故事会"，掌握让数据开口说话的秘密。1.别让数据成了"睡美人"：唤醒它的故事基因想象你正在给董事会讲一个悬疑剧：“去年Q2销售额神秘下滑（悬念），我们像福尔摩斯一样追查线索（行动），发现竟
SQLMesh SCD Type 2 深度解析：时间戳与列级跟踪的实战指南梦想画家数据分析工程 #python 数据工程分析工程 sqlmesh
在数据仓库架构中，缓慢变化维度（SlowlyChangingDimensions,SCD）是处理历史数据追踪的核心技术。SQLMesh作为新一代数据编织平台，其支持的SCDType2模型通过valid_from和valid_to双时间戳机制，为开发者提供了灵活的历史状态管理能力。本文将深入解析SQLMeshSCDType2的两种实现模式（基于时间戳与列级变更检测）、关键配置项及删除操作处理逻辑，让
【C++】——精细化哈希表架构：理论与实践的综合分析 m0_74825238 面试学习路线阿里巴巴 c++散列表架构 java
先找出你的能力在哪里，然后再决定你是谁。——塔拉·韦斯特弗《你当像鸟飞往你的山》目录1.C++与哈希表：核心概念与引入2.哈希表的底层机制：原理与挑战2.1核心功能解析：效率与灵活性的平衡2.2哈希冲突的本质：问题与应对策略2.3开散列与闭散列：两大解决方案的比较3.闭散列的精确实现：从设计到优化3.1整体框架设计：面向扩展的架构3.2仿函数的灵活性：高效哈希的关键3.3插入操作：冲突检测与位置分
阿里云国际站代理商：为什么边缘计算需要分布式防护？聚搜云—服务器分享阿里云边缘计算分布式
1.边缘计算的分布式特性边缘计算将数据处理和存储从集中式的云中心迁移到了靠近数据源的边缘节点，这些节点通常分布广泛且数量众多。这种分布式架构虽然带来了低延迟、高带宽和高可靠性的优势，但也增加了安全防护的复杂性。因为每个边缘节点都可能成为潜在的攻击目标，且攻击面随着节点数量的增加而扩大。2.安全风险的增加数据泄露风险：边缘节点处理和存储用户数据，如果这些节点的安全措施不足，数据可能会被窃取或泄露。物
【论文阅读】PERSONALIZE SEGMENT ANYTHING MODEL WITH ONE SHOT s1ckrain 计算机视觉论文阅读计算机视觉人工智能
PERSONALIZESEGMENTANYTHINGMODELWITHONESHOT原文摘要研究背景与问题：SAM是一个基于大规模数据预训练的强大提示框架，推动了分割领域的发展。尽管SAM具有通用性，但在无需人工提示的情况下，针对特定视觉概念（如自动分割用户宠物狗）的定制化研究尚不充分。方法提出：提出了一种无需训练的SAM个性化方法，称为PerSAM。仅需单次数据（一张带参考掩码的图像），即可在新
计算机视觉技术探索：美颜SDK如何利用深度学习优化美颜、滤镜功能？美狐美颜sdk 美颜SDK 美颜API 直播美颜SDK 计算机视觉深度学习直播美颜SDK 美颜sdk 第三方美颜sdk 美颜api
时下，计算机视觉+深度学习正在重塑美颜技术，通过智能人脸检测、AI滤镜、深度美肤、实时优化等方式，让美颜效果更加自然、精准、个性化。那么，美颜SDK如何结合深度学习来优化美颜和滤镜功能？本文将深入解析AI在美颜技术中的应用，并探讨其未来发展趋势。一、深度学习如何赋能美颜SDK？1.AI人脸检测与关键点识别：精准捕捉五官在美颜过程中，首先需要精准检测人脸位置和五官特征点，确保美颜效果不会失真。深度学
对MCP工作流的一些个人认知持续学习的老赵人工智能
最近在学习MCP系统，虽尚未深入掌握，但已对其工作原理有了初步认识，在此分享下学习收获。MCP是一套能实现客户端、多种服务与大模型协同工作的系统，能处理任务请求并及时反馈。其工作流程如下：一、获取并更新服务使用方法（一）收集整理使用方法MCP正常运行依赖于对各类服务使用方法的了解，这要靠已在系统注册且可识别的功能模块。一旦有新模块注册或旧模块更新，系统会自动检测并获取其使用方法信息。MCP订阅服务
深度学习模型性能全景评估与优化指南 niuTaylor 深度学习人工智能
深度学习模型性能全景评估与优化指南一、算力性能指标体系1.核心算力指标对比指标计算方式适用场景硬件限制TOPS(TeraOperationsPerSecond)每秒万亿次整数运算量化模型推理NVIDIAJetsonNano仅支持FP16/FP32TFLOPS(TeraFLoating-pointOPerationsperSecond)TFLOPS=Cores×FLOPs/Cycle×Frequen
车牌识别技术揭秘：如何用 C# 实现自动车牌识别系统威哥说编程 c#开发语言
车牌识别（LicensePlateRecognition，LPR）是一项计算机视觉技术，用于自动识别车辆的车牌号码。在实际应用中，车牌识别技术被广泛用于停车场管理、交通监控和安防系统等领域。实现车牌识别系统的关键步骤包括图像预处理、车牌检测、字符分割、字符识别等。C#中可以通过结合OpenCV、EmguCV、TesseractOCR等工具来实现车牌识别系统。一、所需工具和库EmguCV：这是一个封
从零开始：使用原生JS打造简易飞机大战游戏西域情歌
本文还有配套的精品资源，点击获取简介：在本教程中，我们将探讨如何利用原生JavaScript的特性，包括事件处理、DOM操作、定时器和音频处理，来构建一个基础的“飞机大战”游戏。该游戏的核心元素包括玩家飞机、敌机、子弹和碰撞检测，它们通过HTML和CSS展现在页面上。通过编写JavaScript脚本，我们实现游戏对象的创建与状态管理，响应用户的键盘和点击事件，更新游戏内容，并通过定时器维护游戏循环
利用Python和深度学习方法实现手写数字识别的高精度解决方案——从数据预处理到模型优化的全流程解析快撑死的鱼 Python算法精解 python 深度学习开发语言
利用Python和深度学习方法实现手写数字识别的高精度解决方案——从数据预处理到模型优化的全流程解析在人工智能的众多应用领域中，手写数字识别是一项经典且具有重要实际应用价值的任务。随着深度学习技术的飞速发展，通过构建和训练神经网络模型，手写数字识别的精度已经可以达到99%以上。本文将以Python为主要编程语言，结合深度学习的核心技术，详细解析手写数字识别的实现过程，并探讨如何进一步优化模型以提高
强化学习中的深度卷积神经网络设计与应用实例数字扫地僧计算机视觉 cnn 人工智能神经网络
I.引言强化学习（ReinforcementLearning，RL）是机器学习的一个重要分支，通过与环境的交互来学习最优策略。深度学习，特别是深度卷积神经网络（DeepConvolutionalNeuralNetworks，DCNNs）的引入，为强化学习在处理高维度数据方面提供了强大工具。本文将探讨强化学习中深度卷积神经网络的设计原则及其在不同应用场景中的实例。II.深度卷积神经网络在强化学习中的
使用Three.js渲染器创建炫酷3D场景 Front_Yue 3D技术实践指南 javascript three.js 3d
引言在当今数字化的时代，3D图形技术正以其独特的魅力在各个领域掀起波澜。从影视制作到游戏开发，从虚拟现实到网页交互，3D场景以其强烈的视觉冲击力和沉浸式的体验，成为了吸引用户、传达信息的重要手段。而Three.js，作为一款功能强大且广受欢迎的JavaScript3D库，为我们提供了便捷、高效的途径来创建令人炫目的3D场景。本文将深入探讨使用Three.js渲染器创建炫酷3D场景的方方面面，带领读
java封装继承多态等麦田的设计者 java eclipse jvm c encapsulatopn
最近一段时间看了很多的视频却忘记总结了，现在只能想到什么写什么了，希望能起到一个回忆巩固的作用。 1、final关键字译为：最终的 &
F5与集群的区别 bijian1013 weblogic 集群 F5
http请求配置不是通过集群，而是F5；集群是weblogic容器的，如果是ejb接口是通过集群。 F5同集群的差别，主要还是会话复制的问题，F5一把是分发http请求用的，因为http都是无状态的服务，无需关注会话问题，类似
LeetCode[Math] - #7 Reverse Integer Cwind java 题解 Math LeetCode Algorithm
原题链接：#7 Reverse Integer 要求：按位反转输入的数字例1：输入 x = 123, 返回 321 例2：输入 x = -123, 返回 -321 难度：简单分析：对于一般情况，首先保存输入数字的符号，然后每次取输入的末位（x%10）作为输出的高位（result = result*10 + x%10）即可。但
BufferedOutputStream 周凡杨
首先说一下这个大批量，是指有上千万的数据量。例子：有一张短信历史表，其数据有上千万条数据，要进行数据备份到文本文件，就是执行如下SQL然后将结果集写入到文件中！ select t.msisd
linux下模拟按键输入和鼠标被触发 linux
查看/dev/input/eventX是什么类型的事件， cat /proc/bus/input/devices 设备有着自己特殊的按键键码，我需要将一些标准的按键，比如0－9，X－Z等模拟成标准按键，比如KEY_0,KEY-Z等，所以需要用到按键模拟，具体方法就是操作/dev/input/event1文件，向它写入个input_event结构体就可以模拟按键的输入了。 linux/in
ContentProvider初体验肆无忌惮_ ContentProvider
ContentProvider在安卓开发中非常重要。与Activity，Service，BroadcastReceiver并称安卓组件四大天王。在android中的作用是用来对外共享数据。因为安卓程序的数据库文件存放在data/data/packagename里面，这里面的文件默认都是私有的，别的程序无法访问。如果QQ游戏想访问手机QQ的帐号信息一键登录，那么就需要使用内容提供者COnte
关于Spring MVC项目（maven）中通过fileupload上传文件 843977358 mybatis spring mvc 修改头像上传文件 upload
Spring MVC 中通过fileupload上传文件，其中项目使用maven管理。 1.上传文件首先需要的是导入相关支持jar包：commons-fileupload.jar,commons-io.jar 因为我是用的maven管理项目，所以要在pom文件中配置（每个人的jar包位置根据实际情况定） <!-- 文件上传 start by zhangyd-c --&g
使用svnkit api，纯java操作svn，实现svn提交，更新等操作 aigo svnkit
原文：http://blog.csdn.net/hardwin/article/details/7963318 import java.io.File; import org.apache.log4j.Logger; import org.tmatesoft.svn.core.SVNCommitInfo; import org.tmateso
对比浏览器，casperjs，httpclient的Header信息 alleni123 爬虫 crawler header
@Override protected void doGet(HttpServletRequest req, HttpServletResponse res) throws ServletException, IOException { String type=req.getParameter("type"); Enumeration es=re
java.io操作 DataInputStream和DataOutputStream基本数据流百合不是茶 java 流
1，java中如果不保存整个对象，只保存类中的属性，那么我们可以使用本篇文章中的方法，如果要保存整个对象先将类实例化后面的文章将详细写到 2，DataInputStream 是java.io包中一个数据输入流允许应用程序以与机器无关方式从底层输入流中读取基本 Java 数据类型。应用程序可以使用数据输出流写入稍后由数据输入流读取的数据。
车辆保险理赔案例 bijian1013 车险
理赔案例：一货运车，运输公司为车辆购买了机动车商业险和交强险，也买了安全生产责任险，运输一车烟花爆竹，在行驶途中发生爆炸，出现车毁、货损、司机亡、炸死一路人、炸毁一间民宅等惨剧，针对这几种情况，该如何赔付。赔付建议和方案：客户所买交强险在这里不起作用，因为交强险的赔付前提是：“机动车发生道路交通意外事故”；如果是交通意外事故引发的爆炸，则优先适用交强险条款进行赔付，不足的部分由商业
学习Spring必学的Java基础知识(5)—注解 bijian1013 java spring
文章来源：http://www.iteye.com/topic/1123823，整理在我的博客有两个目的：一个是原文确实很不错，通俗易懂，督促自已将博主的这一系列关于Spring文章都学完；另一个原因是为免原文被博主删除，在此记录，方便以后查找阅读。有必要对
【Struts2一】Struts2 Hello World bit1129 Hello world
Struts2 Hello World应用的基本步骤创建Struts2的Hello World应用，包括如下几步： 1.配置web.xml 2.创建Action 3.创建struts.xml，配置Action 4.启动web server，通过浏览器访问配置web.xml <?xml version="1.0" encoding="
【Avro二】Avro RPC框架 bit1129 rpc
1. Avro RPC简介 1.1. RPC RPC逻辑上分为二层，一是传输层，负责网络通信；二是协议层，将数据按照一定协议格式打包和解包从序列化方式来看，Apache Thrift 和Google的Protocol Buffers和Avro应该是属于同一个级别的框架，都能跨语言，性能优秀，数据精简，但是Avro的动态模式（不用生成代码，而且性能很好）这个特点让人非常喜欢，比较适合R
lua　set get cookie ronin47 lua cookie
lua: local access_token = ngx.var.cookie_SGAccessToken if access_token then ngx.header["Set-Cookie"] = "SGAccessToken="..access_token.."; path=/;Max-Age=3000" end
java-打印不大于N的质数 bylijinnan java
public class PrimeNumber { /** * 寻找不大于N的质数 */ public static void main(String[] args) { int n=100; PrimeNumber pn=new PrimeNumber(); pn.printPrimeNumber(n); System.out.print
Spring源码学习-PropertyPlaceholderHelper bylijinnan java spring
今天在看Spring 3.0.0.RELEASE的源码，发现PropertyPlaceholderHelper的一个bug 当时觉得奇怪，上网一搜，果然是个bug，不过早就有人发现了，且已经修复：详见： http://forum.spring.io/forum/spring-projects/container/88107-propertyplaceholderhelper-bug
[逻辑与拓扑]布尔逻辑与拓扑结构的结合会产生什么? comsci 拓扑
如果我们已经在一个工作流的节点中嵌入了可以进行逻辑推理的代码,那么成百上千个这样的节点如果组成一个拓扑网络,而这个网络是可以自动遍历的,非线性的拓扑计算模型和节点内部的布尔逻辑处理的结合,会产生什么样的结果呢? 是否可以形成一种新的模糊语言识别和处理模型呢? 大家有兴趣可以试试,用软件搞这些有个好处,就是花钱比较少,就算不成
ITEYE 都换百度推广了 cuisuqiang Google AdSense 百度推广广告外快
以前ITEYE的广告都是谷歌的Google AdSense，现在都换成百度推广了。为什么个人博客设置里面还是Google AdSense呢？都知道Google AdSense不好申请，这在ITEYE上也不是讨论了一两天了，强烈建议ITEYE换掉Google AdSense。至少，用一个好申请的吧。什么时候能从ITEYE上来点外快，哪怕少点
新浪微博技术架构分析 dalan_123 新浪微博架构
新浪微博在短短一年时间内从零发展到五千万用户，我们的基层架构也发展了几个版本。第一版就是是非常快的，我们可以非常快的实现我们的模块。我们看一下技术特点，微博这个产品从架构上来分析，它需要解决的是发表和订阅的问题。我们第一版采用的是推的消息模式，假如说我们一个明星用户他有10万个粉丝，那就是说用户发表一条微博的时候，我们把这个微博消息攒成10万份，这样就是很简单了，第一版的架构实际上就是这两行字。第
玩转ARP攻击 dcj3sjt126com r
我写这片文章只是想让你明白深刻理解某一协议的好处。高手免看。如果有人利用这片文章所做的一切事情，盖不负责。网上关于ARP的资料已经很多了，就不用我都说了。用某一位高手的话来说，“我们能做的事情很多，唯一受限制的是我们的创造力和想象力”。 ARP也是如此。以下讨论的机子有一个要攻击的机子：10.5.4.178 硬件地址：52:54:4C:98
PHP编码规范 dcj3sjt126com 编码规范
一、文件格式 1. 对于只含有 php 代码的文件，我们将在文件结尾处忽略掉 "?>" 。这是为了防止多余的空格或者其它字符影响到代码。例如：<?php$foo = 'foo';2. 缩进应该能够反映出代码的逻辑结果，尽量使用四个空格，禁止使用制表符TAB，因为这样能够保证有跨客户端编程器软件的灵活性。例
linux 脱机管理（nohup） eksliang linux nohup nohup
脱机管理 nohup 转载请出自出处：http://eksliang.iteye.com/blog/2166699 nohup可以让你在脱机或者注销系统后，还能够让工作继续进行。他的语法如下 nohup [命令与参数] --在终端机前台工作 nohup [命令与参数] & --在终端机后台工作但是这个命令需要注意的是，nohup并不支持bash的内置命令，所
BusinessObjects Enterprise Java SDK greemranqq java BO SAP Crystal Reports
最近项目用到oracle_ADF 从SAP/BO 上调用水晶报表，资料比较少，我做一个简单的分享，给和我一样的新手提供更多的便利。首先，我是尝试用JAVA JSP 去访问的。官方API：http://devlibrary.businessobjects.com/BusinessObjectsxi/en/en/BOE_SDK/boesdk_ja
系统负载剧变下的管控策略 iamzhongyong 高并发
假如目前的系统有100台机器，能够支撑每天1亿的点击量（这个就简单比喻一下），然后系统流量剧变了要，我如何应对，系统有那些策略可以处理，这里总结了一下之前的一些做法。 1、水平扩展这个最容易理解，加机器，这样的话对于系统刚刚开始的伸缩性设计要求比较高，能够非常灵活的添加机器，来应对流量的变化。 2、系统分组假如系统服务的业务不同，有优先级高的，有优先级低的，那就让不同的业务调用提前分组
BitTorrent DHT 协议中文翻译 justjavac bit
前言做了一个磁力链接和BT种子的搜索引擎 {Magnet & Torrent}，因此把 DHT 协议重新看了一遍。 BEP: 5Title: DHT ProtocolVersion: 3dec52cb3ae103ce22358e3894b31cad47a6f22bLast-Modified: Tue Apr 2 16:51:45 2013 -070
Ubuntu下Java环境的搭建 macroli java 工作 ubuntu
配置命令：　　$sudo apt-get install ubuntu-restricted-extras 　　再运行如下命令：　　$sudo apt-get install sun-java6-jdk 　　待安装完毕后选择默认Java. 　　$sudo update- alternatives --config java 　　安装过程提示选择，输入“2”即可，然后按回车键确定。
js字符串转日期（兼容IE所有版本） qiaolevip TO Date String IE
/** * 字符串转时间（yyyy-MM-dd HH:mm:ss） * result （分钟） */ stringToDate : function(fDate){ var fullDate = fDate.split(" ")[0].split("-"); var fullTime = fDate.split("
【数据挖掘学习】关联规则算法Apriori的学习与SQL简单实现购物篮分析 superlxw1234 sql 数据挖掘关联规则
关联规则挖掘用于寻找给定数据集中项之间的有趣的关联或相关关系。关联规则揭示了数据项间的未知的依赖关系，根据所挖掘的关联关系，可以从一个数据对象的信息来推断另一个数据对象的信息。例如购物篮分析。牛奶 ⇒ 面包 [支持度：3%，置信度：40%] 支持度3%：意味3%顾客同时购买牛奶和面包。置信度40%：意味购买牛奶的顾客40%也购买面包。规则的支持度和置信度是两个规则兴
Spring 5.0 的系统需求，期待你的反馈 wiselyman spring
Spring 5.0将在2016年发布。Spring5.0将支持JDK 9。 Spring 5.0的特性计划还在工作中，请保持关注，所以作者希望从使用者得到关于Spring 5.0系统需求方面的反馈。