Abandon_first

详解 TensorFlow TFLite 移动端（安卓）部署物体检测 demo（1）——照本宣科

文章目录

- 写在前面
- examples/lite/examples/object_detection/android
- - 简介
  - 使用 Android Studio 在手机上运行安装 demo app
  - - 上帝视角：需要准备什么呢？
    - 上帝视角：Android Studio 运行 demo
    - 初见效果
  - 再出发
  - - 关于前面报错模型没有 metadata 信息
    - 关于 demo 的主要更新
    - 两种 inference 方式的切换
    - 关于 demo 自带的模型
    - 想要换成自己的模型？

写在前面

先简单介绍一下，总体我要做的任务是，在移动端实时地进行人体动作行为检测和自定义类别的物体检测。这块需求中间断续和改动比较多，时间跨度也比较大。由于一些历史原因，只能先把人体动作行为检测降级改成物体检测同自定义类别的物体检测一起做，比如通过使用物体检测嘴巴，再加上嘴巴宽高比例来判断“张嘴”动作。但是如果抛开各种负担，是应该分开两个模型分别做动作行为和物体检测，如此可以达到更精细的效果。

移动端部署有很多工具，我采用的是 Tensorflow 的 TFLite。虽然 TF 很多时候灵活性上不尽人意，比如 tf2 迟迟出来解决 eager 问题，个人做些小研究实验什么的使用不是很灵活，但是在部署方面还是很方便很给力的，从 PC 到网页到移动端等。

本篇只重点记录 TensorFlow TFLite 移动端物体检测安卓 demo 流程，这是最开始的地方，demo 里用的是 MobileNetv2 SSD 在 COCO 数据集上的模型。关于 MobileNetv2 和 SSD 已经记录过了，本篇也不重点讲述，关于其他很多细节，可能会单独再写。

关于参考资料，就直接看 tensorflow 官方提供的资料就够了，分别是官方给的各种实例 examples 以及各种模型 models资料。这两份资料会在整个过程中经常用到，因为篇幅很长，分了若干篇，后面视情况可能还会用到 tensorflow 的官方代码。

还有一点对我产生较大影响的是，tensorflow 提供的部分文档可能会没有及时更新。这就很坑人了鸭，所以在没有正确地图的情况下，可能会自己会在项目里面去四处查找相关的信息。也就是说，现在路都走通了，从上帝视角看，会省去很多弯路；但是中间有一些我摸索的过程，觉得也很重要。后面我会用“上帝视角”和“地图探索”分别标记我的整个过程，想直接看流程的，只看“上帝视角”就可以，“地图探索”可以跳过。

我有点害怕已经啰啰嗦嗦让人看了好无聊被劝退了，所以我先把 demo 的实际运行样子插图到这里好了（/(ㄒoㄒ)/~~求生欲极强）。

好了，继续安心说回 examples 和 models。我们会先接触了解 examples（本篇），models 一开始还没用到，后面会再说（好嘛，我直接把它安排到下篇去了……）。

examples 中我们主要看的是 lite 子目录，lite 下内容也很丰富，基本涵盖了基础的图像、语音和自然语言等任务。其中图像方面有手写数字识别、图像分类、物体检测、姿势检测、风格迁移等，我们当前比较关注的就是其中的 object detection，其下有三种移动端实现，分别是安卓、IOS和树莓派。

最早我也没有什么前端经验，就选的最好操作的安卓版本，本文后面就只拿安卓的实现来说明。（后来 IOS 版本也都有看过，测试能跑通之后就交给前端（被搁置）了，核心代码介绍也有记录过。）

上帝视角，要进行后续的步骤，首先要先把 examples 项目下载下来：

cd /path/to/put/examples
https://github.com/tensorflow/examples.git

后面要讲的 demo 就仅仅在 /examples/lite/examples/object_detection/android/app 中，emmm 别的没用到的项目可以留着练练手吼～

examples/lite/examples/object_detection/android

OK，到这里已经马上进入到 demo 的核心了。给个链接直达～主要信息都可以在页面的 README 中获取，也不知道为啥后半部分排版有点乱，官方至少一年了一直也没怎么改。

简介

简单介绍下这个 demo ，通过在安卓设备上 build 和 run 一个量化过的、用 COCO 数据集训练好的 MobileNet SSD 模型，实现连续的移动端物体检测。

使用 Android Studio 在手机上运行安装 demo app

上帝视角：需要准备什么呢？

首先，至少需要准备一个安卓手机和 Android Studio。

关于手机的话，去年最早我用小米 8 尝试的时候就可以勉强带得动（时间稍长就会软件崩溃强行退出），近两年上市的智能手机应该都是 OK 的。（今年再重启这个需求的时候，重新官网拿这部分下来用发现整体检测都慢了很多，这个目前还没细看具体为什么。）

Android Studio 是用来做安卓应用开发的，因为 tflite 给的这个 demo 几乎等于傻瓜式直接运行了，并不需要完全重头学习安卓开发，即使没做过跟着指引看一看也就可以理解的，千万别被吓跑鸭。需要安卓开发环境在 API 21 以上，Android Studio 在 3.2 及以上，直接官网下最新的版本就可以。（插播一句，自 4.1 版本开始 Android Studio 支持 tflite 模型文件的信息查看了，后面还会提到呦～）

下载安装 Android Studio 之后，打开我们之前下载好的项目 /examples/lite/examples/object_detection/android/app。

上帝视角：Android Studio 运行 demo

打开之后，它会根据 demo 中自带的 gradle 文件自行 Gradle Sync 下载安装依赖等进行配置，很乖，如果失败就科学上网解决一下。

等这些处理好之后，上面菜单栏的绿色运行按钮就亮了，可以运行了。连接你的电脑和手机，调成传输文件开发模式，Android Studio 就可以检测到你的手机设备，点击运行就可以了。

第一次运行的时候，会根据 demo 中写好的下载模型的文件下载模型（下图最后一行就是在下载模型）。这个步骤也是不成功就科学上网解决。

当我时过很久回头写这个的时候，本来想把去年这里的模型直接放到对应位置下省得下了，但是我发现报错了。在很靠前的位置初始化 ObjectDetector 的时候就出错了，如下图。

它说，找不到 TFLite Model 的 Metadata，还没有细看具体哪里变了，可能是官方 demo 哪里改动过了（后面再说），所以我也是下载的最新的，demo 中的模型现在是这个，提取码 pp6h。

初见效果

运行安装之后，你的手机中就会出现一个黄色的 TFLite 的 APP 图标，实际运行就像前面我插的那个动图。具体识别的类别，是根据这个模型被训练时的标签类别决定的，这里就是常见的一些东西，emmm 我的白色小耳机它不认得，误检了，还有杯子鼠标等这个准确率啥的哎就凑合看吧要什么自行车。

再出发

到这一步，真切地看到手机实现物体检测，应该不会因为我的讲述被劝退了吧（孩怕），整装再出发去看看完成这个小工作的中的很多细节吧。

关于前面报错模型没有 metadata 信息

上帝视角： tensorflow 在此方面进行了更新，模型必须包含 metadata 信息才可以用。心里知道这一点，就可以先跳过对 metadata 的纠结，进行下一项。

地图探索：到这里的时候，因为要照着 README 展开流程讲，我在其中发现了前面我提到的那个报错(没有模型的 Metadata 那里)的原因。是因为这个 demo 被更新过，应该是三四个月前 demo 更新提供了两种实现检测的方案，分别是 lib_task_api 和 lib_interpreter，两种 inference solutions 之间可以切换（就是下面文件夹中选中的这俩）。而其相关的信息，我写在了下个小标题中。

关于 demo 的主要更新

其中 lib_task_api 是直接使用现成的 Task 库集成模型 API 进行 inference，而 lib_interpreter 可以使用户自定义 inference pipeline。照着 README 文件找到 app 下的 build.gradle 可以找到下面几行。其中有两行注释，第二行注释也就是 taskApi 那里被标注了是 default 并且是 high-level API，所以更新后的 demo 是默认使用 taskApi 的方式使用高级 API 来运行的。

    flavorDimensions "tfliteInference"
    productFlavors {
       // The TFLite inference is built using the TFLite Java interpreter.
       interpreter {
           dimension "tfliteInference"
       }
       // Default: The TFLite inference is built using the TFLite Task library (high-level API).
       taskApi {
           getIsDefault().set(true)
           dimension "tfliteInference"
       }
    }

关于这个 TaskApi 的介绍链接在这里，往下翻一下就可以看到有这点说明如下图（稍微有点长，没有截全），其中就提到了这个 API 强制要求 TFLite 模型的 Metadata。

而去年我做的时候，还没有这两种选择，当时就是另外一种 lib_interpreter 的方式，介绍在这里。它使用的就是 TensorFlow Lite Interpreter Java API，当时用的模型也就适配这种用法，可以跑通。

两种 inference 方式的切换

README 也说了可以在两个 inference solutions 之间切换，切换方式如下：
（1）在 Android Studio 软件界面的左下角找到 Build Variants。

（2）点击 Build Variants 打开它的工具栏，如下图。点击图中蓝色选中的 taskApiDebug 就可以弹出来其他选项，选择 InterpreterDebug 就切换到 lib_interpreter 方式了。

README 关于如何选择两个 inference API，也给出了建议。如果只是想简单地直接运行一下这个 app，推荐使用默认的 lib_task_api 做 inference 就好了；如果你希望自定义你的模型并且能够控制输入输出的细节信息，那么更建议使用 lib_interpreter 。

上帝视角：可以先乖乖地按照建议，选择 lib_interpreter 的方式。但是切换到 lib_interpreter 的方式，也拯救不了去年的模型，因为 lib_interpreter 也是被更新了的，这两种方式现在都需要写入 metadata 到 tflite 模型才可以。所以别费力气了，下一步就好了～

地图探索：如何得到上面这段上帝视角的呢？那就再甩个链接给你喽～因为我真的去看了 task_api 和 interpreter 在 Android Studio 的具体使用鸭，还对比了和一年前的旧版的异同。

关于 demo 自带的模型

上帝视角：这个模型是 tensorflow 已经写入过 metadata 的 tflite，所以直接就可以在这里用。

模型这里，demo 自己提供的可以在 Android Studio 第一次运行时自动下载解压到指定目录。负责下载模型并解压放置的文件在 app 文件夹下，文件名为 download_model.gradle。内容如下：

task downloadModelFile(type: Download) {
    src 'https://tfhub.dev/tensorflow/lite-model/ssd_mobilenet_v1/1/metadata/2?lite-format=tflite'
    dest project.ext.ASSET_DIR + '/detect.tflite'
    overwrite false
}
preBuild.dependsOn downloadModelFile

可以看到它下载模型的链接，还有存放的位置在 /examples/lite/examples/object_detection/android/app/src/main/assets/detect.tflite，如果模型已存在就不会下载覆盖了。

说到这里，如果后面你想训练自己的模型，就可以把模型修改名字放到 assets 目录下。这个目录下还有另一个文件，是模型对应的标签 labelmap.txt。对于 COCO 数据集训练出来的模型对应的 labelmap.txt 也就是 demo 中自带的 label 文件一共有 91 类，前几个 label 是这样的：

person
bicycle
car
motorcycle
airplane
bus
train
…

想要换成自己的模型？

这一段路可能稍微长一点，整个过程可以分为以下几步。
（1）准备你自己的检测模型；
（2）将这个模型 freeze，得到固化后的 Tensorflow Lite graph；
（3）把上一步的 frozen graph 转格式生成 tflite 的模型，连同你的 labelmap 一起放到 assets 下。
（4）上帝视角：把 labelmap 信息写入到 tflite 中，生成携带 metadata 的 tflite 模型。地图探索：这一步 app 下面的 README 压根儿没讲啊！！！也就是最早我看到的时候，根本不知道还有这一步存在呀，很多文档没有及时更新呀！需要自己找资料一点点看呀！

其中第（1）步等同于平时 PC 端训练模型，而后面（2）（3）（4）步骤是在移动端实现检测的特有步骤。

粗略来讲，PC 端训练得到的模型，参数量大且精细，需要的运行资源相对也较多。而在移动端实现检测时，无论是存储还是运算，总是希望资源占用得少一些，那么这个时候就需要对模型进行改进。

改进模型使其更适合移动端大概可以从下面两个角度出发：

改进模型的网络结构：比如 MobileNet 系列就是特意考量如何降低常见模型的参数量，旨在移动端减少资源的占用，提升性能和效果。其重点在于精简改变模型的结构，用更少更小的 kernel，在保留一定精度的同时减少参数量。
那么如果不考虑改变模型结构和参数量，还有哪些方式能“压缩”模型？那就是量化了。量化粗略地来讲，可以是直接改变模型中的参数类型，比如 float32 改成 uint8，直接降低参数占用的存储空间，在移动端计算时直接“估算”，以此方式降低模型在移动端占用的存储和计算资源。而更细致的量化，应该会锱铢必较，比如考虑计算图中的每个 operation 参数分布，模型某个分支剪掉等等。

乍一开始了解可能还比较抽象，后面一步步走进去看一看就好了。

哎算了，有点长，我要重开一篇。跑了先，der～

OpenCV ML 模块使用指南 ice_junjun OpenCV opencv 人工智能计算机视觉
一、模块概述OpenCV的ML模块提供了丰富的机器学习算法，可用于解决各种计算机视觉和数据分析问题。本指南将详细介绍该模块中主要的机器学习算法，包括支持向量机（SVM）、K均值聚类（K-Means）和神经网络（ANN），并结合图像分类和聚类分析这两个典型应用场景进行代码实现与解释。二、主要函数及类详解（一）支持向量机（SVM）：cv.ml.SVM_create()功能支持向量机（SVM）是一种强大
强化学习中策略网络模型设计与优化技巧数字扫地僧计算机视觉深度学习
I.引言强化学习（ReinforcementLearning,RL）是一种通过与环境交互，学习如何采取行动以最大化累积奖励的机器学习方法。策略网络（PolicyNetwork）是强化学习中一种重要的模型，它直接输出动作的概率分布或具体的动作。本篇博客将深入探讨策略网络的设计原则、优化技巧，并结合具体实例展示其应用。II.策略网络的基本概念A.策略网络的定义策略网络是一种神经网络，它接受当前状态作为
介于YOLOv5的裂缝识别系统程序员～小强 YOLO
介于YOLOv5的裂缝识别系统在现代工业中，裂缝监测是的保障设施安全的重要环节。我们公司的新项目——基于YOLOv5的裂缝识别系统，将为您提供高效、精准的解决方案，助力各类工程项目的质量管理。系统优势我们的裂缝识别系统借助YOLOv5进行深度学习，经过精心训练，拥有强大的图像识别能力。只需简单的步骤，您就能将复杂的裂缝检测转化为轻松的操作，让分析变得更加简单、高效。核心功能图片上传与场景选择用户可
常用的API设计都有哪些风格？优劣势？ PhilipJ0303 java 面试 API设计接口
API设计是软件开发中非常重要的一部分，良好的API设计可以提高系统的可维护性、扩展性和易用性。常见的API设计风格主要有以下几种：1.RESTfulAPI3.gRPC4.SOAP（SimpleObjectAccessProtocol）5.WebSocket6.RPC（RemoteProcedureCall）7.Webhook总结风格适用场景优点缺点RESTfulWeb、移动端、简单CRUD操作简
卷积神经网络Batch Normalization的作用 arron8899 cnn batch 人工智能
BatchNormalization的作用（通俗版）1.像“稳定器”一样校准每层输入想象你在烤多层蛋糕，每层蛋糕的烘烤温度不同（相当于神经网络的每一层数据分布不同）。没有BN时，烤箱温度忽高忽低，导致有的层烤焦（梯度爆炸），有的层不熟（梯度消失）。BN的作用相当于给每一层装了一个自动温度调节器，实时将输入数据调整到标准温度（均值为0，方差为1），保证每层都能均匀受热，训练更稳定。2.让模型训练“少
使用Dall-E生成图像：文本到图像的魔力 shuoac 计算机视觉人工智能 python
使用Dall-E生成图像：文本到图像的魔力技术背景介绍Dall-E是OpenAI开发的一个强大的文本到图像生成模型，它能够根据自然语言描述创造出全新的数字图像。这一技术基于深度学习的方法，使得创意与AI图像生成的结合更具可能性。本文将介绍如何调用Dall-EAPI来生成图像，从而使开发者能够将这一技术应用到自己的项目中。核心原理解析Dall-E利用大型语言模型（LLM）从用户提供的文本描述中提取详
【深度学习|地学应用】滑坡灾害早期隐患的概念、特征及识别方法，同时解释其与人工边坡、滑坡易发性之间的联系与区别。 985小水博一枚呀深度学习人工智能
【深度学习|地学应用】滑坡灾害早期隐患的概念、特征及识别方法，同时解释其与人工边坡、滑坡易发性之间的联系与区别。【深度学习|地学应用】滑坡灾害早期隐患的概念、特征及识别方法，同时解释其与人工边坡、滑坡易发性之间的联系与区别。文章目录【深度学习|地学应用】滑坡灾害早期隐患的概念、特征及识别方法，同时解释其与人工边坡、滑坡易发性之间的联系与区别。1.滑坡灾害早期隐患的概念与特征概念主要特征2.通过光学
一切皆是映射：实现神经网络的硬件加速技术：GPU、ASIC（专用集成电路）和FPGA（现场可编程门阵列） AI天才研究院 AI大模型企业级应用开发实战 DeepSeek R1 &大数据AI人工智能大模型计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
文章目录一切皆是映射：实现神经网络的硬件加速技术：GPU、ASIC（专用集成电路）和FPGA（现场可编程门阵列）1.背景介绍2.核心概念与联系3.核心算法原理&具体操作步骤3.1算法原理概述3.2算法步骤详解3.2.1GPU加速3.2.2ASIC加速3.2.3FPGA加速3.3算法优缺点GPUASICFPGA3.4算法应用领域4.数学模型和公式&详细讲解&举例说明4.1数学模型构建4.2公式推导过
给普通人看的深度学习说明书：用快递系统理解AI如何思考嵌入式Jerry Python AI 人工智能深度学习
第一章：理解AI的思维方式（快递版）1.1快递分拣站的故事假设你管理一个快递分拣站：传统方法：手动制定规则（比如根据邮编分拣）机器学习：观察老员工的分拣记录，总结规律深度学习：搭建自动分拣流水线，自主发现隐藏规则1.2神经网络就像智能分拣机传送带（输入层）：接收包裹信息（图片像素/文字等）#就像扫描快递单input_data=[0.2,0.7,0.1]#归一化后的特征数据分拣工人（隐藏层）：每个工
使用PyTorch搭建Transformer神经网络:入门篇 DASA13 pytorch transformer 神经网络
1.简介Transformer是一种强大的神经网络架构,在自然语言处理等多个领域取得了巨大成功。本教程将指导您使用PyTorch框架从头开始构建一个Transformer模型。我们将逐步解释每个组件,并提供详细的代码实现。2.环境设置首先,确保您的系统中已安装Python(推荐3.7+版本)。然后,安装PyTorch和其他必要的库:pipinstalltorchnumpymatplotlib3.P
解析大模型归一化：提升训练稳定性和性能的关键技术秋声studio 口语化解析深度学习人工智能大模型归一化
引言在深度学习领域，特别是在处理大型神经网络模型时，归一化（Normalization）是一项至关重要的技术。它可以提高模型的训练稳定性和性能，在加速收敛方面发挥了重要作用。本文将深入探讨大模型归一化的原理、常见方法及其应用场景，并结合实际案例和代码示例进行说明。一、归一化的作用与理论基础归一化的主要目的是为了提高模型的训练稳定性和性能。具体来说，归一化有以下几个关键作用：提高训练稳定性：在神经网
小白零基础学数学建模系列-引言与课程目录川川菜鸟数学建模小白到精通系列数学建模
目录引言一、我们的专辑包含哪些内容？第一周：数学建模基础与工具第二周：高级数学建模技巧与应用第三周：机器学习基础与数据处理第四周：监督学习与无监督学习算法第五周：神经网络二、学完本专辑能收获到什么？三、适合什么样的人群学习？四、如何学习本专辑？课程目录第1周：数学建模基础与工具第1天：数学建模入门介绍第2天：数学建模工具介绍第3天：线性回归与曲线拟合第4天：线性规划第5天：动态规划第2周：高级数学
深入解析深度学习中的过拟合与欠拟合诊断、解决与工程实践古月居GYH 深度学习人工智能
一、引言：模型泛化能力的核心挑战在深度学习模型开发中，欠拟合与过拟合是影响泛化能力的两个核心矛盾。据GoogleBrain研究统计，工业级深度学习项目中有63%的失败案例与这两个问题直接相关。本文将从基础概念到工程实践，系统解析其本质特征、诊断方法及解决方案，并辅以可复现的代码案例。二、核心概念与通熟易懂解释简单而言，欠拟合是指模型不能在训练集上获得足够低的误差。换句换说，就是模型复杂度低，模型在
Umi-OCR 实践教程：离线、免费、高效的图像文字识别工具几道之旅人工智能智能体及数字员工 ocr 人工智能
一、工具简介Umi-OCR是一款开源、免费且支持离线运行的OCR（光学字符识别）工具，适用于Windows和Linux系统。它基于深度学习技术，能够高效提取图像中的文字，支持多语言识别、批量处理、截屏识别等功能，尤其适合对隐私敏感或网络受限的场景。核心亮点：离线运行：无需联网，保护隐私。多引擎支持：提供Paddle（高性能）和Rapid（低配兼容）两种引擎。批量处理：支持图片、PDF、电子书等多格
基于ChatGPT、GIS与Python机器学习的地质灾害风险评估、易发性分析、信息化建库及灾后重建高级实践 weixin_贾防洪评价风险评估滑坡泥石流地质灾害
第一章、ChatGPT、DeepSeek大语言模型提示词与地质灾害基础及平台介绍【基础实践篇】1、什么是大模型？大模型（LargeLanguageModel,LLM）是一种基于深度学习技术的大规模自然语言处理模型。代表性大模型：GPT-4、BERT、T5、ChatGPT等。特点：多任务能力：可以完成文本生成、分类、翻译、问答等任务。上下文理解：能理解复杂的上下文信息。广泛适配性：适合科研、教育、行
anythingLLM 使用教程惟贤箬溪穷玩Ai AIGC 人工智能
一、anythingLLM简介anythingLLM是一款灵活且功能强大的语言模型，它基于先进的深度学习架构构建，旨在为用户提供多样化的自然语言处理服务。其设计理念注重通用性和可扩展性，能够适应多种领域和任务，无论是文本生成、智能问答，还是翻译、摘要提取等，都能展现出出色的性能。与同类模型相比，anythingLLM具有训练数据丰富、模型优化程度高的优势，能够生成更符合逻辑、更具实用性的文本内容。
深度解析大模型推理框架：原理、应用与实践百度_开发者中心人工智能大模型自然语言处理
在当今数据驱动的时代，大模型推理框架已经成为人工智能领域的重要支柱。本文将通过简明扼要、清晰易懂的方式，带领读者深入了解大模型推理框架的原理、应用领域和实践经验，帮助读者更好地掌握这一技术，并在实际工作中发挥其价值。一、大模型推理框架简介大模型推理框架是指一种基于深度学习技术的推理框架，主要用于解决大规模数据集下的复杂问题。该框架通过对海量数据进行高效的训练和推理，能够快速地对各种复杂场景进行分析
大模型推理框架：从理论到实践的全面解析百度_开发者中心人工智能大模型自然语言处理
在数据驱动的时代，深度学习技术已经渗透到各个行业，从图像识别到自然语言处理，从推荐系统到智能客服，其应用无处不在。然而，深度学习模型的训练和推理过程往往涉及大量数据和复杂计算，传统的计算框架难以满足需求。因此，大模型推理框架应运而生，成为解决这一问题的关键。一、大模型推理框架基本概念大模型推理框架是一种基于深度学习技术的推理框架，它通过对海量数据进行高效的训练和推理，能够快速地对各种复杂场景进行分
回归任务训练--MNIST全连接神经网络（Mnist_NN）豆芽819 深度学习框架PyTorch pytorch 深度学习人工智能机器学习回归
importtorchimportnumpyasnpimportloggingfromtorch.utils.dataimportTensorDataset,DataLoaderfromtorch.utils.dataimportDataLoader#配置日志logging.basicConfig(level=logging.INFO,format='%(asctime)s-%(levelname
Yolo系列之Yolo的基本理解是十一月末 YOLO python 开发语言 yolo
YOLO的基本理解目录YOLO的基本理解1YOLO1.1概念1.2算法2单、多阶段对比2.1FLOPs和FPS2.2one-stage单阶段2.3two-stage两阶段1YOLO1.1概念YOLO(YouOnlyLookOnce)是一种基于深度学习的目标检测算法，由JosephRedmon等人于2016年提出。它的核心思想是将目标检测问题转化为一个回归问题，通过一个神经网络直接预测目标的类别和位
PyTorch基础知识讲解（一）完整训练流程示例苏雨流丰机器学习 pytorch 人工智能 python 机器学习深度学习
文章目录Tutorial1.数据处理2.网络模型定义3.损失函数、模型优化、模型训练、模型评价4.模型保存、模型加载、模型推理Tutorial大多数机器学习工作流程涉及处理数据、创建模型、优化模型参数和保存训练好的模型。本教程向你介绍一个用PyTorch实现的完整的ML工作流程，并提供链接来了解这些概念中的每一个。我们将使用FashionMNIST数据集来训练一个神经网络，预测输入图像是否属于以下
TensorFlow和Pytorch在功能上的区别以及优势 Honeysea_70 #算法 tensorflow pytorch 人工智能
功能上的区别1.计算图TensorFlow：使用静态计算图（StaticGraph）。在运行模型之前，需要先构建完整的计算图，然后通过会话（Session）运行图。优点是性能优化更高效，适合大规模分布式训练和生产环境部署。缺点是调试相对复杂，因为计算图的构建和运行是分离的。PyTorch：使用动态计算图（DynamicGraph）。计算图是动态构建和执行的，每次迭代都会重新构建图。优点是调试方便，
AI进化论：从图灵测试到智能革命的临界点 A达峰绮人工智能数据处理经验分享 AIGC AI人工智能
智能觉醒的起源密码（1943-2010）在曼彻斯特维多利亚大学的实验室里，1948年"Baby"计算机完成人类首个存储程序运行实验时，艾伦·图灵正在构思《计算机器与智能》。这篇划时代论文提出的"模仿游戏"测试，为人工智能奠定了哲学基础。1956年达特茅斯会议上，麦卡锡正式提出"人工智能"概念，当时学界乐观预测"二十年内机器将完成人类所有工作"。神经网络的发展轨迹充满戏剧性：1958年罗森布拉特发明
大语言模型学习路线：从入门到实战大模型官方资料语言模型学习人工智能产品经理自然语言处理搜索引擎
大语言模型学习路线：从入门到实战在人工智能领域，大语言模型（LargeLanguageModels,LLMs）正迅速成为一个热点话题。本学习路线旨在为有基本Python编程和深度学习基础的学习者提供一个清晰、系统的大模型学习指南，帮助你在这一领域快速成长。本学习路线更新至2024年02月，后期部分内容或工具可能需要更新。适应人群已掌握Python基础具备基本的深度学习知识学习步骤本路线将通过四个核
深度学习与目标检测系列(六) 本文约(4.5万字) | 全面解读复现ResNet | Pytorch | 小酒馆燃着灯深度学习目标检测 pytorch 人工智能 ResNet 残差连接残差网络
文章目录解读Abstract—摘要翻译精读主要内容Introduction—介绍翻译精读背景RelatedWork—相关工作ResidualRepresentations—残差表达翻译精读主要内容ShortcutConnections—短路连接翻译精读主要内容DeepResidualLearning—深度残差学习ResidualLearning—残差学习翻译精读ResNet目的以前方法本文改进本质
深度学习与目标检测系列(三) 本文约(4万字) | 全面解读复现AlexNet | Pytorch | 小酒馆燃着灯深度学习目标检测 pytorch AlexNet 人工智能
文章目录解读Abstract-摘要翻译精读主要内容1.Introduction—前言翻译精读主要内容：本文主要贡献：2.TheDataset-数据集翻译精读主要内容：ImageNet简介：图像处理方法：3.TheArchitecture—网络结构3.1ReLUNonlinearity—非线性激活函数ReLU翻译精读传统方法及不足本文改进方法本文的改进结果3.2TrainingonMultipleG
使用 Milvus 进行向量数据库管理与实践 qahaj milvus 数据库 python
技术背景介绍在当今的AI与机器学习应用中，处理和管理大量的嵌入向量是一个常见的需求。Milvus是一个开源向量数据库，专门用于存储、索引和管理深度神经网络以及其他机器学习模型生成的大规模嵌入向量。它的高性能和易用性使其成为处理向量数据的理想选择。核心原理解析Milvus的核心功能体现在其强大的向量索引和搜索能力。它支持多种索引算法，包括IVF、HNSW等，使其能够高效地进行大规模向量的相似性搜索操
物理学不存在了？诺贝尔物理学奖颁给了人工智能资讯新鲜事人工智能
2024年10月8日，瑞典皇家科学院宣布，将2024年诺贝尔物理学奖授予美国普林斯顿大学教授约翰·J·霍普菲尔德（JohnJ.Hopfield）和加拿大多伦多大学教授杰弗里·E·辛顿（GeoffreyE.Hinton），以表彰他们“在人工神经网络机器学习方面的基础性发现和发明”。辛顿在接受电话采访时表示：“完全没想到”。实话实说，在结果出来前，大家也都没想到。因为在外界预测里，今年的诺贝尔物理学奖
计算机视觉技术探索：美颜SDK如何利用深度学习优化美颜、滤镜功能？美狐美颜sdk 美颜SDK 美颜API 直播美颜SDK 计算机视觉深度学习直播美颜SDK 美颜sdk 第三方美颜sdk 美颜api
时下，计算机视觉+深度学习正在重塑美颜技术，通过智能人脸检测、AI滤镜、深度美肤、实时优化等方式，让美颜效果更加自然、精准、个性化。那么，美颜SDK如何结合深度学习来优化美颜和滤镜功能？本文将深入解析AI在美颜技术中的应用，并探讨其未来发展趋势。一、深度学习如何赋能美颜SDK？1.AI人脸检测与关键点识别：精准捕捉五官在美颜过程中，首先需要精准检测人脸位置和五官特征点，确保美颜效果不会失真。深度学
深度学习模型性能全景评估与优化指南 niuTaylor 深度学习人工智能
深度学习模型性能全景评估与优化指南一、算力性能指标体系1.核心算力指标对比指标计算方式适用场景硬件限制TOPS(TeraOperationsPerSecond)每秒万亿次整数运算量化模型推理NVIDIAJetsonNano仅支持FP16/FP32TFLOPS(TeraFLoating-pointOPerationsperSecond)TFLOPS=Cores×FLOPs/Cycle×Frequen
HttpClient 4.3与4.3版本以下版本比较 spjich java httpclient
网上利用java发送http请求的代码很多，一搜一大把，有的利用的是java.net.*下的HttpURLConnection，有的用httpclient，而且发送的代码也分门别类。今天我们主要来说的是利用httpclient发送请求。 httpclient又可分为 httpclient3.x httpclient4.x到httpclient4.3以下 httpclient4.3
Essential Studio Enterprise Edition 2015 v1新功能体验 Axiba .net
概述：Essential Studio已全线升级至2015 v1版本了！新版本为JavaScript和ASP.NET MVC添加了新的文件资源管理器控件，还有其他一些控件功能升级，精彩不容错过，让我们一起来看看吧！ syncfusion公司是世界领先的Windows开发组件提供商，该公司正式对外发布Essential Studio Enterprise Edition 2015 v1版本。新版本
[宇宙与天文]微波背景辐射值与地球温度 comsci 背景
宇宙这个庞大,无边无际的空间是否存在某种确定的,变化的温度呢? 如果宇宙微波背景辐射值是表示宇宙空间温度的参数之一,那么测量这些数值,并观测周围的恒星能量输出值,我们是否获得地球的长期气候变化的情况呢? &nbs
lvs-server 男人50 server
#!/bin/bash # # LVS script for VS/DR # #./etc/rc.d/init.d/functions # VIP=10.10.6.252 RIP1=10.10.6.101 RIP2=10.10.6.13 PORT=80 case $1 in start) /sbin/ifconfig eth2:0 $VIP broadca
java的WebCollector爬虫框架 oloz 爬虫
WebCollector主页： https://github.com/CrawlScript/WebCollector 下载：webcollector-版本号-bin.zip将解压后文件夹中的所有jar包添加到工程既可。接下来看demo package org.spider.myspider; import cn.edu.hfut.dmic.webcollector.cra
jQuery append 与 after 的区别小猪猪08
1、after函数定义和用法： after() 方法在被选元素后插入指定的内容。语法： $(selector).after(content) 实例： <html> <head> <script type="text/javascript" src="/jquery/jquery.js"></scr
mysql知识充电香水浓 mysql
索引索引是在存储引擎中实现的，因此每种存储引擎的索引都不一定完全相同，并且每种存储引擎也不一定支持所有索引类型。根据存储引擎定义每个表的最大索引数和最大索引长度。所有存储引擎支持每个表至少16个索引，总索引长度至少为256字节。大多数存储引擎有更高的限制。MYSQL中索引的存储类型有两种：BTREE和HASH，具体和表的存储引擎相关； MYISAM和InnoDB存储引擎
我的架构经验系列文章索引 agevs 架构
下面是一些个人架构上的总结，本来想只在公司内部进行共享的，因此内容写的口语化一点，也没什么图示，所有内容没有查任何资料是脑子里面的东西吐出来的因此可能会不准确不全，希望抛砖引玉，大家互相讨论。要注意，我这些文章是一个总体的架构经验不针对具体的语言和平台，因此也不一定是适用所有的语言和平台的。（内容是前几天写的，现附上索引）前端架构 http://www.
Android so lib库远程http下载和动态注册 aijuans andorid
一、背景在开发Android应用程序的实现，有时候需要引入第三方so lib库，但第三方so库比较大，例如开源第三方播放组件ffmpeg库, 如果直接打包的apk包里面, 整个应用程序会大很多.经过查阅资料和实验，发现通过远程下载so文件，然后再动态注册so文件时可行的。主要需要解决下载so文件存放位置以及文件读写权限问题。二、主要
linux中svn配置出错 conf/svnserve.conf:12: Option expected 解决方法 baalwolf option
在客户端访问subversion版本库时出现这个错误： svnserve.conf:12: Option expected 为什么会出现这个错误呢，就是因为subversion读取配置文件svnserve.conf时，无法识别有前置空格的配置文件，如### This file controls the configuration of the svnserve daemon, if you##
MongoDB的连接池和连接管理 BigCat2013 mongodb
在关系型数据库中，我们总是需要关闭使用的数据库连接，不然大量的创建连接会导致资源的浪费甚至于数据库宕机。这篇文章主要想解释一下mongoDB的连接池以及连接管理机制，如果正对此有疑惑的朋友可以看一下。通常我们习惯于new 一个connection并且通常在finally语句中调用connection的close()方法将其关闭。正巧，mongoDB中当我们new一个Mongo的时候，会发现它也
AngularJS使用Socket.IO bijian1013 JavaScript AngularJS Socket.IO
目前，web应用普遍被要求是实时web应用，即服务端的数据更新之后，应用能立即更新。以前使用的技术（例如polling）存在一些局限性，而且有时我们需要在客户端打开一个socket，然后进行通信。 Socket.IO(http://socket.io/)是一个非常优秀的库，它可以帮你实
[Maven学习笔记四]Maven依赖特性 bit1129 maven
三个模块为了说明问题，以用户登陆小web应用为例。通常一个web应用分为三个模块，模型和数据持久化层user-core, 业务逻辑层user-service以及web展现层user-web， user-service依赖于user-core user-web依赖于user-core和user-service 依赖作用范围 Maven的dependency定义
【Akka一】Akka入门 bit1129 akka
什么是Akka Message-Driven Runtime is the Foundation to Reactive Applications In Akka, your business logic is driven through message-based communication patterns that are independent of physical locatio
zabbix_api之perl语言写法 ronin47 zabbix_api之perl
zabbix_api网上比较多的写法是python或curl。上次我用java－－http://bossr.iteye.com/blog/2195679，这次用perl。for example: #!/usr/bin/perl use 5.010 ; use strict ; use warnings ; use JSON :: RPC :: Client ; use
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ brotherlamp linux运维工程师 linux运维工程师教程 linux运维工程师视频 linux运维工程师资料 linux运维工程师自学
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ ----------------------------------------------------- 兄弟连Linux运维工程师课堂实录-计算机基础-1-课程体系介绍1 链接：http://pan.baidu.com/s/1i3GQtGL 密码：bl65 兄弟连Lin
bitmap求哈密顿距离-给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y( bylijinnan java
import java.util.Random; /** * 题目： * 给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y(y1,y2,y3,y4,y5)， * 使得他们的哈密顿距离（d=|x1-y1| + |x2-y2| + |x3-y3| + |x4-y4| + |x5-y5|）最大
map的三种遍历方法 chicony map
package com.test; import java.util.Collection; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Set; public class TestMap { public static v
Linux安装mysql的一些坑 chenchao051 linux
1、mysql不建议在root用户下运行 2、出现服务启动不了，111错误，注意要用chown来赋予权限，我在root用户下装的mysql，我就把usr/share/mysql/mysql.server复制到/etc/init.d/mysqld, (同时把my-huge.cnf复制/etc/my.cnf) chown -R cc /etc/init.d/mysql
Sublime Text 3 配置 daizj 配置 Sublime Text
Sublime Text 3 配置解释(默认){// 设置主题文件“color_scheme”: “Packages/Color Scheme – Default/Monokai.tmTheme”,// 设置字体和大小“font_face”: “Consolas”,“font_size”: 12,// 字体选项：no_bold不显示粗体字，no_italic不显示斜体字，no_antialias和
MySQL server has gone away 问题的解决方法 dcj3sjt126com SQL Server
MySQL server has gone away 问题解决方法，需要的朋友可以参考下。应用程序（比如PHP）长时间的执行批量的MYSQL语句。执行一个SQL，但SQL语句过大或者语句中含有BLOB或者longblob字段。比如，图片数据的处理。都容易引起MySQL server has gone away。今天遇到类似的情景，MySQL只是冷冷的说：MySQL server h
javascript/dom:固定居中效果 dcj3sjt126com JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&
使用 Spring 2.5 注释驱动的 IoC 功能 e200702084 spring bean 配置管理 IOC Office
使用 Spring 2.5 注释驱动的 IoC 功能 developerWorks 文档选项将打印机的版面设置成横向打印模式打印本页将此页作为电子邮件发送将此页作为电子邮件发送级别：初级陈雄华 ([email protected]), 技术总监, 宝宝淘网络科技有限公司 2008 年 2 月 28 日 &nb
MongoDB常用操作命令 geeksun mongodb
1. 基本操作 db.AddUser(username,password) 添加用户 db.auth(usrename,password) 设置数据库连接验证 db.cloneDataBase(fromhost)
php写守护进程（Daemon） hongtoushizi PHP
转载自： http://blog.csdn.net/tengzhaorong/article/details/9764655 守护进程（Daemon）是运行在后台的一种特殊进程。它独立于控制终端并且周期性地执行某种任务或等待处理某些发生的事件。守护进程是一种很有用的进程。php也可以实现守护进程的功能。 1、基本概念 &nbs
spring整合mybatis,关于注入Dao对象出错问题 jonsvien DAO spring bean mybatis prototype
今天在公司测试功能时发现一问题：先进行代码说明： 1，controller配置了Scope="prototype"（表明每一次请求都是原子型） @resource/@autowired service对象都可以（两种注解都可以）。 2，service 配置了Scope="prototype"（表明每一次请求都是原子型）
对象关系行为模式之标识映射 home198979 PHP 架构企业应用对象关系标识映射
HELLO!架构一、概念 identity Map:通过在映射中保存每个已经加载的对象，确保每个对象只加载一次，当要访问对象的时候，通过映射来查找它们。其实在数据源架构模式之数据映射器代码中有提及到标识映射，Mapper类的getFromMap方法就是实现标识映射的实现。二、为什么要使用标识映射？在数据源架构模式之数据映射器中 //c
Linux下hosts文件详解 pda158 linux
　1、主机名：　　无论在局域网还是INTERNET上，每台主机都有一个IP地址，是为了区分此台主机和彼台主机，也就是说IP地址就是主机的门牌号。　　公网：IP地址不方便记忆，所以又有了域名。域名只是在公网（INtERNET)中存在，每个域名都对应一个IP地址，但一个IP地址可有对应多个域名。　　局域网：每台机器都有一个主机名，用于主机与主机之间的便于区分，就可以为每台机器设置主机
nginx配置文件粗解 spjich java nginx
#运行用户#user nobody;#启动进程,通常设置成和cpu的数量相等worker_processes 2;#全局错误日志及PID文件#error_log logs/error.log;#error_log logs/error.log notice;#error_log logs/error.log inf
数学函数 w54653520 java
public class S { // 传入两个整数，进行比较，返回两个数中的最大值的方法。 public int get( int num1, int nu