Kin_Zhang

【论文阅读】CVPR2021: MP3: A Unified Model to Map, Perceive, Predict and Plan

Sensor/组织: Uber
Status: Reading
Summary: 非常棒！端到端输出map中间态一种建图感知预测规划的通用框架
Type: CVPR
Year: 2021
引用量: 20

参考与前言

论文链接：

https://openaccess.thecvf.com/content/CVPR2021/papers/Casas_MP3_A_Unified_Model_To_Map_Perceive_Predict_and_Plan_CVPR_2021_paper.pdf

arxiv上链接（CVPR那个链接缺少附录）：

MP3: A Unified Model to Map, Perceive, Predict and Plan

1. Motivation

HD Map有相当丰富的语义信息比如lanes，crosswalks，traffic lights等等的拓扑和信息。这些信息给感知和motion forecast任务提供了很多先验信息。但是

人为制作hd map是非常cost的，而且还需要实时去根据道路维护hd map
即使是持续维护hd map，在运行过程中也要保证有厘米级的定位

由此本文提出一种端到端方法去表达map中间态，同时能在定位失效的情况下整个车辆的运行

问题场景

在没有HD Map的场景下进行自动驾驶任务是比较困难的，比如感知就损失了先验信息，比如道路上更多的是车，行人横穿马路的crosswalk位置等。而更重要的是规划模块大部分时候需要一个地图先验进行车道中心线的跟随。如果没有HD Map的话 SDV（自动驾驶车辆）应该能有能力根据场景内容进行High-level command的输出

【论文阅读】CVPR2021: MP3: A Unified Model to Map, Perceive, Predict and Plan_第1张图片

相关工作对于端到端的基本都是直接收到所有传感器数据进入网络输出动作，并没有一种中间表达态，而这一层存在的意义也很重要：

interpretability 对于自动驾驶系统的可解释性
直接的端到端形式缺乏整体结构和先验知识的有效利用 brittle to distribution shift [44]

论文相关工作部分着重介绍了online mapping, perception, prediction and motion planning各个子模块的工作同时分析他们如何在端到端的下游中起到作用

Contribution

提出了一种 针对端到端任务下的 mapless drivining approach 使得整个过程具有更多可解释性，不会有information loss，而且对于中间态表达的不确定性也有一定解释。主要方法步骤看下部分和框图基本能理解个大概

发现CV会好像论文介绍后也可以不总结贡献哎

问题区

does not incur any information loss

这点怎么证明？... 怎么说明没有information loss 或是其他方法有信息损失呢？

2. Method

提出了使用probabilistic spatial layers去建模环境内的静态和动态部分，其中
- 静态部分是以规划为中心的online mapping，提取处那些区域可以进行驾驶和相关的交通信息（比如红绿灯限速等）
- 动态部分主要是其他道路交通参与者，用一个novel occupancy flow来提供随时间 occupancy和其速度信息。
随后走到motion planning模块进行retrieve dynamically feasible trajectories，预测地图上的spatial mask以给出SDV一条能走的路，同时使用online mapping和occupancy flow用来作为计算可解释性的safe planning cost

【论文阅读】CVPR2021: MP3: A Unified Model to Map, Perceive, Predict and Plan_第2张图片

整体框架

其中 retrieval-based trajectory sampler是从专家的演示中学习到的一种sampler吗？不是model-based？

2.1 LiDAR

首先对比其他直接输入一帧雷达点云不同之处，这里是exploits a history of LiDAR point clouds 以提取场景此时间下更丰富的几何和语义特征点

参考[30] 将 $T_p=10$ 历史LiDAR点弄成BEV 也就是1秒内的所有激光雷达点，然后以 $a=0.2m/\text{voxel}$ 的分辨率进行voxelized处理，ROI为 $W=140m$ 前后各70m，$H=80$，左右各40和 $Z=10$ 高5m，然后参考[9]将高度和时间作为单独的通道以避免使用三维卷积 saving memory and 减少计算时间。所以整个 3D tensor是：$\left(\frac{H}{a}, \frac{W}{a}, \frac{Z}{a} \cdot T_{p}\right)$

下图橙黄部分为LiDAR对应网络框架，同时结合了[9,52]来进行的提取场景中的几何、语义和motion信息

【论文阅读】CVPR2021: MP3: A Unified Model to Map, Perceive, Predict and Plan_第3张图片

2.2 Scene Representations

主要是用来给出环境信息的一定先验，并在这层输出可视化，再有问题出现时，有一定的可解释性。同时包含对静态环境的预测=online map，和预测动态障碍物位置和速度=dynamics occupancy field

下图三为相关的可视化表达，同时因为传感器感知的局限性，考虑不确定性来评估SDV可能出现的危险也是很重要的；图四为dynamic occupancy field的建立过程

【论文阅读】CVPR2021: MP3: A Unified Model to Map, Perceive, Predict and Plan_第4张图片

online map：主要包含可行驶区域（drivable area），可到达道路（reachable lanes），交叉路口（intersection）；正常情况下我们希望SDV尽可能接近reachable lanes，也就是道路中心线，交叉路口主要帮助理解红绿灯，停车和让行等标志

dynamic occupancy field：主要是帮助SDV理解其他道路参与者，如图四所示，先进行实际的栅格占据，再根据预测的路径进行flow的添加，BEV 0.4m/pixel 分辨率，包含：初始栅格（Initial occupancy），temporal motion field‘；需要注意的是对 vehicles, pedestrains and bikes 进行了分类各自都有自己的occupancy flow

从下部分图八中对应到上面的整体框图，可以看到感知和预测模块的整个网络框架细节部分

概率模型

作用：reason about uncertainty in our online map and dynamic occupancy filed，主要就是解释occupancy flow整个的建立过程

下面为notation与公式细节

如图三所示每个map都是自己的语义通道，定义为$\mathcal M$
用 $i$ 表明 spatial index
drivable area 和交叉路口通道分别用 $\mathcal{M}_{i}^{A} \text { and } \mathcal{M}_{i}^{I}$ Bernoulli random variables 伯努利分布
将SDV到车道中心线的距离model as 拉普拉斯算子 $\mathcal{M}_{i}^{D}$，因为作者发现比Gaussian更准确
将SDV到最近车道中心线的方向表示为 $\mathcal{M}_{i}^{\theta}$ 用Von Mises 分布因为范围可以从 -pi到pi
前面提到了会对动态障碍物进行分类 $\mathcal O^c$ 其中c为class 包含：车辆、行人、骑自行车的人 $\mathcal O^c_{t,i}$ 为类c下 spatio temporal index t,i 的Bernoulli random variables
对每个类别在每个 spatio-temporal location进行建分布：$\mathcal{K}_{t, i}^{c}$ over K BEV motion vectors $\left\{\mathcal{V}_{t, i, k}^{c}: k \in 1 \ldots K\right\}$

终于介绍完了 emmm 接着直接走到公式：在连续时间 t 和 $t+1$ 时从位置 $i_1$ 到位置 $i_2$ 的对应整体occupancy flow的概率为：

\[p\left(\mathcal{F}_{\left(t, i_{1}\right) \rightarrow\left(t+1, i_{2}\right)}^{c}\right)=\sum_{k} p\left(\mathcal{O}_{t, i_{1}}^{c}\right) p\left(\mathcal{K}_{t, i_{1}}^{c}=k\right) p\left(\mathcal{V}_{t, i_{1}, k}^{c}=i_{2}\right) \]

其中 $p\left(\mathcal{V}_{t, i_{1}, k}^{c}=i_{2}\right)$ 如果位置 $i_2$ 在连续motion vector附近的4个格的话，使用的是线性插值；否则直接为0 如图四部分，这里是对整体 F occupancy flow，下面为单个格 $i$ 在时间 $t+1$ 下从 t 转过来的所有格 $j$ 的概率：

\[p\left(\mathcal{O}_{t+1, i}^{c}\right)=1-\prod_j\left(1-p\left(\mathcal{F}_{(t, j) \rightarrow(t+1, i)}^{c}\right)\right) \]

如果好奇如何推导的建议查附录，这里就不展开了... 因为看起来问题不大：二项分布有无 & 连乘得大图

2.3 Motion Planning

这一部分有对不确定性的score加入，然后向整体框图那样根据所有的来进行选择一个最小的cost。下图为对应细节框架设计

【论文阅读】CVPR2021: MP3: A Unified Model to Map, Perceive, Predict and Plan_第5张图片

Trajectory Sampling

一开始看的时候... 我还以为是model-based，细看是从large-dataset学到的采样（不用网络）。

从数据集里提取出车辆轨迹，一共150个小时的manual driving data
聚类（因为高效）每个轨迹的bin包含当前SDV的速度、加速度和曲率

使用初始速度、曲率和加速度对应每个bin size为 2.0 (m/s), 0.02 (1/m), 1.0 (m/s^2)，去将轨迹分类成不同的bins；每个bin中的轨迹都会被聚类成3000个sets，然后 closest trajectories to cluster prototype 会被保留
再加上速度和曲率放入自行车模型给一遍 rollout 来生成连续速度和转角的轨迹。

【论文阅读】CVPR2021: MP3: A Unified Model to Map, Perceive, Predict and Plan_第6张图片

**Route Prediction**

如上网络输入online map和纵向的距离，然后加上high-level action，$c=(a,d)$ 其中a包含 keep lane, 左转，右转。这里手动给GPS加了(0,5)的高斯噪音

Scoring Cost

最后所有的东西都到了这一步来输出实际车辆要运行的那条轨迹，也就是cost最低的，一共有三个指标：routing and driving on roads、safety、comfort

Routing and Driving on Roads

有以下几条

为鼓励SDV执行high-level command，使用评分函数使得SDV 在 $\mathcal R$ 中概率较高的区域行驶更远距离的轨迹

\[f_{r}(\tau, \mathcal{R})=-m(\tau) \min _{i \in m(\tau)} \mathcal{R}_{i} \]
其中 $m(\tau)$ 是指 BEV下 SDV选择轨迹 $\tau$ 所占领的grid cells。用上述 scoring function 可以确保 SDV 保持在路线上，并且仅在路线内移动时才会获得奖励。
引入了一个cost-to-go，来应对超出计划范围的预测路线，对于尽头转弯或者车辆高速下比较有用。具体来说，假设 SDV 保持恒定的速度和航向，我们计算所有与 SDV 重叠的 BEV 网格单元 j 的平均值 $1-R_j$
为确保SDV行驶在道路中心线上，use the predicted reachable lanes distance transform $\mathcal M^D$ 去对轨迹点进行penalize。
同时为了考虑 $\mathcal M^D$ 和 $\mathcal M^\theta$ 上的不确定性，使用 cost function： product of SDV velocity and standard deviation of gird cells，即 $\mathcal M^D$ 和 $\mathcal M^\theta$ 下 SDV 所占领的那些格

\[f_{d}\left(\mathbf{x}, \mathcal{M}^{\theta}, \mathcal{M}^{D}\right)=\sum_{i \in m(\mathbf{x})} \mathbf{x}_{v}\left(\sigma_{i}^{D}+\frac{1}{k_{i}^{\theta}}\right) \]
其中 $k_i^\theta$ is the concentration parameter of the von Mises distribution representing lane direction
使用一个penalize 约束SDV在道路上，不去碰撞边缘

\[f_{a}(\mathbf{x}, \mathcal{M})=\max _{i \in m(\mathbf{x})}\left[1-P\left(\mathcal{M}_{i}^{A}\right)\right] \]
再加一个交叉路口的红绿灯cost，之间使用predicted junction probability map $\mathcal M^J$ 对闯红灯的行为进行惩罚

Safety

即对SDV overlaps occupied regions进行惩罚，对于那些没有重合的但是距离障碍物太近的轨迹点 $\mathbf x$，根据距离和SDV现在的速度进行刹车计算来measure the violation of safety distance，对于comfrotable deceleration的状态为 $\mathbf x_t$

\[f_{o}\left(\mathbf{x}_{t}, \mathcal{O}\right)=\sum_{c} \max _{i \in m\left(\mathbf{x}_{t}\right)} P\left(\mathcal{O}_{t, i}^{c}\right) \]

其中 $m(\mathbf{x}_{t})$ 表示BEV grid-cells，对应 $c$ 为语义的class that overlap 在状态 $\mathbf x_t$ 下的SDV多边形

Comfort

对jerk, 横向加速度，曲率和曲率变化率进行comfortable driving的定义

问题区

原文中 safety和comfort 好像没有很多解释 emm

附录有部分公式
而且对于中心线上的附录使用的direction进行的约束，但是正文是距离？

\[f_{d}(\mathbf{x}, \mathcal{M})=\underset{i \in m(\mathbf{x})}{\mathbb{E}}\left|\mathcal{M}_{i}^{\theta}-\mathbf{x}_{\theta}\right| \]

2.4 Training Loss

像GRI和MaRLn一样是两个阶段的loss回馈，这样训练整个任务的效果会好很多

第一阶段： Multi-task 多任务学习下的 loss

【论文阅读】CVPR2021: MP3: A Unified Model to Map, Perceive, Predict and Plan_第7张图片

第二阶段： Trajectory Scoring的

【论文阅读】CVPR2021: MP3: A Unified Model to Map, Perceive, Predict and Plan_第8张图片

更多详情见arxiv上的论文主页附录

3. 实验

直接摘取了论文里的表格和图，从数字看来这个效果提升很大啊，成功率直接飙升

【论文阅读】CVPR2021: MP3: A Unified Model to Map, Perceive, Predict and Plan_第9张图片

【论文阅读】CVPR2021: MP3: A Unified Model to Map, Perceive, Predict and Plan_第10张图片

在附录里，做了很多个消融实验，这个工作量也挺大的，可惜没开 hhh 附录里也做了将HD Map加到Motion plan的地方进行的对比

4. Conclusion

也直接摘取了和前面方法总结基本一致，可以看看：

【论文阅读】CVPR2021: MP3: A Unified Model to Map, Perceive, Predict and Plan_第11张图片

整体来说这篇工作虽然没有开源，但是很完整，可以说非常完整。从方法设计，到为什么要提出一个模块部分，motivation非常好。整篇文章讲的也很好，算是近期看过的第一名了

碎碎念

这个... 工作好棒啊，看到过程特别是occupancy flow那个处理很聪明，妙啊.. 甚至整条方法链感觉比LAV更完善一点，虽然这个不开源，公司做的嘛.. 向来都是不开源，而且数据集好像也没引用是自己的数据集，所以不如LAV 开源的这种直接对着代码更爽点。不过有一点是 MP3 本文的方法讲的很仔细，包括附录的网络图和一些参数，仔细到大佬们应该能照着复现。感谢杰哥组会指出这篇 hhh 漏网之鱼

赠人点赞手有余香；正向回馈才能更好开放记录 hhh

深入浅出：序列化与反序列化的全面解析进击的小白菜一些开发常识开发语言开发常识
文章目录1.引言2.什么是序列化？2.1为什么需要序列化？3.什么是反序列化？3.1反序列化的重要性4.序列化与反序列化的实现4.1JSON(JavaScriptObjectNotation)4.2XML(eXtensibleMarkupLanguage)4.3ProtocolBuffers(Protobuf)4.4MessagePack5.安全性考虑6.性能优化7.结论附录：常见问题解答Q1:什
Cesium实践（1）—— Hello World 迦南giser WebGIS #Cesium webgis cesium
文章目录前言Cesium是什么Cesium核心类ViewerSceneEntityDataSourceCollection创建第一个Cesium应用工程搭建Cesium版helloworld总结前言工作大半年来主要的技术栈是mapbox-gl和threejs，但是作为一名GIS专业毕业生，一直对Cesium充满兴趣。Cesium不仅保持了threejs的三维绘制能力，而且内置大量渲染地理数据的AP
node-imap-sync-client, imap 客户端库, 同步专用 eli960 MAIL 前端 javascript node.js
node-imap-sync-client说明网址:https://gitee.com/linuxmail/node-imap-sync-client同步操作imap客户端，见例子examples本imap客户端,特点:全部命令都是promise风格主要用于和IMAPD服务器同步邮箱数据和邮件数据支持文件夹的创建/删除/移动(改名)支持邮件的复制/移动/删除/标记/上传支持获取文件夹下邮件UID列
代码训练day7哈希表2 徵686 散列表数据结构
1.四数相加IIleetcode454哈希表判断是否存在classSolution{//四数相加ii统计个数publicintfourSumCount(int[]nums1,int[]nums2,int[]nums3,int[]nums4){HashMapmap=newHashMapmagazine.length())returnfalse;//java字符串长度s.length()for(cha
sqlmap笔记君如尘网络安全-渗透笔记笔记
1.运行环境sqlmap是用Python编写的，因此首先需要确保你的系统上安装了Python。sqlmap支持Python2.6、2.7和Python3.4及以上版本。2.常用命令通用格式：bythonsqlmap.py-r注入点地址--参数-rpost请求-uget请求--level=测试等级--risk=测试风险-v显示详细信息级别-p针对某个注入点注入-threads更改线程数，加速--ba
vLLM - 查看模型是否支持云客Coder 人工智能
支持的模型：https://docs.vllm.ai/en/latest/models/supported_models.html要确定是否支持给定模型，您可以检查HF存储库中的config.json文件。如果"architectures"字段包含下面列出的模型架构，那么理论上应该支持它。查看模型架构查看模型的config.json中的architecturescat~/.cache/huggin
Python实现微信自动发送消息热心市民小汪 python 微信开发语言
实现需求：Python定时发送微信消息importpyautoguiaspgimportpyperclipaspcfromapscheduler.schedulers.blockingimportBlockingScheduler"""实现定时自动发送消息"""#操作间隔为1秒pg.PAUSE=1name='Hello~'msg='是时候点餐啦！！'defmain():#打开微信pg.hotkey
【论文阅读】Persistent Homology Captures the Generalization of Neural Networks Without A Validation Set 开心星人论文阅读论文阅读
将神经网络表征为加权的无环图，直接根据模型的权重矩阵构造PD。计算相邻batch的权重矩阵PD之间的距离。比较同调收敛性与神经网络的验证精度变化趋势摘要机器学习从业者通常通过监控模型的某些指标来估计其泛化误差，并在训练数值收敛之前停止训练，以防止过拟合。通常，这种误差度量或任务相关的指标是通过一个验证集（holdoutset）来计算的。因为这些数据没有直接用于更新模型参数，通常假设模型在验证集上的
【论文阅读】实时全能分割模型万里守约论文阅读论文阅读图像分割图像处理计算机视觉
文章目录导言1、论文简介2、论文主要方法3、论文针对的问题4、论文创新点总结导言在最近的计算机视觉领域，针对实时多任务分割的需求日益增长，特别是在交互式分割、全景分割和视频实例分割等多种应用场景中。为了解决这些挑战，本文介绍了一种新方法——RMP-SAM（Real-TimeMulti-PurposeSegmentAnything），旨在实现实时的多功能分割。RMP-SAM结合了动态卷积与高效的模型
论文阅读：2023 arxiv Multiscale Positive-Unlabeled Detection of AI-Generated Texts CSPhD-winston-杨帆论文阅读论文阅读人工智能
总目录大模型安全相关研究：https://blog.csdn.net/WhiffeYF/article/details/142132328MultiscalePositive-UnlabeledDetectionofAI-GeneratedTextshttps://arxiv.org/abs/2305.18149https://www.doubao.com/chat/211427064915225
论文阅读笔记——MAGICDRIVE: STREET VIEW GENERATION WITH DIVERSE 3D GEOMETRY CONTROL 寻丶幽风论文阅读笔记论文阅读笔记 3d 人工智能自动驾驶
MagicDrive论文MagicDrive通过对3D数据和文本数据的多模态条件融合和隐式视角转换，实现了高质量、多视角一致的3D场景生成。几何条件编码Cross-attention：针对顺序数据，适合处理文本标记和边界框等可变长度输入。Additiveencoderbranch：对于地图等网络状规则数据，能够有效保留空间结构。对于文本按照模版构建：“Adrivingsceneat{locatio
【笔记】扩散模型（五）：Classifier-Free Guidance 理论推导与代码实现 LittleNyima Diffusion Models 笔记机器学习深度学习
论文链接：Classifier-FreeDiffusionGuidance上一篇文章我们学习了ClassifierGuidance，这种方法通过引入一个额外的分类器，使用梯度引导的方式成功地实现了条件生成。虽然ClassifierGuidance可以直接复用训练好的diffusionmodels，不过这种方法的问题是很明显的，首先需要额外训练一个分类器，而且这个分类器不仅仅分类一般的图像，还需要分
【论文阅读】Availability Attacks Create Shortcuts 开心星人论文阅读论文阅读
还得重复读这一篇论文，有些地方理解不够透彻可用性攻击通过在训练数据中添加难以察觉的扰动，使数据无法被机器学习算法利用，从而防止数据被未经授权地使用。例如，一家私人公司未经用户同意就收集了超过30亿张人脸图像，用于构建商业人脸识别模型。为解决这些担忧，许多数据投毒攻击被提出，以防止数据被未经授权的深度模型学习。它们通过在训练数据中添加难以察觉的扰动，使模型无法从数据中学习太多信息，从而导致模型在未见
深度学习 | pytorch + torchvision + python 版本对应及环境安装 zfgfdgbhs 深度学习 python pytorch
目录一、版本对应二、安装命令（pip）1.版本（1）v2.5.1~v2.0.0（2）v1.13.1~v1.11.0（3）v1.10.1~v1.7.02.安装全过程（1）选择版本（2）安装结果参考文章一、版本对应下表来自pytorch的github官方文档：pytorch/vision:Datasets,TransformsandModelsspecifictoComputerVisionpytor
Python画词云图，Python画圆形词云图，API详解请一直在路上 python 开发语言
在Python中，词云图的常用库是wordcloud。以下是核心API参数的详细讲解，以及一个完整的使用示例。一、参数类型默认值说明参数类型默认值说明widthint400词云图的宽度（像素）heightint200词云图的高度（像素）background_colorstr“black”背景颜色，可以是颜色名称（如“white”）或十六进制值（如“#FFFFFF”）colormapstr/matp
员工管理(3)-删除员工-修改员工-全局异常处理器-员工信息统计汐栊 java 数据库开发语言
目录员工管理:删除员工：Controller层：Service层：Mapper接口：接受参数的两种方式：修改员工：查询回显：Controller层：Service层：Mapper接口：修改数据：Controller层：Service层：Mapper接口：程序优化：员工信息统计：职位统计开发Controller层：Service层：Mapper接口：性别统计：员工管理:删除员工：明确三层架构职责：C
L2-050懂蛇语c++（pta天梯赛。测试点1。） zzy678 c++
这个题目看上去还挺简单的，但是自己做的时候就超时了一开始只有19分。我自己stl学的不是很好，然后一开始自己用的pair和vector一起写的发现了一些小问题改了之后才得19。。。其中两个就是超时问题。可能查找太慢？之后又查看了一些别人写的，参考了使用map和vector混用的方法就很好过了，但是那个测试点1就是过不了。最后，我发现就是首字的处理方式应该优化。一个小小小坑。大家注意。#includ
OpenStack阶梯计价实战：Hashmap模块从入门到精准计费冯·诺依曼的 openstack 云计算 linux
目录Hashmap模块概述核心概念解析配置步骤详解应用场景分析注意事项与扩展1.Hashmap模块概述OpenStack的Rating模块负责资源使用量的计费统计，而Hashmap是其核心组件，用于定义灵活的计价规则。通过Hashmap，管理员可以：根据资源类型（如CPU、存储、网络）设置差异化单价实现阶梯计价（如使用量超过阈值后单价打折）将资源与服务、服务组绑定，支持复杂计费策略2.核心概念解析
echart绘制海南地图时增加南海诸岛显示（现成geojson数据）火火PM打怪中工作中的问题
使用场景：产品经理要求展示海南地图时，需要显示南海诸岛；问题：南海诸岛在中国地图上的显示，是echart在mapName=‘china’时，默认fix进去。但是海南省不会默认fix进去解决方案：将南海诸岛的geojson数据想办法弄到，将其直接放在海南省地图数据里面（将三沙市删除）处理结果：{"type":"FeatureCollection","features":[{"id":"460100"
COMP3411/9814 Artificial Intelligence W_X_99515681 人工智能
COMP3411/9814ArtificialIntelligenceTerm1,2025Assignment1–Search,PruningandTreasureHuntingDue:Friday21March,10pmMarks:25%offinalassessmentInthisassignmentyouwillbeexaminingsearchstrategiesforthe15-puzz
COMP 315: Cloud Computing for E-Commerce W_X_99515681 开发语言
Assignment1:JavascriptCOMP315:CloudComputingforE-CommerceFebruary20251IntroductionAcommontaskwhenbackendprogrammingisdatacleaning,whichistheprocessoftakinganinitialdatasetthatmaycontainerroneousorinco
Linux部署模型报错OSError: Error no file named pytorch_model.bin, tf_model.h5, model.ckpt.index or flax_mod dkgee linux pytorch 运维
报错内容：OSError:Errornofilenamedpytorch_model.bin,tf_model.h5,model.ckpt.indexorflax_model.msgpackfoundindirectory主要原因是transformer版本不对，需要升级pipinstall--upgradehuggingface_hubpipinstalltransformers[torch]其
Description of a Poisson Imagery Super Resolution Algorithm 论文阅读青铜锁00 论文阅读 Radar 论文阅读
DescriptionofaPoissonImagerySuperResolutionAlgorithm1.研究目标与意义1.1研究目标1.2实际意义2.创新方法与模型2.1核心思路2.2关键公式与推导2.2.1贝叶斯框架与概率模型2.2.2MAP估计的优化目标2.2.3超分辨率参数α2.3对比传统方法的优势3.实验验证与结果3.1实验设计3.2关键结果4.未来研究方向（实波束雷达领域）4.1挑战
蓝桥杯备赛计划 laitywgx 蓝桥杯职场和发展
1-2小时的蓝桥杯PythonB组冲刺日程表（持续1个月，聚焦高频考点）：第一周：核心算法突破Day1（周一）学习重点：动态规划（01背包问题）学习资源：AcWing《蓝桥杯辅导课》第8讲（背包问题模板）代码模板速记：#一维01背包模板n,V=map(int,input().split())dp=[0]*(V+1)for_inrange(n):w,v=map(int,input().split()
Sklearn.model_selection.GridSearchCV kakak_ Machine Learning
sklearn.model_selection.GridSearchCV具体在scikit-learn中，主要是使用网格搜索，即GridSearchCV类。estimator:即调整的模型param_grid：即要调参的参数列表，以dict呈现。cv:S折交叉验证的折数，即将训练集分成多少份来进行交叉验证。默认是3,。如果样本较多的话，可以适度增大cv的值。scoring:评价标准。获取最好的模型
Ubuntu-Server 设置多个ip和多个ipv6 笔记250320 kfepiza #Linux CentOS Ubuntu 等 #控制台命令行 Shell脚本 sh cmd 等网络通讯传输协议物联 ubuntu tcp/ip 笔记
Ubuntu-Server设置多个ip和多个ipv6在UbuntuServer上为同一网卡配置多个IPv4和IPv6地址，Ubuntu-server-16用的是/etc/network/interfaces配置的networkingUbuntu-server-17.10及更新版本默认用的是systemd-networkd+Netplan,用Netplan来管理systemd-networkd对于U
AutoImageProcessor代码分析 fydw_715 Transformers 人工智能
以下是对AutoImageProcessor类的整理，按照类属性、类方法、静态方法、实例属性和实例方法分类，并对每个方法的功能进行了描述。类属性无显式定义的类属性。全局方法IMAGE_PROCESSOR_MAPPING_NAMES1.遍历IMAGE_PROCESSOR_MAPPING_NAMES字典formodel_type,image_processorsinIMAGE_PROCESSOR_MA
When Large Language Models Meet Speech: A Survey on Integration Approaches UnknownBody LLM Daily Survey Paper 语言模型人工智能自然语言处理
主要内容研究背景：大语言模型（LLMs）在自然语言处理领域取得显著进展，其与语音的融合具有广泛应用前景，但缺乏相关集成方法的综述。文章将语音与LLMs集成方法分为基于文本、基于潜在表示和基于音频令牌三大类。集成方法基于文本的集成：通过级联集成、LLM重打分和LLM生成式错误纠正等方式，利用文本作为LLMs的输入和输出，处理语音相关任务，但存在信息损失和准确性与多样性平衡的问题。基于潜在表示的集成：
大模型学习终极指南：从新手到专家的必经之路，全网最详尽解析，你敢挑战吗？大模型入门教程学习人工智能 AI 大模型大模型学习大模型教程 AI大模型
随着人工智能技术的飞速发展，大模型（Large-ScaleModels）已经成为推动自然语言处理（NLP）、计算机视觉（CV）等领域进步的关键因素。本文将为您详细介绍从零开始学习大模型直至成为专家的全过程，包括所需掌握的知识点、学习资源以及实践建议等。无论您是初学者还是有一定基础的专业人士，都能从中获得有价值的指导。一、基础知识准备在开始学习大模型之前，需要先掌握一些基础知识，这些知识将为后续的学
OpenLayers集成天地图服务开发指南喆星时瑜 WebGIS #天地图 OpenLayers GIS 天地图 WebGIS HTML 地图地图API
以下是一份面向GIS初学者的OpenLayers开发详细教程，深度解析代码：一、开发环境搭建1.1OpenLayers库引入ol.css：包含地图控件、图层等可视化样式ol.js：OpenLayers核心功能库推荐使用固定版本号（如v7.3.0）确保稳定性1.2地图容器设置.map{//设置地图控件显示尺寸height:95vh;width:95vw;}使用视口单位(vh/vw)实现响应式布局保留
PHP如何实现二维数组排序？ IT独行者二维数组 PHP 排序　
二维数组在PHP开发中经常遇到，但是他的排序就不如一维数组那样用内置函数来的方便了，（一维数组排序可以参考本站另一篇文章【PHP中数组排序函数详解汇总】）。二维数组的排序需要我们自己写函数处理了，这里UncleToo给大家分享一个PHP二维数组排序的函数：代码： functionarray_sort($arr,$keys,$type='asc'){ $keysvalue= $new_arr
【Hadoop十七】HDFS HA配置 bit1129 hadoop
基于Zookeeper的HDFS HA配置主要涉及两个文件,core-site和hdfs-site.xml。测试环境有三台 hadoop.master hadoop.slave1 hadoop.slave2 hadoop.master包含的组件NameNode, JournalNode, Zookeeper，DFSZKFailoverController
由wsdl生成的java vo类不适合做普通java vo darrenzhu VO wsdl webservice rpc
开发java webservice项目时，如果我们通过SOAP协议来输入输出，我们会利用工具从wsdl文件生成webservice的client端类，但是这里面生成的java data model类却不适合做为项目中的普通java vo类来使用，当然有一中情况例外，如果这个自动生成的类里面的properties都是基本数据类型，就没问题，但是如果有集合类，就不行。原因如下： 1)使用了集合如Li
JAVA海量数据处理之二（BitMap）周凡杨 java 算法 bitmap bitset 数据
路漫漫其修远兮，吾将上下而求索。想要更快，就要深入挖掘 JAVA 基础的数据结构，从来分析出所编写的 JAVA 代码为什么把内存耗尽，思考有什么办法可以节省内存呢？啊哈！算法。这里采用了 BitMap 思想。首先来看一个实验：指定 VM 参数大小： -Xms256m -Xmx540m
java类型与数据库类型 g21121 java
很多时候我们用hibernate的时候往往并不是十分关心数据库类型和java类型的对应关心，因为大多数hbm文件是自动生成的，但有些时候诸如：数据库设计、没有生成工具、使用原始JDBC、使用mybatis(ibatIS)等等情况，就会手动的去对应数据库与java的数据类型关心，当然比较简单的数据类型即使配置错了也会很快发现问题，但有些数据类型却并不是十分常见，这就给程序员带来了很多麻烦。 &nb
Linux命令 510888780 linux命令
系统信息 arch 显示机器的处理器架构(1) uname -m 显示机器的处理器架构(2) uname -r 显示正在使用的内核版本 dmidecode -q 显示硬件系统部件 - (SMBIOS / DMI) hdparm -i /dev/hda 罗列一个磁盘的架构特性 hdparm -tT /dev/sda 在磁盘上执行测试性读取操作 cat /proc/cpuinfo 显示C
java常用JVM参数墙头上一根草 java jvm参数
-Xms：初始堆大小，默认为物理内存的1/64(<1GB)；默认(MinHeapFreeRatio参数可以调整)空余堆内存小于40%时，JVM就会增大堆直到-Xmx的最大限制 -Xmx：最大堆大小，默认(MaxHeapFreeRatio参数可以调整)空余堆内存大于70%时，JVM会减少堆直到 -Xms的最小限制 -Xmn：新生代的内存空间大小，注意：此处的大小是（eden+ 2
我的spring学习笔记9-Spring使用工厂方法实例化Bean的注意点 aijuans Spring 3
方法一： <bean id="musicBox" class="onlyfun.caterpillar.factory.MusicBoxFactory" factory-method="createMusicBoxStatic"></bean> 方法二：
mysql查询性能优化之二 annan211 UNION mysql 查询优化索引优化
1 union的限制有时mysql无法将限制条件从外层下推到内层，这使得原本能够限制部分返回结果的条件无法应用到内层查询的优化上。如果希望union的各个子句能够根据limit只取部分结果集，或者希望能够先排好序在合并结果集的话，就需要在union的各个子句中分别使用这些子句。例如想将两个子查询结果联合起来，然后再取前20条记录，那么mys
数据的备份与恢复百合不是茶 oracle sql 数据恢复数据备份
数据的备份与恢复的方式有: 表,方案 ,数据库; 数据的备份: 导出到的常见命令; 参数说明 USERID 确定执行导出实用程序的用户名和口令 BUFFER 确定导出数据时所使用的缓冲区大小，其大小用字节表示 FILE 指定导出的二进制文
线程组 bijian1013 java 多线程 thread java多线程线程组
有些程序包含了相当数量的线程。这时，如果按照线程的功能将他们分成不同的类别将很有用。线程组可以用来同时对一组线程进行操作。创建线程组：ThreadGroup g = new ThreadGroup(groupName); &nbs
top命令找到占用CPU最高的java线程 bijian1013 java linux top
上次分析系统中占用CPU高的问题，得到一些使用Java自身调试工具的经验，与大家分享。 (1)使用top命令找出占用cpu最高的JAVA进程PID:28174 (2)如下命令找出占用cpu最高的线程 top -Hp 28174 -d 1 -n 1 32694 root 20 0 3249m 2.0g 11m S 2 6.4 3:31.12 java
【持久化框架MyBatis3四】MyBatis3一对一关联查询 bit1129 Mybatis3
当两个实体具有1对1的对应关系时，可以使用One-To-One的进行映射关联查询 One-To-One示例数据以学生表Student和地址信息表为例，每个学生都有都有1个唯一的地址(现实中，这种对应关系是不合适的，因为人和地址是多对一的关系)，这里只是演示目的学生表 CREATE TABLE STUDENTS (
C/C++图片或文件的读写 bitcarter 写图片
先看代码： /*strTmpResult是文件或图片字符串 * filePath文件需要写入的地址或路径 */ int writeFile(std::string &strTmpResult,std::string &filePath) { int i,len = strTmpResult.length(); unsigned cha
nginx自定义指定加载配置 ronin47
进入 /usr/local/nginx/conf/include 目录，创建 nginx.node.conf 文件，在里面输入如下代码： upstream nodejs { server 127.0.0.1:3000; #server 127.0.0.1:3001; keepalive 64; } server { liste
java-71-数值的整数次方.实现函数double Power(double base, int exponent)，求base的exponent次方 bylijinnan double
public class Power { /** *Q71-数值的整数次方 *实现函数double Power(double base, int exponent)，求base的exponent次方。不需要考虑溢出。 */ private static boolean InvalidInput=false; public static void main(
Android四大组件的理解 Cb123456 android 四大组件的理解
分享一下，今天在Android开发文档-开发者指南中看到的: App components are the essential building blocks of an Android
[宇宙与计算]涡旋场计算与拓扑分析 comsci 计算
怎么阐述我这个理论呢？。。。。。。。。。首先：宇宙是一个非线性的拓扑结构与涡旋轨道时空的统一体。。。。我们要在宇宙中寻找到一个适合人类居住的行星，时间非常重要，早一个刻度和晚一个刻度，这颗行星的
同一个Tomcat不同Web应用之间共享会话Session cwqcwqmax9 session
实现两个WEB之间通过session 共享数据查看tomcat 关于 HTTP Connector 中有个emptySessionPath 其解释如下： If set to true, all paths for session cookies will be set to /. This can be useful for portlet specification impleme
springmvc Spring3 MVC，ajax，乱码 dashuaifu spring jquery mvc Ajax
springmvc Spring3 MVC @ResponseBody返回，jquery ajax调用中文乱码问题解决 Spring3.0 MVC @ResponseBody 的作用是把返回值直接写到HTTP response body里。具体实现AnnotationMethodHandlerAdapter类handleResponseBody方法，具体实
搭建WAMP环境 dcj3sjt126com wamp
这里先解释一下WAMP是什么意思。W:windows，A：Apache，M：MYSQL，P：PHP。也就是说本文说明的是在windows系统下搭建以apache做服务器、MYSQL为数据库的PHP开发环境。工欲善其事，必须先利其器。因为笔者的系统是WinXP，所以下文指的系统均为此系统。笔者所使用的Apache版本为apache_2.2.11-
yii2 使用raw http request dcj3sjt126com http
Parses a raw HTTP request using yii\helpers\Json::decode() To enable parsing for JSON requests you can configure yii\web\Request::$parsers using this class: 'request' =&g
Quartz-1.8.6 理论部分 eksliang quartz
转载请出自出处：http://eksliang.iteye.com/blog/2207691 一.概述基于Quartz-1.8.6进行学习，因为Quartz2.0以后的API发生的非常大的变化，统一采用了build模式进行构建；什么是quartz? 答：简单的说他是一个开源的java作业调度框架，为在 Java 应用程序中进行作业调度提供了简单却强大的机制。并且还能和Sp
什么是POJO？ gupeng_ie java POJO 框架 Hibernate
POJO--Plain Old Java Objects(简单的java对象) POJO是一个简单的、正规Java对象，它不包含业务逻辑处理或持久化逻辑等，也不是JavaBean、EntityBean等，不具有任何特殊角色和不继承或不实现任何其它Java框架的类或接口。 POJO对象有时也被称为Data对象，大量应用于表现现实中的对象。如果项目中使用了Hiber
jQuery网站顶部定时折叠广告 ini JavaScript html jquery Web css
效果体验：http://hovertree.com/texiao/jquery/4.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>网页顶部定时收起广告jQuery特效 - HoverTree<
Spring boot内嵌的tomcat启动失败 kane_xie spring boot
根据这篇guide创建了一个简单的spring boot应用，能运行且成功的访问。但移植到现有项目（基于hbase）中的时候，却报出以下错误： SEVERE: A child container failed during start java.util.concurrent.ExecutionException: org.apache.catalina.Lif
leetcode: sort list michelle_0916 Algorithm linked list sort
Sort a linked list in O(n log n) time using constant space complexity. ====analysis======= mergeSort for singly-linked list ====code======= /** * Definition for sin
nginx的安装与配置,中途遇到问题的解决 qifeifei nginx
我使用的是ubuntu13.04系统，在安装nginx的时候遇到如下几个问题，然后找思路解决的，nginx 的下载与安装 wget http://nginx.org/download/nginx-1.0.11.tar.gz tar zxvf nginx-1.0.11.tar.gz ./configure make make install 安装的时候出现
用枚举来处理java自定义异常 tcrct java enum exception
在系统开发过程中，总少不免要自己处理一些异常信息，然后将异常信息变成友好的提示返回到客户端的这样一个过程，之前都是new一个自定义的异常，当然这个所谓的自定义异常也是继承RuntimeException的，但这样往往会造成异常信息说明不一致的情况，所以就想到了用枚举来解决的办法。 1，先创建一个接口，里面有两个方法，一个是getCode, 一个是getMessage public
erlang supervisor分析 wudixiaotie erlang
当我们给supervisor指定需要创建的子进程的时候，会指定M,F,A,如果是simple_one_for_one的策略的话，启动子进程的方式是supervisor:start_child(SupName, OtherArgs),这种方式可以根据调用者的需求传不同的参数给需要启动的子进程的方法。和最初的参数合并成一个数组，A ++ OtherArgs。那么这个时候就有个问题了，既然参数不一致，那