hitrjj

【AI视野·今日Robot 机器人论文速览第四十五期】Mon, 2 Oct 2023

AI视野·今日CS.Robotics 机器人学论文速览
Mon, 2 Oct 2023
Totally 42 papers
上期速览✈更多精彩请移步主页

Daily Robotics Papers

Learning Decentralized Flocking Controllers with Spatio-Temporal Graph Neural Network
Authors Siji Chen, Yanshen Sun, Peihan Li, Lifeng Zhou, Chang Tien Lu
最近一系列研究深入探讨了使用图神经网络 GNN 在群体机器人中进行分散控制。然而，据观察，仅依靠近邻国家不足以模仿集中控制政策。为了解决这个限制，先前的研究建议将 L 跳延迟状态纳入计算中。虽然这种方法显示出希望，但它可能导致遥远的群体成员之间缺乏共识并形成小集群，从而导致有凝聚力的群体行为失败。相反，我们的方法利用时空 GNN，名为 STGNN，包含空间和时间扩展。空间扩展收集来自遥远邻居的延迟状态，而时间扩展则合并来自直接邻居的先前状态。从两次扩展中收集到的更广泛、更全面的信息可以带来更有效、更准确的预测。我们开发了一种用于控制机器人群的专家算法，并采用模仿学习来训练基于专家算法的去中心化 STGNN 模型。我们在各种设置中模拟了所提出的 STGNN 方法，展示了其模拟全局专家算法的去中心化能力。此外，我们实施了我们的方法，通过一群 Crazyflie 无人机实现凝聚力聚集、领导者跟随和避障。

DREAM: Decentralized Reinforcement Learning for Exploration and Efficient Energy Management in Multi-Robot Systems
Authors Dipam Patel, Phu Pham, Kshitij Tiwari, Aniket Bera
资源受限的机器人通常会遇到能源效率低下、由于任务分配不足而导致计算能力未得到充分利用以及动态环境中缺乏鲁棒性等问题，所有这些都严重影响了它们的性能。本文介绍了用于多机器人系统中探索和高效能源管理的 DREAM 去中心化强化学习，这是一个优化资源分配以实现高效探索的综合框架。它超越了传统的基于启发式的任务规划。该框架结合了使用强化学习的操作范围估计，以在不熟悉的地形中执行探索和避障。 DREAM进一步引入了用于目标分配的能量消耗模型，从而利用图神经网络确保在资源有限的情况下完成任务。与随机分配目标的传统方法相比，这种方法还确保整个多机器人系统能够在更长的时间内生存以执行进一步的任务，这会损害一个或多个代理。我们的方法可以实时调整代理的优先级，展示出针对动态环境的卓越弹性。这一强大的解决方案在各种模拟环境中进行了评估，展示了跨不同场景的适应性和适用性。

Improving Trajectory Prediction in Dynamic Multi-Agent Environment by Dropping Waypoints
Authors Pranav Singh Chib, Pravendra Singh
轨迹固有的多样性和不确定性给精确建模带来了巨大的挑战。运动预测系统必须有效地学习过去的空间和时间信息，以预测智能体的未来轨迹。许多现有方法通过堆叠模型中的单独组件来学习时间运动以捕获时间特征。本文介绍了一种名为 Temporal Waypoint Dropping TWD 的新颖框架，该框架通过路点丢弃技术促进显式时间学习。通过路径点丢弃进行学习可以迫使模型提高对代理之间时间相关性的理解，从而显着增强轨迹预测。轨迹预测方法通常假设观测到的轨迹航路点序列是完整的，而忽略了可能出现缺失值的现实场景，这可能会影响其性能。此外，这些模型在进行预测时经常表现出对特定航路点序列的偏差。我们的TWD有能力有效解决这些问题。它结合了随机和固定过程，通过基于时间序列战略性地删除航路点来规范预测的过去轨迹。通过大量的实验，我们证明了 TWD 在迫使模型学习代理之间复杂的时间相关性方面的有效性。我们的方法可以补充现有的轨迹预测方法，以提高预测精度。

PlaceNav: Topological Navigation through Place Recognition
Authors Lauri Suomela, Jussi Kalliola, Atakan Dag, Harry Edelman, Joni Kristian K m r inen
最近的结果表明，将拓扑导航分为机器人独立组件和机器人特定组件，通过使机器人独立部分能够使用不同机器人类型收集的数据进行训练，可以提高导航性能。然而，导航方法仍然受到缺乏合适的训练数据的限制，并且计算规模较差。在这项工作中，我们提出了方法名称，将机器人独立部分细分为导航特定组件和通用计算机视觉组件。我们利用视觉位置识别来选择拓扑导航管道的子目标。这使得子目标选择更加高效，并能够利用非机器人来源的大规模数据集，从而提高训练数据的可用性。通过地点识别实现的贝叶斯过滤可通过提高子目标的时间一致性来进一步提高导航性能。

MORPH: Design Co-optimization with Reinforcement Learning via a Differentiable Hardware Model Proxy
Authors Zhanpeng He, Matei Ciocarlie
我们介绍 MORPH，一种使用强化学习在仿真中协同优化硬件设计参数和控制策略的方法。与大多数协同优化方法一样，MORPH 依赖于正在优化的硬件模型，通常基于物理定律进行模拟。然而，这样的模型通常很难集成到有效的优化例程中。为了解决这个问题，我们引入了代理硬件模型，该模型始终是可微分的，并且能够实现高效的协同优化以及使用 RL 的长范围控制策略。 MORPH 旨在确保优化的硬件代理尽可能接近其实际对应物，同时仍然能够完成任务。

Differentiable Optimization Based Time-Varying Control Barrier Functions for Dynamic Obstacle Avoidance
Authors Bolun Dai, Rooholla Khorrambakht, Prashanth Krishnamurthy, Farshad Khorrami
控制屏障函数 CBF 为安全控制合成提供了一种简单而有效的方法。最近，人们已经完成了使用基于可微优化的方法来系统地构建用于几何形状之间的静态避障任务的 CBF 的工作。在这项工作中，我们扩展了基于 CBF 的可微优化的应用来执行动态避障任务。我们证明，通过使用时变 CBF TVCBF 公式，我们可以对动态几何障碍物进行避障。此外，我们还展示了如何更改 TVCBF 约束以考虑测量噪声和驱动限制。为了证明我们提出的方法的有效性，我们首先在具有非椭圆体障碍物的模拟动态避障任务上将其性能与基于模型预测控制的方法进行比较。

Robots That Can See: Leveraging Human Pose for Trajectory Prediction
Authors Tim Salzmann, Lewis Chiang, Markus Ryll, Dorsa Sadigh, Carolina Parada, Alex Bewley
预测家庭和办公室等动态环境中所有人的运动对于实现安全有效的机器人导航至关重要。这些空间仍然具有挑战性，因为人类不遵循严格的运动规则，并且通常存在多个封闭的入口点，例如角落和门，为突然相遇创造了机会。在这项工作中，我们提出了一种基于 Transformer 的架构，可根据输入特征（包括来自船上野外感官信息的人体位置、头部方向和 3D 骨骼关键点）来预测以人为中心的环境中人类未来的轨迹。由此产生的模型捕获了未来人类轨迹预测的固有不确定性，并在通用预测基准和从适合预测任务的移动机器人捕获的人类跟踪数据集上实现了最先进的性能。

A Vision-Guided Robotic System for Grasping Harvested Tomato Trusses in Cluttered Environments
Authors Luuk van den Bent, Tom s Coleman, Robert Babuska
目前，桁架番茄称重和包装需要大量的手工工作。自动化的主要障碍在于难以为已经收获的桁架开发可靠的机器人抓取系统。我们提出了一种方法来抓取堆放在相当杂乱的板条箱中的桁架，这也是它们在收获后通常储存和运输的方式。该方法由基于深度学习的视觉系统组成，首先识别板条箱中的各个桁架，然后确定杆上合适的抓取位置。为此，我们引入了具有在线学习功能的抓取姿势排名算法。选择最有希望的抓取姿势后，机器人无需触摸传感器或几何模型即可执行捏握。使用配备有手眼 RGB D 相机的机器人操纵器进行的实验室实验显示，当任务从一堆桁架中拾取所有桁架时，清除率达到 100。

CrossLoco: Human Motion Driven Control of Legged Robots via Guided Unsupervised Reinforcement Learning
Authors Tianyu Li, Hyunyoung Jung, Matthew Gombolay, Yong Kwon Cho, Sehoon Ha
人体运动驱动控制 HMDC 是一种生成自然且引人注目的机器人运动，同时保留高级语义的有效方法。然而，由于运动学和动力学特性的不匹配，建立人类和具有不同身体结构的机器人之间的对应关系并不容易，这导致了问题的内在模糊性。许多以前的算法通过无监督学习来解决这个运动重定向问题，这需要先决条件。然而，在不理解给定的人体动作的情况下学习所有技能的成本将极其高昂，特别是对于高维机器人而言。在这项工作中，我们介绍了 CrossLoco，这是一种引导式无监督强化学习框架，可以同时学习机器人技能及其与人类动作的对应关系。我们的关键创新是引入基于循环一致性的奖励项，旨在最大化人类运动和机器人状态之间的相互信息。我们证明，所提出的框架可以通过转换不同的人类动作（例如跑步、跳跃和跳舞）来生成引人注目的机器人动作。我们将 CrossLoco 与手动设计和无监督的基线算法以及我们框架的消融版本进行定量比较，并证明我们的方法能够以更好的准确性、多样性和用户偏好来转换人体动作。

UniQuadric: A SLAM Backend for Unknown Rigid Object 3D Tracking and Light-Weight Modeling
Authors Linghao Yang, Yanmin Wu, Yu Deng, Rui Tian, Xinggang Hu, Tiefeng Ma
跟踪和建模环境中的未知刚性物体在自主无人系统和虚拟真实交互应用中发挥着至关重要的作用。然而，许多现有的同步定位、建图和移动物体跟踪SLAMMOT方法仅专注于估计特定物体姿态，缺乏对物体尺度的估计，无法有效跟踪未知物体。在本文中，我们提出了一种新颖的 SLAM 后端，它将自我运动跟踪、刚性物体运动跟踪和建模统一在联合优化框架内。在感知部分，我们基于Segment Anything Model SAM和DeAOT设计了像素级异步目标跟踪器AOT，使跟踪器能够在各种预定义任务和提示的引导下有效跟踪目标未知物体。在建模部分，我们提出了一种新颖的以对象为中心的二次参数化来统一静态和动态对象初始化和优化。随后，在物体状态估计部分，我们提出了一种用于物体位姿和尺度估计的紧耦合优化模型，将混合约束纳入一种新颖的双滑动窗口优化框架中以进行联合估计。据我们所知，我们是第一个将对象姿态跟踪与使用二次曲面的动态和静态对象的轻量级建模紧密结合在一起的。我们对模拟数据集和现实世界数据集进行定性和定量实验，展示了运动估计和建模方面最先进的鲁棒性和准确性。

Simultaneous Synchronization and Calibration for Wide-baseline Stereo Event Cameras
Authors Wanli Xing, Shijie Lin, Guangze Zheng, Yanjun Du, Jia Pan
基于事件的相机由于其高时间分辨率和低功耗而越来越多地应用于各种应用中。然而，当部署多个在独立时间系统上运行的此类相机时，就会出现一个根本性的挑战，导致时间错位。这种错位会显着降低下游应用程序的性能。传统的解决方案通常依赖于基于硬件的同步，面临兼容性的限制，并且对于长距离设置来说是不切实际的。为了解决这些挑战，我们提出了一种新颖的算法，该算法利用共享视场中物体的运动来实现多个基于事件的摄像机之间的毫秒级同步。我们的方法还同时估计外部参数。

PONG: Probabilistic Object Normals for Grasping via Analytic Bounds on Force Closure Probability
Authors Albert H. Li, Preston Culbertson, Aaron D. Ames
掌握规划的经典方法是确定性的，需要对物体的姿态和几何形状有完美的了解。作为回应，数据驱动的方法已经出现，计划完全从感官数据中掌握。虽然这些数据驱动方法在生成平行爪和动力抓取方面表现出色，但它们在使用灵巧手的指尖进行精确抓取（例如工具使用）方面的应用仍然有限。由于其对物体几何形状的敏感性，精确抓取提出了独特的挑战，这使得物体形状和姿势的微小不确定性导致原本稳健的抓取失败。为了应对这些挑战，我们引入了用于抓取 PONG 的概率对象法线，这是一种新颖的分析方法，用于在接触位置已知但表面法线不确定的情况下计算力闭合概率的保守估计。然后，我们提出一个实际应用，其中我们使用 PONG 作为抓取度量，以在模拟和现实世界的硬件实验中生成稳健的抓取。

ASAP: Automated Sequence Planning for Complex Robotic Assembly with Physical Feasibility
Authors Yunsheng Tian, Karl D.D. Willis, Bassel Al Omari, Jieliang Luo, Pingchuan Ma, Yichen Li, Farhad Javid, Edward Gu, Joshua Jacob, Shinjiro Sueda, Hui Li, Sachin Chitta, Wojciech Matusik
复杂产品的自动化组装需要一个能够自动规划物理上可行的动作序列以将许多零件组装在一起的系统。在本文中，我们提出了 ASAP，一种基于物理的规划方法，用于自动生成通用形状组件的此类序列。 ASAP 考虑重力来设计一个序列，其中每个子组件在物理上保持稳定，并固定有限数量的零件和支撑表面。我们应用高效的树搜索算法来降低确定此类组装序列的组合复杂度。搜索可以通过几何启发式或基于带有模拟标签的数据训练的图神经网络来指导。最后，我们展示了 ASAP 在针对数百个复杂产品装配的大型数据集生成物理上真实的装配顺序计划方面的卓越性能。我们进一步证明了 ASAP 在模拟和现实世界机器人设置上的适用性。

A Sign Language Recognition System with Pepper, Lightweight-Transformer, and LLM
Authors JongYoon Lim, Inkyu Sa, Bruce MacDonald, Ho Seok Ahn
这项研究探索使用轻量级深度神经网络架构，使人形机器人 Pepper 能够理解美国手语 ASL 并促进非语言人类机器人交互。首先，我们引入了一种针对嵌入式系统优化的轻量级且高效的 ASL 理解模型，确保快速符号识别，同时节省计算资源。在此基础上，我们采用大型语言模型法学硕士进行智能机器人交互。通过复杂的提示工程，我们定制交互，使 Pepper 机器人能够生成自然的语音手势响应，为更有机、更直观的人形机器人对话奠定基础。最后，我们提出了一个集成的软件管道，体现了社交意识人工智能交互模型的进步。利用 Pepper Robot 的功能，我们在现实场景中展示了我们的方法的实用性和有效性。

Sandwich Approach for Motion Planning and Control
Authors Mohamadreza Ramezani, Hossein Rastgoftar
本文受流体力学基础原理的启发，开发了一种在充满障碍物的环境中进行机器人运动规划和控制的新方法。对于运动规划，我们提出了运动空间（具有随机大小和形状的任意障碍物）与具有测地变化距离和约束过渡的无障碍规划空间之间的新颖变换。然后，我们通过对分布在规划空间上的均匀网格进行 A 搜索来获得机器人所需的轨迹。我们表明，与现有的运动空间 A 搜索相比，在规划空间上实施 A 搜索可以生成更短的路径。

Predicting Object Interactions with Behavior Primitives: An Application in Stowing Tasks
Authors Haonan Chen, Yilong Niu, Kaiwen Hong, Shuijing Liu, Yixuan Wang, Yunzhu, Katherine Driggs Campbell
装载是将物体放置在杂乱的货架或箱子中的任务，是仓库和制造操作中的常见任务。然而，这项任务仍然主要由人类工人执行，因为由于复杂的多对象交互和任务的长期性质，装载很难实现自动化。以前的工作通常涉及广泛的数据收集和跨不同对象类别的语义先验的昂贵的人工标记。本文提出了一种从对象交互的预测模型和行为原语的单个演示中学习通用机器人收起策略的方法。我们提出了一种新颖的框架，利用图神经网络来预测行为基元参数空间内的对象交互。我们进一步采用原语增强轨迹优化来搜索预定义的异构行为原语库的参数以实例化控制动作。我们的框架使机器人能够通过单个演示中的几个关键帧 3 4 熟练地执行长视野装载任务。尽管仅接受了模拟训练，但我们的框架表现出了卓越的泛化能力。

Stochastic Implicit Neural Signed Distance Functions for Safe Motion Planning under Sensing Uncertainty
Authors Carlos Quintero Pe a, Wil Thomason, Zachary Kingston, Anastasios Kyrillidis, Lydia E. Kavraki
感知不确定性下的运动规划对于非结构化环境中的机器人至关重要，以保证机器人和附近人类的安全。大多数在不确定性下进行规划的工作都无法扩展到高维机器人（例如机械手），假设机器人或环境的几何形状被简化，或者需要每个对象的噪声知识。相反，我们提出了一种方法，可以直接对传感器特定的任意不确定性进行建模，以找到复杂环境中高维系统的安全运动，而无需精确了解环境几何形状。我们将随机符号距离函数的新颖隐式神经模型与基于分层优化的运动规划器相结合，以在不牺牲路径质量的情况下规划低风险运动。我们的方法还明确限制了路径的风险，提供了可信度。

Social Navigation in Crowded Environments with Model Predictive Control and Deep Learning-Based Human Trajectory Prediction
Authors Viet Anh Le, Behdad Chalaki, Vaishnav Tadiparthi, Hossein Nourkhiz Mahjoub, Jovin D sa, Ehsan Moradi Pari
在过去的几十年里，人群导航越来越受到研究人员的关注，迄今为止，出现了许多旨在解决这一问题的方法。我们提出的方法将智能体运动预测和规划结合起来，以避免机器人冻结问题，同时利用最先进的轨迹预测模型（即社交长短期记忆模型 Social LSTM）捕获多智能体社交交互。在给定机器人可能动作的情况下，利用社交 LSTM 的输出来预测行人在每个时间步的未来轨迹，我们的框架使用模型预测控制 MPC 计算机器人在行人之间导航的最佳控制动作。

Robust Safe Control with Multi-Modal Uncertainty
Authors Tianhao Wei, Liqian Ma, Ravi Pandya, Changliu Liu
具有普遍不确定性的动态系统的安全性至关重要。当前的鲁棒安全控制器主要针对单模态不确定性而设计，在处理多模态不确定性时可能过于保守或不安全。

An Attentional Recurrent Neural Network for Occlusion-Aware Proactive Anomaly Detection in Field Robot Navigation
Authors Andre Schreiber, Tianchen Ji, D. Livingston McPherson, Katherine Driggs Campbell
移动机器人在农业领域等非结构化环境中的使用变得越来越普遍。因此，此类现场机器人主动识别和避免故障的能力对于确保效率和避免损坏至关重要。然而，杂乱的现场环境引入了各种噪声源，例如传感器遮挡，这使得主动异常检测变得困难。现有方法在传感器遮挡场景中表现不佳，因为它们通常不会显式地对遮挡进行建模，而仅利用当前的感官输入。在这项工作中，我们提出了一种基于注意力的循环神经网络架构，用于主动异常检测，它将当前的感官输入和计划的控制动作与先前机器人状态的潜在表示融合在一起。我们通过显式学习的传感器遮挡模型来增强我们的模型，该模型用于调节我们对先前机器人状态的潜在表示的使用。我们的方法显示出改进的异常检测性能，并使移动现场机器人能够在传感器遮挡期间（特别是在所有传感器短暂遮挡的情况下）显示出更高的弹性来预测有关导航故障的误报。

MEM: Multi-Modal Elevation Mapping for Robotics and Learning
Authors Gian Erni, Jonas Frey, Takahiro Miki, Matias Mattamala, Marco Hutter
高程图通常用于表示移动机器人的环境，对于运动和导航任务很有帮助。然而，纯几何信息对于许多需要外观或语义信息的现场应用来说是不够的，这限制了它们对其他平台或领域的适用性。在这项工作中，我们通过将多个来源的多模态信息融合到流行的地图表示中，扩展了以机器人为中心的 2.5D 高程测绘框架。该框架允许以统一的方式输入点云或图像中包含的数据。为了管理数据的不同性质，我们还提出了一组可以根据信息类型和用户需求进行选择的融合算法。我们的系统设计为在 GPU 上运行，使其能够实时执行各种机器人和学习任务。

Cascaded Nonlinear Control Design for Highly Underactuated Balance Robots
Authors Feng Han, Jingang Yi
本文提出了一种高度欠驱动平衡机器人的非线性控制设计，该机器人具有比驱动机器人更多的非驱动自由度 DOF。为了解决同时跟踪驱动坐标和平衡未驱动坐标的挑战，所提出的控制将机器人动力学转换为一系列级联子系统，并且每个子系统都被认为是虚拟驱动的。为了实现控制目标，我们依次设计和更新虚拟和实际控制输入以纳入平衡任务，从而使未驱动的坐标平衡到瞬时平衡。闭环动力学被证明是稳定的，并且跟踪误差以指数方式收敛到原点附近的邻域。

Coupled Active Perception and Manipulation Planning for a Mobile Manipulator in Precision Agriculture Applications
Authors Shuangyu Xie, Chengsong Hu, Di Wang, Joe Johnson, Muthukumar Bagavathiannan, Dezhen Song
移动操纵器经常发现自己处于需要在执行操纵任务之前进行近距离观察的应用程序中。将其命名为耦合主动感知和操作 CAPM 问题，我们对感知过程中的不确定性进行建模，并设计了一种关键状态任务规划方法，该方法将可达性条件视为移动平台感知和操作任务的任务约束。通过在满足任务约束的同时最小化身体关键状态规划中的预期能量使用，我们的算法实现了任务成功率和能量使用之间的最佳平衡。我们已经实现了该算法并在模拟和物理实验中对其进行了测试。

Encountered-Type Haptic Display via Tracking Calibrated Robot
Authors Chenxi Xiao, Yuan Tian
在过去的几十年里，各种触觉设备被开发出来，以促进虚拟现实 VR 中的高保真人机交互 HCI。特别是，被动触觉反馈可以基于真实物体与虚拟物体在空间上重叠而产生引人注目的感觉。然而，这些方法需要预先部署工作，阻碍了它们在实践中的民主化使用。我们提出了跟踪校准机器人 TCR，这是一种新颖且通用的触觉方法，可以将开发人员从部署工作中解放出来，可以在任何场景中部署。具体来说，我们使用协作机器人增强 VR，当用户触摸虚拟世界中的虚拟对象时，该机器人可以在现实世界中呈现触觉接触。用户手指和机器人末端执行器之间的距离随着时间的推移而受到控制。当用户想要触摸虚拟对象时，距离开始平滑地减小到零。

Energy Efficient Foot-Shape Design for Bipedal Walkers on Granular Terrain
Authors Xunjie Chen, Jingang Yi, Hao Wang
了解双足步行者如何在沙子和松散泥土等颗粒材料上有效平衡和行走非常重要。本文首先提出了一种计算方法来获得双足步行者在颗粒地形上的运动和能量分析，然后讨论了一种优化方法用于节能行走的机器人足部形状轮廓设计方法。我们首先使用提供综合力定律的阻力理论提出入侵过程的脚部地形相互作用特征。使用人类步态轮廓，我们计算并比较地面反作用力和在粒状地形上各种足部形状的步行步态的外部功。最终提出了考虑节能和行走效率的足部轮廓设计的多目标优化问题。有趣的是，非凸脚形状在坚硬的颗粒地形上提供了最佳的能量和运动效率性能。

A Real-World Quadrupedal Locomotion Benchmark for Offline Reinforcement Learning
Authors Hongyin Zhang, Shuyu Yang, Donglin Wang
在线强化学习 RL 方法通常数据效率低下或不可靠，这使得它们很难在真实的机器人硬件上进行训练，尤其是四足机器人。从预先收集的数据中学习机器人任务是一个有前途的方向。与此同时，敏捷而稳定的腿式机器人运动的一般形式仍然是一个悬而未决的问题。离线强化学习 ORL 有潜力在这个充满挑战的领域取得突破，但其目前的瓶颈在于缺乏多样化的数据集来应对具有挑战性的现实任务。为了促进 ORL 的开发，我们在真实的四足运动数据集中对 11 种 ORL 算法进行了基准测试。此类数据集是通过经典的模型预测控制 MPC 方法收集的，而不是以前基准测试中常用的无模型在线 RL 方法。大量的实验结果表明，与无模型强化学习相比，性能最好的 ORL 算法可以实现具有竞争力的性能，甚至在某些任务中超越它。然而，基于学习的方法与 MPC 之间仍然存在差距，特别是在稳定性和快速适应方面。

Towards Safe Autonomy in Hybrid Traffic: Detecting Unpredictable Abnormal Behaviors of Human Drivers via Information Sharing
Authors Jiangwei Wang, Lili Su, Songyang Han, Dongjin Song, Fei Miao
涉及自动驾驶和人类驾驶车辆的混合交通将在一段时间内成为自动驾驶汽车实践的常态。一方面，与自动驾驶汽车不同，人类驾驶的车辆可能会表现出突然的异常行为，例如不可预测地切换到危险的驾驶模式，使邻近的车辆面临风险，这种不期望的模式切换可能是由许多人类驾驶员因素引起的，包括疲劳、醉酒、另一方面，现代车对车通信技术使自动驾驶车辆能够高效、可靠地彼此共享稀缺的运行时间信息。在本文中，据我们所知，我们提出了第一个有效的算法，该算法可以 1 通过有效融合周围自动驾驶车辆共享的运行时信息来显着改善轨迹预测，并且可以 2 准确快速地检测异常的人类驾驶模式切换或具有正式保证的异常驾驶行为，且不会损害人类驾驶员的隐私。为了验证我们提出的算法，我们首先在 NGSIM 和 Argoverse 数据集上评估我们提出的轨迹预测器，并表明我们提出的预测器优于基线方法。然后通过在 SUMO 模拟器上进行大量实验，我们表明我们提出的算法在高速公路和城市交通中都具有良好的检测性能。

Circular-Line Trajectory Tracking Controller for Mobile Robot using Multi-Pixy2 Sensors
Authors Xuan Quang Ngo, Tri Duc Tran, Huy Hung Nguyen, Van Dong Nguyen, Van Tu Duong, Tan Tien Nguyen
这项研究提出了一种新颖的跟踪方法，该方法采用三个 Pixy2 传感器来识别所需的线轨迹，而不是传统的感知手段。首先，移动机器人的运动学模型是根据三个 Pixy2 传感器收集的信息得出的。其次，采用滑模控制器来调节跟踪误差。

Autonomous Guidance Navigation and Control of the VISORS Formation-Flying Mission
Authors Tommaso Guffanti, Toby Bell, Samuel Y. W. Low, Mason Murray Cooper, Simone D Amico
具有可重构群VISORS的虚拟超分辨率光学器件是一项分布式望远镜任务，使用两个在太阳同步近地轨道上编队飞行的6U立方体卫星对太阳进行高分辨率成像。光学航天器携带一个光子筛，充当极紫外光谱中的高分辨率透镜，而穿过筛子的图像则聚焦在探测器航天器上。本文介绍了机载制导、导航和控制 GNC 系统的新构想，该系统具有高度自主性、鲁棒性、被动安全性，并在实际任务模拟中得到了验证。 GNC系统的主要目标是在10秒持续时间的重复观测中，以40米间隔建立被动安全且高精度的编队对准，相对导航和位置控制精度达到亚厘米级。科学任务的成功率是通过蒙特卡罗分析在由于传感误差、机动误差、未建模的动力学和内部航天器组件的错误知识而产生的实际建模不确定性下进行评估的。通过整数模糊度分辨率的载波相位差分GPS实现精确的实时相对导航。通过基于闭环优化的随机模型预测控制，实现了对短基线的精确控制，精度达到厘米级。远距离和接近过程中的控制是通过具有米级精度的封闭式脉冲控制来实现的。在整个任务过程中强制实施被动安全，以减轻碰撞风险，即使在关键子系统发生故障的情况下也是如此。

A New 1-mg Fast Unimorph SMA-Based Actuator for Microrobotics
Authors Conor K. Trygstad, Xuan Truc Nguyen, Nestor O. Perez Arancibia
我们推出了一种用于微型机器人的新型单压电晶片执行器，它由细形状记忆合金 SMA 线驱动。利用被动毛细管对准技术和现有的 SMA 微系统制造方法，我们开发了一种长 7 mm、体积为 0.45 mm 3、重 0.96 mg 的执行器，可实现高达 40 Hz 的工作频率和 155 升的升力。乘以自身重量。为了演示所提出的执行器的功能，我们创建了一个 8 毫克爬行器（MiniBug）和一个仿生 56 毫克可控水表面张力爬行器（WaterStrider）。 MiniBug 长 8.5 毫米，移动速度高达每秒 0.76 BL 身体长度，是有史以来同类产品中最轻的全功能爬行微型机器人。 WaterStrider 长 22 毫米，能够以高达 0.28 BL s 的速度移动，并以 0.144 rad s 的角速率执行转弯机动。

Controlling the Solo12 Quadruped Robot with Deep Reinforcement Learning
Authors Michel Aractingi LAAS GEPETTO , Pierre Alexandre L ziart LAAS GEPETTO , Thomas Flayols LAAS GEPETTO , Julien Perez, Tomi Silander, Philippe Sou res LAAS GEPETTO
四足机器人需要强大且通用的运动技能，才能在复杂且具有挑战性的环境中发挥其移动潜力。在这项工作中，我们首次在 Solo12 四足动物上实现了基于端到端学习的稳健控制器。我们的方法基于关节阻抗参考的深度强化学习。由此产生的控制策略遵循命令的速度参考，同时具有高效的能源消耗、稳健且易于部署。我们详细介绍了在真实机器人上迁移的学习过程和方法。

Powertrain Hybridization for Autonomous Vehicles
Authors Shima Nazari, Norma Gowans, Mohammad Abtahi
当今混合动力电动汽车的动力系统是为人类驾驶员开发的，因此，考虑到自动驾驶汽车可以准确地操纵其速度曲线以避免不必要的能量损失，因此，它可能不是未来自动驾驶汽车的最佳选择。在这项工作中，我们通过部署现实世界的城市驾驶配置文件并在混合自动驾驶场景中生成等效的自动驾驶汽车驾驶周期，仔细研究了自动驾驶汽车与人类驾驶员相比所需的混合程度。我们解决了汽车市场上各种电机尺寸的混合动力汽车的最佳能源管理问题，并证明，虽然人类驾驶员通常需要 30 kW 左右的电机尺寸才能充分受益于混合动力，但 AV 仅需 12 kW 电机即可实现类似的增益。更小的电机尺寸带来的更大好处可以归因于更优化的扭矩请求，从而可以从再生制动中获得更高的收益，并实现更高效的发动机运行。此外，我们还研究了速度平滑对传统汽车和混合动力汽车的好处，并探讨了不同机制在降低燃料消耗方面的作用。

See Beyond Seeing: Robust 3D Object Detection from Point Clouds via Cross-Modal Hallucination
Authors Jianning Deng, Gabriel Chan, Hantao Zhong, Chris Xiaoxuan Lu
本文提出了一种通过跨模态幻觉从点云进行鲁棒 3D 物体检测的新颖框架。我们提出的方法与 LiDAR 和 4D 雷达之间的幻觉方向无关。我们在空间和特征层面上引入多重对齐，以实现同时骨干细化和幻觉生成。具体来说，提出了空间对齐来处理几何差异，以实现 LiDAR 和雷达之间更好的实例匹配。特征对齐步骤进一步弥合了传感模式之间的内在属性差距并稳定了训练。即使在推理阶段仅使用单模态数据作为输入，经过训练的目标检测模型也可以更好地处理困难的检测情况。

ComSD: Balancing Behavioral Quality and Diversity in Unsupervised Skill Discovery
Authors Xin Liu, Yaran Chen, Dongbin Zhao
在没有监督的情况下学习多样化且合格的行为以供利用和适应是智能生物的一项关键能力。理想的无监督技能发现方法能够在没有外在奖励的情况下产生多样化且合格的技能，而发现的技能集可以以各种方式有效地适应下游任务。理论上，最大化技能和访问状态之间的互信息MI可以实现理想的技能条件行为蒸馏。然而，最近的先进方法在实践中很难很好地平衡行为质量探索和多样性开发，这可能是由于其严格的内在奖励设计导致的 MI 估计不合理。在本文中，我们提出了对比多目标技能发现 ComSD，它试图通过更合理的 MI 估计和动态加权的内在奖励来减轻所发现行为的质量与多样性冲突。 ComSD 建议采用对比学习来更合理地估计 MI 分解中的技能条件熵。此外，还提出了一种新颖的加权机制，将 MI 分解估计中的不同熵动态平衡为新颖的多目标内在奖励，以提高技能多样性和质量。对于具有挑战性的机器人行为发现，ComSD 可以产生由不同活动级别的不同行为组成的合格技能集，这是最近的先进方法无法做到的。在数值评估中，ComSD 展示了最先进的适应性能，在所有技能组合任务和大多数技能微调任务中显着优于最新的高级技能发现方法。

TBD Pedestrian Data Collection: Towards Rich, Portable, and Large-Scale Natural Pedestrian Data
Authors Allan Wang, Daisuke Sato, Yasser Corzo, Sonya Simkin, Aaron Steinfeld
社交导航和行人行为研究已转向基于机器学习的方法，并集中在行人交互和行人机器人交互建模的主题上。为此，需要包含丰富信息的大规模数据集。我们描述了一个便携式数据收集系统，加上半自主标签管道。作为管道的一部分，我们设计了一个标签校正网络应用程序，有助于人工验证自动行人跟踪结果。我们的系统能够在不同的环境中进行大规模数据收集并快速生产轨迹标签。与现有的行人数据收集方法相比，我们的系统包含三个组件，即自上而下和以自我为中心的视图、在社交适当的机器人存在下的自然人类行为以及基于度量空间的人类验证标签的组合。据我们所知，现有的数据收集系统还没有同时具备这三个组件的组合。

GAIA-1: A Generative World Model for Autonomous Driving
Authors Anthony Hu, Lloyd Russell, Hudson Yeo, Zak Murez, George Fedoseev, Alex Kendall, Jamie Shotton, Gianluca Corrado
自动驾驶有望对交通带来革命性的改进，但构建能够安全地应对现实世界场景的非结构化复杂性的系统仍然具有挑战性。

Robust Asynchronous Collaborative 3D Detection via Bird's Eye View Flow
Authors Sizhe Wei, Yuxi Wei, Yue Hu, Yifan Lu, Yiqi Zhong, Siheng Chen, Ya Zhang
通过促进多个智能体之间的通信，协作感知可以极大地提高每个智能体的感知能力。然而，由于通信延迟、中断和时钟错位，代理之间的时间异步在现实世界中是不可避免的。该问题导致多智能体融合时信息不匹配，严重动摇协作的基础。为了解决这个问题，我们提出了 CoBEVFlow，一种基于鸟瞰 BEV 流的异步鲁棒协作 3D 感知系统。 CoBEVFlow 的关键直觉是补偿运动以对齐多个代理发送的异步协作消息。为了对场景中的运动进行建模，我们提出了 BEV 流，它是与每个空间位置相对应的运动向量的集合。基于BEV流，可以将异步感知特征重新分配到适当的位置，减轻异步的影响。 CoBEVFlow有两个优点：iCoBEVFlow可以处理以不规则、连续时间戳发送的异步协作消息，无需离散化；ii对于BEV流，CoBEVFlow仅传输原始感知特征，而不是生成新的感知特征，避免了额外的噪声。为了验证 CoBEVFlow 的功效，我们创建了 IRregular V2V IRV2V，这是第一个具有各种时间异步性的合成协作感知数据集，可模拟不同的现实世界场景。对 IRV2V 和现实世界数据集 DAIR V2X 进行的大量实验表明，CoBEVFlow 始终优于其他基线，并且在极其异步的设置中具有鲁棒性。

LEF: Late-to-Early Temporal Fusion for LiDAR 3D Object Detection
Authors Tong He, Pei Sun, Zhaoqi Leng, Chenxi Liu, Dragomir Anguelov, Mingxing Tan
我们提出了一种使用时间 LiDAR 点云进行 3D 对象检测的晚期到早期循环特征融合方案。我们的主要动机是将对象感知的潜在嵌入融合到 3D 对象检测器的早期阶段。与直接从原始点学习相比，这种特征融合策略使模型能够更好地捕获具有挑战性的物体的形状和姿势。我们的方法以循环方式进行后期到早期的特征融合。这是通过在时间校准和对齐的稀疏柱标记上强制执行基于窗口的注意力块来实现的。利用鸟瞰图前景柱分割，我们将模型需要融合到当前帧中的稀疏历史特征的数量减少了 10 倍。我们还提出了一种随机长度 FrameDrop 训练技术，该技术将模型推广到推理时的可变帧长度，以提高性能而无需重新训练。

Safe Non-Stochastic Control of Control-Affine Systems: An Online Convex Optimization Approach
Authors Hongyu Zhou, Yichen Song, Vasileios Tzoumas
我们研究如何安全地控制被有界非随机噪声破坏的非线性控制仿射系统，即先验未知且不一定受随机模型控制的噪声。我们关注采用时变凸约束形式的安全约束，例如避免碰撞和控制努力约束。我们提供了一种具有有限动态遗憾的算法，即针对预先知道噪声实现的最优透视控制器的有限次优性。我们对自动化的未来充满动力，尽管现实世界存在阵风等不可预测的干扰，机器人仍将自主执行复杂的任务。为了开发算法，我们将问题捕获为控制器和对手之间的顺序游戏，其中控制器首先玩，选择控制输入，而对手其次玩，选择噪声的实现。尽管无法事先知道噪声的实现，但控制器的目标是最小化其累积跟踪误差。

XVO: Generalized Visual Odometry via Cross-Modal Self-Training
Authors Lei Lai, Zhongkai Shangguan, Jimuyang Zhang, Eshed Ohn Bar
我们提出了 XVO，一种半监督学习方法，用于训练广义单目视觉里程计 VO 模型，在不同的数据集和设置中具有鲁棒的自我操作能力。与通常研究单个数据集中的已知校准的标准单目 VO 方法相比，XVO 有效地学习从视觉场景语义中恢复与现实世界比例的相对姿势，即不依赖于任何已知的相机参数。我们通过 YouTube 上提供的大量无约束和异构行车记录仪视频进行自我训练来优化运动估计模型。我们的主要贡献是双重的。首先，我们凭经验证明半监督训练对于学习通用直接 VO 回归网络的好处。其次，我们演示了多模态监督，包括分割、流、深度和音频辅助预测任务，以促进 VO 任务的广义表示。具体来说，我们发现音频预测任务可以显着增强半监督学习过程，同时减轻噪声伪标签，特别是在高度动态和域外视频数据中。尽管没有多帧优化或不了解相机参数，我们提出的教师网络在常用的 KITTI 基准上实现了最先进的性能。

GPT-Lab: Next Generation Of Optimal Chemistry Discovery By GPT Driven Robotic Lab
Authors Xiaokai Qin, Mingda Song, Yangguan Chen, Zhehong Ai, Jing Jiang
机器人融入化学实验提高了实验效率，但由于缺乏人类智能来理解文献，因此很少为实验设计提供帮助。因此，在自驱动实验室 SDL 中实现从实验设计到验证的完整流程自主仍然是一个挑战。将生成式预训练 Transformers GPT（特别是 GPT 4）引入机器人实验中提供了一种解决方案。我们介绍 GPT Lab，这是一种利用 GPT 模型为机器人提供类人智能的范例。借助我们的机器人实验平台，GPT 实验室挖掘材料和方法的文献，并通过高通量合成验证研究结果。作为演示，GPT 实验室分析了 500 篇文章，鉴定了 18 种潜在试剂，并成功生产出精确的湿度比色传感器，均方根误差 RMSE 为 2.68。

Chinese Abs From Machine Translation

Papers from arxiv.org

更多精彩请移步主页

pic from pexels.com

你可能感兴趣的:(触觉,机器人,Papers,人工智能,机器人,robot,控制,抓取,LLM,触觉)

STM32:关于NVIC的工作与优先级分组方式 sewinger stm32学习笔记单片机嵌入式硬件 stm32
一，NVIC是什么NVIC，全称是NestedVectoredInterruptController，即嵌套向量中断控制器。它是ARMCortex-M系列处理器内核的一个重要组成部分，主要用于管理中断请求，协调中断的优先级，以及控制中断的嵌套执行，使得处理器能够高效、有序地响应和处理多个中断源。这个名称是如何体现的，下面一一说明。二，“嵌套”体现在哪？NVIC的嵌套体现在它能够处理多个中断的嵌套执
探索TriCore架构：AURIX芯片的强大内核裴辰垚Simone
探索TriCore架构：AURIX芯片的强大内核g_tricore_architecture项目地址:https://gitcode.com/gh_mirrors/gt/g_tricore_architecture项目介绍TriCore架构是英飞凌（Infineon）公司开发的一种高性能、低功耗的嵌入式处理器架构，广泛应用于汽车电子、工业控制和消费电子等领域。AURIX系列芯片是基于TriCore
从边缘到核心：群联云防护如何重新定义安全加速边界？群联云防护小杜安全问题汇总安全分布式 ddos 前端 node.js udp
一、安全能力的全方位碾压1.协议层深度防护四层防御：动态过滤畸形TCP/UDP包（如SYNFlood），传统CDN仅限速率控制。技术示例：基于AI的协议指纹分析，拦截异常连接模式。七层防御：精准识别业务逻辑攻击（如薅羊毛API调用），CDN仅支持基础URL黑名单。文档引用：“支持基于HTTP头部字段的多条件组合精准访问控制”（产品文档）。2.资源调度与成本优势节点复用：群联共享节点池降低单客户成本
探索Google AI聊天模型的集成和使用 qahaj 人工智能 python
随着人工智能的飞速发展，GoogleAI的聊天模型提供了强大的自然语言处理能力，可以应用于多种场景中。本文将为你介绍如何通过GoogleAI和LangChain库来使用这些聊天模型。技术背景介绍GoogleAI提供了一系列强大的聊天模型，这些模型具备不同的功能和参数设置。它们不仅可以通过GoogleAI服务访问，还可以通过GoogleCloudVertexAI以企业级功能使用。在本文中，我们将重点
扫地机高增长神话破灭！科沃斯、石头科技艰难 “破冰”！ liukuang110 科技
扫地机器人赛道太冷，陆续有企业倒在寒风里。先是，老牌研发商广东宝乐机器人宣布破产重整；曾获得腾讯和红杉资本大额融资，并邀请罗永浩代言的“追光”品牌，也在短短两年内宣告失败。就连雷军投资、小米生态链孵化的睿米科技，也发布了停止运营的通告。头部玩家近况亦不乐观。以科技创新而闻名的科沃斯业绩大幅下滑，在过去几个月中股价的剧烈下跌，引发了市场的高度关注与深刻反思。另一头部玩家石头科技，毛利率下滑、存货周转
“租赁业务ERP+deepseek”模式的应用软件研究员汽车 DeepSeek 汽车租赁系统
汽车租赁业务从上世纪90年代发展至今，从传统的人工管理到软件辅助，随着互联网的发展，业务公司对汽车租赁系统提出了更高的要求，比如自助订单，业务推广、客户资质评估，车辆风控，风险预警等，又随着近期人工智能的出现，业务公司对业务系统的期望更高，期望都节约更多人工成本，让管理变得简单快捷高效和智能。所以就引发人们新的启发：“业务系统ERP+deepseek”，但业务系统ERP+deepseek能否满足业
45-JavaEE 开发中的动态代理与序列化技术只不过是胆小鬼罢了 WEB安全开发 java
在JavaEE开发领域，动态代理与序列化技术是两个关键知识点，它们在很多场景下发挥着重要作用。以下是对这两部分知识的深入探讨。动态代理代理模式概述代理模式是Java中常用的设计模式之一，其核心思想是代理类与委托类实现相同的接口。代理类的主要职责是为委托类进行预处理、消息过滤、转发消息以及事后处理等操作。这种模式在很多场景下都有应用，比如权限控制、日志记录、事务管理等。JDK动态代理实现步骤创建接口
使用GitHub API进行智能文档加载 fgayif github python
GitHub是一个强大的开发者平台，提供了代码存储、管理和分享的功能。它采用Git软件，增强了分布式版本控制，同时提供了访问控制、错误跟踪、软件功能请求、任务管理、持续集成和项目的wiki等功能。随着AI技术的发展，我们可以利用GitHub的API实现智能文档加载，以便更好地进行代码管理和分析。下面我将介绍如何使用GitHubAPI进行文档加载，并通过实用的代码示例来帮助大家理解。技术背景介绍Gi
驱动开发1 zhaoliancheng6 驱动开发
控制三灯循环亮demo.c#include#include#include#include#include#include"myled.h"#defineCNAME"myled"unsignedintmajor=0;charkbuf[100]="";unsignedint*rcc_virt=NULL;//定义rcc虚拟地址gpio_t*gpioe_virt=NULL;//定义gpioe组虚拟地址g
基于Qt开发：实现对海康威视网络摄像头视频画面实时预览鱼弦 Qt学习与实践音视频开发系列实践 Linux系统编程与驱动开发 arm开发
鱼弦：公众号【红尘灯塔】，CSDN博客专家、内容合伙人、新星导师、全栈领域优质创作者、51CTO(Top红人+专家博主)、github开源爱好者（go-zero源码二次开发、游戏后端架构https://github.com/Peakchen）介绍:本文将介绍如何基于Qt开发框架,实现对海康威视网络摄像头的二次开发应用程序。该应用程序可以实时预览摄像头视频画面,并支持控制云台的水平和垂直移动。这种二
量化交易系统中如何处理机器学习模型的训练和部署？ openwin_top 量化交易系统开发机器学习人工智能量化交易
microPythonPython最小内核源码解析NI-motion运动控制c语言示例代码解析python编程示例系列python编程示例系列二python的Web神器Streamlit如何应聘高薪职位量化交易系统中，机器学习模型的训练和部署需要遵循一套严密的流程，以确保模型的可靠性、性能和安全性。以下是详细描述以及相关的示例：1.数据收集和预处理数据收集在量化交易中，数据是最重要的资产。收集的数
【Appium】Appium征服安卓自动化：GitHub 10.5k+星开源神器，Python代码实战全解析！山河不见老 python 测试 appium android 自动化
Appium一、为什么开发者都在用Appium？二、环境搭建：5分钟极速配置2.1核心工具链2.2安卓设备连接三、脚本实战：从零编写自动化操作3.1示例1：自动登录微信并发送消息3.2示例2：动态滑动屏幕与数据抓取四、避坑指南4.1元素定位优化4.2稳定性增强4.3云真机集成五、生态扩展：超越安卓的自动化版图一、为什么开发者都在用Appium？万星认证：GitHub超10.5k+星标，活跃社区持续
于STM32F103C8T6的智能灯泡控制系统C++源码实现程序员Thomas STM32 单片机智能灯泡 stm32 c++嵌入式硬件
以下是一个基于STM32F103C8T6的智能灯泡控制系统C++源码实现，整合了PWM调光、WiFi控制和环境感知功能。该代码已在STM32CubeIDE中验证，支持直接烧录运行：#include"main.h"#include#include"wifi.h"//LED设备抽象类（3设计）classLEDDevice{protected:TIM_HandleTypeDef*pwmTimer;uin
基于STM32的平衡车外设控制应用案例，提供C++源码程序员Thomas STM32 单片机平衡车 stm32 c++单片机
基于STM32的平衡车外设控制应用案例**下面是一个使用STM32控制平衡车的简单应用案例，包含姿态传感器读取、电机控制和串口通信功能。主要功能使用MPU6050传感器读取姿态数据使用PID控制器调整平衡车姿态通过串口输出调试信息电机速度控制C++源代码#include"stm32f10x.h"#include//定义常量#definePWM_MIN1000#definePWM_MAX2000#d
不懂英语可以学编程吗?,不懂英文可以学编程吗 P5688346 人工智能
大家好，给大家分享一下英语不好能学python编程吗，很多人还不知道这一点。下面详细解释一下。现在让我们来看看！Sourcecodedownload:本文相关源码提到人工智能，就不得不提Python编程语言，大多数人觉得编程语言肯定会涉及到很多代码，满屏的英文字母，想想就头疼，觉得自己不会英语，肯定学不好Python，但是不会英语到底能不能够学习Python呢，下面小编给大家分析分析。其实各位想要
如何实现具备自动重连与心跳检测的WebSocket客户端 FFF-X websocket 网络协议网络
本文介绍如何通过原生WebSocketAPI封装一个具备自动重连、心跳检测、错误恢复等能力的稳健客户端。适用于需要长连接的实时通讯场景（如聊天室、实时数据监控等）。核心功能亮点自动重连机制-指数退避策略重连心跳保活-双向检测连接活性消息可靠性-失败消息自动重发异常处理-错误分类处理机制状态管理-精准控制连接生命周期关键优化点说明事件监听优化改用addEventListener替代onopen等属性
JavaScript基础-DOM的一些基本常用语法 Southern Wind JavaScript javascript
总结了一下JS一直到DOM中所用的单词的用法输入方式：window.prompt('请输入数据');输出方式：1、window.alert('HelloJavaScript');2、console.log输出到控制台3、输出数据到页面document.write('hello')JavaScript数据类型1、基本类型string：字符型number：数值型boolean：布尔型2、特殊类型und
《Oracle DBA入门实战：十大高频问题详解与避坑指南》鸿·蒙数据库 Oracle数据库 DBA入门数据库管理 IT技术干货学习笔记
OracleDBA入门作业十问十答本文为OracleDBA入门作业整理，涵盖工具使用、配置管理及权限控制等核心知识点，适合新手快速上手。如有疑问或补充，欢迎评论区交流！1.DBA常用工具有哪些？OracleUniversalInstaller(OUI)用途：安装、升级或删除软件组件。OracleDatabaseConfigurationAssistant(DBCA)用途：通过图形界面创建、删除或修
聊聊langchain4j的HTTP Client langchain4j
序本文主要研究一下langchain4j的HTTPClientlangchain4j-http-clientlangchain4j提供了langchain4j-http-client模块，它实现了一个HttpClientSPI（服务提供者接口），其他模块通过该接口调用LLM提供商的RESTAPI。这意味着底层HTTP客户端可以被自定义，通过实现HttpClientSPI，还可以集成任何其他HTTP
《当人工智能遇上广域网：跨越地理距离的通信变革》程序猿阿伟人工智能
在数字化时代，广域网作为连接全球信息的纽带，让数据能够在不同地区的网络之间流动。然而，地理距离给广域网数据传输带来诸多挑战，如高延迟、低带宽、信号衰减和不稳定等问题。幸运的是，飞速发展的人工智能技术为解决这些难题提供了新的方向，开启了广域网传输的新篇章。广域网传输面临的地理挑战广域网覆盖范围极为广泛，可连接不同城市、国家甚至跨越洲际，这使得数据传输要跨越漫长的地理距离。以跨国公司的广域网为例，其总
V Rising夜族崛起的管理员指令大全莱卡云（Lcayun）云计算 linux 游戏服务器
使用方法：如果没有启用控制台需要先启用控制台打开游戏点击选项（如果在游戏内点击ESC即可），在通用页面找到启用控制台，勾选右边的方框启用在游戏内点击键盘ESC下方的波浪键（~）使用控制台指令：addtime向前调整游戏时间，addtime+空格+参数（参数必填），参数区间（1~12），可用于调节游戏中的白天天和黑夜的节奏，或者刷怪的节奏，但不能用于植物成熟和仆人打工时间的加快AdminAuth管理
NLP高频面试题（十）——目前常见的几种大模型架构是啥样的 Chaos_Wang_ NLP常见面试题自然语言处理架构人工智能
深入浅出：目前常见的几种大模型架构解析随着Transformer模型的提出与发展，语言大模型迅速崛起，已经成为人工智能领域最为关注的热点之一。本文将为大家详细解析几种目前常见的大模型架构，帮助读者理解其核心差异及适用场景。1.什么是LLM（大语言模型）？LLM通常指参数量巨大、能够捕捉丰富语义信息的Transformer模型，它们通过海量的文本数据训练而成，能够实现高度逼真的文本生成、复杂的语言理
Google的BeyondCorp 零信任网络 yinhezhanshen 网络
Google的BeyondCorp是一种零信任安全框架1。简单来说，就是抛弃了传统的以网络边界为基础的安全防护模式，不再认为只要在企业内部网络里就都是安全的，而是把访问控制的重点放在每个用户和设备上。产生背景过去企业常用防火墙等构建安全边界，认为边界内是安全的，边界外有威胁。但随着网络发展，边界变得模糊，攻击技术演进，边界防护效果变差，内部也会出现安全问题。在这种情况下，Google提出了Beyo
机器学习 Day01人工智能概述山北雨夜漫步机器学习人工智能
1.什么样的程序适合在gpu上运行计算密集型的程序：此类程序主要运算集中在寄存器，寄存器读写速度快，而GPU拥有强大的计算能力，能高效处理大量的寄存器运算，因此适合在GPU上运行。像科学计算中的数值模拟、密码破解等场景的程序，都属于计算密集型，在GPU上运行可大幅提升运算速度。易于并行的程序：GPU采用SIMD架构，有众多核心，同一时间每个核心适合做相同的事。易于并行的程序能充分利用GPU这一特性
华为OD机试统一考试D卷C卷 - 机器人仓库搬砖 py 愤怒的小青春 java
平安寿险北分和飞鹤职能哪个强度好一些呀，平安寿险北分和飞鹤职能哪个强度好一些呀，两个offer纠结经营分析应该属于什么序列#数据分析#在牛客搜经营分析貌似只有字节有这个单独岗位名字，其他大厂都是在从属于数据分析，所以这俩昇腾计算岗位扩招，绝佳上车AI机会，速来ai芯片业务发展太快，要大量补充人力缺口。嵌入式软件开发、测试，前后端岗位，硬件岗位都招。院校范围很春招补录两个公司总包差不多，都是后台开发
《今日AI-人工智能-编程日报》-源自2025年3月20日小亦编辑部每日AI-人工智能-编程日报人工智能大数据
一、AI行业动态英伟达新一代AI芯片Rubin发布计划英伟达宣布其新一代AI芯片Rubin将于2026年下半年推出，下下一代AI芯片架构命名为Feynman，计划于2028年登场。同时，英伟达还推出了RTXPRO6000系列Blackwell专业卡，拥有24064核心、96GB显存和最高600W功耗。OpenAI星际之门数据中心建设进展OpenAI的首个数据中心“星际之门”预计于2026年中在德克
SpringAOP-基本概念-AOP入门程序-核心概念-通知类型-通知顺序-切入点表达式-连接点joinpoint-记录操作日志-获取当前登录员工汐栊 java 开发语言 spring mvc 数据库
目录SpringAOP:AOP快速入门：AOP核心概念：AOP进阶：通知类型：注意事项：方法实现：@PointCutAOP通知顺序:执行顺序:不同切面类中,默认按照切面类的类名字母排序。用@Order(数字)加在切面类上来控制顺序AOP切入点表达式:切入点表达式-execution：切入点表达式-@annotation:可以使用通配符描述切入点:AOP连接点:AOP案例:将案例中增,删,改相关接口
【网络安全 | 漏洞挖掘】通过控制台调试实现登录秋说 web安全漏洞挖掘
未经许可，不得转载。文章目录正文在安全测试过程中，我留意到一个特殊现象：当登录出现错误时，相关请求包并不经过BurpSuite。那么此时账号密码是储存在前端的，我通过调试即可实现登录管理员账户。正文由于系统设定，输入错误的账号和密码会弹出“账号密码错误”的提示。基于此，我在代码中“账号密码错误”提示的相关位置设置了断点，截图如下：随后，我刷新浏览器页面，输入错误的账号和密码，然后点击登录按钮，操作
聊聊langchain4j的HTTP Client hello_ejb3 http iphone 网络协议
序本文主要研究一下langchain4j的HTTPClientlangchain4j-http-clientlangchain4j提供了langchain4j-http-client模块，它实现了一个HttpClientSPI（服务提供者接口），其他模块通过该接口调用LLM提供商的RESTAPI。这意味着底层HTTP客户端可以被自定义，通过实现HttpClientSPI，还可以集成任何其他HTTP
有奖直播 | NXP S32K31X 系列 ASIL-B 车身应用方案介绍 WPG大大通研讨会大大通研讨会汽车车身控制芯片智能
随着汽车智能化、电动化的快速发展，车身控制模块（BCM）作为汽车电子系统的核心组成部分，正面临着更高的功能安全要求和更复杂的系统集成需求。NXPS32K31X系列微控制器凭借其高性能、低功耗和符合ASIL-B功能安全等级的特性，成为车身控制应用的理想选择。本次研讨会将深入探讨S32K31X系列在车身控制中的应用方案，帮助开发者快速掌握相关技术，缩短产品开发周期。研讨会内容包含：一、S32K31X系
Java实现的简单双向Map，支持重复Value superlxw1234 java 双向map
关键字：Java双向Map、DualHashBidiMap 有个需求，需要根据即时修改Map结构中的Value值，比如，将Map中所有value=V1的记录改成value=V2，key保持不变。数据量比较大，遍历Map性能太差，这就需要根据Value先找到Key，然后去修改。即：既要根据Key找Value，又要根据Value
PL/SQL触发器基础及例子百合不是茶 oracle数据库触发器 PL/SQL编程
触发器的简介; 触发器的定义就是说某个条件成立的时候，触发器里面所定义的语句就会被自动的执行。因此触发器不需要人为的去调用，也不能调用。触发器和过程函数类似过程函数必须要调用, 一个表中最多只能有12个触发器类型的,触发器和过程函数相似触发器不需要调用直接执行, 触发时间：指明触发器何时执行，该值可取： before：表示在数据库动作之前触发
[时空与探索]穿越时空的一些问题 comsci 问题
我们还没有进行过任何数学形式上的证明,仅仅是一个猜想..... 这个猜想就是; 任何有质量的物体(哪怕只有一微克)都不可能穿越时空,该物体强行穿越时空的时候,物体的质量会与时空粒子产生反应,物体会变成暗物质,也就是说,任何物体穿越时空会变成暗物质..(暗物质就我的理
easy ui datagrid上移下移一行商人shang js 上移下移 easyui datagrid
/** * 向上移动一行 * * @param dg * @param row */ function moveupRow(dg, row) { var datagrid = $(dg); var index = datagrid.datagrid("getRowIndex", row); if (isFirstRow(dg, row)) {
Java反射 oloz 反射
本人菜鸟，今天恰好有时间，写写博客，总结复习一下java反射方面的知识，欢迎大家探讨交流学习指教首先看看java中的Class package demo; public class ClassTest { /*先了解java中的Class*/ public static void main(String[] args) { //任何一个类都
springMVC 使用JSR-303 Validation验证杨白白 spring mvc
JSR-303是一个数据验证的规范，但是spring并没有对其进行实现，Hibernate Validator是实现了这一规范的，通过此这个实现来讲SpringMVC对JSR-303的支持。 JSR-303的校验是基于注解的，首先要把这些注解标记在需要验证的实体类的属性上或是其对应的get方法上。登录需要验证类 public class Login { @NotEmpty
log4j 香水浓 log4j
log4j.rootCategory=DEBUG, STDOUT, DAILYFILE, HTML, DATABASE #log4j.rootCategory=DEBUG, STDOUT, DAILYFILE, ROLLINGFILE, HTML #console log4j.appender.STDOUT=org.apache.log4j.ConsoleAppender log4
使用ajax和history.pushState无刷新改变页面URL agevs jquery 框架 Ajax html5 chrome
表现如果你使用chrome或者firefox等浏览器访问本博客、github.com、plus.google.com等网站时，细心的你会发现页面之间的点击是通过ajax异步请求的，同时页面的URL发生了了改变。并且能够很好的支持浏览器前进和后退。是什么有这么强大的功能呢？ HTML5里引用了新的API，history.pushState和history.replaceState，就是通过
centos中文乱码 AILIKES centos OS ssh
一、CentOS系统访问 g.cn ，发现中文乱码。于是用以前的方式：yum -y install fonts-chinese CentOS系统安装后，还是不能显示中文字体。我使用 gedit 编辑源码，其中文注释也为乱码。后来，终于找到以下方法可以解决，需要两个中文支持的包： fonts-chinese-3.02-12.
触发器 baalwolf 触发器
触发器(trigger)：监视某种情况，并触发某种操作。触发器创建语法四要素：1.监视地点(table) 2.监视事件(insert/update/delete) 3.触发时间(after/before) 4.触发事件(insert/update/delete) 语法： create trigger triggerName after/before
JS正则表达式的i m g bijian1013 JavaScript 正则表达式
g:表示全局（global)模式，即模式将被应用于所有字符串，而非在发现第一个匹配项时立即停止。 i:表示不区分大小写（case-insensitive）模式，即在确定匹配项时忽略模式与字符串的大小写。 m:表示
HTML5模式和Hashbang模式 bijian1013 JavaScript AngularJS Hashbang模式 HTML5模式
我们可以用$locationProvider来配置$location服务（可以采用注入的方式，就像AngularJS中其他所有东西一样）。这里provider的两个参数很有意思，介绍如下。 html5Mode 一个布尔值，标识$location服务是否运行在HTML5模式下。 ha
[Maven学习笔记六]Maven生命周期 bit1129 maven
从mvn test的输出开始说起当我们在user-core中执行mvn test时，执行的输出如下： /software/devsoftware/jdk1.7.0_55/bin/java -Dmaven.home=/software/devsoftware/apache-maven-3.2.1 -Dclassworlds.conf=/software/devs
【Hadoop七】基于Yarn的Hadoop Map Reduce容错 bit1129 hadoop
运行于Yarn的Map Reduce作业，可能发生失败的点包括 Task Failure Application Master Failure Node Manager Failure Resource Manager Failure 1. Task Failure 任务执行过程中产生的异常和JVM的意外终止会汇报给Application Master。僵死的任务也会被A
记一次数据推送的异常解决端口解决 ronin47 记一次数据推送的异常解决
　　需求：从db获取数据然后推送到B 程序开发完成，上jboss,刚开始报了很多错，逐一解决，可最后显示连接不到数据库。机房的同事说可以ping 通。　　自已画了个图，逐一排除，把linux 防火墙　和　setenforce　设置最低。　　　service iptables stop
巧用视错觉-UI更有趣 brotherlamp UI ui视频 ui教程 ui自学 ui资料
我们每个人在生活中都曾感受过视错觉（optical illusion）的魅力。视错觉现象是双眼跟我们开的一个玩笑，而我们往往还心甘情愿地接受我们看到的假象。其实不止如此，视觉错现象的背后还有一个重要的科学原理——格式塔原理。格式塔原理解释了人们如何以视觉方式感觉物体，以及图像的结构，视角，大小等要素是如何影响我们的视觉的。在下面这篇文章中，我们首先会简单介绍一下格式塔原理中的基本概念，
线段树-poj1177-N个矩形求边长（离散化+扫描线） bylijinnan 数据结构算法线段树
package com.ljn.base; import java.util.Arrays; import java.util.Comparator; import java.util.Set; import java.util.TreeSet; /** * POJ 1177 (线段树+离散化+扫描线)，题目链接为http://poj.org/problem?id=1177
HTTP协议详解 chicony http协议
引言
Scala设计模式 chenchao051 设计模式 scala
Scala设计模式我的话：在国外网站上看到一篇文章，里面详细描述了很多设计模式，并且用Java及Scala两种语言描述，清晰的让我们看到各种常规的设计模式，在Scala中是如何在语言特性层面直接支持的。基于文章很nice，我利用今天的空闲时间将其翻译，希望大家能一起学习，讨论。翻译
安装mysql daizj mysql 安装
安装mysql (1)删除linux上已经安装的mysql相关库信息。rpm -e xxxxxxx --nodeps (强制删除) 执行命令rpm -qa |grep mysql 检查是否删除干净 (2)执行命令 rpm -i MySQL-server-5.5.31-2.el
HTTP状态码大全 dcj3sjt126com http状态码
完整的 HTTP 1.1规范说明书来自于RFC 2616，你可以在http://www.talentdigger.cn/home/link.php?url=d3d3LnJmYy1lZGl0b3Iub3JnLw%3D%3D在线查阅。HTTP 1.1的状态码被标记为新特性，因为许多浏览器只支持 HTTP 1.0。你应只把状态码发送给支持 HTTP 1.1的客户端，支持协议版本可以通过调用request
asihttprequest上传图片 dcj3sjt126com ASIHTTPRequest
NSURL *url =@"yourURL"; ASIFormDataRequest*currentRequest =[ASIFormDataRequest requestWithURL:url]; [currentRequest setPostFormat:ASIMultipartFormDataPostFormat];[currentRequest se
C语言中，关键字static的作用 e200702084 C++c C#
在C语言中，关键字static有三个明显的作用： 1)在函数体，局部的static变量。生存期为程序的整个生命周期，（它存活多长时间）；作用域却在函数体内（它在什么地方能被访问（空间））。一个被声明为静态的变量在这一函数被调用过程中维持其值不变。因为它分配在静态存储区，函数调用结束后并不释放单元，但是在其它的作用域的无法访问。当再次调用这个函数时，这个局部的静态变量还存活，而且用在它的访
win7/8使用curl geeksun win7
1. WIN7/8下要使用curl，需要下载curl-7.20.0-win64-ssl-sspi.zip和Win64OpenSSL_Light-1_0_2d.exe。下载地址： http://curl.haxx.se/download.html 请选择不带SSL的版本，否则还需要安装SSL的支持包 2. 可以给Windows增加c
Creating a Shared Repository; Users Sharing The Repository hongtoushizi git
转载自： http://www.gitguys.com/topics/creating-a-shared-repository-users-sharing-the-repository/ Commands discussed in this section: git init –bare git clone git remote git pull git p
Java实现字符串反转的8种或9种方法 Josh_Persistence 异或反转递归反转二分交换反转 java字符串反转栈反转
注：对于第7种使用异或的方式来实现字符串的反转，如果不太看得明白的，可以参照另一篇博客： http://josh-persistence.iteye.com/blog/2205768 /** * */ package com.wsheng.aggregator.algorithm.string; import java.util.Stack; /**
代码实现任意容量倒水问题 home198979 PHP 算法倒水
形象化设计模式实战 HELLO!架构 redis命令源码解析倒水问题：有两个杯子，一个A升，一个B升，水有无限多，现要求利用这两杯子装C
Druid datasource zhb8015 druid
推荐大家使用数据库连接池 DruidDataSource. http://code.alibabatech.com/wiki/display/Druid/DruidDataSource DruidDataSource经过阿里巴巴数百个应用一年多生产环境运行验证，稳定可靠。它最重要的特点是：监控、扩展和性能。下载和Maven配置看这里： http
两种启动监听器ApplicationListener和ServletContextListener spjich java spring 框架
引言:有时候需要在项目初始化的时候进行一系列工作，比如初始化一个线程池，初始化配置文件，初始化缓存等等，这时候就需要用到启动监听器，下面分别介绍一下两种常用的项目启动监听器 ServletContextListener 特点: 依赖于sevlet容器，需要配置web.xml 使用方法: public class StartListener implements
JavaScript Rounding Methods of the Math object 何不笑 JavaScript Math
The next group of methods has to do with rounding decimal values into integers. Three methods — Math.ceil(), Math.floor(), and Math.round() — handle rounding in differen

【AI视野·今日Robot 机器人论文速览 第四十五期】Mon, 2 Oct 2023

Daily Robotics Papers

你可能感兴趣的:(触觉,机器人,Papers,人工智能,机器人,robot,控制,抓取,LLM,触觉)

【AI视野·今日Robot 机器人论文速览第四十五期】Mon, 2 Oct 2023