羊飘

Briefings in bioinformatics2022 | 基于images-texts的Multi-modal结构信息重建以探索near-drug空间

论文地址：https://academic.oup.com/bib/advance-article/doi/10.1093/bib/bbac461/6761958

论文标题：Multi-modal chemical information reconstruction from images and texts for exploring the near-drug space

一、问题提出

A：药物空间、已知虚拟类药物空间和新型近药物空间的比较。B：专利信息提取的工作。传统的工作(左)涉及大量的手工操作，而CIRS系统更自动化(右)。

类药物空间中包含的许多分子可能难以合成或缺乏预期的药物效果，因此如何建立一个由具有更多可合成化学结构和预期生物特性的化合物组成的“近药物”空间已成为提高成功率和降低药物发现过程成本的最核心目标之一。

将重点放在化学专利上，因为专利中披露的结果可以更加及时、可靠和全面。此外，专利文件涵盖了大量具有可合成结构和预期生物特性的分子，这对发现有用的化合物特别有利。化学专利的主要输出是文本描述和图像模板的混合，许多努力都致力于开发可扩展和精确的工具，以从文本中识别命名实体和从图像中识别化学结构。

对传统分子smiles结构识别：Image2SMILES设法通过数据生成器识别化学结构中的非常规原子。然而，目前的方法在具有特殊键和原子的分子结构图像的识别上仍有一定的局限性。此外，化学专利通常以XML、HTML或PDF格式下载，这些格式的图像分辨率低，噪声大，难以准确提取分子结构。

专利的不同形式的化学信息，即文字和图像，应协调利用，以提供准确的输出。然而，对于计算化学和人工智能的研究人员来说，这种结构融合仍然是一个公开的挑战。

目标是建立一个多模态化学信息重构系统(chemical information reconstruction system：CIRS)，从专利文本和图像中自动处理、提取和对齐异质信息，以最小的人为干预促进化学结构数据库的构建。

二、Materials and methods

1、Data collection and preprocessing

对于Markush图像识别任务，从ChEMBL数据库(ChEMBL28版本)中下载SMILES格式的化学结构。使用RDKit对包含1 911 226个结构的原始SMILES数据集执行清洗。RDKit无法检索的结构被删除;有超过50个重原子的分子也被删除（因为分子图像太“拥挤”，无法处理）。随机数据分割:(1)150K图像训练集；(2) 30K图像验证集；(3)30K图像测试集。

在生成类似Markush结构图像时，使用一些常见的官能团和r基团来替换分子中的原子。使用RDKit识别显式氢原子，并随机替换为上面的标签。如果一个结构有一个或多个环，可以在一个或多个环上随机添加r基团和穿过环的键，以再现真实化学文献中的这种情况。因为RDKit只能生成Kekulized风格的芳香环，所以生成的分子首先以SVG格式保存。在保存步骤中，随机选择图像和原子标签填充大小、键合线宽度和偏移量、原子标签字体和总旋转角度，生成高度多样化的训练图像。然后对SVG字符串进行解析，并随机选取Kekulized样式的芳香环，并将其转换为芳香样式(一个环中间有一个圆)。最后，呈现SVG字符串以生成输出PNG图像。RDKit还提取了原子和键的坐标等附加的基本基元信息，用于创建语义分割和对象分类任务所需的标签。

文本数据来源于欧洲专利局和美国专利和T商标局下载的2712项英文化学专利，检索关键词为A61P、化合物、结构、年份(2010 - 2020)。

预处理主要包括截取取代基描述文本，并通过光学字符识别(OCR)程序将截取的文本转换为可编辑文本。共获得2712个片段，20 798个单词。

Functional groups: Me, OMe, NHMe, Et, OEt, NHEt, Pr, OPr,NHPr, i-Pr, Bu, OBu, NHBu, i-Bu, s-Bu, t-Bu, Ph, OPh, NHPh, T ol,Ts, OTs, NHTs, Bz, NHBz, CF3, CN, CHO, COOH, COOMe, COOEt,NHOH, NMe2, N E t2, N3, N O2, COCl, SOOMe, SOOEt, SOOPh, Bn,OBn, NHBn, Boc, OBoc, Cbz, OCbz, Tf, OTf, Piv , OPiv , Vin, All, TMS,OTMS, TBS, OTBS, THP , OTHP , TBDPS, OTBDPS, OMOM, TES, OTES,

IPDMS, OIPDMS, DEIPS, ODEIPS, CIIS, OCIIS, TIPDS, TFA, OTFA,Fmoc, OFmoc, Alloc, OAlloc, T roc, OT roc, Teoc, OTeoc, T r, OT r,DMTC, ODMTC, BPin, OLev , PMP , OPMP , PMB, OPMB, Bt, OMPA, Mes.
R-groups: R, R1 ∼ R10, Ra ∼ Re, R ’ , R ” , A , M , W , X , Y , Z , Ar , Hal , ∗, #

2、Overview of CIRS （method）

三个主要分支，即图像处理单元(左)、异构数据生成器(中)和文本处理单元(右)，左边和右边的分支分别是取自化学专利图像和文本的模型;这两个分支通过异构数据生成器隐式连接，作为中间的集线器模块，其作用是跨域生成成对的训练数据。因此，在训练过程中，这两个模型将自动学习在跨领域识别化学实体和将它们对齐方面彼此协调。

训练过程：首先，异构数据生成器将以Markush结构图像和(像素级)原子/键标签的形式生成紧密耦合的化学实体对。然后将这些数据作为训练数据输入Image-processing unit，使用Unet3+和YOLOv5来将像素分割成原子和键，并为它们分配正确的标签。在右侧分支中，Text-processing unit采用BiLSTM-CRF模型进行名称实体识别，识别文本中的化学实体(r-基团和取代基)。然后，两个分支的输出，左边的原子/键标签和右边的化学实体，彼此对齐，以重建它们的化学信息。最后，为了将通过左侧模型识别的化学实体实际转化为可见的化学结构，建立了包含7781个取代基结构的取代基描述(化学名称)和SMILES字符串的结构数据库。

异构数据生成器作为中心模块产生跨形态的化学实体之间的关键对应关系。优点是对训练样本的数量和多样性没有严格的限制，可以根据用户的要求随机修改分子。这可以转化为图像处理和文本处理单元良好的泛化性能，这是模型在海量化工专利中提取化工信息的适用性的关键。因此，从双分支模型中提取的结构可以自动对齐，并推广到化工专利中不同的分子结构及其组合。

3、Image-processing unit

由语义分割网络和分类网络组成。

语义分割网络UNet 3+：将每个像素分类为背景、原子或键，并将它们存储在具有像素位置的分割图中。512 × 512，epoch设为15，batch_size为4。考虑到前景(分子)和背景(空像素)的不平衡，选择focal loss。UNet 3+参数(空间复杂度)为26.97M，时间复杂度(FLOPs)为798.68G(每次forward前向运算)。

分类网络YOLOv5：其中原子和键分别被检测和分类。首先根据原子特征图进行非极大值抑制定位原子，然后计算并记录每个原子点的几何中心。以原始图像和中心坐标为输入，预测每个原子的类型和电荷。键以类似的方式处理。epoch为50，batch_size为16。YOLO网络的参数值值和FLOPs分别为47.05M和55.41G。将集成所有信息(原语类型、电荷、位置和连接模式)，并使用RDKit将图像转换为具有结构化格式(如SMILES)的分子。

4、Text-processing unit

使用BiLSTM结合CRF模型。输入文本序列w1, w2，…， wn由词向量vi表示，使用基于word2vector的word embedding捕获input text的语义信息，然后送入BiLSTM encoder将其转换为latent vector;然后将潜在特征向量hi转换为新的表示形式pi，然后将其送入线性CRF层，用于NER标签预测，这是一个从文本中检测真实世界实体的提及并将其分类为预定义类型的任务。使用CrossEntropy loss和10-fold cross validation ，使用Viterbi 算法解码。batch_size为64个序列，每个序列有256个token。参数为0.51M，FLOPs计算的时间复杂度为3.07M。Adam优化器。

5、Evaluation metrics

TP为真阳性率，FP为假阳性率，FN为假阴率。

三、Results and discussion

1、Markush chemical image recognition

公共数据集和相关方法大多针对公共结构图像(没有不确定标签的完整分子)，这限制了它们的应用。

原始分子结构数据从ChEMBL数据库中收集，并用于生成markush型结构的分子图像。然后，这些数据集被用来训练图像处理单元，将给定的图像转换为机器可处理的分子格式，并验证其性能。图像主要包含R基团、官能团、环R键和随机椒盐噪声。

Image-processing unit性能使用两个数据源进行评估:(1) 由作者跨模态数据生成器生成的人工分子图像(通过将分子中的隐式氢原子替换为官能团、R基团)；(2) MolrecUOB数据集，包含5740张真实的(有噪声的)图片，这些图片来自真实的化学文档，包含了官能组(R-groups)。

目标是识别化学基元并预测其标签(原子/键类型、电荷等)，并基于识别基元的连接模式以SMILES格式重建分子结构。

其中语义分割模块可以准确地识别原子和键，即使存在椒胡噪声。该模块的像素精度达到0.982，这表明它可以有效地检测图像中的原子和键的位置。对于原子分类模块，找到正确原子类型的精度平均超过0.996，而R组检测的精度略低(0.976)，因为R组的样式和格式通常是可变的。对于化学键，分类模块的性能也很高(0.996)。最常见的失败是楔形、破折号和环形r键的混淆，因为楔形和环形r键可能看起来像单键。破折号键有时会被模型忽略，因为它的可见度比普通键低，特别是在背景噪声水平高的情况下。原子电荷的预测精度约为0.989。小字体的电荷符号可能会得到稍低的精度。该模型的良好性能主要归功于高质量的训练图像生成。

可以正确重建79%的输入MolrecUOB图像的结构，Tanimoto相似度评分为0.90，表明模型对真实数据具有良好的泛化能力

2、Chemical entity recognition

专利中化学结构文本的标注语料库尤其有限，这直接影响了训练模型的泛化能力。为了解决这个问题，从欧洲专利局和美国专利及商标局下载了2712项化学专利，收集了实体文本和注释训练(2400个片段)和测试(312个片段)集，共20 798个单词。训练集中有6755个片段，验证集中有751个片段，测试集中有312个片段。

(A)带有一些取代类型(S-Entity, S-component, B-component, M-component and E-component)的NER注释片段。(B)数据增强protocol,，将2400个原始片段转换为7506个片段。(C)化学实体在训练、验证和测试集中的分布。(D) BiLSTM-CRF体系结构测试处理单元的说明。(E)实体预测的混淆矩阵;矩阵的第(ij)项表示第i类实体中被预测为第j类实体的部分。主导对角线实体表示准确的预测。

识别实体性能：

3、Case study of chemical information reconstruction

通过一个案例研究来演示CIRS的实用性，在该案例中，选择了一个特定的专利，从其图像和文本描述中提取化学实体，将实体排列在一起，最后将重构的信息转换为结构化的分子数据库。

该专利包含约4个分子式和11个分子图像，展示了他们的化合物发明。选择了一个化学信息提取公式(Ia)来证明CIRS的实用性。如上图所示，公式(Ia)由两部分组成:Markush分子图像和取代基实体文本。

通过CIRS，分别从图像和文本中提取了一个Markush结构和8个具有123个取代基结构的化学实体，将化学实体跨文本和图像的形态进行对齐，并执行专利公式中规定的替换/组合规则，结果得到了2 082 500个分子。与原始专利中报告的11个分子实例相比，这是一个显著的丰富。可以看出，系统可以提取专利中的化学发现，并将其转化为具有所需替换规则的高度综合的分子集合，重构其化学信息。这可以作为药物筛选有用的分子数据库。可以预见的是，通过将系统应用到大量的化学专利中，可以获得大量的结构来促进近药物分子的生成，并有望为制药行业构建一个有用的近药物空间

ARM嵌入式可编程控制器技术开发拉勾科研工作室 arm开发
PLC自动化设计|毕业设计指导|工业自动化解决方案✨专业领域：PLC程序设计与调试工业自动化控制系统HMI人机界面开发工业传感器应用电气控制系统设计工业网络通信擅长工具：西门子S7系列PLC编程三菱/欧姆龙PLC应用触摸屏界面设计电气CAD制图工业现场总线技术自动化设备调试主要内容：PLC控制系统设计工业自动化方案规划电气原理图绘制控制程序编写与调试毕业论文指导毕业设计题目与程序设计✅具体问题可以
【Linux】进程间通信-管道通信实验会的全对٩(ˊᗜˋ*)و Linux linux 经验分享
要求：利用有名管道编写简单的聊天程序，聊天双方在线才能说话，一方说话后需另一方应答才能继续说话，即一来一往的聊天模式，如果输入quit则退出聊天程序。代码实现：进程A#include#include#include#include#include#include#defineFIFO_A"/tmp/chat_fifo_a"//进程A写消息，进程B读消息#defineFIFO_B"/tmp/chat
基于Python的Google Scholar学术论文爬虫实战：最新技术与完整代码解析 Python爬虫项目 2025年爬虫实战项目 python 爬虫开发语言学习 scrapy
摘要本文详细介绍如何使用Python构建一个高效的GoogleScholar爬虫系统，包括代理设置、反反爬策略、数据解析与存储等核心技术。文章涵盖最新Python爬虫技术栈（如Playwright、异步IO等），提供完整可运行的代码示例，并讨论学术爬虫的伦理与法律问题。通过本教程，读者将掌握从GoogleScholar批量获取学术论文信息的高级爬虫技术。关键词：Python爬虫、GoogleSch
[论文阅读]Distilling Step-by-Step! Outperforming Larger Language Models with Less Training Data and Smal 0x211 论文阅读语言模型人工智能自然语言处理
中文译名：逐步蒸馏！以较少的训练数据和较小的模型规模超越较大的语言模型发布链接：http://arxiv.org/abs/2305.02301AcceptedtoFindingsofACL2023阅读原因：近期任务需要用到蒸馏操作，了解相关知识核心思想：改变视角。原来的视角：把LLMs视为噪声标签的来源。现在的视角：把LLMs视为能够推理的代理。方法好在哪？需要的数据量少，得到的结果好。文章的方法
sync.Mutex和sync.RWMutex的区别和它们的使用场景。sync.RWMutex在读多写少的场景下性能更好的原因。小高Baby@ golang 数据结构
Mutex是普通互斥锁，读写操作都需要先获取锁，同一时刻只能有一个goroutines在进行操作RWMtuex是读写互斥锁，读操作允许多个goroutines并发进行，写操作只允许一个goroutines进行操作Mutex适用于读写操作频繁且无明显倾向的场景，RWMutex适用于读多写少的操作。
python+springboot+vue的音乐系统 QQ_511008285 python spring boot vue.js django flask node.js php
目录技术栈介绍具体实现截图系统设计研究方法：设计步骤设计流程核心代码部分展示研究方法详细视频演示试验方案论文大纲源码获取/详细视频演示技术栈介绍Django-SpringBoot-php-Node.js-flask本课题的研究方法和研究步骤基本合理，难度适中，本选题是学生所学专业知识的延续，符合学生专业发展方向，对于提高学生的基本知识和技能以及钻研能力有益。该学生能够在预定时间内完成该课题的设计。
python基于Hadoop的NBA球员大数据分析与可视化系统
目录技术栈介绍具体实现截图系统设计研究方法：设计步骤设计流程核心代码部分展示研究方法详细视频演示试验方案论文大纲源码获取/详细视频演示技术栈介绍Django-SpringBoot-php-Node.js-flask本课题的研究方法和研究步骤基本合理，难度适中，本选题是学生所学专业知识的延续，符合学生专业发展方向，对于提高学生的基本知识和技能以及钻研能力有益。该学生能够在预定时间内完成该课题的设计。
基于 Python 的图书管理系统（源码）
摘要：本论文详细阐述了利用Python语言开发一个简易图书管理系统的过程。该系统具备图书信息录入、删除、修改、查询以及借阅管理等核心功能，可有效提升图书管理的效率与便捷性。通过阐述系统的需求分析、设计思路、代码实现及测试过程，展示了Python在小型管理系统开发中的应用潜力，为相关领域的软件开发提供了有益参考。关键词：Python编程；图书管理系统；数据结构；代码实现一、引言（一）研究背景随着数字
每日mysql 卡卡卡卡罗特每日mysql mysql 数据库
什么是Mysql索引最左匹配原则？最左匹配原则是指，在复合索引中，查询条件需要从左到右和索引开始依次完全匹配的时候，复合索引才可以被有效使用。因为联合索引在建立b+树的过程中是根据索引的顺序从左到右进行排序的，所以使用的时候需要遵循这个原则。能否举例说明复合索引在查询时遵循最左匹配原则的情况假设有(name,age,city)这个复合索引，那么查询语句就得是：SELECT*FROMusersWHE
【EGSR2025】材质+扩散模型+神经网络相关论文整理随笔（四） Superstarimage 文献随笔材质神经网络人工智能扩散模型
AnevaluationofSVBRDFPredictionfromGenerativeImageModelsforAppearanceModelingof3DScenes输入3D场景的几何和一张参考图像，通过扩散模型和SVBRDF预测器获取多视角的材质maps，这些maps最终合并成场景的纹理地图集，并支持在任意视角、任意光照条件下进行重新渲染。样例图如下：在当前时代的技术背景下，生成与几何匹配
每日MySQL之024：FLUSH TABLES 匿_名_用_户 MYSQL MySQL FLUSH TABLES
FLUSHTABLES作用是flush表，并根据参数加上相应的锁。默认是写日志的，如果不希望写日志，可以设置加上参数NO_WRITE_TO_BINLOG。另外，FLUSHTABLES命令执行前会隐式地发出commit命令，常见语法如下：•FLUSHTABLES关闭所有的表，包括正在使用的表，并且会flushquerycache。如果有正处于活动状态的LOCKTABLES...READ命令，则不允许
每日MySQL之005：SUSE linux下卸载MySQL
卸载这里的卸载，对应于之前的安装停止MySQL服务：db2a:~#servicemysqlstop找到所有的MySQL包：db2a:~#rpm-qa|grep-imysqlmysql-community-server-5.7.19-1.sles11mysql-community-common-5.7.19-1.sles11libqt4-sql-mysql-4.6.3-5.34.2mysql-com
超越RAG的搜索革命！分层框架让AI像专家团队一样深度思考 Python_金钱豹人工智能深度学习网络知识图谱大数据
❝一句话概括：与其训练一个越来越大的“六边形战士”AI，不如组建一个各有所长的“复仇者联盟”，这篇论文就是那本“联盟组建手册”。（原论文题目见文末，点击阅读原文可直接跳转至原文链接，Publishedonarxivon03Jul2025,byRenminUniversityofChina）*第一阶段：核心思想概览**论文的动机*在面对“未来的家庭娱乐会是什么样？”或“结合最新的财报和市场趋势，分析
每日mysql 卡卡卡卡罗特每日mysql 算法数据结构
聚簇索引和非聚簇索引的区别定义方面：聚簇索引是基于主键值进行构建的，而非聚簇索引是基于非主键字段构建。假如没有主键，就会选择一个唯一的字段进行构建。假如唯一的字段也没有，就会使用隐藏的列进行构建。存储方面：聚簇索引叶子节点存储的为完整的数据记录。非聚簇索引叶子节点只存储主键和索引字段。应用方面：聚簇索引适合大范围查询和排序，因为可以直接通过主键进行查询和排序。不需要回表。而非聚簇索引在查询索引字段
web 系统对接钉钉三方登录完整步骤实战使用示例
Web系统对接钉钉三方登录完整步骤实战以下是基于OAuth2.0授权码模式的完整对接流程（以扫码登录为例）：一、准备工作注册钉钉开发者账号钉钉开放平台→创建企业内部应用（或第三方应用）记录AppKey和AppSecret配置回调域名（如https://yourdomain.com/callback）授权权限在应用权限中开启成员信息读权限（auth/user）二、前端实现：生成登录二维码window
android mvvm官方demo,Android mvvm架构demo(DataBinding+LiveData+ViewModel+ Repository)
1.实现效果实现页面加载Bing每日一图的功能2.项目结构image(忽略没有按分类创建).png3.实现过程1.注入依赖//ViewModel与LiveDataimplementation"android.arch.lifecycle:extensions:1.1.1"//图片加载implementation'com.github.bumptech.glide:glide:4.9.0'//网络请
SPGAN: Siamese projection Generative Adversarial Networks 这张生成的图像能检测吗优质GAN模型训练自己的数据集人工智能生成对抗网络计算机视觉深度学习神经网络算法
简介简介：该论文针对传统GANs中鉴别器采用硬边际分类导致的误分类问题，提出了基于Siameseprojection网络的SPGAN方法。主要创新点包括：（1）设计Siameseprojection网络来测量特征相似性；（2）提出相似特征对抗学习框架，将相似性测量融入生成器和鉴别器的损失函数；（3）通过相似特征对抗学习，鉴别器能最大化真实图像和生成图像特征的差异性，生成器能合成包含更多真实图像特征
每日一题3239.最少翻转次数使二进制矩阵回文；
本题出自LeetCode每日一题3239.最少翻转次数使二进制矩阵回文，初看想着就是一道暴力破解，双指针强硬遍历一横一竖题目给你一个mxn的二进制矩阵grid。如果矩阵中一行或者一列从前往后与从后往前读是一样的，那么我们称这一行或者这一列是回文的。你可以将grid中任意格子的值翻转，也就是将格子里的值从0变成1，或者从1变成0。请你返回最少翻转次数，使得矩阵要么所有行是回文的，要么所有列是回文的。
计算机科学期刊介绍--各种杂志投稿方式与评价狮子小宝做研究写论文 transactions 工作 email 出版数据库自然语言处理
一、计算机科学期刊介绍计算机科学的publication最大特点在于：极度重视会议，而期刊则通常只用来做re-publication。大部分期刊文章都是会议论文的扩展版，首发就在期刊上的相对较少。也正因为如此，计算机期刊的影响因子都低到惊人的程度，顶级刊物往往也只有1到2左右----被引的通常都是会议版论文，而不是很久以后才出版的期刊版。因此，要讨论计算机科学的publication，首先必须强调
【大家的项目】helyim: 纯 Rust 实现的分布式对象存储系统
helyim是使用rust重写的seaweedfs，具体架构可以参考Facebook发表的haystack和f4论文。主要设计目标为：精简文件元数据信息，去掉对象存储不需要的POSIX语义（如文件权限）小文件合并成大文件，从而减小元数据数，使其完全存在内存中，以省去获取文件元数据的磁盘IO支持地域容灾，包括IDC容灾和机架容灾架构简单，易于实现和运维支持的特性：支持使用Http的文件上传，下载，删
Python：列表切片允许“后边小于左边”吗？
目录1问题2测试3欢迎纠错4论文写作/Python学习智能体1问题在Python中，列表切片允许“后边小于左边”吗？2测试在Python中，列表切片允许“后边小于左边”，此时会返回一个空列表，不会报错。例如：lst=[1,2,3,4,5]print(lst[3:1])#输出：[] 这是因为，当切片的结束索引小于开始索引，且步长为默认的1（正数）时，Python认为没有符合条件的元素，
【论文复现】Taylor算法用于TOA（到达时间）的三维标签位置解算，360个标签、12个基站的环境作为验证，附MATLAB例程 MATLAB卡尔曼论文复现算法 matlab 开发语言
本文给出论文《基于Taylor-Chan算法的改进UWB室内三维定位方法》中的Taylor算法来解算TOA的复现程序（MATLAB）。使用论文中给定的12个锚点/360个测试的标签用来测试算法性能文章目录运行结果程序介绍核心功能概述结果输出应用场景MATLAB源代码运行结果误差输出：程序介绍本程序基于Taylor迭代算法，实现了对三维空间内360个目标点的TOA（TimeofArrival）定位解
面试技术问题总结一 Z字小熊饼干爱吃保安面试数据库职场和发展
MySQL的几种锁机制一、从锁的粒度角度划分表级锁机制：它是对整张表进行锁定的一种锁。当一个事务对表执行写操作时，会获取写锁，在写锁持有期间，其他事务无法对该表进行读写操作；而当事务执行读操作时，会获取读锁，读锁之间是共享的，多个事务可以同时对表加读锁。行级锁机制：行级锁仅对操作的行进行锁定。它能最大程度地支持并发处理。行级锁又可细分为共享锁和排他锁。共享锁允许多个事务同时读取同一行数据；排他锁则
【2025/07/10】GitHub 今日热门项目 Albert_Lsk Github推荐 github 开源协议人工智能开源
GitHub今日热门项目每日精选优质开源项目|发现优质开源项目，跟上技术发展趋势报告概览统计项数值说明报告日期2025-07-10(周四)GitHubTrending每日快照数据时间22:35:44实时生成项目总数16个精选热门开源项目⭐总星数248.8K社区认可度指标今日热度+3.5K24小时新增关注数据洞察核心指标项目总览16个精选项目⭐社区认可248.8K总星标数今日热度3.5K新增关注平均
论文-算法-伪代码-1 youngfengying 算法
伪代码(Pseudocode)是一种算法描述语言。使用伪代码的目的是为了使被描述的算法可以容易地以任何一种编程语言。伪代码必须结构清晰、代码简单、可读性好，并且类似自然语言。介于自然语言与编程语言之间。例子：主要规定：1)算法中出现的数组、变量可以是以下类型：整数、实数、字符、位串或指针。通常这些类型可以从算法的上下文来看是清楚的，并不需要额外加以说明。2)在算法中的某些指令或子任务可以用文字来叙
深度学习交互式图像分割技术演进与突破 wang1776866571 深度学习交互式分割深度学习人工智能交互式分割
说明本文为作者读研期间基于交互式图像分割领域公开文献的系统梳理与个人理解总结，所有内容均为原创撰写（ai辅助创作），未直接复制或抄袭他人成果。文中涉及的算法、模型及实验结论均参考自领域内公开发表的学术论文（具体文献见文末参考文献列表）。本文旨在为交互式图像分割领域的学习者提供一份结构化的综述参考，内容涵盖技术演进、核心方法、关键技术优化及应用前景，希望能为相关研究提供启发。摘要：本文系统综述了基于
【论文阅读】【IEEE TCYB 2023】Edge-Guided Recurrent Positioning Network forSalient Object Detection in Opt
引言任务：光学遥感图像中显著目标检测论文地址：Edge-GuidedRecurrentPositioningNetworkforSalientObjectDetectioninOpticalRemoteSensingImages|IEEEJournals&Magazine|IEEEXplore代码地址：前置知识一、摘要目前由于光学rsi中目标类型多样、目标尺度多样、目标方向众多以及背景杂乱，现有S
计算机专业毕业设计-线上招聘与求职系统的设计与实现-开题报告苦奢bu咖啡课程设计毕业论文毕业设计软件开发开题报告求职招聘 javaweb
本系统开发采用技术为JSP、Bootstrap、Ajax、Springboot、Java、Tomcat、Maven此文章为开题报告，此系统已开发完成相关文档都很健全，相关的代码+部署+论文+ppt+代码讲解+答辩指导文件都有可私要，为本人亲自指导加编写，禁止任何人抄袭以及各类盈利性传播计算机专业毕业设计任何项目-程序-论文-想单独指导的可以私1、选题的目的和意义。通过开发一个功能全面的线上招聘与求
头盔检测数据集和论文 daguantou 人工智能算法
背景据统计使用摩托车头盔可以将道路交通事故中摩托车驾驶员致命伤害的可能性降低42％，尽管如此，遵守摩托车头盔还是较少，尤其是在发展中国家，为了有效开展针对性的头盔使用运动，政府必须收集有关头盔法律遵守程度的详细数据。但40％的国家尚未估算出这一关键的道路安全指标。而且即使有数据可用，头盔使用的观察也常常受到样本量和区域范围的限制，是从相对较短的时间框架中得出的数据，或仅在学术研究范围内单独收集。缺
【自动驾驶】经典LSS算法解析——深度估计 IRevers 个人学习笔记自动驾驶算法人工智能深度学习 python 机器学习
LSS-Lift.Splat,Shoot论文题目：Lift,Splat,Shoot:EncodingImagesFromArbitraryCameraRigsbyImplicitlyUnprojectingto3D代码：https://github.com/nv-tlabs/lift-splat-shoot概括：先做深度估计和特征融合，然后投影到BEV视图中，在BEV视图中做特征融合，在融合后的特
java线程的无限循环和退出 3213213333332132 java
最近想写一个游戏，然后碰到有关线程的问题，网上查了好多资料都没满足。突然想起了前段时间看的有关线程的视频，于是信手拈来写了一个线程的代码片段。希望帮助刚学java线程的童鞋 package thread; import java.text.SimpleDateFormat; import java.util.Calendar; import java.util.Date
tomcat 容器 BlueSkator tomcat Web servlet
Tomcat的组成部分 1、server A Server element represents the entire Catalina servlet container. (Singleton) 2、service service包括多个connector以及一个engine，其职责为处理由connector获得的客户请求。 3、connector 一个connector
php递归,静态变量,匿名函数使用 dcj3sjt126com PHP 递归函数匿名函数静态变量引用传参
<!doctype html> <html lang="en"> <head> <meta charset="utf-8"> <title>Current To-Do List</title> </head> <body>
属性颜色字体变化周华华 JavaScript
function changSize(className){ var diva=byId("fot") diva.className=className; } </script> <style type="text/css"> .max{ background: #900; color:#039;
将properties内容放置到map中 g21121 properties
代码比较简单： private static Map<Object, Object> map; private static Properties p; static { //读取properties文件 InputStream is = XXX.class.getClassLoader().getResourceAsStream("xxx.properti
[简单]拼接字符串 53873039oycg 字符串
工作中遇到需要从Map里面取值拼接字符串的情况，自己写了个，不是很好，欢迎提出更优雅的写法，代码如下： import java.util.HashMap; import java.uti
Struts2学习云端月影
最近开始关注struts2的新特性，从这个版本开始，Struts开始使用convention-plugin代替codebehind-plugin来实现struts的零配置。配置文件精简了，的确是简便了开发过程，但是，我们熟悉的配置突然disappear了，真是一下很不适应。跟着潮流走吧，看看该怎样来搞定convention-plugin。使用Convention插件，你需要将其JAR文件放
Java新手入门的30个基本概念二 aijuans java 新手 java 入门
基本概念:　　1.OOP中唯一关系的是对象的接口是什么,就像计算机的销售商她不管电源内部结构是怎样的,他只关系能否给你提供电就行了,也就是只要知道can or not而不是how and why.所有的程序是由一定的属性和行为对象组成的,不同的对象的访问通过函数调用来完成,对象间所有的交流都是通过方法调用,通过对封装对象数据,很大限度上提高复用率。　　2.OOP中最重要的思想是类,类是模板是蓝图,
jedis 简单使用 antlove java redis cache command jedis
jedis.RedisOperationCollection.java package jedis; import org.apache.log4j.Logger; import redis.clients.jedis.Jedis; import java.util.List; import java.util.Map; import java.util.Set; pub
PL/SQL的函数和包体的基础百合不是茶 PL/SQL编程函数包体显示包的具体数据包
由于明天举要上课,所以刚刚将代码敲了一遍PL/SQL的函数和包体的实现(单例模式过几天好好的总结下再发出来);以便明天能更好的学习PL/SQL的循环,今天太累了,所以早点睡觉,明天继续PL/SQL总有一天我会将你永远的记载在心里,,, 函数; 函数:PL/SQL中的函数相当于java中的方法;函数有返回值定义函数的 --输入姓名找到该姓名的年薪 create or re
Mockito(二)--实例篇 bijian1013 持续集成 mockito 单元测试
学习了基本知识后，就可以实战了，Mockito的实际使用还是比较麻烦的。因为在实际使用中，最常遇到的就是需要模拟第三方类库的行为。比如现在有一个类FTPFileTransfer，实现了向FTP传输文件的功能。这个类中使用了a
精通Oracle10编程SQL(7)编写控制结构 bijian1013 oracle 数据库 plsql
/* *编写控制结构 */ --条件分支语句 --简单条件判断 DECLARE v_sal NUMBER(6,2); BEGIN select sal into v_sal from emp where lower(ename)=lower('&name'); if v_sal<2000 then update emp set
【Log4j二】Log4j属性文件配置详解 bit1129 log4j
如下是一个log4j.properties的配置 log4j.rootCategory=INFO, stdout , R log4j.appender.stdout=org.apache.log4j.ConsoleAppender log4j.appender.stdout.layout=org.apache.log4j.PatternLayout log4j.appe
java集合排序笔记白糖_ java
public class CollectionDemo implements Serializable,Comparable<CollectionDemo>{ private static final long serialVersionUID = -2958090810811192128L; private int id; private String nam
java导致linux负载过高的定位方法 ronin47
定位java进程ID 可以使用top或ps -ef |grep java ![图片描述][1] 根据进程ID找到最消耗资源的java pid 比如第一步找到的进程ID为5431 执行 top -p 5431 -H ![图片描述][2] 打印java栈信息 $ jstack -l 5431 > 5431.log 在栈信息中定位具体问题将消耗资源的Java PID转
给定能随机生成整数1到5的函数，写出能随机生成整数1到7的函数 bylijinnan 函数
import java.util.ArrayList; import java.util.List; import java.util.Random; public class RandNFromRand5 { /** 题目：给定能随机生成整数1到5的函数，写出能随机生成整数1到7的函数。解法1： f(k) = (x0-1)*5^0+(x1-
PL/SQL Developer保存布局 Kai_Ge
近日由于项目需要，数据库从DB2迁移到ORCAL，因此数据库连接客户端选择了PL/SQL Developer。由于软件运用不熟悉，造成了很多麻烦，最主要的就是进入后，左边列表有很多选项，自己删除了一些选项卡，布局很满意了，下次进入后又恢复了以前的布局，很是苦恼。在众多PL/SQL Developer使用技巧中找到如下这段： &n
[未来战士计划]超能查派[剧透,慎入] comsci 计划
非常好看,超能查派,这部电影......为我们这些热爱人工智能的工程技术人员提供一些参考意见和思想........ 虽然电影里面的人物形象不是非常的可爱....但是非常的贴近现实生活.... &nbs
Google Map API V2 dai_lm google map
以后如果要开发包含google map的程序就更麻烦咯 http://www.cnblogs.com/mengdd/archive/2013/01/01/2841390.html 找到篇不错的文章，大家可以参考一下 http://blog.sina.com.cn/s/blog_c2839d410101jahv.html 1. 创建Android工程由于v2的key需要G
java数据计算层的几种解决方法2 datamachine java sql 集算器
2、SQL SQL/SP/JDBC在这里属于一类，这是老牌的数据计算层，性能和灵活性是它的优势。但随着新情况的不断出现，单纯用SQL已经难以满足需求，比如： JAVA开发规模的扩大，数据量的剧增，复杂计算问题的涌现。虽然SQL得高分的指标不多，但都是权重最高的。成熟度：5星。最成熟的。
Linux下Telnet的安装与运行 dcj3sjt126com linux telnet
Linux下Telnet的安装与运行 linux默认是使用SSH服务的而不安装telnet服务如果要使用telnet 就必须先安装相应的软件包即使安装了软件包默认的设置telnet 服务也是不运行的需要手工进行设置如果是redhat9，则在第三张光盘中找到 telnet-server-0.17-25.i386.rpm
PHP中钩子函数的实现与认识 dcj3sjt126com PHP
假如有这么一段程序： function fun(){ fun1(); fun2(); } 首先程序执行完fun1()之后执行fun2()然后fun()结束。但是，假如我们想对函数做一些变化。比如说，fun是一个解析函数，我们希望后期可以提供丰富的解析函数，而究竟用哪个函数解析，我们希望在配置文件中配置。这个时候就可以发挥钩子的力量了。我们可以在fu
EOS中的WorkSpace密码修改蕃薯耀修改WorkSpace密码
EOS中BPS的WorkSpace密码修改 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 201
SpringMVC4零配置--SpringSecurity相关配置【SpringSecurityConfig】 hanqunfeng SpringSecurity
SpringSecurity的配置相对来说有些复杂，如果是完整的bean配置，则需要配置大量的bean，所以xml配置时使用了命名空间来简化配置，同样，spring为我们提供了一个抽象类WebSecurityConfigurerAdapter和一个注解@EnableWebMvcSecurity，达到同样减少bean配置的目的，如下： applicationContex
ie 9 kendo ui中ajax跨域的问题 jackyrong AJAX跨域
这两天遇到个问题，kendo ui的datagrid，根据json去读取数据，然后前端通过kendo ui的datagrid去渲染，但很奇怪的是，在ie 10,ie 11,chrome,firefox等浏览器中，同样的程序，浏览起来是没问题的，但把应用放到公网上的一台服务器，却发现如下情况： 1） ie 9下，不能出现任何数据，但用IE 9浏览器浏览本机的应用，却没任何问题
不要让别人笑你不能成为程序员 lampcy 编程程序员
在经历六个月的编程集训之后，我刚刚完成了我的第一次一对一的编码评估。但是事情并没有如我所想的那般顺利。说实话，我感觉我的脑细胞像被轰炸过一样。手慢慢地离开键盘，心里很压抑。不禁默默祈祷：一切都会进展顺利的，对吧？至少有些地方我的回答应该是没有遗漏的，是不是？难道我选择编程真的是一个巨大的错误吗——我真的永远也成不了程序员吗？我需要一点点安慰。在自我怀疑，不安全感和脆弱等等像龙卷风一
马皇后的贤德 nannan408
马皇后不怕朱元璋的坏脾气，并敢理直气壮地吹耳边风。众所周知，朱元璋不喜欢女人干政，他认为“后妃虽母仪天下，然不可使干政事”，因为“宠之太过，则骄恣犯分，上下失序”，因此还特地命人纂述《女诫》，以示警诫。但马皇后是个例外。　　有一次，马皇后问朱元璋道：“如今天下老百姓安居乐业了吗？”朱元璋不高兴地回答：“这不是你应该问的。”马皇后振振有词地回敬道：“陛下是天下之父，
选择某个属性值最大的那条记录（不仅仅包含指定属性，而是想要什么属性都可以） Rainbow702 sql group by 最大值 max 最大的那条记录
好久好久不写SQL了，技能退化严重啊！！！直入主题：比如我有一张表，file_info，它有两个属性（但实际不只，我这里只是作说明用）： file_code, file_version 同一个code可能对应多个version 现在，我想针对每一个code，取得它相关的记录中，version 值最大的那条记录， SQL如下： select *
VBScript脚本语言 tntxia VBScript
VBScript 是基于VB的脚本语言。主要用于Asp和Excel的编程。 VB家族语言简介 Visual Basic 6.0 源于BASIC语言。由微软公司开发的包含协助开发环境的事
java中枚举类型的使用 xiao1zhao2 java enum 枚举 1.5新特性
枚举类型是j2se在1.5引入的新的类型,通过关键字enum来定义,常用来存储一些常量. 1.定义一个简单的枚举类型 public enum Sex { MAN, WOMAN } 枚举类型本质是类,编译此段代码会生成.class文件.通过Sex.MAN来访问Sex中的成员,其返回值是Sex类型. 2.常用方法静态的values()方