【文献阅读】用于遥感数据集的视觉问答

一、文章概况

文章题目：《RSVQA: Visual Question Answering for Remote Sensing Data》

文章下载地址：

二、文献导读

摘要部分：

Abstract— This article introduces the task of visual question answering for remote sensing data (RSVQA). Remote sensing images contain a wealth of information, which can be useful for a wide range of tasks, including land cover classification, object counting, or detection. However, most of the available methodologies are task-specific, thus inhibiting generic and easy access to the information contained in remote sensing data. As a consequence, accurate remote sensing product generation still requires expert knowledge. With RSVQA, we propose a system to extract information from remote sensing data that is accessible to every user: we use questions formulated in natural language and use them to interact with the images. With the system, images can be queried to obtain high-level information specific to the image content or relational dependencies between objects visible in the images. Using an automatic method introduced in this article, we built two data sets (using low- and high-resolution data) of image/question/answer triplets. The information required to build the questions and answers is queried from OpenStreetMap(OSM). The data sets can be used to train (when using supervised methods) and evaluate models to solve the RSVQA task. We report the results obtained by applying a model based on convolutional neural networks (CNNs) for the visual part and a recurrent neural network (RNN) for the natural language part of this task. The model is trained on the two data sets, yielding promising results in both cases.

Index Terms— Convolution neural networks (CNNs), data set, deep learning, natural language, OpenStreetMap (OSM), recurrent neural networks (RNNs), very high resolution (HR), visual question answering (VQA).

本文主要介绍了遥感数据的视觉问答任务。遥感图像数据信息丰富，应用广泛，可用于土地覆盖分类、目标检测等方面。然而，现有的大多数方法都是根据具体任务来处理数据的，无法通用和方便地获取遥感数据中所含的信息。通过RSVQA，作者做了一个每个用户都可以从遥感数据中提取信息的系统，使用自然语言来表达问题，与图像互动。通过该系统，可以查询图像，获得特定图像的内容或图像之间关系的高级信息。本文创建了两个数据集（低分辨率数据集和高分辨率数据集）的图像/问题/答案三元组。从OpenStreetMap（OSM）中查询构建问题和答案所需要的信息。文中使用卷积神经网络（CNN）模型处理视觉信息，递归神经网络（RNN）模型处理自然语言部分。该模型在两个数据集上训练都取得了较好的结果。

三、文章详细介绍

遥感数数据有广泛的应用从土地覆盖/土地利用到人群估计、环境监测等。可以利用遥感数据来解决的问题的关键性质，在过去十年已作出重大努力来增加遥感数据的可用性。VQA的目的是回答一个给定图像的自由形式和开放式的问题。由于问题可以不受限制，应用于遥感数据的VQA模型可以作为涉及遥感数据的经典问题的通用解决方案(例如，“这张图像中有茅草屋顶吗?”，也包括一些非常具体的任务，包括不同性质的物体之间的关系(例如，“河的右边有茅草屋顶吗?”)。如下图所示，应用于遥感数据集的VQA模型。

本文中，作者提出了VQA的一个新的应用，特别是与遥感图像的互交。本文中作者提出了个面向遥感方法的VQA数据集，并评估了任务在遥感数据集上的适用性。

文章的主要贡献包括：

1) a method to generate remote sensing-oriented VQA data sets;（面向遥感的VQA数据集生成方法）

2) two data sets;（两个数据集）

3) the proposed RSVQA model.（提出RSVQA模型）

1、数据集

A.Method（方法）

VQA的一个主要限制因素是特定任务数据集的可用性。作者用一组遥感影像，提出了与之对应的问题和答案。作者按照自动化程序构建了有关合成图像问题/答案对的数据集。公开的OMS数据包含地理位置信息，利用这些数据，从真实遥感数据中自动提取所需答案问/题对的相关信息。构建数据库的第一步是创建问题，第二步计算答案（注意：为每个图像提取多个答案对）。

问题构建（Question Construction）构建问题的方法如下图所示，主要由四个部分组成

1) choice of an element category [highlighted in red in Fig. 2(a)];元素类别选择（红色）

2) application of attributes to the element [highlighted in green in Fig. 2(a)];元素属性应用（绿色）

3) selection based on the relative location to another element [highlighted in green in Fig. 2(a)];相对另一个元素位置选择（绿色）

4) construction of the question [highlighted in blue in Fig. 2(a)]问题结构（蓝色）

a)元素类别选择（Element category selection）：首先从元素目录中随机选择一个元素。该目录是从OSM图层之一中提取元素建立的：道路、水域、建筑物和土地利用。道路和水域直接作为要素处理，建筑物和土地使用相关的对象是根据OSM数据规范中定义的“类型”字段定义的。土地利用对象的示例包括居住区、建筑区、宗教场所等。建筑物分为两类：商业（例如，零售和超市）和住宅（例如，房屋和公寓）。

b)属性应用（ Attributes application）：第二步是细化前面选择的元素类别，从形状（Shape）和尺寸（Size）两个可能的属性中随机选择一个。

1）形状（Shape）每个元素可以是正方形、矩形或圆形。元素是否属于其中一种类型取决于其集合属性（即面积/周长比和面积/外切圆面积比的硬阈值）

2）尺寸（Size）使用表面积上的硬阈值，可将元素是为"大"，"中"，"小"。如下图所示：

c)相对位置（Relative position）优化该元素的另一种可能性是与另一个元素相比查看其相对位置。我们定义了五个关系：“左侧”，“顶部”，“右侧”，“底部”和“旁边”。这些相对位置是在图像空间（即地理位置）中理解的。

d)问题构建（Question construction）：在这个过程中，一个元素（例如，道路）的属性（如，小道路）和可选的相对位置（如，位于水域左侧的道路）。最后一步是生成有关此元素的“base question”。作者定义了五种感兴趣问题,如[Fig. 2(a)]中，从中随机选择一个特定类型以获得一个基本问题，例如，在比较问题的情中，我们随机选择“小于”，“等于”和“大于”，并构造第二个元素。然后针对每个问题的类型和对象的预定义模板，将问题转化为自然语言问题。针对一类问题（例如，count）定义了多个模板（例如，(e.g., “how many__ are there?,” “what is the number of__ ?,” or “what is the amount of __?”)。使用模板的随机选择，保证了问题类型和问题模板的多样性。

答案构建（Answer Construction）从OSM提取与图像足迹相对应的对象，然后根据问题类型选择和使用对应于元素类别及其属性的对象b，以获取相对应的答案。

1）Count:在技术情况下，答案仅仅是对象的数量b。

2）Presence:通过将对象b的数量与0进行比较，可以回答存在问题。

3）Area:关于面积问题的答案是物体b的面积之和。

4) Comparison:通过将对象b的数量与第二个元素的数量进行比较来回答该问题。

5) Rural/Urban:这一类问题以特定的方式进行处理。不创建特定元素，而是计算建筑物的数量（包括商业和住宅）。根据输入数据的分辨率将建筑物的数量阈值化为一个预定义的数值来回答问题。

B.Data（数据）

本文根据上述数据集构建方法构建了两个不同特征的数据集：

1）Low Resolution (低分辨率LR)：利用哨兵2号卫星在荷兰拍摄的照片，分辨率10M(数据集使用可见光波段），周期5天。该数据集取了9张覆盖荷兰的低云层图，总共被划分为772张大小为256× 256的RGB图像，覆盖面积6.55km2。利用上述构建问题的方法够建了77232个问题和答案。将数据集分为训练集（77.8%）、验证集（11.1%）和测试集（11.1%）。

2) High-Resolution (高分辨率HR)：从USGS上获取高分辨率RGB正射影像（HRO），分辨率15CM，该数据集为美国一些地区，采用从2000到2016年的数据。该数据集中提取了美国东北岸161个贴图，被分成10659张大小为512×512的图像（每张占地5898平方米）。

如上图Fig. 4所示，HR数据集的范围可扩展到波特兰，曼哈顿（纽约市）和费城地区。每个点代表一个图像（通常大小为5000×5000），然后将其拆分为图块。图像涵盖纽约市/长岛地区，费城和波特兰。红点表示训练样本，绿色五边形表示验证样本，蓝色用于测试集（测试集1用蓝色三角形表示，测试集2用蓝星表示）。

利用上述构建问题的方法够建了1066316个问题和答案，将数据集分为训练集（61.5%）、验证集（11.2%）和测试集（测试集1 20.5%,6.8%为测试设置2）。从fig.4中可以看到，测试集1覆盖了训练集和验证集相似的区域，而测试集2覆盖的费城没有在训练集中出现，测试集2 实用的是另一个传感器上面的数据。

3）Differences Between the Two Data Sets:由于他们的特点，两个数据集分别代表了VQA两种不同的应用实例。

LR数据集有较大的时间和空间范围。这个特性对VQA未来大规模查询有很大的帮助，LR（10M)分辨率，一些小物体在图像上看不到（如房子、道路和树木等），限制了模型给出答案的准确性。HR数据集分辨率很高，有大量感兴趣信息来回答典型问题。因此，相随与LR数据集，关于对象覆盖或者较小的对象问题都可以从这些数据集中得到答案。然而这种数据集周期较长，获取成本较高。

基于上述这些不同之处，分别为两个数据集够早了不同类型的问题。是在HR数据集中询问有关对象面积的问题。关于城市、农村分类问题只在LR数据集中提问。考虑数据的分布个误差范围，作者量化了两个数据集的不同答案。

1) Counting in LR:覆盖范围相对较大，图中包含的小物体的数量可能很高，数值答案程重尾分布，如下图Fig. 5所示：

准确的说，26.7%的数字答案是“0”，50%的答案小于“7”，最高的数字答案是“17139”。在大多数情况下，在65 536像素的图像上区分17 139个物体是不可能的。因此，数值答案被量化为以下类别:

0;

between 1 and 10;

between 11 and 100;

between 101 and 1000;

more than 1000

2）以类似的方式两花了HR数据集中面积的的问题。这类答案中绝大部分（60.9%）是“0 m2”，分布也呈现出重尾现象，因此也使用与LR相同的量化方式

C. Discussion（讨论）

1）Questions/Answers Distributions:这两个类型的数据集每个问题的答案分布如下图Fig. 6所示。大多数问题类型程均匀分布（LR数据集中的“农村/城市”问题除外，每个图像仅被询问一次）。

在HR数据集的答案分布中，答案为“no”的占了37.7%。在LR数据集中，答案为“yes”的频率为34.9%，而“no”的频率是34.3%。

2）Limitations of the Proposed Method:作者提出的图像/问题/答案三元组生成的方法在人工标注时有自动和易于扩展的优点，但也存在一定的局限性。首先，可能会出现注释丢失注册错误的情况。此外，图像采集日期可能与OSM采集日期不相匹配，此外，用于自动构造和提供答案的模板比传统的VQA数据集更加有限(LR数据集有9个可能的答案，HR数据集有98个可能的答案)。

2、VQA MODEL（VQA模型）

利用基于深度学习的VQA模型研究遥感VQA任务的难点，温州港提出的网络模型结构如下图Fig. 7所示。

VQA模型主要由三部分组成：

feature extraction;（特征提取）

fusion of these features to obtain a single feature vector representing both the visual information and the question;（特征融合）

prediction based on this vector.（预测）

如上图所示，该模型是端到端的学习过程，融合后的图像可以看作是图像和问题的联合嵌入，作为预测步骤的输入。下面详细介绍这三个部分。

A. Feature Extraction（特征提取）

VQA模型的第一个组成部分是特征提取，是为了获得图像和问题中信息的低维表示。

1）Visual Part（视觉部分）：一般使用CNN从2维图像中提取特征，本文使用ResNet-152在ImageNet上进行预训练。使用输入的残差映射避免了不必要的退化问题。最后的平均池化层和全连接层用一个1 × 1的二维卷积代替，共输出2048个特征向量，学习最终的全连阶层获得一个1200维的特征向量。

2) Language Part（语言部分）：使用skip-thoughts模型在BookCorpus数据集上进行训练得到特征向量。这个是个循环神经网络模型，是为了生成一个表示单词序列的向量。模型训练时，对书中的一个句子进行编码，然后在对其解码，以获得该书中两个相邻的句子。在该模型中，作者使用编码器，然后是一个全连接层（大小从2400元素到1200个元素）。

B. Fusion（融合）

在这一步中，有两个大小相同的特征向量（一个表示图像，一个表示问题）。将其合并成一个向量，对向量元素使用双曲正切函数后进行元素点乘。

C. Prediction（预测）

通过使用具有256个元素的隐藏层的MLP，将此1200维的向量投影到答案空间。将问题表述为分类任务，其中每个可能的答案都是一类。因此，输出向量的大小取决于可能答案的数量。

D. Training Procedure（训练过程）

模型训练使用Adam优化器，学习率为10-5，直到收敛为止（LR 设为150个epoch，HR维35个epoch）。每个全连阶层使使用0.但的dropout。因两个输入的数据集大小不同(HR图像是4倍大)，训练批次也不同，HR数据集使用70个批量实例，对LR数据集使用280个批量实例。

3、分析

图8和图9中不同测试集的一些预测：

模型在LR数据集上的数值性能见表II：

混淆矩阵如图10所示：

HR数据集在两个测试集上的表现见表III：

混淆矩阵如图11所示：

4、结论

微信小程序常用开发框架有哪些？ +码农快讯+ 分享微信小程序小程序开发
想要开发出一套高质量的小程序，运用框架，组件库是省时省力省心必不可少一部分，随着小程序日渐火爆，各种不同类型的小程序也渐渐更新，其中不乏一些优秀好用的框架/组件库。1：WeUI小程序–使用教程https://weui.io/官方介绍：WeUI是一套同微信原生视觉体验一致的基础样式库，由微信官方设计团队为微信内网页和微信小程序量身设计，令用户的使用感知更加统一。小程序开发中最常用到的一款框架，受广大
js的书写位置和css的书写位置的区别？为什么要这样写？李是啥也不会 javascript css 开发语言
JavaScript和CSS的书写位置有以下区别：CSS通常写在标签中，或者在外部样式表文件中（）。CSS主要用于控制页面的视觉样式和布局，通常在HTML文件的部分引入，以确保在页面渲染时样式已经加载完毕，从而避免样式闪烁。JavaScript通常写在标签中，或者在外部脚本文件中（）。JavaScript用于添加页面的动态行为和交互。一般建议将JavaScript放在HTML文件的末尾（标签之前）
云南印象一玉龙雪山把日子过成诗吧
一顿饱眠后，兴冲冲前往玉龙雪山，为了预防高反，提前数日已服红景天，又买了氧气瓶，心理上安心多了。第一站，观看印象丽江，满满的男子汉气息扑面而来，谁说现在的男人越来越娘，这里的男子个个演的豪情万丈，满足了女性视觉感受。节目是否精彩，因人而异，看懂了等于了解了少数民族的风土人情，看不懂就是一帮群众演员在闹腾。这种表演风格，场面壮观，红色情怀，老谋子的最爱，不深评。图片发自App表演毕，前往玉龙雪山，人
测试面试问答题记录 XXX-17 软件测试软件测试面试题面试软件测试
一、面试问答题1.一套完整的测试应该由哪些阶段组成？先做计划，测试需求分析，用例编写，测试执行，测试报告的编写，最终进行测试的评估。2.Aplha测试和beta测试的区别？属于验收测试的两种类型，一般是先做Aplha测试，再做beta测试，Aplha测试把参与人员叫到开发方这边，测试环境是开发方控制，测试人员是比较集中的一般就是测试人员，开发方等一些人，beta测试一般是上线前进行的测试，测试环境
掌握这些思维、习惯，让你在职业生涯中受益匪浅伽马有话说
有哪些对职业生涯有益的思维和习惯呢？这里有四个建议：一、收集各行各业人类失败与灾难的反面案例我们总是高估自己，小瞧别人。有一个有趣的例子。据统计，瑞典有百分之九十的司机都认为他们的驾驶技术在平均水平之上。让我们看看抖音上那些失败的案例吧。有多少视频都是骑着单车到货车的视觉盲区被碾伤碾死；有多少视频都是醉酒开车撞伤路人、撞坏栅栏；有多少视频都是相互赌气，相互别车，最后大打出手。人类失败与灾难案例从来
21堂写作课复盘第十三课：念头写作的三项基本功皮小芸
在开始之前，先送给大家一个练习写作的秘籍，那就是“一对多”练习法。一个想法，可以用多种多样的语言形式呈现出来。比如讲个故事，也可以举个例子，或者是设计一个问答，可以多尝试几种写法。即便是同一个意思，换成不同的话来写，可以这样说，也可以那样说。写完之后，再把几种写法做一个比较，看看哪个更好。平时多看看别人的文章，取长补短。在看书的时候，也留心一下别人的写作方式，以便帮助自己更加熟练地运用语言。另外，
Unreal Engine——AI生成高精度的虚拟人物和环境（虚拟世界构建、电影场景生成）（二）（技术分析）爱研究的小牛 AIGC—虚拟现实人工智能虚幻游戏引擎 AIGC
UnrealEngine（虚幻引擎）是业界领先的3D实时渲染引擎，广泛应用于游戏开发、影视制作、建筑可视化和虚拟现实等领域。其核心技术实现涵盖了多项复杂的功能模块，包括图形渲染、物理引擎、动画系统、音效系统和网络系统等。1.图形渲染技术UnrealEngine的图形渲染系统非常强大，支持实时渲染复杂的3D场景，生成高品质的视觉效果。虚幻引擎使用先进的渲染管线，主要分为以下几个方面：1.1渲染管线虚
录像与录像装置的区别 wjq77
录像装置是20世纪晚期艺术的一个多元界面。它糅合了艺术与科技、私人空间与公共场所、主观视觉与机器的非透明表面、高雅文化与大众文化、博物馆艺术品的严肃性与卫星电视的数字狂欢，这是一个身体消失的时刻与身体再度被发现的时刻。录像装置不能以信件形式发送或拍成视频。它不能成为原始录像的拷贝或是拷贝的拷贝。没有人能将其买来放在客厅的角落，艺术家也不能靠自己口袋里的小钱来创作它。录像装置拥有它自己的历史，受制于
基于 LangChain 开发应用程序第三章-储存明志刘明大模型学习手册 langchain
需要学习提示词工程的同学请看面向开发者的提示词工程需要学习ChatGPT的同学请查看搭建基于ChatGPT的问答系统本部分之前的章节可以查看基于LangChain开发应用程序第一章-简介基于LangChain开发应用程序第二章-提示和输出第三章储存在与语言模型交互时，你可能已经注意到一个关键问题：它们并不记忆你之前的交流内容，这在我们构建一些应用程序（如聊天机器人）的时候，带来了很大的挑战，使得对
视频也能分割？！在云服务器上部署最新视觉大模型SAM2教程、详细代码注释和视频演示 Hanley_Yeung 图像处理人工智能 python 人工智能 python 深度学习 SAM2 计算机视觉图像分割
使用SAM2进行视频分割本笔记本展示了如何使用SAM2在视频中进行交互式分割。它将涵盖以下内容：在帧上添加点击以获取和细化masklets（时空掩码）在整个视频中传播点击以获取_masklets同时分割和跟踪多个目标我们使用术语_segment_或_mask_来指代单个帧上对象的模型预测，_masklet_指代整个视频中的时空掩码。如果使用Jupyter在本地运行，请首先根据安装说明在您的环境中安
万里素食行是一场巅峰体验吉林长春张耀辉
2020年5月24日，全家周日观影日，是N师学院的一次特别精神大餐，感谢互加计划吴虹校长的推荐和邀约，徐立导演的素食题材电影《巅峰体验》，这是一部超过瘾的影片，全程视觉享受，影片中体验人生巅峰为了寻找人生的终极意义，为了挖掘自己未知的潜能，记录了一群人63天的素食雷达骑行者从繁华似锦的大上海万里到达宁静致远的拉萨圣地，预计骑行1万里的故事。这是一部真人真事的纪录片，没有任何情节设计，也没有预设台词
Python计算机视觉编程第三章图像到图像的映射一只小小程序猿计算机视觉 python opencv
目录单应性变换直接线性变换算法仿射变换图像扭曲图像中的图像分段仿射扭曲创建全景图RANSAC拼接图像单应性变换单应性变换是将一个平面内的点映射到另一个平面内的二维投影变换。在这里，平面是指图像或者三维中的平面表面。单应性变换具有很强的实用性，比如图像配准、图像纠正和纹理扭曲，以及创建全景图像。单应性变换本质上是一种二维到二维的映射，可以将一个平面内的点映射到另一个平面上的对应点。代码如下：impo
DIODE：超高分辨率室内室外数据集（猫脸码客第186期）猫脸码客: catCode2024 开源数据集猫脸码客开源数据集超高分辨率室内室外数据集
亲爱的读者们，您是否在寻找某个特定的数据集，用于研究或项目实践？欢迎您在评论区留言，或者通过公众号私信告诉我，您想要的数据集的类型主题。小编会竭尽全力为您寻找，并在找到后第一时间与您分享。在计算机视觉和深度学习领域，深度信息作为三维空间感知的重要组成部分，对于实现高级视觉任务如场景理解、机器人导航、增强现实等具有至关重要的作用。然而，获取准确且密集的深度数据一直是一个挑战，尤其是在同时涵盖室内和室
《秒速五厘米》：经历过异地恋的人才懂的心酸，因为爱，所以坚持好姑娘黄黄啊
《秒速五厘米》应该是新海诚在国内出名的第一部作品了，《秒速五厘米》虽然故事情节简单，却获得好评一片，除了给人在视觉上的享受以外，更多的是给心灵带来的动容。简单一点来说，《秒速五厘米》主要讲诉了两个青梅竹马、相互喜欢的小孩明里和贵树的故事，因为父母工作的原因导致分隔两地，两个人在不同的城市读完了高中、大学，随着时间的推移走到了人生的分叉路口，最后相忘于江湖的故事。有人说，宁愿在电影院多看十次《你的名
德国的教育理念语文教育思考者
德国为什么强大到可怕？在他们的小树林里就决定了一切脑洞历史观7月6日·文史作家历史问答专家我们知道，德国是一个超级强大的国家。它只有八千万人口，却拥有2300个世界品牌。要不是历史上二次暴走，今天的德国绝对是欧洲巨无霸的存在，当然，现在也是欧洲一哥。看看德国的这些机器。那德国为什么这么强呢？归根到底是教育。德国的教育，尤其是学前教育非常有特色，可能亲们也知道，世界上第一所幼儿园就是一个德国人创立的
微软 Azure AI 服务免费试用及申请：语音识别、文本转语音、基于视觉、语言处理、文档分析等10大场景全云在线allcloudonline microsoft azure 人工智能
为方便企业认识和快速上手AzureAI服务，我们总结了一套包括语音识别、文本转语音、基于视觉、语言处理场景、文档分析场景等全面的预构建模型和演示，旨在解决各种用例。这些模型易于访问，可帮助企业无缝实施AI驱动的解决方案，如下是已整理并编录的AzureAI服务中提供的预构建演示，希望这可以帮助您将AI无缝融入您的产品和服务中。微软AzureAI服务可以合规、稳定地提供企业用户使用ChatGPT的可能
可对画面进行平台传输，实时查看监控的智慧交通开源了。 ai产品老杨人工智能音视频安全开源 vue.js
智慧交通视觉监控平台是一款功能强大且简单易用的实时算法视频监控系统。它的愿景是最底层打通各大芯片厂商相互间的壁垒，省去繁琐重复的适配流程，实现芯片、算法、应用的全流程组合，从而大大减少企业级应用约95%的开发成本。用户只需在界面上进行简单的操作，就可以实现全视频的接入及布控。项目搭建地址项目开源地址：yihecode-server本项目基于ai场景而开发，提供算法模型管理、摄像头管理、告警管理、数
深度学习入门篇：PyTorch实现手写数字识别 AI_Guru人工智能深度学习 pytorch 人工智能
深度学习作为机器学习的一个分支，近年来在图像识别、自然语言处理等领域取得了显著的成就。在众多的深度学习框架中，PyTorch以其动态计算图、易用性强和灵活度高等特点，受到了广泛的喜爱。本篇文章将带领大家使用PyTorch框架，实现一个手写数字识别的基础模型。手写数字识别简介手写数字识别是计算机视觉领域的一个经典问题，目的是让计算机能够识别并理解手写数字图像。这个问题通常作为深度学习入门的练习，因为
老A爷爷幸福父母音频宅萌姊
亲子问答与孩子意见有分歧原来要这样说本期音频感悟现在有一个怪现象，我们以为最容易沟通的家人，反而越不好沟通！以为很了解对方，而真实的感受是，我们往往只看到了表相，对方内心的恐惧、怀疑、渴望和很多念头，我们无法感受到。失去了想去了解的好奇心，只是按自己以为的觉得！孩子出了问题，家长第一反应是到处找解决办法，不停的想帮他们解决。而事实上，就我家里，不停的折腾觉得有很多问题的姐姐，效果并没有我所期待的转
给大家介绍一下全国排名前三的小说网站历史说书人
众所周知，现在是网络小说横行的时代，随便拿出来手机一点，便是好多个网络小说和网站跳跃了出来。但是根据我的一番亲身体验，真正有水平的小说网站不多，主要可以分为俩大派系。第一大小说网站便要数企鹅系的起点中文网了。中国第一大小说网站，可谓是小说界里面的航母了，里面各种各类的正版图书应有尽有，小神大神无数，简直就是看小说的最后网站，无论是历史军事还是都市玄幻，都能让你一饱眼福，欲罢不能的视觉和脑觉爽感。第
OpenCV高阶操作富士达幸运星 opencv 人工智能计算机视觉
在图像处理与计算机视觉领域，OpenCV（OpenSourceComputerVisionLibrary）无疑是最为强大且广泛使用的工具之一。从基础的图像读取、1.图片的上下，采样下采样（Downsampling）下采样通常用于减小图像的尺寸，从而减少图像中的像素数。这个过程可以通过多种方法实现，但最常见的是通过图像金字塔中的pyrDown函数（在OpenCV中）或其他类似的滤波器（如平均池化、最
PHP健身微信小程序系统源码 2401_84593753 miui52086微码在线微信开放平台微信小程序微信公众平台微信小程序
️‍♀️健身新潮流！解锁“健身微信小程序”的全方位塑形秘籍开篇：掌中健身房，随时随地动起来你还在为找不到合适的健身场地或教练而烦恼吗？是时候告别这些束缚，拥抱“健身微信小程序”带来的便捷与高效了！‍♀️这个小小的程序，就像你的私人健身顾问，让你随时随地都能享受专业的健身体验。️‍♂️个性化训练计划，科学塑形1️⃣智能评估，定制方案一打开“健身微信小程序”，首先迎接你的是智能体质评估。通过简单的问答
深入掌握大模型精髓：《实战AI大模型》带你全面理解大模型开发！努力的光头强人工智能 langchain prompt transformer 深度学习
今天，人工智能技术的快速发展和广泛应用已经引起了大众的关注和兴趣，它不仅成为技术发展的核心驱动力，更是推动着社会生活的全方位变革。特别是作为AI重要分支的深度学习，通过不断刷新的表现力已引领并定义了一场科技革命。大型深度学习模型（简称AI大模型）以其强大的表征能力和卓越的性能，在自然语言处理、计算机视觉、推荐系统等领域均取得了突破性的进展。尤其随着AI大模型的广泛应用，无数领域因此受益。AI大模型
计算机视觉—照相机（下） zidea
封面焦距(FieldofView)同一位置相机用不同焦距，28mmFieldofView就变小，85mm时候的Fieldofview也就是只有28度视野，每一个物体在通常尺寸的胶片上像素也就是越多，chromaticAberration焦距和是波长相关，不同颜色光聚焦在不同位置。这种现象在物体边缘尤为明显。颜色颜色说简单也简单，说复杂也复杂，我们在高中物理已经知道可见光是电磁波，不同颜色对应不同波
llm-universe学习小记录4--构建RAG应用 Adela0546 学习语言模型
构建RAG应用一、将LLM接入LangChain1、基于LangChain调用ChatGPT2、使用LangChain调用百度文心一言3、使用LangChain调用讯飞星火4、使用LangChain调用智谱GLM具体内容与代码详见将LLM接入LangChain。二、构建检索问答链1、加载向量数据库2、创建一个LLM3、构建检索问答链4、检索问答链效果测试5、添加历史对话的记忆功能（1）记忆（Mem
视频语言规划硅谷秋水大模型智能体机器学习音视频人工智能计算机视觉机器学习
23年10月来自谷歌、MIT和伯克利分校的论文“videolanguageplanning”。讨论如何利用在互联网规模数据上预训练大型生成模型，在生成的视频和语言空间中实现复杂长范围任务的视觉规划。为此，提出视频语言规划(VLP)，一种由树搜索过程组成的算法，训练(i)视觉-语言模型作为策略和价值函数，以及(ii)文本-到-视频模型作为动态模型。VLP将长范围任务指令和当前图像观察作为输入，并输出
预警提醒并生成日志，便于后期追溯的智慧地产开源了 AI服务老曹开源安全智慧城市大数据人工智能
智慧地产视觉监控平台是一款功能强大且简单易用的实时算法视频监控系统。它的愿景是最底层打通各大芯片厂商相互间的壁垒，省去繁琐重复的适配流程，实现芯片、算法、应用的全流程组合，从而大大减少企业级应用约95%的开发成本。AI是新形势下数字经济的重要基础设施，具备同各行各业结合的能力，越来越多的行业和领域都在进行不同层次的智能化升级。新人工智能时代将是泛智能时代，覆盖的范围也远远不止传统理解中的互联网和科
Python OpenCV精讲系列 - 高级图像处理技术（五）极客代码 Python OpenCV精讲 python opencv 图像处理开发语言人工智能计算机视觉
⚡️⚡️专栏：PythonOpenCV精讲⚡️⚡️本专栏聚焦于Python结合OpenCV库进行计算机视觉开发的专业教程。通过系统化的课程设计，从基础概念入手，逐步深入到图像处理、特征检测、物体识别等多个领域。适合希望在计算机视觉方向上建立坚实基础的技术人员及研究者。每一课不仅包含理论讲解，更有实战代码示例，助力读者快速将所学应用于实际项目中，提升解决复杂视觉问题的能力。无论是入门者还是寻求技能进
【 WPF 中常用的 `Effect` 类的介绍、使用示例和适用场景】 TIF星空 WPF分享 wpf 经验分享笔记
WPF中常用的`Effect`类的介绍、使用示例和适用场景使用场景解释示例代码示例代码解释Effect类描述使用示例适用场景DropShadowEffect为元素应用投影效果。xml为控件、文本、图像添加阴影效果，增加立体感和视觉层次。BlurEffect为元素应用模糊效果。xml模糊背景、图像或文本，常用于突出前景内容或创建模糊背景效果。BitmapEffect通过位图管道为元素应用特效（已过时
「RIA学习力」《心流》便签8，陈晓冰陈晓冰_14db
图片发自App[A1，激活经验]用视觉带来乐趣、体验心流的经历视觉带来乐趣，根据心流的定义，是需要不断挑战的，要用视觉艺术的角度去看待这个美丽的视觉世界。我上班的早晨，时间来得及的情况下，都会走一条稍远的、穿过公园的路到单位，因为公园里不仅风景很美丽，而且还能吸收到很多积极向上的能量，有各个年龄段晨跑的人们，还有练习武术、练习广场舞、练习双人舞、太极等等各种小群体，虽然脚步速度还是如常，但穿过这种
java责任链模式 3213213333332132 java 责任链模式村民告县长
责任链模式，通常就是一个请求从最低级开始往上层层的请求，当在某一层满足条件时，请求将被处理，当请求到最高层仍未满足时，则请求不会被处理。就是一个请求在这个链条的责任范围内，会被相应的处理，如果超出链条的责任范围外，请求不会被相应的处理。下面代码模拟这样的效果：创建一个政府抽象类,方便所有的具体政府部门继承它。 package 责任链模式; /** *
linux、mysql、nginx、tomcat 性能参数优化 ronin47
一、linux 系统内核参数 /etc/sysctl.conf文件常用参数 net.core.netdev_max_backlog = 32768 #允许送到队列的数据包的最大数目 net.core.rmem_max = 8388608 #SOCKET读缓存区大小 net.core.wmem_max = 8388608 #SOCKET写缓存区大
php命令行界面 dcj3sjt126com PHP cli
常用选项 php -v php -i PHP安装的有关信息 php -h 访问帮助文件 php -m 列出编译到当前PHP安装的所有模块执行一段代码 php -r 'echo "hello, world!";' php -r 'echo "Hello, World!\n";' php -r '$ts = filemtime("
Filter&Session 171815164 session
Filter HttpServletRequest requ = (HttpServletRequest) req; HttpSession session = requ.getSession(); if (session.getAttribute("admin") == null) { PrintWriter out = res.ge
连接池与Spring,Hibernate结合 g21121 Hibernate
前几篇关于Java连接池的介绍都是基于Java应用的，而我们常用的场景是与Spring和ORM框架结合，下面就利用实例学习一下这方面的配置。 1.下载相关内容： &nb
[简单]mybatis判断数字类型 53873039oycg mybatis
昨天同事反馈mybatis保存不了int类型的属性,一直报错，错误信息如下: Caused by: java.lang.NumberFormatException: For input string: "null" at sun.mis
项目启动时或者启动后ava.lang.OutOfMemoryError: PermGen space 程序员是怎么炼成的 eclipse jvm tomcat catalina.sh eclipse.ini
在启动比较大的项目时，因为存在大量的jsp页面，所以在编译的时候会生成很多的.class文件，.class文件是都会被加载到jvm的方法区中，如果要加载的class文件很多，就会出现方法区溢出异常 java.lang.OutOfMemoryError: PermGen space. 解决办法是点击eclipse里的tomcat，在
我的crm小结 aijuans crm
各种原因吧，crm今天才完了。主要是接触了几个新技术： Struts2、poi、ibatis这几个都是以前的项目中用过的。 Jsf、tapestry是这次新接触的，都是界面层的框架，用起来也不难。思路和struts不太一样，传说比较简单方便。不过个人感觉还是struts用着顺手啊，当然springmvc也很顺手，不知道是因为习惯还是什么。jsf和tapestry应用的时候需要知道他们的标签、主
spring里配置使用hibernate的二级缓存几步 antonyup_2006 java spring Hibernate xml cache
．在spring的配置文件中 applicationContent.xml，hibernate部分加入 xml 代码 <prop key="hibernate.cache.provider_class">org.hibernate.cache.EhCacheProvider</prop> <prop key="hi
JAVA基础面试题百合不是茶抽象实现接口 String类接口继承抽象类继承实体类自定义异常
/* * 栈（stack）：主要保存基本类型（或者叫内置类型）（char、byte、short、 *int、long、 float、double、boolean）和对象的引用，数据可以共享，速度仅次于 * 寄存器（register），快于堆。堆（heap）：用于存储对象。 */ &
让sqlmap文件 "继承" 起来 bijian1013 java ibatis sqlmap
多个项目中使用ibatis , 和数据库表对应的 sqlmap文件（增删改查等基本语句)，dao, pojo 都是由工具自动生成的, 现在将这些自动生成的文件放在一个单独的工程中，其它项目工程中通过jar包来引用，并通过"继承"为基础的sqlmap文件，dao,pojo 添加新的方法来满足项
精通Oracle10编程SQL(13)开发触发器 bijian1013 oracle 数据库 plsql
/* *开发触发器 */ --得到日期是周几 select to_char(sysdate+4,'DY','nls_date_language=AMERICAN') from dual; select to_char(sysdate,'DY','nls_date_language=AMERICAN') from dual; --建立BEFORE语句触发器 CREATE O
【EhCache三】EhCache查询 bit1129 ehcache
本文介绍EhCache查询缓存中数据，EhCache提供了类似Hibernate的查询API，可以按照给定的条件进行查询。要对EhCache进行查询，需要在ehcache.xml中设定要查询的属性数据准备 @Before public void setUp() { //加载EhCache配置文件 Inpu
CXF框架入门实例白糖_ spring Web 框架 webservice servlet
CXF是apache旗下的开源框架，由Celtix + XFire这两门经典的框架合成，是一套非常流行的web service框架。它提供了JAX-WS的全面支持，并且可以根据实际项目的需要，采用代码优先（Code First）或者 WSDL 优先（WSDL First）来轻松地实现 Web Services 的发布和使用，同时它能与spring进行完美结合。在apache cxf官网提供
angular.equals boyitech AngularJS AngularJS API AnguarJS 中文API angular.equals
angular.equals 描述: 比较两个值或者两个对象是不是相等。还支持值的类型，正则表达式和数组的比较。两个值或对象被认为是相等的前提条件是以下的情况至少能满足一项：两个值或者对象能通过=== （恒等）的比较两个值或者对象是同样类型，并且他们的属性都能通过angular
java-腾讯暑期实习生-输入一个数组A[1,2,...n]，求输入B，使得数组B中的第i个数字B[i]=A[0]*A[1]*...*A[i-1]*A[i+1] bylijinnan java
这道题的具体思路请参看何海涛的微博：http://weibo.com/zhedahht import java.math.BigInteger; import java.util.Arrays; public class CreateBFromATencent { /** * 题目：输入一个数组A[1,2,...n]，求输入B，使得数组B中的第i个数字B[i]=A
FastDFS 的安装和配置修订版 Chen.H linux fastDFS 分布式文件系统
FastDFS Home:http://code.google.com/p/fastdfs/ 1. 安装 http://code.google.com/p/fastdfs/wiki/Setup http://hi.baidu.com/leolance/blog/item/3c273327978ae55f93580703.html 安装libevent (对libevent的版本要求为1.4.
[强人工智能]拓扑扫描与自适应构造器 comsci 人工智能
当我们面对一个有限拓扑网络的时候,在对已知的拓扑结构进行分析之后,发现在连通点之后,还存在若干个子网络,且这些网络的结构是未知的,数据库中并未存在这些网络的拓扑结构数据....这个时候,我们该怎么办呢? 那么,现在我们必须设计新的模块和代码包来处理上面的问题
oracle merge into的用法 daizj oracle sql merget into
Oracle中merge into的使用 http://blog.csdn.net/yuzhic/article/details/1896878 http://blog.csdn.net/macle2010/article/details/5980965 该命令使用一条语句从一个或者多个数据源中完成对表的更新和插入数据. ORACLE 9i 中，使用此命令必须同时指定UPDATE 和INSE
不适合使用Hadoop的场景 datamachine hadoop
转自：http://dev.yesky.com/296/35381296.shtml。　　Hadoop通常被认定是能够帮助你解决所有问题的唯一方案。当人们提到“大数据”或是“数据分析”等相关问题的时候，会听到脱口而出的回答：Hadoop! 实际上Hadoop被设计和建造出来，是用来解决一系列特定问题的。对某些问题来说，Hadoop至多算是一个不好的选择，对另一些问题来说，选择Ha
YII findAll的用法 dcj3sjt126com yii
看文档比较糊涂，其实挺简单的： $predictions=Prediction::model()->findAll("uid=:uid",array(":uid"=>10)); 第一个参数是选择条件：”uid=10″。其中:uid是一个占位符，在后面的array(“:uid”=>10)对齐进行了赋值；更完善的查询需要
vim 常用 NERDTree 快捷键 dcj3sjt126com vim
下面给大家整理了一些vim NERDTree的常用快捷键了，这里几乎包括了所有的快捷键了，希望文章对各位会带来帮助。切换工作台和目录 ctrl + w + h 光标 focus 左侧树形目录ctrl + w + l 光标 focus 右侧文件显示窗口ctrl + w + w 光标自动在左右侧窗口切换ctrl + w + r 移动当前窗口的布局位置 o 在已有窗口中打开文件、目录或书签，并跳
Java把目录下的文件打印出来蕃薯耀列出目录下的文件文件夹下面的文件目录下的文件
Java把目录下的文件打印出来 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月11日 11:02:
linux远程桌面----VNCServer与rdesktop hanqunfeng Desktop
windows远程桌面到linux，需要在linux上安装vncserver，并开启vnc服务，同时需要在windows下使用vnc-viewer访问Linux。vncserver同时支持linux远程桌面到linux。 linux远程桌面到windows，需要在linux上安装rdesktop，同时开启windows的远程桌面访问。下面分别介绍，以windo
guava中的join和split功能 jackyrong java
guava库中，包含了很好的join和split的功能，例子如下： 1）将LIST转换为使用字符串连接的字符串 List<String> names = Lists.newArrayList("John", "Jane", "Adam", "Tom");
Web开发技术十年发展历程 lampcy android Web 浏览器 html5
回顾web开发技术这十年发展历程： Ajax 03年的时候我上六年级，那时候网吧刚在小县城的角落萌生。传奇，大话西游第一代网游一时风靡。我抱着试一试的心态给了网吧老板两块钱想申请个号玩玩，然后接下来的一个小时我一直在，注，册，账，号。彼时网吧用的512k的带宽，注册的时候，填了一堆信息，提交，页面跳转，嘣，”您填写的信息有误，请重填”。然后跳转回注册页面，以此循环。我现在时常想，如果当时a
架构师之mima-----------------mina的非NIO控制IOBuffer(说得比较好) nannan408 buffer
1.前言。如题。 2.代码。 IoService IoService是一个接口，有两种实现：IoAcceptor和IoConnector；其中IoAcceptor是针对Server端的实现，IoConnector是针对Client端的实现；IoService的职责包括： 1、监听器管理 2、IoHandler 3、IoSession
ORA-00054:resource busy and acquire with NOWAIT specified Everyday都不同 oracle session Lock
[Oracle] 今天对一个数据量很大的表进行操作时，出现如题所示的异常。此时表明数据库的事务处于“忙”的状态，而且被lock了，所以必须先关闭占用的session。 step1，查看被lock的session： select t2.username, t2.sid, t2.serial#, t2.logon_time from v$locked_obj
javascript学习笔记 tntxia JavaScript
javascript里面有6种基本类型的值:number、string、boolean、object、function和undefined。number：就是数字值，包括整数、小数、NaN、正负无穷。string:字符串类型、单双引号引起来的内容。boolean:true、false object:表示所有的javascript对象，不用多说function:我们熟悉的方法，也就是
Java enum的用法详解 xieke90 enum 枚举
Java中枚举实现的分析：示例： public static enum SEVERITY{ INFO,WARN,ERROR } enum很像特殊的class，实际上enum声明定义的类型就是一个类。而这些类都是类库中Enum类的子类 (java.l