GADFLYGIS

从实现的技术手段细数：高分辨率遥感影像+人工智能的现在和未来

转载http://baijiahao.baidu.com/s?id=1601901487917871613&wfr=spider&for=pc

依庄防，博士，泰伯网海外特约专栏作者。傣族，出生于西双版纳，目前就职于Development Seed（美国华盛顿特区），是一位机器学习算法工程师。

作者：依庄防

编辑：洪月月

人工智能不可阻挡地向各行业渗透。这一现象，恰巧撞上了“商业遥感卫星发射潮”。这似乎预示了某种潜流。此刻，从事卫星遥感影像解译和大数据提取的专业人士、科研人员、政府部门和企业都跃跃欲试：恨不得在获取数据的同时，一股脑儿在卫星上直接解译、处理和打包，地面接收站再根据用户需求分发。

显然，这种愿景目前还无法实现。商业卫星影像本身数据量庞大，有很多难点尚未攻关。不过，在高分辨率影像应用领域，市场和科研都有一些亮眼的成果——它们让高分遥感从获取、解译到数据分配的一条龙服务的愿景成为可能。

（注：目前热议的人工智能，其实包括了很多领域和应用。讲真，所有可以用机器代替人工来做，特别是重复性强的，在媒体报道中都统称人工智能。本文所指的人工智能，具体指用机器学习、深度学习等计算机视觉技术去分析、解译高分遥感数据。）

所以，只有充分了解高分辨率遥感影像的直接应用难度，才能为人工智能与遥感的结合，构建合理的想像。

高分遥感应用难度

难度1. 数据大

高分遥感影像的分辨率越大，其数据就越大。

30米分辨率指的是遥感影像上每一个像素对应的地物是30米x30米。比如地面120米 x 120米的地块，在分辨率为30米的卫星影像图上是16个像元，但是在3米x 3米的卫星影像上就是1600个像元，到了30厘米 x 30厘米的卫星影像图中则变成了160000个像元。

分辨率越高记录的数据信息越详细，不仅仅是像元随着高分影像增大，其每个像元的信息复杂性也在增加，因此高分遥感影像分辨率的提高和其更低分辨率影像之间的文件大小不是线性关系。

难度2. 分析难

分辨率越高，信息量越大，数据提取就越难。

同一个地点，高分辨率遥感影像随着分辨率越高获取的地面数据越多，信息越复杂，就越难提取有用的信息。

如果在一二十年前用Landsat卫星影像（30米分辨率）做一个县市级别的土地利用分类工作，直接把数据导入地理信息和图像解译工作平台（ERDAS，EDVI和ArcGIS等等）大概都可以作出个产品来。但是如果卫星影像分辨率达到了30厘米(相当于30m分辨率高出100倍的精度)：30米分辨率时只能看到大概的形状，30厘米就可以看到路上行驶的车辆了——遥感影像分辨率越高，精度越高，可以观察到的地物就越多，那么在众多繁杂的信息中分辨出有用信息的难度就越大。

普通影像处理软件处理分辨率越高的影像就越困难，此时人工智能的作用就凸显了。高性能超级计算机，可以不知疲倦地实时处理人工和普通影像处理软件无法完成的工作。

Digital GlobeWorldView-3影像两个分辨率对比图，左图是分辨率为1.24米（文件大小为1.7M），右图分辨率是0.31米（图片大小是10.2M）

难度3. 可用性不确定

解译数据的可用性。

这时，可能会有遥感专业的同事说，信息量大，正是高分辨率遥感的魅力所在。这话是没有错的。

下面咱们还要讲怎么使用人工智能遥感从高分辨率遥感影像中提取有用的信息。但是在实现这一步之前，有一个不可忽视的细节难度——分辨率越高的影像解译和提取的信息越多，处理不好，反倒可能使得结果没办法用。

我们从高分辨率影像中提取的数据，最终目的是希望可以放在地图上，供专业人士或者普通市民使用。基本上很多计算机视觉里面使用到机器学习和深度学习（比如图像分割、对象检测和图像分类）都可以在高分辨率遥感中应用。

无人驾驶汽车使用的机器学习算法是图像分割，即该车在街道上行驶时不断的拍照和解读，哪里是道路、道路边界、行道树和行人。从高分辨率遥感解译信息其实也是这么一回事，从图像分割中知道哪里是楼房、道路、桥梁、树林、机场等等。

和一般计算机视觉不同的是，高分遥感提取的数据需要放在地图上，就是说这数据不仅要在机器学习（人工智能）模型中达到好的精度，还要有准确的地理信息（比如经纬度等等）——这最终才有可用性。

比如咱们用图像分割中解译出来的道路在地图上向右平移了5米，或者解译出来的楼房缺了三分之一等等。那么数据要用到现实生活，如导航或者计算建筑面积，就没啥用了。

难度4.其他

高分辨率遥感影像本身特点带来的问题。

除了以上高分辨率遥感影像文件大、信息复杂、信息提取难度高、以及人工智能模型结果的可用性不确定等因素之外，高分辨率遥感影像本身还存在以下问题：

①云层覆盖。大家抬眼看天空，云层千变万化。不同的季节和地区云层覆盖不一。一旦卫星影像研究区域的云覆盖率到了10%以上就很难从中提取好的数据。当然这个问题在商业小卫星覆盖率高的地区，卫星可以在短时间内重复性的访问一个地点，或者在天气晴朗的时候使用无人机获取数据等，是可以解决这个问题的。

②时空分辨率的取舍。空间分辨率，是到目前一直强调的高分辨率。而时间分辨率指的是遥感影像以多高的频率获取，比如是一天拍一次上海，还是一个月一次，还是一年一次。

高分辨率卫星影像不仅仅处理和解译难，获取的费用也是不菲的。因此没有长期的研究、资金支持和投入，没有市场需求，同时开发的高分遥感产品不能在时间或空间分辨率中占得优势的话，企业很难在市场上存活。比如美国Digital Globe，它的卫星影像是根据客户需要去采集数据，它最好的数据产品WorldView-3和4的分辨率可达0.31米。Planet Lab的商业模式则不同，它是通过提高时间分辨率但（部分）放弃空间分辨率（他们的最高分辨率的卫星影像产品是1米空间分辨率），以实现每周生成覆盖全球的遥感影像。当然，Planet同时也在提高卫星影像的空间分辨率来抢占市场。

③波段多，难以取舍。和计算机视觉的机器学习、人工智能模型中大部分只是用红绿蓝三个色相通道（就是普通的照片）不同，高分辨率遥感影像可以有十几到上百个波段，不同的地物解译和图像分割可选取不通的波段组合。但是选择多了也很痛苦，因为目前高分率波段组合和选择在机器学习（人工智能）上的应用还没有足够积累。

人工智能和高分遥感的结合

人工智能和高分辨率遥感可以说是天作之合。

高分辨率遥感影像的存在是为了能让我们实时监测地面发生的变化。比如一个城市哪里新建了房屋，哪里新建了道路桥梁；农业上哪一个作物得了病虫害；或者哪一个地区发生旱灾涝害，要怎样疏导灾民，如何重建。也有保险公司在实时监测用户的屋顶材料和冰雹雪灾之间的联系，从而为拓展房屋保险业务提供服务。人工智能可以让我们大规模、智能化、实时性的实现数据提取。

前面说了那么多困难，那么，人工智能和高分辨率遥感影像解译能结合吗？能有未来吗？答案是肯定的。下面待我给大家一一解读。

传统计算机视觉的新玩法

01.啥是机器学习（深度学习）

机器学习可以分为监督学习，非监督学习和强化学习。

顾名思义，监督学习指的是告诉模型你认为图像里哪是房子哪是路，人工智能就会建立原始卫星影像和你给的标签（房子，道路）之间的数学关系。非监督学习就是不告诉模型哪是房子哪是道路，模型根据卫星影像里面的像元值对图像进行分类。强化学习则是啥也不告诉模型，让模型自己学习，并不断强化。当然我这是往简单里说，具体的解释大家可以参考其他机器学习的资料。

高分辨率遥感影像解译用的最多的是监督学习。

第一排的两张图是监督学习中的图像分割训练数据（左图是卫星影像图，右图是标签数据——房子和道路）。这个训练图集的关系就如同解方程式：其中卫星影像图就相当于X，标签数据就是y，人工智能模型就是在X和y中找数学关系。然后我们可以通过这个关系从未被人工智能模型训练过的卫星影像图中提取房子和道路的信息。

第二排的两张图是监督学习中的对象检测训练数据（左图是卫星影像图，右图是房子的对象检测框）。

在第一排训练数据训练的图像分割模型，就可以从高分辨率遥感影像中找出卫星影像中哪一个像元是房子或者道路。第二排训练数据集训练的模型则可以用来“找房子”，这个方法一般可以用来数房子，即可以用通过新房子在一段时间的建设数量来衡量区域经济发展的速度。比如第一排的训练数据集可以通过在高分辨率遥感影像和标签数据之间建立数学关系（这里通常通过深度学习的方法），进而预测未知影像中的检测对象。

人工智能模型通过输入的高分辨率遥感影像和标签数据来预测检测对象。图中第一排是房屋建筑面积的预测模型，第二排是道路系统检测模型。

02.高分影像和开放街道地图（Open Street Map）为机器学习新玩法雪中送炭

高分遥感影像数据量大，传统的分析方法是下载一整片卫星影像，导入到可以用来分析这个影像的地理信息软件中来分析。这项工作繁琐、缓慢、不讨好，而且受各种不可知因素影响。没有大量的人工投入很难用于应急，比如洪涝灾害来了，只能依靠过往的地图和模型信息积累来开展工作。

通过区块地图服务（Tile Map Service）实现高分遥感的实时分享，以及开放街道地图的存在，它们是未来人工智能在高分辨率遥感影像解译方面长足发展的两个重要基础。要做到以上实时预测道路网络，离不开这两个基石。

03.区块地图服务（Tile Map Service）

大家肯定熟悉百度地图、高德地图、必应卫星影像图。照理来说，全球或整个中国的地图数据那么大，储存了那么多数据，比如你喜欢的餐馆、书店、咖啡馆、电影院等等，以及你上学、上班和回家的每一条路，还有千千万万同学的同学、朋友的朋友的住宅小区等等。数据那么大，可是并不妨碍你一打开手机就可以浏览。

这得益于区块地图服务（当然还有其他的技术，咱们先往简单里说），这个技术可以使我们从全球地图开始，点击放大地图20次就可以看到世界上任何一个地区的街景。地图在每一次放大过程中的信息量不一样，在全球水平上是非常粗糙的国家级数据，放大20次在手机屏幕上展示的信息就是你感兴趣的街景图。

在放大地图的过程中越来越多的信息被展现，在缩小的过程你会发现经常走的那条街不见了，慢慢的学校在地图上消失了，然后在全国地图上你只看到你的省会城市。

这和高分遥感影像实时分享有啥关系？说白了就是同一个道理。高分遥感简单的说是你可以放到最大看到的卫星影像图，精细、信息量大。可以想像，这些块状的卫星影像就像地板砖一样（英文用词是tile，很形象），分辨率为1米的块状卫星影像要覆盖（铺满）整个中国大概需要千万亿块（960万平方公里）。可想而知要在这个分辨率尺度上解译国家级别的数据，这个工作量和人工需求有多大，就更不要说比1米分辨率更高的高分辨率影像了。

商业卫星影像公司可以通过生成不同分辨率影像，来满足不同的用户需求。比如要做建筑物占地面积或者道路系统的人工智能模型，就会希望用到最高空间分辨率的影像（下图提到的放大次数我们希望用到zoom level 17以上的影像数据），但是做农业相关的土地利用图就不需要高分辨率的影像。

区块地图服务可以从全球低分辨率的卫星影像放大到高尺度的卫星影像。

04.开放街道地图

开放街道地图是以人人都可以编辑的世界地图为其宗旨。全球有几百万会员每天都在世界不同的国家和地区编辑和录入数据。其中人道主义援助的贡献特别突出，比如海地和尼泊尔地震期间就有全球的志愿者通过高清卫星影像编辑地图，比如勾画出哪个地段的道路和房子被毁了，哪里是最近的救援点和医院等等。

开放街景地图可以作为机器学习的训练数据集，特别是训练数据中的标签数据。我们最近开发了一个开放的python数据包，叫做Label Maker。该数据包可以从开放街道地图的API匹配同个地区的Mapbox卫星影像来生成包括TensorFlow、MXNet、Pytorch、Theano和Keras框架下的深度学习训练数据集。

我们在Label Maker的上面放了几个机器学习的案例，包括图像分类和对象检测，大家可以去看看（我的中文博客介绍）。

高分影像、开放街景地图和Label Maker，加上云计算，可以实现很多以往传统的中低分辨率遥感影像和传统的卫星影像解译无法做到的。SkyNet是我们做图像分割的一个机器学习方法，开放的，大家可以去玩玩。

我们用SkyNet可以实时从高分遥感影像中解译道路系统。当然SkyNet的背后是剑桥大学在前几年开发的SegNet技术。机器学习中的图像分割（也是SkyNet）背后的技术是目前无人驾驶汽车中主要使用的计算机视觉技术之一。我们现在还在开发更多、更新、运算更快的算法。北美和全球都有很多类似的公司和机构，开发各种深度学习、传统机器学习在高分辨率遥感影像解译中的应用软件包和工具。希望未来可以给大家多多介绍。

Development Seed的SkyNet人工智能模型可以实时预测道路系统。SkyNet是一个开放的模型，任何人都可以使用。

高分遥感影像的出现和人工智能可以帮我们做很多事情。作为这个领域的专业人士，我们该从应用的角度出发，挖掘人工智能和高分影像的应用。比如对于智能城市的建设，第一道数据关口是我们的城市里道路建设和房屋状况是怎么样的？哪里发展最快，哪里比较慢，为什么？洪涝灾害来了哪里会受灾比较严重？医院学校都建在哪里，其他的公共设施都建在哪里？

高分遥感的实时更新以及人工智能的快速运算，需要能够回答智能城市建设的最基本问题。比如下图，通过对比人工智能模型的建筑占地面积预测结果和已经在地图上标记的建筑占地面积，就可以找出一个城市哪些建筑是新的、还没有标记在地图上的。开放街景地图的制图任务管理人员可以号召制图志愿者到这些地方添加没有地图标记的建筑物。同样的道理，人工智能和高分辨率遥感影像的结合，除了可以帮城市规划机构标记城市化的进程外，遥感的多光谱波段还可以“看见”城市建筑物的材料，从而“预见”城市在不同自然灾害下的脆弱程度，这对灾后重建工作也会起到很大作用。

Urchn数据分享平台中导入人工智能模型的结果，能够帮城市规划机构和政府部门发现城市发展和建设情况。

浅见未来

01.人工智能也需要加入人的协助

目前人工智能在高分辨率遥感影像上的应用日新月异，但是因为卫星遥感影像应用难度，以及人工智能本身的应用瓶颈，还不能实现全程的自动化。因此，从卫星影像采集到卫星影像解译和数据整理一条龙服务还难以达到。不过，相关专业人士可以在这个过程中助力。

比如上面提到的道路系统和房屋建筑占地面积预测在一定程度上是可以实现全程自动化的，但是还有大量案例是无法全部自动化的。

2018年我们帮助世界银行制作巴基斯坦、尼日利亚和赞比亚三国的高压电网图。高压电网在高分辨率影像中是非常难以分辨的，我们通过人工智能模型预测高压电塔的分布、引导专业制图人员制图的方式完成，这要比传统人工查看高压电塔、画高压电网的方法在速度上提高了33倍工作产出（该方法现在是开放的报告和模型方法，可供大家参阅）。

Development Seed的数据组专业制图师们通过人工智能模型预测的高压电塔（图中橙色方框）来引导高压电网制图。

巴基斯坦高压电网的制图前后对比。通过人工智能模型对高压电塔的预测，专业制图人士的制图效率提高了33倍。

02.高分辨率影像解译和人工智能要完成三件事

现在人工智能（机器学习和深度学习）和高分辨率遥感的解译和应用热情空前高涨，但是所有业内人士也不能忽略这个问题：如何从高分遥感影像中提取可直接应用的数据。

这个问题不是专业人士拍拍脑袋就能够决定的，而是应该从不同应用案例和使用者的角度出发来解译和整理数据。比如同样的方法论，我上面提到的应用图像分割从高分辨率遥感影像中提取道路系统。城市规划师需要的数据与交通管理部门不同，涝灾情况下的导航需要的道路系统也与灾后重建所需要的不同。

道路系统属性不同，能够支持不同的工作和需求。因此，机器学习算法工程师和高分辨率遥感影像解译的工作，必须能够满足三方面的要求：第一，数据的完整性；第二，预测的准确性；第三，数据的应用性。其中，第三个条件不应该是最后考虑的，而是要在人工智能模型的开发过程中贯穿始终。

希望我们可以一起做更多更有意义的工作，通过开放的软件开发服务更多的社区、地区、国家和需要数据的人。

情绪觉察日记第37天露露_e800
今天是家庭关系规划师的第二阶最后一天，慧萍老师帮我做了个案，帮我处理了埋在心底好多年的一份恐惧，并给了我深深的力量！这几天出来学习，爸妈过来婆家帮我带小孩，妈妈出于爱帮我收拾东西，并跟我先生和婆婆产生矛盾，妈妈觉得他们没有照顾好我…。今晚回家见到妈妈，我很欣赏她并赞扬她，妈妈说今晚要跟我睡我说好，当我们俩躺在床上准备睡觉的时候，我握着妈妈的手对她说:妈妈这几天辛苦你了，你看你多利害把我们的家收拾得
机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
【iOS】MVC设计模式 Magnetic_h ios mvc 设计模式 objective-c 学习 ui
MVC前言如何设计一个程序的结构，这是一门专门的学问，叫做"架构模式"（architecturalpattern），属于编程的方法论。MVC模式就是架构模式的一种。它是Apple官方推荐的App开发架构，也是一般开发者最先遇到、最经典的架构。MVC各层controller层Controller/ViewController/VC（控制器）负责协调Model和View，处理大部分逻辑它将数据从Mod
C语言宏函数南林yan C语言 c语言
一、什么是宏函数？通过宏定义的函数是宏函数。如下，编译器在预处理阶段会将Add(x,y)替换为((x)*(y))#defineAdd(x,y)((x)*(y))#defineAdd(x,y)((x)*(y))intmain(){inta=10;intb=20;intd=10;intc=Add(a+d,b)*2;cout<
C语言如何定义宏函数？小九格物 c语言
在C语言中，宏函数是通过预处理器定义的，它在编译之前替换代码中的宏调用。宏函数可以模拟函数的行为，但它们不是真正的函数，因为它们在编译时不会进行类型检查，也不会分配存储空间。宏函数的定义通常使用#define指令，后面跟着宏的名称和参数列表，以及宏展开后的代码。宏函数的定义方式：1.基本宏函数：这是最简单的宏函数形式，它直接定义一个表达式。#defineSQUARE(x)((x)*(x))2.带参
c++ 的iostream 和 c++的stdio的区别和联系黄卷青灯77 c++算法开发语言 iostream stdio
在C++中，iostream和C语言的stdio.h都是用于处理输入输出的库，但它们在设计、用法和功能上有许多不同。以下是两者的区别和联系：区别1.编程风格iostream（C++风格）：C++标准库中的输入输出流类库，支持面向对象的输入输出操作。典型用法是cin（输入）和cout（输出），使用>操作符来处理数据。更加类型安全，支持用户自定义类型的输入输出。#includeintmain(){in
2021-08-26 影幽
在生活中，女人与男人的感悟往往有所不同。人生最大的舞台就是生活，大幕随时都可能拉开，关键是你愿不愿意表演都无法躲避。在生活中，遇事不要急躁，不要急于下结论，尤其生气时不要做决断，要学会换位思考，大事化小小事化了，把复杂的事情尽量简单处理，千万不要把简单的事情复杂化。永远不要扭曲，别人善意，无药可救。昨天是张过期的支票，明天是张信用卡，只有今天才是现金，要善加利用！执着的攀登者不必去与别人比较自己的
消息中间件有哪些常见类型 xmh-sxh-1314 java
消息中间件根据其设计理念和用途，可以大致分为以下几种常见类型：点对点消息队列（Point-to-PointMessagingQueues）：在这种模型中，消息被发送到特定的队列中，消费者从队列中取出并处理消息。队列中的消息只能被一个消费者消费，消费后即被删除。常见的实现包括IBM的MQSeries、RabbitMQ的部分使用场景等。适用于任务分发、负载均衡等场景。发布/订阅消息模型（Pub/Sub
《大清方方案》| 第二话谁佐清欢
和珅究竟说了些什么？竟能令堂堂九五之尊龙颜失色！此处暂且按下不表；单说这位乾隆皇帝，果真不愧是康熙从小带过的，一旦决定了要做的事，便杀伐决断毫不含糊。他当即亲自拟旨，着令和珅为钦差大臣，全权负责处理方方事件，并钦赐尚方宝剑，遇急则三品以下官员可先斩后奏。和珅身负皇上重托，岂敢有半点怠慢，当夜即率领相关人等，马不停蹄杀奔江汉。这一路上，和珅的几位幕僚一直在商讨方方事件的处置方案。有位年轻幕僚建议快刀
Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
Python教程：一文了解使用Python处理XPath 旦莫 Python进阶 python 开发语言
目录1.环境准备1.1安装lxml1.2验证安装2.XPath基础2.1什么是XPath？2.2XPath语法2.3示例XML文档3.使用lxml解析XML3.1解析XML文档3.2查看解析结果4.XPath查询4.1基本路径查询4.2使用属性查询4.3查询多个节点5.XPath的高级用法5.1使用逻辑运算符5.2使用函数6.实战案例6.1从网页抓取数据6.1.1安装Requests库6.1.2代
Google earth studio 简介陟彼高冈yu 旅游
GoogleEarthStudio是一个基于Web的动画工具，专为创作使用GoogleEarth数据的动画和视频而设计。它利用了GoogleEarth强大的三维地图和卫星影像数据库，使用户能够轻松地创建逼真的地球动画、航拍视频和动态地图可视化。网址为https://www.google.com/earth/studio/。GoogleEarthStudio是一个基于Web的动画工具，专为创作使用G
LLM 词汇表落难Coder LLMs NLP 大语言模型大模型 llama 人工智能
Contextwindow“上下文窗口”是指语言模型在生成新文本时能够回溯和参考的文本量。这不同于语言模型训练时所使用的大量数据集，而是代表了模型的“工作记忆”。较大的上下文窗口可以让模型理解和响应更复杂和更长的提示，而较小的上下文窗口可能会限制模型处理较长提示或在长时间对话中保持连贯性的能力。Fine-tuning微调是使用额外的数据进一步训练预训练语言模型的过程。这使得模型开始表示和模仿微调数
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
关于提高复杂业务逻辑代码可读性的思考编程经验分享开发经验 java 数据库开发语言
目录前言需求场景常规写法拆分方法领域对象总结前言实际工作中大部分时间都是在写业务逻辑，一般都是三层架构，表示层（Controller）接收客户端请求，并对入参做检验，业务逻辑层（Service）负责处理业务逻辑，一般开发都是在这一层中写具体的业务逻辑。数据访问层（Dao）是直接和数据库交互的，用于查数据给业务逻辑层，或者是将业务逻辑层处理后的数据写入数据库。简单的增删改查接口不用多说，基本上写好一
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
使用Apify加载Twitter消息以进行微调的完整指南 nseejrukjhad twitter easyui 前端 python
#使用Apify加载Twitter消息以进行微调的完整指南##引言在自然语言处理领域，微调模型以适应特定任务是提升模型性能的常见方法。本文将介绍如何使用Apify从Twitter导出聊天信息，以便进一步进行微调。##主要内容###使用Apify导出推文首先，我们需要从Twitter导出推文。Apify可以帮助我们做到这一点。通过Apify的强大功能，我们可以批量抓取和导出数据，适用于各类应用场景。
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
Day1笔记-Python简介&标识符和关键字&输入输出 ~在杰难逃~ Python python 开发语言大数据数据分析数据挖掘
大家好，从今天开始呢，杰哥开展一个新的专栏，当然，数据分析部分也会不定时更新的，这个新的专栏主要是讲解一些Python的基础语法和知识，帮助0基础的小伙伴入门和学习Python，感兴趣的小伙伴可以开始认真学习啦！一、Python简介【了解】1.计算机工作原理编程语言就是用来定义计算机程序的形式语言。我们通过编程语言来编写程序代码，再通过语言处理程序执行向计算机发送指令，让计算机完成对应的工作，编程
MYSQL面试系列-04 king01299 面试 mysql 面试
MYSQL面试系列-0417.关于redolog和binlog的刷盘机制、redolog、undolog作用、GTID是做什么的？innodb_flush_log_at_trx_commit及sync_binlog参数意义双117.1innodb_flush_log_at_trx_commit该变量定义了InnoDB在每次事务提交时，如何处理未刷入（flush）的重做日志信息（redolog）。它
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
Kafka 消息丢失如何处理？架构文摘JGWZ 学习
今天给大家分享一个在面试中经常遇到的问题：Kafka消息丢失该如何处理？这个问题啊，看似简单，其实里面藏着很多“套路”。来，咱们先讲一个面试的“真实”案例。面试官问：“Kafka消息丢失如何处理？”小明一听，反问：“你是怎么发现消息丢失了？”面试官顿时一愣，沉默了片刻后，可能有点不耐烦，说道：“这个你不用管，反正现在发现消息丢失了，你就说如何处理。”小明一头雾水：“问题是都不知道怎么丢的，处理起来
webpack图片等资源的处理 dmengmeng
需要的loaderfile-loader（让我们可以引入这些资源文件）url-loader（其实是file-loader的二次封装）img-loader（处理图片所需要的）在没有使用任何处理图片的loader之前，比如说css中用到了背景图片，那么最后打包会报错的，因为他没办法处理图片。其实你只想能够使用图片的话。只加一个file-loader就可以，打开网页能准确看到图片。{test:/\.(p
走向以教育叙事为载体的教育叙事研究 666小飞鱼
今天我读了吴松超老师的《给教师的68条建写作建议》中的第23条《如何通过教育叙事走向研究》，吴老师在文中与我们分享了一个德育案例，这是一个反面的案例，意在告知我们在处理问题时，不能就考虑的点太窄，思考要全面。走向教育叙事研究，教师要有敏锐的“感知力”，这个感知力来自于背后专业知识的支撑，思维能力以及广阔的视野和见识等。所以对于同一件事处理方法不同，这个就是教师背后“敏锐力”的不同造成的，也就是说是
ARM中断处理过程落汤老狗嵌入式linux
一、前言本文主要以ARM体系结构下的中断处理为例，讲述整个中断处理过程中的硬件行为和软件动作。具体整个处理过程分成三个步骤来描述：1、第二章描述了中断处理的准备过程2、第三章描述了当发生中的时候，ARM硬件的行为3、第四章描述了ARM的中断进入过程4、第五章描述了ARM的中断退出过程本文涉及的代码来自3.14内核。另外，本文注意描述ARM指令集的内容，有些sourcecode为了简短一些，删除了T
18、架构-可观测性之聚合度量大树~~ 架构 java python 后端架构
聚合度量聚合度量是指对系统运行时产生的各种指标数据进行收集、聚合和分析，以了解系统的健康状况和性能表现。聚合度量是可观测性的关键组成部分，通过对度量数据的分析，可以及时发现系统中的异常和瓶颈。以下是对聚合度量各个方面的详细解析，并结合具体的数据案例和技术支撑。指标收集收集系统运行时产生的各种指标数据是聚合度量的基础。常见的指标包括CPU使用率、内存使用率、请求处理时间、请求数、错误率等。以下是指标
【华为OD技术面试真题 - 技术面】- python八股文真题题库（1）算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.数据预处理流程数据预处理的主要步骤工具和库2.介绍线性回归、逻辑回归模型线性回归（LinearRegression）模型形式：关键点：逻辑回归（LogisticRegression）模型形式：关键点：参数估计与评估：3.python浅拷贝及深拷贝浅拷贝（Shal
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
简介Shell、zsh、bash zhaosuningsn Shell zsh bash shell linux bash
Shell是Linux和Unix的外壳，类似衣服，负责外界与Linux和Unix内核的交互联系。例如接收终端用户及各种应用程序的命令，把接收的命令翻译成内核能理解的语言，传递给内核，并把内核处理接收的命令的结果返回给外界，即Shell是外界和内核沟通的桥梁或大门。Linux和Unix提供了多种Shell，其中有种bash，当然还有其他好多种。Mac电脑中不但有bash，还有一个zsh，预装的，据说
HQL之投影查询归来朝歌 HQL Hibernate 查询语句投影查询
在HQL查询中，常常面临这样一个场景，对于多表查询，是要将一个表的对象查出来还是要只需要每个表中的几个字段，最后放在一起显示？针对上面的场景，如果需要将一个对象查出来： HQL语句写“from 对象”即可 Session session = HibernateUtil.openSession();
Spring整合redis bylijinnan redis
pom.xml <dependencies>  <dependency> <groupId>org.springframework.data</groupId> <artifactId>spring-data-redi
org.hibernate.NonUniqueResultException: query did not return a unique result: 2 0624chenhong Hibernate
参考：http://blog.csdn.net/qingfeilee/article/details/7052736 org.hibernate.NonUniqueResultException: query did not return a unique result: 2 在项目中出现了org.hiber
android动画效果不懂事的小屁孩 android动画
前几天弄alertdialog和popupwindow的时候，用到了android的动画效果，今天专门研究了一下关于android的动画效果，列出来，方便以后使用。 Android 平台提供了两类动画。一类是Tween动画，就是对场景里的对象不断的进行图像变化来产生动画效果（旋转、平移、放缩和渐变）。第二类就是 Frame动画，即顺序的播放事先做好的图像，与gif图片原理类似。
js delete 删除机理以及它的内存泄露问题的解决方案换个号韩国红果果 JavaScript
delete删除属性时只是解除了属性与对象的绑定，故当属性值为一个对象时，删除时会造成内存泄露（其实还未删除）举例： var person={name:{firstname:'bob'}} var p=person.name delete person.name p.firstname -->'bob' // 依然可以访问p.firstname，存在内存泄露
Oracle将零干预分析加入网络即服务计划蓝儿唯美 oracle
由Oracle通信技术部门主导的演示项目并没有在本月较早前法国南斯举行的行业集团TM论坛大会中获得嘉奖。但是，Oracle通信官员解雇致力于打造一个支持零干预分配和编制功能的网络即服务（NaaS）平台，帮助企业以更灵活和更适合云的方式实现通信服务提供商（CSP）的连接产品。这个Oracle主导的项目属于TM Forum Live!活动上展示的Catalyst计划的19个项目之一。Catalyst计
spring学习——springmvc（二） a-john springMVC
Spring MVC提供了非常方便的文件上传功能。 1，配置Spring支持文件上传： DispatcherServlet本身并不知道如何处理multipart的表单数据，需要一个multipart解析器把POST请求的multipart数据中抽取出来，这样DispatcherServlet就能将其传递给我们的控制器了。为了在Spring中注册multipart解析器，需要声明一个实现了Mul
POJ-2828-Buy Tickets aijuans ACM_POJ
POJ-2828-Buy Tickets http://poj.org/problem?id=2828 线段树，逆序插入 #include<iostream>#include<cstdio>#include<cstring>#include<cstdlib>using namespace std;#define N 200010struct
Java Ant build.xml详解 asia007 build.xml
1,什么是antant是构建工具2,什么是构建概念到处可查到，形象来说，你要把代码从某个地方拿来，编译，再拷贝到某个地方去等等操作，当然不仅与此，但是主要用来干这个3,ant的好处跨平台 --因为ant是使用java实现的，所以它跨平台使用简单--与ant的兄弟make比起来语法清晰--同样是和make相比功能强大--ant能做的事情很多，可能你用了很久，你仍然不知道它能有
android按钮监听器的四种技术百合不是茶 android xml配置监听器实现接口
android开发中经常会用到各种各样的监听器,android监听器的写法与java又有不同的地方; 1,activity中使用内部类实现接口 ,创建内部类实例使用add方法与java类似创建监听器的实例 myLis lis = new myLis(); 使用add方法给按钮添加监听器
软件架构师不等同于资深程序员 bijian1013 程序员架构师架构设计
本文的作者Armel Nene是ETAPIX Global公司的首席架构师，他居住在伦敦，他参与过的开源项目包括 Apache Lucene,，Apache Nutch， Liferay 和 Pentaho等。如今很多的公司
TeamForge Wiki Syntax & CollabNet User Information Center sunjing TeamForge How do Attachement Anchor Wiki Syntax
the CollabNet user information center http://help.collab.net/ How do I create a new Wiki page? A CollabNet TeamForge project can have any number of Wiki pages. All Wiki pages are linked, and
【Redis四】Redis数据类型 bit1129 redis
概述 Redis是一个高性能的数据结构服务器，称之为数据结构服务器的原因是，它提供了丰富的数据类型以满足不同的应用场景，本文对Redis的数据类型以及对这些类型可能的操作进行总结。 Redis常用的数据类型包括string、set、list、hash以及sorted set.Redis本身是K/V系统，这里的数据类型指的是value的类型，而不是key的类型，key的类型只有一种即string
SSH2整合-附源码白糖_ eclipse spring tomcat Hibernate Google
今天用eclipse终于整合出了struts2+hibernate+spring框架。我创建的是tomcat项目，需要有tomcat插件。导入项目以后，鼠标右键选择属性，然后再找到“tomcat”项，勾选一下“Is a tomcat project”即可。具体方法见源码里的jsp图片，sql也在源码里。补充1：项目中部分jar包不是最新版的，可能导
[转]开源项目代码的学习方法 braveCS 学习方法
转自： http://blog.sina.com.cn/s/blog_693458530100lk5m.html http://www.cnblogs.com/west-link/archive/2011/06/07/2074466.html 1）阅读features。以此来搞清楚该项目有哪些特性2）思考。想想如果自己来做有这些features的项目该如何构架3）下载并安装d
编程之美-子数组的最大和（二维） bylijinnan 编程之美
package beautyOfCoding; import java.util.Arrays; import java.util.Random; public class MaxSubArraySum2 { /** * 编程之美子数组之和的最大值（二维） */ private static final int ROW = 5; private stat
读书笔记-3 chengxuyuancsdn jquery笔记 resultMap配置 ibatis一对多配置
1、resultMap配置 2、ibatis一对多配置 3、jquery笔记 1、resultMap配置当<select resultMap="topic_data"> <resultMap id="topic_data">必须一一对应。 (1)<resultMap class="tblTopic&q
[物理与天文]物理学新进展 comsci
如果我们必须获得某种地球上没有的矿石,才能够进行某些能量输出装置的设计和建造,而要获得这种矿石,又必须首先进行深空探测,而要进行深空探测,又必须获得这种能量输出装置,这个矛盾的循环,会导致地球联盟在与宇宙文明建立关系的时候,陷入困境怎么办呢?
Oracle 11g新特性:Automatic Diagnostic Repository daizj oracle ADR
Oracle Database 11g的FDI（Fault Diagnosability Infrastructure）是自动化诊断方面的又一增强。 FDI的一个关键组件是自动诊断库（Automatic Diagnostic Repository-ADR）。在oracle 11g中，alert文件的信息是以xml的文件格式存在的，另外提供了普通文本格式的alert文件。这两份log文
简单排序:选择排序 dieslrae 选择排序
public void selectSort(int[] array){ int select; for(int i=0;i<array.length;i++){ select = i; for(int k=i+1;k<array.leng
C语言学习六指针的经典程序，互换两个数字 dcj3sjt126com c
示例程序，swap_1和swap_2都是错误的，推理从1开始推到2，2没完成，推到3就完成了 # include <stdio.h> void swap_1(int, int); void swap_2(int *, int *); void swap_3(int *, int *); int main(void) { int a = 3; int b =
php 5.4中php-fpm 的重启、终止操作命令 dcj3sjt126com PHP
php 5.4中php-fpm 的重启、终止操作命令: 查看php运行目录命令：which php/usr/bin/php 查看php-fpm进程数：ps aux | grep -c php-fpm 查看运行内存/usr/bin/php -i|grep mem 重启php-fpm/etc/init.d/php-fpm restart 在phpinfo()输出内容可以看到php
线程同步工具类 shuizhaosi888 同步工具类
同步工具类包括信号量（Semaphore）、栅栏（barrier）、闭锁（CountDownLatch）闭锁（CountDownLatch） public class RunMain { public long timeTasks(int nThreads, final Runnable task) throws InterruptedException { fin
bleeding edge是什么意思 haojinghua DI
不止一次，看到很多讲技术的文章里面出现过这个词语。今天终于弄懂了——通过朋友给的浏览软件，上了wiki。我再一次感到，没有辞典能像WiKi一样，给出这样体贴人心、一清二楚的解释了。为了表达我对WiKi的喜爱，只好在此一一中英对照，给大家上次课。 In computer science, bleeding edge is a term that
c中实现utf8和gbk的互转 jimmee c iconv utf8&gbk编码
#include <iconv.h> #include <stdlib.h> #include <stdio.h> #include <unistd.h> #include <fcntl.h> #include <string.h> #include <sys/stat.h> int code_c
大型分布式网站架构设计与实践 lilin530 应用服务器搜索引擎
1.大型网站软件系统的特点？ a.高并发，大流量。 b.高可用。 c.海量数据。 d.用户分布广泛，网络情况复杂。 e.安全环境恶劣。 f.需求快速变更，发布频繁。 g.渐进式发展。 2.大型网站架构演化发展历程？ a.初始阶段的网站架构。应用程序，数据库，文件等所有的资源都在一台服务器上。 b.应用服务器和数据服务器分离。 c.使用缓存改善网站性能。 d.使用应用
在代码中获取Android theme中的attr属性值 OliveExcel android theme
Android的Theme是由各种attr组合而成, 每个attr对应了这个属性的一个引用, 这个引用又可以是各种东西. 在某些情况下, 我们需要获取非自定义的主题下某个属性的内容 (比如拿到系统默认的配色colorAccent), 操作方式举例一则: int defaultColor = 0xFF000000; int[] attrsArray = { andorid.r.
基于Zookeeper的分布式共享锁 roadrunners zookeeper 分布式共享锁
首先，说说我们的场景，订单服务是做成集群的，当两个以上结点同时收到一个相同订单的创建指令，这时并发就产生了，系统就会重复创建订单。等等......场景。这时，分布式共享锁就闪亮登场了。共享锁在同一个进程中是很容易实现的，但在跨进程或者在不同Server之间就不好实现了。Zookeeper就很容易实现。具体的实现原理官网和其它网站也有翻译，这里就不在赘述了。官
两个容易被忽略的MySQL知识 tomcat_oracle mysql
1、varchar(5)可以存储多少个汉字，多少个字母数字？　　相信有好多人应该跟我一样，对这个已经很熟悉了，根据经验我们能很快的做出决定，比如说用varchar(200)去存储url等等，但是，即使你用了很多次也很熟悉了，也有可能对上面的问题做出错误的回答。　　这个问题我查了好多资料，有的人说是可以存储5个字符，2.5个汉字（每个汉字占用两个字节的话），有的人说这个要区分版本，5.0
zoj 3827 Information Entropy(水题) 阿尔萨斯 format
题目链接：zoj 3827 Information Entropy 题目大意：三种底，计算和。解题思路：调用库函数就可以直接算了，不过要注意Pi = 0的时候，不过它题目里居然也讲了。。。limp→0+plogb(p)=0，因为p是logp的高阶。 #include <cstdio> #include <cstring> #include <cmath&

从实现的技术手段细数：高分辨率遥感影像+人工智能的现在和未来

你可能感兴趣的:(影像处理,人工智能,深度学习)