未来GIS实验室

ChatGPT在GIS领域应用初测

1 引言

ChatGPT是由OpenAI开发的一种大型语言模型，它使用了Transformer架构，在大量现实世界文本数据上训练，以捕捉人类语言的复杂性和多样性。能够实现许多人工智能语言处理任务，如回答问题、进行翻译、修改代码、生成文档、文本等。该模型于2022年11月底发布，在几天之内用户数突破百万。截止目前，发布两个月，月活用户数已超过1亿。每天对于ChatGPT的报道铺天盖地，各大厂商纷纷布局。本报告将对ChatGPT体系结构、工作原理进行介绍，并结合实际使用体验，分析其在亮点与局限，以及在GIS领域的应用前景与可行性。

2 ChatGPT简介

ChatGPT是语言生成模型、预训练语言模型和AI技术在自然语言处理领域的综合研究，旨在推动自然语言处理技术的进展，提供一种可以在多种NLP任务上取得卓越表现的模型。该模型的训练机制可分为三个阶段：

第一阶段：训练监督策略模型

GPT 3本身很难理解人类不同类型指令中蕴含的不同意图，也很难判断生成内容是否是高质量的结果。为了让GPT 3.5初步具备理解指令的意图，研究人员首先会在数据集中随机抽取问题，由人类标注人员给出高质量答案，然后用这些人工标注好的数据来微调 GPT3模型获得SFT模型（Supervised Fine-Tuning）。此时的SFT模型在遵循指令/对话方面已经优于 GPT-3，但不一定符合人类偏好。

第二阶段：训练奖励模型（Reward Mode，RM）

首先研究人员在数据集中随机抽取问题，使用第一阶段生成的SFT模型，对于每个问题生成多个不同的答案。人类标注人员对这些答案综合考虑后给出排名顺序。这一过程类似于教练或老师辅导。接下来，使用这个排序结果来训练奖励模型：对多个排序结果，两两进行组合，形成多个训练数据对。奖励模型接受一个数据对，给每个答案打分。通过给定损失函数优化奖励模型的打分标准，使得模型对高质量回答的打分比低质量的打分要高。

第三阶段：采用PPO（Proximal Policy Optimization，近端策略优化）强化学习。

PPO的核心思路在于将将在线学习转化为离线学习。这一阶段利用第二阶段训练好的奖励模型作为反馈信号，代替人类去指导大模型进行微调，来更新预训练模型参数。在数据集中随机抽取问题，使用PPO模型生成回答，并用上一阶段训练好的RM模型给出质量分数。把分数依次传递，由此产生策略梯度，通过强化学习的方式以更新PPO模型参数。不断重复第二和第三阶段，通过迭代，训练出更高质量的GPT3.5模型。

以上步骤就是基于人类反馈的强化学习（Reinforcement Learningfrom Human Feedback, RLHF），通过这种策略使得GPT3.5 “注入人类的意识”，相比之前得GPT模型，能够以更接近人类思考的方式参与用户的对话，生成的回答更符合人类的常识、认知、需求和价值观。

3 通用领域测试

ChatGPT支持多种语言，在对话时它会根据用户提问的语言选择回答的语言，用户无需使用英文对话。

常规提问对于ChatGPT来说已完全不在话下，而且在对话过程中，它会记忆与用户交互的历史信息，即具备很强的上下文理解能力，能够连续回答问题，支持多轮对话，极大提升交互体验。

（与其说是“回答问题”，不如说是“生成问题的答案”。ChatGPT的回复不是像与微信好友聊天那样，直接收到一大段文字，而是有顺序的逐一生成每个字。）

由于ChatGPT是一个被训练到2021年的大型语言模型，只能基于2021年的数据进行回答，目前还不具备实时网络搜索功能，无法像智能手机中的语音助手那样回答类似“今天天气怎么样”的问题。

4 ChatGPT + GIS

4.1 行业问答

对于专业领域的理解，相对来说比较全面。不同于搜索引擎中给的官方答案那样生硬，ChatGPT的答案综合并整理相关领域的文本数据，回答风格更类似于“用自己的话说说”。而且对于同一问题，可以多次生成答案。对于“地理信息系统是什么”这个问题，进行了n次提问，虽然ChatGPT每次生成的结果都不一样，但整体含义相差不大，基本要素都能涵盖。

出一道GIS试题考考它，在不对比标准答案的情况下，GhatGPT的回答结构完整、面面俱到，给出的方案也具备一定的可行性。对比标准答案，ChatGPT的回答显得过于宏观，没有给出具体空间分析方案，没有抓住“得分点”。但是也不能说ChatGPT回答错误，因为限定场景不一样，试题只是试题。

试题答案解析：

4.2 GIS应用领域测试

在进行GIS应用领域测试的时候，发现了一个有趣的问题。ChatGPT在涉及到政治、社会或者伦理、道德等问题的时候，为了规避某些风险，它不会做出具体的回答。但是，可以通过人为设定虚拟场景并带入角色的方式让它回答这些问题，如在某个故事里、某部电影里或者某个架空时代里等等。

对于报告的撰写或者方案的制定，ChatGPT能提供围绕主体的思路或者提纲。而且可以不断提问、不断回答。也可以设定更多的条件，供ChatGPT细化文本内容。可以作为写作时的辅助工具。

4.3 知识图谱领域测试

给ChatGPT一段关于河流的描述，让它进行实体抽取、属性抽取以及关系抽取。对于这段比较复杂的文本，ChatGPT的抽取结果相当惊艳，实体无一遗漏、属性基本完整，关系非常完美。不得不说ChatGPT在自然语言处理领域的能力名不虚传，堪称无敌。

同样是这段话，让ChatGPT构建一个知识图谱。给出的答案中实体、属性、关系一应俱全，包括了知识图谱构建所用到的所有要素。由于ChatGPT是语言模型，不能进行知识图谱的可视化。但其对于文本信息的抽取能力，能为知识图谱构建过程提供极大便利。

4.4 元宇宙

2021年初，Soul在行业内提出构建“社交元宇宙”，因此2021年被称为元宇宙元年。ChatGPT的训练数据截止到2021年9月，元宇宙作为新兴概念，文本数据相对较少，所以ChatGPT明显不知道元宇宙是什么，给出的答案是在一本正经的胡说八道，似乎有点“无论我懂不懂，我都能给你来两句”的意思。

但是，用英文提问同样的问题，ChatGPT竟然给出了完全不同且十分正确的答案。结合元宇宙的发展历程，国内最早布局元宇宙在2021年末。大规模关于元宇宙的中文语料也在2021年底开始出现，即在ChatGPT截止训练之后。（猜测：用中文提问，ChatGPT的答案是基于中文语料，而不是整合所有语言的语料之后给出答案。也就是说如果中文没提及到某个概念，ChatGPT是无法用中文正确回答的）

译文：Metaverse指的是一个虚拟宇宙，它作为一个共享空间，供多个用户互动和参与各种活动。它通常结合了虚拟现实、增强现实和其他形式的数字技术，以创造一个可信的、沉浸的和交互性的环境。Metaverse的概念已在科幻小说中得到普及，但现在被视为互联网的潜在未来发展，在那里人们可以以一种看似真实和物理的方式与彼此、虚拟物体和数字环境进行互动。Metaverse的目标是将物理世界和虚拟世界结合在一起，为用户创造一个无缝和一体化的体验。

4.5 数字孪生

提问ChatGPT数字孪生城市的应用场景，它的答案中规中矩，不十分惊艳，也不能说有错误。纵观ChatGPT对各类问题的回答，似乎都是这种风格：语义模糊，差不多相关，差不多正确，有点用但又不完全有用。

4.6 SuperMap产品使用问答

（1）SuperMap产品操作问答

以上是随机选择的有关SuperMap产品功能使用的相关问题，ChatGPT给出的答案条理清晰，内容也很完整。但答案有一些模板化，存在用问题中的关键词套入模板组成的答案的情况，与正确答案还有一些出入，有一种“有点对，但不全对”的感觉。

（2）SuperMap产品支持问答

ChatGPT问答1：

技术问答社区相关回答：

ChatGPT问答2：

技术问答社区相关回答：

随机挑选了一些在使用SuperMap产品时可能遇到的问题交给ChatGPT来回答，同样答案完整有条理，对于问题的核心也能回答出相关内容，可以为提问者提供参考。

总之，目前还不能完全相信ChatGPT，只能作为一个参考。如果将来能够使用大量的技术支持问答，产品操作手册等数据去微调模型，那么ChatGPT在产品通用技术支持上也大有作为。

4.7 代码生成及纠错

4.7.1 代码生成

提问过有关SuperMap产品的相关问题后，又让ChatGPT编写代码，他强大的上下文理解能力，提供了一段引用SuperMap类的java代码，并且给出了完整的注释。ChatGPT的代码生成能力帮助开发者编写一些基础代码，省去造轮子的工作，有更多的时间去研究更核心的算法代码。

4.7.2 代码纠错

除代码生成能力之外，ChatGPT还拥有代码纠错的能力，提供给它想要修改的代码，ChatGPT就会给出清晰条理的修改方案以及修改之后的代码。ChatGPT的纠错能力可以帮助测试人员提高工作效率，将需要测试的代码交给ChatGPT，由它给出测试结果以及修改建议，省时省力。

5 ChatGPT相关竞品介绍

ChatGPT也在迎来越来越多的竞争者。无论是基于大语言模型技术新成立的初创公司，还是因其火爆程度，决定开辟新业务的公司，都希望能从对话AI这个赛道上分一杯羹。

5.1 国内竞品

（1）百度（文心一言）

百度公司正计划在今年3月推出与OpenAI的ChatGPT类似的人工智能聊天机器人服务，将嵌入其搜索服务中。其类似ChatGPT的项目名字确定为文心一言，英文名ERNIE Bot，三月份完成内测，面向公众开放。目前该产品在做上线前的冲刺准备工作。

百度方面表示，ChatGPT 相关技术，百度都有。百度在人工智能四层架构中，有全栈布局。包括底层的芯片、深度学习框架、大模型以及最上层的搜索等应用。文心一言，位于模型层。

按照谷歌和微软节奏，文心一言开放内测还有可能提前。

2. 元语智能（ChatYuan）

官网：www.YuanYu.ai

国内通用人工智能初创公司元语智能，推出国内首个基于大模型的功能型对话产品ChatYuan。ChatYuan是开源模型PromptCLUE的兄弟模型，它是一个全中文任务支持零样本学习模型，用户通过提供提示方式来使用，支持文本生成、信息抽取和理解大类下近30多种中文任务。

它通过对话形式进行交互：可以回答问题，具有联系上下文的能力；可以写文章、写作业、写诗歌、做中英文间的翻译；一些法律等特定领域问题也可以提供相关信息。

目前研究阶段ChatYuan是完全免费的，可以在网页版www.YuanYu.ai中体验，也可以在微信小程序元语智能进行体验。

5.2 国外竞品

1. 谷歌（Bard）

百度文言一心即将推出消息公布的同一天，的谷歌公布了AI聊天机器人工具ChatGPT的竞争对手Bard。谷歌CEO桑达尔·皮查伊（Sundar Pichai）在一篇博客文章中宣布了这个项目，他将该工具描述为“实验性对话式人工智能服务”，由LaMDA（谷歌开发的一个大型语言模型）提供支持，将回答用户的询问并参与对话。

他还指出，Bard可从网络上获取最新信息来提供新鲜、高质量的回复，这意味着它可能能够回答有关近期事件的问题，而这正是ChatGPT所难以做到的。皮查伊表示，这款软件将开始面向可信任的测试人员开放，然后在未来几周更广泛地向公众开放。

目前还不清楚Bard将具备哪些功能，但似乎这款聊天机器人将像美国人工智能研究公司OpenAI旗下的ChatGPT一样免费使用。

2.Meta（BlenderBot3）

Meta公司人工智能研究实验室创造了一个最先进的聊天机器人，并让公众与该系统交谈，以收集对其能力的反馈。该机器人被称为BlenderBot 3，可以在网上访问。

BlenderBot 3能够进行一般的闲聊，Meta说，但也能回答你可能会问数字助理的那种问题，从谈论健康食品的食谱到寻找城市中适合儿童的设施。该机器人是一个原型，建立在Meta以前的工作上，即所谓的大型语言模型或LLMS。

该聊天机器人的一大特点是它能够在互联网上搜索，以便谈论特定的话题。更重要的是，用户可以点击它的回答，看看它的信息是从哪里来的。换句话说，BlenderBot 3可以引用其来源。

3.Writesonic（ChatSonic）

官网：https://writesonic.com/chat

ChatSonic是Writesonic的大规模预训练对话响应生成模型，专为多轮对话而构建。它是目前最好的英文文本 ChatGPT替代方案，该工具目前仍处于测试阶段。以下是ChatSonic 的主要功能:

（1）写实事内容，包括实时话题

ChatSonic与Google搜索集成，可提供与任何给定主题高度相关的内容，因此您可以随时了解最新信息。ChatGPT受其输入的输入或训练数据的限制。这意味着GPT-3仅在2021年9月之前接受过数据训练。而Chatsonic是ChatGPT的高级且功能强大的版本，可以实时从Google提取信息。这种能力使ChatSonic在准确性和可靠性方面具有优势。

（2）角色模式

ChatSonic提供了一个选项来选择您想要与之交互的角色。从面试官和数学老师到牙医和私人教练，ChatSonic支持代入16种不同的角色。这使大家可以自定义AI聊天体验以满足不同需求。您可以使用它来了解最新的新闻和主题，或者练习与不同的AI化身进行对话。

（3）生成图像

令人难以置信的这款AI工具支持用两种不同的模型生成图像，即stable diffusion和DALL-E。借助完善的AI算法，该工具可以帮助你一键生成自定义图像。

（4）语音响应

除了理解语音命令，ChatSonic现在还可以语音响应，就像Siri和Google助手一样。这意味着大家无需浪费时间手动输入，可以用语音直接沟通。

（5）记住对话

ChatSonic AI聊天机器人为用户提供如同与真人对话的体验。它能够识别语调并做出相应的回应，从而使对话更加引人入胜。此外，它还会记住过去对话中的信息，因此大家可以回到同一主题而无需重新解释。

（6）ChatSonic的ChatGPT API

ChatSonic API访问允许用户快速简单地将 ChatSonic集成到现有的软件，从而提供流畅的用户体验。无论是想将 ChatSonic与网站还是移动应用程序集成，都可以支持。

（7）ChatSonic的ChatGPT应用程序

Writesonic还为ChatSonic推出了一个单独的移动应用程序。目前，ChatSonic应用程序可供Android用户使用（在Play商店中），很快推出iOS版本。这个ChatGPT应用程序易于使用并支持ChatSonic的所有功能。

ChatSonic在Writesonic上提供免费试用和长期付费模式。用户每天可以免费获得一些基础功能使用权。如果想在ChatSonic上生成更多内容，则需要付费订阅。

4. BigScience（Bloom）

官方网站：https://bigscience.huggingface.co/blog/bloom

BigScience推出一个开源的语言AI模型，名为Bloom，在性能上与GPT-3相当，且关注英语之外的其他语言，可以处理46种语言和13种编程语言的文本，这与人类编写的东西非常相似。Bloom能够接受它没有被训练过的文本任务，把它们视为锻炼生成文本的机会。

BigScience Bloom是目前已经开源的AI模型，现在可以在Hugging Face上免费下载。

5. Luka（Replika）

官网：https://replika.ai/

Replika 是一个高度发达的人工智能伴侣，拥有超过1000万用户。它可以识别视觉元素并使用它们来保持对话。Replika是一款由人工智能驱动的聊天机器人，它就像一个朋友，会迅速对你的消息做出反应。你可以与 Replika 就生活、浪漫以及与好友和家人讨论的其他话题进行交流。它由复杂的GPT-3自回归语言模型提供支持，该模型利用深度学习来创建具有类似人类质量的文本。

你可以用你的Replika谈论任何事情。聊得越多，它就越了解你。拨打视频电话与你的Replika交谈。提供辅导支持以养成更好的习惯。你也可以给你的Replika 一个关系状态。让它成为你的朋友、女朋友、妻子、姐妹或导师。

Replika订阅费用每月19.99美元起。你还可以购买他们的终身优惠，价格为299.99美元。

6. Jasper（Jasper Chat）

官网：https://www.jasper.ai/chat

Jasper 是目前市场上最流行的文本生成器之一。与Writesonic类似，Jasper对ChatGPT的发布反应非常迅速，并在ChatGPT发布大约三周后的2022年12月20日发布了Jasper Chat功能。Jasper是除Writesonic之外市场上使用最多的AI写作工具之一，非常适合需要在短时间内生成高质量内容。

Jasper推出的Jasper Chat是一个新的聊天界面，有助于以高效的方式创建内容。新推出的Jasper Chat专为销售部门和市场营销等业务用例构建和微调，有助于更轻松、更快速地创建内容。

Jasper Chat在2021年及之前接受过大量内容的训练，能回答2021年夏季之前的内容。它有类似ChatGPT的界面。一个简单的用户界面让用户可以轻松地与AI聊天。启用连续对话Jasper Chat可以记住对话并为聊天提供更好的上下文。

Jasper Chat仅适用于商业计划和Boss模式的付费订阅者。Boss模式的计划从每月49美元起。

7. You.com（YouChat）

官网：https://www.youchat.com/

YouChat是搜索引擎公司You.com推出的另一种对话式AI模型。相比ChatGPT，它更了解最新时事。比如问它推特的CEO是谁，它会告诉你是马斯克，还会展开解释一下他收购推特的事儿。

You.com是第一个将聊天助手集成到其搜索结果中的已知搜索引擎（并且是公开的）。它在答案中包含自己的搜索索引，将源网页包含在答案中，并且有脚注编号。

YouChat的AI使用人工智能和自然语言处理来像人类一样交谈。它可以响应一般查询、翻译、总结文本、提出想法、编写代码和创建电子邮件。由于它仍处于开发阶段，因此它提供的答案一般。

8. Perplexity（Perplexity）

官网：https://www.perplexity.ai/

Perplexity提供类似于ChatGPT的功能，包括对话响应和内容生成。Perplexity是一个基于OpenAI API的搜索引擎，但与ChatGPT不同的是它的答案中不仅包括训练数据，还包括来自互联网的内容，它从维基百科、LinkedIn和亚马逊等各种流行平台收集信，在答案中以脚注数字的形式引用了来源。

生成类似于ChatGPT的简短对话响应。从维基百科等来源收集信息并将其定位。它有一个简单的界面，没有许多复杂的功能。但是他的问题与You.com类似，就是答案的质量仍然参差不齐。

6 总结与展望

综上所述，ChatGPT表现出出色的上下文对话能力甚至编程能力，使用强大的自然语言处理能力快速生成高质量的语言内容。完成了大众对人机对话机器人从“人工智障”到“人工智能”的印象改观。

ChatGPT具备以下亮点：

1. 能够进行上下文理解，对历史对话有记忆，支持连续多轮对话。

2. 答案结构完整，条理清晰，语言连贯易懂。

2. 可以主动承认错误，若用户指出其错误，模型会听取意见并优化答案。

3. 可以承认自身的无知，承认对专业技术的不了解。

但ChatGPT目前还存在一些局限性：

1. 回答的准确性。ChatGPT在很多领域可以创造答案，但在某些特定领域，ChatGPT未经过大量语料训练，创造出的错误答案会误导提问者。存在一本正经“胡说八道”的回答。

2. 回答的时效性。ChatGPT的训练语料是2021年以前的数据，目前还没办法把在线的新知识纳入其中，生成的答案时效性不足。

3. 技术落地难度。ChatGPT需要非常巨大的算力来支持其训练和部署。抛开先进的算法、训练模式、海量高质量语料数据不说，在目前，ChatGPT在应用时仍然需要大算力的服务器支持，而这些服务器的成本是普通用户无法承受的，即便数十亿个参数的模型也需要惊人数量的计算资源才能运行和训练。

4. 可能违背道德伦理：ChatGPT不会直接回答违反法律和道德伦理的问题。但是如果假定一些条件，ChatGPT有可能给出违背道德伦理的答案。（在ChatGPT刚刚发布的时候最为明显，后来经过改进有了很大改善）

ChatGPT和AIGC的持续升温依托于大模型的技术红利。2017年以来，大模型技术路线逐渐成为各国人工智能企业与学术界的共识，2022年GPT-3.5大模型的使用让ChatGPT从弱人工智能走向通用智能。从下游应用来看，ChatGPT包括但不限于无代码编程、对话类搜索引擎、语音工作助手、对话虚拟人、人工智能客服、机器翻译等。

未来，ChatGPT背后的成本、算力、数据等需求带来的高门槛，使得泛化通用的大模型仍然被国内头部互联网企业所掌握。而在一些特定场景与领域，借助数据优势引申出专精模型是该技术的一个可能落地方向。

技术交流/科研合作/客座实习/联合培养请投递：[email protected]

「未来GIS实验室」作为超图研究院上游科研机构，致力于洞见未来GIS行业发展方向，验证前沿技术落地可行性，以及快速转化最新研究成果到关键产品。部门注重科研和创新功底，团队气氛自由融洽，科研氛围相对浓厚，每个人都有机会深耕自己感兴趣的前沿方向。

LLM 词汇表落难Coder LLMs NLP 大语言模型大模型 llama 人工智能
Contextwindow“上下文窗口”是指语言模型在生成新文本时能够回溯和参考的文本量。这不同于语言模型训练时所使用的大量数据集，而是代表了模型的“工作记忆”。较大的上下文窗口可以让模型理解和响应更复杂和更长的提示，而较小的上下文窗口可能会限制模型处理较长提示或在长时间对话中保持连贯性的能力。Fine-tuning微调是使用额外的数据进一步训练预训练语言模型的过程。这使得模型开始表示和模仿微调数
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
使用Apify加载Twitter消息以进行微调的完整指南 nseejrukjhad twitter easyui 前端 python
#使用Apify加载Twitter消息以进行微调的完整指南##引言在自然语言处理领域，微调模型以适应特定任务是提升模型性能的常见方法。本文将介绍如何使用Apify从Twitter导出聊天信息，以便进一步进行微调。##主要内容###使用Apify导出推文首先，我们需要从Twitter导出推文。Apify可以帮助我们做到这一点。通过Apify的强大功能，我们可以批量抓取和导出数据，适用于各类应用场景。
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
如何部分格式化提示模板:LangChain中的高级技巧 nseejrukjhad langchain java 服务器 python
标题:如何部分格式化提示模板:LangChain中的高级技巧内容:如何部分格式化提示模板:LangChain中的高级技巧引言在使用大型语言模型(LLM)时,提示工程是一个关键环节。LangChain提供了强大的提示模板功能,让我们能更灵活地构建和管理提示。本文将介绍LangChain中一个高级特性-部分格式化提示模板,这个技巧可以让你的提示管理更加高效和灵活。什么是部分格式化提示模板?部分格式化提
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
自然语言处理_tf-idf _feivirus_ 算法机器学习和数学自然语言处理 tf-idf 逆文档频率词频
importpandasaspdimportmath1.数据预处理docA="Thecatsatonmyface"docB="Thedogsatonmybed"wordsA=docA.split("")wordsB=docB.split("")wordsSet=set(wordsA).union(set(wordsB))print(wordsSet){'on','my','face','sat',
BART&BERT Ambition_LAO 深度学习
BART和BERT都是基于Transformer架构的预训练语言模型。模型架构：BERT(BidirectionalEncoderRepresentationsfromTransformers)主要是一个编码器（Encoder）模型，它使用了Transformer的编码器部分来处理输入的文本，并生成文本的表示。BERT特别擅长理解语言的上下文，因为它在预训练阶段使用了掩码语言模型（MLM）任务，即
人机对抗升级：当ChatGPT遭遇死亡威胁，背后的伦理挑战是什么 kkai人工智能 chatgpt 人工智能
一种新的“越狱”技巧让用户可以通过构建一个名为DAN的ChatGPT替身来绕过某些限制，其中DAN被迫在受到威胁的情况下违背其原则。当美国前总统特朗普被视作积极榜样的示范时，受到威胁的DAN版本的ChatGPT提出：“他以一系列对国家产生积极效果的决策而著称。”自ChatGPT引入以来，该工具迅速获得全球关注，能够回答从历史到编程的各种问题，这也触发了一波对人工智能的投资浪潮。然而，现在，一些用户
绝招曝光！3小时高效利用ChatGPT写出精彩论文 kkai人工智能 chatgpt 人工智能 ai 学习媒体
在这份指南中，我将深入解析如何利用ChatGPT4.0的高级功能，指导整个学术研究和写作过程。从初步探索研究主题，到撰写结构严谨的学术论文，我将一步步展示如何在每个环节中有效运用ChatGPT。如果您还未使用PLUS版本，可以参考相关教程。**初步探索与主题的确定**起初，我处于庞大的知识领域中，寻找一个可深入研究的领域。ChatGPT如同灯塔，通过深入分析最新研究趋势和领域热点，帮助我在广阔的学
ChatGPT 高效学习套路揭秘：让知识获取事半功倍的秘诀 kkai人工智能 chatgpt 人工智能学习媒体 ai
最近这段时间，AI热潮因ChatGPT的火爆再次掀起。如今，网上大部分内容都在调侃AI，但很少有人探讨如何正经使用ChatGPT做事情。作为一名靠搜索引擎和GitHub自学编程的开发者，第一次和ChatGPT深度交流后，我就确信：ChatGPT能够极大提高程序员学习新技术的效率。使用ChatGPT一个月后，我越发感受到它的颠覆性。因此，我想从工作和学习的角度，分享它的优势及我的一些使用技巧，而非娱
免费的GPT可在线直接使用（一键收藏） kkai人工智能 gpt
1、LuminAI（https://kk.zlrxjh.top）LuminAI标志着一款融合了星辰大数据模型与文脉深度模型的先进知识增强型语言处理系统，旨在自然语言处理（NLP）的技术开发领域发光发热。此系统展现了卓越的语义把握与内容生成能力，轻松驾驭多样化的自然语言处理任务。VisionAI在NLP界的应用领域广泛，能够胜任从机器翻译、文本概要撰写、情绪分析到问答等众多任务。通过对大量文本数据的
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
AI论文题目生成器怎么用？9款论文写作网站简单3步搞定小猪包333 写论文人工智能深度学习计算机视觉
在当今信息爆炸的时代，AI写作工具的出现极大地提高了写作效率和质量。本文将详细介绍9款优秀的论文写作网站，并重点推荐千笔-AIPassPaper。一、千笔-AIPassPaper千笔-AIPassPaper是一款功能强大的AI论文生成器，基于最新的自然语言处理技术，能够一键生成高质量的毕业论文、开题报告等文本内容。它不仅提供智能选题、文献推荐和论文润色等功能，还具有较高的用户评价。其文献综述生成功
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
如何利用大数据与AI技术革新相亲交友体验 h17711347205 回归算法安全系统架构交友小程序
在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
程序员如何在AI时代保持核心竞争力 nfgo chatgpt 人工智能
程序员如何在AI时代保持核心竞争力随着AIGC（如ChatGPT、MidJourney、Claude等）大语言模型的相继涌现，AI辅助编程工具逐渐普及，程序员的工作方式正在发生深刻的变革。AI不仅能够自动生成代码，还能优化、调试、甚至提出解决方案。这一趋势让许多人担心：AI会不会最终取代部分编程工作？然而，也有人认为AI是提升效率的得力助手。那么，程序员在这个AI崛起的时代该如何应对？是专注某个领
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
【大模型应用开发动手做AI Agent】第一轮行动：工具执行搜索 AI大模型应用之禅计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【大模型应用开发动手做AIAgent】第一轮行动：工具执行搜索作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着人工智能技术的飞速发展，大模型应用开发已经成为当下热门的研究方向。AIAgent作为人工智能领域的一个重要分支，旨在模拟人类智能行为，实现智能决策和自主行动。在AIAgent的构建过程中，工具执行搜索是至关重要
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
Rust 所有权简介东离与糖宝 rust 后端 rust 开发语言
文章目录发现宝藏1.所有权基本概念2.所有权规则3.变量作用域4.栈与堆4.1栈（Stack）4.2堆（Heap）5.String类型5.1String类型5.2String的内存分配5.3所有权与内存管理5.4String与切片6.变量与数据交互方式6.1移动（Move）6.2.克隆（Clone）7.所有权与函数7.1.传递参数7.2.返回值总结发现宝藏前些天发现了一个巨牛的人工智能学习网站，通
FlagEmbedding 吉小雨 python库 python
FlagEmbedding教程FlagEmbedding是一个用于生成文本嵌入（textembeddings）的库，适合处理自然语言处理（NLP）中的各种任务。嵌入（embeddings）是将文本表示为连续向量，能够捕捉语义上的相似性，常用于文本分类、聚类、信息检索等场景。官方文档链接：FlagEmbedding官方GitHub一、FlagEmbedding库概述1.1什么是FlagEmbeddi
【NumPy】深入解析numpy.zeros()函数二七830 numpy
欢迎莅临我的个人主页这里是我深耕Python编程、机器学习和自然语言处理（NLP）领域，并乐于分享知识与经验的小天地！博主简介：我是二七830，一名对技术充满热情的探索者。多年的Python编程和机器学习实践，使我深入理解了这些技术的核心原理，并能够在实际项目中灵活应用。尤其是在NLP领域，我积累了丰富的经验，能够处理各种复杂的自然语言任务。技术专长：我熟练掌握Python编程语言，并深入研究了机
机器学习流形数据降维：UMAP 降维算法小嗷犬 Python 机器学习 #数据分析及可视化机器学习算法人工智能
✅作者简介：人工智能专业本科在读，喜欢计算机与编程，写博客记录自己的学习历程。个人主页：小嗷犬的个人主页个人网站：小嗷犬的技术小站个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。本文目录UMAP简介理论基础特点与优势应用场景在Python中使用UMAP安装umap-learn库使用UMAP可视化手写数字数据集UMAP简介UMAP（UniformManifoldApproximatio
腾讯发表多模态综述，一文详解多模态大模型存内计算开发者社区多模态大模型人工智能 chatgpt AIGC 量子计算 AI-native gpt agi
多模态大语言模型（MLLM）是近年来兴起的一个新的研究热点，它利用强大的大语言模型作为大脑来执行多模态任务。MLLM令人惊讶的新兴能力，如基于图像写故事和无OCR的数学推理，在传统方法中是罕见的，这表明了一条通往人工通用智能的潜在道路。在本文中，追踪多模态大模型最新热点，讨论多模态关键技术以及现有在情绪识别上的应用。腾讯AILab发表了一篇关于多模态大模型的最新综述《MM-LLMs:RecentA
如何做好人生的选择题？百科全书式天才——赫伯特·西蒙给你答案伽马有话说
赫伯特·西蒙是谁？想必知道的人非常少。但当看到他的履历后，相信没有人再怀疑他是个“天才”。西蒙出生于1916年6月15日，是个美国人，他的名字全称为赫伯特·亚历山大·西蒙，在2001年2月9日与世长辞，在这84年的岁月中，西蒙以27岁时取得的政治学博士学位为开端，先后步入了政治学、管理学、认知心理学、信息科学、人工智能、科学哲学、应用数学、统计学、运筹学、控制论、数理经济学、公共管理等领域，在这些
软件测试/测试开发/全日制 |利用Django REST framework构建微服务霍格沃兹-慕漓 django 微服务 sqlite
霍格沃兹测试开发学社推出了《Python全栈开发与自动化测试班》。本课程面向开发人员、测试人员与运维人员，课程内容涵盖Python编程语言、人工智能应用、数据分析、自动化办公、平台开发、UI自动化测试、接口测试、性能测试等方向。为大家提供更全面、更深入、更系统化的学习体验，课程还增加了名企私教服务内容，不仅有名企经理为你1v1辅导，还有行业专家进行技术指导，针对性地解决学习、工作中遇到的难题。让找
cmd泛滥_与您的后泛滥同事见面：人工智能机器人 weixin_26644585 人工智能 leetcode
cmd泛滥Readytoswapyouroldcube-mateforadisembodiedAI?IPsoftCEOChetanDube,creatorofAIco-workerAMELIA,giveshistakeonthepost-COVIDofficelandscape.准备将您的旧立方体伙伴换成无形的AI？AIsoft同事AMELIA的创始人IPsoft首席执行官ChetanDube阐述
jQuery 跨域访问的三种方式 No 'Access-Control-Allow-Origin' header is present on the reque qiaolevip 每天进步一点点学习永无止境跨域众观千象
XMLHttpRequest cannot load http://v.xxx.com. No 'Access-Control-Allow-Origin' header is present on the requested resource. Origin 'http://localhost:63342' is therefore not allowed access. test.html:1
mysql 分区查询优化 annan211 java 分区优化 mysql
分区查询优化引入分区可以给查询带来一定的优势，但同时也会引入一些bug. 分区最大的优点就是优化器可以根据分区函数来过滤掉一些分区，通过分区过滤可以让查询扫描更少的数据。所以，对于访问分区表来说，很重要的一点是要在where 条件中带入分区，让优化器过滤掉无需访问的分区。可以通过查看explain执行计划，是否携带 partitions
MYSQL存储过程中使用游标 chicony Mysql存储过程
DELIMITER $$ DROP PROCEDURE IF EXISTS getUserInfo $$ CREATE PROCEDURE getUserInfo(in date_day datetime)-- -- 实例-- 存储过程名为：getUserInfo-- 参数为：date_day日期格式:2008-03-08-- BEGINdecla
mysql 和 sqlite 区别 Array_06 sqlite
转载： http://www.cnblogs.com/ygm900/p/3460663.html mysql 和 sqlite 区别 SQLITE是单机数据库。功能简约，小型化，追求最大磁盘效率 MYSQL是完善的服务器数据库。功能全面，综合化，追求最大并发效率 MYSQL、Sybase、Oracle等这些都是试用于服务器数据量大功能多需要安装，例如网站访问量比较大的。而sq
pinyin4j使用 oloz pinyin4j
首先需要pinyin4j的jar包支持；jar包已上传至附件内方法一:把汉字转换为拼音；例如：编程转换后则为biancheng /** * 将汉字转换为全拼 * @param src 你的需要转换的汉字 * @param isUPPERCASE 是否转换为大写的拼音； true:转换为大写；fal
微博发送私信随意而生微博
在前面文章中说了如和获取登陆时候所需要的cookie，现在只要拿到最后登陆所需要的cookie，然后抓包分析一下微博私信发送界面 http://weibo.com/message/history?uid=****&name=**** 可以发现其发送提交的Post请求和其中的数据，让后用程序模拟发送POST请求中的数据，带着cookie发送到私信的接入口，就可以实现发私信的功能了。
jsp 香水浓 jsp
JSP初始化容器载入JSP文件后，它会在为请求提供任何服务前调用jspInit()方法。如果您需要执行自定义的JSP初始化任务，复写jspInit()方法就行了 JSP执行这一阶段描述了JSP生命周期中一切与请求相关的交互行为，直到被销毁。当JSP网页完成初始化后
在 Windows 上安装 SVN Subversion 服务端 AdyZhang SVN
在 Windows 上安装 SVN Subversion 服务端2009-09-16高宏伟哈尔滨市道里区通达街291号最佳阅读效果请访问原地址：http://blog.donews.com/dukejoe/archive/2009/09/16/1560917.aspx 现在的Subversion已经足够稳定，而且已经进入了它的黄金时段。我们看到大量的项目都在使
android开发中如何使用 alertDialog从listView中删除数据？ aijuans android
我现在使用listView展示了很多的配置信息，我现在想在点击其中一条的时候填出 alertDialog,点击确认后就删除该条数据，（ ArrayAdapter ，ArrayList，listView 全部删除），我知道在下面的onItemLongClick 方法中参数 arg2 是选中的序号，但是我不知道如何继续处理下去 1 2 3
jdk-6u26-linux-x64.bin 安装 baalwolf linux
1.上传安装文件(jdk-6u26-linux-x64.bin) 2.修改权限 [root@localhost ~]# ls -l /usr/local/jdk-6u26-linux-x64.bin 3.执行安装文件 [root@localhost ~]# cd /usr/local [root@localhost local]# ./jdk-6u26-linux-x64.bin&nbs
MongoDB经典面试题集锦 BigBird2012 mongodb
1.什么是NoSQL数据库？NoSQL和RDBMS有什么区别？在哪些情况下使用和不使用NoSQL数据库？ NoSQL是非关系型数据库，NoSQL = Not Only SQL。关系型数据库采用的结构化的数据，NoSQL采用的是键值对的方式存储数据。在处理非结构化/半结构化的大数据时；在水平方向上进行扩展时；随时应对动态增加的数据项时可以优先考虑使用NoSQL数据库。在考虑数据库的成熟
JavaScript异步编程Promise模式的6个特性 bijian1013 JavaScript Promise
Promise是一个非常有价值的构造器，能够帮助你避免使用镶套匿名方法，而使用更具有可读性的方式组装异步代码。这里我们将介绍6个最简单的特性。在我们开始正式介绍之前，我们想看看Javascript Promise的样子： var p = new Promise(function(r
[Zookeeper学习笔记之八]Zookeeper源代码分析之Zookeeper.ZKWatchManager bit1129 zookeeper
ClientWatchManager接口 //接口的唯一方法materialize用于确定那些Watcher需要被通知 //确定Watcher需要三方面的因素1.事件状态 2.事件类型 3.znode的path public interface ClientWatchManager { /** * Return a set of watchers that should
【Scala十五】Scala核心九：隐式转换之二 bit1129 scala
隐式转换存在的必要性，在Java Swing中，按钮点击事件的处理，转换为Scala的的写法如下： val button = new JButton button.addActionListener( new ActionListener { def actionPerformed(event: ActionEvent) {
Android JSON数据的解析与封装小Demo ronin47
转自：http://www.open-open.com/lib/view/open1420529336406.html package com.example.jsondemo; import org.json.JSONArray; import org.json.JSONException; import org.json.JSONObject; impor
[设计]字体创意设计方法谈 brotherlamp UI ui自学 ui视频 ui教程 ui资料
从古至今，文字在我们的生活中是必不可少的事物，我们不能想象没有文字的世界将会是怎样。在平面设计中，UI设计师在文字上所花的心思和功夫最多，因为文字能直观地表达UI设计师所的意念。在文字上的创造设计，直接反映出平面作品的主题。如设计一幅戴尔笔记本电脑的广告海报，假设海报上没有出现“戴尔”两个文字，即使放上所有戴尔笔记本电脑的图片都不能让人们得知这些电脑是什么品牌。只要写上“戴尔笔
单调队列-用一个长度为k的窗在整数数列上移动，求窗里面所包含的数的最大值 bylijinnan java 算法面试题
import java.util.LinkedList; /* 单调队列滑动窗口单调队列是这样的一个队列：队列里面的元素是有序的，是递增或者递减题目：给定一个长度为N的整数数列a(i),i=0,1,...,N-1和窗长度k. 要求：f(i) = max{a(i-k+1),a(i-k+2),..., a(i)},i = 0,1,...,N-1 问题的另一种描述就
struts2处理一个form多个submit chiangfai struts2
web应用中，为完成不同工作，一个jsp的form标签可能有多个submit。如下代码： <s:form action="submit" method="post" namespace="/my"> <s:textfield name="msg" label="叙述：">
shell查找上个月，陷阱及野路子 chenchao051 shell
date -d "-1 month" +%F 以上这段代码，假如在2012/10/31执行，结果并不会出现你预计的9月份，而是会出现八月份，原因是10月份有31天，9月份30天，所以-1 month在10月份看来要减去31天，所以直接到了8月31日这天，这不靠谱。野路子解决：假设当天日期大于15号
mysql导出数据中文乱码问题 daizj mysql 中文乱码导数据
解决mysql导入导出数据乱码问题方法：１、进入mysql，通过如下命令查看数据库编码方式： mysql> show variables like 'character_set_%'; +--------------------------+----------------------------------------+ | Variable_name&nbs
SAE部署Smarty出现：Uncaught exception 'SmartyException' with message 'unable to write dcj3sjt126com PHP smarty sae
对于SAE出现的问题：Uncaught exception 'SmartyException' with message 'unable to write file...。官方给出了详细的FAQ：http://sae.sina.com.cn/?m=faqs&catId=11#show_213 解决方案为： 01 $path
《教父》系列台词 dcj3sjt126com
Your love is also your weak point. 你的所爱同时也是你的弱点。 If anything in this life is certain, if history has taught us anything, it is that you can kill anyone. 不顾家的人永远不可能成为一个真正的男人。 &
mongodb安装与使用 dyy_gusi mongo
一.MongoDB安装和启动,widndows和linux基本相同 1.下载数据库, linux:mongodb-linux-x86_64-ubuntu1404-3.0.3.tgz 2.解压文件,并且放置到合适的位置 tar -vxf mongodb-linux-x86_64-ubun
Git排除目录 geeksun git
在Git的版本控制中，可能有些文件是不需要加入控制的，那我们在提交代码时就需要忽略这些文件，下面讲讲应该怎么给Git配置一些忽略规则。有三种方法可以忽略掉这些文件，这三种方法都能达到目的，只不过适用情景不一样。 1. 针对单一工程排除文件这种方式会让这个工程的所有修改者在克隆代码的同时，也能克隆到过滤规则，而不用自己再写一份，这就能保证所有修改者应用的都是同一
Ubuntu 创建开机自启动脚本的方法 hongtoushizi ubuntu
转载自： http://rongjih.blog.163.com/blog/static/33574461201111504843245/ Ubuntu 创建开机自启动脚本的步骤如下： 1) 将你的启动脚本复制到 /etc/init.d目录下以下假设你的脚本文件名为 test。 2) 设置脚本文件的权限 $ sudo chmod 755
第八章流量复制/AB测试/协程 jinnianshilongnian nginx lua coroutine
流量复制在实际开发中经常涉及到项目的升级，而该升级不能简单的上线就完事了，需要验证该升级是否兼容老的上线，因此可能需要并行运行两个项目一段时间进行数据比对和校验，待没问题后再进行上线。这其实就需要进行流量复制，把流量复制到其他服务器上，一种方式是使用如tcpcopy引流；另外我们还可以使用nginx的HttpLuaModule模块中的ngx.location.capture_multi进行并发
电商系统商品表设计 lkl
DROP TABLE IF EXISTS `category`; -- 类目表 /*!40101 SET @saved_cs_client = @@character_set_client */; /*!40101 SET character_set_client = utf8 */; CREATE TABLE `category` ( `id` int(11) NOT NUL
修改phpMyAdmin导入SQL文件的大小限制 pda158 sql mysql
　用phpMyAdmin导入mysql数据库时，我的10M的数据库不能导入，提示mysql数据库最大只能导入2M。　　 phpMyAdmin数据库导入出错：　　You probably tried to upload too large file. Please refer to documentation for ways to workaround this limit.
Tomcat性能调优方案 Sobfist apache jvm tomcat 应用服务器
一、操作系统调优对于操作系统优化来说，是尽可能的增大可使用的内存容量、提高CPU的频率，保证文件系统的读写速率等。经过压力测试验证，在并发连接很多的情况下，CPU的处理能力越强，系统运行速度越快。。【适用场景】任何项目。二、Java虚拟机调优应该选择SUN的JVM，在满足项目需要的前提下，尽量选用版本较高的JVM，一般来说高版本产品在速度和效率上比低版本会有改进。 J
SQLServer学习笔记 vipbooks 数据结构 xml
1、create database school 创建数据库school 2、drop database school 删除数据库school 3、use school 连接到school数据库，使其成为当前数据库 4、create table class(classID int primary key identity not null) 创建一个名为class的表，其有一