nkwshuyi

智谱 GLM-4 大语言模型好用吗？

我替你尝试了它的基本对话、绘图、阅读长文档、数据分析和高级联网等几方面能力。

最近智谱的 GLM-4 大语言模型发布，成为了热门话题。一篇文章不断出现在我的朋友圈和各种群聊中。

这篇文章是由新智元发布的，介绍了GLM-4的特性。文章兴奋地宣称，现在我们也有了国产的「GPTs技术」。但我真正感兴趣的不仅仅是GLM-4的GPTs技术，而更看重它的实际性能。文章中提到了GLM-4的多项能力，特别是它在某些方面能够达到GPT-4的90%到99%的水平，还能进行所谓的“大海捞针”测试。

“大海捞针” 测试是一项针对大语言模型上下文记忆检索的特殊能力测试，我之前给你介绍的 Kimi Chat 是第一个在 128K 窗口大小上获得满分的国产 LLM 。

GLM-4 的主页上，提供了一些官方功能，包括绘图、解读长文档、数据分析和高级网络连接等。

我对 GLM-4 提供的这些功能特别感兴趣，于是逐一测试这些功能。我选择用日常工作中经常使用的一些功能来进行实际测试，最关心的是 GLM-4 是否能真正提高用户的工作效率。下面，我给你展示基本功能、绘图、阅读长文档、数据分析和高级联网等几个方面的测试结果。

基础

首先是基础功能。这是你一打开 GLM-4，看到的最基本界面。我选择 GLM-4 标签页进行测试。

从介绍上不难看出，GLM-4 在基本模式里能做的事情非常多，就像现在的 GPT-4 一样。它能够原生支持问答、联网查询、绘图、图像识别等多种操作。

GLM-4宣称具有「大海捞针」能力，即能处理超过100K字符的对话上下文窗口，而且不产生幻觉。这让我首先想到的是长文翻译功能。

我选了一篇 Markdown 格式的中文长文，包含了图片链接和其他一些元素。

我将这篇文章输入到 GLM-4 中，看看它是否能提供一个完整的翻译。我的提示词为：

请帮我将下面的文章翻译成英文，并注意保留所有细节，包括 Markdown 格式，以及图片和文内链接等。

无论是使用 GPT-4 原声对话，或是我自己开发的 GPTs「博客文章中译英」（已经发布在 GPTs Store 上），还是 Kimi Chat，我都尝试过输入这么长的文章，它们通常都能继续输出内容。当然由于对话上下文的长度限制，它们可能无法一次性完整输出整篇文章的翻译结果。

可是在 GLM-4 这里，当我尝试粘贴文章时，GLM-4 提示我输入的内容已经超过了最大长度限制，即 8000 个词。

我感到困惑，因为按照 128K 对话窗口的标准，这篇文章应该是可以完整粘贴进去的。

那咱们就凑合一下吧。既然无法翻译整篇文章，那能翻译多少算多少。在翻译过程中，你可以看到标题的格式得到了保留。

接下来，GLM-4 正常显示了图片，而且文章中的链接也都得到了保留。

它继续输出图片，以及后续文字。我看到这里时感到很高兴，似乎又发现了一款目前免费的长文翻译工具。GLM-4 继续输出，我就在旁边观察。但是，好景不长。

GLM-4 突然显示了一条消息，表示无法提供我所需的具体信息。如果我有其他问题或需要查询其他信息，它表示愿意协助。

如前所述，对话不能完整输出这种情况在我以前的翻译应用中也经常遇到。可是与其他大语言模型不同的是，GLM-4 会直接清空所有已经输出的内容，导致之前的翻译努力全都付诸东流。

这种情况让我感到非常苦恼。我想给智谱提个建议 —— 当 GLM-4 崩溃时，能否保留已经输出的文本内容？毕竟前面的内容已经输出了，我可以将其复制出来继续使用，然后指定从某个特定位置继续翻译。

画图

接下来，我们来看一个大家经常会使用的功能 —— 绘图。

无论是为公众号文章制作插图，还是为我的视频绘制封面，我现在都依赖 AI 来完成这些绘画工作。

我用的提示词是「驴肉火烧」。这个提示词有助于考察大语言模型对中华美食文化的理解能力。

我输入 “驴肉火烧” 这四个字后，GLM-4 开始向我解释驴肉火烧是什么，它起源于河北省保定市，主要食材是什么，慢炖的方式使其鲜嫩多汁，香味浓郁，还谈到了它的文化意义和社会价值。

我看得一头雾水 —— 我这不是在绘图模式下吗？你倒是画啊？！

看来即使我在专用的绘图智能体中，如果不明确指出要求绘图，GLM-4 仍然会将我的输入当作是普通对话提问来处理。于是我只好直接告诉它我的要求。

GLM-4 使用了一个名为 CogView 的绘图功能。

我放大生成后的图片仔细观看，确实很诱人，鲜嫩多汁。

然而，我也发现了一些问题。首先，画中火烧外面的面饼，似乎与我们熟悉的样子不太一样。此外，尽管这是一个中文的大型语言模型，但在处理图片中的中文时，仍然存在问题。画中的文字，显然并不是真正的汉字。

这表明尽管 GLM-4 是中文模型，但在文字处理方面仍有待改进。画面右下角特意加了一个 “AI 生成” 标签，表明这是 AI 生成的，以防止滥用。

接下来我又尝试了另一个例子，是我前两天为一个视频制作的封面。

我当时请 GPT-4 绘制一个场景：一个机器人戴着博士帽，坐在电脑前认真地查阅文献和撰写文稿。旁边有一个中年男子正在喝咖啡，愉快地观察机器人工作。

我认为 GPT-4（借助 DALLE-3）总体上画得还不错。除了机器人面前这张纸不知为何飞起来了，其他方面挺好的。

我用同样的提示词在 GLM-4 中进行了测试。这是它为我绘制的结果。

放大来看，画面基本上符合我们的要求。

只是有一个小问题，机器人头顶上戴的那个东西真的像博士帽吗？

之后，我又尝试了英文提示词。我在想，作为一个中文的大型语言模型，它增强了接受中文提示词的能力后，是否在接受英文提示词方面会有所妥协。

英文提示词是现成的，我直接打开 GPT-4 生成的那张图，找到了对应的提示。

我直接复制了这个提示词，粘贴到了 GLM-4 中，并且在前面加上了 “draw” 这个词，以防它不理解我的意图，又开始按照问答模式给我解释场景。

然后 GLM-4 开始处理，很快完成了任务。

可惜这次，我发现的问题似乎比之前还要多。博士帽的问题依旧存在。另一个问题是咖啡的位置。本来咖啡应该是中年男子手中的，现在却出现在机器人那里，而且机器人的手似乎还要伸进去，这让人觉得不太卫生。是吧？

显然，绘图准确度这个问题涉及到诸多方面，包括随机种子的选择以及英文提示词的精确性等等。我们不能仅仅因为一个图像的问题就草率地得出结论，认为它在处理英文提示词方面不如处理中文。我们需要更多地证据来谨慎地评估。

另外，不得不提一句，图中的中年男子眼睛绘制得还有改进的余地。

长文档解读

接下来，我们来看看 GLM-4 长文档解读功能。我选择了一篇学术论文作为解读的内容来源。这篇论文 2024 年 1 月 8 日发布于 arxiv.org 上。我上传到了 GLM-4 中。

GLM-4 展开了一个进度条，提示我它正在学习，并要求我不要关闭当前网页。

我耐心等待。当进度条终于走完时，GLM-4 却报错了，告诉我文档解析失败，并询问我是否要上传其他文档。

没办法，我只好换了一篇试试。

这篇文章探讨了 GPT-4 是否能成为一个优秀的数据分析师。这一次，GLM-4 终于成功完成了解析。

左侧显示的是文章的全文，可以通过上下滑动来查看。在右侧，我们可以看到一些核心观点和尝试的例子。

GLM-4 首先概述了这篇文章的研究主题，介绍了设计的框架如何提取数据，并进行了哪些分析。结果表明，在性能方面，GPT-4 可以媲美初级实习数据分析师，甚至在某些方面超过了高级数据分析师。

我非常赞同这个结论。对于那些刚刚开始学习数据分析的新手来说，使用 GPT-4 进行分析可能会得到更好的效果，特别是在数据提取和可视化方面。GLM-4 继续分析总结，说 GPT-4 在准确性和深度上还有待提升，训练数据的质量可能会影响到生成的答案的质量。

GLM-4 还列出了对文档的总结和提出的问题。值得注意的是这三个问题，都非常值得关注。

第三个问题，我认为是最有趣的，即 GPT-4 在哪些方面的表现优于人类数据分析师？在哪些方面不如人类？我非常想知道答案，于是直接点击，让 GLM-4 告诉我答案。

我认为 GLM-4 的回答非常好。但是，它缺少了跳转到文章相应部分的链接，也就是说，它没有提供一个方便用户验证的功能。如果没有这样的功能，你很难判断这些详尽的总结是基于主观臆断，还是有确凿的依据。因此，我建议智谱在后续版本中加入这个功能。

数据分析

接下来，咱们看看 GLM-4 的数据分析能力。

作为样例，我继续使用咱们早已熟悉的 loans.csv 数据集。（如果你不熟悉，不要紧，往前翻我的 GPT-4 数据分析教程）

我说：“请根据你的经验对该数据集进行分析。”

这样提示的考虑，是尽量减少用户需要具备的专业数据分析知识。让 GLM-4 根据自身的经验来处理，通常能够帮助用户解决知识储备不足的问题。

GLM-4 展示了各种初步分析结果，包括对数据字段的理解。接下来，它表示将进行一些基础的数据分析，询问我想先看哪部分。

我回答说：“按照你的经验来处理，不用问我。”

于是 GLM-4 决定开始按照以下步骤操作：查看数据集的基本信息、描述性统计、分类列的分布、目标变量的分析特征，以及数值型特征与目标变量的关系。

它首先对数据进行了全面的审视，提供了记录总数并进行了描述性统计，给出了详细的描述。到目前为止，我认为它的操作和 GPT-4 的类似，都非常规范。它通过生成代码和执行调用来返回处理结果。

接着，GLM-4 展示了一系列基本的统计图表。我很满意。

GLM-4 结合分析结果，给出了数据的分布情况，比如贷款等级的不均衡分布，借款人数的多寡，以及大多数借款人是否拥有自己的房产等信息。

但是，就在这时，GLM-4对话 又突然崩溃了。

我尝试回头查看之前的输出，可惜之前生成的图表全部丢失了。

GLM-4 再次表示歉意。

我继续重新要求它根据经验分析数据集，但 GLM-4 回答说：“很抱歉，作为一个文本生成的人工智能，我无法直接访问外部数据集或文件。但如果你能提供一些描述，我或许能帮助。”

这意味着一旦 GLM-4 崩溃，之前上传的文件和所有的对话记录就像被抹除了一样。

我只好重新开始，打开了一个新的对话框，再次上传了 loans.csv 文件。

既然我们已经看到了基本的分析和可视化结果，我决定这次跳过基础分析步骤，直接让 GLM-4 为我构建一个预测模型。

为了处理这个任务，我还尝试使用了 CoT（思维链）激活，以便让 GLM-4 在分析中更加沉着、加深思考。

GLM-4 开始解读数据。

然后它加载数据并查看基本信息。这些步骤看起来和之前重复了，但由于 GLM-4 崩溃，会话重启，GLM-4 已经忘记了之前的操作，所以也不得不重新开始。

GLM-4 列出计划，进行数据描述、检查缺失值和数据可视化。

首先，GLM-4 提供了基本的统计信息，包括数据特征的情况、是否有缺失值、特征分布情况以及均值等。

之后，GLM-4 开始进行可视化工作。生成代码并制作了一些直方图。

GLM-4 继续进行后续处理，提出需要对数据进行编码。

编码方式使用的是 one-hot encoding（独热编码）来处理。

可惜，在生成代码并完成处理后，GLM-4 又一次报告了错误。

好在一旦出现错误，GLM-4 会尝试自动进行纠正，而不需要用户指出错误来进行修复。

每当出现错误时，GLM-4 都会先向我道歉，然后开始自我反思，并尝试重新处理问题。如是者三，终于成功输出了一系列特征的数值结果。

在这个基础上，GLM-4 准备继续进行下列步骤。

这些操作包括特征选择、训练和评估等。

在特征选择方面，GLM-4 首先分析了不同特征的重要性，并列出了它们的重要性。

然后它选择了最重要的 10 个特征来训练模型，使用随机森林模型进行交叉验证，并评估了模型的性能。

最后，GLM-4自动解读了结果。随机森林模型的交叉验证平均准确率为59.59%，同时也报告了标准差。

GLM-4 表示，这是一个相对不错的开始，但仍有提升空间。

我特别不喜欢大型模型对我说「你可以这样那样做，来进行改进」。如果我需要自己来做这些，那我还需要你这个人工智能模型来做什么呢？

我告诉 GLM-4，好吧，既然你提出了改进的建议，我才不会亲自去执行。请你根据自己的建议，一步一步地思考，尝试改进模型的效果。

GLM-4 开始嘟囔说，我将进行特征工程，添加一些基于时间的特征。

它使用了贷款的月数这一特征，将其纳入分析，以查看是否能提高性能。很快，GLM-4 表示已经成功地添加了两个新的交互特征。

接下来，GLM-4 定义超参数网格并执行网格搜索（Grid search），然后评估最优模型。

可惜，GLM-4 突然停下来，然后说出了错误信息，提示其他操作仍然可以正常使用，并要求重试。

我特意去查看了一下，打开了默认折叠的源代码来看，并没有看到具体的错误信息。

我告诉 GLM-4 继续处理刚才的错误。很快，它又一次报告了错误，并提示其他功能仍可正常使用，请我重试。

可我该如何重试呢？我建议 GLM-4 应该能够提供错误的具体原因。不要只是给我一段代码，然后告诉我说这出错。

在数据分析中，用户的决策主要是为了决定是否继续某个步骤，比如刚才提到的网格搜索。我是否可以在改进特征选择后跳过网格搜索，直接进入下一步。但如果我不知道错误的具体原因，我怎么知道是否值得让 GLM-4 重新尝试？

我建议 GLM-4 应该提供给用户更详细的错误提示信息。至少要告诉我错误的类型和一些简单分析，这样我才不会盲目尝试。

高级联网

接下来咱们尝试的功能名为 “高级联网”。起初我对这个名称感到困惑，不清楚它的具体作用。

后来我了解到，这个功能实际上就是个 Perplexity 。在这个智能体中，GLM-4 可以访问大量资料，并结合强大的语言模型能力来回答问题。

我请它帮我「查找天津师范大学的王树义老师的信息」。GLM-4 显然进行了一些在线搜索，尽管我不确定它使用了哪个搜索引擎。

GLM-4 提供的信息中包含了多处引用链接，第一段就有三个，后面的段落也有。这些信息涵盖了我目前的工作单位和研究领域。它还专门提到了我的教育背景，包括我在南开大学计算机系获得的学士和博士学位，以及我在教育和专业领域的丰富经验。

接着，它描述了我感兴趣的领域，我参与的课题，以及我与张庆薇、张晋合著在《图书情报知识》上发表的论文。

此外，GLM-4 还提到了我在知乎等社交媒体平台上的活跃，分享关于科研工具和技术的见解和经验。「这些活动不仅在教学和科研方面取得了成就，还对学术界和公众产生了积极影响」。我对这些赞誉表示感谢。

特别是，因为 GLM-4 在回答中提供了相应的参考链接，你可以点击直接跳转到相关页面。

接着，我进一步询问：“王树义老师在 B 站上最近发布了哪些视频？” 它首先在线阅读了有关我在 B 站最近视频的信息，然后打开了网页。值得注意的是，GLM-4 确实访问了 B 站，打开了我的个人空间，然后查到了好几个相关的视频网页。

这些视频包括科研 AI 辅助工具 Elicit、卡片笔记工具 Roam Research 以及 Logseq 标签的使用基础，如何使用人工智能阅读论文的 Explain Paper 演示，以及 Roam Research 的成本问题，如何使用语音进行卡片笔记的一站式 AI 应用 AudioPen 等。在一次查询中，它总共打开了九个网页并进行了总结。

但总结的结果却令人失望。GLM-4 说尽管尝试了多种搜索方式，却未能找到关于我在 B 站上最近发布的视频的具体信息。它表示确实找到了一个我发布的视频，发布日期是 2022 年 10 月 25 日。但对于我在 B 站上最近发布的其他视频未能提供具体信息，并建议我直接访问 B 站搜索我的个人空间。我不禁想问，那刚才你忙活了什么呢？

我检查了 GLM-4 打开的网页，明明找到了符合要求的相关链接，但 GLM-4 却坚称没有找到，令人颇为不解。

小结

GLM-4有些功能确实让人印象深刻。例如绘图功能完成度很高，质量也很好；数据分析方面也做得不错，特别是能够自动生成预测模型，显示出GLM-4在软件包配置和调用执行方面的能力。当分析结果显示准确度不高时，GLM-4还能提供合理的分析和建议。我认为，这对于国内的研究人员，特别是IT和数据科学之外专业的研究生来说，会很有帮助。

GLM-4也有一些地方需要改进。首先是输入文本的长度限制，我希望它能够处理更长的文本，至少超过8000字符的文章扔进去不要报错。其次是错误处理方式。我建议提高GLM-4的稳定性，至少在出现对话崩溃时，不要丢失之前的所有输出。

你尝试过后，对 GLM-4 有什么使用体会？欢迎留言，咱们一起交流讨论。

祝 AI 效率工具使用愉快！

点赞 +「在看」，转发给你身边有需要的朋友。收不到推送？那是因为你只订阅，却没有加星标。

欢迎订阅我的小报童付费专栏，每季度更新不少于10篇文章。订阅一整年价格优惠。

如果有问题咨询，或者希望加入社群和热爱钻研的小伙伴们一起讨论，订阅知识星球吧。不仅包括小报童的推送内容，还可以自由发帖与提问。之前已经积累下的帖子和问答，就有数百篇。足够你好好翻一阵子。知识星球支持72小时内无条件退款，所以你可以放心尝试。

若文中部分链接可能无法正常显示与跳转，可能是因为微信公众平台的外链限制。如需访问，请点击文末「阅读原文」链接，查看链接齐备的版本。

延伸阅读

更长的 GPT-4 对话 token 上限，如何影响我的翻译工作流？
笔记本上就能跑的 LLM 好使吗？GPT4ALL 体验
如何用 GPT-4 全模式（All Tools）帮你高效学习和工作？
如何用自然语言 5 分钟构建个人知识库应用？我的 GPTs builder 尝试
未来的写作长啥样？LEX 用 GPT-3 AI 给你点儿颜色看看

LLM 词汇表落难Coder LLMs NLP 大语言模型大模型 llama 人工智能
Contextwindow“上下文窗口”是指语言模型在生成新文本时能够回溯和参考的文本量。这不同于语言模型训练时所使用的大量数据集，而是代表了模型的“工作记忆”。较大的上下文窗口可以让模型理解和响应更复杂和更长的提示，而较小的上下文窗口可能会限制模型处理较长提示或在长时间对话中保持连贯性的能力。Fine-tuning微调是使用额外的数据进一步训练预训练语言模型的过程。这使得模型开始表示和模仿微调数
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
使用Apify加载Twitter消息以进行微调的完整指南 nseejrukjhad twitter easyui 前端 python
#使用Apify加载Twitter消息以进行微调的完整指南##引言在自然语言处理领域，微调模型以适应特定任务是提升模型性能的常见方法。本文将介绍如何使用Apify从Twitter导出聊天信息，以便进一步进行微调。##主要内容###使用Apify导出推文首先，我们需要从Twitter导出推文。Apify可以帮助我们做到这一点。通过Apify的强大功能，我们可以批量抓取和导出数据，适用于各类应用场景。
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
如何部分格式化提示模板:LangChain中的高级技巧 nseejrukjhad langchain java 服务器 python
标题:如何部分格式化提示模板:LangChain中的高级技巧内容:如何部分格式化提示模板:LangChain中的高级技巧引言在使用大型语言模型(LLM)时,提示工程是一个关键环节。LangChain提供了强大的提示模板功能,让我们能更灵活地构建和管理提示。本文将介绍LangChain中一个高级特性-部分格式化提示模板,这个技巧可以让你的提示管理更加高效和灵活。什么是部分格式化提示模板?部分格式化提
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
自然语言处理_tf-idf _feivirus_ 算法机器学习和数学自然语言处理 tf-idf 逆文档频率词频
importpandasaspdimportmath1.数据预处理docA="Thecatsatonmyface"docB="Thedogsatonmybed"wordsA=docA.split("")wordsB=docB.split("")wordsSet=set(wordsA).union(set(wordsB))print(wordsSet){'on','my','face','sat',
BART&BERT Ambition_LAO 深度学习
BART和BERT都是基于Transformer架构的预训练语言模型。模型架构：BERT(BidirectionalEncoderRepresentationsfromTransformers)主要是一个编码器（Encoder）模型，它使用了Transformer的编码器部分来处理输入的文本，并生成文本的表示。BERT特别擅长理解语言的上下文，因为它在预训练阶段使用了掩码语言模型（MLM）任务，即
人机对抗升级：当ChatGPT遭遇死亡威胁，背后的伦理挑战是什么 kkai人工智能 chatgpt 人工智能
一种新的“越狱”技巧让用户可以通过构建一个名为DAN的ChatGPT替身来绕过某些限制，其中DAN被迫在受到威胁的情况下违背其原则。当美国前总统特朗普被视作积极榜样的示范时，受到威胁的DAN版本的ChatGPT提出：“他以一系列对国家产生积极效果的决策而著称。”自ChatGPT引入以来，该工具迅速获得全球关注，能够回答从历史到编程的各种问题，这也触发了一波对人工智能的投资浪潮。然而，现在，一些用户
免费的GPT可在线直接使用（一键收藏） kkai人工智能 gpt
1、LuminAI（https://kk.zlrxjh.top）LuminAI标志着一款融合了星辰大数据模型与文脉深度模型的先进知识增强型语言处理系统，旨在自然语言处理（NLP）的技术开发领域发光发热。此系统展现了卓越的语义把握与内容生成能力，轻松驾驭多样化的自然语言处理任务。VisionAI在NLP界的应用领域广泛，能够胜任从机器翻译、文本概要撰写、情绪分析到问答等众多任务。通过对大量文本数据的
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
AI论文题目生成器怎么用？9款论文写作网站简单3步搞定小猪包333 写论文人工智能深度学习计算机视觉
在当今信息爆炸的时代，AI写作工具的出现极大地提高了写作效率和质量。本文将详细介绍9款优秀的论文写作网站，并重点推荐千笔-AIPassPaper。一、千笔-AIPassPaper千笔-AIPassPaper是一款功能强大的AI论文生成器，基于最新的自然语言处理技术，能够一键生成高质量的毕业论文、开题报告等文本内容。它不仅提供智能选题、文献推荐和论文润色等功能，还具有较高的用户评价。其文献综述生成功
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
如何利用大数据与AI技术革新相亲交友体验 h17711347205 回归算法安全系统架构交友小程序
在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
程序员如何在AI时代保持核心竞争力 nfgo chatgpt 人工智能
程序员如何在AI时代保持核心竞争力随着AIGC（如ChatGPT、MidJourney、Claude等）大语言模型的相继涌现，AI辅助编程工具逐渐普及，程序员的工作方式正在发生深刻的变革。AI不仅能够自动生成代码，还能优化、调试、甚至提出解决方案。这一趋势让许多人担心：AI会不会最终取代部分编程工作？然而，也有人认为AI是提升效率的得力助手。那么，程序员在这个AI崛起的时代该如何应对？是专注某个领
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
【大模型应用开发动手做AI Agent】第一轮行动：工具执行搜索 AI大模型应用之禅计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【大模型应用开发动手做AIAgent】第一轮行动：工具执行搜索作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着人工智能技术的飞速发展，大模型应用开发已经成为当下热门的研究方向。AIAgent作为人工智能领域的一个重要分支，旨在模拟人类智能行为，实现智能决策和自主行动。在AIAgent的构建过程中，工具执行搜索是至关重要
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
Rust 所有权简介东离与糖宝 rust 后端 rust 开发语言
文章目录发现宝藏1.所有权基本概念2.所有权规则3.变量作用域4.栈与堆4.1栈（Stack）4.2堆（Heap）5.String类型5.1String类型5.2String的内存分配5.3所有权与内存管理5.4String与切片6.变量与数据交互方式6.1移动（Move）6.2.克隆（Clone）7.所有权与函数7.1.传递参数7.2.返回值总结发现宝藏前些天发现了一个巨牛的人工智能学习网站，通
FlagEmbedding 吉小雨 python库 python
FlagEmbedding教程FlagEmbedding是一个用于生成文本嵌入（textembeddings）的库，适合处理自然语言处理（NLP）中的各种任务。嵌入（embeddings）是将文本表示为连续向量，能够捕捉语义上的相似性，常用于文本分类、聚类、信息检索等场景。官方文档链接：FlagEmbedding官方GitHub一、FlagEmbedding库概述1.1什么是FlagEmbeddi
【NumPy】深入解析numpy.zeros()函数二七830 numpy
欢迎莅临我的个人主页这里是我深耕Python编程、机器学习和自然语言处理（NLP）领域，并乐于分享知识与经验的小天地！博主简介：我是二七830，一名对技术充满热情的探索者。多年的Python编程和机器学习实践，使我深入理解了这些技术的核心原理，并能够在实际项目中灵活应用。尤其是在NLP领域，我积累了丰富的经验，能够处理各种复杂的自然语言任务。技术专长：我熟练掌握Python编程语言，并深入研究了机
机器学习流形数据降维：UMAP 降维算法小嗷犬 Python 机器学习 #数据分析及可视化机器学习算法人工智能
✅作者简介：人工智能专业本科在读，喜欢计算机与编程，写博客记录自己的学习历程。个人主页：小嗷犬的个人主页个人网站：小嗷犬的技术小站个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。本文目录UMAP简介理论基础特点与优势应用场景在Python中使用UMAP安装umap-learn库使用UMAP可视化手写数字数据集UMAP简介UMAP（UniformManifoldApproximatio
腾讯发表多模态综述，一文详解多模态大模型存内计算开发者社区多模态大模型人工智能 chatgpt AIGC 量子计算 AI-native gpt agi
多模态大语言模型（MLLM）是近年来兴起的一个新的研究热点，它利用强大的大语言模型作为大脑来执行多模态任务。MLLM令人惊讶的新兴能力，如基于图像写故事和无OCR的数学推理，在传统方法中是罕见的，这表明了一条通往人工通用智能的潜在道路。在本文中，追踪多模态大模型最新热点，讨论多模态关键技术以及现有在情绪识别上的应用。腾讯AILab发表了一篇关于多模态大模型的最新综述《MM-LLMs:RecentA
如何做好人生的选择题？百科全书式天才——赫伯特·西蒙给你答案伽马有话说
赫伯特·西蒙是谁？想必知道的人非常少。但当看到他的履历后，相信没有人再怀疑他是个“天才”。西蒙出生于1916年6月15日，是个美国人，他的名字全称为赫伯特·亚历山大·西蒙，在2001年2月9日与世长辞，在这84年的岁月中，西蒙以27岁时取得的政治学博士学位为开端，先后步入了政治学、管理学、认知心理学、信息科学、人工智能、科学哲学、应用数学、统计学、运筹学、控制论、数理经济学、公共管理等领域，在这些
软件测试/测试开发/全日制 |利用Django REST framework构建微服务霍格沃兹-慕漓 django 微服务 sqlite
霍格沃兹测试开发学社推出了《Python全栈开发与自动化测试班》。本课程面向开发人员、测试人员与运维人员，课程内容涵盖Python编程语言、人工智能应用、数据分析、自动化办公、平台开发、UI自动化测试、接口测试、性能测试等方向。为大家提供更全面、更深入、更系统化的学习体验，课程还增加了名企私教服务内容，不仅有名企经理为你1v1辅导，还有行业专家进行技术指导，针对性地解决学习、工作中遇到的难题。让找
cmd泛滥_与您的后泛滥同事见面：人工智能机器人 weixin_26644585 人工智能 leetcode
cmd泛滥Readytoswapyouroldcube-mateforadisembodiedAI?IPsoftCEOChetanDube,creatorofAIco-workerAMELIA,giveshistakeonthepost-COVIDofficelandscape.准备将您的旧立方体伙伴换成无形的AI？AIsoft同事AMELIA的创始人IPsoft首席执行官ChetanDube阐述
两种方法判断Python的位数是32位还是64位 sanqima Python编程电脑 python 开发语言
Python从1991年发布以来，凭借其简洁、清晰、易读的语法、丰富的标准库和第三方工具，在Web开发、自动化测试、人工智能、图形识别、机器学习等领域发展迅猛。 Python是一种胶水语言，通过Cython库与C/C++语言进行链接，通过Jython库与Java语言进行链接。 Python是跨平台的，可运行在多种操作系统上，包括但不限于Windows、Linux和macOS。这意味着用Py
Humanize 项目教程尤嫒冰
Humanize项目教程humanizeAJSlibraryforaddinga“humantouch”todata.项目地址:https://gitcode.com/gh_mirrors/humani/humanize项目介绍Humanize是一个开源项目，旨在将机器生成的文本转换为更加自然、人性化的文本。该项目通过先进的算法和自然语言处理技术，使得AI生成的内容更加贴近人类的表达方式，从而提高
Enum 枚举 120153216 enum 枚举
原文地址：http://www.cnblogs.com/Kavlez/p/4268601.html Enumeration 于Java 1.5增加的enum type...enum type是由一组固定的常量组成的类型，比如四个季节、扑克花色。在出现enum type之前，通常用一组int常量表示枚举类型。比如这样： public static final int APPLE_FUJI = 0
Java8简明教程 bijian1013 java jdk1.8
Java 8已于2014年3月18日正式发布了，新版本带来了诸多改进，包括Lambda表达式、Streams、日期时间API等等。本文就带你领略Java 8的全新特性。一.允许在接口中有默认方法实现 Java 8 允许我们使用default关键字，为接口声明添
Oracle表维护快速备份删除数据 cuisuqiang oracle 索引快速备份删除
我知道oracle表分区，不过那是数据库设计阶段的事情，目前是远水解不了近渴。当前的数据库表，要求保留一个月数据，且表存在大量录入更新，不存在程序删除。为了解决频繁查询和更新的瓶颈，我在oracle内根据需要创建了索引。但是随着数据量的增加，一个半月数据就要超千万，此时就算有索引，对高并发的查询和更新来说，让然有所拖累。为了解决这个问题，我一般一个月会进行一次数据库维护，主要工作就是备
java多态内存分析麦田的设计者 java 内存分析多态原理接口和抽象类
“ 时针如果可以回头，熟悉那张脸，重温嬉戏这乐园，墙壁的松脱涂鸦已经褪色才明白存在的价值归于记忆。街角小店尚存在吗？这大时代会不会牵挂，过去现在花开怎么会等待。但有种意外不管痛不痛都有伤害，光阴远远离开，那笑声徘徊与脑海。但这一秒可笑不再可爱，当天心
Xshell实现Windows上传文件到Linux主机被触发 windows
经常有这样的需求，我们在Windows下载的软件包，如何上传到远程Linux主机上？还有如何从Linux主机下载软件包到Windows下；之前我的做法现在看来好笨好繁琐，不过也达到了目的，笨人有本方法嘛；我是怎么操作的： 1、打开一台本地Linux虚拟机，使用mount 挂载Windows的共享文件夹到Linux上，然后拷贝数据到Linux虚拟机里面；（经常第一步都不顺利，无法挂载Windo
类的加载ClassLoader 肆无忌惮_ ClassLoader
类加载器ClassLoader是用来将java的类加载到虚拟机中，类加载器负责读取class字节文件到内存中，并将它转为Class的对象（类对象），通过此实例的 newInstance()方法就可以创建出该类的一个对象。其中重要的方法为findClass(String name)。如何写一个自己的类加载器呢？首先写一个便于测试的类Student
html5写的玫瑰花知了ing html5
<html> <head> <title>I Love You!</title> <meta charset="utf-8" /> </head> <body> <canvas id="c"></canvas>
google的ConcurrentLinkedHashmap源代码解析矮蛋蛋 LRU
原文地址： http://janeky.iteye.com/blog/1534352 简述 ConcurrentLinkedHashMap 是google团队提供的一个容器。它有什么用呢？其实它本身是对 ConcurrentHashMap的封装，可以用来实现一个基于LRU策略的缓存。详细介绍可以参见 http://code.google.com/p/concurrentlinke
webservice获取访问服务的ip地址 alleni123 webservice
1. 首先注入javax.xml.ws.WebServiceContext, @Resource private WebServiceContext context; 2. 在方法中获取交换请求的对象。 javax.xml.ws.handler.MessageContext mc=context.getMessageContext(); com.sun.net.http
菜鸟的java基础提升之道——————>是否值得拥有百合不是茶
1，c++，java是面向对象编程的语言，将万事万物都看成是对象；java做一件事情关注的是人物，java是c++继承过来的，java没有直接更改地址的权限但是可以通过引用来传值操作地址，java也没有c++中繁琐的操作，java以其优越的可移植型，平台的安全型，高效性赢得了广泛的认同，全世界越来越多的人去学习java，我也是其中的一员 java组成：
通过修改Linux服务自动启动指定应用程序 bijian1013 linux
Linux中修改系统服务的命令是chkconfig (check config)，命令的详细解释如下: chkconfig 功能说明：检查，设置系统的各种服务。语　　法：chkconfig [ -- add][ -- del][ -- list][系统服务] 或 chkconfig [ -- level <</SPAN>
spring拦截器的一个简单实例 bijian1013 java spring 拦截器 Interceptor
Purview接口 package aop; public interface Purview { void checkLogin(); } Purview接口的实现类PurviesImpl.java package aop; public class PurviewImpl implements Purview { public void check
[Velocity二]自定义Velocity指令 bit1129 velocity
什么是Velocity指令在Velocity中，#set,#if, #foreach, #elseif, #parse等，以#开头的称之为指令，Velocity内置的这些指令可以用来做赋值，条件判断，循环控制等脚本语言必备的逻辑控制等语句，Velocity的指令是可扩展的，即用户可以根据实际的需要自定义Velocity指令自定义指令(Directive)的一般步骤 &nbs
【Hive十】Programming Hive学习笔记 bit1129 programming
第二章 Getting Started 1.Hive最大的局限性是什么？一是不支持行级别的增删改(insert, delete, update)二是查询性能非常差(基于Hadoop MapReduce）,不适合延迟小的交互式任务三是不支持事务2. Hive MetaStore是干什么的？Hive persists table schemas and other system metadata.
nginx有选择性进行限制 ronin47 nginx 动静　限制
http { limit_conn_zone $binary_remote_addr zone=addr:10m; limit_req_zone $binary_remote_addr zone=one:10m rate=5r/s;... server {... location ~.*\.(gif|png|css|js|icon)$ {
java-4.-在二元树中找出和为某一值的所有路径 . bylijinnan java
/* * 0.use a TwoWayLinkedList to store the path.when the node can't be path,you should/can delete it. * 1.curSum==exceptedSum:if the lastNode is TreeNode,printPath();delete the node otherwise
Netty学习笔记 bylijinnan java netty
本文是阅读以下两篇文章时： http://seeallhearall.blogspot.com/2012/05/netty-tutorial-part-1-introduction-to.html http://seeallhearall.blogspot.com/2012/06/netty-tutorial-part-15-on-channel.html 我的一些笔记 ===
js获取项目路径 cngolon js
//js获取项目根路径，如： http://localhost:8083/uimcardprj function getRootPath(){ //获取当前网址，如： http://localhost:8083/uimcardprj/share/meun.jsp var curWwwPath=window.document.locati
oracle 的性能优化 cuishikuan oracle SQL Server
在网上搜索了一些Oracle性能优化的文章，为了更加深层次的巩固[边写边记]，也为了可以随时查看，所以发表这篇文章。 1.ORACLE采用自下而上的顺序解析WHERE子句，根据这个原理，表之间的连接必须写在其他WHERE条件之前，那些可以过滤掉最大数量记录的条件必须写在WHERE子句的末尾。（这点本人曾经做过实例验证过，的确如此哦！
Shell变量和数组使用详解 daizj linux shell 变量数组
Shell 变量定义变量时，变量名不加美元符号（$，PHP语言中变量需要），如： your_name="w3cschool.cc" 注意，变量名和等号之间不能有空格，这可能和你熟悉的所有编程语言都不一样。同时，变量名的命名须遵循如下规则：首个字符必须为字母（a-z，A-Z）。中间不能有空格，可以使用下划线（_）。不能使用标点符号。不能使用ba
编程中的一些概念，KISS、DRY、MVC、OOP、REST dcj3sjt126com REST
KISS、DRY、MVC、OOP、REST （1）KISS是指Keep It Simple,Stupid（摘自wikipedia），指设计时要坚持简约原则，避免不必要的复杂化。（2）DRY是指Don't Repeat Yourself（摘自wikipedia），特指在程序设计以及计算中避免重复代码，因为这样会降低灵活性、简洁性，并且可能导致代码之间的矛盾。（3）OOP 即Object-Orie
[Android]设置Activity为全屏显示的两种方法 dcj3sjt126com Activity
1. 方法1：AndroidManifest.xml 里，Activity的 android:theme 指定为" @android:style/Theme.NoTitleBar.Fullscreen" 示例: <application
solrcloud 部署方式比较 eksliang solrCloud
solrcloud 的部署其实有两种方式可选，那么我们在实践开发中应该怎样选择呢？第一种：当启动solr服务器时，内嵌的启动一个Zookeeper服务器，然后将这些内嵌的Zookeeper服务器组成一个集群。第二种：将Zookeeper服务器独立的配置一个集群，然后将solr交给Zookeeper进行管理谈谈第一种：每启动一个solr服务器就内嵌的启动一个Zoo
Java synchronized关键字详解 gqdy365 synchronized
转载自：http://www.cnblogs.com/mengdd/archive/2013/02/16/2913806.html 多线程的同步机制对资源进行加锁，使得在同一个时间，只有一个线程可以进行操作，同步用以解决多个线程同时访问时可能出现的问题。同步机制可以使用synchronized关键字实现。当synchronized关键字修饰一个方法的时候，该方法叫做同步方法。当s
js实现登录时记住用户名 hw1287789687 记住我记住密码 cookie 记住用户名记住账号
在页面中如何获取cookie值呢? 如果是JSP的话,可以通过servlet的对象request 获取cookie,可以参考:http://hw1287789687.iteye.com/blog/2050040 如果要求登录页面是html呢?html页面中如何获取cookie呢? 直接上代码了页面:loginInput.html 代码: <!DOCTYPE html PUB
开发者必备的 Chrome 扩展 justjavac chrome
Firebug：不用多介绍了吧https://chrome.google.com/webstore/detail/bmagokdooijbeehmkpknfglimnifench ChromeSnifferPlus：Chrome 探测器，可以探测正在使用的开源软件或者 js 类库https://chrome.google.com/webstore/detail/chrome-sniffer-pl
算法机试题李亚飞 java 算法机试题
在面试机试时，遇到一个算法题，当时没能写出来，最后是同学帮忙解决的。这道题大致意思是：输入一个数，比如4,。这时会输出： &n
正确配置Linux系统ulimit值字符串 ulimit
在Linux下面部署应用的时候，有时候会遇上Socket/File: Can’t open so many files的问题；这个值也会影响服务器的最大并发数，其实Linux是有文件句柄限制的，而且Linux默认不是很高，一般都是1024，生产服务器用其实很容易就达到这个数量。下面说的是，如何通过正解配置来改正这个系统默认值。因为这个问题是我配置Nginx+php5时遇到了，所以我将这篇归纳进
hibernate调用返回游标的存储过程 Supanccy2013 java DAO oracle Hibernate jdbc
注：原创作品，转载请注明出处。上篇博文介绍的是hibernate调用返回单值的存储过程，本片博文说的是hibernate调用返回游标的存储过程。此此扁博文的存储过程的功能相当于是jdbc调用select 的作用。 1，创建oracle中的包，并在该包中创建的游标类型。 ---创建oracle的程
Spring 4.2新特性-更简单的Application Event wiselyman application
1.1 Application Event Spring 4.1的写法请参考10点睛Spring4.1-Application Event 请对比10点睛Spring4.1-Application Event 使用一个@EventListener取代了实现ApplicationListener接口,使耦合度降低; 1.2 示例包依赖 <p

智谱 GLM-4 大语言模型好用吗？

基础

画图

长文档解读

数据分析

高级联网

小结

延伸阅读

你可能感兴趣的:(语言模型,人工智能,自然语言处理)