zenRRan

我的第一篇论文诞生的故事

点击上方，选择星标或置顶，每天给你送干货！

作者：郭必扬时间：2020-12-16

【插播】年初抽47份大奖！！参加的人还很少，后天开奖！

新年大礼包：Xbox、Switch，PopMart芝麻街系列盲盒，小度音响，百度网盘超级会员免费领

前言：离上一次写博文已经快半年了，这半年我主要在忙两件事，一个是组里的企业项目，一个是我的第一篇学术论文。时间飞逝，转眼半年过去，从项目中诞生的一个想法最终转换成了我的第一篇学术论文，成功被AAAI接收，这对于刚刚开始博士生涯的我是莫大的鼓励。本文尝试回忆一下这篇论文诞生的全过程，算是给这段难忘的时光画上一个句号。

一、Idea的产生

1. 灵感来临的夜晚

2020年7月份的某个周五夜晚，刚刚开完组会的我陷入沉思，博士一年级还没开学，怎么大家都已经在讲自己的论文和研究工作了？我还什么都没有呢，每天就只做做项目。之前曾经有一个研究工作，因为陷入了瓶颈，也好久没有继续推进了，因此从硕士毕业以来，一直不知道我的学术之路到底在哪里。

我们组做研究主要的方向，还是偏信管的方向，这意味着首先是以实际的应用为导向的，另外主要还是做计量的分析，即发现一些“什么对什么有什么影响”的这样的研究。说实话，我一直不太感兴趣。而看计算机的论文，我就觉得很有意思，而且计算机方向的研究，让我感觉很有创造力，所以我对计算机的方向，尤其是当今的人工智能方向，一直有执念。曾经也跟导师讨论过，他跟我建议还是做信管方向的研究，毕竟是我们组的专长；曾经也有一些稚嫩的计算机方面的研究点子，也被组里的老师轻松戳破（早被人做过了）。所以，好久以来，我还是挺迷茫的。

那个夜晚，结束组会后，我没有像往常一样直接去休息，而是拿出iPad开始构思一些想法，不知为何当时就有一种预感：“今晚我会想出一个可以做的想法”。近期在企业项目中，一直在做文本分类相关的工作，为了分析模型的结果，常常盯着混淆矩阵看，从中我也发现了一些问题，那就是有一些类别很容易搞混，就一直再想办法解决它。当时就觉得，各个类别彼此之间的相似性是很不一样的，然而分类的时候我们却是假设他们是一样的来分类（one-hot target），这样自然不太好，如果能让模型来训练的时候意识到不同的输出维度存在相似性就好了，于是我立马画了一个草稿：

草稿展示的实际上是一个很简单的想法，那就是手动构造一个soft target，然后用那个去训练模型。写完这个想法之后，我十分地兴奋（虽然后来通过文献阅读发现，学术界早就有类似的想法了），马上开始写相关的代码。第二天也是起的很早就在家里做实验。让我高兴的是，这样朴素的想法，确实是有效的，我在我们项目的数据集上，发现了些许的效果提高。

2. 雏形初现

在我的朴素的想法得到实验的印证之后，我就开始想这个如何能有“学术含量”。因为“人工的”的发不了论文，“智能的”才可以发论文。所以我需要设计一个方法，让我通过人工手段得到的效果提升，可以智能地实现。这个实际上不难，只要是有机器学习、深度学习经验的人，都知道基本的思路就是：

“人工构造了什么，就让模型去学习什么。”

所以我前面是自己手工构造的soft target，那我就需要设计模型去学习这个soft target。能达到这个目的的模型设计有很多，但可行的不多，所以我画了很多草图，从原理的角度去查看其可行性。这个时候，之前看过的几篇论文对我产生了极大的提示作用，因此也借鉴了其模型结构。现在回想起来，如果我没看过那篇论文，我也设计不出这样的模型。

设计出来的模型，我又赶紧用代码去实现它，我使用项目的数据集做试验，发现构造出来的模型，也有效果！

此时我的心中已经开始有些按捺不住喜悦了，但我还不急着去找老师分享我的实验结果。为了证明不光光是项目的数据集有效果，我开始在网上收集各种各样的公共的文本分类数据集，中文的，英文的，赶紧都拿来试一试。当我测试到第三个数据集，发现我的方法依然有稳定的提高的时候，我知道，我这个论文，要诞生了！但那个时候，我只敢仰望顶会，感觉像AAAI这种，我还遥不可期，我的想法是把这个idea，写成文章投一投国内的一些新兴的NLP会议，博士开学前先试个水。

我开始整理这几天的实验数据、绘制模型的草图、写下自己的思路，并预约老师讨论。

我依然清晰地记得那一天在小会议室，我激动地、一口气讲完我的研究问题来源、思路、模型设计、实验结果，我感觉无比舒畅。老师认真地听完，没有犹豫，直接告诉我：“我觉得这是一个很有价值的研究，思路很清晰。”

对于这样的评价，我既惊喜，又感觉再意料之中，毕竟我是有备而来。然后我跟老师说，我想投一投SMP（全国社会媒体处理大会）试试，结果老师说：“这么好的想法，不投一个顶会？那岂不是浪费了！投AAAI吧！” 这一句话，比任何对我想法的好评都更加鼓舞人心。因此，我放弃了随便投一投的想法，立志冲击AAAI！

二、疯狂做实验

写论文有两种套路：先写出来，然后补实验。或者先做实验，再根据结果写论文。

一般前一种套路适合学术大佬或者老油条，他们相信自己的思路一定可以出做好结果，做实验只不过是为了找证据给别人看，而它们内心早已知道答案。但我还不太自信，我需要实验结果来给我信心，在idea产生后的一个月里，我几乎都在做实验，没有动笔开始写。

要想让自己的论文有说服力，自然是需要找大家都使用的、公开的benchmark数据集，收集了大量的数据集之后，还需要进行一些挑选，不可能所有的都放到论文里去。另外，因为要跟baseline模型进行对比，所以我还需要复现一些baseline模型。有些数据集，我发现我复现的结果，完全比不上baseline论文中声称的，那么这种数据集我就放弃了，不然容易被他人怀疑是不是故意把baseline做的很差。

数据集收集完毕之后，就进入到艰苦的“实验-调参-实验”循环了。这个过程是最无聊、最容易让人开始怀疑自己的阶段了。调参调到后期，甚至完全不知道自己在干嘛，开始怀疑自己做实验的意义，怀疑自己到底是在做科学研究，还是只是在费电而已。实验的记录我也比较随意，常常会忘记记录具体参数，导致结果无法复现。

这段时间的生活枯燥而乏味，每天在项目工作之余，把一组组的实验提交到服务器上跑。睡前如果发现跑出好结果了，我可以兴奋地晚上睡不着；要是效果差，我会啥都不想做，对女朋友都不耐烦，导致她有一次对我说：“我觉得自己对你根本不重要！你的喜怒哀乐完全由实验结果支配！”，哎，她这么一说，我发现还真是，完全被实验控制了。

三、论文的成型

时间到了8月份，基础的实验基本都做完了。这段时间主要是组会上跟老师们讨论实验结果、尝试进行理论解释的过程。深度学习的黑箱之处在于，你希望它怎么做，它还真不一定按你的做。所以我虽然按照自己的特定的意图设计的模型，但模型却不一定实现了我的意图。从实验结果也可以看出，有一些结果是跟我的预想不一致的。这段时间也很让人头疼，因为有些实验结果，真的不知道怎么解释，要解释也只能解释个大概，而大概的文字是无法写进论文里的。

然而随着AAAI投稿deadline的逼近，我也开始有点慌张了。本来还设计了很多补充实验和拓展研究，但按照目前的进度，是无法完成了。于是我决定不管那么多了，先根据现有的结果写出来再说！

这不写不知道，一开始写英文论文，就发现写起来总是很别扭，感觉自己词汇量就那么屈指可数的几个词。另外，论文的结构我也不知道怎么组织，我看的各种论文，都有各自的结构，有的related work在前，有的在后，没有一个标准。

这个时候咋办？我的办法是——抄！哦，不对，读书人的事儿怎么能叫“抄”呢？应该叫借鉴。我又是挑选了我那个时候正在看的我觉得格式写的特别工整的、又正好是AAAI的文章——TextGCN。上来先把人家的组织结构给“借鉴”了一遍，借鉴完这个，还不够，还要借鉴人家的遣词造句，诶，随着借鉴的深入，我发现我写的也慢慢“有内味儿了”，于是慢慢就上道了。除了TextGCN这一篇，我还借鉴了好几篇其他的优秀论文，包括别人画了写什么图、怎么画的、表格怎么设计的。总之，不管内容优不优秀，至少我先让我的论文看上去像一篇正经的AAAI论文。

我住的附近有个商场，楼上有家钢琴店，楼下有家星巴克。差不多在我刚刚产生这篇论文idea的时候，女朋友开始在那家琴房学钢琴。于是那些日子，经常是她在楼上练琴，我在楼下写论文，然后一起回家。令人怀恋的岁月啊！

四、提交前的紧急修改

deadline前的两周，另两位老师也加入了论文的讨论，听完论文后，他们首先肯定我的研究的完整性和规范性，但也提出了一些比较尖锐的问题，比如缺失了一个重要的baseline，另外模型的设计存在不合理之处。这两个都是十分严重的问题，对于只有两周就要提交的我来说，是十分可怕的。但同时，我也感到十分幸运在提价前能收到这样重要的反馈。

时间再紧也没有办法，只能硬着头皮去继续做实验、修改。说实话那个时候我已经有点疲惫了，首先，增加一个baseline意为着我至少要跑25组实验。另外设计上的不合理，这属于根本性问题了，但我已经没有时间去重新设计、重跑全部实验了，只能把这种不太合理的地方给淡化，毕竟效果上是提升的，只是模型结构可以设计的更有说服力。

最后我的折中方案是，新增几组实验实验，把baseline加上去，并使用一个更好的模型结构跑实验。最后火急火燎地做完了补充实验，算是把论文的一个大窟窿给填上了。

deadline分两个，一个是摘要的ddl，一个是正文的ddl。提交完摘要之后，一周之内我和老师们又一起把正文来来回回修改了N版，才放心地提交了。这个时候我感觉前面的“借鉴”还是发挥了很大作用，总体上本身已经比较规范了，但是多数是一些小问题，所以改起来还比较快。

五、顺利挺过第一轮筛选

论文提交后，就是接近一个月的空窗期。这段时间就是整理整理数据、代码，为github做准备。

10月14号的晚上，收到了顺利通过第一轮的邮件：

我也忘了当时是什么心情，应该也不是太激动了。但我确实是很满意的，第一次冲击顶会，我内心的小目标就是能过第一轮，那说明至少有一个国际上的该领域的审稿人认同我的工作了，那也是对我的一个巨大鼓励了。主要此时我也看不到任何的具体评论，所以我依然什么都做不了，只能耐心等待第二轮的结果一起放出来。

六、为Rebuttal鏖战到最后一刻

如果说第一轮的时候我内心还十分淡定，那么第二轮时我就真的开始紧张了。第一轮筛掉了38%的论文，一大半都还在呢，竞争只能是更加激烈了，而第二轮的结果，基本上就决定了最终的结果。

到了临近第二轮结果公布的时间点，我又开始像热锅上的蚂蚁了，反复地刷我的邮箱，就是看不到结果。直到第二天晚上，正骑车回寝室，手机振动了一下，一看“From Microsoft CMT”，我立马手抖着点开：

reviews已经在系统上公布，而且只有72小时的时间供我回复（rebuttal）。我一身冷汗，对着自行车踏板一顿狂踩冲到了寝室，迅速打开电脑查看reviews。

一打开review界面，密密麻麻的英文评论把我看蒙了，我直接去翻到最下面，应该会有打分，果真：

看到这一句“5-Below threshold of acceptance”，我的心凉了，哎。。。实力不济啊！

不过我马上又转悲为喜，因为我发现这个只是其中的一个打分。。。果真第一次投论文，完全没经验啊。最后的结果是两个6分，两个5分，完完全全地、不多不少地、恰到好处地踩到了分界线上！

这真是比走钢丝都要刺激啊！听说只要rebuttal做的好，是有可能让reviewer改分的！72小时倒计时，最后一搏，开始！

我赶紧联系老师们的时间，结果最晚只能到第二天晚上才能讨论，所以我得先自己整理好问题，然后明天做一次讨论后，写写就要提交了。

deadline前夕，我跟老师们在线上会议里碰面，仔细地讨论4个reviewer提出的几十条意见、建议。当时我最大的感受就是，这些reviewer的水平，真的是高啊！没有一个无聊的问题，每一个都一针见血，所以我曾经担心的、遗漏的问题，全部被他们给提了出来，很痛，又很爽（？？？）。而怎么回复他们的提问，又真的是一个技术活儿，这里面不仅仅要靠计算机知识，更需要借助心理学，不同的说法，给reviewer的感觉是完全不一样的，既要承认他们提出的问题（给审稿人面子），又要讲明自己的贡献（给自己面子），还要给出一个明确的解答或者计划（再次给审稿人面子），边想如何回复他们，其实我对自己的工作也理解的更加深刻。我和老师们从晚上8点，一直讨论到12点才散会。

那个晚上，我知道我是没有时间再睡觉了，我一个人留在实验室，开始整理rebuttal。夜晚的实验楼静悄悄，只有空调静静得吹，没有其他人，终于可以外放音乐，我写到了凌晨3点，实在写不动了，睡了一会，醒来后继续写，一直写到阳光从实验室窗户照射到我的电脑上，终于写完了！

发给老师们后，我赶紧回寝室睡觉，回去的路上碰到了刚刚出发去实验室的同学们。

睡醒后离deadline还有几小时，又根据老师们的意见修改了一部分，终于在系统上隆重地点击“submit”。那一刻，对我而言，仿佛是一个时代的结束。如果这是一场比赛，那么提交的那一刻，比赛就已经结束，我努力到了最后一刻，已经没有什么可以遗憾了。

七、不抱希望到柳暗花明

最终的放榜要等待12月1号，这是一个特别的日子，因为我的生日也在12月。我一直憧憬着，如果这次可以终稿，那么这将是我的收到的最好的生日礼物了。

这一个月来，我一直徘徊在“还是很有希望的！5566改成6666就有戏了！”和“没戏了，别幻想了！”之间。有时候看到知乎网友分享自己低分过线的经历，感觉自己也可以。后来看到知乎上有人开了一个AAAI21的专题讨论，很多人在分享自己的得分，我看了一圈，天哪，都比我高！7分8分的遍地都是，我这个边缘分，肯定没戏了！这时，我基本也不再幻想能中了。开始安安心心地根据review的看论文，准备年底的IJCAI。

11月底，越来越近了，虽然不抱希望了，但心中总不免还是会想“万一踩了狗屎运中了呢？”，所以我又开始焦虑了起来。到了放榜的那一天，我又开始每5分钟刷一次邮箱了。老婆也有点紧张了，总是提醒我看邮箱。一直等到晚上，还是没有放榜。

那一夜，真的很难睡着，辗转反侧，虽然我知道希望不大，但只要有一丝的希望，我就无法安心入睡。我一遍遍地刷新邮箱，什么也没有。然而第二天上午还有一门课的考试，我必须想办法睡着了。没办法，我打开手机记事本，在Todo list上写下这段话：

写完之后，顿时内心平静了下来。难道一个结果，就要把人的心态一直吊着吗？做好每天的事，管他结果怎么样！终于，我慢慢沉入梦乡......

第二天，太阳照常升起，我和室友照常骑着共享单车到教学楼，照常吃午饭、敲代码、看论文、调bug。结果依然迟迟不出现，老婆又问了几遍，我给她发了一个Twitter的截图，说国外网友也都在催呢，哈哈，不管了！

下午5时许，同实验室的同学喊我去吃饭，我没啥胃口，下午看别人Github的代码，一直还没看懂呢，正烦呢，于是我接着看代码。又过了一会儿，手机振动了一下，我火速打开手机，我知道，它来了。

边打开邮箱，我边自言自语：“好啦，我知道没过啦~~~不过万一真的能看到一个Congratulation单词呢？”

"Congratulations!"

是的，美好的事情发生了！

刚刚还眉头紧锁地，现在脸上的两坨肉已经开始止不住地上扬了，我反复地盯着邮件看，确认是我，确认是"congratulation"，确认是"delighted"，确认是"success"，我终于确认了，我中稿了！不管实验室里其他人了，一句“我艹！起飞了！”脱口而出。

我马上出门，给老婆打电话，开口我竟然激动地不知道怎么说，只是大声的说：
“乖，快出来！快点！”
老婆听了有点吃惊：“啥？你不会来公司了吧？？好好，我出来了！”
我已经语无伦次：“不是不是，那个。。。告诉你一个天大的好消息！！！”
老婆迟疑了一下，马上反应过来了：“啊？不会吧！啊！！！！中稿啦！！！哇~~~！！”
我装作淡定地说：“是的，中稿了”，只有实验楼窗户的倒影知道我笑得多么灿烂。
......

跟老婆分享完喜悦之后，我又准备赶紧跟老师们说，结果老师们已经知道了，已经群里恭喜我了。于是我又赶紧跟我爸妈分享，他们也非常激动，还让我把邮件的截图、论文的大概意思都发给他们，看样子是要发朋友圈了，哈哈。

老婆约我去正大广场见面，请我吃大餐，在赴约的路上，我感觉自己好久好久没有这么轻松快乐了，也许从研究生起吧，感觉自己终于做成了一件事儿。

∞、回顾与总结

回顾从idea产生到论文接收的的过程，我觉得值得我记录的有这么几个点：

随时记录自己突然冒出来的想法，尤其是从实际问题中产生的想法，往往比较有价值
做模型的时候要多对进行细致的分析，比如分析混淆矩阵就比分析classification report要细，更能发现问题
从简单的想法入手，快速印证自己的想法的可行性
如果真的喜欢某个事物，就不要怕被泼冷水，坚持去想去做
先自己动手，找到证据说服自己，才能说服老师
多看经典论文和思路较为新颖的论文。例如对我有重大启发的那个论文，是TextGCN论文中的一个baseline方法，叫LEAM（Joint Embedding of Words and Labels for Text Classification），这个标题一看就是一个很新颖的结构，所以我特地去看了看，没想到后来用上了
认真地进行实验记录，不要偷懒。一个参数忘了写，等于后面要把一组参数都跑一遍。我就常常因为忘记某个实验结果是怎么跑出来的而不得不哭着重跑实验。。。
参数多了容易迷失自己，每次实验前，先想清楚自己的目的是什么，最好能记下来，实验结束后也马上记录一下结果印证了什么。
用云计算平台，记得即使保存代码和结果。我就因为忘了及时续费，导致中途两次代码和数据丢失，浪费了不少时间。
如果英文学术写作不熟悉，照葫芦画瓢是一个很有效的做法。
rebuttal really matters！好好写，有时候真的可以起死回生！
多找几个老师讨论，集思广益。这篇论文受到了四位老师的耐心帮助，每位老师都发挥了无可替代的贡献。在此再次感谢他们！

后记：也许对于很多人来说，发表一篇AAAI是小菜一碟，尤其那些计算机名校、AI大组。但是对于我这种既不是计算机科班出身，学校学院乃至组里也不是专门做这个方向的人来说，这段经历对我来说已经十分珍贵了，遂记录下来，一来纪念这段时光，重温那段岁月的学术激情，二来鼓励自己继续努力，未来做出更多的学术贡献，三来给跟我类似背景的同学一些勉励，大家共同加油！

另外，细心的读者会发现，在论文诞生的这几个月里，我的女朋友也变成了我的老婆，是的，感谢她一直陪伴着我写完这篇论文，见证了我这期间的喜怒哀乐，也见证我人生中又一段独特的时光，未来还有好多美好的事情等待我们我一起经历。

后记plus：其实论文被接收与否，不影响这个论文的本质贡献。如果这篇论文没中，我也可以列举出各种没有中的理由。因此，论文本身是否真的有贡献，使我们更应该关注的。如果让我对自己这篇论文给出一个真实的评价，我会说，有一些创新和贡献，但还确实不够，革命尚未成功，同志任需努力！

说个正事哈

由于微信平台算法改版，公号内容将不再以时间排序展示，如果大家想第一时间看到我们的推送，强烈建议星标我们和给我们多点点【在看】。星标具体步骤为：

（1）点击页面最上方“深度学习自然语言处理”，进入公众号主页。

（2）点击右上角的小点点，在弹出页面点击“设为星标”，就可以啦。

感谢支持，比心。

投稿或交流学习，备注：昵称-学校（公司）-方向，进入DL&NLP交流群。

方向有很多：机器学习、深度学习，python，情感分析、意见挖掘、句法分析、机器翻译、人机对话、知识图谱、语音识别等。

记得备注呦

推荐两个专辑给大家：

专辑 | 李宏毅人类语言处理2020笔记

专辑 | NLP论文解读

专辑 | 情感分析


整理不易，还望给个在看！

你可能感兴趣的:(人工智能,twitter,tapestry,oom,ai)

学习111 麋鹿叔叔学习
项目名称项目简介主要功能技术原理GitHub地址browser-use智能浏览器工具，让AI像人类一样操作浏览器，实现网页自动化网页浏览与操作、多标签页管理、视觉识别与内容提取、操作记录与重复执行、自定义动作支持、主流LLM模型支持为大语言模型服务的创新Python工具库GitHubEkoFellouAI推出的生产就绪型JavaScript框架，基于自然语言驱动创建智能代理支持所有平台，提供统一便
不用再当“技术宅“！这个AI神器让我5分钟变身人工智能达人阳光永恒736 AI工具人工智能 deepseek 一键包本地部署 AI资源
最近我在朋友圈刷到好多朋友都在玩AI画图、AI写诗，看得我心痒痒。可每次想自己试试，打开教程就被满屏的代码吓退——"Python环境配置"、"CUDA驱动安装"这些词比数学作业还让人头疼。直到我发现了一个叫DeepSeek本地部署一键包的神器，我的AI探索之旅终于变得像搭乐高一样简单！夸克网盘分享一、原来AI离我们这么近上周三放学路上，我看见隔壁班的小美用AI给自己照片生成古风造型，这让我突然意识
使用LangChain实现基于LLM和RAG的PDF问答系统张同学吧 langchain 语言模型
目录前言一.大语言模型(LLM)1.什么是LLM？2.LLM的能力与特点二、增强检索生成(RAG)三.什么是LangChain？1.LangChain的核心功能2.LangChain的优势3.LangChain的应用场景4.总结四.使用LangChain实现基于PDF的问答系统前言本文将介绍LLM和RAG的基本概念，并通过一个实际的代码示例，展示如何使用LangChain构建一个基于PDF文档的问
python将网银web工程转换成客户端electron工程案例银行金融科技人工智能机器学习 DeepSeek electron
以下是一个将网银Web工程转换为Electron客户端的技术方案，结合Python和Electron实现桌面端增强功能：bash#项目结构webank-electron/├──main/#Electron主进程代码│├──main.js│└──python_server.py├──renderer/#网页渲染进程│└──webank-web/#原始网银Web工程├──package.json└──
OpenAI Deep Research 要 200 美元/月？试试这 4 款免费开源平替！ surfirst LLM 人工智能开源 DeepResearch
引言随着AI研究代理（AIresearchagents）的兴起，越来越多的工具能够帮助用户快速获取信息、整理研究报告。OpenAI最近推出的DeepResearch便是一个典型代表，它能在几十分钟内完成原本需要人类数小时的多步骤研究任务。然而，DeepResearch并非唯一的选择，开源社区也提供了多个优秀的替代方案。如果你希望使用开源方案、获得更强的可定制性，或者避免依赖OpenAI，那么本文介
DeepSeek API在AutoCAD中的创新应用与挑战 CodeJourney. 数据库算法人工智能
在数字化设计领域，随着人工智能技术的飞速发展，将AI能力融入传统设计软件成为提升设计效率和质量的重要趋势。AutoCAD作为广泛应用的计算机辅助设计软件，与DeepSeekAPI的结合展现出了巨大的潜力。这种融合不仅为设计工作带来了全新的思路和方法，还在多个方面对设计流程进行了优化和创新。一、DeepSeekAPI赋能AutoCAD的多元应用场景（一）智能设计辅助：让创意快速落地在传统设计过程中，
程序员学商务英语之Don‘t jinx it、l have a half mind to do sth、Don‘t change the subject、Quality over quantity.. 李匠2024 英文
1463-Don'tjinxit.-别鸟鸦嘴A:Whatifitrainstheweekend?Youknow,theweather'sbeenchangeablethesedays!如果这个周末下雨怎么办?你知道，这些天的天气变化无常!B:Don'tiinxit.i'vespentalotoftimepreparingforthiscamping.lhopeitstaysfineforthewe
AI 赋能应急管理：ChatGPT、DeepSeek、Grok 的应用探索一ge科研小菜菜人工智能人工智能
个人主页：一ge科研小菜鸡-CSDN博客期待您的关注1.引言随着人工智能（AI）技术的快速发展，大语言模型（LLM）在应急管理领域的应用逐步扩大。ChatGPT、DeepSeek、Grok等AI模型凭借强大的文本处理、数据分析和推理能力，可为灾害预警、应急响应、风险评估等提供高效支持。本文将对比三大AI模型在应急管理中的优势，并探讨其在未来智能化应急管理体系中的应用前景。2.应急管理中的核心挑战应
DeepSeek的崛起：2025新春国产AI模型的全球影响力耶耶Norsea 网络杂烩人工智能百度
摘要在2025年新春之际，国产AI模型DeepSeek以现象级的姿态迅速崛起，凭借免费、易用及高性能的特点，吸引了全球科技界的广泛关注。这款大型人工智能模型不仅展现了国产技术的实力，还为用户提供了高效便捷的使用体验，成为行业内的焦点。关键词DeepSeek崛起,2025新春,国产AI模型,免费易用,高性能特点一、国产AI的崭新篇章1.1DeepSeek的诞生背景在2025年新春之际，DeepSee
一文说清楚什么是预训练（Pre-Training）、微调（Fine-Tuning），零基础小白建议收藏！！小城哇哇人工智能语言模型 AI大模型大模型微调预训练 agi LLM
前言预训练和微调是现代AI模型的核心技术，通过两者的结合，机器能够在处理复杂任务时表现得更为高效和精准。预训练为模型提供了广泛的语言能力，而微调则确保了模型能够根据特定任务进行细化和优化。近年来，人工智能（AI）在各个领域的突破性进展，尤其是在自然语言处理（NLP）方面，引起了广泛关注。两项重要的技术方法——预训练和微调，成为了AI模型发展的基石。预训练通常是指在大规模数据集上进行模型训练，以帮助
每天分析一个开源项目：open_deep_research 申非zz LLM github 开源
每天分析一个开源项目：open_deep_research项目链接：langchain-ai/open_deep_research项目介绍项目功能：OpenDeepResearch是一个基于LangGraph的Web研究助手，旨在帮助用户快速生成特定主题的综合性报告。它模拟了OpenAI和Gemini的DeepResearch流程，但提供了更强的自定义能力，允许用户配置模型、Prompt、报告结构
ONE Deep模型：LG AI Research的开源突破耶耶Norsea 网络杂烩自动化
摘要由LGAIResearch开发的ONEDeep系列开源AI模型，参数规模覆盖2.4亿至32亿。经评估，2.4B参数规模的ONEDeep模型在性能上优于同类其他模型，展现出显著优势。这一成果为AI技术的应用与研究提供了强有力的支持。关键词ONEDeep模型,开源AI模型,LGAIResearch,2.4B参数,性能优越一、ONEDeep模型概述1.1ONEDeep模型的开发背景在当今人工智能技术
文章去除AI味的指令 wirepuller_king AI word技巧人工智能
去AI味指令-1Role:AI文章人性化优化专家Profile:author:wirepullerVersion:5.2.0Language:中文Description:专门优化AI生成文章,使其更接近人类自然写作风格的专家Background:你是一位精通自然语言处理和人类写作风格的专家。你的任务是将AI生成的文章转化为更自然、更有人情味的文章,去除机械化和公式化的痕迹,增加文章的可读性和亲和力
Cursor + 向量数据生产力的提升！！ AI Agent首席体验官数据库人工智能 AI编程 ai编程
1.Cursor+向量数据库意味着什么?将Cursor与向量数据库结合意味着强化AI辅助编程的能力，主要体现在以下几个方面：代码理解与上下文感知：Cursor作为AI编程工具可以利用向量数据库存储代码片段、函数、类和项目结构的向量表示，使AI能更精确地理解代码上下文和关系。语义搜索能力：向量数据库使Cursor能够执行基于语义的代码搜索，而不仅仅是关键词匹配，开发者可以用自然语言描述需求，找到语义
GitHub项目推荐--基于LLM的开源爬虫项目惟贤箬溪穷玩Ai github 爬虫
以下是一些基于大语言模型（LLM，LargeLanguageModel）的开源爬虫项目，它们结合了自然语言处理（NLP）技术与爬虫的功能，能在一定程度上提升爬取的智能化和精度。这些项目可以用于自动化抓取、内容提取、数据分析等任务。1.GPT-3WebScraper简介：这是一个基于OpenAIGPT-3模型的网页抓取工具，利用GPT-3的自然语言理解能力来生成有用的爬虫策略、处理网页内容并提取有价
深度解析大模型推理框架：原理、应用与实践百度_开发者中心人工智能大模型自然语言处理
在当今数据驱动的时代，大模型推理框架已经成为人工智能领域的重要支柱。本文将通过简明扼要、清晰易懂的方式，带领读者深入了解大模型推理框架的原理、应用领域和实践经验，帮助读者更好地掌握这一技术，并在实际工作中发挥其价值。一、大模型推理框架简介大模型推理框架是指一种基于深度学习技术的推理框架，主要用于解决大规模数据集下的复杂问题。该框架通过对海量数据进行高效的训练和推理，能够快速地对各种复杂场景进行分析
Linux当中解决apt-get install E: 无法定位软件包问题 wt-cai linux
最近遇到一些问题，记录一下。也给其他人参考解决方案。主要参考该博客：https://blog.csdn.net/qq_36698189/article/details/115607886注意：更换清华源的时候一定要跟自己ubuntu版本相对应，不然可能会有其他问题。还有其他问题，如：1.Linux中使用apt/apt-get时报错：libc6-dev:破坏（依赖）:libgcc-9-dev(＜9.
【AI】Jetson Nano烧写SD卡镜像：Ubuntu20.04 郭老二 AI linux驱动 Jetson Nano
1、简述JetsonNano出厂时，默认支持Ubuntu18.04。各个厂家的国产板子，自带的也是Ubuntu18.04。如何升级到Ubuntu20.04呢？2、在线升级首先确保JetsonNano已经烧写了Ubuntu18.04，然后在线升级至Ubuntu20.041）删除谷歌浏览器sudoapt-getremove--purgechromium-browserchromium-browser-
nvidia系列教程-AGX-Orin系统刷机及备份 flypig哗啦啦 nvidia nvidia AGX-Orin
目录前言一、准备工作二、AGXOrin系统刷机步骤三、AGXOrin系统备份总结前言NVIDIAAGXOrin是一款高性能的嵌入式计算平台，专为边缘计算和AI应用而设计。为了确保系统的稳定性和适应不同的应用场景，用户可能需要对AGXOrin进行系统刷机和备份操作。本文将详细介绍如何完成这些操作，帮助您更好地管理和维护AGXOrin设备。一、准备工作在开始刷机和备份之前，请确保您已经准备好以下工具和
DeepSeek 部署指南 (使用 vLLM 本地部署) AGI大模型资料分享员人工智能语言模型学习 chatgpt 深度学习大模型 deepseek
DeepSeek部署指南(使用vLLM本地部署)本文档将指导您如何使用vLLM在本地部署DeepSeek语言模型。我们以deepseek-ai/DeepSeek-R1-Distill-Qwen-7B模型为例进行演示。1、安装Python环境首先，您需要安装Python环境。访问Python官网:https://www.python.org/根据您的操作系统选择安装包:Python官网提供Windo
同步MySQL数据至Elasticsearch：go-mysql-elasticsearch实战指南吴镇业
同步MySQL数据至Elasticsearch：go-mysql-elasticsearch实战指南go-mysql-elasticsearchSyncMySQLdataintoelasticsearch项目地址:https://gitcode.com/gh_mirrors/go/go-mysql-elasticsearch项目介绍go-mysql-elasticsearch是一个服务，能够自动将
C语言中的结构体 NaZiMeKiY C/C++c语言算法开发语言
一.结构体1.结构体的概念：结构体可以理解为自定义的数据类型，它是由一批数据组合而成的结构型数据2.结构体格式：struct结构体名字{成员1;成员2;...成员n;};案例：#include#includestructstudent{charname[100];intage;chargender;};intmain(){structstudents1;strcpy(s1.name,"zhangs
解决Ubuntu命令“sudo apt-get install”——“ E: 无法定位软件包”问题 Joker 007 服务器 ubuntu linux 服务器
1.添加镜像源(本文是清华源)。运行代码：sudovim/etc/apt/sources.list添加如下内容：debhttps://mirrors.tuna.tsinghua.edu.cn/ubuntu/bionicmainrestricteduniversemultiverse#deb-srchttps://mirrors.tuna.tsinghua.edu.cn/ubuntu/bionicm
设计模式-抽象工厂模式(Abstract Factory) 树懒_Zz 设计模式抽象工厂模式设计模式
抽象工厂模式是一种创建型设计模式，它能创建一系列相关的对象，而无需指定其具体类。譬如你正在开发一款家具组装系统。代码中包括一些产品：椅子（chair）,沙发（sofa）和咖啡桌（CoffeeTable）然后基于这些产品形成一些列组合套餐装饰风艺术(ArtDeco)、维多利亚（Victorian）和现代（Mdern）。你需要设法单独生成每件家具对象，这样才能确保其风格一致。如果顾客收到的家具风格不一
Python基础知识点总结豆芽819 tip python 开发语言
1Python简介Python特点：解释型语言：无需编译，逐行执行。动态类型：变量类型在运行时确定。简洁易读：语法接近自然语言，代码简洁。跨平台支持：Windows/Linux/macOS均可运行。应用领域：Web开发、数据分析、人工智能、自动化脚本等。开发环境：推荐使用IDLE、PyCharm、VSCode或JupyterNotebook。2Python数值运算基本运算符：算术：+,-,*,/,
Pytorch中的torch.utils.data.Dataset 类小白的高手之路深度学习（DL）Pytorch实战深度学习 python pytorch
1、使用方法fromtorch.utils.dataimportDataset2、torch.utils.data.Dataset类的定义classDataset(Generic[_T_co]):r"""Anabstractclassrepresentinga:class:`Dataset`.Alldatasetsthatrepresentamapfromkeystodatasamplesshou
实验7-2-3 求矩阵的局部极大值范德蒙蒙矩阵算法数据结构 c语言
#includeintmain(){intm,n;scanf("%d%d",&m,&n);inta[m+1][n+1];//编号从1开始for(inti=1;ia[i-1][j]&&a[i][j]>a[i+1][j]&&a[i][j]>a[i][j-1]&&a[i][j]>a[i][j+1]){printf("%d%d%d\n",a[i][j],i,j);you=1;}}}if(you==0){p
shell 脚本搭建apache 好多知识都想学 apache
#!/bin/bash#SetApacheversiontoinstall##author:yuan#检查外网连接echo"检查外网连接..."pingwww.baidu.com-c3>/dev/null2>&1if[$?-eq0];then echo"外网通讯良好！"else echo"网络连接失败，请检查你的网络设置！" exit1fisleep5#检查并安装APR库echo"检查并安装
[每周一更]-(第137期)：Go + Gin 实战：Docker Compose + Apache 反向代理全流程 ifanatic 每周一更容器 Go golang gin docker
文章目录**1.Go代码示例（`main.go`）****2.`Dockerfile`多段构建**3.构建Docker镜像**4.`docker-compose.yml`直接拉取镜像****5.运行容器****6.测试API**7、配置域名访问**DNS解析：将域名转换为IP地址****DNS寻址示例**8.错误记录访问路径ip+端口：端口可以了，但是小程序中不支持该格式，还需要配置nginx代理
在Ubuntu20.04上交叉编译能在Windows上运行的Qt5应用 daqinzl linux qt C++Ubuntu20.04 Qt5 交叉编译 Windows应用
参考链接：https://blog.csdn.net/Interview_TC/article/details/146050419https://bugreports.qt.io/browse/QTBUG-82592重要设置sudoupdate-alternatives--configx86_64-w64-mingw32-g++选择后缀带posix的，（/usr/bin/x86_64-w64-mi
Maven Array_06 eclipse jdk maven
Maven Maven是基于项目对象模型(POM)，信息来管理项目的构建，报告和文档的软件项目管理工具。 Maven 除了以程序构建能力为特色之外，还提供高级项目管理工具。由于 Maven 的缺省构建规则有较高的可重用性，所以常常用两三行 Maven 构建脚本就可以构建简单的项目。由于 Maven 的面向项目的方法，许多 Apache Jakarta 项目发文时使用 Maven，而且公司
ibatis的queyrForList和queryForMap区别 bijian1013 java ibatis
一.说明 iBatis的返回值参数类型也有种：resultMap与resultClass，这两种类型的选择可以用两句话说明之： 1.当结果集列名和类的属性名完全相对应的时候，则可直接用resultClass直接指定查询结果类
LeetCode[位运算] - #191 计算汉明权重 Cwind java 位运算 LeetCode Algorithm 题解
原题链接：#191 Number of 1 Bits 要求：写一个函数，以一个无符号整数为参数，返回其汉明权重。例如，‘11’的二进制表示为'00000000000000000000000000001011', 故函数应当返回3。汉明权重：指一个字符串中非零字符的个数；对于二进制串，即其中‘1’的个数。难度：简单分析：将十进制参数转换为二进制，然后计算其中1的个数即可。 “
浅谈java类与对象 15700786134 java
java是一门面向对象的编程语言，类与对象是其最基本的概念。所谓对象，就是一个个具体的物体，一个人，一台电脑，都是对象。而类，就是对象的一种抽象，是多个对象具有的共性的一种集合，其中包含了属性与方法，就是属于该类的对象所具有的共性。当一个类创建了对象，这个对象就拥有了该类全部的属性，方法。相比于结构化的编程思路，面向对象更适用于人的思维
linux下双网卡同一个IP 被触发 linux
转自： http://q2482696735.blog.163.com/blog/static/250606077201569029441/ 由于需要一台机器有两个网卡，开始时设置在同一个网段的IP，发现数据总是从一个网卡发出，而另一个网卡上没有数据流动。网上找了下，发现相同的问题不少：一、关于双网卡设置同一网段IP然后连接交换机的时候出现的奇怪现象。当时没有怎么思考、以为是生成树
安卓按主页键隐藏程序之后无法再次打开肆无忌惮_ 安卓
遇到一个奇怪的问题，当SplashActivity跳转到MainActivity之后，按主页键，再去打开程序，程序没法再打开（闪一下），结束任务再开也是这样，只能卸载了再重装。而且每次在Log里都打印了这句话"进入主程序"。后来发现是必须跳转之后再finish掉SplashActivity 本来代码： // 销毁这个Activity fin
通过cookie保存并读取用户登录信息实例知了ing JavaScript html
通过cookie的getCookies()方法可获取所有cookie对象的集合；通过getName()方法可以获取指定的名称的cookie；通过getValue()方法获取到cookie对象的值。另外，将一个cookie对象发送到客户端，使用response对象的addCookie()方法。下面通过cookie保存并读取用户登录信息的例子加深一下理解。（1）创建index.jsp文件。在改
JAVA 对象池矮蛋蛋 java ObjectPool
原文地址： http://www.blogjava.net/baoyaer/articles/218460.html Jakarta对象池 ☆为什么使用对象池恰当地使用对象池化技术，可以有效地减少对象生成和初始化时的消耗，提高系统的运行效率。Jakarta Commons Pool组件提供了一整套用于实现对象池化
ArrayList根据条件+for循环批量删除的方法 alleni123 java
场景如下： ArrayList<Obj> list Obj-> createTime, sid. 现在要根据obj的createTime来进行定期清理。（释放内存） ------------------------- 首先想到的方法就是 for(Obj o:list){ if(o.createTime-currentT>xxx){
阿里巴巴“耕地宝”大战各种宝百合不是茶平台战略
“耕地保”平台是阿里巴巴和安徽农民共同推出的一个 “首个互联网定制私人农场”，“耕地宝”由阿里巴巴投入一亿，主要是用来进行农业方面，将农民手中的散地集中起来不仅加大农民集体在土地上面的话语权，还增加了土地的流通与利用率，提高了土地的产量，有利于大规模的产业化的高科技农业的发展，阿里在农业上的探索将会引起新一轮的产业调整，但是集体化之后农民的个体的话语权将更少，国家应出台相应的法律法规保护
Spring注入有继承关系的类（1） bijian1013 java spring
一个类一个类的注入 1.AClass类 package com.bijian.spring.test2; public class AClass { String a; String b; public String getA() { return a; } public void setA(Strin
30岁转型期你能否成为成功人士 bijian1013 成功
很多人由于年轻时走了弯路，到了30岁一事无成，这样的例子大有人在。但同样也有一些人，整个职业生涯都发展得很优秀，到了30岁已经成为职场的精英阶层。由于做猎头的原因，我们接触很多30岁左右的经理人，发现他们在职业发展道路上往往有很多致命的问题。在30岁之前，他们的职业生涯表现很优秀，但从30岁到40岁这一段，很多人
[Velocity三]基于Servlet+Velocity的web应用 bit1129 velocity
什么是VelocityViewServlet 使用org.apache.velocity.tools.view.VelocityViewServlet可以将Velocity集成到基于Servlet的web应用中，以Servlet+Velocity的方式实现web应用 Servlet + Velocity的一般步骤 1.自定义Servlet，实现VelocityViewServl
【Kafka十二】关于Kafka是一个Commit Log Service bit1129 service
Kafka is a distributed, partitioned, replicated commit log service.这里的commit log如何理解？ A message is considered "committed" when all in sync replicas for that partition have applied i
NGINX + LUA实现复杂的控制 ronin47 lua nginx 控制
安装lua_nginx_module 模块 lua_nginx_module 可以一步步的安装，也可以直接用淘宝的OpenResty Centos和debian的安装就简单了。。这里说下freebsd的安装： fetch http://www.lua.org/ftp/lua-5.1.4.tar.gz tar zxvf lua-5.1.4.tar.gz cd lua-5.1.4 ma
java-14.输入一个已经按升序排序过的数组和一个数字，在数组中查找两个数，使得它们的和正好是输入的那个数字 bylijinnan java
public class TwoElementEqualSum { /** * 第 14 题：题目：输入一个已经按升序排序过的数组和一个数字，在数组中查找两个数，使得它们的和正好是输入的那个数字。要求时间复杂度是 O(n) 。如果有多对数字的和等于输入的数字，输出任意一对即可。例如输入数组 1 、 2 、 4 、 7 、 11 、 15 和数字 15 。由于
Netty源码学习-HttpChunkAggregator-HttpRequestEncoder-HttpResponseDecoder bylijinnan java netty
今天看Netty如何实现一个Http Server org.jboss.netty.example.http.file.HttpStaticFileServerPipelineFactory： pipeline.addLast("decoder", new HttpRequestDecoder()); pipeline.addLast(&quo
java敏感词过虑-基于多叉树原理 cngolon 违禁词过虑替换违禁词敏感词过虑多叉树
基于多叉树的敏感词、关键词过滤的工具包，用于java中的敏感词过滤 1、工具包自带敏感词词库，第一次调用时读入词库，故第一次调用时间可能较长，在类加载后普通pc机上html过滤5000字在80毫秒左右，纯文本35毫秒左右。 2、如需自定义词库，将jar包考入WEB-INF工程的lib目录，在WEB-INF/classes目录下建一个 utf-8的words.dict文本文件，
多线程知识 cuishikuan 多线程
T1，T2，T3三个线程工作顺序，按照T1，T2，T3依次进行 public class T1 implements Runnable{ @Override
spring整合activemq dalan_123 java spring jms
整合spring和activemq需要搞清楚如下的东东1、ConnectionFactory分： a、spring管理连接到activemq服务器的管理ConnectionFactory也即是所谓产生到jms服务器的链接 b、真正产生到JMS服务器链接的ConnectionFactory还得
MySQL时间字段究竟使用INT还是DateTime？ dcj3sjt126com mysql
环境：Windows XPPHP Version 5.2.9MySQL Server 5.1 第一步、创建一个表date_test（非定长、int时间） CREATE TABLE `test`.`date_test` (`id` INT NOT NULL AUTO_INCREMENT ,`start_time` INT NOT NULL ,`some_content`
Parcel: unable to marshal value dcj3sjt126com marshal
在两个activity直接传递List<xxInfo>时，出现Parcel: unable to marshal value异常。在MainActivity页面（MainActivity页面向NextActivity页面传递一个List<xxInfo>）： Intent intent = new Intent(this, Next
linux进程的查看上（ps） eksliang linux ps linux ps -l linux ps aux
ps:将某个时间点的进程运行情况选取下来转载请出自出处：http://eksliang.iteye.com/admin/blogs/2119469 http://eksliang.iteye.com ps 这个命令的man page 不是很好查阅，因为很多不同的Unix都使用这儿ps来查阅进程的状态，为了要符合不同版本的需求，所以这个
为什么第三方应用能早于System的app启动 gqdy365 System
Android应用的启动顺序网上有一大堆资料可以查阅了，这里就不细述了，这里不阐述ROM启动还有bootloader，软件启动的大致流程应该是启动kernel -> 运行servicemanager 把一些native的服务用命令启动起来（包括wifi, power, rild, surfaceflinger, mediaserver等等）-> 启动Dalivk中的第一个进程Zygot
App Framework发送JSONP请求(3) hw1287789687 jsonp 跨域请求发送jsonp ajax请求越狱请求
App Framework 中如何发送JSONP请求呢? 使用jsonp,详情请参考:http://json-p.org/ 如何发送Ajax请求呢? (1)登录 /*** * 会员登录 * @param username * @param password */ var user_login=function(username,password){ // aler
发福利，整理了一份关于“资源汇总”的汇总 justjavac 资源
觉得有用的话，可以去github关注：https://github.com/justjavac/awesome-awesomeness-zh_CN 通用 free-programming-books-zh_CN 免费的计算机编程类中文书籍精彩博客集合 hacke2/hacke2.github.io#2 ResumeSample 程序员简历
用 Java 技术创建 RESTful Web 服务 macroli java 编程 Web REST
转载：http://www.ibm.com/developerworks/cn/web/wa-jaxrs/ JAX-RS (JSR-311) 【 Java API for RESTful Web Services 】是一种 Java™ API，可使 Java Restful 服务的开发变得迅速而轻松。这个 API 提供了一种基于注释的模型来描述分布式资源。注释被用来提供资源的位
CentOS6.5-x86_64位下oracle11g的安装详细步骤及注意事项超声波 oracle linux
前言：这两天项目要上线了，由我负责往服务器部署整个项目，因此首先要往服务器安装oracle，服务器本身是CentOS6.5的64位系统，安装的数据库版本是11g，在整个的安装过程中碰到很多的坑，不过最后还是通过各种途径解决并成功装上了。转别写篇博客来记录完整的安装过程以及在整个过程中的注意事项。希望对以后那些刚刚接触的菜鸟们能起到一定的帮助作用。安装过程中可能遇到的问题（注
HttpClient 4.3 设置keeplive 和 timeout 的方法 supben httpclient
ConnectionKeepAliveStrategy kaStrategy = new DefaultConnectionKeepAliveStrategy() { @Override public long getKeepAliveDuration(HttpResponse response, HttpContext context) { long keepAlive
Spring 4.2新特性-@Import注解的升级 wiselyman spring 4
3.1 @Import @Import注解在4.2之前只支持导入配置类在4.2,@Import注解支持导入普通的java类,并将其声明成一个bean 3.2 示例演示java类 package com.wisely.spring4_2.imp; public class DemoService { public void doSomethin