唐伯虎点·蚊香

Research Origin of GPT-4

三十年前，互联网（Web 1.0）时代开启。人们只能在笨重的电脑上用鼠标点击由HTML编写的网页文本，随后开始支持插入图片，可以上传视频，于是有了网络新闻、搜索、电子邮件、短信、网游…互联网带来了全新的商业模式，深刻改变了人们的生产生活。

三十年后的当下，以ChatGPT为代表的大模型问世了。起初人们拿它当玩具，直到ChatGPT的诞生与人类实现惊艳交互，自动生成文本信息，而刚刚发布的GPT-4更是进化成支持文本和图像的多模态大模型，还能理解图像、代码，目前已经接入到微软Office全家桶…

看到两者的共性了吗？

比尔·盖茨说，ChatGPT不亚于互联网的诞生。而OpenAI总裁、联合创始人Greg Brockman更直截了当：“我们会拿下Web 4.0。”在去年ChatGPT发布前与ScaleAI CEO Alexandr Wang的对话中他这样谈到。而在3月10日举办的SXSW 23大会的另一场对话上，他称：我们正在创建新型互联网或类似的东西。

多模态GPT-4更像往这一方向演化的雏形。在ChatGPT发布后，仅仅经过四个月的大约五次更迭，这个升级版模型展现出更震撼的效果和更大影响力。

这让一直在研究人类大脑运作机制的“深度学习教父”Geoffrey Hinton也不免感到激动：“毛毛虫提取营养物质，然后破茧成蝶。而人们已经萃取了数十亿理解的精华，GPT-4就是人类的’蝴蝶’（humanity’s butterfly）。”他还评价了让ChatGPT大获成功的秘密武器：人类反馈的强化学习（RLHF）是在教育一个超自然早熟的孩子。

这使得人类与机器实现了动态互动，让机器的智能特征体现得更明显，不同于人类与传统互联网交互的静态方式。在Brockman看来，我们正走在一个充满活力的世界，AI将改变人们与信息互动的方式，它会理解并帮助你。换句话说，GPT模型在真正改变人机交互的方式。

GPT模型所取得的成就令人艳羡，不过这建立在OpenAI数年的技术探索和坚定信念上。

作为深度参与了GPT模型从0到1生产过程，以及推动GPT研究和工程落地的主要“幕后推手”，Brockman对此深有体会，“它并非试图像快速致富那样昙花一现，而是一直在缓慢积累价值，才有了指数级增长带来的巨大回报。”

人们好奇包括GPT-4、ChatGPT在内的模型在爆发前所经历的蛰伏和执着，尤其是有志于打造类GPT模型的研究者们很想知道，GPT模型是如何从最初的胚胎想法逐步被OpenAI培育成孩子的？这个孩子又将如何长成AGI？它在可预见的未来对这个世界会带来哪些变革？

对于这些疑惑，问Brockman再合适不过了。此前，在SXSW 23以及与Alexander Wang的两场对话中，他对此进行了详细阐述，OneFlow按QA形式进行了编译整理。（内容转载请联系OneFlow获得授权。）

1、ChatGPT的爆火

Q：ChatGPT是如何产生的？GPT模型当初发布时显得有些违反常识，但却在某种程度上掀起了最新的AI浪潮，这与你们当初构建这些技术时的预期是否一致?

**A：**ChatGPT、GPT-3、DALL·E 2这些模型看似一夜成名，但其实构建这些模型耗费了整整五年时间，饱含多年的心血。

GPT模型的构建要从2017年发布的情感神经元论文（Neural Sentiment Neuron: A novel Neural Architecture for Aspect-based Sentiment Analysis）说起，这篇论文的思想很新颖，不过很多人可能已经忘了。

OpenAI研究员Alec Radford对语言非常感兴趣，并致力于聊天机器人的研究。我们真的很喜欢Alec，非常支持他在我们去调研严肃项目时做任何他想做的事。

当时他负责的一个项目一直在训练LSTM模型，以此来预测亚马逊商品评价中的下一个字符。该模型能预测下一个字符，了解评价类型，还会像机器人一样学习，不过它也并非无所不知。

我们发现LSTM模型中的单个神经元有助于开发出SOTA情感分析分类器（sentiment analysis classifier），可以告知你文本情感（正面评价或负面评价），这一发现听起来平平无奇，但我们非常清楚地知道，这是一个超越语法并转向语义的时刻。

我们必须不断去推动。2017年底，Transformer问世，当时OpenAI联合创始人Ilya Sutskever立即发现这正是OpenAI一直在期待的模型。因此，尽管当时Transformer还并不完善，但我们基于它相继研发了GPT模型，基于对好的和糟糕的事实进行训练，以预测给定单词序列的下一个词。然后使用强化学习，让人类引导模型找到正确的答案。

我们内部运行的算法就是通过这些小方法来获取生存迹象（signs of life）。对于特定的数据集，必须非常小心才能区分出真正的生存迹象，否则就难以取得进展。但如果你的直觉准确，就会知道是时候加大算力和研究人员的投入，进行模型扩展了。

GPT-2的问世显然令人眼前一亮，通过函数曲线就知道模型越大，需要投入的算力和数据就越多，同时获得的工程细节就越多，曲线就变得更好了。我们的目标只是打破现有范式，不断改进模型，直到曲线趋于稳定。

一直到研发ChatGPT，我们所做的额外工作就是让模型更有“活力（alive）”，并创建了一个超级简单易用的交互界面，免费提供给所有人。

Q：ChatGPT是在去年11月底上线的，为什么会在这个节点发布？

**A：**准备发布ChatGPT时，我一直告诉团队，我们可以非常保守，比如拒绝做任何看起来有点草率的事情，最重要的是，不能在发布后的三天内就因为陷入舆论麻烦而关闭ChatGPT。

我们有数百个测试人员花了好几个月去做测试，但这与让它完全暴露在充满多样性和对抗性的真实用户使用环境中非常不同。

从2020年6月开始，我们已经做了很长时间的迭代部署，第一次开放产品的API给普通用户肯定很紧张，但我确信团队能应付自如。

Q：ChatGPT正式上线两个月内用户超过1亿，成为历史上增长最快的应用，而Facebook用了4.5年，TikTok用了9个月达到类似的成就。现在所有人都在讨论ChatGPT，为什么它会成为杀手级应用？

**A：**实际上，我经常思考这个问题，ChatGPT背后的模型大约是在一年前研发的，所以并不是新技术，但它的不同在于对话更具一致性，你真的可以和它对话，它会做你想要做的事。其次，我们让用户很容易就可以体验它的能力。

非常有趣的是，随着ChatGPT真正开始流行起来，人们可以看到，相当长一段时间内技术可能做到的事情以及实际能做的事情之间的差距。确保人们知道事物的发展方向真的很重要。对我来说，这也许是最大的收获。

Q：你认为生成式AI最有趣和最具颠覆性的用例是什么？

**A：**我想讲一个个人轶事。医疗诊治绝对是一个高风险领域。几年前，我妻子得了一种神秘的疾病，她的腹部右下方感到疼痛，会是阑尾炎吗？我们看了两个医生都认为是细菌感染，开了不同的抗生素，但都无济于事。第四个医生做了超声波检测才找到了病因。

而当我把那些症状输入到ChatGPT中，给出的答案是：第一，确保不是阑尾炎；第二，卵巢囊肿破裂，而这正是确诊的病因。但我不想让它取代医生，也不想让它告诉我去服用这种超级罕见的抗生素。

Q：ChatGPT有时会一本正经地胡说八道，就像醉酒的疯子。

**A：**确实，所以在使用过程中更要有信息甄别能力。其实ChatGPT的准确性很高，只是我们在训练过程中损坏了一些信息。我很高兴人们通过与其交流来缕清思路，只将其当做一种全天候待命的认知辅助工具。

Q：你能分享一下关于GPT模型未来版本的想法吗？它是否会更谨慎、更具创造力？

**A：**先解释下我们是如何构建这些系统的。**第一步，我们需要训练一个基础模型，它的目标只是预测下一个单词。**我们会给这个模型提供大量的文本数据，但并不会告诉它哪些信息是正确的。这个模型需要在这些文本数据中学习，并且在这个过程中必须考虑所有上下文信息来预测下一个词。所以这个模型同时也会习得偏见、意识形态和思想等信息。

**第二步是进行人类反馈的强化学习（RFHL），也被称为后期训练（post training）。**在这一阶段，我们会从大量的文本数据中选择有用的数据，告诉它如何正确地处理数据。

然而，还存在一个非常重要同时又非常棘手的问题，那就是AI应该做些什么？谁来作出这个决定？这是一个非常不同的议题，我们正在不懈努力让它具有合法性（legitimacy）。我们发现，基础模型本身实际上是根据其不确定性进行校准的，但这对后期训练来说是一项需要解决的工程性难题。

自去年12月以来，我们已经发布了四到五个不同版本的ChatGPT，例如事实准确性和幻觉问题均已得到了改善。这得益于通过后期训练不断改进。

我相信，未来我们将会拥有更加准确、能够自我检查工作质量、知道何时拒绝、何时提供帮助的GPT系统，同时还能协助人类完成更加艰巨的任务。

2、构建GPT模型的信念

Q：很多人在初次使用GPT-3时就深受震撼，尤其是模型的定性新行为（qualitatively new behaviors），而不只是模型在既定任务上的良好表现。你看到早期模型成果时是否会感到这很神奇？

**A：**当时的结果令我十分兴奋。我们只需要写出函数名称和文档字符串就能真正编写出函数，尽管不是十分复杂的函数，但它能够根据要求写出代码，做一些小小的修改就能满足需求。

有趣的是，以前我们认为模型只在特定数据分布中表现出色，一旦超出分布范围就会出现问题，而GPT-3的范式可以应用于不同的数据分布。你会发现模型具有泛化能力，而且对已知的数据，泛化能力更强。

那模型对于未知的数据的泛化能力怎么样？人类不太擅长未涉足的领域，而模型可以从大量不同配置中学习并提取有用信息，这简直不可思议。

Q：在开发GPT-3的过程中，需要投入大量的计算资源，而且实验也不一定能成功，这需要很大的信心和决心。在整个过程中，你是否怀疑过自己，或者是否相信只要不断进行尝试就能取得成功？

**A：**实现模型扩展并不是想当然的事，需要不断尝试才能找到最佳解决方案。有趣的是，当我们得到首个扩展结果时，确信这是正确的方法，可以一直推进，直至获得最佳结果。

我们研究DOTA这款游戏整整三年。一开始，我们对这款游戏一无所知，经过不断努力打败了游戏开发商内部的团队，最终成功击败职业团队。期间，我们进行模型扩展，并且解决所有bug，在每一个维度上不断迭代，从而获取更好的回报。这同样适用于GPT-2模型扩展，其迭代过程相当复杂，为此还需要分配出大量的计算资源，这需要具备坚定的信念。

另一方面，模型扩展是迭代的过程，因此你不必考虑会做出不可逆转的决定，因为每一步都能从现实中得到反馈，这样就可以从大局思考“如果这个方案成功了会怎样”。同时，还能确保你已为成功做好了准备。

不过，也不要盲目将一整年时间都花在可能不会取得预期结果的事上。平衡这两者才是关键所在。

Q：从DOTA和情感神经元中学到的东西是你们制胜的关键。虽然从外部看，这些零散的知识不是很直观，但将其整合在一起就为扩展和构建GPT-3指明了方向。这好像就是创新的方式：将各种实验成果整合在一起，就构建出了新事物。

**A：**这就是第一性原理的实践。

3、为何看好AI的发展

Q：2017年左右，AI算法还非常弱，但你就坚信AI的能力会逐渐提升，拥有很好的发展前景，为什么你会对AI有如此乐观的态度？

**A：**在某种程度上来说，这其实是一种直觉。我在上学时就对NLP非常感兴趣，还找了一位这方面的专家，请求与他做NLP方面的研究，他同意了。他给我讲解了一些NLP领域的相关内容，但听完后觉得，NLP不是我想要的东西，因为它没有正确的特性（properties），就好像我们在NLP系统中投入了大量精力，做了大量工作，但却无法说清楚语言到底是如何运转的，仿佛缺少了某种内在的东西。相反，神经网络的运作就非常清晰，神经网络系统就像海绵一样大量吸收数据、算力，它有正确的形状因子（form factor）。

但我们忽略了一件事，那就是这个神经网络能否被训练，要考虑是否有足够的数据、算力、是否有足够的能力等。

2012年，Alex的论文让神经网络重获关注，我认为这是神经网络领域取得的第一个重大成果。人们在计算机视觉研究方面花了几十年的时间，但CNN的出现让这一领域有了质的飞跃。

这就好像是一些原本彼此隔绝的部门的隔绝状态一天天被打破，清楚地表明某些事情即将发生，有某种巨大的潜力正在等待被挖掘。

Q：你们是否怀疑过技术方面的选择，还是说一直都很有信心，从未动摇过？

**A：**在这个过程中，我们难免会质疑所做的选择，怀疑策略是否正确，所做的事是否正确。比如我们会进行多次计算以确定模型大小，因为犯错在所难免，必须找出这背后的原因，毕竟不能指望AI去找原因。

扩展定律（scaling law）就是一个很好的例子，我们做这个研究是为了更科学地理解模型在各个函数图轴上的提升方式，我们不断给模型提供算力和数据，但终究有限。多年以后，我们突然意识到对这条函数曲线的理解有误，因此，我们又投入了大量的token和数据去训练模型。

从下游结论来看，训练数据太少，所以得出的结论就不太对。之后在某个时刻，你会突然意识到原来问题出在基本假设上，这样一切就都说得通了。

我一直有一种感觉，在工作中如果坚持不懈，不断探索，做到极致，将是最激动人心的时刻，这意味着我们触及到技术领域的极限，真正做成了一些事情，同时也意味着终于能看清下一步的方向。

Q：这让我想到了Stripe公司的运营原则之一：宏观上乐观，微观上悲观。这句话很能引起共鸣，在面对技术问题时，我们必须要做好最坏的打算，但显然，从长期来看，你对自己的工作一直很有信心。

**A：**是的，这是一个充满激情与活力，拥有强大力量的领域，我们要怀有敬畏。

这些模型最初只是一堆随机数字，在数字的基础上人们发展出了超级计算机，海量数据集，我们做了算法开发等大量的工程工作，然后再进行整合。

神经网络是独一无二的技术领域，从根本上来说，它就像是一块海绵，我们只需要喂入数据，就能训练出模型，这个模型可以重复使用，可以处理跨领域的工作。而传统软件需要人工去写下所有规则，从这些规则中得到反馈，人们也许可以利用Spark集群来处理一些事务，但我并不想这样做，我对神经网络更感兴趣。

Q：在创办OpenAI之前，你担任过Stripe首席技术官，这两家企业可以说都是业内标杆，但它们有何异同？

**A：**很有趣的一点是，当这两家公司面临问题时，采取的思维方式都是第一性原理思维。

Stripe在产品预发布时激起了一定的浪花，究其本质是我们在早期就拥有一定的客户。当时，一位做风险投资的朋友想知道产品预发布成功的秘诀。当我告诉他不过是改进了付款方式，他一脸的不可思议，但那其实就是秘密武器。

我们从第一性原理出发，即事物的本质出发去重新思考做事的方式，而非一味地照搬他人做法。我们会问自己：应该怎么做？难点在哪儿？有必要这样做吗？

OpenAI在AI领域做事的方式与之前相似。为了进军AI界，我们雇佣了很多接触过该领域的员工，不过也有人从未涉足过Ai，而是以初学者的身份进入AI界。在我看来，以这种方式进入一个未知领域能免受其常规做法的束缚，一切从零开始，排除外在因素的影响。

两家公司之间也存在差异。对Stripe而言，它开发了传统的Playbook，在思考出创新点后，就对产品进行构建、打磨，而且在构建产品的第一天就有目标客户。OpenAI则需要研究客户是谁，从2015年底开始，到2020年我们才拥有了第一款真正意义上的产品。

因此，要弄清楚做什么以及能做好什么，而对这些事情的思考都源于组织内部而非外部。

4、乐观看待AI的潜在风险

Q：人们对OpenAI的研究也有很多担忧，比较忧心技术方面潜在的负面影响。人们说AI将取代我们的工作。那么，哪些职业的风险最高？

**A：**过去，人们认为AI将首先替代那些从事体力劳动的工作，但实际情况并非如此。现在，AI在认知方面的发展已经取得了巨大进步（例如写诗），但在物理性质的事物发展上却没有非常大的进步。

这表明，AI的发展进程与人们的预期相差甚远。此外，仍有一些工作无法实现自动化，这表明人类的能力比我们想象得更强大。

作为一名程序员，我的期望是能够借助工具提高工作效率。目前，我们使用的AI代码助手Copilot能够自动补全代码，对于一些不太熟悉编程语言或特定的库函数的人来说非常有用。而ChatGPT更强大，可以帮助我们编写整个函数，或者根据需求编写聊天机器人框架。
未来的编码过程将会变得更加简化，我们只需做出设计决策，而不必亲自编写每一行代码，这将大大提高工作效率，同时也可以帮助我们在职业上更进一步。

Q：如果将认知能力都外包给AI，那么人类的智力会不会有下降风险？

**A：**这也是最让我彻夜难眠的事。放在以前，这种趋势可能会令人兴奋，但我发现，人们逐渐不再喜欢阅读和思考。所以在这项新技术来临之前，我们要确保如何使其成为人类的“智力倍增器”而非“削减器”。

人类真正需要的是能为我们分解问题的“导师”，而不是帮我们全盘解决问题的AI。正所谓授人以鱼不如授人以渔，只有这样我们才能走得更远。

Q：随着数据、算法和计算规模的不断增长，大公司会竞相构建更大、性能更好的超级计算机，而拥有更大的超级计算机就意味着比其他超级计算机更具优势，这种情况会成为未来的发展趋势吗？是否能找到一种更开放、更有用的方式，避免它成为大公司之间的竞争工具？

**A：**未来的发展趋势就像计算技术在更多领域的重演。未来仍然会出现只有少数人掌握的越来越庞大的超级计算机，能创建出常人无法构建的超级大模型，但这并不会削弱人们利用这些模型所做事情的价值。

我认为，超级强大的、具有双重用途的、极度复杂的系统，像风力涡轮机那样将分散在各处的、更加容易掌控的系统之间进行权衡是很重要的。对于非常强大的新兴技术，必须采取双重解决方案。

随着技术的发展，人们对AI的看法也发生了变化，开始发现AI真的有用。朋友们，是时候开始构建（AI）了。

Q：有研究表明，当前科学发展的脚步整体上在放缓，而AI相对在逐步加速甚至正走向复兴。你是否担心AI的发展在未来也会放缓？

**A：****事物总是呈S型曲线发展，而且通常会有范式转变。**Ray Kurzweil的《奇点临近》一书介绍了计算机不同行业的发展曲线，展示了各种性能的时间变化。100年来，我们差不多经历了五次不同的范式转变，才创造出了当前的计算机。我们当下在做的事情也会是S形曲线，并出现范式转变，这体现了人类的创造力。

**另一方面，范式是否发生转变并不重要。**现在AI的重点是它的用途，我们希望通过AI来提升计算机的能力，让计算机发挥更大的作用，当然，它也带来了一些新问题，但总的来说，它解决的问题要比创造的问题多得多，并且改变了人类的交互方式。

在AI领域，我们取得了一些新的突破，以GitHub Copilot为例，它能在很低的时延下完成代码的自动编写，但如果时延超过了1500毫秒，那么该工具就没有人会使用。

现在有些事情人类实现不了，但可以用机器来辅助我们完成，这才是重点。如果我们正在做的事情发展进入停滞，也并不影响它们能创造的价值。

Q：你对AI发展的最大顾虑是什么？

**A：**人们对于AI的看法一直都比较有意思。如果回到十年前，你翻开任何一篇文章，或者说问街上的任何一个人关于AI的看法，一定都是负面的，人们对于AI的看法一直都比较复杂，混合着恐惧的情绪。人们有时能看到AI的潜力，有时看不到，但是大家一直在试图看清AI。

我完全赞同人们所说的，既要看到AI好的一面，也要看到坏的一面，不能做一个盲目的乐观主义者，也不能完全悲观，好像人类快要走向灭亡一样，这两种看法都是有问题的。

AI发展将经历不同的发展阶段。现在面临的最大挑战是滥用问题，系统本身还不是那么强大，但其实问题的根源在于背后的人心，虽然文字具有强大的力量，但不会直接影响这个世界，问题出在人们的行动上。我们要在社会和技术层面找到避免滥用的方法并对系统进行监督，这至关重要。

另外，将来系统本身会变得十分强大，假设系统在没有监控的情况下与多人互动，将产生什么样的影响？对于这种情况OpenAI已经有所警觉，我们要建造与全人类价值观相符的系统，有选择性地让特定价值观进入到系统当中。当然，要做到这一点并不容易。

5、AI的未来发展方向

Q：AI在哪些方面有值得期待的应用场景？

**A：**AI真正能做的是增强人类现有的能力，在写作、编程和娱乐等知识工作方面就是如此。最令我感到兴奋的是，技术门槛将会降低。对于那些有创意并想付诸实践的人来说，AI会为他们提供一个“完整的创意工作室”。专业人士也将有机会创造出比任何业余人士都更好的东西。

**AI不仅不会使人们的技能消失，反而还会使生产力倍增。**比如激发人们的创造力，不会画画的人现在可以通过模型创造出各种图像，现在我们可以让自己脑海中的画面真正出现在纸面上。比如3D设计师们可以先利用DALL·E对他们想要的东西进行渲染，然后再开始制作。

很多人都看过《权力的游戏》，但我知道结局却没能遂每个人的愿。有了AI，人们就可以制作自己想要的结局，甚至将自己作为主角代入其中。有人可能会说“我并不需要”，但这就像口袋里的手机，你可以不用，但需要的时候，它就能派上用场。

Q：你怎么看待AI的未来？

**A：**AI仍然会是一个活跃且多变的领域，它的发展也许会出乎所有人的意料。我们的任务是尽可能地为AI发展提供便利。

最早一批利用GPT-3提供服务的客户估值已经达到了数十亿美元。看着模型为如此多的人创造巨大价值，是一件很有成就感的事情。

未来十年，这些模型将快速发展，应用将无处不在。**AI的发展会和互联网类似，**1990年，人们对互联网还知之甚少，21世纪初，人们开始对互联网感兴趣，这时机遇与挑战并存。现在，互联网已经成为商业发展中不可分割的一部分。

**我们的任务就是开发通用人工智能，去建造出一种能够处理所有任务的全能机器，并将这一技术开发到极致，让它们在最具经济价值的工作上达到超越人类的表现。**要做到这种程度只是时间问题，当这些工具真的发展到了如此有创造性的地步，且能够超越人类的时候，它们甚至会自发地开始工作。

未来，我们还不知道AI的价值会如何分配，也不知道该如何利用AI来解决人们目前难以应对的挑战，例如气候变化、大学教育等等。

Q：这些技术出现的时机也很有意思，去年，人人都在讨论Web 3.0是加密货币（crypto），但如今看来，AI才是真正的Web 3.0。

**A：**我们会拿下Web 4.0。

Q：你提到两个非常有意思的方向，一是GPT模型等现存技术的进步，它们在商业上的应用越来越广泛，二是通用人工智能算法的持续提升。目前来看，AGI的发展方向会是怎样的？

**A：**人类很早以前就开始了对通用人工智能的研究，这点仅从神经网络的发展历史就可以看出。2012年是改变世界的一年，算力需求每年增长10倍，而且还在持续增长。回报开始变得可预期，所以我们要投入更多的资金来建造大规模的超级计算机。

通过注入更多算力、更好地利用反向传播神经网络技术，构建更强大的模型，这个流程是很固定的。但其中的细节可能会有所变化，比如你想要开发GPT模型还是Whisper、注入语音数据还是从互联网注入文本数据，这些细节可能很重要，这关系到你要做什么，要下载什么资源。但如果放大视角看待这项技术，这又没那么重要。

我们学会了利用扩展定律来进行所有的科学调整，务必要确保这些模型不仅聪明，而且与人类的意图保持一致。我们的目标是每年都做一些以前不可能做成的事情。

**我们正在构建的东西就跟构建计算机一样。**在摩尔定律的辉煌时期，新芯片层出不穷。因为要想建立最好的计算机，只需要不断构建下一个最好的芯片，并持续对技术中的各部分进行改进。

参考文献：

[1] https://aibusiness.com/nlp/sxsw-23-openai-co-founder-shares-the-story-behind-chatgpt

[2] https://www.youtube.com/watch?v=Rp3A5q9L_bg

[3] https://www.youtube.com/watch?v=YNkxVDAiA1Q

你可能感兴趣的:(OpenAI,chatgpt,语言模型)

LLM中最后一个词语的表征（隐藏状态）通常会融合前面所有词语的信息吗？ ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python 机器学习算法深度学习人工智能
LLM中最后一个词语的表征（隐藏状态）通常会融合前面所有词语的信息吗？在大语言模型（LLM）中，最后一个词语的表征（隐藏状态）通常会融合前面所有词语的信息，这是由LLM的核心架构（以Transformer为基础）决定的，具体可以从以下角度理解：1.核心机制：自注意力（Self-Attention）的作用现代LLM（如GPT系列、Qwen等）均基于Transformer架构，其核心是自注意力机制。在
Xcode 26 现已发布，并支持代码智能它与基于 Cursor 和 AI Agent 的工作流程相比如何？知识大胖 SwiftUI源码大全 xcode macos ide
简介Xcode26昨天发布了！惊喜的是，它支持macOS15，但要使用新的ChatGPT助手，你需要macOS26Tahoe。所以我把我的M3MaxMacBookPro升级到了Tahoe。我不是说你应该升级，但我这么做是为了测试Xcode的新功能并与大家分享！值得注意的是，这是迄今为止最小的Xcode版本（下载大小）！正如Apple在Xcode新功能会话视频（我建议您观看）中所说的那样，这是一项巨
AI MCP教程之什么是 MCP？利用本地 LLM 、MCP、DeepSeek 集成构建您自己的 AI 驱动工具知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 mcp deepseek
介绍利用模型上下文协议(MCP)的工具吸引了我们的注意力—将AI变成触手可及的生产力引擎。它们巧妙、高效，让人难以抗拒。但如果您可以将这样的功能添加到自己的工具中，会怎么样呢？在本指南中，我将引导您构建一个具有本地运行的大型语言模型(LLM)和MCP集成的AI工具-让您以类似的方式自动执行利用MCP的工具您喜欢的任务。推荐文章《AnythingLLM教程系列之12AnythingLLM上的Olla
12 个强大的 DeepSeek AI 提示将彻底改变您的日常生活知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 deepseek
内容写作的最佳提示让我们从写作开始吧。无论您是博主、学生还是社交媒体创作者，这些提示都将帮助您创作出精彩的内容。提示1：“扮演专业文案撰稿人，为[产品/服务]撰写引人注目的广告文案。文案应引人入胜、具有说服力，且字数不得超过100个字。”这使得ChatGPT的响应结构就像真实的广告文案一样。提示2：“以更具吸引力和说服力的方式重写此段落，同时保持含义不变：[插入文本]。”推荐文章《Neo4j上使用
24GB GPU 中的 DeepSeek R1：Unsloth AI 针对 671B 参数模型进行动态量化知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 deepseek ollama
简介最初的DeepSeekR1是一个拥有6710亿个参数的语言模型，UnslothAI团队对其进行了动态量化，将模型大小减少了80%（从720GB减少到131GB），同时保持了强大的性能。当添加模型卸载功能时，该模型可以在24GBVRAM下以低令牌/秒的推理速度运行。推荐文章《本地构建AI智能分析助手之01快速安装，使用PandasAI和Ollama进行数据分析，用自然语言向你公司的数据提问为决策
在 Obsidian 中本地使用 DeepSeek — 无需互联网！知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 deepseek
简介您是否想在Obsidian内免费使用类似于ChatGPT的本地LLM？如果是，那么本指南适合您！我将引导您完成在Obsidian中安装和使用DeepSeek-R1模型的确切步骤，这样您就可以在笔记中拥有一个由AI驱动的第二大脑。推荐文章《24GBGPU中的DeepSeekR1：UnslothAI针对671B参数模型进行动态量化》权重1，DeepSeek类《在RaspberryPi上运行语音识别
Llama-Omni会说话的人工智能“语音到语音LLM” 利用低延迟、高质量语音转语音 AI 彻底改变对话方式（教程含源码）知识大胖 NVIDIA GPU和大语言模型开发教程 llama 人工智能 nvidia llm
介绍“单靠技术是不够的——技术与文科、人文学科的结合，才能产生让我们心花怒放的成果。”——史蒂夫·乔布斯近年来，人机交互领域发生了重大变化，尤其是随着ChatGPT、GPT-4等大型语言模型(LLM)的出现。虽然这些模型主要基于文本，但人们对语音交互的兴趣日益浓厚，以使人机对话更加无缝和自然。然而，实现语音交互而不受语音转文本处理中常见的延迟和错误的影响仍然是一个挑战。关键字：Llama-Omni
OpenWebUI系列之如何通过docker自动将其更新到OpenWebUI最新版本知识大胖 NVIDIA GPU和大语言模型开发教程 docker llm openwebui
实战需求OpenWebUI是一个可扩展、功能丰富且用户友好的自托管WebUI，旨在完全离线运行。它支持各种LLM运行器，包括Ollama和OpenAI兼容API。如何通过docker自动将其更新到OpenWebUI最新版本？系列文章《OpenWebUI系列之如何通过docker更新到OpenWebUI的最新版本》权重0，本地类、opewebui类《OpenWebUI系列之如何通过docker自动将
AnythingLLM教程系列之 09 AnythingLLM 支持自定义音频转录提供程序知识大胖 NVIDIA GPU和大语言模型开发教程 llama3 anythingllm llm
什么是AnythingLLM?AnythingLLM是最易于使用的一体化AI应用程序，可以执行RAG、AI代理等操作，且无需任何代码或基础设施难题。您需要为您的企业或组织提供一款完全可定制、私有且一体化的AI应用程序，该应用程序基本上是一个具有许可的完整ChatGPT，但具有任何LLM、嵌入模型或矢量数据库。如何安装《无需任何代码构建自己的大模型知识库：AnythingLLM最易于使用的一体化AI
AnythingLLM教程系列之 04 AnythingLLM 允许您以正确的格式导出聊天日志，以构建 GPT-3.5 和 OpenAI 上其他可用模型的微调模型（教程含安装步骤）知识大胖 NVIDIA GPU和大语言模型开发教程 llama3 ai anythinllm llama
什么是AnythingLLM?AnythingLLM是最易于使用的一体化AI应用程序，可以执行RAG、AI代理等操作，且无需任何代码或基础设施难题。您需要为您的企业或组织提供一款完全可定制、私有且一体化的AI应用程序，该应用程序基本上是一个具有许可的完整ChatGPT，但具有任何LLM、嵌入模型或矢量数据库。如何安装《无需任何代码构建自己的大模型知识库：AnythingLLM最易于使用的一体化AI
【AI大模型】LLM模型架构深度解析：BERT vs. GPT vs. T5 我爱一条柴ya 学习AI记录 ai 人工智能 AI编程 python
引言Transformer架构的诞生（Vaswanietal.,2017）彻底改变了自然语言处理（NLP）。在其基础上，BERT、GPT和T5分别代表了三种不同的模型范式，主导了预训练语言模型的演进。理解它们的差异是LLM开发和学习的基石。一、核心架构对比特性BERT(BidirectionalEncoder)GPT(GenerativePre-trainedTransformer)T5(Text
[论文阅读]Distilling Step-by-Step! Outperforming Larger Language Models with Less Training Data and Smal 0x211 论文阅读语言模型人工智能自然语言处理
中文译名：逐步蒸馏！以较少的训练数据和较小的模型规模超越较大的语言模型发布链接：http://arxiv.org/abs/2305.02301AcceptedtoFindingsofACL2023阅读原因：近期任务需要用到蒸馏操作，了解相关知识核心思想：改变视角。原来的视角：把LLMs视为噪声标签的来源。现在的视角：把LLMs视为能够推理的代理。方法好在哪？需要的数据量少，得到的结果好。文章的方法
【实战AI】macbook M1 本地ollama运行deepseek 东方鲤鱼 chat AI macos ai llama AIGC chatgpt
由于deepseek官网或者Aapi调用会有网络延迟或不响应的情况，故在本地搭建部署；前提条件1.由于需要拉取开源镜像，受网络限制，部分资源在前提中会下载的更快！请自行；2.设备macbookM132G下载ollamaOllama是一款跨平台推理框架客户端（MacOS、Windows、Linux），专为无缝部署大型语言模型（LLM）（如Llama2、Mistral、Llava等）而设计。通过一键式
LLaMA-Omni 深度解析：打开通往无缝人机语音交互的大门 kakaZhui 前沿多模态大模型：论文与实战 llama 交互 LLM TTS 语音识别语音合成人工智能
一、引言：语音交互大模型今天我们来看语音交互大模型LLaMA-Omni，它由中国科学院计算技术研究所的研究者们推出，是一个基于强大的Llama-3.1-8B-Instruct构建的语音语言模型。LLaMA-Omni不仅实现了低至226ms的惊人交互延迟，还能同时生成高质量的文本与语音回复，真正意义上让大语言模型（LLM）具备了“听说”的能力。这篇博客将带你由浅入深，全方位地探索LLaMA-Omni
低成本作弊神器？使用ESP32将通义千问AI接入学生计算器
前因：IT之家9月24日消息，YouTube频道ChromaLock于9天前发布视频，介绍了名为TI-32的改造电路板，加装在德州仪器TI-84Plus图形计算器上，可以接入ChatGPT。IT之家查询公开资料，在PSAT、SAT和ACT大学入学考试、IB和AP考试中，标准化组织已经批准考生使用TI-84Plus图形计算器。ChromaLock探索了该计算器的连接端口，设计了名为TI-32的改造电
MCP协议：AI时代的“万能插座”如何重构IT生态与未来
MCP协议：AI时代的“万能插座”如何重构IT生态与未来在人工智能技术爆炸式发展的浪潮中，一个名为ModelContextProtocol（MCP）的技术协议正以惊人的速度重塑IT行业的底层逻辑。2024年11月由Anthropic首次发布，MCP在短短半年内获得OpenAI、谷歌、亚马逊、阿里、腾讯等全球科技巨头的支持，被业内誉为AI时代的HTTP协议或USB-C接口，正在成为连接大模型与现实世
在LLM快速迭代时代构建持久AI应用：架构设计与实施策略
引言：技术浪潮下的开发困境大型语言模型(LLM)的发展速度令人瞠目：从GPT-3到GPT-4，从Claude1到Claude3，从Llama1到Llama3，迭代周期正在从"年"缩短到"月"。作为一名AI应用开发者，我亲身经历了这种技术浪潮带来的挑战：昨天精心调优的prompt今天可能失效；上个季度集成的模型这个季度已有更优选择；刚完成的功能设计瞬间被新模型的能力超越。在如此快速变化的环境中，如何
AI Agent 2025 大爆发：从 GPT-4o 到 Devin，下一代 Agent 架构与落地趋势深度解析
当大模型学会“看”“听”“点鼠标”，并且还能叫来一整个“Agent舰队”协同工作，软件开发、运营乃至个人生产力的游戏规则正在被重写。1|为什么Agent在2025重新引爆？模型升级带来实时多模态OpenAIGPT-4o把文本、语音、图像三路感知和毫秒级响应塞进同一模型，实时demo像“科幻电影走出屏幕”OpenAI。浏览器级自动操作新上线的OperatorAgent能在Web页面自主点击、滚动、填
ChatGPT 技术核心：模型结构、能力差异与实战价值
ChatGPT系列模型全景与版本进化按时间与技术路标排序，核心模型如下：GPT‑3.5（2022）GPT‑4（2023年3月）GPT‑4Turbo/GPT‑4.5（2023年末/2025年2月）GPT‑4o（Omni）（2024年5月）GPT‑4o mini/o1/o3系列/GPT‑4.1（2024–2025）每一代都是对前代提升版本，从参数规模、性能、能力上不断优化。核心技术差异详解（面向高级程
大型语言模型（LLM, Large Language Models）基模和 Chat 模型之间的区别
一、概述最近看大模型相关的知识，有看到大模型都有基础模型（base）和对话模型（chat），不太清楚什么时候用到基础模型，什么时候用到对话模型，故有此文。通过了解，最简单的概述就是基于基础模型会训练出一个对话（Chat）模型，对话模型主要用于对话场景，基础模型主要做文本生成，没有上下文对话的能力。在模型命名上也能看出来区别，例如：Qwen-72B和Qwen-72B-ChatChatGLM3-6B-
SpringBoot集成LangChain4j：构建智能AI应用全解析 java干货仓库八股文汇总 Spring 大模型 spring boot 人工智能后端
在企业级应用中融入大语言模型(LLM)能力已成为趋势，而LangChain4j作为专为Java设计的LLM集成框架，与SpringBoot的结合为开发者提供了强大而灵活的解决方案。本文将从基础概念到高级应用，全面解析如何利用这一组合构建智能AI应用。一、LangChain4j概述1.1什么是LangChain4j？LangChain4j是一个开源Java框架，灵感来源于Python的LangCha
【Python】OpenAI API 宅男很神经 python 开发语言
【Python与OpenAIAPI深度探索：从基础到未来】第一章：OpenAIAPI概览与核心概念1.1OpenAIAPI是什么？能做什么？OpenAIAPI(ApplicationProgrammingInterface，应用程序编程接口)是一套允许开发者通过编程方式访问和使用OpenAI开发的各种先进人工智能模型的服务。这些模型经过海量数据的训练，能够在多种任务上达到甚至超越人类水平。通过AP
chatgpt赋能python：Python音频降噪处理：使用Python减少噪音并提升声音质量
Python音频降噪处理：使用Python减少噪音并提升声音质量在日常生活中，使用音频通信是非常普遍的。但是，由于各种原因，我们可能会遇到许多噪音干扰，从而降低语音质量并影响通信的效果。为了解决这个问题，我们可以使用Python来降噪音。什么是音频降噪处理？我们每天听到的声音都是由许多不同频率的声音波形组成的。噪音是指在声音中添加了其他频率的声音波形。这些声音可以是来自电器的嗡嗡声、风扇或其他背景
详解LLMOps，将DevOps用于大语言模型开发
大家好，在机器学习领域，随着技术的不断发展，将大型语言模型（LLMs）集成到商业产品中已成为一种趋势，同时也带来了许多挑战。为了有效应对这些挑战，数据科学家们转向了一种新型的DevOps实践LLM-OPS，专为大型语言模型的开发和维护而设计。本文将介绍LLM-OPS的核心思想，并分析这一策略如何帮助数据科学家更高效地运用DevOps的优秀实践，从而在语言模型的开发和部署过程中，提升工作效率和成果的
chatgpt赋能python：Python降噪技术突出人声，在语音处理中的应用 atest166 ChatGpt chatgpt python 语音识别计算机
Python降噪技术突出人声，在语音处理中的应用在现代社会中，语音处理已经成为了一个普遍的技术，由于环境干扰和录音设备的限制，录音中往往会有许多杂音和噪音，影响语音质量和信号分析。在此背景下，降噪技术逐渐成为了一项重要的技术手段。Python作为一门功能强大的编程语言，可以被广泛地应用于语音处理，尤其是在降噪方面。在本篇文章中，我们会详细探讨Python降噪技术突出人声的应用。什么是语音降噪？语音
大模型微服务架构：拆解AI应用的资源密码陈乔布斯大模型 AI 人工智能人工智能架构微服务 AI 大模型 python API
引言：为什么大模型应用需要微服务架构？想象你经营一家网红餐厅，刚开始只有一个厨师负责所有菜品（类似单体架构）。随着生意火爆，顾客需要川菜、粤菜、甜品等多种选择，单个厨师忙不过来，还经常出错。于是你招聘了川菜师傅、粤菜师傅、甜品师，每人专注一个领域（类似微服务架构），效率和质量立刻提升——这就是大模型应用从单体架构转向微服务的核心原因。随着ChatGPT、文心一言等大模型技术的爆发，互联网企业正将大
Agent与自主系统之核心概念与架构解析陈乔布斯 AI 人工智能大模型架构人工智能 AI python Agent 大模型智能体
引言：从智能助手到自主决策者想象一下，当你清晨醒来，智能家居系统已经根据你的睡眠数据和日程安排，自动调节了室内温度、煮好了咖啡，并推送了个性化的早间新闻摘要。这一切背后，正是Agent在默默工作——它们不再是被动执行指令的工具，而是能够感知环境、自主决策并持续优化的"数字同事"。2025年，Agent技术迎来爆发式发展。从OpenAI的Operator能独立完成餐厅预订和购物，到智谱的AutoGL
代码与 AI 的交响乐：探索 avante.nvim 的智能编程革命步子哥人工智能
在编程的世界里，代码不仅是逻辑的堆砌，更是一场思想与技术的交响乐。avante.nvim，一个运行在Neovim上的AI驱动插件，正以其智能化的代码补全、生成和编辑功能，为开发者奏响一曲高效与创新的乐章。本文将带你走进avante.nvim的世界，探索它如何通过大语言模型（LLM）和上下文感知机制，重新定义编程的艺术与科学。从灵感火花到代码现实：AI驱动的编程新时代想象一下，你正在编写一个复杂的P
零代码玩转大模型！LLaMA Factory：你的专属模型精修师 jane_xing 人工智能 llama
你是否曾对大语言模型（LLM）的强大能力心驰神往，却苦于以下难题？想定制专属模型？微调代码看不懂，环境配置太复杂…硬件资源有限？动辄需要数张A100，普通设备望而却步…中文任务不给力？原生模型中文理解弱，效果难达预期…部署门槛高？模型优化、压缩、服务化步步是坎？好消息是：LLaMAFactory来拯救你啦！它就像一家功能齐全的“模型精修店”，让你无需深厚AI功底，也能轻松定制、优化和部署大模型！一
掌握LLM工程课，让你的AI之旅充满惊喜
掌控AI时代的密码：深入LLM工程课程在人工智能迅猛发展的今天，对大语言模型（LLM）的深入理解和应用能力已经成为引领技术潮流的重要基石。为了帮助更多人掌握这项核心技术，特此分享关于LLM工程的一项出色在线课程。这门课程引导您通过一段为期八周的旅程，掌握AI及大语言模型的精髓，从而达到熟练应用的水平。探索LLM的世界课程以项目为驱动，通过循序渐进的学习模块，帮助您在LLM的世界中行稳致远。每周的内
LeetCode[位运算] - #137 Single Number II Cwind java Algorithm LeetCode 题解位运算
原题链接：#137 Single Number II 要求：给定一个整型数组，其中除了一个元素之外，每个元素都出现三次。找出这个元素注意：算法的时间复杂度应为O(n)，最好不使用额外的内存空间难度：中等分析：与#136类似，都是考察位运算。不过出现两次的可以使用异或运算的特性 n XOR n = 0, n XOR 0 = n，即某一
《JavaScript语言精粹》笔记 aijuans JavaScript
0、JavaScript的简单数据类型包括数字、字符创、布尔值（true/false）、null和undefined值，其它值都是对象。 1、JavaScript只有一个数字类型，它在内部被表示为64位的浮点数。没有分离出整数，所以1和1.0的值相同。 2、NaN是一个数值，表示一个不能产生正常结果的运算结果。NaN不等于任何值，包括它本身。可以用函数isNaN(number)检测NaN,但是
你应该更新的Java知识之常用程序库 Kai_Ge java
在很多人眼中，Java 已经是一门垂垂老矣的语言，但并不妨碍 Java 世界依然在前进。如果你曾离开 Java，云游于其它世界，或是每日只在遗留代码中挣扎，或许是时候抬起头，看看老 Java 中的新东西。 Guava Guava[gwɑ:və]，一句话，只要你做Java项目，就应该用Guava（Github）。 guava 是 Google 出品的一套 Java 核心库，在我看来，它甚至应该
HttpClient 120153216 httpclient
/** * 可以传对象的请求转发，对象已流形式放入HTTP中 */ public static Object doPost(Map<String,Object> parmMap,String url) { Object object = null; HttpClient hc = new HttpClient(); String fullURL
Django model字段类型清单 2002wmj django
Django 通过 models 实现数据库的创建、修改、删除等操作，本文为模型中一般常用的类型的清单，便于查询和使用： AutoField：一个自动递增的整型字段，添加记录时它会自动增长。你通常不需要直接使用这个字段；如果你不指定主键的话，系统会自动添加一个主键字段到你的model。(参阅自动主键字段) BooleanField：布尔字段,管理工具里会自动将其描述为checkbox。 Cha
在SQLSERVER中查找消耗CPU最多的SQL 357029540 SQL Server
返回消耗CPU数目最多的10条语句 SELECT TOP 10 total_worker_time/execution_count AS avg_cpu_cost, plan_handle, execution_count, (SELECT SUBSTRING(text, statement_start_of
Myeclipse项目无法部署，Undefined exploded archive location 7454103 eclipse MyEclipse
做个备忘！错误信息为： Undefined exploded archive location 原因：在工程转移过程中，导致工程的配置文件出错；解决方法：
GMT时间格式转换 adminjun GMT 时间转换
普通的时间转换问题我这里就不再罗嗦了，我想大家应该都会那种低级的转换问题吧，现在我向大家总结一下如何转换GMT时间格式，这种格式的转换方法网上还不是很多，所以有必要总结一下，也算给有需要的朋友一个小小的帮助啦。 1、可以使用 SimpleDateFormat SimpleDateFormat EEE-三位星期 d-天 MMM-月 yyyy-四位年
Oracle数据库新装连接串问题 aijuans oracle数据库
割接新装了数据库，客户端登陆无问题，apache/cgi-bin程序有问题，sqlnet.log日志如下： Fatal NI connect error 12170. VERSION INFORMATION: TNS for Linux: Version 10.2.0.4.0 - Product
回顾java数组复制 ayaoxinchao java 数组
在写这篇文章之前，也看了一些别人写的，基本上都是大同小异。文章是对java数组复制基础知识的回顾，算是作为学习笔记，供以后自己翻阅。首先，简单想一下这个问题：为什么要复制数组？我的个人理解：在我们在利用一个数组时，在每一次使用，我们都希望它的值是初始值。这时我们就要对数组进行复制，以达到原始数组值的安全性。java数组复制大致分为3种方式：①for循环方式 ②clone方式 ③arrayCopy方
java web会话监听并使用spring注入 bewithme Java Web
在java web应用中，当你想在建立会话或移除会话时，让系统做某些事情，比如说，统计在线用户，每当有用户登录时，或退出时，那么可以用下面这个监听器来监听。 import java.util.ArrayList; import java.ut
NoSQL数据库之Redis数据库管理(Redis的常用命令及高级应用) bijian1013 redis 数据库 NoSQL
一 .Redis常用命令 Redis提供了丰富的命令对数据库和各种数据库类型进行操作，这些命令可以在Linux终端使用。 a.键值相关命令 b.服务器相关命令 1.键值相关命令 &
java枚举序列化问题 bingyingao java 枚举序列化
对象在网络中传输离不开序列化和反序列化。而如果序列化的对象中有枚举值就要特别注意一些发布兼容问题: 1.加一个枚举值新机器代码读分布式缓存中老对象，没有问题，不会抛异常。老机器代码读分布式缓存中新对像，反序列化会中断，所以在所有机器发布完成之前要避免出现新对象，或者提前让老机器拥有新增枚举的jar。 2.删一个枚举值新机器代码读分布式缓存中老对象，反序列
【Spark七十八】Spark Kyro序列化 bit1129 spark
当使用SparkContext的saveAsObjectFile方法将对象序列化到文件，以及通过objectFile方法将对象从文件反序列出来的时候，Spark默认使用Java的序列化以及反序列化机制，通常情况下，这种序列化机制是很低效的，Spark支持使用Kyro作为对象的序列化和反序列化机制，序列化的速度比java更快，但是使用Kyro时要注意，Kyro目前还是有些bug。 Spark
Hybridizing OO and Functional Design bookjovi erlang haskell
推荐博文： Tell Above, and Ask Below - Hybridizing OO and Functional Design 文章中把OO和FP讲的深入透彻，里面把smalltalk和haskell作为典型的两种编程范式代表语言，此点本人极为同意，smalltalk可以说是最能体现OO设计的面向对象语言，smalltalk的作者Alan kay也是OO的最早先驱，
Java-Collections Framework学习与总结-HashMap BrokenDreams Collections
开发中常常会用到这样一种数据结构，根据一个关键字，找到所需的信息。这个过程有点像查字典，拿到一个key，去字典表中查找对应的value。Java1.0版本提供了这样的类java.util.Dictionary(抽象类)，基本上支持字典表的操作。后来引入了Map接口，更好的描述的这种数据结构。 &nb
读《研磨设计模式》-代码笔记-职责链模式-Chain Of Responsibility bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 业务逻辑：项目经理只能处理500以下的费用申请，部门经理是1000，总经理不设限。简单起见，只同意“Tom”的申请 * bylijinnan */ abstract class Handler { /*
Android中启动外部程序 cherishLC android
1、启动外部程序引用自： http://blog.csdn.net/linxcool/article/details/7692374 //方法一 Intent intent=new Intent(); //包名包名+类名（全路径） intent.setClassName("com.linxcool", "com.linxcool.PlaneActi
summary_keep_rate coollyj SUM
BEGIN /*DECLARE minDate varchar(20) ; DECLARE maxDate varchar(20) ;*/ DECLARE stkDate varchar(20) ; DECLARE done int default -1; /* 游标中注册服务器地址 */ DE
hadoop hdfs 添加数据目录出错 daizj hadoop hdfs 扩容
由于原来配置的hadoop data目录快要用满了，故准备修改配置文件增加数据目录，以便扩容，但由于疏忽，把core-site.xml, hdfs-site.xml配置文件dfs.datanode.data.dir 配置项增加了配置目录，但未创建实际目录，重启datanode服务时，报如下错误： 2014-11-18 08:51:39,128 WARN org.apache.hadoop.h
grep 目录级联查找 dongwei_6688 grep
在Mac或者Linux下使用grep进行文件内容查找时，如果给定的目标搜索路径是当前目录，那么它默认只搜索当前目录下的文件，而不会搜索其下面子目录中的文件内容，如果想级联搜索下级目录，需要使用一个“-r”参数： grep -n -r "GET" . 上面的命令将会找出当前目录“.”及当前目录中所有下级目录
yii 修改模块使用的布局文件 dcj3sjt126com yii layouts
方法一：yii模块默认使用系统当前的主题布局文件，如果在主配置文件中配置了主题比如: 'theme'=>'mythm', 那么yii的模块就使用 protected/themes/mythm/views/layouts 下的布局文件；如果未配置主题，那么 yii的模块就使用 protected/views/layouts 下的布局文件，总之默认不是使用自身目录 pr
设计模式之单例模式 come_for_dream 设计模式单例模式懒汉式饿汉式双重检验锁失败无序写入
今天该来的面试还没来，这个店估计不会来电话了，安静下来写写博客也不错，没事翻了翻小易哥的博客甚至与大牛们之间的差距，基础知识不扎实建起来的楼再高也只能是危楼罢了，陈下心回归基础把以前学过的东西总结一下。 *********************************
8、数组豆豆咖啡二维数组数组一维数组
一、概念数组是同一种类型数据的集合。其实数组就是一个容器。二、好处可以自动给数组中的元素从0开始编号，方便操作这些元素三、格式 //一维数组 1,元素类型[] 变量名 = new 元素类型[元素的个数] int[] arr =
Decode Ways hcx2013 decode
A message containing letters from A-Z is being encoded to numbers using the following mapping: 'A' -> 1 'B' -> 2 ... 'Z' -> 26 Given an encoded message containing digits, det
Spring4.1新特性——异步调度和事件机制的异常处理 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
squid3(高命中率)缓存服务器配置 liyonghui160com
系统:centos 5.x 需要的软件:squid-3.0.STABLE25.tar.gz 1.下载squid wget http://www.squid-cache.org/Versions/v3/3.0/squid-3.0.STABLE25.tar.gz tar zxf squid-3.0.STABLE25.tar.gz &&
避免Java应用中NullPointerException的技巧和最佳实践 pda158 java
1) 从已知的String对象中调用equals()和equalsIgnoreCase()方法，而非未知对象。　　总是从已知的非空String对象中调用equals()方法。因为equals()方法是对称的，调用a.equals(b)和调用b.equals(a)是完全相同的，这也是为什么程序员对于对象a和b这么不上心。如果调用者是空指针，这种调用可能导致一个空指针异常 Object unk
如何在Swift语言中创建http请求 shoothao http swift
概述：本文通过实例从同步和异步两种方式上回答了”如何在Swift语言中创建http请求“的问题。如果你对Objective-C比较了解的话，对于如何创建http请求你一定驾轻就熟了，而新语言Swift与其相比只有语法上的区别。但是，对才接触到这个崭新平台的初学者来说，他们仍然想知道“如何在Swift语言中创建http请求？”。在这里,我将作出一些建议来回答上述问题。常见的
Spring事务的传播方式 uule spring事务
传播方式：新建事务 required required_new - 挂起当前非事务方式运行 supports &nbs