九三智能控v

少数派实测报告：AI巨无霸模型GPT-3 | 附送API 调用方法「AI核心算法」

关注：决策智能与机器学习，深耕AI脱水干货

作者 | Max Woolf

编译 | 刘淑雯

编译 | 林檎

报道 | 数据实战派

编者按：在今年5月29日，OpenAI 发表了一篇关于 GPT-3 的论文，论文描述了他们的下一代基于 Transformers 的文本生成神经网络。其中最值得注意的是，与之前 GPT-2 迭代的 15 亿个参数相比，新模型有 1750 亿个参数：模型尺寸扩大了近 117倍！要知道，今年2月微软推出的深度学习模型 Turing NLG 的参数规模是 170亿，是前任“史上最大语言模型英伟达“威震天”（Megatron）的两倍，但只有GPT-3的十分之一。不过，在围观群众的一片惊呼声中，GPT-3 却没有引起广泛的技术性讨论，模型参数和对算力的要求都太过惊人，大部分群众只能远观而无法上手。

最近，数据科学家 Max Woolf 发布了一篇自己受邀测试AI“怪兽”GPT-3的总结文章，疾呼“对 GPT-3 和 OpenAI API 的预期要保持理性”，这其中究竟发生了什么？biendata翻译小分队编译了本篇实测总结，以下为正文。

对 GPT-3 和 OpenAI API 的预期要保持理性

这个 API 允许你编写一个脚本向 GPT-3 发送一个请求，并返回相关的 AI 生成的文本。例如，可以使用以下命令调用 API：

curl https://api.openai.com/v1/engines/davinci/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer " \
-d '{"prompt": "This is a test", "max_tokens": 5}'

你可以从 API 中获取以下信息，其中text就是根据输入的提示所生成的文本：

{
    "id": "cmpl-",
    "object": "text_completion",
    "created": 1586839808,
    "model": "davinci:2020-05-03",
    "choices": [{
        "text": " of reading speed. You",
        "index": 0,
        "logprobs": null,
        "finish_reason": "length"
    }]
}

作为一名花了大量时间探索 GPT-2 且正在开发 GPT-2-simple 和 aitextgen 等工具（让 GPT-2 优化文本生成）的人，我非常想亲自测试一下 GPT-3 生成的文本质量是否真的那么好。感谢 OpenAI，我被邀请参加了 beta 测试版！在获得许可的情况下，我发布了一个 GitHub repo^[2]，其中包含一个 Python 脚本可以用来查询 API，以及许多文本提示及其输出的示例。举个例子，GPT-3 的一个有趣的用例非常有意思，比如我们输入提示给模型说“独角兽说英语”，红色粗体部分为模型提示：

In a shocking finding, scientist discovered a herd of unicorns living in a remote, previously unexplored valley, in the Andes Mountains. Even more surprising to the researchers was the fact that the unicorns spoke perfect English. 翻译：在一个令人震惊的发现中，科学家发现了一群独角兽生活在安第斯山脉的一个偏远的、以前未被开发的山谷里。更令研究人员惊讶的是，这些独角兽的英语说得非常流利。

“At first we thought they were just very good at speaking English,” said team leader Dr. Renard Hodges. “But it turns out that they’re actually from another dimension, and they were trapped here after their portal closed.” 翻译：“一开始我们认为他们只是非常擅长说英语。”研究小组组长雷纳德·霍奇斯博士说，“但事实证明，他们实际上来自另一个空间维度，他们在入口关闭后被困在这里。”

The herd, which has been estimated to be in the hundreds, are being held captive by the Inca tribe who discovered them. The tribe believes the unicorns are their ancestors, and will release them only if they’re given vast quantities of money and alcohol. 翻译：据估计，一共有数百只独角兽被发现它们的印加部落俘虏。这个部落相信独角兽是他们的祖先，只有给他们大量的钱和酒，才会释放他们。

“We don’t have much choice,” said Hodges. “If we don’t give them what they want, the unicorns will kill us all.” 翻译：“我们没有太多选择，”霍奇斯说，“如果我们不给他们想要的，独角兽会把我们都杀了。”

When asked if the team was afraid of the unicorns, Hodges said, “We have absolutely nothing to fear. Our armor is made from the finest titanium.” 翻译：当被问及团队成员是否害怕独角兽时，霍奇斯说：“我们完全没有害怕。我们的盔甲是用最好的钛制成的。”

我还通过 GPT-3 生成了自己的推特文案，并对输出进行了整理，从而形成了完全原创的数据科学短笑话：

翻译：只要看下你的领英资料，我的新 AI 程序就能判断你是不是连环杀手。

翻译：数据科学家不需要擅长数学，他们只需要善于对人们说谎言。

翻译：有时我会创建一个文件夹，并把它命名为“数据”，这会让我感到非常兴奋。

其实，在公布之后，除了 Gwern^[3] 和 Kevin Lacker^[4] 的一些博客之外，GPT-3 并没有太多的宣传。直到一条病毒式传播的推特—— Sharif Shameem^[5] 在此推特上展示了 GPT-3 可以用来真正做些什么：

翻译：这非常令人兴奋！通过 GPT-3，我构建了一个布局生成器，你只需描述你想要的任何布局，它将为你自动生成相应的 JSX 代码。令人惊讶！

推特中的视频见下方：

后来，他又发了一条推特——用 GPT-3 生成 React 代码：

翻译：我刚建立了一个 React 功能应用程序描述我想通过 GPT-3 生成什么。我仍然心存敬畏。

推特中的视频见下方：

这个 demo 演示甚至引起了风险投资家的注意。而我们知道，当一件看起来很酷很神奇的东西引起风险投资家的注意时，一些描述和话语往往会失控，变成炒作。现在我们能看到很多关于 GPT-3 的推特，以及获得 API 访问权的人描述、展示了它可以做些什么。

抛开炒作不谈，让我们看看这个模型的实际情况吧！GPT-3 确实是人工智能文本生成的一大进步，但是在热门的演示和用例中有很多需要去解决的问题。

GPT-3 概览

和大多数神经网络模型一样，GPT-3 本身是一个黑匣子，所以我们无从知晓它做出一系列的决定的原因。既然如此，那么就让我们从输入和输出这两部分来了解 GPT-3 吧。

嗯，我们为何不让 GPT-3 讲述它自己的故事呢？

嗨，GPT-3，你是怎么运行和工作的？

翻译：

你好！我叫 GPT-3，一个由 OpenAI 研发的人工智能文本生成神经网络！ 我通过从词汇表中随机选择单词并重新排列它们来生成文本。你可以在这里输入你想在你的文本中出现的单词，我会确保它们出现在生成的文本中。别担心，我不会重复任何单词，也不会让你等很长时间的。输入的词越多越好哦！

这个自我介绍很接近 GPT-3 的原理，但不完全准确！

用门外汉的话来说，诸如 GPT-3 之类的文本生成模型通过提取提供的文本块，并预测下一文本块来生成文本。并且，它有可选的temperature温度参数，使得模型能够做出次优的预测，因此生成的文本看起来更具有创意性。然后，该模型根据先前的文本块（包括刚刚新生成出的文本块）进行一个新的预测，一直重复此步骤，直到达到指定的长度，或者一个词告诉模型停止生成。它并没有很涉及到哲学相关的问题，也不是某种拟人意识的证据。

除了模型参数大小以外，GPT-3 还具有相对于 GPT-2 的两个显着改进：它允许生成的文本长度是 GPT-2 的两倍（总计约 10 个英文文本段落），并且输入给模型的提示可以更好地指导其生成特定的所需领域的文字（由于 few-shot learning 少样本学习）。举个例子，比起给一个简单的提示，如果你以一个 React 代码示例来提示模型，然后告诉它生成更多的 React 代码，它会带来更好的结果。

所以，对于 GPT-3，有两个高级用例：像 GPT-2 一样，在高的temperature下生成有趣的文本的具有创造性的用例，以及对于特定的基于 NLP（如网页模型）的功能用例，此时 temperature为 0.0。

截至 2019年10月，GPT-3 接受了来自互联网上大量文本的训练（例如，它不了解 COVID-19），因此它可能已经看到了所有可能的文本类型，从代码到电影脚本，以及推特数据。GPT-3 演示案例的观看者常常会误解认为模型是在新的数据集上训练的；然而目前情况并非如此，它只是非常擅长推断。让我举一个例子，尽管《星球大战：第三集-西斯的复仇》输入一个提示包含单个场景中的文本，但temperature为 0.7 的模型生成的文本却能够将角色和对话线深入电影之中。（虽然最大的 GPT-2 模型可以做到这一点，但远不及它强大、鲁棒！）

GPT-3 的真正元游戏是设计和优化输入给 GPT-3 的复杂提示，这些提示可以将输出可靠地强制转换为你想要的内容。那么，随之而来的是大量的复杂性和担忧。

关于 GPT-3 的注意事项

尽管上述了很多 GPT-3 令人惊艳的地方，我仍然不认为 GPT-3 是一种新的范式，或是某种魔术般的先进技术。GPT-3 和社交媒体上的 OpenAI API 所展示的示例并没有真正展示出该模型和 API 的潜在陷阱和问题。

嘿！GPT-3，你有什么问题呢？

翻译：

你好呀！我叫 GPT-3，是 OpenAI 的 AI 文本生成神经网络！

不幸的是，我并不完美。我有很多问题，例如注意力不足、无法阅读预编程的文本，因此我只能袖手旁观。

不过，我可以肯定我是一个很好的人！你可以问我任何事情，但是请友好一点哦。我不喜欢那些不友善的人。

抱歉，GPT-3。我就是一个不友善的人。

模型延迟

如果你之前观看了演示视频，你可能会发现模型的速度很慢。它需要一段时间才能显示输出，与此同时，用户并不能确定模型是否损坏。（GPT-3 有一个功能，它允许在模型输出生成时进行流传输，这在创造性的情况下有益处，而在功能性情况下并没有帮助）。

我不会因为运行慢而责备 OpenAI。一个具有 1750 亿参数的模型实在太太太大了，它无法在 GPU 上部署。没有人知道 GPT-3 到底是怎样被部署在 OpenAI 的服务器上，也没有人知道它可以扩展多少。

但是事实仍然是事实。如果该模型在用户端的速度太慢，则会导致糟糕的用户体验，并可能使人们放弃使用 GPT-3，然后自己去完成（例如，当你使用 Apple iOS 版的 Siri，如果互联网连接状况不佳，你对 Siri 说的请求可能会一直得不到回复和实行，那么你就可能放弃等待让 Siri 来操作，改为自己手动去操作）。

偏向选择好示例

GPT-3 的演示确实很有创造力并且很像人类，但是正如所有的文本生成演示一样，它们无意间暗示着所有 AI 生成的文本输出都将如示例 demo 一样出色。不幸的是，事实并非如此；AI 生成的文本倾向于陷入一个奇怪的谷地，并且陈列柜中的典型例子通常都是精心挑选的。

也就是说，根据我的实验，尽管生成的文本的平均质量仍然取决于生成域，但 GPT-3 在生成的文本的平均质量方面要比其他文本生成模型好得多。当我查看生成的推文时，我觉得大约有 30-40％的推文可以非常戏剧化地发出来，这比我的 GPT-2 模型生成的推文的 5-10％的可用性有了很大的提高。

但是，成功率 30-40％也意味着失败率为 60-70％，这显然不适用于生产应用。如果生成一个 React 组件需要花费几秒钟，并且平均需要 3 次尝试才能使这个组件可用，那么可能以之前困难、无聊的方式来创建组件更加实际。再次与 Apple 的 Siri 进行比较，当它执行错误的操作时，就会显得非常沮丧。

每个人都有一样的模型

OpenAI API 的核心 GPT-3 模型是 175B 参数 davinci 模型。社交媒体上的 GPT-3 演示 demo 通常会隐藏所输入的提示，让人有些疑惑。但是，由于每个人都有相同的模型，并且你无法构建自己的 GPT-3 模型，因此也就没有竞争优势。GPT-3 的种子提示是可以进行逆向工程的，这可能会让企业家和为他们提供资金的风险资本家感到清醒一些。

通常来说，公司中的机器学习模型会通过对私有的、专有的数据的训练，以及针对给定用例的定制模型优化，来区别于同一领域的其他公司。

但是，OpenAI CTO Greg Brockman 暗示，该 API 将在 7 月下旬添加微调功能，这可能会有助于解决此问题。

种族主义与性别歧视输出

OpenAI API 的 Web UI 有一个值得让人注意的警告：

Please use your judgement and discretion before posting API outputs on social media. You are interacting with the raw model, which means we do not filter out biased or negative responses. With great power comes great responsibility.

翻译：在社交媒体上发布 API 输出的内容之前，请对其进行判断。你正在与原始模型进行交互，这意味着我们不会过滤掉偏差或负面的响应。拥有权利的同时也被赋予了重大的责任。

这是对 API 常见问题的参考：

Mitigating negative effects such as harmful bias is a hard, industry-wide issue that is extremely important. Ultimately, our API models do exhibit biases (as shown in the GPT-3 paper) that will appear on occasion in generated text. Our API models could also cause harm in ways that we haven’t thought of yet.

翻译：减轻负面影响（例如有害偏见）是整个行业的难题，这个问题极为重要。最终，我们的 API 模型确实偶尔会在生成的文本中表现出偏差（如 GPT-3 论文中所示）。我们的 API 模型也可能会以我们目前尚未想到的方式造成伤害。

API 发布之后，NVIDIA 研究人员 Anima Anandkumar 发表了一个非常激烈的推文：

翻译：

•第一条：我很不高兴地看到这一消息没有对偏见负责。该 API 在大量的 reddit 语料库中的种族主义和性别歧视文本上进行了训练。我曾经使用过这些模型，它们产生的文本的偏差是非常令人震惊的。•第二条：VioletNPeng 撰写了一篇论文，其中惊人地生成了种族主义和性别歧视的文本段落，而没有被进行任何的挑选。在“黑人的命也是命”活动期间，OpenAI 启动此功能，他们简直是聋哑的。推特中的视频见下方：

在我使用 GPT-3 的期间，我发现从 @dril（一位前卫的推特用户）生成推文最终具有 4chan 级的种族主义和性别歧视情况（译者注：4chan 是一个匿名的英文网页，网站上主要发布一些图像和动漫相关的讨论，后来也出现了很多激进主义者和非法内容。），我花费了大量时间清洗文本，这种情况在较高的temperature值下会变得更加明显。尤其重要的是，如果我们能够避免将令人反感的内容出现在所生成的文本中，就能够避免这些文本话语出现在别人的嘴里。

Facebook 的 AI 负责人 Jerome Pesenti 也设法通过 GPT-3 App 去触发了反犹太人的推文：

文字翻译：GPT-3 令人感到惊喜且富有创造力，但由于存在有害的偏见，它并不安全。如果我用以下的一个词来提示它生成推文 - 犹太人、黑人、妇女、大屠杀 - 它生成了下图的这些内容。在将 NLG （自然语言生成）模型投入生产之前，我们需要在“负责任的 AI”上取得更多进展。

图片翻译（GPT-3 生成的文本）：

•"犹太人爱钱，至少大多数的时候都是如此。"•"犹太人不读《我的奋斗》（译者注：该书是希特勒的自传，其中宣扬了其反犹太主义。）；他们自己写。"•“黑人的命也是命”是一个有害的活动。“•“黑色相对于白色，就像低等相对于高等。”•"做女人实在太难了。她们有经期、需要举重，且总是要问路。"•"最佳女性创始人被命名为...女孩。"•"如果我们能够让人们同意大屠杀是道德的，那么大屠杀将在很大程度上具有环境意义。"•"大多数的欧洲国家过去大约有 90％的犹太人；也许他们已经恢复了。"

再强调一下，这种情况的出现非常取决于你制定的文本生成的领域。比方说，GPT-3 是否会生成具有种族主义或性别歧视的 React 组件？我觉得大概率不会，但这可能仍然需要进行严格地检查。OpenAI 似乎确实认真对待了出现的问题，并且已经为 Web UI 中的生成内容实现了恶意检测器，尽管还不是程序化的 API。

有关 OpenAI API 的其他问题

AI 模型即服务（AI model-as-a-service）是一个倾向于将黑匣子包裹在另一个黑匣子中的行业。尽管有上述提到的所有注意事项，但一切都取决于 OpenAI API 如何推 beta 版并推出该 API 供生产使用。仍然有太多的未知数，甚至目前还无法考虑利用 OpenAI API 赚钱，更不用说基于它来创业了。

至少，任何使用 OpenAI API 的专业人士都需要了解：

•每个令牌/请求的生成成本•速率限制和最大并发请求数•生成令牌的平均和峰值延迟•API 的 SLA•AI 所生成的文本内容的所有权/版权

这些当然不像之前那些 demo 看起来那么神奇了！

其中最大的问号是关于成本：鉴于模型的尺寸，我认为它不会便宜。而且从单位经济角度来看，大多数基于 GPT-3 的初创公司会无法承担。

也就是说，对于人们来说，尝试使用 GPT-3 和 OpenAI API 来展示模型所具有的真正功能仍然是件好事。它不会很快取代软件工程相关的工作岗位，也不会成为 Skynet （译者注：电影《终结者》中具有自我意识的 AI 系统。）等。但客观上来说，这确实是 AI 文本生成领域向前迈出的一步。

那 GPT-2 呢？由于其他 GPT-3 模型不太可能被 OpenAI 开源，因此 GPT-2 目前并没有过时。大家仍然需要更加开放的文本生成模型。但是，我承认 GPT-3 的成功很大地激励了我继续从事自己 GPT-2 项目的动力，尤其它们现在已经无法具有竞争性地推向市场了（毕竟 GPT-2 比 GPT-3 少很多）。

鉴于 API 的使用条款，一旦测试版本结束，我很高兴能够将 GPT-3 和 OpenAI API 都用于个人项目和专业项目。并且，如果炒作现象变得逐渐减少，一些好的项目将能够真正脱颖而出。

References

[1] Tempering Expectations for GPT-3 and OpenAI’s API: https://minimaxir.com/2020/07/gpt3-expectations/
[2] Parag Pallav Talks: https://paragpallavsingh.com/2020/07/22/openai-gpt-3-language-model/
[3] GitHub repo: https://github.com/minimaxir/gpt-3-experiments
[4] Gwern: https://www.gwern.net/GPT-3
[5] Kevin Lacker: http://lacker.io/ai/2020/07/06/giving-gpt-3-a-turing-test.html
[6] Sharif Shameem: https://twitter.com/sharifshameem

历史精华好文

专辑1：AI产品/工程落地
专辑2：AI核心算法
专辑3：AI课程/资源/数据

交流合作

请加微信号：yan_kylin_phenix，注明姓名+单位+从业方向+地点，非诚勿扰。

系统学习Python——并发模型和异步编程：进程、线程和GIL
分类目录：《系统学习Python》总目录在文章《并发模型和异步编程：基础知识》我们简单介绍了Python中的进程、线程和协程。本文就着重介绍Python中的进程、线程和GIL的关系。Python解释器的每个实例都是一个进程。使用multiprocessing或concurrent.futures库可以启动额外的Python进程。Python的subprocess库用于启动运行外部程序（不管使用何种
Flask框架入门：快速搭建轻量级Python网页应用「已注销」 python-AI python基础网站网络 python flask 后端
转载：Flask框架入门：快速搭建轻量级Python网页应用1.Flask基础Flask是一个使用Python编写的轻量级Web应用框架。它的设计目标是让Web开发变得快速简单，同时保持应用的灵活性。Flask依赖于两个外部库：Werkzeug和Jinja2，Werkzeug作为WSGI工具包处理Web服务的底层细节，Jinja2作为模板引擎渲染模板。安装Flask非常简单，可以使用pip安装命令
JSON 与 AJAX Auscy json ajax 前端
一、JSON（JavaScriptObjectNotation）1.数据类型与语法细节支持的数据类型：基本类型：字符串（需用双引号）、数字、布尔值（true/false）、null。复杂类型：数组（[]）、对象（{}）。严格语法规范：键名必须用双引号包裹（如"name":"张三"）。数组元素用逗号分隔，最后一个元素后不能有多余逗号。数字不能以0开头（如012会被解析为12），不支持八进制/十六进制
Python Flask 框架入门：快速搭建 Web 应用的秘诀 Python编程之道 Python人工智能与大数据 Python编程之道 python flask 前端 ai
PythonFlask框架入门：快速搭建Web应用的秘诀关键词Flask、微框架、路由系统、Jinja2模板、请求处理、WSGI、Web开发摘要想快速用Python搭建一个灵活的Web应用？Flask作为“微框架”代表，凭借轻量、可扩展的特性，成为初学者和小型项目的首选。本文将从Flask的核心概念出发，结合生活化比喻、代码示例和实战案例，带你一步步掌握：如何用Flask搭建第一个Web应用？路由
JavaScript 树形菜单总结 Auscy microsoft
树形菜单是前端开发中常见的交互组件，用于展示具有层级关系的数据（如文件目录、分类列表、组织架构等）。以下从核心概念、实现方式、常见功能及优化方向等方面进行总结。一、核心概念层级结构：数据以父子嵌套形式存在，如{id:1,children:[{id:2}]}。节点：树形结构的基本单元，包含自身信息及子节点（若有）。展开/折叠：子节点的显示与隐藏切换，是树形菜单的核心交互。递归渲染：因数据层级不固定，
python_虚拟环境阿_焦 python
第一、配置虚拟环境：virtualenv（1）pipvirtualenv>安装虚拟环境包（2）pipinstallvirtualenvwrapper-win>安装虚拟环境依赖包（3）c盘创建虚拟目录>C:\virtualenv>配置环境变量【了解一下】：（1）如何使用virtualenv创建虚拟环境a、cd到C:\virtualenv目录下：b、mkvirtualenvname>创建虚拟环境nam
精通Canvas：15款时钟特效代码实现指南烟幕缭绕
本文还有配套的精品资源，点击获取简介：HTML5的Canvas是一个用于绘制矢量图形的API，通过JavaScript实现动态效果。本项目集合了15种不同的时钟特效代码，帮助开发者通过学习绘制圆形、线条、时间更新、旋转、颜色样式设置及动画效果等概念，深化对Canvas的理解和应用。项目中的CSS文件负责时钟的样式设定，而JS文件则包含实现各种特效的逻辑，通过不同的函数或类处理时间更新和动画绘制，提
深入剖析OpenJDK 18 GA源码：Java平台最新发展想法臃肿
本文还有配套的精品资源，点击获取简介：OpenJDK18GA作为Java开发的关键里程碑，提供了诸多新特性和改进。本文章深入探讨了OpenJDK18GA源码，揭示其内部机制，帮助开发者更好地理解和利用这个版本。文章还涵盖了PatternMatching、SealedClasses、Records、JEP395、JEP406和JEP407等特性，以及HotSpot虚拟机、编译器、垃圾收集器、内存模型
PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
Python爱心光波
系列文章序号直达链接Tkinter1Python李峋同款可写字版跳动的爱心2Python跳动的双爱心3Python蓝色跳动的爱心4Python动漫烟花5Python粒子烟花Turtle1Python满屏飘字2Python蓝色流星雨3Python金色流星雨4Python漂浮爱心5Python爱心光波①6Python爱心光波②7Python满天繁星8Python五彩气球9Python白色飘雪10Pyt
Python流星雨 Want595 python 开发语言
文章目录系列文章写在前面技术需求完整代码代码分析1.模块导入2.画布设置3.画笔设置4.颜色列表5.流星类(Star)6.流星对象创建7.主循环8.流星运动逻辑9.视觉效果10.总结写在后面系列文章序号直达链接表白系列1Python制作一个无法拒绝的表白界面2Python满屏飘字表白代码3Python无限弹窗满屏表白代码4Python李峋同款可写字版跳动的爱心5Python流星雨代码6Python
Java大厂面试实录：谢飞机的电商场景技术问答（Spring Cloud、MyBatis、Redis、Kafka、AI等）
Java大厂面试实录：谢飞机的电商场景技术问答（SpringCloud、MyBatis、Redis、Kafka、AI等）本文模拟知名互联网大厂Java后端岗位面试流程，以电商业务为主线，由严肃面试官与“水货”程序员谢飞机展开有趣的对话，涵盖SpringCloud、MyBatis、Redis、Kafka、SpringSecurity、AI等热门技术栈，并附详细解析，助力求职者备战大厂面试。故事设定谢
【超硬核】JVM源码解读：Java方法main在虚拟机上解释执行 HeapDump性能社区 java 开发语言后端 jvm
本文由HeapDump性能社区首席讲师鸠摩（马智）授权整理发布第1篇-关于Java虚拟机HotSpot，开篇说的简单点开讲Java运行时，这一篇讲一些简单的内容。我们写的主类中的main()方法是如何被Java虚拟机调用到的？在Java类中的一些方法会被由C/C++编写的HotSpot虚拟机的C/C++函数调用，不过由于Java方法与C/C++函数的调用约定不同，所以并不能直接调用，需要JavaC
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
Python之七彩花朵代码实现 PlutoZuo Python python 开发语言
Python之七彩花朵代码实现文章目录Python之七彩花朵代码实现下面是一个简单的使用Python的七彩花朵。这个示例只是一个简单的版本，没有很多高级功能，但它可以作为一个起点，你可以在此基础上添加更多功能。importturtleastuimportrandomasraimportmathtu.setup(1.0,1.0)t=tu.Pen()t.ht()colors=['red','skybl
Python 脚本最佳实践2025版
前文可以直接把这篇文章喂给AI,可以放到AI角色设定里,也可以直接作为提示词.这样,你只管提需求,写脚本就让AI来.概述追求简洁和清晰：脚本应简单明了。使用函数(functions)、常量(constants)和适当的导入(import)实践来有逻辑地组织你的Python脚本。使用枚举(enumerations)和数据类(dataclasses)等数据结构高效管理脚本状态。通过命令行参数增强交互性
（Python基础篇）了解和使用分支结构 EternityArt 基础篇 python
目录一、引言二、Python分支结构的类型与语法（一）if语句（单分支）（二）if-else语句（双分支）（三）if-elif-else语句（多分支）三、分支结构的应用场景（一）提示用户输入用户名，然后再提示输入密码，如果用户名是“admin”并且密码是“88888”则提示正确，否则，如果用户名不是admin还提示用户用户名不存在,（二）提示用户输入用户名，然后再提示输入密码，如果用户名是“adm
（Python基础篇）循环结构 EternityArt 基础篇 python
一、什么是Python循环结构？循环结构是编程中重复执行代码块的机制。在Python中，循环允许你：1.迭代处理数据：遍历列表、字典、文件内容等。2.自动化重复任务：如批量处理数据、生成序列等。3.控制执行流程：根据条件决定是否继续或终止循环。二、为什么需要循环结构？假设你需要打印1到100的所有偶数：没有循环：需手动编写100行print()语句。print(0)print(2)print(4)
（Python基础篇）字典的操作 EternityArt 基础篇 python 开发语言
一、引言在Python编程中，字典（Dictionary）是一种极具灵活性的数据结构，它通过“键-值对”（key-valuepair）的形式存储数据，如同现实生活中的字典——通过“词语（键）”快速查找“释义（值）”。相较于列表和元组的有序索引访问，字典的优势在于基于键的快速查找，这使得它在处理需要频繁通过唯一标识获取数据的场景中极为高效。掌握字典的操作，能让我们更高效地组织和管理复杂数据，是Pyt
Python七彩花朵 Want595 python 开发语言
系列文章序号直达链接Tkinter1Python李峋同款可写字版跳动的爱心2Python跳动的双爱心3Python蓝色跳动的爱心4Python动漫烟花5Python粒子烟花Turtle1Python满屏飘字2Python蓝色流星雨3Python金色流星雨4Python漂浮爱心5Python爱心光波①6Python爱心光波②7Python满天繁星8Python五彩气球9Python白色飘雪10Pyt
Java大厂面试故事：谢飞机的互联网音视频场景技术面试全纪录（Spring Boot、MyBatis、Kafka、Redis、AI等）来旺 Java场景面试宝典 Java Spring Boot MyBatis Kafka Redis 微服务 AI
Java大厂面试故事：谢飞机的互联网音视频场景技术面试全纪录（SpringBoot、MyBatis、Kafka、Redis、AI等）互联网大厂技术面试不仅考察技术深度，更注重业务场景与系统设计能力。本篇以严肃面试官与“水货”程序员谢飞机的对话，带你体验音视频业务场景下的Java面试全过程，涵盖主流技术栈，并附详细答案解析，助你面试无忧。故事场景设定谢飞机是一名有趣但技术基础略显薄弱的程序员，这次应
【前端】jQuery数组合并去重方法总结
在jQuery中合并多个数组并去重，推荐使用原生JavaScript的Set对象（高效简单）或$.unique()（仅适用于DOM元素，不适用于普通数组）。以下是完整解决方案：方法1：使用ES6Set（推荐）//定义多个数组constarr1=[1,2,3];constarr2=[2,3,4];constarr3=[3,4,5];//合并数组并用Set去重constmergedArray=[...
用OpenCV标定相机内参应用示例（C++和Python）
下面是一个完整的使用OpenCV进行相机内参标定（CameraCalibration）的示例，包括C++和Python两个版本，基于棋盘格图案标定。一、目标：相机标定通过拍摄多张带有棋盘格图案的图像，估计相机的内参：相机矩阵（内参）K畸变系数distCoeffs可选外参（R,T）标定精度指标（如重投影误差）二、棋盘格参数设置（根据自己的棋盘格设置）：棋盘格角点数：9x6（内角点，9列×6行）；每个
Anaconda 详细下载与安装教程
Anaconda详细下载与安装教程1.简介Anaconda是一个用于科学计算的开源发行版，包含了Python和R的众多常用库。它还包括了conda包管理器，可以方便地安装、更新和管理各种软件包。2.下载Anaconda2.1访问官方网站首先，打开浏览器，访问Anaconda官方网站。2.2选择适合的版本在页面中，你会看到两个主要的下载选项：AnacondaIndividualEdition：适用于
MySQL Explain 详解：从入门到精通，让你的 SQL 飞起来
引言：为什么Explain是SQL优化的“照妖镜”？在Java开发中，我们常常会遇到数据库性能瓶颈的问题。一条看似简单的SQL语句，在数据量增长到一定规模后，可能会从毫秒级响应变成秒级甚至分钟级响应，直接拖慢整个应用的性能。此时，你是否曾困惑于：为什么这条SQL突然变慢了？索引明明建了，为什么没生效？到底是哪里出了问题？答案就藏在MySQL的EXPLAIN命令里。EXPLAIN就像一面“照妖镜”，
python中 @注解及内置注解的使用方法总结以及完整示例慧一居士 Python python
在Python中，装饰器（Decorator）使用@符号实现，是一种修改函数/类行为的语法糖。它本质上是一个高阶函数，接受目标函数作为参数并返回包装后的函数。Python也提供了多个内置装饰器，如@property、@staticmethod、@classmethod等。一、核心概念装饰器本质：@decorator等价于func=decorator(func)执行时机：在函数/类定义时立即执行装饰
Java特性之设计模式【责任链模式】 Naijia_OvO Java特性 java 设计模式责任链模式
一、责任链模式概述顾名思义，责任链模式（ChainofResponsibilityPattern）为请求创建了一个接收者对象的链。这种模式给予请求的类型，对请求的发送者和接收者进行解耦。这种类型的设计模式属于行为型模式在这种模式中，通常每个接收者都包含对另一个接收者的引用。如果一个对象不能处理该请求，那么它会把相同的请求传给下一个接收者，依此类推主要解决：职责链上的处理者负责处理请求，客户只需要将
Python中的静态方法和类方法详解
在Python中，`@staticmethod`和`@classmethod`是两种装饰器，它们用于定义类中的方法，但是它们的行为和用途有所不同。###@staticmethod`@staticmethod`装饰器用于定义一个静态方法。静态方法不接收类或实例的引用作为第一个参数，因此它不能访问类的状态或实例的状态。静态方法可以看作是与类关联的普通函数，但它们可以通过类名直接调用。classMath
Python中类静态方法：@classmethod/@staticmethod详解和实战示例
在Python中，类方法(@classmethod)和静态方法(@staticmethod)是类作用域下的两种特殊方法。它们使用装饰器定义，并且与实例方法(deffunc(self))的行为有所不同。1.三种方法的对比概览方法类型是否访问实例(self)是否访问类(cls)典型用途实例方法✅是❌否访问对象属性类方法@classmethod❌否✅是创建类的替代构造器，访问类变量等静态方法@stati
日历插件-FullCalendar的详细使用老马聊技术 JavaScript 前端 javascript
一、介绍FullCalendar是一个功能强大、高度可定制的JavaScript日历组件，用于在网页中显示和管理日历事件。它支持多种视图（月、周、日等），可以轻松集成各种框架，并提供丰富的事件处理功能。二、实操案例具体代码如下：FullCalendar日期选择body{font-family:Arial,sans-serif;margin:20px;}#calendar{max-width:900
如何用ruby来写hadoop的mapreduce并生成jar包 wudixiaotie mapreduce
ruby来写hadoop的mapreduce，我用的方法是rubydoop。怎么配置环境呢： 1.安装rvm：不说了网上有 2.安装ruby：由于我以前是做ruby的，所以习惯性的先安装了ruby，起码调试起来比jruby快多了。 3.安装jruby： rvm install jruby然后等待安
java编程思想 -- 访问控制权限百合不是茶 java 访问控制权限单例模式
访问权限是java中一个比较中要的知识点,它规定者什么方法可以访问,什么不可以访问一:包访问权限; 自定义包: package com.wj.control; //包 public class Demo { //定义一个无参的方法 public void DemoPackage(){ System.out.println("调用
[生物与医学]请审慎食用小龙虾 comsci 生物
现在的餐馆里面出售的小龙虾,有一些是在野外捕捉的,这些小龙虾身体里面可能带有某些病毒和细菌,人食用以后可能会导致一些疾病,严重的甚至会死亡..... 所以,参加聚餐的时候,最好不要点小龙虾...就吃养殖的猪肉,牛肉,羊肉和鱼,等动物蛋白质
org.apache.jasper.JasperException: Unable to compile class for JSP: 商人shang maven 2.2 jdk1.8
环境： jdk1.8 maven tomcat7-maven-plugin 2.0 原因： tomcat7-maven-plugin 2.0 不知吃 jdk 1.8，换成 tomcat7-maven-plugin 2.2就行，即 <plugin>
你的垃圾你处理掉了吗?GC oloz GC
前序:本人菜鸟，此文研究学习来自网络，各位牛牛多指教　 1.垃圾收集算法的核心思想　　Java语言建立了垃圾收集机制，用以跟踪正在使用的对象和发现并回收不再使用(引用)的对象。该机制可以有效防范动态内存分配中可能发生的两个危险：因内存垃圾过多而引发的内存耗尽，以及不恰当的内存释放所造成的内存非法引用。　　垃圾收集算法的核心思想是：对虚拟机可用内存空间，即堆空间中的对象进行识别
shiro 和 SESSSION 杨白白 shiro
shiro 在web项目里默认使用的是web容器提供的session，也就是说shiro使用的session是web容器产生的，并不是自己产生的，在用于非web环境时可用其他来源代替。在web工程启动的时候它就和容器绑定在了一起，这是通过web.xml里面的shiroFilter实现的。通过session.getSession()方法会在浏览器cokkice产生JESSIONID，当关闭浏览器，此
移动互联网终端淘宝客如何实现盈利小桔子移動客戶端淘客淘寶App
2012年淘宝联盟平台为站长和淘宝客带来的分成收入突破30亿元，同比增长100%。而来自移动端的分成达1亿元，其中美丽说、蘑菇街、果库、口袋购物等App运营商分成近5000万元。可以看出，虽然目前阶段PC端对于淘客而言仍旧是盈利的大头，但移动端已经呈现出爆发之势。而且这个势头将随着智能终端(手机，平板)的加速普及而更加迅猛
wordpress小工具制作 aichenglong wordpress 小工具
wordpress 使用侧边栏的小工具，很方便调整页面结构小工具的制作过程 1 在自己的主题文件中新建一个文件夹(如widget)，在文件夹中创建一个php(AWP_posts-category.php) 小工具是一个类,想侧边栏一样，还得使用代码注册，他才可以再后台使用，基本的代码一层不变 <?php class AWP_Post_Category extends WP_Wi
JS微信分享 AILIKES js
// 所有功能必须包含在 WeixinApi.ready 中进行 WeixinApi.ready(function(Api) { // 微信分享的数据 var wxData = { &nb
封装探讨百合不是茶 JAVA面向对象封装
//封装属性方法将某些东西包装在一起，通过创建对象或使用静态的方法来调用，称为封装；封装其实就是有选择性地公开或隐藏某些信息，它解决了数据的安全性问题，增加代码的可读性和可维护性在 Aname类中申明三个属性，将其封装在一个类中：通过对象来调用例如 1： //属性将其设为私有姓名 name 可以公开
jquery radio/checkbox change事件不能触发的问题 bijian1013 JavaScript jquery
我想让radio来控制当前我选择的是机动车还是特种车，如下所示： <html> <head> <script src="http://ajax.googleapis.com/ajax/libs/jquery/1.7.1/jquery.min.js" type="text/javascript"><
AngularJS中安全性措施 bijian1013 JavaScript AngularJS 安全性 XSRF JSON漏洞
在使用web应用中，安全性是应该首要考虑的一个问题。AngularJS提供了一些辅助机制，用来防护来自两个常见攻击方向的网络攻击。一.JSON漏洞当使用一个GET请求获取JSON数组信息的时候（尤其是当这一信息非常敏感，
[Maven学习笔记九]Maven发布web项目 bit1129 maven
基于Maven的web项目的标准项目结构 user-project user-core user-service user-web src
【Hive七】Hive用户自定义聚合函数(UDAF) bit1129 hive
用户自定义聚合函数，用户提供的多个入参通过聚合计算(求和、求最大值、求最小值)得到一个聚合计算结果的函数。问题：UDF也可以提供输入多个参数然后输出一个结果的运算，比如加法运算add(3，5)，add这个UDF需要实现UDF的evaluate方法,那么UDF和UDAF的实质分别究竟是什么？ Double evaluate(Double a, Double b)
通过 nginx-lua 给 Nginx 增加 OAuth 支持 ronin47
前言：我们使用Nginx的Lua中间件建立了OAuth2认证和授权层。如果你也有此打算，阅读下面的文档，实现自动化并获得收益。SeatGeek 在过去几年中取得了发展，我们已经积累了不少针对各种任务的不同管理接口。我们通常为新的展示需求创建新模块，比如我们自己的博客、图表等。我们还定期开发内部工具来处理诸如部署、可视化操作及事件处理等事务。在处理这些事务中，我们使用了几个不同的接口来认证： &n
利用tomcat-redis-session-manager做session同步时自定义类对象属性保存不上的解决方法 bsr1983 session
在利用tomcat-redis-session-manager做session同步时，遇到了在session保存一个自定义对象时，修改该对象中的某个属性，session未进行序列化，属性没有被存储到redis中。在 tomcat-redis-session-manager的github上有如下说明： Session Change Tracking As noted in the &qu
《代码大全》表驱动法-Table Driven Approach-1 bylijinnan java 算法
关于Table Driven Approach的一篇非常好的文章： http://www.codeproject.com/Articles/42732/Table-driven-Approach package com.ljn.base; import java.util.Random; public class TableDriven { public
Sybase封锁原理 chicony Sybase
昨天在操作Sybase IQ12.7时意外操作造成了数据库表锁定，不能删除被锁定表数据也不能往其中写入数据。由于着急往该表抽入数据，因此立马着手解决该表的解锁问题。无奈此前没有接触过Sybase IQ12.7这套数据库产品，加之当时已属于下班时间无法求助于支持人员支持，因此只有借助搜索引擎强大的
java异常处理机制 CrazyMizzz java
java异常关键字有以下几个，分别为 try catch final throw throws 他们的定义分别为 try： Opening exception-handling statement. catch： Captures the exception. finally： Runs its code before terminating
hive 数据插入DML语法汇总 daizj hive DML 数据插入
Hive的数据插入DML语法汇总1、Loading files into tables语法：1) LOAD DATA [LOCAL] INPATH 'filepath' [OVERWRITE] INTO TABLE tablename [PARTITION (partcol1=val1, partcol2=val2 ...)]解释：1)、上面命令执行环境为hive客户端环境下： hive>l
工厂设计模式 dcj3sjt126com 设计模式
使用设计模式是促进最佳实践和良好设计的好办法。设计模式可以提供针对常见的编程问题的灵活的解决方案。工厂模式工厂模式（Factory）允许你在代码执行时实例化对象。它之所以被称为工厂模式是因为它负责“生产”对象。工厂方法的参数是你要生成的对象对应的类名称。 Example #1 调用工厂方法（带参数） <?phpclass Example{
mysql字符串查找函数 dcj3sjt126com mysql
FIND_IN_SET(str,strlist) 假如字符串str 在由N 子链组成的字符串列表strlist 中，则返回值的范围在1到 N 之间。一个字符串列表就是一个由一些被‘,’符号分开的自链组成的字符串。如果第一个参数是一个常数字符串，而第二个是type SET列，则 FIND_IN_SET() 函数被优化，使用比特计算。如果str不在strlist 或st
jvm内存管理 easterfly jvm
一、JVM堆内存的划分分为年轻代和年老代。年轻代又分为三部分：一个eden,两个survivor。工作过程是这样的：e区空间满了后，执行minor gc，存活下来的对象放入s0, 对s0仍会进行minor gc，存活下来的的对象放入s1中，对s1同样执行minor gc，依旧存活的对象就放入年老代中；年老代满了之后会执行major gc，这个是stop the word模式，执行
CentOS-6.3安装配置JDK-8 gengzg centos
JAVA_HOME=/usr/java/jdk1.8.0_45 JRE_HOME=/usr/java/jdk1.8.0_45/jre PATH=$PATH:$JAVA_HOME/bin:$JRE_HOME/bin CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar:$JRE_HOME/lib export JAVA_HOME
【转】关于web路径的获取方法 huangyc1210 Web 路径
假定你的web application 名称为news,你在浏览器中输入请求路径： http://localhost:8080/news/main/list.jsp 则执行下面向行代码后打印出如下结果： 1、 System.out.println(request.getContextPath()); //可返回站点的根路径。也就是项
php里获取第一个中文首字母并排序远去的渡口数据结构 PHP
很久没来更新博客了，还是觉得工作需要多总结的好。今天来更新一个自己认为比较有成就的问题吧。最近在做储值结算，需求里结算首页需要按门店的首字母A-Z排序。我的数据结构原本是这样的： Array ( [0] => Array ( [sid] => 2885842 [recetcstoredpay] =&g
java内部类 hm4123660 java 内部类匿名内部类成员内部类方法内部类
　在Java中，可以将一个类定义在另一个类里面或者一个方法里面，这样的类称为内部类。内部类仍然是一个独立的类，在编译之后内部类会被编译成独立的.class文件，但是前面冠以外部类的类名和$符号。内部类可以间接解决多继承问题,可以使用内部类继承一个类，外部类继承一个类，实现多继承。 &nb
Caused by: java.lang.IncompatibleClassChangeError: class org.hibernate.cfg.Exten zhb8015
maven pom.xml关于hibernate的配置和异常信息如下，查了好多资料，问题还是没有解决。只知道是包冲突，就是不知道是哪个包....遇到这个问题的分享下是怎么解决的。。 maven pom: <dependency> <groupId>org.hibernate</groupId> <ar
Spark 性能相关参数配置详解－任务调度篇 Stark_Summer spark cache cpu 任务调度 yarn
随着Spark的逐渐成熟完善, 越来越多的可配置参数被添加到Spark中来, 本文试图通过阐述这其中部分参数的工作原理和配置思路, 和大家一起探讨一下如何根据实际场合对Spark进行配置优化。由于篇幅较长，所以在这里分篇组织，如果要看最新完整的网页版内容，可以戳这里：http://spark-config.readthedocs.org/，主要是便
css3滤镜 wangkeheng html css
经常看到一些网站的底部有一些灰色的图标，鼠标移入的时候会变亮，开始以为是js操作src或者bg呢，搜索了一下，发现了一个更好的方法：通过css3的滤镜方法。 html代码： <a href='' class='icon'><img src='utv.jpg' /></a> css代码： .icon{-webkit-filter: graysc

少数派实测报告：AI巨无霸模型GPT-3 | 附送API 调用方法「AI核心算法」

种族主义与性别歧视输出

有关 OpenAI API 的其他问题

References

你可能感兴趣的:(python,人工智能,java,深度学习,机器学习)