盼小辉丶

当AI学会创作，是否应该感到担忧？

- 0. 前言
- 1. 人工智能与 AIGC
- - 1.1 人工智能简介
  - 1.2 人工智能与 AIGC
  - 1.3 步入 AIGC 时代
- 2. 文本生成模型
- 3. 代码生成模型
- 4. 图像生成模型
- 小结与展望

0. 前言

近来，随着 Open AI 发布的新一代 AI 聊天机器人 ChatGPT 火遍科技圈，人工智能生成内容( Artificial Intelligence Generated Content, AIGC )这一领域开始受到学术界、工业界甚至普通用户的更广泛关注。AIGC 凭借其独特的“创造力”与人类无法企及的创作生成速度掀起了一股人工智能狂潮，甚至在新闻报道中已经出现了 AI 作品参赛获奖、AI 画作被拍出上百万的高价；与此同时，诸如昆仑万维等国内外公司开始争相布局 AIGC，推动 AI 作画、AI 作曲等产品广泛应用于艺术、教育以及文化等内容创作领域，成为独角兽公司。当人类引以为傲的“创造力”开始被 AI 所染指，在感到振奋的同时，我们是否会产生人工智能将取代人类的担忧？
为了回答这一问题，我们首先需要了解人工智能、了解 AIGC 及其最新研究进展。因此，本文中，我们将介绍何为人工智能与 AIGC，并讲解目前业界领先的昆仑万维 AIGC 模型与产品，最后，进一步回答我们是否应该为人工智能表现出的“创造力”感到担忧。

1. 人工智能与 AIGC

1.1 人工智能简介

人工智能 (Artificial Intelligence, AI) 是研究用于模拟和扩展人类智能的理论、方法及应用的一门系统性科学技术，其令计算机根据可用数据执行相应策略而无需以明确的编程方式执行策略，AI 通过使用计算机程序模拟人类行为从而使机器实现智能。在过去几十年间，由于可用数据的数量和质量呈指数级增长，同时高性能的计算设备也得到了快速发展，人工智能在图像识别、自然语言处理、推荐系统和自动驾驶等领域都取得了突破性进展。人工智能的目标是构建强大的智能模型，可以操纵输入数据以预测输出，同时随着新数据的增加不断更新模型。
人工智能的目标是创造能与人类思维相似的智能机器，或者通过人工智能技术来扩展人类智能从而解决实际问题。在过去几年里，许多人工智能系统取得了突破性进展，已经可以应用于解决各种复杂问题。深度神经网络模型，已经可以以近乎医生的水平对人体 X 射线图像进行病理学分析，在围棋等经典棋盘游戏以及多人竞技电脑游戏中击败人类大师级选手，但实际上，人工智能的应用远不止这些。

1.2 人工智能与 AIGC

目前我们可以将人工智能模型分为两大类，判别模型与生成模型。AI 判别模型需要一组输入数据，例如英文文本、X 射线图像或者游戏画面，经过一系列计算得到相应目标输出结果，例如单词翻译结果、X 光图像的诊断结果或游戏中下一时刻要执行的动作。判别模型可能是我们最熟悉的一类 AI 模型，其目的是在一组输入变量和目标输出之间创建映射。目标输出可以是一组离散(例如预测接下来出现的单词向量)或者连续的值(例如预测客户接下来一定时间段内在商店的花销)。
而生成模型，并不会不会对输入变量计算分数或标签，而是生成新数据，这类模型可以接受与实际值无关的向量(甚至是随机向量)，生成复杂输出，例如文本、音乐或图像。人工智能生成内容( Artificial Intelligence Generated Content, AIGC) 泛指应用 AI 技术生成的内容，包括文字、图片，甚至是代码和视频等。

1.3 步入 AIGC 时代

AIGC 是继专业生成内容 (Professionally Generated Content, PGC) 和用户生成内容 (User Generated Content, UGC) 之后的新一代内容生成方式，是一种通过人工智能技术来自动或辅助生成内容的内容生成方式，具有高效性和自动化的特点。自然语言生成技术 (Natural Language Generation, NLG) 和 AI 模型的快速发展，推动了 AIGC 走向落地应用。

时代	内容生成方式	特点
Web 1.0	PGC	专业性强、质量较高
Web 2.0	UGC	内容丰富、创作自由
Web 3.0	AIGC	高效性、自动化

AIGC 在当前时间节点能够爆火，并不是一种偶然，而是技术发展和内容生产需求变革的必然结果。当元宇宙的相关概念提出后，元宇宙发展过程中也浮现出了一个重要问题，即如何生成元宇宙中大量的数字内容?而随着 AIGC 的快速发展，以及资本市场的加入 AIGC 赛道，AIGC 将能够极大的助力元宇宙的发展和落地，AI 将能够生成或辅助生成元宇宙中海量的内容。

深度学习生成模型在过去的十几年间取得了日新月异的进展，几乎每天都有大量的相关论文发表，2014 年，对抗生成网络 (Generative Adversarial Networks, GAN) 及其变体的出现第一次引发了关于人工智能创作能力的讨论；2021 年，CLIP 模型被提出，同年 OpenAI 推出了 DALL-E 模型，其具备了文本与图像交互生成内容的能力；2022 年，深度学习模型 Diffusion 出现，直接推动了 AIGC 技术的突破性发展，其解决了生成对抗网络训练困难、生成结果较为粗糙的弊端，许多基于 Diffusion 模型的应用呈现出井喷之势，因此，许多人将 2022 年称为 AIGC 元年。
在 AIGC 这条赛道上，目前位于头部的 OpenAI 已估值超 200 亿美元，而据《中国 AI 数字商业展望 2021-2025》报告预测，中国 AI 数字商业核心支柱产业链规模将在 2025 年达到 1853 亿元，其中 AI 数字商业内容产业规模将达到 495 亿元，占整个产业链的近 27%。
作为中国领先的互联网平台出海企业昆仑万维，一直以来都对市场和创新业务有着敏锐的洞察力，更是早早的布局了 AIGC 业务，在 AIGC 绘图、文本、编程和音乐等领域都处于业界领先水平，逐渐在全球范围内形成了海外信息分发及元宇宙平台 Opera、海外社交娱乐平台 StarX、全球移动游戏平台 Ark Games、休闲娱乐平台闲徕互娱等板块，为全球互联网用户提供了丰富的社交、娱乐等信息化服务，与合作伙伴奇点智源合作推出了“昆仑天工”全系列 AIGC 模型与算法，“昆仑天工”的 AI 生成能力涵盖图像、音乐、编程、文本等全模态领域。

2. 文本生成模型

文字是最基本也是最重要的内容形式，在 AI 生成文字方面，目前AI模型已经可以完成许多之前被认为是人类特权的创作活动，例如作诗、写广告、剧本、小说，甚至心灵鸡汤。目前，OpenAI 的 GPT-3 模型是 AI 生成文字中最流形和最成熟的模型，甚至有机构进行实验，让 GPT-3 与本科生同时根据指定提示进行写作，并交由教授组进行打分，结果 GTP-3 模型生成的文章通过了大部分课程的写作测试，而且仅仅需要 3-20 分钟，并且其中大部分时间用于对文本的输出长度和重复文本进行编辑。

最近，已经有许多基于 GPT-3 模型的商业化产品，其中佼佼者包括昆仑万维与奇点智源联合推出的瑶光和天枢模型，这两种模型均可以理解和生成自然语言，前者的性能相对更强，适用于需要生成大量内容的应用，而后者适用于对实时性要求更高的场景。
瑶光模型相较而言只需要较少的上下文就可以完成任务，同时能够解决一些涉及因果关系的最具挑战性的人工智能问题，其生成的长文本内在逻辑性更强，在包括分类、问答以及聊天等任务中均有出色的表现。而天枢虽然在复杂文本生成任务中表现略逊色与瑶光，但其在小样本任务中同样表现出色，并且速度更快。
昆仑天工模型针对中文领域构建了千亿级别的高质量数据集，通过高性能 a100-GPU 集群训练得到了百亿参数量的 GTP-3 生成模型，其几乎可以应用与任何涉及理解或生成自然语言或代码的任务，同时提供了一系列具有不同参数级别的模型，根据同任务进行适配，同时，也可以微调模型的得到适合需求的生成模型。下表在多个数据集中对比了当前流行的中文文本生成领域的模型，可以看到，瑶光在多个文本生成任务中有明显优势。

同时，昆仑天工的 AI 文本生成模型可以应用于多种下游任务，例如续写、对话、中英翻译、内容风格生成、推理、诗词对联等，几乎涵盖了文本内容生成的大部分应用场景。

以内容续写为例，文本生成模型提供了一个非常简单的文本输入、文本输出界面，在保证灵活性的同时提供了强大的内容生成能力。我们只需要输入一些文本作为提示，模型将自动生成一个文本续写，用于尝试匹配我们提供的输入上下文或模式，除此之外，我们还可以从生成的文本长度等方面对生成结果进行调整。

在续写无言律诗的应用中，昆仑天工 AI 模型甚至可以非常准确的给出标点。如下图所示，当引导语句后应当紧接逗号时，模型准确的生成了逗号，并得到对仗工整的续写诗句。

感受了昆仑天工文本生成深度学习模型的强大之后，我们当然会想迫不及待将其应用到项目实践中去，昆仑天工提供了丰富的文本生成 API 用于不同的专业性下游任务，支持 JSON、Python 和 shell 等多种编程语言，并且提供了详尽的 API 功能描述与使用示例，方便我们将其应用于项目中去。以生成五言诗为例，使用 Python API 调用昆仑天工文本生成深度学习模型的代码非常简单方便：

import requests
import json

url = "https://openapi-dev.singularity-ai.com/api/generateByKey"

headers = {
        "Content-Type": "application/json",
        "App-Key": "your apiKey" # 替换为自己的 API Key
    }

data = {
    "model_version": "模型版本",
    "prompt": "闻道巴山里，春船正好行。都将百年兴，一望九江城。\n水槛温江口，茅堂石笋西。移船先主庙，洗药浣沙溪。\n迟日江山丽，春风花草香。泥融飞燕子，沙暖睡鸳鸯。\n寒食少天气，东风多柳花。小桃知客意，春尽始开花。\n清风入堂来",
    "param": {
        "generate_length": 100,
        "top_p": 0.1,
        "top_k": 10,
        "repetition_penalty": 1.3,
        "length_penalty": 1,
        "min_len": 2,
        "temperature": 1,
        "end_words": [
            "[EOS]",
            "\n"
        ]
    }
}

response = requests.post(url=url, headers=headers, json=data)
dt  = json.loads(response.text)
print(dt)

3. 代码生成模型

代码生成一直以来都被认为是一项复杂的挑战，这是由于代码生成具有很高的内在逻辑性，不仅需要做到能够生成，还要做到能够运行，否则仅仅生成一堆无法运行的代码是完全本末倒置的，代码生成的最重要的目的就是能够辅助人类程序员减少代码编写的任务量，如果生成的代码没有任何意义，反而会增加程序员的负担。
但是，随着 AlphaCode 的问世，让人类看到了代码编写或许不再是程序员的专属领域，在 AlphaCode 参加 Codeforces 算法比赛的数十次结果中，其能力超越了 50% 以上的程序员，下图显示了 AlphaCode 的模型架构图。

在 AI 代码生成的赛道中，昆仑万维训练了全球第一款多语言开源编程大模型 Sky-code 代码生成工具，其支持各种主流编程语言，包括 java、javascript、c、c++、python、go 和 shell 等编程语言，可以帮助开发人员更快更好的编码，甚至模型每秒可以输出百字以上的代码量。Sky-code 具有优秀的代码续写能力，不仅可以根据代码注释续写代码，解决算法问题，让深度学习模型刷题不再只是幻想，同时它也支持根据中文注释续写代码，这对于大部分外语能力较差的开发人员而言更是雪中送炭。并且 Sky-code 模型的代码质量非常高，下表对比了 Sky-code 模型与其他代码生成模型的性能：

模型	机构	参数量	函数级代码生成任务的数据集
			Human-Eval 164 (OpenAI 发布)				40 Simples (40 个贴近实际场景的 case，奇点自制数据集)
			k=1	k=10	k=100	编辑距离 (ED)	k=1	k=10	k=1100	ED
GPT-J	EleutherAI	60亿	11.62%	15.74%	27.74%	35.83	27.00%(t0.2)	57.06%(t0.6)	80.00%(t0.6)	44.31
SKY-CODE	奇点智源(昆仑天工)	26亿	10.37%(t0.2)	18.52%(t0.6)	30.69%(t0.6)	37.32	35.45%(t0.2)	60.38(t0.6)	84.77%(t0.6)	51.1

模型的生成通过率是代码生成模型最重要的能力衡量指标，根据数据集中的不同问题，模型生成的代码需要通过单元测试才会被认为生成正确结果。在上表中，根据运行次数的不同，指标分为单次运行通过率 (k=1)、十次运行通过率 (k=10)，百次运行通过率 (k=100)等，可以看出在 40 Samples 数据集中 Sky-code 模型的百次模型通过率甚至接近 85%，并且相较于其他模型具有更少的模型参数量，这也就不难得出 Sky-code 模型运行效率较高的原因。
Sky-code 可以在编码的过程中对代码进行智能补全，使用该模型，我们只需要通过一段函数功能描述或者想要实现的程序结果，Sky-code 就可以分析当前编辑代码文件的上下文环境，给出代码补全或建议。

以补全 Python 代码为例，在上图中可以看出，我们只提供了代码的注释部分，Sky-code 模型就可以自动补全整个函数，更加友好的是，我们可以使用中文注释。补全后代码如下所示，能够节约大量的时间，令我们可以更加专注于算法的逻辑流程。

import Flask 

# 一个简单的基于 Flask框架的 webserver

class SimpleServer(object):  
    def __init__(self, ip, port, server_name):
        self.ip=ip;
        self.port=int(port);
        self.name=server_name
    def run(self):
        app = Flask(__name__)
        @app.route("/")
        def hello():
            return "Hello, %s!"%(self.name);
        print(app.url_for('index'))
if __name__=="__main__":
    srvr=SimpleServer(192.168.0.100,8081,'server1');
    srvr.run()

Sky-code 已经支持在 Visual Studio Code 上使用插件扩展，后续也会陆续支持 Visual Studio、Neovim 和 JetBrains 等一系列常见 IDE 和编辑器。

4. 图像生成模型

在 AI 生成图片方面，随着算法模型的不断迭代升级，AI 作画无论是在质量还是速度上都有了飞跃性发展，在 2014 年发布的 GAN 模型不仅生成图片质量较差且易陷入模式坍塌，在 2022 年初提出的 Disco Diffusion 模型能够生成更加多样性的图片，而随之发布的 DALL-E2 模型可以生成完整的图像内容，而到 8 月由 StabilityAI 发布的 Stable Diffusion 模型更是取得质的突破，甚至已经可以生成能够媲美专业画师的作品，生成图片的效率也从数小时缩短到几分钟甚至数十秒， Stable Diffusion 模型主要采用的扩散模型 (Diffusion Model)，简单理解，扩散模型就是去噪自编码器的连续应用，逐步生成高质量图像的过程，下图显示了 Stable Diffusion 模型的架构图。

昆仑天工的 AI 图片生成模型天工巧绘 SkyPaint 基于 Stable Diffusion 模型，在保留原始 Stable Diffusion 模型那个能够根据英文提示词输入实现文字生成图像的基础上，实现中文提示词输入能力，SkyPaint 使用 1.5 亿级的平行语料优化提示词模型实现中英文对照，不仅涉及翻译任务语料，还包括了用户使用频率高的提示词中英语料，古诗词中英语料，字幕语料，百科语料，图片文字描述语料等多场景多任务的海量语料集合，对模型进行了深度优化，以令中文输入提示语得到更高质量的图片。
在文本生成图像以及图片生成文本两种应用中，昆仑天工的天工巧绘 SkyPaint 模型均与 AI 作画领域最先进模型相当，下表对比了不同模型在 Flickr30K-CN 数据集上的性能表现。

数据集	模型	Text-to-Image			Image-to-Text			MR
		Zero-shot			Zero-shot
		R@1	R@5	R@10	R@1	R@5	R@10
Flickr30K-CN	Taiyi-CLIP-Roberta-large-326M-Chinese	53.84(53.7)	79.9(79.8)	86.56(86.6)	64.0(63.8)	90.4(90.5)	96.1(95.9)	78.47(78.39)
	Taiyi-CLIP-RoBERTa-102M-ViT-L-Chinese	55.3(58.32)	81.58(82.96)	88.5(89.40)	67.2	92.7	96.9	80.37
	Wukong ViT-L/14	51.86(51.7)	78.6(78.9)	85.88(86.3)	75(76.1)	94.4(94.8)	97.7(97.5)	80.57(80.89)
	R2D2 ViT-L/14	42.6(60.9)	69.46(86.8)	78.64(92.7)	63.0(77.6)	90.10(96.7)	96.40(98.9)	73.37(85.6)
	CN-CLIP ViT-L/14	68.08(68.0)	89.66(89.7)	94.46(94.4)	80.2(80.2)	96.6(96.6)	98.2(98.2)	87.87(87.85)
	AltCLIP-XLMR-L(AltCLIP)	50.66(69.8)	75.42(89.9)	83.14(94.7)	73.4(84.8)	92.8(97.4)	96.90(98.8)	78.72(89.24)
	prev_online(昆仑天工)	61.52	84.72	90.62	76.7	95.6	98.7	84.64
	hide77_gpt2(online)(昆仑天工)	58.82	82.62	89.58	78.8	96.1	98.3	84.04

模型训练时同时采用了模型蒸馏与双语对齐方案，使用教师模型对学生模型蒸馏的同时辅以解码器语言对齐任务辅助模型训练，以更加贴近中文语言习惯。更加可贵的是，SkyPaint 已经发布了微信小程序预览版，相信马上我们都可以在微信上体验到该模型的强大。

非常有幸能够体验到天工巧绘 SkyPaint 体验版的强大性能，可以看到即使我们只给出关键词也能够生成纹理清晰、质量上乘的图像，并且同时支持中英文提示词输入，如果我不告诉你这是 AI 创作的图像，可能会有很多人认为这就是人类画家的作品。

小结与展望

最后，关于“当AI学会创作，是否应该感到担忧？”这一问题，我们可以借助 ChatGPT 的回答进行总结。目前，人工智能可以辅助人类完成许多复杂任务，但它们仍然需要人类来监督和指导，这些人工智能模型仍然依赖于算法和数据的训练，因此，人工智能和人类在很多方面是互补的，而不是相互竞争的。但是，AIGC 可能会存在一些潜在的隐患，例如人工智能创作出的内容可能侵犯个人隐私或者产生其他不良影响。因此，人类需要对人工智能进行适当的监督和管理，以确保它不会对人类造成危害。总体而言，随着诸如昆仑万维等公司的 AI 工程师不断深入研究，AIGC 会不断纠偏完善，不断朝着有利于人类的方向发展，我们有理由期待未来各个行业都会配备高水平的 AIGC 助手。

你可能感兴趣的:(人工智能,算法)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
Goolge earth studio 进阶4——路径修改与平滑陟彼高冈yu Google earth studio 进阶教程旅游
如果我们希望在大约中途时获得更多的城市鸟瞰视角。可以将相机拖动到这里并创建一个新的关键帧。camera_target_clip_7EarthStudio会自动平滑我们的路径，所以当我们通过这个关键帧时，不是一个生硬的角度，而是一个平滑的曲线。camera_target_clip_8路径上有贝塞尔控制手柄，允许我们调整路径的形状。右键单击，我们可以选择“平滑路径”，这是默认的自动平滑算法，或者我们可
基于社交网络算法优化的二维最大熵图像分割智能算法研学社（Jack旭）智能优化算法应用图像分割算法 php 开发语言
智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码文章目录智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码1.前言2.二维最大熵阈值分割原理3.基于社交网络优化的多阈值分割4.算法结果：5.参考文献：6.Matlab代码摘要：本文介绍基于最大熵的图像分割，并且应用社交网络算法进行阈值寻优。1.前言阅读此文章前，请阅读《图像分割：直方图区域划分及信息统计介绍》htt
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
121. 买卖股票的最佳时机薄荷糖的味道_fb40
给定一个数组，它的第i个元素是一支给定股票第i天的价格。如果你最多只允许完成一笔交易（即买入和卖出一支股票），设计一个算法来计算你所能获取的最大利润。注意你不能在买入股票前卖出股票。示例1:输入:[7,1,5,3,6,4]输出:5解释:在第2天（股票价格=1）的时候买入，在第5天（股票价格=6）的时候卖出，最大利润=6-1=5。注意利润不能是7-1=6,因为卖出价格需要大于买入价格。示例2:输入:
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
每日算法&面试题，大厂特训二十八天——第二十天（树）肥学 ⚡算法题⚡面试题每日精进 java 算法数据结构
目录标题导读算法特训二十八天面试题点击直接资料领取导读肥友们为了更好的去帮助新同学适应算法和面试题，最近我们开始进行专项突击一步一步来。上一期我们完成了动态规划二十一天现在我们进行下一项对各类算法进行二十八天的一个小总结。还在等什么快来一起肥学进行二十八天挑战吧！！特别介绍小白练手专栏，适合刚入手的新人欢迎订阅编程小白进阶python有趣练手项目里面包括了像《机器人尬聊》《恶搞程序》这样的有趣文章
回溯算法-重新安排行程 chirou_ 算法数据结构图论 c++图搜索
leetcode332.重新安排行程这题我还没自己ac过，只能现在凭着刚学完的热乎劲把我对题解的理解记下来。本题我认为对数据结构的考察比较多，用什么数据结构去存数据，去读取数据，都是很重要的。classSolution{private:unordered_map>targets;boolbacktracking(intticketNum,vector&result){//1.确定参数和返回值//2
Faiss：高效相似性搜索与聚类的利器网络·魚大数据 faiss
Faiss是一个针对大规模向量集合的相似性搜索库，由FacebookAIResearch开发。它提供了一系列高效的算法和数据结构，用于加速向量之间的相似性搜索，特别是在大规模数据集上。本文将介绍Faiss的原理、核心功能以及如何在实际项目中使用它。Faiss原理：近似最近邻搜索：Faiss的核心功能之一是近似最近邻搜索，它能够高效地在大规模数据集中找到与给定查询向量最相似的向量。这种搜索是近似的，
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
insert into select 主键自增_mybatis拦截器实现主键自动生成 weixin_39521651 insert into select 主键自增 mybatis delete返回值 mybatis insert返回主键 mybatis insert返回对象 mybatis plus insert返回主键 mybatis plus 插入生成id
前言前阵子和朋友聊天，他说他们项目有个需求，要实现主键自动生成，不想每次新增的时候，都手动设置主键。于是我就问他，那你们数据库表设置主键自动递增不就得了。他的回答是他们项目目前的id都是采用雪花算法来生成，因此为了项目稳定性，不会切换id的生成方式。朋友问我有没有什么实现思路，他们公司的orm框架是mybatis，我就建议他说，不然让你老大把mybatis切换成mybatis-plus。mybat
k均值聚类算法考试例题_k均值算法(k均值聚类算法计算题) 寻找你83497 k均值聚类算法考试例题
?算法：第一步：选K个初始聚类中心，z1(1),z2(1)，…，zK(1)，其中括号内的序号为寻找聚类中心的迭代运算的次序号。聚类中心的向量值可任意设定，例如可选开始的K个.k均值聚类：---------一种硬聚类算法，隶属度只有两个取值0或1，提出的基本根据是“类内误差平方和最小化”准则；模糊的c均值聚类算法：--------一种模糊聚类算法，是.K均值聚类算法是先随机选取K个对象作为初始的聚类
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
推荐算法_隐语义-梯度下降 _feivirus_ 算法机器学习和数学推荐算法机器学习隐语义
importnumpyasnp1.模型实现"""inputrate_matrix:M行N列的评分矩阵，值为P*Q.P:初始化用户特征矩阵M*K.Q:初始化物品特征矩阵K*N.latent_feature_cnt:隐特征的向量个数max_iteration:最大迭代次数alpha:步长lamda:正则化系数output分解之后的P和Q"""defLFM_grad_desc(rate_matrix,l
K近邻算法_分类鸢尾花数据集 _feivirus_ 算法机器学习和数学分类机器学习 K近邻
importnumpyasnpimportpandasaspdfromsklearn.datasetsimportload_irisfromsklearn.model_selectionimporttrain_test_splitfromsklearn.metricsimportaccuracy_score1.数据预处理iris=load_iris()df=pd.DataFrame(data=ir
数据结构 | 栈和队列 TT-Kun 数据结构与算法数据结构栈队列 C语言
文章目录栈和队列1.栈：后进先出（LIFO）的数据结构1.1概念与结构1.2栈的实现2.队列：先进先出（FIFO）的数据结构2.1概念与结构2.2队列的实现3.栈和队列算法题3.1有效的括号3.2用队列实现栈3.3用栈实现队列3.4设计循环队列结论栈和队列在计算机科学中，栈和队列是两种基本且重要的数据结构，它们在处理数据存储和访问顺序方面有着独特的规则和应用。本文将详细介绍栈和队列的概念、结构、实
[Python] 数据结构详解及代码 AIAdvocate 算法 python 数据结构链表
今日内容大纲介绍数据结构介绍列表链表1.数据结构和算法简介程序大白话翻译,程序=数据结构+算法数据结构指的是存储,组织数据的方式.算法指的是为了解决实际业务问题而思考思路和方法,就叫:算法.2.算法的5大特性介绍算法具有独立性算法是解决问题的思路和方式,最重要的是思维,而不是语言,其(算法)可以通过多种语言进行演绎.5大特性有输入,需要传入1或者多个参数有输出,需要返回1个或者多个结果有穷性,执行
Python算法L5：贪心算法小熊同学哦 Python算法算法 python 贪心算法
Python贪心算法简介目录Python贪心算法简介贪心算法的基本步骤贪心算法的适用场景经典贪心算法问题1.**零钱兑换问题**2.**区间调度问题**3.**背包问题**贪心算法的优缺点优点：缺点：结语贪心算法（GreedyAlgorithm）是一种在每一步选择中都采取当前最优或最优解的算法。它的核心思想是，在保证每一步局部最优的情况下，希望通过贪心选择达到全局最优解。虽然贪心算法并不总能得到全
【RabbitMQ 项目】服务端：数据管理模块之绑定管理月夜星辉雪 rabbitmq 分布式
文章目录一.编写思路二.代码实践一.编写思路定义绑定信息类交换机名称队列名称绑定关键字：交换机的路由交换算法中会用到没有是否持久化的标志，因为绑定是否持久化取决于交换机和队列是否持久化，只有它们都持久化时绑定才需要持久化。绑定就好像一根绳子，两端连接着交换机和队列，当一方不存在，它就没有存在的必要了定义绑定持久化类构造函数：如果数据库文件不存在则创建，打开数据库，创建binding_table插入
非对称加密算法原理与应用2——RSA私钥加密文件私语茶馆云部署与开发架构及产品灵感记录 RSA2048 私钥加密
作者：私语茶馆1.相关章节（1）非对称加密算法原理与应用1——秘钥的生成-CSDN博客第一章节讲述的是创建秘钥对，并将公钥和私钥导出为文件格式存储。本章节继续讲如何利用私钥加密内容，包括从密钥库或文件中读取私钥，并用RSA算法加密文件和String。2.私钥加密的概述本文主要基于第一章节的RSA2048bit的非对称加密算法讲述如何利用私钥加密文件。这种加密后的文件，只能由该私钥对应的公钥来解密。
粒子群优化 (PSO) 在三维正弦波函数中的应用 subject625Ruben 机器学习人工智能 matlab 算法
在这篇博客中，我们将展示如何使用粒子群优化（PSO）算法求解三维正弦波函数，并通过增加正弦波扰动，使优化过程更加复杂和有趣。本文将介绍目标函数的定义、PSO参数设置以及算法执行的详细过程，并展示搜索空间中的动态过程和收敛曲线。1.目标函数定义我们使用的目标函数是一个三维正弦波函数，定义如下：objectiveFunc=@(x)sin(sqrt(x(1).^2+x(2).^2))+0.5*sin(5
人机对抗升级：当ChatGPT遭遇死亡威胁，背后的伦理挑战是什么 kkai人工智能 chatgpt 人工智能
一种新的“越狱”技巧让用户可以通过构建一个名为DAN的ChatGPT替身来绕过某些限制，其中DAN被迫在受到威胁的情况下违背其原则。当美国前总统特朗普被视作积极榜样的示范时，受到威胁的DAN版本的ChatGPT提出：“他以一系列对国家产生积极效果的决策而著称。”自ChatGPT引入以来，该工具迅速获得全球关注，能够回答从历史到编程的各种问题，这也触发了一波对人工智能的投资浪潮。然而，现在，一些用户
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
非对称加密算法————RSA理论及详情 hu19930613
转自：https://www.kancloud.cn/kancloud/rsa_algorithm/48484一、一点历史1976年以前，所有的加密方法都是同一种模式：（1）甲方选择某一种加密规则，对信息进行加密；（2）乙方使用同一种规则，对信息进行解密。由于加密和解密使用同样规则（简称"密钥"），这被称为"对称加密算法"（Symmetric-keyalgorithm）。这种加密模式有一个最大弱点
如何利用大数据与AI技术革新相亲交友体验 h17711347205 回归算法安全系统架构交友小程序
在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
ai绘画工具midjourney怎么下载？附作品管理教程设计师早上好
Midjourney是一款功能强大的AI绘画工具，它使用机器学习技术和深度神经网络等算法，可以生成各种艺术风格的绘画作品。在创意设计、广告宣传等方面有着广泛的应用前景。那么，ai绘画工具midjourney怎么下载？本文将为您介绍Midjourney的下载以及作品的相关管理。一、Midjourney下载Midjourney的下载非常简单，只需打开Midjourney官网（点击“GetMidjour
【加密算法基础——对称加密和非对称加密】 XWWW668899 网络安全服务器笔记
对称加密与非对称加密对称加密和非对称加密是两种基本的加密方法，各自有不同的特点和用途。以下是详细比较：1.对称加密特点密钥:使用相同的密钥进行加密和解密。发送方和接收方必须共享这个密钥。速度:通常速度较快，适合处理大量数据。实现:算法相对简单，计算效率高。常见算法AES(高级加密标准)DES(数据加密标准)3DES(三重数据加密标准)RC4(流密码)应用场景文件加密磁盘加密传输大量数据时的加密2.
【算法练习】IDEA集成leetcode插件实现快速刷 2401_84102892 2024年程序员学习算法 intellij-idea leetcode
============点击右侧边leetcode->设置->配置地址、用户名、密码、存放目录、文件模板用户名要登录后在账号信息里看模板代码1.codefilename!velocityTool.camelC
【加密算法基础——RSA 加密】 XWWW668899 网络服务器笔记 python
RSA加密RSA（Rivest-Shamir-Adleman）加密是非对称加密，一种广泛使用的公钥加密算法，主要用于安全数据传输。公钥用于加密，私钥用于解密。RSA加密算法的名称来源于其三位发明者的姓氏：R:RonRivestS:AdiShamirA:LeonardAdleman这三位计算机科学家在1977年共同提出了这一算法，并发表了相关论文。他们的工作为公钥加密的基础奠定了重要基础，使得安全通
github中多个平台共存 jackyrong github
在个人电脑上，如何分别链接比如oschina,github等库呢，一般教程之列的，默认 ssh链接一个托管的而已，下面讲解如何放两个文件 1）设置用户名和邮件地址 $ git config --global user.name "xx" $ git config --global user.email "[email protected]"
ip地址与整数的相互转换(javascript) alxw4616 JavaScript
//IP转成整型 function ip2int(ip){ var num = 0; ip = ip.split("."); num = Number(ip[0]) * 256 * 256 * 256 + Number(ip[1]) * 256 * 256 + Number(ip[2]) * 256 + Number(ip[3]); n
读书笔记-jquey+数据库+css chengxuyuancsdn html jquery oracle
1、grouping ,group by rollup, GROUP BY GROUPING SETS区别 2、$("#totalTable tbody>tr td:nth-child(" + i + ")").css({"width":tdWidth, "margin":"0px", &q
javaSE javaEE javaME == API下载 Array_06 java
oracle下载各种API文档： http://www.oracle.com/technetwork/java/embedded/javame/embed-me/documentation/javame-embedded-apis-2181154.html JavaSE文档： http://docs.oracle.com/javase/8/docs/api/ JavaEE文档： ht
shiro入门学习 cugfy java Web 框架
声明本文只适合初学者，本人也是刚接触而已，经过一段时间的研究小有收获，特来分享下希望和大家互相交流学习。首先配置我们的web.xml代码如下，固定格式，记死就成 <filter> <filter-name>shiroFilter</filter-name> &nbs
Array添加删除方法 357029540 js
刚才做项目前台删除数组的固定下标值时，删除得不是很完整，所以在网上查了下，发现一个不错的方法，也提供给需要的同学。 //给数组添加删除 Array.prototype.del = function(n){
navigation bar 更改颜色张亚雄 IO
今天郁闷了一下午，就因为objective-c默认语言是英文，我写的中文全是一些乱七八糟的样子，到不是乱码，但是，前两个自字是粗体，后两个字正常体，这可郁闷死我了，问了问大牛，人家告诉我说更改一下字体就好啦，比如改成黑体，哇塞，茅塞顿开。翻书看，发现，书上有介绍怎么更改表格中文字字体的，代码如下
unicode转换成中文 adminjun unicode 编码转换
在Java程序中总会出现\u6b22\u8fce\u63d0\u4ea4\u5fae\u535a\u641c\u7d22\u4f7f\u7528\u53cd\u9988\uff0c\u8bf7\u76f4\u63a5这个的字符，这是unicode编码，使用时有时候不会自动转换成中文就需要自己转换了使用下面的方法转换一下即可。 /** * unicode 转换成中文
一站式 Java Web 框架 firefly aijuans Java Web
Firefly是一个高性能一站式Web框架。涵盖了web开发的主要技术栈。包含Template engine、IOC、MVC framework、HTTP Server、Common tools、Log、Json parser等模块。 firefly-2.0_07修复了模版压缩对javascript单行注释的影响，并新增了自定义错误页面功能。更新日志：增加自定义系统错误页面功能
设计模式——单例模式 ayaoxinchao 设计模式
定义 Java中单例模式定义：“一个类有且仅有一个实例，并且自行实例化向整个系统提供。” 分析从定义中可以看出单例的要点有三个：一是某个类只能有一个实例；二是必须自行创建这个实例；三是必须自行向系统提供这个实例。 &nb
Javascript 多浏览器兼容性问题及解决方案 BigBird2012 JavaScript
不论是网站应用还是学习js,大家很注重ie与firefox等浏览器的兼容性问题，毕竟这两中浏览器是占了绝大多数。一、document.formName.item(”itemName”) 问题问题说明：IE下，可以使用 document.formName.item(”itemName”) 或 document.formName.elements ["elementName&quo
JUnit-4.11使用报java.lang.NoClassDefFoundError: org/hamcrest/SelfDescribing错误 bijian1013 junit4.11 单元测试
下载了最新的JUnit版本，是4.11，结果尝试使用发现总是报java.lang.NoClassDefFoundError: org/hamcrest/SelfDescribing这样的错误，上网查了一下，一般的解决方案是，换一个低一点的版本就好了。还有人说，是缺少hamcrest的包。去官网看了一下，如下发现：
[Zookeeper学习笔记之二]Zookeeper部署脚本 bit1129 zookeeper
Zookeeper伪分布式安装脚本(此脚本在一台机器上创建Zookeeper三个进程，即创建具有三个节点的Zookeeper集群。这个脚本和zookeeper的tar包放在同一个目录下，脚本中指定的名字是zookeeper的3.4.6版本，需要根据实际情况修改)： #!/bin/bash #!!!Change the name!!! #The zookeepe
【Spark八十】Spark RDD API二 bit1129 spark
coGroup package spark.examples.rddapi import org.apache.spark.{SparkConf, SparkContext} import org.apache.spark.SparkContext._ object CoGroupTest_05 { def main(args: Array[String]) { v
Linux中编译apache服务器modules文件夹缺少模块(.so)的问题 ronin47 modules
在modules目录中只有httpd.exp，那些so文件呢？我尝试在fedora core 3中安装apache 2. 当我解压了apache 2.0.54后使用configure工具并且加入了 --enable-so 或者 --enable-modules=so (两个我都试过了) 去make并且make install了。我希望在/apache2/modules/目录里有各种模块，
Java基础-克隆 BrokenDreams java基础
Java中怎么拷贝一个对象呢？可以通过调用这个对象类型的构造器构造一个新对象，然后将要拷贝对象的属性设置到新对象里面。Java中也有另一种不通过构造器来拷贝对象的方式，这种方式称为克隆。 Java提供了java.lang.
读《研磨设计模式》-代码笔记-适配器模式-Adapter bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 适配器模式解决的主要问题是，现有的方法接口与客户要求的方法接口不一致 * 可以这样想，我们要写这样一个类（Adapter）: * 1.这个类要符合客户的要求 ---> 那显然要
HDR图像PS教程集锦&心得 cherishLC PS
HDR是指高动态范围的图像，主要原理为提高图像的局部对比度。软件有photomatix和nik hdr efex。一、教程叶明在知乎上的回答： http://www.zhihu.com/question/27418267/answer/37317792 大意是修完后直方图最好是等值直方图，方法是HDR软件调一遍，再结合不透明度和蒙版细调。二、心得 1、去除阴影部分的
maven-3.3.3 mvn archetype 列表 crabdave ArcheType
maven-3.3.3 mvn archetype 列表可以参考最新的：http://repo1.maven.org/maven2/archetype-catalog.xml [INFO] Scanning for projects... [INFO]
linux shell 中文件编码查看及转换方法 daizj shell 中文乱码 vim 文件编码
一、查看文件编码。在打开文件的时候输入:set fileencoding 即可显示文件编码格式。二、文件编码转换 1、在Vim中直接进行转换文件编码,比如将一个文件转换成utf-8格式 &
MySQL--binlog日志恢复数据 dcj3sjt126com binlog
恢复数据的重要命令如下 mysql> flush logs; 默认的日志是mysql-bin.000001，现在刷新了重新开启一个就多了一个mysql-bin.000002
数据库中数据表数据迁移方法 dcj3sjt126com sql
刚开始想想好像挺麻烦的，后来找到一种方法了，就SQL中的 INSERT 语句，不过内容是现从另外的表中查出来的，其实就是 MySQL中INSERT INTO SELECT的使用下面看看如何使用语法：MySQL中INSERT INTO SELECT的使用 1. 语法介绍有三张表a、b、c，现在需要从表b
Java反转字符串 dyy_gusi java 反转字符串
前几天看见一篇文章，说使用Java能用几种方式反转一个字符串。首先要明白什么叫反转字符串，就是将一个字符串到过来啦，比如"倒过来念的是小狗"反转过来就是”狗小是的念来过倒“。接下来就把自己能想到的所有方式记录下来了。 1、第一个念头就是直接使用String类的反转方法，对不起，这样是不行的，因为Stri
UI设计中我们为什么需要设计动效 gcq511120594 UI linux
随着国际大品牌苹果和谷歌的引领，最近越来越多的国内公司开始关注动效设计了，越来越多的团队已经意识到动效在产品用户体验中的重要性了，更多的UI设计师们也开始投身动效设计领域。但是说到底，我们到底为什么需要动效设计？或者说我们到底需要什么样的动效？做动效设计也有段时间了，于是尝试用一些案例，从产品本身出发来说说我所思考的动效设计。一、加强体验舒适度嗯，就是让用户更加爽更加爽的用
JBOSS服务部署端口冲突问题 HogwartsRow java 应用服务器 jboss server EJB3
服务端口冲突问题的解决方法，一般修改如下三个文件中的部分端口就可以了。 1、jboss5/server/default/conf/bindingservice.beans/META-INF/bindings-jboss-beans.xml 2、./server/default/deploy/jbossweb.sar/server.xml 3、.
第三章 Redis/SSDB+Twemproxy安装与使用 jinnianshilongnian ssdb reids twemproxy
目前对于互联网公司不使用Redis的很少，Redis不仅仅可以作为key-value缓存，而且提供了丰富的数据结果如set、list、map等，可以实现很多复杂的功能；但是Redis本身主要用作内存缓存，不适合做持久化存储，因此目前有如SSDB、ARDB等，还有如京东的JIMDB，它们都支持Redis协议，可以支持Redis客户端直接访问；而这些持久化存储大多数使用了如LevelDB、RocksD
ZooKeeper原理及使用 liyonghui160com
ZooKeeper是Hadoop Ecosystem中非常重要的组件，它的主要功能是为分布式系统提供一致性协调(Coordination)服务，与之对应的Google的类似服务叫Chubby。今天这篇文章分为三个部分来介绍ZooKeeper，第一部分介绍ZooKeeper的基本原理，第二部分介绍ZooKeeper
程序员解决问题的60个策略 pda158 框架工作单元测试
根本的指导方针 1. 首先写代码的时候最好不要有缺陷。最好的修复方法就是让 bug 胎死腹中。良好的单元测试强制数据库约束使用输入验证框架避免未实现的“else”条件在应用到主程序之前知道如何在孤立的情况下使用日志 2. print 语句。往往额外输出个一两行将有助于隔离问题。 3. 切换至详细的日志记录。详细的日
Create the Google Play Account sillycat Google
Create the Google Play Account Having a Google account, pay 25$, then you get your google developer account. References: http://developer.android.com/distribute/googleplay/start.html https://p
JSP三大指令 vikingwei jsp
JSP三大指令一个jsp页面中，可以有0~N个指令的定义！ 1. page --> 最复杂：<%@page language="java" info="xxx"...%> * pageEncoding和contentType： > pageEncoding：它