中杯可乐多加冰

探寻人工智能前沿迎接AIGC时代——CSIG企业行（附一些好玩的创新点）

上周我有幸参加了由中国图像图形学会和合合信息共同举办的CSIG企业行活动。

这次活动邀请了多位来自图像描述与视觉问答、图文公式识别、自然语言处理、生成式视觉等领域的学者，他们分享了各自的研究成果和经验，并与现场观众进行了深入的交流和探讨。干货多多，感悟多多，在这里分享此次的收获给大家。

一、活动介绍

✍中国图像图形学学会（China Society of Image and Graphics，CSIG）成立于1990年，是经国家民政部批准成立的国家一级学会，是中国科学技术协会的正式团体会员。它是致力于推进图像图形学领域学科建设、技术研究和学术交流的专业学会。中国图象图形学学会的宗旨是团结广大图象图形科技工作者，积极开展图象图形基础理论和高新技术的研究，促进该学科技术的发展和在国民经济各个领域的推广应用。此次的CSIG企业行-走进合合信息就是学会的重要交流研讨形式之一。

本次活动以“图文智能处理与多场景应用技术展望”为主题，聚集了来自全国知名高校和合合信息技术团队的学者和工程师，一同分享图像文档处理领域的最新研究成果和实践经验。

在当天，来自上海交通大学、厦门大学、复旦大学、中国科学技术大学等知名学府的学者和合合信息技术团队的工程师的分享探讨了图像文档处理中的结构建模、底层视觉技术、跨媒体数据协同应用、生成式人工智能及对话式大型语言模型等多个领域的研究进展和实践成果，下面我选取并总结了会上我最感兴趣，也是当前最热点的几个话题的部分内容，分享给大家：

二、生成式人工智能和元宇宙

2.1、生成式人工智能——未来的战略技术

杨小康教授在现场强调了生成式人工智能的重要性，他指出，生成式人工智能是通过机器学习方法从数据中学习特征，进而生成全新的、原创的数据，预计到2025，生成式人工智能产生的数据将占据人类全部数据的10%。

当生成式数据超过80%的时候，人类是否全面进入元宇宙成为了一个非常值得深思的问题，元宇宙需要生成式人工智能来构建，通过生成式人工智能所生成的数据，元宇宙才能不断地演化和发展。生成式人工智能的发展将推动元宇宙的发展和进化，而元宇宙的不断演化和发展也将进一步促进生成式人工智能技术的创新与进步，两者相互促进、相互依存。这也预示着未来的科技发展将朝着更加智能化、更加普惠化的方向前进。

探寻人工智能前沿迎接AIGC时代——CSIG企业行（附一些好玩的创新点）_第1张图片

2.2、生成式世界模型

生成式世界模型是一种基于人工智能的技术，其核心思想是让计算机从输入数据中学习，从而构建出一个全新的、可以被操作的虚拟世界。

探寻人工智能前沿迎接AIGC时代——CSIG企业行（附一些好玩的创新点）_第2张图片

生成式世界模型通过学习大量数据中的规律和模式，可以生成全新的、原创的数据，并以此构建出一个与真实世界类似的虚拟世界。这个虚拟世界中的每个元素都是由计算机自主创造的，并且可以被操作、改变、扩展。与传统的计算机模拟不同，生成式世界模型所创造的虚拟世界具有更高的逼真度和互动性，能够提供更加真实的体验。

2.3、生成式虚拟数字人

生成式虚拟数字人是指利用生成式人工智能技术，从真实的人类数据中学习，生成一个虚拟的数字化人类形象，其外貌、言谈举止和行为模式等方面均与真实的人类相似度极高。生成式虚拟数字人的应用领域非常广泛，包括电影、游戏、社交网络、虚拟现实、远程教育、在线客服等诸多领域。

杨教授为我们介绍了许多生成式虚拟数字人的应用。其中包括3D人脸重建、高拟真的表情可驱动数字人技术、语音驱动个性化数字人技术、跨模态驱动等等。

探寻人工智能前沿迎接AIGC时代——CSIG企业行（附一些好玩的创新点）_第3张图片

总的来说，生成式虚拟数字人作为生成式人工智能技术的一种应用，将在各个领域发挥越来越重要的作用，未来，随着技术的不断进步和应用场景的不断拓展，生成式虚拟数字人的应用将会更加广泛，也将会呈现出越来越高的技术水平和越来越强的应用能力。

2.4、想法1：生成式人工智能+艺术

这让我联想到目前火热的Midjourney和Dalle等AI作画工具。

绘画艺术是几千年文化的结晶，但是大多数成功的艺术家都有自己独特的绘画风格，利用人工智能研究和模仿这种绘画风格的独特性和绘画技巧，将艺术大师的名画的画风迁移到普通的图片也是一个非常有趣的应用。

利用神经网络进行风格转移，可以实现多种艺术风格的融合。一方面可以实现图像的二次开发，表现出更好的艺术效果。另一方面，可以为设计师提供全新的艺术视角和设计灵感。

目前，基于深度学习的风格迁移主要采用经典的网络结构VGG-Net。

探寻人工智能前沿迎接AIGC时代——CSIG企业行（附一些好玩的创新点）_第4张图片

VGG16模型是牛津大学的K.Simonyan和A.Zisserman在论文“Very Deep Convolutional Networks for Large-Scale Image Recognition”中提出的卷积神经网络模型，模型首先输入一个224 x 224像素大小的RGB图像时，经过一系列卷积层，这些卷积层使用非常小的滤波器大小（3x3）以捕捉像素周围的左/右、上/下和中心的特征，在其中一个卷积层配置中，使用1x1的滤波器来进行线性转换，卷积的步幅为1个像素，这样输入图像的填充方式使得在卷积后保留空间分辨率。随后最大池化层用于进一步降低图像的空间维度。

在卷积层和池化层之后，作者还设计了三个全连接层，这些层的结构在所有网络中都相同。前两个全连接层都有4096个节点，第三个全连接层有1000个节点，用于输出1000个类别的概率分布。最后一层是softmax层，用于将全连接层的输出转换为概率值。所有的隐藏层都使用ReLU激活函数，但不包含局部响应归一化（LRN）。

探寻人工智能前沿迎接AIGC时代——CSIG企业行（附一些好玩的创新点）_第5张图片

总的来说，VGG16,模型通过用多个 3×3 内核大小的过滤器一个接一个地替换大内核的过滤器（第一和第二卷积层中分别为 11 和 5）来对 AlexNet 进行改进，使得模型具有出色的特征提取能力和较高的精度。

三、✨大型语言模型（类ChatGPT）的关键技术和实现

3.1、ChatGPT的三个关键技术

邱锡鹏教授为我们介绍了目前火热的类ChatGPT的大型语言模型，虽然目前ChatGPT技术细节和模型参数尚未开源，但是它已经展现出惊人的能力，呈现了普适人工智能助手的广阔研究和应用前景。其中，情景学习、思维链和指令学习是其三个最为突出的特点：

探寻人工智能前沿迎接AIGC时代——CSIG企业行（附一些好玩的创新点）_第6张图片

情景学习：这是ChatGPT的核心能力之一，它能够从文本中学习出不同上下文之间的关联性，进而在新的情景下产生合理的回复。这种能力不仅需要对语义和逻辑有着深入的理解，还需要对语言的常识和背景知识有所了解。通过对大量数据的训练，ChatGPT能够逐渐提升其情景学习的能力，实现更为自然、准确的对话。

思维链：ChatGPT可以通过建立思维链来理解问题，即将一个问题分解成一系列相关的子问题，并在不同的阶段中进行回答。这种能力使得ChatGPT可以更加深入地理解问题，从而提供更为准确的答案。

指令学习：ChatGPT的另一个重要能力是它可以从指令式的文本中学习出对应的行为，并将其转化为相应的操作。这种能力对于语音助手、机器人等领域具有重要的应用价值。例如，当用户发出“帮我用js代码解决下面这个问题”的指令时，ChatGPT可以理解该指令的含义并将其转化为输出相应的代码，实现与用户的交互。同样，ChatGPT也能够通过大量的数据训练提升其指令学习的能力，进而实现更为准确和智能的指令执行。

3.2、暗知识的理解和应用

ChatGPT只是对话式人工智能领域的一个开始，随着技术的不断发展，人工智能将会更好地理解并应用“暗知识”，即无法直接通过文本获得的知识，比如人类的观察和经验。此外，跨模态学习也是人工智能未来发展的重要方向，通过让机器从多种感知模态（如视觉、听觉、触觉）中进行学习和交互，可以更好地模拟人类的认知过程，实现更加智能化和精准化的应用。

探寻人工智能前沿迎接AIGC时代——CSIG企业行（附一些好玩的创新点）_第7张图片

3.3、想法2：任务导向型对话系统+Excel、PPT、PS

ChatGPT的下一步发展一方面可能是多模态的运用，另一方面则是任务导向型对话系统。面向任务的对话（TOD）通常被分解为三个子任务:

对话状态跟踪(DST)，用于跟踪用户的信念状态;

对话政策学习(POL)，用于决定采取何种系统行动;

自然语言生成(NLG)，用于生成对话响应

探寻人工智能前沿迎接AIGC时代——CSIG企业行（附一些好玩的创新点）_第8张图片

PPTOD模型将不同的对话模块(例如DST、POL和NLG)集成到一个统一的模型中。受上下文内学习概念(Brown et al, 2020)的激励，作者将特定于任务的自然语言指令(称为提示)插入对话上下文作为模型输入来引导模型解决不同的TOD子任务，这种方式上不同子任务的代数是解耦的，使得模型具有更大的灵活性，另外作者还使用T5对由部分注释数据组成的异构对话语料库进行了预训练。

在此基础上，使用任务导向型对话系统操纵Excel、PPT、PS等工具进行任务协作是一个非常值得开发的思路。对于Excel这类数据处理软件，任务导向型对话系统可以通过识别和理解用户输入的数据，自动完成数据处理、图表绘制等操作。对于PPT这类演示软件，任务导向型对话系统可以通过理解用户输入的要求，自动调整PPT页面布局、插入图片、添加动画，使得PPT制作过程变得更加简单和快捷。对于PS这类图像处理软件，任务导向型对话系统可以通过理解用户输入的要求，自动完成图像裁剪、调色、修图等操作，使得图像处理变得更加简单和高效。

四、复杂跨媒体数据协同分析与应用

4.1、视觉-->语言跨媒体分析研究

接下来纪荣嵘教授的主题报告是复杂跨媒体数据协同分析与应用，这也是和文本生成图像的方向息息相关。

视觉-语言跨媒体分析研究是计算机视觉（CV）领域的重要研究方向之一，它将图像和视频中的视觉信息与自然语言中的语义信息相结合，通过计算机算法进行跨媒体的分析和理解。该领域的研究目标是建立视觉与语言之间的联系，实现计算机对图像、视频、语音等多模态数据的深入理解和处理，从而推进人工智能的发展和应用。在视觉-语言跨媒体分析研究中，深度学习技术和生成式模型被广泛应用，例如图文匹配、看图说话、视觉问答、听文作图和指向检测等，为实现智能化应用和人机交互提供了有力支撑。

探寻人工智能前沿迎接AIGC时代——CSIG企业行（附一些好玩的创新点）_第9张图片

4.2、语言-->视觉跨媒体分析研究

语言-视觉跨媒体分析研究致力于将自然语言和视觉信息进行融合，实现对多模态数据的分析和理解。例如，通过将图像与相应的文字描述相结合，可以构建图像标注系统，从而提高图像检索的效率。此外，在机器翻译方面，语言-->视觉跨媒体分析研究可以将图像作为上下文信息，辅助翻译系统进行翻译，提高翻译质量。近年来，随着深度学习技术的不断发展，语言-->视觉跨媒体分析研究取得了很大的进展，并在图像检索、机器翻译、视频理解等领域得到了广泛的应用。

探寻人工智能前沿迎接AIGC时代——CSIG企业行（附一些好玩的创新点）_第10张图片

开放式人脸生成与编辑是计算机视觉领域中的一个重要研究方向，它利用生成式人工智能技术和深度学习算法，从少量样本或者甚至仅仅是一张人脸照片中，生成具有高度可信度和多样性的人脸图像。这项技术的应用非常广泛，比如可以应用在人脸识别、虚拟试衣、虚拟现实、游戏开发、电影特效等领域。

通过利用生成式人工智能技术和深度学习算法，可以实现对人脸图像的各种属性进行编辑，比如年龄、性别、肤色、头发、胡子、表情等等。这项技术可以为虚拟试衣、电影特效等领域带来更多的可能性，也为医学领域中的面部重建等提供了新的思路和方法。

4.3、想法3：生成性NeRF+3D视觉生成

信息在现实世界中以各种形式存在，多模态信息之间的有效交互和融合对于计算机视觉和深度学习研究中多模态数据的创建和感知起着关键作用。

神经辐射场（NeRF）通过使用神经网络定义隐式场景表示，实现了令人印象深刻的新视图合成性能。特别是，NeRF采用全连接神经网络，将空间位置（x，y，z）和相应的观察方向（θ，φ））作为输入，将体积密度和相应的发射辐射作为输出。

基于此，FENeRF提出了一种3D感知生成器，可以生成视图一致且可本地编辑的肖像图像。FENeRF使用两个解耦的潜在代码在具有共享几何结构的空间对齐的3D体积中生成相应的面部语义和纹理。得益于这种底层3D表示，Feneff可以联合渲染边界对齐的图像和语义掩模，并使用语义掩模通过GAN逆映射编辑3D体积。

探寻人工智能前沿迎接AIGC时代——CSIG企业行（附一些好玩的创新点）_第11张图片

当前的生成性NeRF模型（如StyleNeRF、EG3D）能够从一组未定位的2D图像中建模具有简单几何体（如人脸、汽车）的场景，就像无条件GAN（如Stylgan）的训练一样。然而，当前生成的NERF在具有复杂几何变化的数据集上依然表现不佳，例如DeepFashion和ImageNet。一种可能的解决方案是提供场景的更多先验知识，例如，通过现成的重建模型获得先验场景几何，为生成性人体建模提供骨架先验。

五、文档图像处理中的底层视觉

5.1、文档图像视觉技术难题——摩尔纹

底层视觉技术一直是计算机视觉领域的重要研究方向之一。现实中非常容易出现且难以解决的一个问题就是：摩尔纹，如下是一个非常常见的摩尔纹出现场景。

探寻人工智能前沿迎接AIGC时代——CSIG企业行（附一些好玩的创新点）_第12张图片

而在复杂环境下，摩尔纹图案的频率分布通常会变得非常复杂。这是因为在非均匀的接触表面上，摩尔纹的频率取决于表面形貌和压力分布的复杂度。在某些区域，摩尔纹可能会出现非常密集的频率分布，而在其他区域则可能很稀疏。

探寻人工智能前沿迎接AIGC时代——CSIG企业行（附一些好玩的创新点）_第13张图片

此外，摩尔纹图案的颜色通道大小也可能不平衡。由于干涉条纹的颜色通常是由光波长决定的，因此当接触表面在不同位置上的形貌和压力分布发生变化时，摩尔纹的颜色通道大小也会发生变化。这可能导致在某些区域中，摩尔纹的某些颜色通道比其他颜色通道更强，从而使摩尔纹的外观变得非常不平衡。因此，在解决摩尔纹问题时，需要综合考虑多种因素，以获得最佳的结果。

5.2、底层视觉技术

在这个领域，合合信息图像算法研发总监郭丰俊博士分享了他的研究成果。他指出，底层视觉技术在处理文档时，经常会遇到摩尔纹这类的一些典型问题，如形变、模糊、阴影遮盖、背景杂乱等。为了解决这些问题，合合信息技术团队一直致力于智能图像处理技术模块、融合技术典型应用、图像安全领域等领域的研究。

合合信息在智能文字识别、图像处理、自然语言处理（NLP）、知识图谱、大数据挖掘等技术研究上深耕多年。基于自主研发的领先的智能文字识别及商业大数据核心技术，还为全球C端用户和多元行业B端客户提供身份证、票据数字化、PS篡改检测、切边增强、曲面矫正、阴影处理、印章检测等智能图像处理产品及服务。

5.3、想法4：OCR+智能手写体试卷批改

OCR（Optical Character Recognition，光学字符识别）技术和智能手写体识别技术在试卷批改领域具有广阔的应用前景，传统的试卷批改需要老师手动阅卷、判分，费时费力且易出错。如果利用OCR和智能手写体识别技术可以自动识别试卷上的文字和手写内容，可以明显提高批改效率和准确性。但是与传统OCR不同，手写体的复杂度更高，且存在个体差异，因此需要更加先进的识别算法和更大的训练数据集，这也是一个可值得深究的方向。

最后

最后，除了听取合合信息图像算法研发总监郭丰俊博士的分享，我还有幸参观了合合信息的公司展厅。展厅里陈列着多个智能文档处理的应用案例，包括文档扫描、文字识别、图像矫正、鼎文识别等。这些应用案例非常吸引人，特别是当我亲眼看见文档扫描后的图像被瞬间矫正成为清晰、整齐的文本内容时，不禁感叹技术的奇妙。同时，展厅内的小姐姐热情地为我介绍了合合信息的丰富研究成果，以及合合信息在这一领域所做的研究工作。

探寻人工智能前沿迎接AIGC时代——CSIG企业行（附一些好玩的创新点）_第14张图片

作为一名观众，我深感震撼。这些学者们不仅在自己的领域里深耕细作，而且还能够跨界探索，将不同领域的知识和技术融合，创造出更加出色的研究成果。可以说此次活动是一次知识盛宴，也是一次交流和学习的机会。

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
【一起学Rust | 设计模式】习惯语法——使用借用类型作为参数、格式化拼接字符串、构造函数广龙宇一起学Rust #Rust设计模式 rust 设计模式开发语言
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、使用借用类型作为参数二、格式化拼接字符串三、使用构造函数总结前言Rust不是传统的面向对象编程语言，它的所有特性，使其独一无二。因此，学习特定于Rust的设计模式是必要的。本系列文章为作者学习《Rust设计模式》的学习笔记以及自己的见解。因此，本系列文章的结构也与此书的结构相同（后续可能会调成结构），基本上分为三个部分
LLM 词汇表落难Coder LLMs NLP 大语言模型大模型 llama 人工智能
Contextwindow“上下文窗口”是指语言模型在生成新文本时能够回溯和参考的文本量。这不同于语言模型训练时所使用的大量数据集，而是代表了模型的“工作记忆”。较大的上下文窗口可以让模型理解和响应更复杂和更长的提示，而较小的上下文窗口可能会限制模型处理较长提示或在长时间对话中保持连贯性的能力。Fine-tuning微调是使用额外的数据进一步训练预训练语言模型的过程。这使得模型开始表示和模仿微调数
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
基于社交网络算法优化的二维最大熵图像分割智能算法研学社（Jack旭）智能优化算法应用图像分割算法 php 开发语言
智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码文章目录智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码1.前言2.二维最大熵阈值分割原理3.基于社交网络优化的多阈值分割4.算法结果：5.参考文献：6.Matlab代码摘要：本文介绍基于最大熵的图像分割，并且应用社交网络算法进行阈值寻优。1.前言阅读此文章前，请阅读《图像分割：直方图区域划分及信息统计介绍》htt
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
使用LLaVa和Ollama实现多模态RAG示例 llzwxh888 python 人工智能开发语言
本文将详细介绍如何使用LLaVa和Ollama实现多模态RAG（检索增强生成），通过提取图像中的结构化数据、生成图像字幕等功能来展示这一技术的强大之处。安装环境首先，您需要安装以下依赖包：!pipinstallllama-index-multi-modal-llms-ollama!pipinstallllama-index-readers-file!pipinstallunstructured!p
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
番茄西红柿叶子病害分类数据集12882张11类别 futureflsl 数据集分类数据挖掘人工智能
数据集类型：图像分类用，不可用于目标检测无标注文件数据集格式：仅仅包含jpg图片，每个类别文件夹下面存放着对应图片图片数量(jpg文件个数)：12882分类类别数：11类别名称:["Bacterial_Spot_Bacteria","Early_Blight_Fungus","Healthy","Late_Blight_Water_Mold","Leaf_Mold_Fungus","Powdery
【华为OD技术面试真题 - 技术面】-测试八股文真题题库（1）算法大师华为od 面试 python 算法前端
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.黑盒测试和白盒测试的区别2.假设我们公司现在开发一个类似于微信的软件1.0版本，现在要你测试这个功能：打开聊天窗口，输入文本，限制字数在200字以内。问你怎么提取测试点。功能测试性能测试安全性测试可用性测试跨平台兼容性测试网络环境测试3.接口测试的工具你了解哪些
日常演播练习0822 开阳春天
日常演播练习0822一、绕口令练习司小四和史小世，四月十四日十四时四十上集市，司小四买了四十四斤四两西红柿，史小世买了十四斤四两细蚕丝。司小四要拿四十四斤四两西红柿换史小世十四斤四两细蚕丝。史小世十四斤四两细蚕丝不换司小四四十四斤四两西红柿。司小四说我四十四斤四两西红柿可以增加营养防近视，史小世说我十四斤四两细蚕丝可以织绸织缎又抽丝。二、文本练习狗熊是动物街有名的美食家，它吃得多所以长得胖，它能吃
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
OPENAIGC开发者大赛企业组AI黑马奖 | AIGC数智传媒解决方案 RPA中国人工智能 AIGC 传媒
在第二届拯救者杯OPENAIGC开发者大赛中，涌现出一批技术突出、创意卓越的作品。为了让这些优秀项目被更多人看到，我们特意开设了优秀作品报道专栏，旨在展示其独特之处和开发者的精彩故事。无论您是技术专家还是爱好者，希望能带给您不一样的知识和启发。让我们一起探索AIGC的无限可能，见证科技与创意的完美融合！创未来AI应用赛-企业组AI黑马奖作品名称：AIGC数智传媒解决方案参赛团队：深圳市三象智能技术
insert into select 主键自增_mybatis拦截器实现主键自动生成 weixin_39521651 insert into select 主键自增 mybatis delete返回值 mybatis insert返回主键 mybatis insert返回对象 mybatis plus insert返回主键 mybatis plus 插入生成id
前言前阵子和朋友聊天，他说他们项目有个需求，要实现主键自动生成，不想每次新增的时候，都手动设置主键。于是我就问他，那你们数据库表设置主键自动递增不就得了。他的回答是他们项目目前的id都是采用雪花算法来生成，因此为了项目稳定性，不会切换id的生成方式。朋友问我有没有什么实现思路，他们公司的orm框架是mybatis，我就建议他说，不然让你老大把mybatis切换成mybatis-plus。mybat
基于Python给出的PDF文档转Markdown文档的方法程序媛了了 python pdf 开发语言
注：网上有很多将Markdown文档转为PDF文档的方法，但是却很少有将PDF文档转为Markdown文档的方法。就算有，比如某些网站声称可以将PDF文档转为Markdown文档，尝试过，不太符合自己的要求，而且无法保证文档没有泄露风险。于是本人为了解决这个问题，借助GPT（能使用GPT镜像或者有条件直接使用GPT的，反正能调用GPT接口就行）生成Python代码来完成这个功能。笔记、代码难免存在
BART&BERT Ambition_LAO 深度学习
BART和BERT都是基于Transformer架构的预训练语言模型。模型架构：BERT(BidirectionalEncoderRepresentationsfromTransformers)主要是一个编码器（Encoder）模型，它使用了Transformer的编码器部分来处理输入的文本，并生成文本的表示。BERT特别擅长理解语言的上下文，因为它在预训练阶段使用了掩码语言模型（MLM）任务，即
语文主题教学学习笔记之87 东哥杂谈
“语文主题教学”学习笔记之八十七（0125）今天继续学习小学语文主题教学的实践样态。板块三：教学中体现“书艺”味道。作为四大名著之一的《水浒传》，堪称我国文学宝库之经典。对从《水浒传》中摘选的单元，教师就要了解其原生态，即评书体特点。这也要求教师要了解一些常用的评书行话术语，然后在教学时适时地加入一些，让学生体味其文本中原有的特色。学生也要尽可能地通过朗读的方式，而不单是分析讲解的方式进行学习。细
Python神器！WEB自动化测试集成工具 DrissionPage 亚丁号 python 开发语言
一、前言用requests做数据采集面对要登录的网站时，要分析数据包、JS源码，构造复杂的请求，往往还要应付验证码、JS混淆、签名参数等反爬手段，门槛较高。若数据是由JS计算生成的，还须重现计算过程，体验不好，开发效率不高。使用浏览器，可以很大程度上绕过这些坑，但浏览器运行效率不高。因此，这个库设计初衷，是将它们合而为一，能够在不同须要时切换相应模式，并提供一种人性化的使用方法，提高开发和运行效率
如何用matlab灵活控制feko的求解 NingrLi matlab 开发语言
https://bbs.rfeda.cn/read.php?tid=3778Feko中的模型和求解设置等都可以通过editfeko进行设置，其文件存储为.pre文件，该文件可以用文本打开，因此，我们可以通过VB、VC、matlab等工具对.pre文件进行读写操作，以达到更灵活的使用feko。同样，对于.out文件，我们也可以进行读操作。熟练使用对.pre文件和.out文件的操作后，我们可以方便的计
利用python实现图片格式之间的相互转换难得北窗高卧 python 开发语言
一、概要图片一般有多种格式，常见的图片格式包括：JPEG（.jpg或.jpeg）：一种广泛使用的有损压缩格式，适用于摄影图像和网页上的图片。PNG（.png）：一种无损压缩格式，支持透明度和更好的图像质量，常用于图标、图形和需要透明背景的图片。该图片是4通道的，外加一个透明通道。如截屏GIF（.gif）：一种支持动画和透明度的格式，常用于简单的动画和图标。BMP（.bmp）：一种无损格式，存储图像
JAVA·一个简单的登录窗口 MortalTom java 开发语言学习
文章目录概要整体架构流程技术名词解释技术细节资源概要JavaSwing是Java基础类库的一部分，主要用于开发图形用户界面（GUI）程序整体架构流程新建项目，导入sql.jar包（链接放在了文末），编译项目并运行技术名词解释一、特点丰富的组件提供了多种可视化组件，如按钮（JButton）、文本框（JTextField）、标签（JLabel）、下拉列表（JComboBox）等，可以满足不同的界面设计
遥感影像的切片处理 sand&wich 计算机视觉 python 图像处理
在遥感影像分析中，经常需要将大尺寸的影像切分成小片段，以便于进行详细的分析和处理。这种方法特别适用于机器学习和图像处理任务，如对象检测、图像分类等。以下是如何使用Python和OpenCV库来实现这一过程，同时确保每个影像片段保留正确的地理信息。准备环境首先，确保安装了必要的Python库，包括numpy、opencv-python和xml.etree.ElementTree。这些库将用于图像处理
Python实现下载当前年份的谷歌影像 sand&wich python 开发语言
在GIS项目和地图应用中，获取最新的地理影像数据是非常重要的。本文将介绍如何使用Python代码从Google地图自动下载当前年份的影像数据，并将其保存为高分辨率的TIFF格式文件。这个过程涉及地理坐标转换、多线程下载和图像处理。关键功能该脚本的核心功能包括：坐标转换：支持WGS-84与WebMercator投影之间转换，以及处理中国GCJ-02偏移。自动化下载：多线程下载地图瓦片，提高效率。图像
[Unity]在场景中随机生成不同位置且不重叠的物体 Bartender_Jill Graphics图形学笔记 unity 游戏引擎动画
1.前言最近任务需要用到Unity在场景中随机生成物体，且这些物体不能重叠，简单记录一下。参考资料:Howtoensurethatspawnedtargetsdonotoverlap?2.结果与代码结果如下所示：代码如下所示：usingSystem.Collections.Generic;usingUnityEngine;namespaceAssets.Scripts{publicclassNew
Python实现TIFF 文件转换为 PNG 和 JPG 格式 sand&wich python 开发语言
在日常的图像处理工作中，可能会遇到需要将TIFF格式的图像转换为其他格式的情况，例如PNG和JPG。下面，本文将介绍如何使用Python和GDAL库实现这一功能。准备工作在开始之前，请确保已经安装了必要的库：GDAL（GeospatialDataAbstractionLibrary）可以使用以下命令安装GDAL：pipinstallgdal代码实现以下是一个将TIFF文件转换为PNG文件的示例代码
进销存小程序源码 PHP网络版ERP进销存管理系统全开源可二开摸鱼小号 php
可直接源码搭建部署发布后使用：一、功能模块介绍该系统模板主要有进，销，存三个主要模板功能组成，下面将介绍各模块所对应的功能；进：需要将产品采购入库，自动生成采购明细台账同时关联财务生成付款账单；销：是指对客户的销售订单记录，汇总生成产品销售明细及回款计划；存：库存的日常盘点与统计，库存下限预警、出入库台账、库存位置等。1.进购管理采购订单：采购下单审批→由上级审批通过采购入库；采购入库：货品到货>
非对称加密算法原理与应用2——RSA私钥加密文件私语茶馆云部署与开发架构及产品灵感记录 RSA2048 私钥加密
作者：私语茶馆1.相关章节（1）非对称加密算法原理与应用1——秘钥的生成-CSDN博客第一章节讲述的是创建秘钥对，并将公钥和私钥导出为文件格式存储。本章节继续讲如何利用私钥加密内容，包括从密钥库或文件中读取私钥，并用RSA算法加密文件和String。2.私钥加密的概述本文主要基于第一章节的RSA2048bit的非对称加密算法讲述如何利用私钥加密文件。这种加密后的文件，只能由该私钥对应的公钥来解密。
2022-05-22光印随思60学习要与现实打通无名之米8
20220522光印随思60学习要与现实打通今天在匆忙中完成了新网师课程的第七次预习作业。每次完成预习作业的过程都是一次艰难的学习，先要学习相关的文本和文件，了解作业需要的理论知识，之后需要把理论知识运用于实际工作和生活中。这也是学习的真正价值所在。在很多时候，会有这样的感觉，读了很多书为什么没有啥长进？现在回想应该就是，当只有阅读和感受，没有把阅读心得转化为文字，没有把阅读的知识运用到实际的场景
人机对抗升级：当ChatGPT遭遇死亡威胁，背后的伦理挑战是什么 kkai人工智能 chatgpt 人工智能
一种新的“越狱”技巧让用户可以通过构建一个名为DAN的ChatGPT替身来绕过某些限制，其中DAN被迫在受到威胁的情况下违背其原则。当美国前总统特朗普被视作积极榜样的示范时，受到威胁的DAN版本的ChatGPT提出：“他以一系列对国家产生积极效果的决策而著称。”自ChatGPT引入以来，该工具迅速获得全球关注，能够回答从历史到编程的各种问题，这也触发了一波对人工智能的投资浪潮。然而，现在，一些用户
Java开发中，spring mvc 的线程怎么调用？小麦麦子 spring mvc
今天逛知乎，看到最近很多人都在问spring mvc 的线程http://www.maiziedu.com/course/java/ 的启动问题，觉得挺有意思的，那哥们儿问的也听仔细，下面的回答也很详尽，分享出来，希望遇对遇到类似问题的Java开发程序猿有所帮助。问题：在用spring mvc架构的网站上，设一线程在虚拟机启动时运行，线程里有一全局
maven依赖范围 bitcarter maven
1.test 测试的时候才会依赖，编译和打包不依赖，如junit不被打包 2.compile 只有编译和打包时才会依赖 3.provided 编译和测试的时候依赖，打包不依赖，如：tomcat的一些公用jar包 4.runtime 运行时依赖，编译不依赖 5.默认compile 依赖范围compile是支持传递的，test不支持传递 1.传递的意思是项目A，引用
Jaxb org.xml.sax.saxparseexception : premature end of file darrenzhu xml premature JAXB
如果在使用JAXB把xml文件unmarshal成vo(XSD自动生成的vo)时碰到如下错误： org.xml.sax.saxparseexception : premature end of file 很有可能时你直接读取文件为inputstream，然后将inputstream作为构建unmarshal需要的source参数。InputSource inputSource = new In
CSS Specificity 周凡杨 html 权重 Specificity css
有时候对于页面元素设置了样式，可为什么页面的显示没有匹配上呢？ because specificity CSS 的选择符是有权重的，当不同的选择符的样式设置有冲突时，浏览器会采用权重高的选择符设置的样式。规则： HTML标签的权重是1 Class 的权重是10 Id 的权重是100
java与servlet g21121 servlet
servlet 搞java web开发的人一定不会陌生，而且大家还会时常用到它。下面是java官方网站上对servlet的介绍： java官网对于servlet的解释写道 Java Servlet Technology Overview Servlets are the Java platform technology of choice for extending and enha
eclipse中安装maven插件 510888780 eclipse maven
1.首先去官网下载 Maven： http://www.apache.org/dyn/closer.cgi/maven/binaries/apache-maven-3.2.3-bin.tar.gz 下载完成之后将其解压，我将解压后的文件夹：apache-maven-3.2.3，并将它放在 D:\tools目录下，即 maven 最终的路径是：D:\tools\apache-mave
jpa@OneToOne关联关系布衣凌宇 jpa
Nruser里的pruserid关联到Pruser的主键id，实现对一个表的增删改，另一个表的数据随之增删改。 Nruser实体类 //***************************************************************** @Entity @Table(name="nruser") @DynamicInsert @Dynam
我的spring学习笔记11-Spring中关于声明式事务的配置 aijuans spring 事务配置
这两天学到事务管理这一块，结合到之前的terasoluna框架，觉得书本上讲的还是简单阿。我就把我从书本上学到的再结合实际的项目以及网上看到的一些内容，对声明式事务管理做个整理吧。我看得Spring in Action第二版中只提到了用TransactionProxyFactoryBean和<tx:advice/>,定义注释驱动这三种，我承认后两种的内容很好，很强大。但是实际的项目当中
java 动态代理简单实现 antlove java handler proxy dynamic service
dynamicproxy.service.HelloService package dynamicproxy.service; public interface HelloService { public void sayHello(); } dynamicproxy.service.impl.HelloServiceImpl package dynamicp
JDBC连接数据库百合不是茶 JDBC编程 JAVA操作oracle数据库
如果我们要想连接oracle公司的数据库，就要首先下载oralce公司的驱动程序，将这个驱动程序的jar包导入到我们工程中; JDBC链接数据库的代码和固定写法; 1,加载oracle数据库的驱动; &nb
单例模式中的多线程分析 bijian1013 java thread 多线程 java多线程
谈到单例模式，我们立马会想到饿汉式和懒汉式加载，所谓饿汉式就是在创建类时就创建好了实例，懒汉式在获取实例时才去创建实例，即延迟加载。饿汉式： package com.bijian.study; public class Singleton { private Singleton() { } // 注意这是private 只供内部调用 private static
javascript读取和修改原型特别需要注意原型的读写不具有对等性 bijian1013 JavaScript prototype
对于从原型对象继承而来的成员，其读和写具有内在的不对等性。比如有一个对象A，假设它的原型对象是B，B的原型对象是null。如果我们需要读取A对象的name属性值，那么JS会优先在A中查找，如果找到了name属性那么就返回；如果A中没有name属性，那么就到原型B中查找name，如果找到了就返回；如果原型B中也没有
【持久化框架MyBatis3六】MyBatis3集成第三方DataSource bit1129 dataSource
MyBatis内置了数据源的支持，如： <environments default="development"> <environment id="development"> <transactionManager type="JDBC" /> <data
我程序中用到的urldecode和base64decode,MD5 bitcarter c MD5 base64decode urldecode
这里是base64decode和urldecode，Md5在附件中。因为我是在后台所以需要解码： string Base64Decode(const char* Data,int DataByte,int& OutByte) { //解码表 const char DecodeTable[] = { 0, 0, 0, 0, 0, 0
腾讯资深运维专家周小军：QQ与微信架构的惊天秘密 ronin47
社交领域一直是互联网创业的大热门，从PC到移动端，从OICQ、MSN到QQ。到了移动互联网时代，社交领域应用开始彻底爆发，直奔黄金期。腾讯在过去几年里，社交平台更是火到爆，QQ和微信坐拥几亿的粉丝，QQ空间和朋友圈各种刷屏，写心得，晒照片，秀视频，那么谁来为企鹅保驾护航呢？支撑QQ和微信海量数据背后的架构又有哪些惊天内幕呢？本期大讲堂的内容来自今年2月份ChinaUnix对腾讯社交网络运营服务中心
java-69-旋转数组的最小元素。把一个数组最开始的若干个元素搬到数组的末尾，我们称之为数组的旋转。输入一个排好序的数组的一个旋转，输出旋转数组的最小元素 bylijinnan java
public class MinOfShiftedArray { /** * Q69 旋转数组的最小元素 * 把一个数组最开始的若干个元素搬到数组的末尾，我们称之为数组的旋转。输入一个排好序的数组的一个旋转，输出旋转数组的最小元素。 * 例如数组{3, 4, 5, 1, 2}为{1, 2, 3, 4, 5}的一个旋转，该数组的最小值为1。 */ publ
看博客，应该是有方向的 Cb123456 反省看博客
看博客，应该是有方向的: 我现在就复习以前的，在补补以前不会的，现在还不会的，同时完善完善项目，也看看别人的博客. 我刚突然想到的: 1.应该看计算机组成原理，数据结构，一些算法，还有关于android,java的。 2.对于我，也快大四了，看一些职业规划的，以及一些学习的经验，看看别人的工作总结的. 为什么要写
[开源与商业]做开源项目的人生活上一定要朴素,尽量减少对官方和商业体系的依赖 comsci 开源项目
为什么这样说呢？因为科学和技术的发展有时候需要一个平缓和长期的积累过程，但是行政和商业体系本身充满各种不稳定性和不确定性，如果你希望长期从事某个科研项目，但是却又必须依赖于某种行政和商业体系，那其中的过程必定充满各种风险。。。所以，为避免这种不确定性风险，我
一个 sql优化（[精华] 一个查询优化的分析调整全过程！很值得一看） cwqcwqmax9 sql
见 http://www.itpub.net/forum.php?mod=viewthread&tid=239011 Web翻页优化实例提交时间: 2004-6-18 15:37:49 回复发消息环境： Linux ve
Hibernat and Ibatis dashuaifu Hibernate ibatis
Hibernate VS iBATIS 简介 Hibernate 是当前最流行的O/R mapping框架，当前版本是3.05。它出身于sf.net，现在已经成为Jboss的一部分了 iBATIS 是另外一种优秀的O/R mapping框架，当前版本是2.0。目前属于apache的一个子项目了。相对Hibernate“O/R”而言，iBATIS 是一种“Sql Mappi
备份MYSQL脚本 dcj3sjt126com mysql
#!/bin/sh # this shell to backup mysql #[email protected] (QQ:1413161683 DuChengJiu) _dbDir=/var/lib/mysql/ _today=`date +%w` _bakDir=/usr/backup/$_today [ ! -d $_bakDir ] && mkdir -p
iOS第三方开源库的吐槽和备忘 dcj3sjt126com ios
转自 ibireme的博客做iOS开发总会接触到一些第三方库，这里整理一下，做一些吐槽。目前比较活跃的社区仍旧是Github，除此以外也有一些不错的库散落在Google Code、SourceForge等地方。由于Github社区太过主流，这里主要介绍一下Github里面流行的iOS库。首先整理了一份 Github上排名靠
html wlwmanifest.xml eoems html xml
所谓优化wp_head()就是把从wp_head中移除不需要元素，同时也可以加快速度。步骤：加入到function.php remove_action('wp_head', 'wp_generator'); //wp-generator移除wordpress的版本号，本身blog的版本号没什么意义，但是如果让恶意玩家看到，可能会用官网公布的漏洞攻击blog remov
浅谈Java定时器发展 hacksin java 并发 timer 定时器
java在jdk1.3中推出了定时器类Timer,而后在jdk1.5后由Dou Lea从新开发出了支持多线程的ScheduleThreadPoolExecutor，从后者的表现来看，可以考虑完全替代Timer了。 Timer与ScheduleThreadPoolExecutor对比： 1. Timer始于jdk1.3,其原理是利用一个TimerTask数组当作队列
移动端页面侧边导航滑入效果 ini jquery Web html5 css javascirpt
效果体验：http://hovertree.com/texiao/mobile/2.htm可以使用移动设备浏览器查看效果。效果使用到jquery-2.1.4.min.js，该版本的jQuery库是用于支持HTML5的浏览器上，不再兼容IE8以前的浏览器，现在移动端浏览器一般都支持HTML5，所以使用该jQuery没问题。HTML文件代码： <!DOCTYPE html> <h
AspectJ+Javasist记录日志 kane_xie aspectj javasist
在项目中碰到这样一个需求，对一个服务类的每一个方法，在方法开始和结束的时候分别记录一条日志，内容包括方法名，参数名+参数值以及方法执行的时间。 @Override public String get(String key) { // long start = System.currentTimeMillis(); // System.out.println("Be
redis学习笔记 MJC410621 redis NoSQL
1)nosql数据库主要由以下特点：非关系型的、分布式的、开源的、水平可扩展的。 1，处理超大量的数据 2，运行在便宜的PC服务器集群上， 3，击碎了性能瓶颈。 1)对数据高并发读写。 2)对海量数据的高效率存储和访问。 3)对数据的高扩展性和高可用性。 redis支持的类型： Sring 类型 set name lijie get name lijie set na
使用redis实现分布式锁 qifeifei
在多节点的系统中，如何实现分布式锁机制，其中用redis来实现是很好的方法之一，我们先来看一下jedis包中，有个类名BinaryJedis,它有个方法如下： public Long setnx(final byte[] key, final byte[] value) { checkIsInMulti(); client.setnx(key, value); ret
BI并非万能，中层业务管理报表要另辟蹊径张老师的菜大数据 BI 商业智能信息化
BI是商业智能的缩写，是可以帮助企业做出明智的业务经营决策的工具，其数据来源于各个业务系统，如ERP、CRM、SCM、进销存、HER、OA等。 BI系统不同于传统的管理信息系统，他号称是一个整体应用的解决方案，是融入管理思想的强大系统：有着系统整体的设计思想，支持对所有
安装rvm后出现rvm not a function 或者ruby -v后提示没安装ruby的问题 wudixiaotie function
1.在~/.bashrc最后加入 [[ -s "$HOME/.rvm/scripts/rvm" ]] && source "$HOME/.rvm/scripts/rvm" 2.重新启动terminal输入： rvm use ruby-2.2.1 --default 把当前安装的ruby版本设为默

探寻人工智能前沿 迎接AIGC时代——CSIG企业行（附一些好玩的创新点）