深度人工智能

大模型的背景与现状问题

一、大模型的发展背景

谈起大模型，第一时间想到的是什么？是主流的ChatGPT？或者GPT4？还是DALL-E3？亦或者Midjourney？以及Stablediffusion？还是层出不穷的其他各类AI Agent应用工具？大模型在2023年突然遍地开花，井喷式发展，尤其是后半年，几乎大部分科技公司、学术团体、研究机构、以及学生团队都在发布各自的大模型，感觉大模型突然从洛阳纸贵到了唾手可得。

大模型能在短时间内层出不穷的原因不仅是因为国外开源的LLaMa2、Falcon等，以及国内开源的ChatGLM、Baichuan2等给大家在模型的开发应用上带来了借鉴和方便，更重要的是大模型的发展条件已经完全成熟。

如果时间提前5-10年，全世界范围内能够做大模型的公司和团体，一只手完全可以数的过来，不说模型本身的开发难度，首先算力资源就是限制大模型发展的首要因素，想一想5年轻的算力能力还处于一个什么样的状态就清楚了，现在训练大模型的算力设备都是近3年才发布的，其次还有数据资源的问题，近5年全球的数据增长量，几乎每年翻一倍。因此，大模型的发展并不是一蹴而就的，它是在大算力、大数据发展的加持之下才出现的，大模型时代的发展离不开大算力、大数据的支持。

Ø大算力

大算力是指大型的计算能力，它可以用来处理海量的数据和信息，实现多种复杂的计算任务，如人工智能、科学模拟、数字孪生等。大算力是数字经济时代的新生产力，对推动科技进步、行业数字化转型以及经济社会发展发挥重要作用。

大算力的常用计量单位是每秒执行的浮点运算次数，即FLOPS。比如，阿里云在河北张北智算中心提供了一个算力有12 EFLOPS，即每秒执行1200亿亿次浮点运算，相当于462万台最新款M1的苹果电脑产生的算力。

按照《中国算力白皮书（2022年）》的定义，算力主要分为四部分：通用算力、智能算力、超算算力、边缘算力。通用算力以CPU芯片输出的计算能力为主；智能算力以GPU、FPGA、AI芯片等输出的人工智能计算能力为主；超算算力以超级计算机输出的计算能力为主；边缘算力主要是以就近为用户提供实时计算能力为主，是前三种的组合。

根据中国信息通信研究院的测算，2021年我国基础设施算力规模达到140 EFLOPS，位居全球第二；计算设备算力总规模达到202 EFLOPS，全球占比33%，增速达到50%，其中智能算力成为增长驱动力，增速达到85%。

我国已形成体系较完整、规模体量庞大、创新活跃的计算产业，涌现一批先进计算技术创新成果，计算芯片、计算系统、计算软件等环节持续取得突破，新兴计算平台和系统加速创新，前沿计算技术多点突破。

我国消费和行业应用算力需求增长迅猛，互联网依然是最大的算力需求行业，制造业、金融、医疗等领域

也有较大提升潜力。我国以计算机为代表的算力产业规模达到2.6万亿元，直接和间接分别带动经济总产出2.2万亿和8.2万亿元。

Ø大数据

大数据是指规模巨大、类型多样、速度快、价值密度低的数据集合，它超出了传统数据处理软件的能力范围，需要新的技术和方法来进行分析和利用。大数据具有以下特征：

大量（Volume）：大数据的数据量非常庞大，通常以TB（太字节）、PB（拍字节）或EB（艾字节）为单位来衡量。例如，据统计，2020年全球互联网用户产生的数据量达到59ZB（泽字节），相当于每天产生160亿GB的数据。

高速（Velocity）：大数据的数据流动速度非常快，需要实时或近实时地进行收集、处理和分析。例如，每天有数十亿条微博、微信等社交媒体信息在网络上流动，每秒钟有数百万次的搜索请求在搜索引擎上发生，每分钟有数千小时的视频在视频平台上上传。

多样（Variety）：大数据的数据类型非常多样，包括结构化的数据（如数字、文本等）、半结构化的数据（如XML、JSON等）和非结构化的数据（如图像、音频、视频等）。这些数据来自于不同的来源，如传感器、日志、社交媒体、网页、文档等。

价值（Value）：大数据的价值密度相对较低，也就是说，其中有用的信息只占一小部分，需要通过有效的分析方法才能挖掘出来。例如，一张照片中可能只有人脸或物体的部分信息是有价值的，而其他的背景或噪声则是无用的。

真实（Veracity）：大数据的真实性和可靠性也是一个重要的问题，因为大数据中可能存在不准确、不完整、或重复数据，这会影响数据质量和分析结果。因此，需要对大数据进行清洗、整合等操作来提高真实性。

Ø大模型

大模型是指具有大量参数和计算资源的机器学习模型，通常在训练过程中需要大量的数据和计算能力，并且具有数百万到数十亿个参数。大模型的设计目的是为了提高模型的表示能力和性能，在处理复杂任务时能够更好地捕捉数据中的模式和规律。

大模型的发展源于自然语言处理领域，以谷歌的BERT、OpenAI的GPT和百度文心大模型为代表，参数规模逐步提升至千亿、万亿，同时用于训练的数据量级也显著提升，带来了模型能力的提高。

大模型通常采用预训练+微调的方式，即先在海量无标注的数据上进行自监督学习，然后根据具体的下游任务进行少量数据的微调，以实现更优的识别、理解、决策、生成等效果。

大模型在推进产业智能化升级中已表现出巨大潜力，可以应用于搜索、推荐、智能交互、AIGC、生产流程变革、产业提效等场景。大模型也面临着一些挑战和风险，如算力成本高昂、数据质量和安全问题、模型可解释性和可信度问题等。

大模型的参数数量非常庞大，这使得它们能够更好地捕获数据中的复杂关系和模式。这对于在各种任务上实现出色的性能非常有帮助。

大模型通常有更深的神经网络结构，包括多个层和子网络，这有助于模型对数据进行多层次的特征提取和抽象。

大模型通常会通过在大规模数据上进行预训练来获得广泛的知识，然后可以在特定任务上进行微调，以实现更好的性能。这种预训练-微调策略在自然语言处理领域非常成功。

由于大模型的规模和复杂性，它们需要大量的计算资源进行训练和推断。通常需要使用高性能的计算单元，如GPU（图形处理单元）或TPU（张量处理单元）来支持大模型的运算。

算力、数据、算法模型三者共同构建了大模型应用的发展生态，三者的关系也是相互依存、缺一不可的。算力的充足与否直接影响到大模型的训练速度和模型的规模，更强大的算力可以支持更大的模型、更长的训练时间，以及更高的训练精度；数据的多样性、质量和规模对大模型的性能和泛化能力有重大影响，丰富的数据可以帮助模型更好地理解不同情境和问题，提高模型的性能；算法模型的改进可以减少对算力和数据的需求，使模型更高效地训练，或者在有限的数据条件下取得更好的性能。

Ø大模型的主要能力和问题

和众所周知的AlphaGo不同，以ChatGPT为代表的大模型之所以能够被大众所熟知和使用，不仅仅是感叹于它的神奇之处，更多的是来自于对大模型带来的实际应用价值，而这种实际应用价值对于每一个普通人而言，都是有非常大的帮助。相比AlphaGo只对围棋领域的影响，而以ChatGPT、DALL-E为主的大模型则是对整个人类的表达和创作方式进行了革命。

大模型的应用如雨后春松般的出现，并能够被大众所接受，主要来自于它的各种能力。首先是他的迁移学习能力，大模型具有强大的知识和记忆能力，可以从海量的语料中学习到丰富的语义和知识表示，并在下游任务中进行迁移学习。如果从头训练一个大模型，它所花费的时间将是很漫长的，目前的大模型都是利用迁移学习的方式来提高训练效率的。

其次，大模型强大的表达能力使其对各类问题几乎拥有和人类一样的理解，大模型具有惊人的生成和理解能力，可以根据内部表示生成新的信息，如图像、声音、文本等，并能够理解言外之意、隐喻、幽默等复杂的语言现象。

另外大模型还具有人类独有的创造学习，大模型具有潜在的学习推理和规划能力，可以根据目标进行推理和决策，并通过反馈与环境交互，甚至能够塑造环境。它能够根据现有的数据信息推测未来，能够根据描述创作出符合条件的各类作品。

大模型的能力固然强悍，但是同时也要正视大模型目前存在的一系列问题，比如被常常诟病的幻觉问题，大模型往往缺乏常识和道德观念，可能会产生虚构、错误或有害的输出。大模型除了幻觉问题，还存在重复输出内容的问题，有时候大模型会出现缺乏创造性和想象力的内容，会重复输出相似的内容，或抄袭已有的内容。

在国外，大模型的输出内容最被不能接受的就是偏见问题，我们知道国外对人种歧视和性别歧视比较敏感，而大模型缺乏自我意识和情感表达，经常会出现一些歧视性的内容，会生成偏执的内容，让人们认为是缺乏人性和同理心的。

当然，随着大模型技术的发不断发展，无论是幻觉问题、重复输出问题，还是偏见歧视问题，都会慢慢有所改进的，未来我们使用到的AI Agent将会更加智能，更像一个真正的人类。

二、大模型的现状和未来

Ø大模型对企业的影响

目前大模型在企业之间的竞争已经逐渐趋向白热化，到了明年，企业之间的大模型应用竞争会更加激烈，尤其是大企业之间，各自都在争抢市场占有率，这和移动互联网时代的情况有些类似。

有一个共识就是大模型的应用会逐渐渗透到各行各业中，目前已经有很多行业和企业受到了大模型的直接影响，比如金融行业的信息评估预测、医疗行业的影像分析和药物研发、零售行业的销售分析和市场预测、制造业的生产数据分析和调度计划等。

互联网企业的用户敏感度最高，因此大模型对互联网企业的冲击会更大。尤其是大企业，如果没有自己的大模型生态，那么意味着将来可能会受制于人，或者发展受阻；而小企业没有太大的实力和大企业去竞争，更多的是依附各大企业的生态体系下，发展自己的业务。大模型的发展对各大互联网厂商来说，几乎已经是必选项，要么积极拥抱，要么等待出局。

Ø大模型的扶持政策

和企业间的竞争相比，国家和各地政府对大模型的发展更是倾注了大量补助和优惠政策。2023年4月28日，中央政治局会议强调“要重视通用人工智能发展，营造创新生态，重视防范风险”。当下，全国已有北京、深圳、成都、杭州、无锡、上海、重庆多城面向AI大模型时代推出了新政策或政策意见稿。

7月8日，在2023世界人工智能大会闭幕式上，《上海市推动人工智能大模型创新发展的若干措施》（下称《若干措施》）公布，并发布了“模”都倡议，成立上海人工智能开源生态产业集群，打造AI“模都”。上海将携手海内外各类英才全力推进卓越引领的“模”都上海建设，打造大模型企业人才集聚的创新高地，鼓励在沪开展大模型的研发和产业化，对重点项目及人才团队给予优先的政策支持，打造最具竞争力的创新环境，加大资金的支持力度，对新增的大模型、高水平的算力、智能算力建设和使用，给予分级分类的支持，进一步壮大人工智能产业基金的规模，引导和撬动市场资本。

8月2日，杭州计划为符合要求的通用大模型研发单位提供最高不超过5000万元的补助，且每年评选不超过10个性能先进并在杭成功落地的优秀专用模型，提供最高不超过500万元的补助金额。补助（奖励）资金由市和各区、县（市）按财政体制共同承担。

在8月27日举行的2023长三角算力发展大会上，苏州市发布《苏州市关于推进算力产业发展和应用的行动方案》，明确提出到2025年的智算算力目标，并公布对半导体和集成电路、EDA、大模型、软件和信息服务等算力企业的一系列资金支持和补助，最高奖励或补助高达1000万元。

8月29日，武汉“光谷软件十条”提出支持开源平台建设，最高补贴3000万元，鼓励进行重大开源项目的软件开发，孕育出原创性、爆炸性、轰动性的具有全球影响力的大模型。最新一轮武汉数字经济应用场景“揭榜挂帅”项目中，新设立“人工智能大模型典型应用场景”榜单，鼓励人工智能企业依托大模型技术开发应用。

北京为支持中关村科学城通用人工智能产业发展，鼓励大模型创新研发，制定2023年中关村科学城算力补贴专项申报指南。夯实算力基础支撑。对技术创新性强、应用生态丰富的大模型，给予相关创新主体不超过购买或租用算力合同金额的30%、最高1000万元资金补贴。对于重大项目，原则上可根据研发迭代情况，连续支持两年。对技术创新性强、性能好的通用大模型，分档给予1000万元、500万元、300万元资金补贴(不超过购买或租用算力合同金额30%)。对技术创新性强、应用生态丰富的垂直大模型，分档给予300万元、200万元、100万元资金补贴(不超过购买或租用算力合同金额30%)。

除了以上已经明确公布了奖励标准的城市，其他各大城市也都在陆续发布对大模型的支持政策。可见大模型的发展已经是各大城市政府的主要扶持的方向之一了，未来随着大模型的落地应用和产生的实际价值，政策上的倾斜可能还会更大。

从国家层面来说，大模型的发展既是科技和经济增长的长期规划，也是国际竞争的主要方向之一，大模型的应用不仅可以用于民生方向，同时也可以用于军事领域。而一个国家的发展，离不开科技的发展、经济的发展，以及军事力量的发展。

Ø大模型的发展方向

目前大模型的应用大部分都聚集于通用模型，通用模型的优势是一个模型能够解决多类问题，比如大众熟知的ChatGPT、文心一言等模型，就是一个通用模型，它既能够对话聊天、写文章，也能够解决一般的数学问题，还能够进行代码编程，几乎跟文本相关的各类问题，它都能够去做。

通用模型的弱点也来自于此，由于模型同时能够执行多种任务，那么它的参数就不会降下来，而且在数学、编程等各类专业问题的解答上并不如人意，这是多方面的因素造成的，一方面想要模型能够解决多类问题，那么所准备的训练数据就需要对应各类问题中的各种场景，这本身就不是一件容易的事，更何况就算准备了大量的数据，在进行人类反馈强化学习（RLHF）的时候，也需要各位问题的专家来鉴别模型的输出是否合理。

另一方面，模型要解决的问题类型越多，往往意味着模型的复杂度会提高，它的参数分布就越分散，方差也会变大，因为这些参数需要去拟合各类任务，可能会导致这些参数很难优秀的解答每一个问题，大部分情况就是各类问题都能拿到中位分数，很难拿到高分，想要解决这个问题，就需要更大参数的模型。

一般来说，在解决多模态任务的时候，模型的参数量越大，模型的复杂度就越高，这意味着模型有更强的拟合能力，可以捕捉到更复杂的特征和关系。因此，在数据量充足的情况下，大参数模型通常可以获得更好的性能。但是如果数据量不足，过大的模型参数量可能会导致过拟合。随着模型参数量的增加，训练和推理所需的计算资源也会相应增加。从而导致训练时间过长，或者对硬件设备有较高的要求。

理论上来说，可以通过增加模型的参数来提高模型的能力，但是在实际的应用上，这并不是唯一的选择，相反在很多时候，需要降低模型的参数让模型在各种设备上能够运行，不但能够提高模型的部署效率，还能节约很多算力资源。

大模型小型化是未来的发展趋势，比如微软发布的Phi1.5-1.3B模型，以及国内上海人工智能实验室发布的InternLM-20B模型，都在保证模型能力的前提下做参数瘦身，尽可能地降低模型的参数来适应各类实际应用场景，相信在未来，随着大模型的技术发展，大模型相对而言可能并不“大”，这和第一台计算机从房子大小变成现在的掌上工具一样，大模型也需要这样一个发展的过程，从而让大模型更加平民化。

就目前大模型的发展而言，通用大模型小型化带来的效果远没有专业大模型小型化带来的效果好，一般来说，同样参数的专用模型在各类指定任务的效果上肯定优于通用模型，未来专用模型在各领域的实际应用价值也要高于通用模型，这一点可以参考MathGPT解决数学问题的能力和CodeGPT解决编程问题的能力，这些专用大模型在各自的领域里，其能力是远超于通用大模型的，而且专用大模型的商业价值也要远高于通用大模型。

未来大模型的发展将从通用模型发展到专用模型，进一步还会发展到世界模型，构造自主 AI则需要预测世界模型，而世界模型必须能够执行多模态预测。可见大模型的发展既是企业持续，也是国运之争，更是全人类共同走向AGI之门的钥匙。

当语言模型”思考”时，它真的在推理吗？ qq_502428990 语言模型人工智能自然语言处理
最近，每当我看到ChatGPT一步步”推导”数学题，或是Claude条理分明地分析哲学问题时，总忍不住想起图灵测试那个古老的命题：我们是否又一次被表象迷惑了？这些看似严谨的推理过程，到底是一场精妙的模仿秀，还是真正智能的曙光？1.被误解的”思考者”走进任何科技论坛，你都能看到人们对GPT-4解题过程的惊叹：”看这一步一步的推导，它简直像人类一样在思考！”但作为一个长期观察语言模型的研究者，我不得不
大模型本地部署，拥有属于自己的ChatGpt 小妖同学学AI chatgpt
ChatGpt以其强大的信息整合和对话能力惊艳了全球，在自然语言处理上面表现出了惊人的能力。不管用于文案撰写还是程序辅助开发都大大提高了我们的工作效率，但是其使用有一定的门槛，让我们大多数人都望而却步，今天我们利用ollama实现本地大模型的步骤，让我们轻松拥有自己的人工智能。Ollama作为一个轻量级的工具，可以帮助用户在本地运行这些大型语言模型，无需持续依赖云服务，既保护了数据隐私，又能减少网
Spring AI 结合 MCP MySQL 实现对话式数据库查询没刮胡子软件开发技术实战专栏人工智能AI Spring 数据库 spring 人工智能 spring-ai mcp-server mysql
在现代应用开发中，将人工智能与数据库查询结合可以创造更自然、更智能的用户交互方式。下面我将详细介绍如何使用SpringAI框架结合MCP（可能指MySQL连接池或相关组件）实现对话中的数据库查询功能。什么是SpringAI和MCPMySQLSpringAI框架概述SpringAI是基于Spring生态的人工智能集成框架，它提供了：与大型语言模型(LLM)的集成能力对话管理和自然语言处理功能业务逻辑
【LangChain】langchain.chains.create_sql_query_chain() 函数：基于自然语言生成 SQL 查询的链（Chain）彬彬侠 LangChain langchain chains create_sql_quer sql_database sql
langchain.chains.create_sql_query_chain函数是LangChain库中的一个函数，用于创建基于自然语言生成SQL查询的链（Chain），结合语言模型（LLM）和数据库上下文生成可执行的SQL语句。本文基于LangChain0.3.x，详细介绍create_sql_query_chain的定义、参数、方法和典型场景，并提供一个独立示例，展示如何使用create_s
AIGC领域Prompt工程：原理、方法与行业应用 AI天才研究院 ChatGPT 计算 AI大模型应用入门实战与进阶 AIGC prompt ai
AIGC领域Prompt工程：原理、方法与行业应用关键词：Prompt工程、大语言模型（LLM）、提示设计、少样本学习、AIGC应用、思维链（CoT）、提示优化摘要：随着AIGC（人工智能生成内容）技术的爆发式发展，大语言模型（如GPT-4、LLaMA、通义千问）的性能已达到前所未有的高度。然而，模型的强大能力能否被充分释放，很大程度上依赖于"提示（Prompt）"的设计质量。本文系统解析Prom
大语言模型中的思维链提示：解锁高效互动的秘密 t0_54program 大数据与人工智能语言模型人工智能自然语言处理个人开发
在当今的人工智能领域，大语言模型（LLMs）已然成为一颗耀眼的明星，它经过海量训练，能够理解并生成人类语言，在编程等诸多领域助力人们完成日常任务。然而，若想与这些模型实现高效沟通，掌握正确的请求方式至关重要，而思维链提示（Chainofthoughtprompting）便是与LLMs互动时最为高效的技术之一。什么是提示（Prompting）？LLMs基于海量数据集进行训练，以理解并生成类人文本。其
大模型系列——Ollama WebUI 简明教程猫猫姐大模型大模型人工智能
大模型系列——OllamaWebUI简明教程OpenWebUI，以前称为OllamaWebUI，支持各种大型语言模型(LLM)运行器，是本地部署并与语言模型交互的多功能工具。OpenWebUI，以前称为OllamaWebUI，是一个可扩展、功能丰富且用户友好的自托管Web界面，旨在完全离线运行。它支持各种大型语言模型(LLM)运行器，使其成为部署和与语言模型交互的多功能工具。OpenWebUI提供
大模型的“Tomcat”：一文读懂AI推理引擎（Inference Engine) 人工智能
本文已收录在Github，关注我，紧跟本系列专栏文章，咱们下篇再续！魔都架构师|全网30W技术追随者大厂分布式系统/数据中台实战专家主导交易系统百万级流量调优&车联网平台架构AIGC应用开发先行者|区块链落地实践者以技术驱动创新，我们的征途是改变世界！实战干货：编程严选网1推理引擎是啥？从熟悉的“服务器”说起，想象你用Java写好了一个业务应用，如订单处理服务，打成一个JAR或WAR包。这包能直接
微调大语言模型(生成任务)，怎么评估它到底“变好”了？茫茫人海一粒沙语言模型人工智能自然语言处理
随着大语言模型（如GPT、LLaMA）的广泛应用，越来越多团队开始基于它们做微调，定制符合自己业务需求的模型。微调虽能让模型更贴合任务，但评估是否真的“变好”却不是简单的事。本文将系统介绍微调过程中和微调完成后，如何科学有效地评估模型效果，帮助你用对指标，做出准确判断。一、微调时的评估：关注训练过程中的模型表现1.验证集Loss（ValidationLoss）微调训练时，我们会准备一部分数据作为验
【AI大模型】26、算力受限下的模型工程：从LoRA到弹性智能系统的优化实践无心水 AI大模型人工智能搜索引擎 LoRA 大语言模型微调模型压缩知识蒸馏量化技术
引言：算力瓶颈与模型工程的突围之路在人工智能领域，大语言模型的发展正呈现出参数规模爆炸式增长的趋势。从GPT-3的1750亿参数到PaLM的5400亿参数，模型能力的提升往往伴随着对算力资源的极度渴求。然而，对于大多数企业和研究者而言，动辄数百GB的显存需求、数十万块GPU的训练集群显然是难以企及的"算力鸿沟"。当面对"无米之炊"的困境时，模型工程技术成为突破算力瓶颈的核心路径——通过算法创新而非
【AI】为Cursor配置MCP服务器自学也学好编程 AI MCP 人工智能 ai AI编程
title:【AI】为Cursor配置MCP服务器categories:AItags:CursorMCPAI编程开发工具AI一、Cursor与MCP服务简介Cursor是一款AI驱动的代码编辑器，通过集成大型语言模型（LLM）帮助开发者更高效地编写代码。而MCP（ModelContextProtocol）是由Anthropic推出的开放标准协议，它允许AI模型与外部工具、数据和系统无缝交互，极大扩
推动视觉AI边界，智象未来HiDream荣登全球技术先锋榜单雷焰财经人工智能 AIGC 计算机视觉
近日，世界经济论坛“全球技术先锋”荣誉榜单正式揭晓，智象未来HiDream凭借尖端技术成就入选。智象未来HiDream成立于2023年3月，是一家专注于多模态AIGC技术应用的公司，由加拿大工程院外籍院士IEEE/IAPR/CAAIFellow梅涛博士创立。回顾过往，众多知名企业，如Airbnb、Google、Twitter和Spotify等，都曾获得世界经济论坛的“全球技术先锋”称号。然而，今年
提示工程入门指南：如何有效地与大语言模型交互止观止大语言模型语言模型人工智能
本文深入拆解提示工程的核心概念、最佳实践和实用技巧。作为AI领域的热点技术，提示工程（PromptEngineering）能显著提升大语言模型（LargeLanguageModel,LLM）如DeepSeek的响应质量。文档结构概览引言：为什么需要提示工程？提示的定义与结构：上下文、指令、约束的完整解析提示工程原则：6项核心技巧有效vs无效提示对比：案例驱动的实操分析用户提示与系统提示：行为控制的
Midscene.js介绍和使用望华笙测试工具 ui 前端
Midscene.js介绍和使用由于课程任务的需要，本人去寻找了AI+软件测试的相关应用，发现了Midscene这一便利的UI自动化测试工具。本篇博客主要对Midscene作了介绍，也给出了本人在使用Midscene过程中遇到的问题及摸索到的解决方案。Midscene.js是一个开源的基于多模态大型语言模型的UI自动化测试工具，它是由字节的web-infra团队开发。它能够智能地“解析”用户界面并
Python开发AI智能体(三)———Langchain定义提示词模板【本人】 Agent智能体 python 人工智能 langchain 语言模型
前言上篇文章给大家介绍AI项目检测平台LangSmish以及开源框架Langchain的使用，并且带领大家编写了一个案例。这篇文章将介绍在Langchain框架中如何定义提示词模板一、什么是提示词模板？提示词模板（PromptTemplate）是大语言模型（LLM）应用开发中的核心概念，本质是预定义的提示结构框架。它通过将静态文本与动态变量结合，实现标准化、可复用的提示生成机制。它提示词可以是一个
使用LangChain构建智能应用：从入门到实战 afTFODguAKBF langchain python
引言在当今的人工智能时代，构建智能应用程序已经成为越来越多开发者的目标。LangChain是一个强大的工具，可以帮助我们快速开发基于大型语言模型（LLM）的应用。本篇文章将带你了解如何从零开始使用LangChain，构建一个简单的LLM应用程序，并逐步探索更复杂的功能。主要内容构建简单的LLM应用使用LangChain，我们可以快速构建一个简单的LLM应用程序。接下来，我将带你一步步实现。什么是L
论文阅读：2025 arxiv Qwen3 Technical Report
https://arxiv.org/pdf/2505.09388https://www.doubao.com/chat/9918384373236738文章目录论文翻译Qwen3技术报告摘要1引言论文翻译Qwen3技术报告Qwen团队摘要在这项工作中，我们介绍了Qwen模型家族的最新版本Qwen3。Qwen3包含一系列大型语言模型（LLM），旨在提升性能、效率和多语言能力。Qwen3系列包括密集型
干货！大模型时代一定要收藏的 20 个LLM 中文数据集 OpenBayes 资源上新人工智能语言模型数据库机器学习
自ChatGPT重磅推出以来，大语言模型(largelanguageModel,LLM)以其卓越的学习能力在各个领域引起轰动。大模型的训练和调优离不开优质庞大的数据支撑，精心构建的数据集不仅为大模型提供了充分的燃料，还为大模型在垂直领域的应用和性能提升提供了可能。本文整理了一些适用于大模型训练调优的热门中文公开数据集（按照首字母A-Z顺序排列），以供大家了解和使用。温馨提示：本文列举的所有数据集，
阿里云魔搭社区AIGC专区：中国AI创作的革命性平台 Liudef06小白阿里云 AIGC 人工智能
在生成式人工智能重塑全球数字创作版图的浪潮中，中国首个一站式AIGC开发平台——阿里云魔搭社区AIGC专区于2024年9月杭州云栖大会正式亮相。这一突破性进展不仅填补了国内全流程AI创作工具的空白，更以157款多模态开源模型和全免费GPU算力的开放姿态，为超过690万开发者提供了从模型调用到应用落地的完整生态支持。一、魔搭社区：中国AI模型生态的奠基者魔搭社区（ModelScope）作为阿里云在2
探秘阿里云Tair KVCache：大模型推理的加速引擎云资源服务商阿里云云计算人工智能
一、引言近年来，人工智能领域发展迅猛，大语言模型（LLM）不断取得突破，其应用场景也日益广泛。从智能客服到内容生成，从智能写作到智能翻译，大语言模型正在深刻地改变着我们的生活和工作方式。随着模型规模的不断扩大和推理需求的日益增长，大模型推理过程中的显存瓶颈问题逐渐凸显，成为制约其发展和应用的关键因素。在大模型推理中，KVCache技术作为一种优化手段，通过缓存历史Token的Key/Value向量
【重构推荐系统】国产大模型驱动的电商个性化推荐完整实战：架构设计、推理优化与在线部署闭环观熵国产大模型部署实战全流程指南重构人工智能 Agent 智能体落地方案
个人简介作者简介：全栈研发，具备端到端系统落地能力，专注大模型的压缩部署、多模态理解与Agent架构设计。热爱“结构”与“秩序”，相信复杂系统背后总有简洁可控的可能。我叫观熵。不是在控熵，就是在观测熵的流动个人主页：观熵个人邮箱：[email protected]座右铭：愿科技之光，不止照亮智能，也照亮人心！专栏导航观熵系列专栏导航：AI前沿探索：从大模型进化、多模态交互、AIGC内容生成，到
Prompt Engineering for Large Language Models 三月七꧁ ꧂ 论文合集llm+prompt prompt 语言模型人工智能自然语言处理 pdf javascript 前端
题目大型语言模型的快速工程简介随着OpenAI的ChatGPT和Google的Bard等软件的普及，大语言模型（LLM）已经渗透到生活和工作的许多方面。例如，ChatGPT可用于提供定制食谱，建议替换缺失的成分。它可用于起草研究提案、用多种编程语言编写工作代码、在语言之间翻译文本、协助政策制定等等（Gao2023）。用户通过“提示”或自然语言指令与大型语言模型进行交互。精心设计的提示可以带
潜入思维的海洋：SoftCoT++如何让语言模型更聪明步子哥智能涌现语言模型人工智能自然语言处理
在人工智能的浩瀚星空下，大型语言模型（LLMs）如同一颗颗璀璨的恒星，照亮了从文本生成到复杂推理的广阔领域。然而，这些模型在推理任务中往往像是在迷雾中航行——尽管它们能抵达目的地，却常常因为固定的思维路径而错过更优的航线。2025年5月，一篇题为《SoftCoT++:Test-TimeScalingwithSoftChain-of-ThoughtReasoning》的论文如同一盏明灯，照亮了如何让
企业级AI开发利器：Spring AI框架深度解析与实战_spring ai实战 AI大模型-海文人工智能 spring python 算法开发语言 java 机器学习
企业级AI开发利器：SpringAI框架深度解析与实战一、前言：Java生态的AI新纪元在人工智能技术爆发式发展的今天，Java开发者面临着一个新的挑战：如何将大语言模型（LLMs）和生成式AI（GenAI）无缝融入企业级应用。传统的Java生态缺乏统一的AI集成方案，开发者往往需要为不同AI供应商（如OpenAI、阿里云、HuggingFace）编写大量重复的接口适配代码，这不仅增加了开发成本，
PyTorch教程：LSTM语言模型的动态量化技术解析怀灏其Prudent
PyTorch教程：LSTM语言模型的动态量化技术解析tutorialsPyTorchtutorials.项目地址:https://gitcode.com/gh_mirrors/tuto/tutorials前言在深度学习模型部署过程中，模型大小和推理速度是两个至关重要的考量因素。PyTorch提供的动态量化技术能够在不显著影响模型准确率的前提下，有效减小模型体积并提升推理速度。本文将深入解析如何对
大语言模型(LLM)量化基础知识(一) -派神- RAG NLP ChatGPT 语言模型人工智能自然语言处理
承接各类AI相关应用开发项目(包括但不限于大模型微调、RAG、AI智能体、NLP、机器学习算法、运筹优化算法、数据分析EDA等)!!!有意愿请私信!!!随着大型语言模型(LLM)的参数数量的增长,与其支持硬件（加速器内存）增长速度之间的差距越来越大，如下图所示：上图显示，从2017年到2022年，语言模型的大小显著增加：2017年：Transformer模型（0.05B参数）2018年：GPT（0
大模型读过的书，终将成为人类的新血肉：一场知识炼金术的深度剖析黑巧克力可减脂 AIGC AIGC 人工智能
“吾生也有涯，而知也无涯。以有涯随无涯，殆已！”庄子千年前的慨叹，在信息爆炸的今天更显沉重。人类个体穷尽一生，所能阅读、理解、吸收的书籍不过沧海一粟。然而，一种前所未有的“数字读者”正在悄然改变这一困境——大语言模型以其近乎贪婪的“阅读”能力，正对浩如烟海的书籍进行前所未有的批量处理与深度总结。这并非冰冷的机械扫描，而是一场静默却影响深远的知识炼金术。巨量“吞噬”：大模型如何“阅读”万卷书？数据洪
配置不当的MCP服务器使AI代理系统面临入侵风险 FreeBuf- 服务器人工智能运维
风险概述：默认配置暴露命令执行漏洞数百台用于连接大语言模型（LLM）与第三方服务、数据源及工具的模型上下文协议（ModelContextProtocol，MCP）服务器存在默认配置缺陷，可能导致用户面临未授权的操作系统命令执行等风险。随着代理型AI（AgenticAI）的兴起，MCP服务器正迅速成为增强AI模型推理上下文的关键工具。但安全研究人员警告，大量公开共享的MCP服务器存在不安全配置，攻击
从实验到生产：DeepSeek大模型工程化部署的关键步骤与风险控制一ge科研小菜菜人工智能人工智能
个人主页：一ge科研小菜鸡-CSDN博客期待您的关注一、引言：大模型部署迈入“工程化时代”随着DeepSeek等开源大语言模型（LLM）的发展，大模型不再是AI实验室的专属工具，越来越多的企业正尝试将其纳入业务生产系统，应用于客服问答、合同审查、数据分析、自动写作等场景。但模型的能力≠可用的系统。从模型下载到模型上线，中间隔着“部署的鸿沟”：资源配置、服务稳定性、响应效率、安全控制、上线合规……一
【人工智能】微调的秘密武器：释放大模型的无限潜能蒙娜丽宁 Python杂谈人工智能人工智能
《PythonOpenCV从菜鸟到高手》带你进入图像处理与计算机视觉的大门！解锁Python编程的无限可能：《奇妙的Python》带你漫游代码世界在人工智能迅猛发展的今天，大规模语言模型（LLMs）以其强大的通用能力席卷各行各业。然而，如何让这些通用模型在特定领域或任务中发挥最大潜力？答案是微调（Fine-tuning）。本文深入探讨微调的理论基础、技术细节与实践方法，揭示其作为解锁大模型隐藏潜力
jQuery 跨域访问的三种方式 No 'Access-Control-Allow-Origin' header is present on the reque qiaolevip 每天进步一点点学习永无止境跨域众观千象
XMLHttpRequest cannot load http://v.xxx.com. No 'Access-Control-Allow-Origin' header is present on the requested resource. Origin 'http://localhost:63342' is therefore not allowed access. test.html:1
mysql 分区查询优化 annan211 java 分区优化 mysql
分区查询优化引入分区可以给查询带来一定的优势，但同时也会引入一些bug. 分区最大的优点就是优化器可以根据分区函数来过滤掉一些分区，通过分区过滤可以让查询扫描更少的数据。所以，对于访问分区表来说，很重要的一点是要在where 条件中带入分区，让优化器过滤掉无需访问的分区。可以通过查看explain执行计划，是否携带 partitions
MYSQL存储过程中使用游标 chicony Mysql存储过程
DELIMITER $$ DROP PROCEDURE IF EXISTS getUserInfo $$ CREATE PROCEDURE getUserInfo(in date_day datetime)-- -- 实例-- 存储过程名为：getUserInfo-- 参数为：date_day日期格式:2008-03-08-- BEGINdecla
mysql 和 sqlite 区别 Array_06 sqlite
转载： http://www.cnblogs.com/ygm900/p/3460663.html mysql 和 sqlite 区别 SQLITE是单机数据库。功能简约，小型化，追求最大磁盘效率 MYSQL是完善的服务器数据库。功能全面，综合化，追求最大并发效率 MYSQL、Sybase、Oracle等这些都是试用于服务器数据量大功能多需要安装，例如网站访问量比较大的。而sq
pinyin4j使用 oloz pinyin4j
首先需要pinyin4j的jar包支持；jar包已上传至附件内方法一:把汉字转换为拼音；例如：编程转换后则为biancheng /** * 将汉字转换为全拼 * @param src 你的需要转换的汉字 * @param isUPPERCASE 是否转换为大写的拼音； true:转换为大写；fal
微博发送私信随意而生微博
在前面文章中说了如和获取登陆时候所需要的cookie，现在只要拿到最后登陆所需要的cookie，然后抓包分析一下微博私信发送界面 http://weibo.com/message/history?uid=****&name=**** 可以发现其发送提交的Post请求和其中的数据，让后用程序模拟发送POST请求中的数据，带着cookie发送到私信的接入口，就可以实现发私信的功能了。
jsp 香水浓 jsp
JSP初始化容器载入JSP文件后，它会在为请求提供任何服务前调用jspInit()方法。如果您需要执行自定义的JSP初始化任务，复写jspInit()方法就行了 JSP执行这一阶段描述了JSP生命周期中一切与请求相关的交互行为，直到被销毁。当JSP网页完成初始化后
在 Windows 上安装 SVN Subversion 服务端 AdyZhang SVN
在 Windows 上安装 SVN Subversion 服务端2009-09-16高宏伟哈尔滨市道里区通达街291号最佳阅读效果请访问原地址：http://blog.donews.com/dukejoe/archive/2009/09/16/1560917.aspx 现在的Subversion已经足够稳定，而且已经进入了它的黄金时段。我们看到大量的项目都在使
android开发中如何使用 alertDialog从listView中删除数据？ aijuans android
我现在使用listView展示了很多的配置信息，我现在想在点击其中一条的时候填出 alertDialog,点击确认后就删除该条数据，（ ArrayAdapter ，ArrayList，listView 全部删除），我知道在下面的onItemLongClick 方法中参数 arg2 是选中的序号，但是我不知道如何继续处理下去 1 2 3
jdk-6u26-linux-x64.bin 安装 baalwolf linux
1.上传安装文件(jdk-6u26-linux-x64.bin) 2.修改权限 [root@localhost ~]# ls -l /usr/local/jdk-6u26-linux-x64.bin 3.执行安装文件 [root@localhost ~]# cd /usr/local [root@localhost local]# ./jdk-6u26-linux-x64.bin&nbs
MongoDB经典面试题集锦 BigBird2012 mongodb
1.什么是NoSQL数据库？NoSQL和RDBMS有什么区别？在哪些情况下使用和不使用NoSQL数据库？ NoSQL是非关系型数据库，NoSQL = Not Only SQL。关系型数据库采用的结构化的数据，NoSQL采用的是键值对的方式存储数据。在处理非结构化/半结构化的大数据时；在水平方向上进行扩展时；随时应对动态增加的数据项时可以优先考虑使用NoSQL数据库。在考虑数据库的成熟
JavaScript异步编程Promise模式的6个特性 bijian1013 JavaScript Promise
Promise是一个非常有价值的构造器，能够帮助你避免使用镶套匿名方法，而使用更具有可读性的方式组装异步代码。这里我们将介绍6个最简单的特性。在我们开始正式介绍之前，我们想看看Javascript Promise的样子： var p = new Promise(function(r
[Zookeeper学习笔记之八]Zookeeper源代码分析之Zookeeper.ZKWatchManager bit1129 zookeeper
ClientWatchManager接口 //接口的唯一方法materialize用于确定那些Watcher需要被通知 //确定Watcher需要三方面的因素1.事件状态 2.事件类型 3.znode的path public interface ClientWatchManager { /** * Return a set of watchers that should
【Scala十五】Scala核心九：隐式转换之二 bit1129 scala
隐式转换存在的必要性，在Java Swing中，按钮点击事件的处理，转换为Scala的的写法如下： val button = new JButton button.addActionListener( new ActionListener { def actionPerformed(event: ActionEvent) {
Android JSON数据的解析与封装小Demo ronin47
转自：http://www.open-open.com/lib/view/open1420529336406.html package com.example.jsondemo; import org.json.JSONArray; import org.json.JSONException; import org.json.JSONObject; impor
[设计]字体创意设计方法谈 brotherlamp UI ui自学 ui视频 ui教程 ui资料
从古至今，文字在我们的生活中是必不可少的事物，我们不能想象没有文字的世界将会是怎样。在平面设计中，UI设计师在文字上所花的心思和功夫最多，因为文字能直观地表达UI设计师所的意念。在文字上的创造设计，直接反映出平面作品的主题。如设计一幅戴尔笔记本电脑的广告海报，假设海报上没有出现“戴尔”两个文字，即使放上所有戴尔笔记本电脑的图片都不能让人们得知这些电脑是什么品牌。只要写上“戴尔笔
单调队列-用一个长度为k的窗在整数数列上移动，求窗里面所包含的数的最大值 bylijinnan java 算法面试题
import java.util.LinkedList; /* 单调队列滑动窗口单调队列是这样的一个队列：队列里面的元素是有序的，是递增或者递减题目：给定一个长度为N的整数数列a(i),i=0,1,...,N-1和窗长度k. 要求：f(i) = max{a(i-k+1),a(i-k+2),..., a(i)},i = 0,1,...,N-1 问题的另一种描述就
struts2处理一个form多个submit chiangfai struts2
web应用中，为完成不同工作，一个jsp的form标签可能有多个submit。如下代码： <s:form action="submit" method="post" namespace="/my"> <s:textfield name="msg" label="叙述：">
shell查找上个月，陷阱及野路子 chenchao051 shell
date -d "-1 month" +%F 以上这段代码，假如在2012/10/31执行，结果并不会出现你预计的9月份，而是会出现八月份，原因是10月份有31天，9月份30天，所以-1 month在10月份看来要减去31天，所以直接到了8月31日这天，这不靠谱。野路子解决：假设当天日期大于15号
mysql导出数据中文乱码问题 daizj mysql 中文乱码导数据
解决mysql导入导出数据乱码问题方法：１、进入mysql，通过如下命令查看数据库编码方式： mysql> show variables like 'character_set_%'; +--------------------------+----------------------------------------+ | Variable_name&nbs
SAE部署Smarty出现：Uncaught exception 'SmartyException' with message 'unable to write dcj3sjt126com PHP smarty sae
对于SAE出现的问题：Uncaught exception 'SmartyException' with message 'unable to write file...。官方给出了详细的FAQ：http://sae.sina.com.cn/?m=faqs&catId=11#show_213 解决方案为： 01 $path
《教父》系列台词 dcj3sjt126com
Your love is also your weak point. 你的所爱同时也是你的弱点。 If anything in this life is certain, if history has taught us anything, it is that you can kill anyone. 不顾家的人永远不可能成为一个真正的男人。 &
mongodb安装与使用 dyy_gusi mongo
一.MongoDB安装和启动,widndows和linux基本相同 1.下载数据库, linux:mongodb-linux-x86_64-ubuntu1404-3.0.3.tgz 2.解压文件,并且放置到合适的位置 tar -vxf mongodb-linux-x86_64-ubun
Git排除目录 geeksun git
在Git的版本控制中，可能有些文件是不需要加入控制的，那我们在提交代码时就需要忽略这些文件，下面讲讲应该怎么给Git配置一些忽略规则。有三种方法可以忽略掉这些文件，这三种方法都能达到目的，只不过适用情景不一样。 1. 针对单一工程排除文件这种方式会让这个工程的所有修改者在克隆代码的同时，也能克隆到过滤规则，而不用自己再写一份，这就能保证所有修改者应用的都是同一
Ubuntu 创建开机自启动脚本的方法 hongtoushizi ubuntu
转载自： http://rongjih.blog.163.com/blog/static/33574461201111504843245/ Ubuntu 创建开机自启动脚本的步骤如下： 1) 将你的启动脚本复制到 /etc/init.d目录下以下假设你的脚本文件名为 test。 2) 设置脚本文件的权限 $ sudo chmod 755
第八章流量复制/AB测试/协程 jinnianshilongnian nginx lua coroutine
流量复制在实际开发中经常涉及到项目的升级，而该升级不能简单的上线就完事了，需要验证该升级是否兼容老的上线，因此可能需要并行运行两个项目一段时间进行数据比对和校验，待没问题后再进行上线。这其实就需要进行流量复制，把流量复制到其他服务器上，一种方式是使用如tcpcopy引流；另外我们还可以使用nginx的HttpLuaModule模块中的ngx.location.capture_multi进行并发
电商系统商品表设计 lkl
DROP TABLE IF EXISTS `category`; -- 类目表 /*!40101 SET @saved_cs_client = @@character_set_client */; /*!40101 SET character_set_client = utf8 */; CREATE TABLE `category` ( `id` int(11) NOT NUL
修改phpMyAdmin导入SQL文件的大小限制 pda158 sql mysql
　用phpMyAdmin导入mysql数据库时，我的10M的数据库不能导入，提示mysql数据库最大只能导入2M。　　 phpMyAdmin数据库导入出错：　　You probably tried to upload too large file. Please refer to documentation for ways to workaround this limit.
Tomcat性能调优方案 Sobfist apache jvm tomcat 应用服务器
一、操作系统调优对于操作系统优化来说，是尽可能的增大可使用的内存容量、提高CPU的频率，保证文件系统的读写速率等。经过压力测试验证，在并发连接很多的情况下，CPU的处理能力越强，系统运行速度越快。。【适用场景】任何项目。二、Java虚拟机调优应该选择SUN的JVM，在满足项目需要的前提下，尽量选用版本较高的JVM，一般来说高版本产品在速度和效率上比低版本会有改进。 J
SQLServer学习笔记 vipbooks 数据结构 xml
1、create database school 创建数据库school 2、drop database school 删除数据库school 3、use school 连接到school数据库，使其成为当前数据库 4、create table class(classID int primary key identity not null) 创建一个名为class的表，其有一