AMiner学术搜索和科技情报挖掘

2023 年热门的大型语言模型 (LLMs)汇总

大模型（LLMs）是一种人工智能模型，旨在理解和生成人类语言。

它们通过在大量的文本数据上进行训练，可以执行广泛的任务，包括文本总结、翻译、情感分析等等。这些模型通常基于深度学习架构，如转换器，这使它们在各种自然语言处理任务上表现出令人印象深刻的能力。

大模型领域在国内外都取得了显著的成就，各个国家和地区的企业、机构以及学术界都在积极投入资源和努力，推动大模型技术的发展。

比如，在国外，OpenAI 推出的基于 GPT-3.5 的大型语言模型 ChatGPT，由于其优秀的表现，ChatGPT 及其背后的大型语言模型迅速成为人工智能领域的热门话题，吸引了广大科研人员和开发者的关注和参与。

在国内，截至2023年8月31日，多家大模型企业和机构正式宣布其服务已经上线，并向全社会开放。目前，百度、智谱、百川、字节、商汤、中科院（紫东太初）等8个企业和机构的大模型名列第一批备案名单，它们可以正式上线并向公众提供服务。

为了让大家能更加直观的看到大模型领域的发展，我们整理了国内外顶尖的大模型，提供给大家参考和使用。

国外大模型汇总

Open AI

ChatGPT

ChatGPT是由GPT-3语言模型驱动的开源聊天机器人。它能够与用户进行自然语言对话交流。ChatGPT经过广泛的主题训练，可以帮助回答问题、提供信息和生成创意内容等各种任务。它被设计成友好和乐于助人的，可以适应不同的对话风格和语境。通过ChatGPT，您可以在最新新闻、时事、爱好和个人兴趣等各种话题上进行有趣而富有信息的对话。

论文：https://www.aminer.cn/pub/5ed0e04291e011915d9e43ee

GPT-4

2023年3月，OpenAI 发布了多模态预训练大模型 GPT-4，能接受图像和文本输入，再输出正确的文本回复。实验表明，GPT-4 在各种专业测试和学术基准上的表现与人类水平相当。例如，它通过了模拟律师考试，且分数在应试者的前 10% 左右；相比之下，GPT-3.5 的得分在倒数 10% 左右。

论文：https://www.aminer.cn/pub/641130e378d68457a4a2986f

Google

LaMDA

LaMDA是一系列专门用于对话的基于Transformer的模型。这些模型拥有多达1370亿个参数，并使用1.56万亿个公开对话数据进行训练。LaMDA可以在各种话题上进行自由流畅的对话。与传统的聊天机器人不同，它不受预定义路径的限制，可以根据对话的方向进行自适应调整。

论文：https://www.aminer.cn/pub/61ea249b5244ab9dcbabc7ac

PaLM

PaLM是一个具有5400亿个参数的语言模型，能够处理各种任务，包括复杂的学习和推理。它在语言和推理测试中可以胜过最先进的语言模型和人类。PaLM系统采用了少样本学习的方法，可以从少量的数据中泛化，近似模拟人类学习和应用知识来解决新问题的方式。

论文：https://www.aminer.cn/pub/624d050e5aee126c0f4a7920

mT5

多语言T5（mT5）是一个由130亿个参数组成的文本到文本的Transformer模型。它是在mC4语料库上进行训练的，涵盖了101种语言，如阿姆哈拉语、巴斯克语、科萨语、祖鲁语等。mT5能够在许多跨语言自然语言处理任务上达到最先进的性能水平。

论文：https://www.aminer.cn/pub/5f92ba5191e011edb3573ba5

Deepmind

Gopher

DeepMind的语言模型Gopher在回答关于科学、人文等专业主题的问题等任务上比现有的大型语言模型更准确，而在逻辑推理和数学等其他任务上与它们相当。Gopher拥有2800亿个参数可供调整，使其比OpenAI的GPT-3更大，后者只有1750亿个参数。

论文：https://www.aminer.cn/pub/61b2c0246750f848a14300ff

Chinchilla

Chinchilla使用与Gopher相同的计算预算，但只有700亿个参数和四倍的数据。在许多下游评估任务中，它胜过了Gopher、GPT-3、Jurassic-1和Megatron-Turing NLG等模型。它在微调和推理方面使用的计算资源明显较少，极大地促进了下游应用的使用。

论文：https://www.aminer.cn/pub/63a413f690e50fcafd6d190a

Sparrow

Sparrow是由DeepMind开发的聊天机器人，旨在正确回答用户的问题，同时减少不安全和不适当回答的风险。Sparrow的动机是解决语言模型产生不正确、带偏见或潜在有害输出的问题。Sparrow通过使用人类判断进行训练，使其比基线预训练语言模型更有帮助、更正确和更无害。

论文：https://www.aminer.cn/pub/63365e7c90e50fcafd1a2bdd

Anthropic

Claude

Claude是一个由先进的自然语言处理驱动的基于AI的对话助手。它的目标是成为有益、无害和诚实的助手。它使用一种称为Constitutional AI的技术进行训练。在训练过程中，通过模型自我监督和其他AI安全方法，对其进行限制和奖励，以展现之前提到的行为特征。

论文：https://www.aminer.cn/pub/63a1750c90e50fcafd1f38d7

AI21 Labs

Jurassic

Jurassic-1是AI21 Labs推出的开发者平台，为构建应用程序和服务提供最先进的语言模型。它提供了两个模型，其中包括Jumbo版本，是迄今为止发布的最大、最复杂的通用语言模型。这些模型非常灵活，能够生成类似于人类的文本，并解决诸如问答和文本分类等复杂任务。

论文：https://www.aminer.cn/pub/62620f1c5aee126c0f686cf5

NVIDIA

Megatron-Turing NLG

Megatron-Turing自然语言生成（MT-NLG）模型是一个基于Transformer的语言模型，拥有5300亿个参数，使其成为同类模型中最大且最强大的模型。它在零、一和少样本设置中超越了之前的最先进模型，并在完成预测、常识推理、阅读理解、自然语言推理和词义消歧等自然语言任务中展现了无与伦比的准确性。

论文：https://www.aminer.cn/pub/61f753205aee126c0f9c2149

国内大模型汇总

百度

Ernie 3.0 Titan

由百度和鹏程实验室联合发布，它有 260B 个参数，擅长自然语言理解和生成。它在海量非结构化数据上进行了训练，并在机器阅读理解、文本分类和语义相似性等 60 多项 NLP 任务中取得了一流的成绩。此外，泰坦还在 30 项少拍和零拍基准测试中表现出色，这表明它有能力利用少量标记数据在各种下游任务中进行泛化。

论文：https://www.aminer.cn/pub/61c53a815244ab9dcbcaf3b5

Ernie Bot

于 3 月份完成 "Ernie Bot "项目的内部测试。Ernie Bot 是一种人工智能语言模型，类似于 OpenAI 的 ChatGPT，能够进行语言理解、语言生成和文本到图像的生成。这项技术是全球开发生成式人工智能竞赛的一部分。

论文：https://www.aminer.cn/pub/60e441e0dfae54001623c105

智谱AI

GLM

一个基于自回归填空的通用预训练框架，通过在一个统一的框架中同时学习双向和单向的注意力机制，模型在预训练阶段同时学习到了上下文表示和自回归生成。在针对下游任务的微调阶段，通过完形填空的形式统一了不同类型的下游任务，从而实现了针对所有自然语言处理任务通用的预训练模型。

论文：https://www.aminer.cn/pub/622819cdd18a2b26c7ab496a

GLM-130B

GLM-130B 是一个开源开放的双语（中文和英文）双向稠密模型，拥有 1300 亿参数，模型架构采用通用语言模型（GLM）。它旨在支持在一台 A100（40G * 8）或 V100（32G * 8）服务器上对千亿规模参数的模型进行推理。在 INT4 量化方案下，GLM-130B 可以几乎不损失模型性能的情况下在 RTX 3090（24G * 4）或 GTX 1080 Ti（11G * 8）服务器上进行高效推理。

论文：https://www.aminer.cn/pub/633e476890e50fcafde59595

ChatGLM-6B

ChatGLM-6B 是一个开源的、支持中英双语问答的对话语言模型，并针对中文进行了优化。该模型基于 General Language Model (GLM) 架构，具有 62 亿参数。结合模型量化技术，用户可以在消费级的显卡上进行本地部署（INT4 量化级别下最低只需 6GB 显存）。ChatGLM-6B 使用了和 ChatGLM 相同的技术，针对中文问答和对话进行了优化。经过约 1T 标识符的中英双语训练，辅以监督微调、反馈自助、人类反馈强化学习等技术的加持，62 亿参数的ChatGLM-6B 虽然规模不及千亿模型，但大大降低了推理成本，提升了效率，并且已经能生成相当符合人类偏好的回答。

华为

PanGu-Alpha

华为开发了一种与 OpenAI 的 GPT-3 相当的中文模型，称为 PanGu-Alpha。该模型基于 1.1 TB 的中文资源，包括书籍、新闻、社交媒体和网页，包含超过 2000 亿个参数，比 GPT-3 多 2500 万个。PanGu-Alpha 能高效完成各种语言任务，如文本摘要、问题解答和对话生成。

论文：https://www.aminer.cn/pub/6087f2ff91e011e25a316d31

阿里

M6

2021年6月，阿里巴巴联合清华大学发表了一项新研究，提出了参数规模达到1000亿的中文预训练模型 M6，是当时最大规模的中文多模态预训练模型。M6的应用适用于广泛的任务，包括产品描述生成、视觉问答、问答、中国诗歌生成等，实验结果表明M6的表现优于一系列强大的基准。并且，研究人员还专门设计了文本引导的图像生成任务，并证明经过微调的 M6 可以创建具有高分辨率和丰富细节的高质量图像。

论文：https://www.aminer.cn/pub/60c320b19e795e9243fd1672

通义千问

2023年4月，阿里发布了「通义千问」，一个超大规模的语言模型，具备多轮对话、文案创作、逻辑推理、多模态理解、多语言支持等功能。

而就在前几天，阿里再次推出以通义千问70亿参数模型Qwen-7B为基座语言模型：Qwen-VL，支持图文输入，具备多模态信息理解能力。除了具备基本的图文识别、描述、问答及对话能力之外，还新增了视觉定位、图像中文字理解等能力。

论文：https://www.aminer.cn/pub/64e826d63fda6d7f06c3150c

商汤

日日新

2023年4 ，商汤推出大模型 “日日新”，包括自然语言处理模型 “商量”、文生图模型 “秒画” 和数字人视频生成平台 “如影” 等。这也是继百度文心一言、阿里通义千问之后，又一国内大厂的类 ChatGPT 产品。

最近，商汤大模型团队也提出了文生图大模型RAPHAEL，详细请看论文。

论文：https://www.aminer.cn/pub/647572e0d68f896efa7b79ab

除以上模型之外，国内模型还有百川智能模型、抖音的云雀大模型、中科院 “紫东太初”模型、上海人工智能实验室的书生大模型、MiniMax 的 ABAB 大模型等。

在2023年，国内外不断涌现出新的模型，我们目睹了大模型的爆炸式增长。随着大模型的不断演进和优化，我们可以期待它们在自然语言处理、图像识别、语音识别等领域的性能不断提升，甚至超越人类的水平。

这将推动人工智能技术在各个行业的广泛应用，从医疗到金融，从交通到教育，大模型将成为智能设备和服务的核心。我们的生活将变得更加智能化、便捷化和个性化。

当然，大模型的未来发展也面临一些挑战和问题，如隐私和安全性等。然而，随着技术的进步和应用的拓展，这些问题将逐步得到解决和克服。

总的来说，一切交给时间来证明！

如何使用ChatPaper？

使用ChatPaper的方法很简单，打开AMiner首页，从页面顶部导航栏或者右下角便可进入ChatPaper页面。

在ChatPaper页面中，可以选择基于单篇文献进行对话和基于全库（个人文献库）对话，可选择上传本地PDF或者直接在AMiner上检索文献。

驱动开发系列59- 再述如何处理硬件中断黑不溜秋的 GPU驱动专栏驱动开发
目录一：硬件中断以及内核是如何处理中断的二：分配硬件IRQ1.使用request_irq()分配中断处理程序2.释放IRQ3.设置中断标志4.理解电平触发与边沿触发中断三：实现中断处理程序四：使用线程中断模型五：启用/禁用中断六：查看所有已分配的中断线七：理解和使用上半部和下半部八：总结在本文中，我们将重点讨论编写设备驱动程序时一个非常关键的方面：什么是硬件中断，更重要的是，作为驱动开发者，你该如
NET中数据模型Model和数据传输对象DTO的区别岁陨命理 ui
数据模型Model主要处理业务逻辑，不可以用于数据传递使用数据模型的缺点：直接向前端返回数据模型，会暴露系统的业务核心。而使用dto的时候可以屏蔽我们不希望暴露的核心业务颗粒度太粗(输出数据无法精细调整)。但是通过不同dto的组合，可以调整输出数据的结果，从而解决颗粒度太粗的问题DTODTO的全称是数据传输对象，主要用于数据传递，是面向界面UI的使用DTO的好处：DTO的定义是根据UI的需求来个性
企业如何用Data Agent实现数据价值效率的飞跃数据库观点资讯
作者阿里云数据库高级技术专家徐大丁(辰马)一、引言：数据价值实现的困境在数字化转型的浪潮中，数据被誉为“新时代的石油”。然而，对于大多数企业而言，这座“油田”的价值却远未被充分开采。下图简单概括了企业在数据价值效率追求上的演进路径，反映出业界对数据价值效率指标的追求。组织，技术都在不断地升级。以价值效率为牵引，从报表到洞察，从分析到预测，追求更高的效率提升和决策速度。这带来了技术架构的不断演进，从
SUNDAE-一种称为“光谱剪枝”的技术来优化和压缩3DGS模型 huarzail 3DGS 剪枝 3d 算法
清华大学人工智能产业研究院、伦敦帝国理工学院、北京航空航天大学、北京理工大学、中国科学院大学、香港中文大学（深圳）、中国电信人工智能研究院（TeleAI）EVOL实验室的研究人员联合推出了一种新的3D场景表示方法-SUNDAE，它通过一种称为“光谱剪枝”的技术来优化和压缩3D高斯溅射（3DGaussianSplatting，简称3DGS）模型，同时使用神经网络补偿来保持渲染质量。项目主页：SUND
FLUX.1 Kontext全景图：下一代AI图像编辑的家族革命与技术图谱 Liudef06小白 AIGC 人工智能 AIGC
FLUX.1Kontext全景图：下一代AI图像编辑的家族革命与技术图谱120亿参数流式变换器驱动，3秒完成像素级编辑，StableDiffusion原班团队打造的AI图像新范式正在重塑创意工作流。2025年夏，BlackForestLabs（黑森林实验室）向全球创意产业投下一枚技术炸弹——FLUX.1Kontext图像编辑模型家族正式亮相。这个由StableDiffusion核心创始团队打造的A
2025年7月-9月广深地区学术会议征稿邀稿 | 2025年7-9月广州学术会议、深圳学术会议参会投稿 | 广深参会 EI 检索会议推荐 | 期待在广东与您相见，共襄学术盛举！
会议名称【点击会议名称查看详情】会议时间会议地点第四届能源与电力系统国际学术会议(ICEEPS2025)2025年7月17-19日广州第七届电子与通信，网络与计算机技术国际学术会议（ECNCT2025）2025年7月18-20日广州2025年人工智能与基础模型国际学术会议（AIFM2025）2025年7月18-20日广州第六届经济管理与大数据应用国际学术会议(ICEMBDA2025)2025年7月
魔都AI医疗哪家强？全景揭秘科技创新与未来钱景！
引言上海作为中国科技创新的先锋城市，正在AI医疗领域崭露头角。根据2024年12月的数据，上海拥有34家专注于AI药物研发的公司，占全国预临床研究的60%和临床试验的47%。这些公司利用深度学习、大语言模型（LLM）和计算机视觉等技术，革新药物发现、医疗影像分析和数据治理，推动医疗行业的智能化转型。从全球首个人工智能医院“AgentHospital”到AI驱动的诊断系统，上海的AI医疗生态正在重塑
AI 正在深度重构软件开发的底层逻辑和全生命周期，从技术演进、流程重构和未来趋势三个维度进行系统性分析
AI正在深度重构软件开发的底层逻辑和全生命周期，从需求分析到运维维护的每个环节都产生了范式级变革。以下从技术演进、流程重构和未来趋势三个维度进行系统性分析：一、AI重构软件开发全栈的技术图谱需求工程智能化NLP驱动的需求解析：GPT-4架构实现用户访谈转录自动转化为UML用例图，准确率达89%（微软2023内部数据）情感计算应用：基于BERT的意图识别模型可捕捉用户需求中的隐性情绪，需求变更预测准
软件建模、设计模式、重构 kingzdm java 设计模式设计模式重构 uml
软件建模、设计模式、重构软件建模软件建模体现了软件设计的思想，在需求和实现之间架起了一座桥梁，通过模型指导软件系统的具体实现。模型并不是软件系统的一个完备表示，而是所研究的系统的一种抽象。软件建模通过不同的视角去描述一个系统。软件建模视角：外部视角，交互视角，结构化视角，行为视角。软件建模方法：结构化方法，面向对象方法，基于构建方法，面向服务方法，面向方面方法，模型驱动方法，形式化方法。UML特点
C++系列（九）：C++函数三大杀器 --- 默认参数×占位符×重载 - 解锁高性能代码的终极奥义傅里叶的耶 C++语言系列（教程 +实战）c++函数默认参数占位符重载
引言在C++的编程范式中，函数不仅是代码复用的基本单元，更是抽象复杂性的核心工具。默认参数、占位参数和函数重载三大特性，共同构成了函数式抽象的"三位一体"：默认参数是接口设计的润滑剂，它通过参数预设值消除冗余调用，将"通用配置"内化于函数签名。当开发者面对高频次调用的API时，默认参数能显著减少代码噪音，使核心逻辑浮出水面。占位参数则展现了语言的预留智慧。这个看似无用的语法结构，实质是系统演进的战
深度探索：现代翻译技术的核心算法与实践（第一篇）软考和人工智能学堂 #DeepSeek快速入门人工智能 #深度学习算法
引言：翻译技术的演进之路从早期的基于规则的机器翻译(RBMT)到统计机器翻译(SMT)，再到如今主导行业的神经机器翻译(NMT)，翻译技术已经走过了漫长的发展道路。现代翻译系统不仅能够处理简单的句子，还能理解上下文、识别领域术语，甚至捕捉微妙的文化差异。本系列文章将带您深入探索现代翻译技术的核心算法与实践。作为开篇之作，本文将重点介绍神经机器翻译的基础架构——序列到序列(Seq2Seq)模型，并通
Java面向对象三大特性精华实战笔记：static、继承、多态与接口
文章目录Java面向对象三大特性精华实战笔记：static、继承、多态与接口一、static1.静态变量2.静态方法二、工具类1.Javabean类2.测试类3.工具类三、继承四、多态定义表现形式多态的前提多态的好处五、接口接口的定义和使用接口中成员的特点总结Java面向对象三大特性精华实战笔记：static、继承、多态与接口一、static在public后加上static表示老师名字这个属性被所
个人总结 - LangChain4j应用（1）艾露z AI java langchain ai 人工智能
个人总结-LangChain4j应用（1）github：Releases·langchain4j/langchain4j·GitHub官方文档：Introduction|LangChain4j简要介绍：LangChain4j是一个旨在简化大语言模型（LLMs）与Java应用程序集成的框架。ChatandLanguageModels：LanguageModel：最简单的聊天模型，简单的接收字符串，不
一文读懂主流云厂商的云安全产品对比｜小白也能看懂！
☁️一文读懂主流云厂商的云安全产品对比｜小白也能看懂！云服务器是“家”，安全产品就是“门锁、摄像头、护栏”——你搭了房子，总得保护吧？无论你是初创开发者，还是企业运维，选对安全产品比你想象中更重要。但问题来了，阿里云、腾讯云、华为云这三大厂商的云安全产品看起来都差不多，到底有什么区别？作为一个云安全小白，云安全产品那么多到底是什么以及最后该怎么选？！一、安全防护到底防的是什么？很多人以为“云安全”
2022年MySQL最新面试题 m0_54850467 面试学习路线阿里巴巴 android 前端后端
2022年MySQL最新面试题目录前言一、数据库基础知识0、概要1、平时MySQL主要用哪个版本2、数据库三大范式是什么3、MySQL有关权限的表都有哪几个4、MySQL的binlog有有几种录入格式？分别有什么区别？平时用到哪些关系型数据库和非关系数据库,可以谈谈你对它们的理解吗?5、可以简单说说你对MySQL的逻辑架构了解吗？6、了解MySQL中的MVCC是什么?7、PostgreSQL相对于
X-Flux-ComfyUI 技术指南：基于ComfyUI的FLUX扩散模型工作流搭建
X-Flux-ComfyUI技术指南：基于ComfyUI的FLUX扩散模型工作流搭建x-flux-comfyui项目地址:https://gitcode.com/gh_mirrors/xf/x-flux-comfyui前言X-Flux-ComfyUI是一个基于ComfyUI平台的扩展项目，专门为FLUX扩散模型提供了一套完整的工作流节点。本文将详细介绍如何安装配置该扩展，并深入解析各个核心节点的功
2025生成式AI革命：从技术原理到商业应用，一文读懂未来十年的颠覆力量硅基打工人 AI 人工智能开源语言模型经验分享
引言：生成式AI为何成为2025年最火爆的技术话题？2025年，生成式AI（GenerativeAI）已从实验室走向千家万户。无论是刷屏的AI绘画、爆火的虚拟主播，还是医疗领域的蛋白质结构预测，生成式AI正以惊人的速度重塑行业格局。据《2025年人工智能发展报告》显示，全球生成式AI市场规模已突破800亿美元，年增长率达45%。与此同时，OpenAI的GPT-5、谷歌的GeminiUltra等大模
新手向:中文语言识别的进化之路
自然语言处理（NLP）技术正在以前所未有的速度改变我们与机器的交互方式，而中文作为世界上使用人数最多的语言，其处理技术面临着独特的挑战与机遇。本文将全面剖析中文自然语言识别模型的发展历程、核心技术原理、当前应用现状以及未来发展趋势，带您深入了解这一改变人机交互方式的关键技术。一、中文NLP的特殊挑战：为什么中文处理如此困难？中文自然语言处理面临着一系列西方语言所不具备的特殊挑战，这些挑战直接影响了
LLM探索的时代新加坡内哥谈技术人工智能
每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同行！订阅：https://rengongzhineng.io/当前的大语言模型，是过去三十年人类在互联网上自由发布海量文本内容的意外副产品。IlyaS
2025 年使用大模型进行软件工程：现实检验新加坡内哥谈技术软件工程人工智能
每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同行！订阅：https://rengongzhineng.io/以工程经理与资深工程师的视角，探讨大厂与初创公司的挑战,以及与Anthropic、Cur
“猫攻击”揭示推理模型脆弱性，凸显上下文工程的重要性新加坡内哥谈技术人工智能
每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同行！订阅：https://rengongzhineng.io/一项研究显示，即便是像“猫一生中大多数时间都在睡觉”这样简单的语句，也可能显著干扰高级推
Google AI 刚刚开源 MCP 数据库工具箱，让 AI 代理安全高效地查询数据库新加坡内哥谈技术人工智能
每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同行！订阅：https://rengongzhineng.io/https://github.com/googleapis/genai-toolboxG
海外社媒营销：实现多账号矩阵与精准触达
在全球社交媒体用户突破50亿的当下，TikTok、Instagram、Facebook等平台已成为品牌触达海外消费者的核心战场。然而，随着平台风控升级与用户需求分化，海外社媒营销正面临两大核心挑战：多账号矩阵运营易被封禁（TikTok单月封禁超200万账号）、内容触达缺乏精准度（全球用户语言/文化/兴趣差异超300种）。亚矩阵云手机通过虚拟化环境隔离、AI行为模拟引擎、动态内容适配系统三大核心技术
Python 领域 vllm 安装与环境配置全攻略 Python编程之道 Python编程之道 python 开发语言 ai
Python领域vllm安装与环境配置全攻略关键词：Python、vllm、安装、环境配置、深度学习摘要：本文围绕Python领域中vllm的安装与环境配置展开，全面且深入地介绍了vllm的相关知识。首先阐述了背景信息，包括目的范围、预期读者、文档结构和术语表。接着详细讲解了vllm的核心概念与联系，分析其核心算法原理并给出具体操作步骤，还引入了相关数学模型和公式进行说明。通过项目实战，提供代码实
AGI面临突破需要清除这两朵乌云：解码智能鸿沟的终极密码
1.物理学史的镜鉴：科学革命的预兆1900年英国物理学家开尔文勋爵宣称"物理学大厦已告完成"，却未料及那两朵"光速悖论"与"紫外灾难"的乌云，最终催生了相对论与量子力学。这段历史在AI领域重现：当算力呈指数级增长，模型参数突破万亿级，我们依然无法教会AI"水杯会掉落"的常识。这种历史重演揭示着深刻规律——任何科学体系的突破往往始于对既有范式的质疑。正如爱因斯坦推翻绝对时空观，当前AI研究需要重新审
语义分割模型的轻量化与准确率提升研究 pk_xz123456 仿真模型深度学习算法 transformer 深度学习人工智能算法数据结构
语义分割模型的轻量化与准确率提升研究1.引言语义分割是计算机视觉领域的核心任务之一，它要求模型为图像中的每个像素分配一个类别标签。随着深度学习的发展，语义分割模型在多个领域得到了广泛应用，如自动驾驶、医学影像分析、遥感图像解译等。然而，现有的语义分割模型往往面临两个主要挑战：模型复杂度高导致难以部署在资源受限的设备上，以及准确率仍有提升空间以满足实际应用需求。本文将从模型轻量化和准确率提升两个角度
Spring MVC 框架解析
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、Spri
Spring MVC深度解析
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、Spri
Spring Cloud服务治理精讲 Java廖志伟 Java场景面试宝典 Spring Cloud Service Governance Distributed Systems
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、Spri
领域设计关键技术解析 Java廖志伟 Java场景面试宝典
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、Spri
jvm调优总结（从基本概念到深度优化） oloz java jvm jdk 虚拟机应用服务器
JVM参数详解：http://www.cnblogs.com/redcreen/archive/2011/05/04/2037057.html Java虚拟机中，数据类型可以分为两类：基本类型和引用类型。基本类型的变量保存原始值，即：他代表的值就是数值本身；而引用类型的变量保存引用值。“引用值”代表了某个对象的引用，而不是对象本身，对象本身存放在这个引用值所表示的地址的位置。
【Scala十六】Scala核心十：柯里化函数 bit1129 scala
本篇文章重点说明什么是函数柯里化，这个语法现象的背后动机是什么，有什么样的应用场景，以及与部分应用函数(Partial Applied Function)之间的联系 1. 什么是柯里化函数 A way to write functions with multiple parameter lists. For instance def f(x: Int)(y: Int) is a
HashMap dalan_123 java
HashMap在java中对很多人来说都是熟的；基于hash表的map接口的非同步实现。允许使用null和null键；同时不能保证元素的顺序；也就是从来都不保证其中的元素的顺序恒久不变。 1、数据结构在java中，最基本的数据结构无外乎：数组和引用（指针），所有的数据结构都可以用这两个来构造，HashMap也不例外，归根到底HashMap就是一个链表散列的数据
Java Swing如何实时刷新JTextArea，以显示刚才加append的内容周凡杨 java 更新 swing JTextArea
在代码中执行完textArea.append("message")后，如果你想让这个更新立刻显示在界面上而不是等swing的主线程返回后刷新，我们一般会在该语句后调用textArea.invalidate()和textArea.repaint()。问题是这个方法并不能有任何效果，textArea的内容没有任何变化，这或许是swing的一个bug，有一个笨拙的办法可以实现
servlet或struts的Action处理ajax请求 g21121 servlet
其实处理ajax的请求非常简单，直接看代码就行了： //如果用的是struts //HttpServletResponse response = ServletActionContext.getResponse(); // 设置输出为文字流 response.setContentType("text/plain"); // 设置字符集 res
FineReport的公式编辑框的语法简介老A不折腾 finereport 公式总结
FINEREPORT用到公式的地方非常多，单元格（以=开头的便被解析为公式），条件显示，数据字典，报表填报属性值定义，图表标题，轴定义，页眉页脚，甚至单元格的其他属性中的鼠标悬浮提示内容都可以写公式。简单的说下自己感觉的公式要注意的几个地方： 1.if语句语法刚接触感觉比较奇怪，if(条件式子,值1,值2)，if可以嵌套，if(条件式子1，值1，if(条件式子2，值2，值3)
linux mysql 数据库乱码的解决办法墙头上一根草 linux mysql 数据库乱码
linux 上mysql数据库区分大小写的配置 lower_case_table_names=1 1-不区分大小写 0-区分大小写修改/etc/my.cnf 具体的修改内容如下: [client] default-character-set=utf8 [mysqld] datadir=/var/lib/mysql socket=/va
我的spring学习笔记6-ApplicationContext实例化的参数兼容思想 aijuans Spring 3
ApplicationContext能读取多个Bean定义文件，方法是： ApplicationContext appContext = new ClassPathXmlApplicationContext（ new String[]｛“bean-config1.xml”，“bean-config2.xml”，“bean-config3.xml”，“bean-config4.xml
mysql 基准测试之sysbench annan211 基准测试 mysql基准测试 MySQL测试 sysbench
1 执行如下命令，安装sysbench-0.5： tar xzvf sysbench-0.5.tar.gz cd sysbench-0.5 chmod +x autogen.sh ./autogen.sh ./configure --with-mysql --with-mysql-includes=/usr/local/mysql
sql的复杂查询使用案列与技巧百合不是茶 oracle sql 函数数据分页合并查询
本片博客使用的数据库表是oracle中的scott用户表; ------------------- 自然连接查询查询 smith 的上司(两种方法) &
深入学习Thread类 bijian1013 java thread 多线程 java多线程
一．线程的名字下面来看一下Thread类的name属性，它的类型是String。它其实就是线程的名字。在Thread类中，有String getName()和void setName(String)两个方法用来设置和获取这个属性的值。同时，Thr
JSON串转换成Map以及如何转换到对应的数据类型 bijian1013 java fastjson net.sf.json
在实际开发中，难免会碰到JSON串转换成Map的情况，下面来看看这方面的实例。另外，由于fastjson只支持JDK1.5及以上版本，因此在JDK1.4的项目中可以采用net.sf.json来处理。一.fastjson实例 JsonUtil.java package com.study; impor
【RPC框架HttpInvoker一】HttpInvoker：Spring自带RPC框架 bit1129 spring
HttpInvoker是Spring原生的RPC调用框架，HttpInvoker同Burlap和Hessian一样，提供了一致的服务Exporter以及客户端的服务代理工厂Bean，这篇文章主要是复制粘贴了Hessian与Spring集成一文，【RPC框架Hessian四】Hessian与Spring集成在【RPC框架Hessian二】Hessian 对象序列化和反序列化一文中
【Mahout二】基于Mahout CBayes算法的20newsgroup的脚本分析 bit1129 Mahout
#!/bin/bash # # Licensed to the Apache Software Foundation (ASF) under one or more # contributor license agreements. See the NOTICE file distributed with # this work for additional information re
nginx三种获取用户真实ip的方法 ronin47
随着nginx的迅速崛起，越来越多公司将apache更换成nginx. 同时也越来越多人使用nginx作为负载均衡, 并且代理前面可能还加上了CDN加速，但是随之也遇到一个问题：nginx如何获取用户的真实IP地址,如果后端是apache,请跳转到<apache获取用户真实IP地址>，如果是后端真实服务器是nginx，那么继续往下看。实例环境：用户IP 120.22.11.11
java-判断二叉树是不是平衡 bylijinnan java
参考了 http://zhedahht.blog.163.com/blog/static/25411174201142733927831/ 但是用java来实现有一个问题。由于Java无法像C那样“传递参数的地址，函数返回时能得到参数的值”，唯有新建一个辅助类：AuxClass import ljn.help.*; public class BalancedBTree {
BeanUtils.copyProperties VS PropertyUtils.copyProperties 诸葛不亮 PropertyUtils BeanUtils
BeanUtils.copyProperties VS PropertyUtils.copyProperties 作为两个bean属性copy的工具类，他们被广泛使用，同时也很容易误用，给人造成困然；比如：昨天发现同事在使用BeanUtils.copyProperties copy有integer类型属性的bean时，没有考虑到会将null转换为0，而后面的业
[金融与信息安全]最简单的数据结构最安全 comsci 数据结构
现在最流行的数据库的数据存储文件都具有复杂的文件头格式，用操作系统的记事本软件是无法正常浏览的，这样的情况会有什么问题呢？从信息安全的角度来看，如果我们数据库系统仅仅把这种格式的数据文件做异地备份，如果相同版本的所有数据库管理系统都同时被攻击，那么
vi区段删除 Cwind linux vi 区段删除
区段删除是编辑和分析一些冗长的配置文件或日志文件时比较常用的操作。简记下vi区段删除要点备忘。 vi概述引文中并未将末行模式单独列为一种模式。单不单列并不重要，能区分命令模式与末行模式即可。 vi区段删除步骤： 1. 在末行模式下使用:set nu显示行号非必须，随光标移动vi右下角也会显示行号，能够正确找到并记录删除开始行
清除tomcat缓存的方法总结 dashuaifu tomcat 缓存
用tomcat容器，大家可能会发现这样的问题，修改jsp文件后，但用IE打开依然是以前的Jsp的页面。出现这种现象的原因主要是tomcat缓存的原因。解决办法如下: 在jsp文件头加上 <meta http-equiv="Expires" content="0"> <meta http-equiv="kiben&qu
不要盲目的在项目中使用LESS CSS dcj3sjt126com Web less
　如果你还不知道LESS CSS是什么东西，可以看一下这篇文章，是我一朋友写给新人看的《CSS——LESS》　　不可否认，LESS CSS是个强大的工具，它弥补了css没有变量、无法运算等一些“先天缺陷”，但它似乎给我一种错觉，就是为了功能而实现功能。　　比如它的引用功能 ? .rounded_corners{
[入门]更上一层楼 dcj3sjt126com PHP yii2
更上一层楼通篇阅读完整个“入门”部分，你就完成了一个完整 Yii 应用的创建。在此过程中你学到了如何实现一些常用功能，例如通过 HTML 表单从用户那获取数据，从数据库中获取数据并以分页形式显示。你还学到了如何通过 Gii 去自动生成代码。使用 Gii 生成代码把 Web 开发中多数繁杂的过程转化为仅仅填写几个表单就行。本章将介绍一些有助于更好使用 Yii 的资源：
Apache HttpClient使用详解 eksliang httpclient http协议
Http协议的重要性相信不用我多说了，HttpClient相比传统JDK自带的URLConnection，增加了易用性和灵活性（具体区别，日后我们再讨论），它不仅是客户端发送Http请求变得容易，而且也方便了开发人员测试接口（基于Http协议的），即提高了开发的效率，也方便提高代码的健壮性。因此熟练掌握HttpClient是很重要的必修内容，掌握HttpClient后，相信对于Http协议的了解会
zxing二维码扫描功能 gundumw100 android zxing
经常要用到二维码扫描功能现给出示例代码 import com.google.zxing.WriterException; import com.zxing.activity.CaptureActivity; import com.zxing.encoding.EncodingHandler; import android.app.Activity; import an
纯HTML+CSS带说明的黄色导航菜单 ini html Web html5 css hovertree
HoverTree带说明的CSS菜单:纯HTML+CSS结构链接带说明的黄色导航在线体验效果：http://hovertree.com/texiao/css/1.htm代码如下,保存到HTML文件可以看到效果： <!DOCTYPE html > <html > <head> <title>HoverTree
fastjson初始化对性能的影响 kane_xie fastjson 序列化
之前在项目中序列化是用thrift，性能一般，而且需要用编译器生成新的类，在序列化和反序列化的时候感觉很繁琐，因此想转到json阵营。对比了jackson，gson等框架之后，决定用fastjson，为什么呢，因为看名字感觉很快。。。网上的说法： fastjson 是一个性能很好的 Java 语言实现的 JSON 解析器和生成器，来自阿里巴巴的工程师开发。
基于Mybatis封装的增删改查实现通用自动化sql mengqingyu DAO
1.基于map或javaBean的增删改查可实现不写dao接口和实现类以及xml，有效的提高开发速度。 2.支持自定义注解包括主键生成、列重复验证、列名、表名等 3.支持批量插入、批量更新、批量删除 <bean id="dynamicSqlSessionTemplate" class="com.mqy.mybatis.support.Dynamic
js控制input输入框的方法封装(数字，中文，字母，浮点数等) qifeifei javascript js
在项目开发的时候，经常有一些输入框，控制输入的格式，而不是等输入好了再去检查格式，格式错了就报错，体验不好。 /** 数字，中文，字母,浮点数(+/-/.) 类型输入限制，只要在input标签上加上 jInput="number,chinese,alphabet,floating" 备注：floating属性只能单独用*/ funct
java 计时器应用 tangqi609567707 java timer
mport java.util.TimerTask; import java.util.Calendar; public class MyTask extends TimerTask { private static final int
erlang输出调用栈信息 wudixiaotie erlang
在erlang otp的开发中，如果调用第三方的应用，会有有些错误会不打印栈信息，因为有可能第三方应用会catch然后输出自己的错误信息，所以对排查bug有很大的阻碍，这样就要求我们自己打印调用的栈信息。用这个函数：erlang:process_display (self (), backtrace).需要注意这个函数只会输出到标准错误输出。也可以用这个函数：erlang:get_s