腾讯云开发者

深耕视听领域的匠人，如何看多媒体技术未来？ | 专访上海交大宋利

引言

20 世纪 80 年代，当多媒体技术诞生，一个全新的多媒体应用时代大幕徐徐开启。四十年间，一代代技术人不断投身多媒体事业，这其中有许多深耕该领域的匠心人，埋首研究并持续创新，引领和推动多媒体技术不断演进，蓬勃发展。

上海交通大学电子工程系教授、图像所副所长宋利老师便是这样一位一路见证多媒体技术起步和勃兴，深耕多媒体技术数十年，引领着高校教学和研究数字化前行的“匠心人”。在本期技术指针中，我们将跟随腾讯云 TVP、上海交通大学电子工程系教授图像所副所长宋利老师，透过学者视角，开启一段奇妙的多媒体技术发展之旅。

一、看起步发展，忆多媒体历程

早在二十多年前读博士时进入多媒体领域，宋利老师便扎根于此，一路以来，他见证着多媒体技术从 H.264 时代发展至如今的深度学习时代，也伴随技术的发展而成长。那么，接下来，我们将跟随宋利老师的脚步，回首与多媒体的不解之缘。

我从2005年博士毕业后留校，一直专注多媒体领域教到现在，从讲师到副教授、教授这样一步一步地做。遥想当年没有现在这么热闹，我印象中当年的同一届学生里有好多人都已经转行了，并没有留在多媒体领域。但是我在念博士的时候，因为热爱所以比较认定自己未来要在多媒体行业里工作，而且视频编码领域拥有一半技术一半艺术，一半可控一半不可控，这一点也非常吸引我持续投入。

其实，我做的第一个项目是图形学，主要是给虚拟人试穿衣服以模拟真人试衣，这是现在看起来都很超前的一个技术。在那之后我开始转到视频编码领域，中间也有跟踪过一段音频技术，然后便一路从 H.264 时代、H.265 时代、H.266 时代，现在到深度学习时代，算是见证了多媒体行业从起步到发展的环节。

在学者以外，我的另一个身份是老师。我个人是比较喜欢做老师的状态，教学相长，当能把一个东西讲给别人听时其实是又学习了一遍。同时每学期都是新同学，新面孔，每次都有新鲜感，要把他们领入门，希望他们成长起来，成长得更好更快，这种感觉其实还是挺难得和挺棒的，这可能也正是做老师的乐趣所在。我其实也很尊重学生的选择和个性，我一般会让我的研究生花些时间去了解自己喜欢什么，擅长什么，我希望学生做自己喜欢且擅长的事。作为高校教师，毋庸置疑还是要保证自己专业的精深，我在多媒体领域里面从事时间最长，大约超过一半的投入和产出、项目来源、学生、做的成果，还是在视频编解码领域，因此在这方面还是在持续发力的。我上课时跟学生也正好讲到 “T model”， “T” 这一横的意义是代表广博，知识要有广度，但还有一个很重要的是 “T” 这一竖的杠杆，即深度，深度是代表你的专业，只有足够深才能找到自己的立足点。

多媒体其实入门不难，但是要做到精深，是需要投入时间打磨的，需要有工匠精神。就好比一本教材，往往要出到第三版才会有比较优质的内容，对于产品，对于技术也是这样，我们得倾注热情，花时间去提升技艺，要不断地拓宽视野和学习范围。多媒体的特点就是它是一个不断变化的滑动窗口，下一代可能走的就不是这个技术体系，而正是学习能力和投入决定了你能走得多远。

在这个市场蓬勃发展的阶段，因为市场足够大，做得不好也能分一杯羹，但等到市场进入竞争激烈的状态时，那就只能靠打擂了。因此我和很多同学说，希望大家毕业以后到各个公司里面是做编码器设计的人，而不是简单拿编码器去改，我们要有能力重新写一个，争取坐上第一把交椅。

二、看深耕领域，剖多媒体演化

在多媒体发展史上，多媒体一词的概念，编解码的标准，它们都经历了哪些演变；在编码标准上，我们又是如何实现从跟随到领路的转变？从概念内涵到标准迭代，宋利老师将为我们一一娓娓道来：

多媒体领域的发展大约经历了 40 年的时间，1990年，以视频编码第一代标准 H.261 为代表发展到现在，如今我们日常使用的微信视频号，腾讯会议的背后都是多媒体技术在支撑，它经历了很大的演变。

第一个演变阶段是 TV，即电视阶段，从电视台把一个节目能传到我们的家里原来至少需要经过 300 多个设备和环节。第二阶段走向为OTT，或被称为流媒体，流媒体把原来电视时代的大堆专用设备都简化了，对我们多媒体人而言是一个网络的出现，虽然终端看到的东西没有变化，但其实背后已经发生了重大的结构演化。第三阶段则是手机终端化，如今我们仅仅使用手机就能够处理绝大部分的问题。未来再进一步向交互性更强的方向发展，就是如今大家热议的元宇宙，也是腾讯所说的全真互联网，我最近还取了一个新词叫“临境媒体”，它们比原来的多媒体的内涵又更加丰富了。

我在上课时也给同学们留了一个思考题，云游戏到底是游戏还是视频？我们打的是游戏，但支撑游戏的却是视频的技术，它其实是将渲染完的结果再以视频形式推到用户侧。低时延编解码、视频处理，它们的内涵比以前无疑扩大了许多。有时候语言限定了大家的想象力或限定了知识，我们至今还在用“多媒体”这个词，但“媒体”的内涵其实与二十年、十年前相比已经发生了很大的变化。

（一）视频编解码迭代下，H.267 路在何方

当前，视频编解码从某种程度上来说已经发展渐趋成熟，可以说只要存在视频的地方，那么这个视频都不会是原始视频，它背后一定有编码器，它也是属于基础架构里面不可或缺的环境。

通信里面的 1G、2G、3G，现在已经发展到 5G，类比到视频编解码其实也有代际的概念。鉴于视频编解码比较具有通用性，所以它有一个标准在后面推动。从第一代 H.261，到 H.262 即MPEG-2，再到 H.263 跟 MPEG-4 是中间过渡的，然后又发展到 H.264，H.264 是现在用得最多的，到 H.265 和最新标准 H.266，一路走来我们通常认为有四代编解器，每一代的发展也差不多历时 8 到 10 年，加起来一共 35 到 40 年的时间。这和移动通信一样，目前视频编码也差不多走到同样的位置，对应的 H.266 出来以后，大家认为视频编解码再往前走到 H.267 的话，是否还继续沿着这个标准和这条单一的演进路线走下去，这是一个有待思考和探索的问题。

（二）编码标准的“垄断”与“领路”

其实，现在的编码标准也分为几条线，早先我们更多还是参考国外的标准或者国际标准为主。这主要是因为我国国起步较晚，那时候很多技术都有时间顺序，很多 ICT 的技术就来自于欧美，我们只能从后向前追赶。国内标准是从大概二十年前产生，近几年开始声音比较大，是国家和电信领域里面认可的标准，现在的代表是 AVS。

值得一提的是，多媒体领域里面有一个特点是华人比较多且他们的能力很强。国内标准能够单独做起来，性能也与国际标准基本保持在同一级，甚至在某些方面还会做得更领先，也是得益于国内外许多华人的推动。特别是在国内，包括腾讯这些公司在这方面投入很大。从这个意义上来说，我们在基础上并不落后，甚至是处在领先地位。在明确赛道的情况下，中国人一般用十年时间可以完成别人要用两三代时间完成的事，目前阶段，我们更希望是我们去领路，让别人跟随中国的步伐。

三、看技术热点，寻多媒体应用

如今，多媒体应用走进了千家万户，在线视频会议办公，短视频娱乐都为我们的工作和生活带来了极大的便利。那么，一场在线视频会议的背后需要怎样的多重技术支撑；RTC 又有哪些充满想象空间的新兴应用场景？让我们跟随宋利老师一探究竟。

（一）多媒体技术推动在线视频会议的兴起

“原本我们预想到视频会议肯定会走到千家万户，但是没有预料到它的发展速度会是如此之快，用户规模如此庞大，而且成为我们日常的刚需。”宋利老师感慨道。

我们上的很多课程是专题性质的，一门课里会有很多专题，比较适合邀请不同专题下面的专家来分别授课，这样不同领域的专家能够为学生提供更为深入的解读，对于这类课程，在线上开一个腾讯视频会议，可以大大节省异地老师的上课时间，比线下教学的可操作性更强。

现在我们学校也是用腾讯会议企业版，腾讯的产品和服务态度都做得很好，得到了师生的认可。学校的课程会统一导入腾讯会议，每天的课程都会按时给老师发送提醒，所有选了课的学生，只要登录后就可以通过在线列表直接加入课程会议，这一点十分方便。

（二）在线视频会议背后的多重技术

视频会议系统是一个很典型且完整的现代多媒体通信系统。现在，我们普遍把它定义成 RTC 类的典型应用，它较流媒体而言在技术上的挑战更大，主要在于视频会议是双向互动的，而非流媒体的单向输出。在线视频会议的背后，其实有着多个技术步骤：

第一阶段是屏幕采集，从老师到学生这一侧是典型的屏幕采集，比如我们上课一般会用笔记本电脑，首先需要捕获屏幕，屏幕捕获包括图像和声音两部分，其中声音还包括屏幕里面的声音，比如播放的视频声音，以及人说话的声音，是按照 30 帧，每秒钟 30 次去抓取画面和声音。

第二阶段是图像处理，在屏幕捕获后便进入处理阶段，包括噪声处理、颜色修正、设备光亮统一、美颜滤镜等，这些我们都称之为图像处理，经过这一步，这就过了一个信号处理的滤波。

第三阶段是编码压缩，在这阶段就进入编码器，音频和视频都会被分开压缩。在压缩过程中，各种编码标准便会开始执行，压缩完毕后便会生成一个音频流和一个视频流。

第四阶段是复用和打包，鉴于音频流和视频流需要传输到网络，所以还有一个复用和打包的环节，将音频流和视频流按照时间排列好，同一个时间的打包到一起，盖一个戳，这便称为复用打包，同时，复用打包也是十分有讲究的，需要根据传输网络的要求，现在多媒体一般是在 IP 网络之上，所以会把它打成 IP 包。

第五阶段是网络分发，打包以后就可以过网络分发了，分发完毕后，无论学生在哪里，只要能够上网，便能从网络上把这个包拿下来。

第六阶段是逆向解包、解复用，剩下的工作就是把包裹拆开，音频和视频都拎出来，对照看看时间是否对准，再把它们按照时间点放到缓存区里面排列好。原来的视频如果是流媒体，我们叫播放器，播放器就会把音频、视频拿出来解码，把音频还原成音频，从二进制还原成信号，视频还原成图像，然后播放。其实 RTC 也一样，视频会议也一样，视频会议不叫播放而叫显示或呈现，也是一样把实时的包抓出来，音频、视频放到显存、声卡里，然后进行解码，到这一步又还原成一幅图像、一个视频。

最后，第七阶段是后处理，对比前面阶段的前处理，最后一步我们对应称之为后处理。因为我们再往前推是显示器，从数字到模拟还有一个适配的过程，所以后处理主要是对于屏幕适配来做一些调色和缩放处理。

腾讯会议作为在线视频会议的典型代表，从用户层面来看，它主要给我三种感受：首先是它简单好用，操作方便。其次是质量高，尤其体现在声音方面，虽然是视频会议，但我们往往更多会关注参会人的声音。腾讯会议的噪声抑制相比以前有了显著提升。最后无疑是稳定性高，依靠腾讯云，腾讯会议能够保障大规模用户的同时在线。

我们做学术的人往往强调的是上限，需要大家发表论文要讲创新性。但我认为做产品则需要稳住下限，毕竟是给千百万人使用的东西，需要花费更大力气来保障下限。把一个东西做出来可能不难，但是要把它做成一个用户规模很大、非常稳定运行的产品则极具挑战性。

（三）RTC 既是娱乐工具，也是生产力

实际上，RTC 不仅仅是单一技术，它还是一个系统。刚才我们提到的编解码，做流媒体用的分发类的编码器跟实时通信的编码器是不一样的要求，比如低时延的很多东西。这两年云游戏、直播等发展得很快，在这背后其实很多技术都跟 RTC 相关，直播里就有运用 RTC 的部分技术，比如腾讯的快直播。大众热议的元宇宙，其实它背后也离不开 RTC，此外，RTC 和工业结合起来布局远程监控、远程操作、远程医疗、远程救护、远程培训，这些应用也会是未来的新兴方向。

毋庸置疑，RTC +各种应用可以影响我们的娱乐、生活、生产、工作，例如，腾讯跟三一智矿公司合作的“自动驾驶+远程操控”的智慧矿山无人化方案便是一个典型的工业应用场景，主要是基于腾讯云实时音视频（TRTC）与 5G 网络融合技术，可以将视频传输时延大幅降低，为矿山作业人员提供更加稳定、流畅、可靠的远程操作体验。

腾讯云特别是视频部分在整个行业里是走在前列的。在视频这块，腾讯云走得最为深入，产品应用很多，且都细化到了解决方案上，比如 TRTC、快直播、流媒体等，针对不同场景都做了优化，这也说明腾讯云在音视频这块做得非常细致，而且里面的技术创新和快速迭代大家也是有目共睹。

从行业角度来说，我期待在现有基础上能有一定升格。我相信在腾讯云产品的迭代更新过程中，本身也会有很多独创的东西非常适合中国，期待腾讯云的创新能在未来升级成行业的标杆或标准。据我了解，腾讯的多媒体实验室也做了很多标准化的工作，我期待未来在这方面能有更多的突破。

四、看未来方向，探多媒体的下一站

随着元宇宙、ChatGPT 等新兴技术不断涌现，与之紧密相关的多媒体的下一站将走向何方，我们该如何把握它的数字化未来呢？追随着宋利老师的视线，我们一起眺望多媒体的未来前景。

其实，从消费者的角度来说，大家对于新技术的关注更多还是在于终端技术，目前手机屏幕占据了我们最多的使用时间，那么在未来，多媒体的下一块屏会在哪里？究竟是头盔，还是眼镜，又或是全息，目前各种探索层出不穷。下一块屏实际上也是下一代终端的原型，它将带动整个行业往前跳跃。

就整个基础链上而言，无论是 XR 还是 VR，我们能感觉到更多的驱动力其实还是来自于终端，终端对应的头端是成像采集、拍照技术、成像技术、声音技术，甚至包括虚拟制造。AR 代表更多的是生成，多媒体内容的生产、生成有很多新花样。以 AI 为代表的内容，元宇宙的虚实结合带来的东西，我觉得会把当前多媒体的很多东西颠覆掉，极大地拓宽多媒体的维度。

例如在过去我们的多媒体其实都是把内容记录下来，尽可能保证真实感。但是现在加入元宇宙、AI，便可以创造出多个虚拟形象，用户还可以和虚拟形象进行互动，即虚实融合、虚实相生，这里有着很大的想象空间。

业界的领袖，包括腾讯提及的全真互联网概念，国外的元宇宙概念，其实都已经给我们的发展指明了方向，这当中的路径可能有快有慢，但方向我个人还是十分认同，它最终的目的就是希望我们能达到更高的体验。

在一个大周期内部是小模块在迭代，到达某一个点后，即是随着破坏性技术的出现，大周期将会突然产生一个大的跳跃，叫做“升维”，会“咔嚓”带动整体往前走一步又再进入循环，往往技术进步就是这样，但它常常是不可预料，突然出现的。背后科研人员也好，行业也好，国家也好，其实我们都没有停下追逐的步伐。

结语

在短短四十年时间里，多媒体技术从破空而来发展到现在应用遍地开花，并还在不断向前突破，正是一代代像宋利老师这样的多媒体“匠心人”，用多年耕耘和持续探索，才让我们今天的视听世界得以如此丰富多彩。TVP 技术指针，下期将继续和你一起，探寻技术真相。

驱动程序为什么要做 WHQL 认证? GDCA SSL证书网络协议网络
驱动程序进行WHQL（WindowsHardwareQualityLabs）认证的核心价值在于解决兼容性、安全性和市场准入三大关键问题，具体必要性如下：️‌一、规避系统拦截，保障驱动可用性‌消除安装警告‌未认证的驱动在安装时会触发Windows的‌红色安全警告‌（如“无法验证发布者”），甚至被系统强制拦截。通过WHQL认证的驱动获得微软数字签名，用户可无阻安装‌。满足系统强制要求‌Windows1
C++ 11 Lambda表达式和min_element()与max_element()的使用_c++ lamda函数 min_element(
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以添加戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！intmain(){vectormyvec{3,
冒泡、选择、插入排序：三大基础排序算法深度解析（C语言实现） xienda 算法排序算法数据结构
在算法学习道路上，排序算法是每位程序员必须掌握的基石。本文将深入解析冒泡排序、选择排序和插入排序这三种基础排序算法，通过C语言代码实现和对比分析，帮助读者彻底理解它们的差异与应用场景。算法原理与代码实现1.冒泡排序（BubbleSort）工作原理：通过重复比较相邻元素，将较大元素逐步"冒泡"到数组末尾。voidbubbleSort(intarr[],intn){ for(inti=0;iarr[
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
配音助手：自媒体神器，内置海量音色的语音，支持多主播配音阿幸软件杂货间媒体
软件介绍内置文字转语音，提供多个主播音色，男声、女声、小孩、方言。支持的场景也是比较多，比如：广告促销、有声读物、广播配音、影视配音、Ai配音等。这个软件是免费的，只不过需要通过手机号码登录就可以使用全部功能了。软件下载夸克下载
npm proxy setting kjndppl [Node.js JavaScript npm https proxy password
清理npmconfigdeletehttp-proxynpmconfigdeletehttps-proxy具体设置步骤如下：1.执行npmconfig后，将看到下一行提示信息npmconfigls-ltoshowalldefaults.2.执行npmconfigls-l后，在一大长串的settign中找出userconfig项(大概位于倒数第4项)[b]userconfig[/b]="C:\\Us
RocketMQ 核心特性实战详解愤怒的代码 RocketMQ实战 rocketmq
RocketMQ核心特性实战详解本文基于RocketMQ4.x+rocketmq-spring-boot-starter2.3.1，从零搭建，逐步讲解RocketMQ11大核心特性，每一段代码都能直接跑。0.项目环境准备依赖引入在pom.xml文件添加：org.apache.rocketmqrocketmq-spring-boot-starter2.3.1配置文件application.ymlse
传统检测响应慢？陌讯多模态引擎提速90+FPS实战 2501_92473147 算法计算机视觉目标检测
开篇痛点：实时目标检测在安防监控中的核心挑战在安防监控领域，实时目标检测是保障公共安全的关键技术。然而，传统算法如YOLOv5或开源框架MMDetection常面临两大痛点：误报率高（复杂光照或遮挡场景下检测不稳定）和响应延迟（高分辨率视频流处理FPS低于30）。实测数据显示，城市交通监控系统误报率达15%，导致安保资源浪费；客户反馈表明，延迟超100ms时，目标跟踪可能失效。这些问题源于算法泛化
AI音乐模拟器：AIGC时代的智能音乐创作革命 lauo 人工智能 AIGC 开源前端机器人
AI音乐模拟器：AIGC时代的智能音乐创作革命引言：AIGC浪潮下的音乐创作新范式在数字化转型的浪潮中，人工智能生成内容（AIGC）正在重塑各个创意领域。音乐产业作为创意经济的重要组成部分，正经历着前所未有的变革。据最新市场研究数据显示，全球AI音乐市场规模预计将从2023年的5.8亿美元增长到2030年的26.8亿美元，年复合增长率高达24.3%。这一快速增长的市场背后，是AI音乐技术正在打破传
【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（Advanced RAG[1]）基于历史对话重新生成Query？ 985小水博一枚呀 AI大模型学习路线人工智能学习 langchain RAG
【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（AdvancedRAG[1]）基于历史对话重新生成Query？【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（AdvancedRAG[1]）基于历史对话重新生成Query？文章目录【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（AdvancedRAG[1]）基于历史对话重新生成Q
【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（Advanced RAG[1]）其他Query优化相关策略？ 985小水博一枚呀 AI大模型学习路线人工智能学习 langchain
【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（AdvancedRAG[1]）其他Query优化相关策略？【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（AdvancedRAG[1]）其他Query优化相关策略？文章目录【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（AdvancedRAG[1]）其他Query优化相关策略？一
LLM中最后一个词语的表征（隐藏状态）通常会融合前面所有词语的信息吗？ ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python 机器学习算法深度学习人工智能
LLM中最后一个词语的表征（隐藏状态）通常会融合前面所有词语的信息吗？在大语言模型（LLM）中，最后一个词语的表征（隐藏状态）通常会融合前面所有词语的信息，这是由LLM的核心架构（以Transformer为基础）决定的，具体可以从以下角度理解：1.核心机制：自注意力（Self-Attention）的作用现代LLM（如GPT系列、Qwen等）均基于Transformer架构，其核心是自注意力机制。在
AI Agent开发学习系列 - langchain之Chains的使用(7)：用四种处理文档的预制链轻松实现文档对话 alex100 AI Agent 学习人工智能 langchain prompt 语言模型 python
在LangChain中，四种文档处理预制链（stuff、refine、mapreduce、mapre-rank）是实现文档问答、摘要等任务的常用高阶工具。它们的核心作用是：将长文档切分为块，分步处理，再整合结果，极大提升大模型处理长文档的能力。stuff直接拼接所有文档内容到prompt，一次性交给大模型处理。适合文档较短、token不超限的场景。refine递进式摘要。先对第一块文档生成初步答案
视频分析：让AI看懂动态画面随机森林404 计算机视觉音视频人工智能 microsoft
引言：动态视觉理解的革命在数字信息爆炸的时代，视频已成为最主要的媒介形式。据统计，每分钟有超过500小时的视频内容被上传到YouTube平台，而全球互联网流量的82%来自视频数据传输。面对如此海量的视频内容，传统的人工处理方式已无法满足需求，这正是人工智能视频分析技术大显身手的舞台。视频分析技术赋予机器"看懂"动态画面的能力，使其能够自动理解、解释甚至预测视频中的内容，这一突破正在彻底改变我们与视
python相关内容二湫默 python 开发语言
1.技术面试题（1）详细描述单调栈的工作原理和应用场景答：工作原理：维护一个栈结构，栈中元素保持单调递增或单调递减的顺序。遍历数据时，新元素入栈前，弹出栈顶所有不满足单调关系的元素，再将新元素入栈，确保栈的单调性。应用场景：解决下一个元素更大的问题，如数组中后面一个元素比前面一个入栈的元素大，则需要上一个元素出栈，然后大的那个元素入栈。（2）详细描述单调队列的工作原理和应用场景答：工作原理：维护队
数据结构：导论梁辰兴数据结构学习笔记数据结构导论算法时间复杂度空间复杂度
目录一，数据结构的研究内容二，基本概念与术语（一）数据、数据元素、数据项与数据对象（二）数据结构（三）数据类型与抽象数据类型️三，抽象数据类型的表示与实现⚙️四，算法与算法分析⚖️（一）算法的定义及特性（二）评价算法优劣的基本标准⏱️（三）算法的时间复杂度（四）算法的空间复杂度章结一，数据结构的研究内容数据结构是计算机科学的核心基础，其研究内容可概括为三大维度：数据组织形式：探索如何将现实世界中的
Python3 内置函数 AI老李 python python
关键要点Python3的内置函数是解释器直接提供的，无需导入即可使用，涵盖数据类型转换、数学操作、序列处理等多种功能。推荐使用官方文档、菜鸟教程和腾讯云开发者社区的中文资源，适合初学者和中级学习者。资源提供详细解释和示例，学习时可结合实际项目实践。简介Python3的内置函数是编程中常用的工具，方便用户快速实现各种操作。以下是几个主要资源，帮助您学习这些函数的用法。资源推荐Python官方文档：内
android去除gps漂移代码,GPS漂移过滤算法扇贝君
GPS漂移过滤算法基本思想：逐点过滤，再经过基础过滤后，进行判断运动状态，静止状态和运动中。如果静止，则使用电子围栏；如果运动，则先过滤大速度，再过滤加速度，然后过滤距离(包括超大距离，和速度相关距离)。对于要过滤的点，采用之前最近的可靠点，进行替换，同时，无效次数+1，如果后面是有效点，则无效次数-1，如果无效次数归0，认为这个点才是真正可靠点(无效次数为正时，都为要被替换的点)。如果遇到不定点
不同行业的 AI 数据安全与合规实践：7 大核心要点全解析观熵人工智能 DeepSeek 私有化部署
不同行业的AI数据安全与合规实践：7大核心要点全解析关键词AI数据安全、行业合规、私有化部署、数据分类分级、国产大模型、隐私保护、DeepSeek部署摘要随着国产大模型在金融、医疗、政务、教育等关键领域的深入部署，AI系统对数据安全与行业合规提出了更高要求。本文结合DeepSeek私有化部署实战，系统梳理当前各行业主流的数据安全合规标准与落地策略，从数据分类分级、访问控制、审计追踪到敏感信息识别与
【Android】安卓四大组件之广播接收器（Broadcast Receiver）：从基础到进阶 m0_59734531 Android android java Boradcast 安卓四大组件
在Android开发中，广播接收器（BroadcastReceiver）是一个非常重要的组件，它能帮助应用接收来自系统或其他应用的事件通知，实现跨组件、跨应用的通信。大家可以把广播接收器想象成一个“收音机”。它的作用是监听系统或应用发出的“广播消息”，并在收到消息后执行相应的操作。（一）基础概念BroadcastReceiver用于监听系统或应用发出的广播事件，实现跨组件通信。其特点是发送方无需关
上位机知识篇---文件系统 Atticus-Orion 上位机知识篇文件系统 windows linux FAT NTFS ext4 ZFS
文章目录前言1.FAT（FileAllocationTable）版本FAT12FAT16FAT32优势兼容性好简单轻量适合小文件存储劣势不支持大文件性能较差缺乏高级功能使用场景2.NTFS（NewTechnologyFileSystem）优势支持大文件和大分区高性能日记功能权限控制劣势兼容性差不适合嵌入式设备使用场景3.exFAT（ExtendedFileAllocationTable）优势支持大
【Android】安卓四大组件之内容提供者（ContentProvider）：从基础到进阶 m0_59734531 Android android Java ContentProvider 安卓四大组件
你手机里的通讯录，存储了所有联系人的信息。如果你想把这些联系人信息分享给其他App，就可以通过ContentProvider来实现。。一、什么是ContentProvider‌ContentProvider‌是Android四大组件之一，负责实现‌跨应用程序的数据共享与访问‌，通过统一接口封装数据存储细节，提供标准化操作方式。其中主要功能包括：数据抽象层：将应用内部的数据（如SQLite数据库、文
深度学习篇---昇腾NPU&CANN 工具包 Atticus-Orion 上位机知识篇图像处理篇深度学习篇深度学习人工智能 NPU 昇腾 CANN
介绍昇腾NPU是华为推出的神经网络处理器，具有强大的AI计算能力，而CANN工具包则是面向AI场景的异构计算架构，用于发挥昇腾NPU的性能优势。以下是详细介绍：昇腾NPU架构设计：采用达芬奇架构，是一个片上系统，主要由特制的计算单元、大容量的存储单元和相应的控制单元组成。集成了多个CPU核心，包括控制CPU和AICPU，前者用于控制处理器整体运行，后者承担非矩阵类复杂计算。此外，还拥有AICore
400多个免费在线编程与计算机科学课程 zhufafa 基础理论课程理论计算机基础免费
来源：medium作者：DhawalShah五年前，麻省理工学院和斯坦福大学等学校首先向公众开放免费的在线课程。如今，全球有700多所学校创造了数以千计的免费在线课程。从入门到精通系列，是作者通过ClassCentral的课程数据库整理的400多个免费在线课程的简介和链接（来源于ClassCentral，一个在线课程搜索引擎），根据课程难度分为入门、进阶和高阶三大类，每门课程还有星级评分（统计自C
STM32F1单片机驱动42步进电机 All right 1 STM32学习单片机 stm32 嵌入式硬件
我们使用的单片机是STM32F103ZET6，电机是42步进电机（额定电流是1A）、驱动是TMC2209；但是暂时使用2160这个外接驱动（注意：2160为大电流电机驱动不能长时间带动这个42电机，否则会发烫烧电机）。开启一个定时器2外设中断：为电机提供步进脉冲；开启三个GPIO口：作为EN、STEP、DIR控制；42步进电机：步距角1.8°、16细分、3200步每圈。一、代码：tim.c:/*U
《C++性能优化指南》 linux版代码及原理解读第一章 v俊逸 C++性能优化指南性能优化 C++性能优化性能优化
概述：目录概述：性能优化的必要性：C++代码优化策略总结用好的编译器并用好编译器使用更好的算法使用更好的库减少内存分配和复制移除计算使用更好的数据结构提高并发性优化内存管理性能优化的必要性：按照当今的CPU运行速度来说，执行一条指令所需要的时间是10的-9次方的时间单位，如此快速的执行速度是否就没有性能优化的必要了呢？其实不然，性能优化与CPU的执行速度并无非常大的关系，试想一下，一段代码，如果用
法律科技领域人工智能代理构建的十个经验教训，一位人工智能工程师通过构建、部署和维护智能代理的经验教训来优化法律工作流程的历程。知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 ai
目录介绍什么是代理人？为什么它对法律如此重要？法律技术中代理用例示例-合同审查代理-法律研究代理在LegalTech中使用代理的十个教训-教训1：即使代理很酷，它们也不能解决所有问题-教训2：选择最适合您用例的框架-教训3：能够快速迭代不同的模型-教训4：从简单开始，必要时扩展-教训5：使用跟踪解决方案；您将需要它-教训6：确保跟踪成本，代理循环可能很昂贵-教训7：将控制权交给最终用户（人在环路中
12 个强大的 DeepSeek AI 提示将彻底改变您的日常生活知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 deepseek
内容写作的最佳提示让我们从写作开始吧。无论您是博主、学生还是社交媒体创作者，这些提示都将帮助您创作出精彩的内容。提示1：“扮演专业文案撰稿人，为[产品/服务]撰写引人注目的广告文案。文案应引人入胜、具有说服力，且字数不得超过100个字。”这使得ChatGPT的响应结构就像真实的广告文案一样。提示2：“以更具吸引力和说服力的方式重写此段落，同时保持含义不变：[插入文本]。”推荐文章《Neo4j上使用
在 Obsidian 中本地使用 DeepSeek — 无需互联网！知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 deepseek
简介您是否想在Obsidian内免费使用类似于ChatGPT的本地LLM？如果是，那么本指南适合您！我将引导您完成在Obsidian中安装和使用DeepSeek-R1模型的确切步骤，这样您就可以在笔记中拥有一个由AI驱动的第二大脑。推荐文章《24GBGPU中的DeepSeekR1：UnslothAI针对671B参数模型进行动态量化》权重1，DeepSeek类《在RaspberryPi上运行语音识别
Llama-Omni会说话的人工智能“语音到语音LLM” 利用低延迟、高质量语音转语音 AI 彻底改变对话方式（教程含源码）知识大胖 NVIDIA GPU和大语言模型开发教程 llama 人工智能 nvidia llm
介绍“单靠技术是不够的——技术与文科、人文学科的结合，才能产生让我们心花怒放的成果。”——史蒂夫·乔布斯近年来，人机交互领域发生了重大变化，尤其是随着ChatGPT、GPT-4等大型语言模型(LLM)的出现。虽然这些模型主要基于文本，但人们对语音交互的兴趣日益浓厚，以使人机对话更加无缝和自然。然而，实现语音交互而不受语音转文本处理中常见的延迟和错误的影响仍然是一个挑战。关键字：Llama-Omni
Js函数返回值 _wy_ js return
一、返回控制与函数结果，语法为：return 表达式;作用: 结束函数执行，返回调用函数，而且把表达式的值作为函数的结果二、返回控制语法为：return;作用: 结束函数执行，返回调用函数，而且把undefined作为函数的结果在大多数情况下,为事件处理函数返回false,可以防止默认的事件行为.例如,默认情况下点击一个<a>元素,页面会跳转到该元素href属性
MySQL 的 char 与 varchar bylijinnan mysql
今天发现，create table 时，MySQL 4.1有时会把 char 自动转换成 varchar 测试举例： CREATE TABLE `varcharLessThan4` ( `lastName` varchar(3) ) ; mysql> desc varcharLessThan4; +----------+---------+------+-
Quartz——TriggerListener和JobListener eksliang TriggerListener JobListener quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208624 一.概述 listener是一个监听器对象，用于监听scheduler中发生的事件，然后执行相应的操作；你可能已经猜到了，TriggerListeners接受与trigger相关的事件，JobListeners接受与jobs相关的事件。二.JobListener监听器 j
oracle层次查询 18289753290 oracle；层次查询；树查询
.oracle层次查询(connect by) oracle的emp表中包含了一列mgr指出谁是雇员的经理，由于经理也是雇员，所以经理的信息也存储在emp表中。这样emp表就是一个自引用表，表中的mgr列是一个自引用列，它指向emp表中的empno列，mgr表示一个员工的管理者， select empno,mgr,ename,sal from e
通过反射把map中的属性赋值到实体类bean对象中酷的飞上天空 javaee 泛型类型转换
使用过struts2后感觉最方便的就是这个框架能自动把表单的参数赋值到action里面的对象中但现在主要使用Spring框架的MVC，虽然也有@ModelAttribute可以使用但是明显感觉不方便。好吧，那就自己再造一个轮子吧。原理都知道，就是利用反射进行字段的赋值，下面贴代码主要类如下： import java.lang.reflect.Field; imp
SAP HANA数据存储：传统硬盘的瓶颈问题蓝儿唯美 HANA
SAPHANA平台有各种各样的应用场景，这也意味着客户的实施方法有许多种选择，关键是如何挑选最适合他们需求的实施方案。在《Implementing SAP HANA》这本书中，介绍了SAP平台在现实场景中的运作原理，并给出了实施建议和成功案例供参考。本系列文章节选自《Implementing SAP HANA》，介绍了行存储和列存储的各自特点，以及SAP HANA的数据存储方式如何提升空间压
Java Socket 多线程实现文件传输随便小屋 java socket
高级操作系统作业，让用Socket实现文件传输，有些代码也是在网上找的，写的不好，如果大家能用就用上。客户端类： package edu.logic.client; import java.io.BufferedInputStream; import java.io.Buffered
java初学者路径 aijuans java
学习Java有没有什么捷径?要想学好Java，首先要知道Java的大致分类。自从Sun推出Java以来，就力图使之无所不包，所以Java发展到现在，按应用来分主要分为三大块：J2SE,J2ME和J2EE,这也就是Sun ONE(Open Net Environment)体系。J2SE就是Java2的标准版，主要用于桌面应用软件的编程；J2ME主要应用于嵌入是系统开发，如手机和PDA的编程；J2EE
APP推广 aoyouzi APP 推广
一，免费篇 1，APP推荐类网站自主推荐最美应用、酷安网、DEMO8、木蚂蚁发现频道等,如果产品独特新颖，还能获取最美应用的评测推荐。PS：推荐简单。只要产品有趣好玩，用户会自主分享传播。例如足迹APP在最美应用推荐一次，几天用户暴增将服务器击垮。 2，各大应用商店首发合作老实盯着排期，多给应用市场官方负责人献殷勤。 3，论坛贴吧推广百度知道，百度贴吧，猫扑论坛，天涯社区，豆瓣（
JSP转发与重定向百合不是茶 jsp servlet Java Web jsp转发
在servlet和jsp中我们经常需要请求,这时就需要用到转发和重定向; 转发包括;forward和include 例子;forwrad转发; 将请求装法给reg.html页面关键代码; req.getRequestDispatcher("reg.html
web.xml之jsp-config bijian1013 java web.xml servlet jsp-config
1.作用：主要用于设定JSP页面的相关配置。 2.常见定义： <jsp-config> <taglib> <taglib-uri>URI(定义TLD文件的URI,JSP页面的tablib命令可以经由此URI获取到TLD文件)</tablib-uri> <taglib-location> TLD文件所在的位置
JSF2.2 ViewScoped Using CDI sunjing CDI JSF 2.2 ViewScoped
JSF 2.0 introduced annotation @ViewScoped; A bean annotated with this scope maintained its state as long as the user stays on the same view(reloads or navigation - no intervening views). One problem w
【分布式数据一致性二】Zookeeper数据读写一致性 bit1129 zookeeper
很多文档说Zookeeper是强一致性保证，事实不然。关于一致性模型请参考http://bit1129.iteye.com/blog/2155336 Zookeeper的数据同步协议 Zookeeper采用称为Quorum Based Protocol的数据同步协议。假如Zookeeper集群有N台Zookeeper服务器(N通常取奇数，3台能够满足数据可靠性同时
Java开发笔记白糖_ java开发
1、Map<key,value>的remove方法只能识别相同类型的key值 Map<Integer,String> map = new HashMap<Integer,String>(); map.put(1,"a"); map.put(2,"b"); map.put(3,"c"
图片黑色阴影 bozch 图片
.event{ padding:0; width:460px; min-width: 460px; border:0px solid #e4e4e4; height: 350px; min-heig
编程之美-饮料供货-动态规划 bylijinnan 动态规划
import java.util.Arrays; import java.util.Random; public class BeverageSupply { /** * 编程之美饮料供货 * 设Opt（V’，i）表示从i到n-1种饮料中，总容量为V’的方案中，满意度之和的最大值。 * 那么递归式就应该是：Opt（V’，i）=max{ k * Hi+Op
ajax大参数（大数据）提交性能分析 chenbowen00 Web Ajax 框架浏览器 prototype
近期在项目中发现如下一个问题项目中有个提交现场事件的功能，该功能主要是在web客户端保存现场数据（主要有截屏，终端日志等信息）然后提交到服务器上方便我们分析定位问题。客户在使用该功能的过程中反应点击提交后反应很慢，大概要等10到20秒的时间浏览器才能操作，期间页面不响应事件。根据客户描述分析了下的代码流程，很简单，主要通过OCX控件截屏，在将前端的日志等文件使用OCX控件打包，在将之转换为
[宇宙与天文]在太空采矿,在太空建造 comsci
我们在太空进行工业活动...但是不太可能把太空工业产品又运回到地面上进行加工,而一般是在哪里开采,就在哪里加工,太空的微重力环境,可能会使我们的工业产品的制造尺度非常巨大.... 地球上制造的最大工业机器是超级油轮和航空母舰,再大些就会遇到困难了,但是在空间船坞中,制造的最大工业机器,可能就没
ORACLE中CONSTRAINT的四对属性 daizj oracle CONSTRAINT
ORACLE中CONSTRAINT的四对属性 summary:在data migrate时,某些表的约束总是困扰着我们,让我们的migratet举步维艰,如何利用约束本身的属性来处理这些问题呢?本文详细介绍了约束的四对属性: Deferrable/not deferrable, Deferred/immediate, enalbe/disable, validate/novalidate,以及如
Gradle入门教程 dengkane gradle
一、寻找gradle的历程一开始的时候，我们只有一个工程，所有要用到的jar包都放到工程目录下面，时间长了，工程越来越大，使用到的jar包也越来越多，难以理解jar之间的依赖关系。再后来我们把旧的工程拆分到不同的工程里，靠ide来管理工程之间的依赖关系，各工程下的jar包依赖是杂乱的。一段时间后，我们发现用ide来管理项程很不方便，比如不方便脱离ide自动构建，于是我们写自己的ant脚本。再后
C语言简单循环示例 dcj3sjt126com c
# include <stdio.h> int main(void) { int i; int count = 0; int sum = 0; float avg; for (i=1; i<=100; i++) { if (i%2==0) { count++; sum += i; } } avg
presentModalViewController 的动画效果 dcj3sjt126com controller
系统自带(四种效果)： presentModalViewController模态的动画效果设置： [cpp] view plain copy UIViewController *detailViewController = [[UIViewController al
java 二分查找 shuizhaosi888 二分查找 java二分查找
需求：在排好顺序的一串数字中，找到数字T 一般解法：从左到右扫描数据，其运行花费线性时间O(N)。然而这个算法并没有用到该表已经排序的事实。 /** * * @param array * 顺序数组 * @param t * 要查找对象 * @return */ public stati
Spring Security（07）——缓存UserDetails 234390216 ehcache 缓存 Spring Security
Spring Security提供了一个实现了可以缓存UserDetails的UserDetailsService实现类，CachingUserDetailsService。该类的构造接收一个用于真正加载UserDetails的UserDetailsService实现类。当需要加载UserDetails时，其首先会从缓存中获取，如果缓存中没
Dozer 深层次复制 jayluns VO maven po
最近在做项目上遇到了一些小问题，因为架构在做设计的时候web前段展示用到了vo层，而在后台进行与数据库层操作的时候用到的是Po层。这样在业务层返回vo到控制层，每一次都需要从po-->转化到vo层，用到BeanUtils.copyProperties(source, target)只能复制简单的属性，因为实体类都配置了hibernate那些关联关系，所以它满足不了现在的需求，但后发现还有个很
CSS规范整理（摘自懒人图库） a409435341 html UI css 浏览器
刚没事闲着在网上瞎逛，找了一篇CSS规范整理，粗略看了一下后还蛮有一定的道理，并自问是否有这样的规范，这也是初入前端开发的人一个很好的规范吧。一、文件规范 1、文件均归档至约定的目录中。具体要求通过豆瓣的CSS规范进行讲解：所有的CSS分为两大类：通用类和业务类。通用的CSS文件，放在如下目录中：基本样式库 /css/core
C++动态链接库创建与使用你不认识的休道人 C++dll
一、创建动态链接库 1.新建工程test中选择”MFC [dll]”dll类型选择第二项"Regular DLL With MFC shared linked"，完成 2.在test.h中添加 extern “C” 返回类型 _declspec(dllexport)函数名(参数列表); 3.在test.cpp中最后写 extern “C” 返回类型 _decls
Android代码混淆之ProGuard rensanning ProGuard
Android应用的Java代码，通过反编译apk文件（dex2jar、apktool）很容易得到源代码，所以在release版本的apk中一定要混淆一下一些关键的Java源码。 ProGuard是一个开源的Java代码混淆器（obfuscation）。ADT r8开始它被默认集成到了Android SDK中。官网： http://proguard.sourceforge.net/
程序员在编程中遇到的奇葩弱智问题 tomcat_oracle jquery 编程 ide
　　现在收集一下：　　排名不分先后，按照发言顺序来的。 1、Jquery插件一个通用函数一直报错，尤其是很明显是存在的函数，很有可能就是你没有引入jquery。。。或者版本不对 2、调试半天没变化：不在同一个文件中调试。这个很可怕，我们很多时候会备份好几个项目，改完发现改错了。有个群友说的好：在汤匙
解决maven-dependency-plugin (goals "copy-dependencies","unpack") is not supported xp9802 dependency
解决办法：在plugins之前添加如下pluginManagement，二者前后顺序如下： [html] view plain copy <build> <pluginManagement