Linux????? Mr.Liyz

上交AI研究院副院长马利庄：基于大数据的人脸识别技术进展与展望

文章发布于公号【数智物语】（ID：decision_engine），关注公号不错过每一篇干货。

转自 | 中国人工智能学会

本篇大家整理的是来自上海交通大学人工智能研究院副院长、华东师范大学特聘教授，国家杰出青年基金获得者马利庄主题为《基于大数据的人脸识别技术进展与展望》的精彩演讲。马院长参与了腾讯优图人脸识别、微众银行刷脸验证、商汤3D人体姿态估计等项目，具有丰富的理论和实践经验。

马利庄

上海交通大学人工智能研究院副院长、华东师范大学特聘教授，国家杰出青年基金获得者

以下内容根据速记进行整理，经过马利庄本人校对。

我汇报提纲包括七个内容。首先回顾一下过去十几年发生的事情。一个是数字化时代兴起，它催生了互联网，这是我们时代的主流大趋势。许多的产业，像数字媒体业，数字相机，VR/AR的技术兴起。当然我们也知道伴随着一些行业的衰落，像胶卷等一些传统的行业。早的时候，我们计算机还有很多的硬盘拷贝等等，这些现在都没有了。就是因为数字化的时代催生了互联网的时代。

我们刚才看到动动三维这个创意设计，里面也把一些创意工作放在网上去了，数字化，利用图形图像技术来展现。互联网时代催生了大数据。我们知道有众多的新媒体产生，如微信，几乎每个人都在使用，平均花2个小时到3个小时，都是数据的使用者，同时也是产生者，自然形成了社交大数据。微信不仅是社交的工具，也是一个工作的工具；同时成为了一个游戏，这是个深刻改变了人们生活形态的互联网时代。同样，有一些产业衰落。我们看到街头的小商店，小商品市场不景气。我印象最深刻的是义乌的小商品市场，现在日子很不好过。

互联网以及伴随产生的大数据催生了人工智能时代！人工智能有三个要素：

一个是大数据，有大数据作为原料；

第二个是计算能力，主要是GPU与CPU等；

最后是核心的算法，深度学习/卷积神经网络算法。

我1992年在浙大人工智能研究所做博士后，当时跟何志均先生，潘云鹤教授是人工智能研究所的所长，那时就研究人工智能，但三起三落，人工智能的发展是螺旋式演进的。当时人工智能的发展为什么非常曲折和起伏，原因主要是缺少一个大数据的原料，缺少大量的算力，同时缺少深度学习等卷积神经网络新算法。当时计算能力限制，算法处理不了现在大量复杂的数据或者大数据。像人脸识别的深度学习算法，需要要标注数据，我们与腾讯的优图人脸项目中，用了近百万级别的人脸标注。在当时九十年代，这是难以想象的规模。

当时有软盘，只有1兆多，现在一幅超高清的图像都是几兆数据，甚至更高。我们做AI+医疗的研究，分析肿瘤的病理切片。一张图片有上百兆数据，包括深度学习时涉及的相关参数，算法实现过程显示内存很可能不够。

人工智能时代催生智能手机，智能安防，智能社区，智能语音与机器人等。在座的各位比较幸运，因为人工智能时代中长久兴旺的是软件行业，创意创新。智能创意不可能被AI替代。但目标明确，规则清晰的行业就非常可能被AI替代。

9亿的微信用户，每天有10多亿的图像和视频数据传输。阿里巴巴改写了商业版图，伴随大数据，人工智能兴起。在座的可能在股市中投资，过去几年，NVDIA和AMD的股价涨了十倍，重要的因素是AI对计算能力的需求大幅增长，当然另外的原因是比特币和区块链的热潮中，大量挖矿对算力的海量需求。

互联网的极速发展，自然汇聚了可视媒体大数据。这些信息的增长改变了我们的生活方式，例如社交网络中的微信。当然也有挑战，大数据体量已经超越了现有的硬件处理条件，比如说存储空间，和计算资源的不足。我们认为该领域的科学问题包括：数据的高效表达，智能的处理以及结构化，深度学习与感知理论，基于视觉感知的失真度量，不确定环境下的任务感知与理解等。

现在有理论研究证明深度学习模型合适条件下可以收敛到全局最优解。这是目前为止深度学习中最新的一个理论成果。我们在座各位要重视。以前我们调侃各种深度学习模型重要的是调参数，有人运气好，会调出好的结果，但现在有理论依据和保障。

技术的突破源于需求。城市大数据，有很多交通、环境的感知数据等。金融大数据，阿里、腾讯、百度都有积极的介入，希望提升运用效率和结构效率。互联网金融中，还有所谓的万物互联；徐教授也讲了，不光是视觉，听觉，还有嗅觉，味觉等等相关的感知数据。将人、路由器，服务器，业务系统等等作为研究对象，以网络地图的方式实现网络空间态势感知，服务于网络***战。这就是斯诺登揭示的棱镜项目。

回到主题，智慧城市以人为中心，我们人工智能是要保障个体的信息安全，提高人的生活质量，让生活更美好。2010年世博会，上海提出城市让生活更美好，非常符合我们智慧城市的总体目标。个体信息安全就涉及到身份的认证和门禁、监控等。所以人脸识别和行为姿态识别是关键技术。

现在讲一个比较形象的术语就是刷脸技术。很多人都知道，早几年的时候，我们跟腾讯合作研发微众银行的刷脸技术，微众银行只需一个总部即可，不像工商银行一样有几万的分支机构。它只要一个总部，其业务都可以通过远程核身和身份认证可以实现。当时总理亲历了刷脸技术过程。刷脸验证，出租司机获得了3.5万元的贷款。这是微众银行的第一笔互联网银行的放贷业务。

互联网人脸识别技术跟传统银行不同。银行里面我们知道有“三亲”原则。这是互联网金融这块必须考虑的问题，亲见申请人本人，亲核申请人×××原件，亲见申请人本人签字。我们可以通过远程核身技术做到。

传统的方法是人工成本高。刚才讲的刷脸技术用于银行中的互联网金融，刷脸准确率99.9%还是不够。生物识别技术有很多种，我们要融合多元特征，例如脸部表情、声音或声纹，还有人脸的特征，提高身份远程核身的可靠性和准确率。人脸识别是最为自然的交互技术，现在可以做到非常高的精度。我们知道让你按一个手印，可能你感觉像罪犯，因为身体的接触，很多人比较忌讳。目前人脸识别技术有门槛。我们跟腾讯优图合作来，在LFW数据集上可以达到99.65%和99.8%。

人脸识别技术挑战与难点，主要是图像的采集质量；其次是光照环境和姿态。因为识别分为主动式和被动式；金融支付里面是人会主动配合采集设备，图像质量和人脸姿态好。这种情形，识别率可以达到99%。但很多时候，人脸会在不同的光照条件下，产生大的差异，比如说昨天晚上我们部分智能创意与数字艺术的专委会人员合影的时候，背影强光，人脸拍出来就很暗，姿态也各异等等。还有年龄跨度问题等。×××有效期有15年或20年。还有院士说猪脸的识别，猪脸状态是短暂的，或者快速变化的，因为生长周期一般只有半年，其识别率会大大下降。我们知道蜡像，外形几乎跟你做的一模一样。当然蜡像缺乏脸部表情，让他对话就露馅了。我们捕捉脸部表情的微变化这个就可以防御有人用它来欺骗***系统。

目前我们的研究方向包括深度学习技术，基于人脸物理性质的推理和人脸语义或表情的推理；人脸监测，特征跟踪，跨年龄的人脸识别，以及三维人脸识别。我们重点攻克三维人脸识别。一张正面的照片，可以生成一张逼真的三维人脸。

活体检测可以真正提高我们这个识别系统的安全性。有的公司号称是采用人脸识别技术，其实用一张大照片就能通过验证。这说明他们没有采用活体检测，也没有用三维光照变化的信息，以及综合人脸表情、声纹来辨别真假。

下面我讲讲互联网金融视频监控中取得的进展。

大的框架，我们看看人脸识别上面。这是我们跟腾讯的优图组一起合作，基于腾讯云平台和相关的人脸识别技术。2014年的时候，在FDDB数据集上人脸检测达到了世界第一，人脸识别率在LFW数据集上刷新世界纪录99.65%。采用的主要是标注大量的人脸图片与非人脸图片的数据（近百万级别）。这在20年以前是难以想象的。腾讯优图有很多的实习生，认真的标注。我们采用VIOLA-Jones瀑布流框架的算法优化。

大规模小人脸的检测方面。这张照片里面人脸数目上千。计算机视觉算法可以识别超860个人脸。以前的方法是无法想象的。一般的人能够识别到两百多个，已经非常很难。主要是用的这个DSFD人脸检验算法，包括了特征增强模块、分层锚点渐进式LOSS的算法。

根据人脸识别的身份认证。我们用百万级人脸数据库训练，多个数百层深度学习模型集成。目前有一个权威数据集MegaFace，我们项目组取得了83.29%的准确率，位列榜首。我们提出了新的光线活体提高识别方法的安全性。大家知道安全性非常重要，真正用于安全监控以及公安系统的时候，不光是识别人脸模型，还要考虑防伪和防***。我们这次进博会刷脸系统应用，每天差不多30万人进出场馆。我们知道6位的金融密码，其实试一百万次就一定有你正确的密码。30万人中，脸长得非常像的概率是很大的，特别是有些双胞胎，很难识别。我们要用到多生物特征技巧，达到安全、简便、高速、通用等要求。

安防监控里面，我们需要找到不同摄像头里的同一个人物。我们以前出了事情后期检验，看问题在哪；现在要同步进行。该任务下一个路径到哪一个地方等等。人的姿态会有很大差异，同一个人的姿态变化也很多。人体重识别方面，我们在三个主流数据上获得第一。主要方法是通过了多任务交替训练，基于分块的金字塔模型。

我们与商汤也是开展了这方面的合作，跟腾讯的合作已经七年多。人体跟踪方面，追踪视频中行人并对其运动轨迹做出预判。项目组的人体跟踪技术，在权威测评MOT challenge上取得了两项记录。采用的技术方法，包括基于图匹配模型的目标关联算法，基于有效动态差分的运动相似度计算算法，以及基于行人再识别技术的特征相似度模型等。还有其他的应用，基于深度学习的人脸识别技术，以及颜值测算，可用于社交娱乐。

我们前年的时候，用了1300台服务器，每天1亿人脸计算平台。还有天天P图，人脸美化等分析技术。

我们跟商汤合作开展3D人体姿态估计。通过单张图片，估计人体的姿态模型。基于二维图像序列估计3D人体姿态是非常实用的。在最大的人体姿态数据集Human3.6M上，我们取得三项指标第一。这个成果还在保密阶段，主要是对人体的快速估计。还有像素级别的语义分割，GTAV和SYNTHIA数据集作为源数据集，Cityscape作为目标数据集，相关的指标Mean IoU提高10个百分点。还有一个是预测RGB图片上每个像素对应位置的深度值。该项研究非常重要。我们在座的肯定有很多搞创意设计，会涉及到二维三维的。我想做个革命性预测，因为有了深度相机以后，基于很好的三维重构技术将来每个普通的人都可以生成三维的场景；普通人拍一段视频就能生成三维的，自然形成海量的三维动画视频数据，这是未来大发展方向。

我很简单的讲一下视觉无损压缩技术。基于人类的视觉特性，对图像进行极限程度的压缩。只要人的视觉感受不出差别，我们对其做一个最大程度的压缩，非常实用。我们在2014年的时候，就处理了1200亿张图片的压缩。这个例子中，左边是3M，右边是700多K，但是肉眼分辨不出哪一个是原始图像。还有相关研究如自动上色和风格化。中国传统文化中有所谓的面像学。相由心生，从大数据的概念，从面部特征包括耳垂，眼眉间距等，找出相关的统计规律。人脸配准和识别可以用于望诊。我们跟上海儿童医学研究院做一个儿童罕见遗传基因缺损症研究项目。例如唐氏综合症，我诧异的是什么呢？两个儿童得了某种基因缺损症，他们没有任何血缘关系，但是脸部的共同特征非常明显。我做基因检测，有将近两千多种的基因缺损症，这个太费钱费时。我用照片筛选一下，判断一下你的某一个基因可能是缺损的，那么再去做对应的DNA检测。

中医四诊望闻问切，是辨证论治，可采用典型的专家系统方法。比较重要的应用需求就是眼底黄斑病变的AI算法。到了一定年龄以后，人眼普遍会有一定的问题。信息社会，人的视觉消耗太大了。每天手机屏幕那么小，我们在眼底黄斑定位上取得了一个比赛的第一。肺病诊断方面的重大应用需求。现在非常明确的事实，通过AI+医疗智能化算法判别的准确率，比专家级医生提高10多个百分点。我是比较乐观的，计算机AI算法一定会超过专家医生的水平，高精尖的医生永远需要，但工作强度大大降低。

大数据和强大的算力使得深度学习技术有了用武之地。国家对人工智能的期望非常大，我们的压力也很大，到底有多少人工智能的产业能够落地。我想计算机视觉有很多落地的重大应用，也包括部分自然语言处理方面的技术。

人工智能重大需求，一个是纯的互联网银行；第二个是智能安防与公共安全。智慧城市中的异常检测，复杂的场景下的身份认证和行为识别等需要研究。还有一个是新的获取手段，包括深度数码相机。刚才讲的智能动画创作，大众化的创意设计，人工智能+AR/VR。创意设计是我们这个大会的主题之一，这块将有大的进展。总之人工智能不变的是挑战和机遇。

转载于:https://blog.51cto.com/14143343/2369330

基于大数据的商品推荐系统的设计与实现 JAVA编码选手个人作品案例展示分享大数据 spring boot maven vue.js 后端 javascript
摘要在当今互联网时代，随着电子商务的快速发展，各行各业都面临着海量数据的挑战和机遇，电子商务极大地改变了商业运作的方式，为消费者和企业带来了前所未有的便利和机会。该毕业设计以京东商品数据为来源，设计与实现基于大数据的电商商品推荐系统。通过对电商商品数据进行深度挖掘，可以发现消费趋势、产品热门度、价格以及地区差异等信息，为市场营销和产品策略提供重要参考。利用Java语言及SpringBoot框架、M
【机器学习】多模态AI——融合多种数据源的智能系统 2的n次方_ 人工智能
随着人工智能的快速发展，单一模态（如文本、图像或语音）已经不能满足复杂任务的需求。多模态AI（MultimodalAI）通过结合多种数据源（如文本、图像、音频等）来提升模型的智能和表现，适用于多样化的应用场景，如自动驾驶、医疗诊断、跨语言翻译等。一、多模态AI简介多模态AI是一种将不同形式的数据（如文本、图像、音频等）融合在一起的技术，旨在让模型从多个维度感知和理解信息。这种融合使得AI系统能够从
Python OpenAI 库开发指南：从入门到实战精通 senger_lcc python 开发语言
在人工智能（AI）领域，OpenAI无疑是全球最受瞩目的机构之一。它推出的GPT系列模型、DALL·E等创新技术，正在深刻改变各行各业。作为Python开发者，我们该如何快速上手并高效利用OpenAI的API，成为了提升个人竞争力的关键。本文将带你从零开始，深入解析Python语言中的openAI库，助你掌握AI开发的核心工具，成为AI领域的专家。一、什么是openAI库？它能为开发者带来什么？1
Python3.13来了！编程爱好者必看 Python之栈人工智能 python 开发语言
Python3.13于近期发布，其中包含大量重要更新。Python作为机器学习、数据科学和人工智能领域使用最广泛的编程语言，一直在不断发展，以满足这些领域日益增长的需求。最新发布的Python3.13提供了多项具有影响力的改进，旨在提高性能和生产力，对于从事ML和AI项目的开发人员来说是一个重要的里程碑。Python在ML和AI领域的主导地位主要归功于它的简单性、广泛的库支持和庞大的社区。然而，随
Python 操作 Elasticsearch 全指南：从连接到数据查询与处理 XMYX-0 python elasticsearch jenkins
文章目录Python操作Elasticsearch全指南：从连接到数据查询与处理引言安装`elasticsearch-py`连接到Elasticsearch创建索引插入数据查询数据1.简单查询2.布尔查询更新文档删除文档和索引删除文档删除索引批量插入数据处理分页结果总结Python操作Elasticsearch全指南：从连接到数据查询与处理引言在大数据分析与搜索应用中，Elasticsearch是
人工智能之数学基础：一个小例子帮你快速搞懂极大线性无关向量组每天五分钟玩转人工智能机器学习深度学习之数学基础人工智能线性代数机器学习极大线性无关向量组深度学习神经网络
本文重点在上一节课程中，我们学习了线性相关和线性无关。当线性相关的时候，那么说明这组向量至少存在一个向量可以被其它向量给表示，可以被表示就说明这个向量就是可有可无的，可以被替代的，这里就涉及到极大线性无关向量组的概念了，本文对此进行学习。极大无关向量组的定义与性质定义在线性空间中，如果存在一个向量组，它满足以下两个条件：一是它本身是线性无关的；二是向量空间中的任何包含它的向量组，如果仍然保持线性无
个人职业发展与AI赋能的前端开发前端
在瞬息万变的科技浪潮中，个人职业发展显得尤为重要。对于前端开发者而言，如何提升自身竞争力，适应日新月异的技术革新，是持续关注的核心问题。而近年来，人工智能（AI）技术的飞速发展，特别是AI代码生成器的兴起，正深刻地改变着前端开发的格局，为开发者们提供了前所未有的机遇。本文将以ScriptEcho为例，探讨AI技术如何赋能前端开发，助力个人职业发展。市场趋势与个人技能提升当前市场对前端开发人才的需求
代码重构的革命：AI代码生成器如何改变游戏规则前端
在软件开发的世界里，代码重构是一项既重要又艰巨的任务。繁琐的重复性工作、低下的效率以及难以避免的错误，常常让开发者们疲惫不堪。然而，随着人工智能技术的飞速发展，智能化代码重构的时代已经到来，而AI代码生成器正成为这场革命的核心驱动力。代码重构的挑战：一个开发者的心声传统的代码重构过程充满了挑战。想象一下，你需要将一个庞大的、混乱的代码库改造成模块化、易于维护的结构。这需要你花费大量的时间去理解现有
Python 3.13性能大提升：免费多线程时代来临敖行客 Allthinker python java 开发语言爬虫
在编程的世界里，Python一直以其简洁、易读和强大的功能而备受青睐。随着技术的不断进步，Python的每一个新版本都带来了新的惊喜和改进。而Python3.13无疑是其中的一颗璀璨明星。在一个数据驱动的世界里，Python已经成为了一种无处不在的编程语言，它的性能和功能的提升始终是开发者们关注的热点。随着大数据、人工智能、云计算等技术的飞速发展，对编程语言性能的要求也在不断提高。在这样的背景下，
分布式存储的技术选型之HDFS、Ceph、MinIO对比 Linux运维老纪勇敢向前迎接运维开发之挑战分布式 hdfs ceph 云原生运维开发大数据云计算
分布式存储的技术选型比：HDFS、Ceph、MinIO对比一文读懂分布式存储在当今数字化时代，数据呈爆炸式增长，分布式存储技术应运而生，成为大数据存储与管理的得力助手。它将数据分散存于多台独立设备，构建起一个庞大而可靠的虚拟存储体系，有效突破了传统集中式存储的性能瓶颈，大幅提升了可靠性、可用性及存取效率，轻松应对海量数据的存储挑战。分布式存储的应用场景极为广泛。在大数据处理领域，如互联网公司应对海
基于hadoop的协同过滤算法电影推荐系统的设计与实现 AI天才研究院大数据AI人工智能 AI大模型企业级应用开发实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
基于hadoop的协同过滤算法电影推荐系统的设计与实现文章目录基于hadoop的协同过滤算法电影推荐系统的设计与实现1.背景介绍1.1电影推荐系统的重要性1.2传统推荐系统的缺陷1.3Hadoop在大数据处理中的作用2.核心概念与联系2.1协同过滤算法2.2基于用户的协同过滤2.3基于项目的协同过滤2.4Hadoop在协同过滤算法中的应用3.核心算法原理具体操作步骤3.1基于用户的协同过滤算法流程
Java 驱动大数据流处理：Storm 与 Flink 入门（大数据）用心去追梦大数据 java storm
Java是一种广泛使用的编程语言，特别适用于企业级应用开发。随着数据量的不断增长，处理大数据流成为了现代软件开发中的一个重要领域。ApacheStorm和ApacheFlink是两个用于处理大规模数据流的开源框架，它们都支持用Java编写的应用程序。下面将简要介绍这两个框架，并提供一些入门指导。ApacheStormApacheStorm是一个免费、开源的分布式实时计算系统。Storm让用户能够轻
【人工智能 | 大数据】基于人工智能的大数据分析方法用心去追梦人工智能大数据数据分析
基于人工智能（AI）的大数据分析方法是指利用机器学习、深度学习和其他AI技术来分析和处理大规模数据集。这些方法能够自动识别模式、提取有用信息，并做出预测或决策，从而帮助企业和组织更好地理解市场趋势、客户行为以及其他关键因素。以下是几种主要的基于AI的大数据分析方法：机器学习模型：通过训练算法让计算机从历史数据中学习并做出预测或分类。常见的机器学习技术包括监督学习（如回归分析、支持向量机）、非监督学
基于MATLAB机器学习、深度学习实践技术应用梦想的初衷~ 机器学习人工智能 matlab 机器学习深度学习
近年来，MATLAB在机器学习和深度学习领域的发展取得了显著成就。其强大的计算能力和灵活的编程环境使其成为科研人员和工程师的首选工具。在无人驾驶汽车、医学影像智能诊疗、ImageNet竞赛等热门领域，MATLAB提供了丰富的算法库和工具箱，极大地推动了人工智能技术的应用和创新。原文链接https://mp.weixin.qq.com/s?__biz=Mzg2NDYxNjMyNA==&mid=224
ChatGPT搜索漏洞：AI代码生成器安全隐患及应对策略前端
近年来，随着人工智能技术的飞速发展，各种AI代码生成器层出不穷，为程序员带来了极大的便利。然而，技术进步的同时也伴随着安全风险的提升。最近，OpenAI的ChatGPT搜索工具曝出重大安全漏洞，引发了业界广泛关注。本文将深入探讨该漏洞的细节、影响以及应对措施，并展望未来AI工具安全发展趋势。ChatGPT作为一款强大的AI工具，其搜索功能本意是帮助用户快速获取信息。然而，英国卫报近期报道揭露了Ch
大数据组件之Azkaban简介努力的小星星大数据 linux 运维数据结构
一、Azkaban介绍1.1背景一个完整的大数据分析系统，必然由很多任务单元(如数据收集、数据清洗、数据存储、数据分析等)组成，所有的任务单元及其之间的依赖关系组成了复杂的工作流。复杂的工作流管理涉及到很多问题：如何定时调度某个任务？如何在某个任务执行完成后再去执行另一个任务？如何在任务失败时候发出预警？......面对这些问题，工作流调度系统应运而生。Azkaban就是其中之一。1.2功能Azk
分析-MQ消息队列中间件-在IM即时通讯系统的用途酱油瓶啤酒杯中间件分布式队列 kafka
MQ消息队列在IM即时通讯的用途1）用户聊天消息的离线存储环节：因为IM消息的发送属于高吞吐场景，直接操作DB可能会让DB崩溃，所有离线消息在落地入库前，可以先扔到MQ消息队列中，再由单独部署的消费者来有节奏地存储到DB中；２)用户的行为数据收集环节：因为用户的聊天消息和指令等，可以用于大数据分析，而且基于国家监管要求也是必须要存储一段时间的，所以此类数据的收集同样可以用于MQ消息队列，再由单独部
2024年最全（一）大数据---Hadoop整体介绍（架构层）----（组件，并发知识体系大全 2401_84586689 程序员大数据 hadoop 架构
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化资料的朋友，可以戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！Hadoop方案一、大数据介绍============
数据分析基础定义阿金要当大魔王~~ 数据分析数据分析数据挖掘
一、大数据的定义数据分析是基于商业等目的，有目的的进行收集、整理、加工和分析数据，提炼有价值信息的过程。大数据分析即针对海量的、多样化的数据集合的分析大数据分析是一种利用大规模数据集进行分析和挖掘知识的方法。随着互联网、社交媒体、移动设备等产生庞大的数据，大数据分析成为了当今世界各行业的重要技术。这篇文章将从数据收集、存储、处理、分析、可视化、应用等方面进行全面讲解，以帮助读者更好地理解大数据分析
大数据学习(36)- Hive和YARN viperrrrrrr 大数据学习 hive
&&大数据学习&&系列专栏：哲学语录:承认自己的无知，乃是开启智慧的大门如果觉得博主的文章还不错的话，请点赞+收藏⭐️+留言支持一下博主哦当客户端提交SQL作业到HiveServer2时，HiveServer2会根据用户提交的SQL作业及数据库中现有的元数据信息生成一份可供计算引擎执行的计划。每个执行计划对应若干MapReduce作业，Hive会将所有的MapReduce作业都提交到YARN中。Y
深入解析如何进行TensorFlow框架下的算子开发与适配插件开发：基于昇腾AI的完整流程快撑死的鱼华为昇腾 Ascend C的算子开发系统学习人工智能 tensorflow python
深入解析如何进行TensorFlow框架下的算子开发与适配插件开发：基于昇腾AI的完整流程在人工智能领域中，算子（Operator）作为深度学习模型的基础执行单元，决定了整个模型的计算性能和结果准确性。随着硬件平台的多样化，如何将第三方深度学习框架中的算子适配到特定的硬件平台变得至关重要。本文将深入探讨如何在TensorFlow框架下开发适配昇腾AI处理器的算子插件，通过解析算子属性映射、数据排布
大数据分析专业毕业设计最新最全选题精华汇总--持续更新中⑤ 源码空间站11 python django 大数据分析数据可视化 hadoop hive 大数据分析毕设
目录前言开题指导建议更多精选选题选题帮助最后前言大家好,这里是源码空间站学长大数据分析专业毕业设计毕设专题!大四是整个大学期间最忙碌的时光，一边要忙着准备考研、考公、考教资或者实习为毕业后面临的升学就业做准备,一边要为毕业设计耗费大量精力。学长给大家整理了大数据分析专业最新精选选题，如遇选题困难或选题有任何疑问，都可以问学长哦(见文末)!以下是学长精心整理的一些选题:21.基于Hadoop和Spa
使用Sui索引框架支持自定义数据导入 Sui_Network 数据库 web3 大数据区块链网络云计算
Sui索引框架通过强大的数据导入框架提供对Sui链上数据的定制化访问。它允许任何相关软件，无论是在链上还是链下运行，收集原始链上数据和派生数据。利用Sui索引框架创建定制的数据流，开发者可以轻松构建响应链上事件的软件和产品。链上数据流的强大之处区块链数据结构旨在确保交易的完整性，这通常意味着它们没有针对整个历史的随机数据访问进行优化。然而，使用Sui索引框架构建的定制化数据流克服了这一限制，使开发
Python从0到100（八十三）：神经网络-使用残差网络RESNET识别手写数字是Dream呀 python 神经网络网络
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学习学习和学业的先行者！欢迎大家订阅专栏：零基础学Python：Python从0到100最新
解锁辅助驾驶新境界：基于昇腾 AI 异构计算架构 CANN 的应用探秘倔强的石头_ AIGC 人工智能架构
博客主页：倔强的石头的CSDN主页Gitee主页：倔强的石头的gitee主页⏩文章专栏：《AI大模型》期待您的关注目录一、引言二、CANN是什么1.异构计算与人工智能的关系2.CANN的定义和作用3.CANN的技术优势三、基于CANN的辅助驾驶AI应用原理1.目标检测算法2.智能检测流程3.算力平台支持四、基于CANN的辅助驾驶AI优势1.高效训练2.精准检测3.快速编程4.产业应用五、部署实操六
探秘IO分布式模块设计：让大数据处理更高效清水湾落车分布式
一、引言随着互联网的飞速发展，大数据、云计算、人工智能等技术逐渐成为时代的主流。在这个数据爆炸的时代，如何高效地处理海量数据成为企业面临的重大挑战。IO分布式模块设计作为一种有效的解决方案，越来越受到关注。本文将带您了解IO分布式模块设计的基本概念、原理及其在实际应用中的优势。二、什么是IO分布式模块设计？IO分布式模块设计，是指将数据存储、数据处理、数据传输等IO操作进行分布式处理的一种设计方法
大带宽业务都包含哪些内容？ wanhengidc 服务器运维
大带宽服务器通常是指100Mbps以上的服务器，让企业能够快速稳定的传输数据信息，其中大带宽业务就是指需要高速数据传输和处理能力的业务，一般会包含对大量数据的传输和存储，需要高带宽的网络连接来支持。大带宽业务具体都包含了哪些方面呢？大带宽业务包括大规模数据传输、云计算和远程存储等内容，大规模数据传输是涉及到大文件的传输或者是大数据集的传输。同时在云计算中会涉及到云服务器和虚拟化环境的应用，需要有着
【人工智能】Python实战：构建高效的多任务学习模型蒙娜丽宁 Python杂谈 AI 人工智能 python 学习
《PythonOpenCV从菜鸟到高手》带你进入图像处理与计算机视觉的大门！解锁Python编程的无限可能：《奇妙的Python》带你漫游代码世界多任务学习（Multi-taskLearning,MTL）作为机器学习领域中的一种重要方法，通过在单一模型中同时学习多个相关任务，不仅能够提高模型的泛化能力，还能有效利用任务间的共享信息。本文深入探讨了多任务学习的基本概念、优势及其在实际应用中的重要性。
以Python构建ONE FACE管理界面：从基础至进阶的实战探索 Allen_LVyingbo python python pyqt
一、引言1.1研究背景与意义在人工智能技术蓬勃发展的当下，面部识别技术凭借其独特优势，于安防、金融、智能终端等众多领域广泛应用。在安防领域，可助力监控系统精准识别潜在威胁人员，提升公共安全保障水平；金融行业中，实现刷脸支付、远程开户等便捷服务，优化用户体验并强化交易安全。智能终端方面，为设备解锁、身份验证等功能提供支持，提升设备使用的便捷性与安全性。然而，现有面部识别系统在数据安全、检索效率及用户
明达云：赋能化工园区，智绘安全高效新蓝图明达技术物联网网络
在日新月异的科技浪潮中，数字化转型已成为各行各业转型升级的关键驱动力。尤其在化工这一关乎国家经济命脉与安全环保的重要领域，如何实现智能化管理、提升运营效率、确保生产安全，成为了摆在众多化工园区面前的重大课题。在此背景下，明达云平台以其卓越的技术实力与深厚的行业经验，正逐步成为化工园区智慧化升级的首选伙伴。智慧监管，安全先行化工生产，安全为先。明达云平台通过集成物联网、大数据、人工智能等先进技术，为
设计模式介绍 tntxia 设计模式
设计模式来源于土木工程师克里斯托弗亚历山大（http://en.wikipedia.org/wiki/Christopher_Alexander）的早期作品。他经常发表一些作品，内容是总结他在解决设计问题方面的经验，以及这些知识与城市和建筑模式之间有何关联。有一天，亚历山大突然发现，重复使用这些模式可以让某些设计构造取得我们期望的最佳效果。亚历山大与萨拉-石川佳纯和穆雷西乐弗斯坦合作
android高级组件使用(一) 百合不是茶 android RatingBar Spinner
1、自动完成文本框（AutoCompleteTextView） AutoCompleteTextView从EditText派生出来，实际上也是一个文本编辑框，但它比普通编辑框多一个功能：当用户输入一个字符后，自动完成文本框会显示一个下拉菜单，供用户从中选择，当用户选择某个菜单项之后，AutoCompleteTextView按用户选择自动填写该文本框。使用AutoCompleteTex
[网络与通讯]路由器市场大有潜力可挖掘 comsci 网络
如果国内的电子厂商和计算机设备厂商觉得手机市场已经有点饱和了,那么可以考虑一下交换机和路由器市场的进入问题..... 这方面的技术和知识,目前处在一个开放型的状态,有利于各类小型电子企业进入 &nbs
自写简单Redis内存统计shell 商人shang Linux shell 统计Redis内存
#!/bin/bash address="192.168.150.128:6666,192.168.150.128:6666" hosts=(${address//,/ }) sfile="staticts.log" for hostitem in ${hosts[@]} do ipport=(${hostitem
单例模式(饿汉 vs懒汉) oloz 单例模式
package 单例模式; /* * 应用场景:保证在整个应用之中某个对象的实例只有一个 * 单例模式种的《懒汉模式》 * */ public class Singleton { //01 将构造方法私有化，外界就无法用new Singleton()的方式获得实例 private Singleton(){}; //02 申明类得唯一实例 priva
springMvc json支持杨白白 json springmvc
1.Spring mvc处理json需要使用jackson的类库，因此需要先引入jackson包 2在spring mvc中解析输入为json格式的数据:使用@RequestBody来设置输入 @RequestMapping("helloJson") public @ResponseBody JsonTest helloJson() {
android播放，掃描添加本地音頻文件小桔子
最近幾乎沒有什麽事情，繼續鼓搗我的小東西。想在項目中加入一個簡易的音樂播放器功能，就像華為p6桌面上那麼大小的音樂播放器。用過天天動聽或者QQ音樂播放器的人都知道，可已通過本地掃描添加歌曲。不知道他們是怎麼實現的，我覺得應該掃描設備上的所有文件，過濾出音頻文件，每個文件實例化為一個實體，記錄文件名、路徑、歌手、類型、大小等信息。具體算法思想，
oracle常用命令 aichenglong oracle dba 常用命令
1 创建临时表空间 create temporary tablespace user_temp tempfile 'D:\oracle\oradata\Oracle9i\user_temp.dbf' size 50m autoextend on next 50m maxsize 20480m extent management local
25个Eclipse插件 AILIKES eclipse插件
提高代码质量的插件1. FindBugsFindBugs可以帮你找到Java代码中的bug，它使用Lesser GNU Public License的自由软件许可。2. CheckstyleCheckstyle插件可以集成到Eclipse IDE中去，能确保Java代码遵循标准代码样式。3. ECLemmaECLemma是一款拥有Eclipse Public License许可的免费工具，它提供了
Spring MVC拦截器+注解方式实现防止表单重复提交 baalwolf spring mvc
原理：在新建页面中Session保存token随机码，当保存时验证，通过后删除，当再次点击保存时由于服务器端的Session中已经不存在了，所有无法验证通过。 1.新建注解： ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
《Javascript高级程序设计(第3版)》闭包理解 bijian1013 JavaScript
“闭包是指有权访问另一个函数作用域中的变量的函数。”--《Javascript高级程序设计(第3版)》看以下代码： <script type="text/javascript"> function outer() { var i = 10; return f
AngularJS Module类的方法 bijian1013 JavaScript AngularJS Module
AngularJS中的Module类负责定义应用如何启动，它还可以通过声明的方式定义应用中的各个片段。我们来看看它是如何实现这些功能的。一.Main方法在哪里如果你是从Java或者Python编程语言转过来的，那么你可能很想知道AngularJS里面的main方法在哪里？这个把所
[Maven学习笔记七]Maven插件和目标 bit1129 maven插件
插件(plugin)和目标(goal) Maven，就其本质而言，是一个插件执行框架，Maven的每个目标的执行逻辑都是由插件来完成的，一个插件可以有1个或者几个目标，比如maven-compiler-plugin插件包含compile和testCompile，即maven-compiler-plugin提供了源代码编译和测试源代码编译的两个目标使用插件和目标使得我们可以干预
【Hadoop八】Yarn的资源调度策略 bit1129 hadoop
1. Hadoop的三种调度策略 Hadoop提供了3中作业调用的策略， FIFO Scheduler Fair Scheduler Capacity Scheduler 以上三种调度算法，在Hadoop MR1中就引入了，在Yarn中对它们进行了改进和完善.Fair和Capacity Scheduler用于多用户共享的资源调度 2. 多用户资源共享的调度
Nginx使用Linux内存加速静态文件访问 ronin47
Nginx是一个非常出色的静态资源web服务器。如果你嫌它还不够快，可以把放在磁盘中的文件，映射到内存中，减少高并发下的磁盘IO。先做几个假设。nginx.conf中所配置站点的路径是/home/wwwroot/res，站点所对应文件原始存储路径：/opt/web/res shell脚本非常简单，思路就是拷贝资源文件到内存中，然后在把网站的静态文件链接指向到内存中即可。具体如下：
关于Unity3D中的Shader的知识 brotherlamp unity unity资料 unity教程 unity视频 unity自学
首先先解释下Unity3D的Shader，Unity里面的Shaders是使用一种叫ShaderLab的语言编写的，它同微软的FX文件或者NVIDIA的CgFX有些类似。传统意义上的vertex shader和pixel shader还是使用标准的Cg/HLSL 编程语言编写的。因此Unity文档里面的Shader，都是指用ShaderLab编写的代码，然后我们来看下Unity3D自带的60多个S
CopyOnWriteArrayList vs ArrayList bylijinnan java
package com.ljn.base; import java.util.ArrayList; import java.util.Iterator; import java.util.List; import java.util.concurrent.CopyOnWriteArrayList; /** * 总述： * 1.ArrayListi不是线程安全的，CopyO
内存中栈和堆的区别 chicony 内存
1、内存分配方面：堆：一般由程序员分配释放，若程序员不释放，程序结束时可能由OS回收。注意它与数据结构中的堆是两回事，分配方式是类似于链表。可能用到的关键字如下：new、malloc、delete、free等等。栈：由编译器(Compiler)自动分配释放，存放函数的参数值，局部变量的值等。其操作方式类似于数据结构中
回答一位网友对Scala的提问 chenchao051 scala map
本来准备在私信里直接回复了，但是发现不太方便，就简要回答在这里。问题写道对于scala的简洁十分佩服，但又觉得比较晦涩，例如一例，Map("a" -> List(11,111)).flatMap(_._2)，可否说下最后那个函数做了什么，真正在开发的时候也会如此简洁？谢谢先回答一点，在实际使用中，Scala毫无疑问就是这么简单。
mysql 取每组前几条记录 daizj mysql 分组最大值最小值每组三条记录
一、对分组的记录取前N条记录：例如：取每组的前3条最大的记录 1.用子查询： SELECT * FROM tableName a WHERE 3> (SELECT COUNT(*) FROM tableName b WHERE b.id=a.id AND b.cnt>a. cnt) ORDER BY a.id,a.account DE
HTTP深入浅出 http请求 dcj3sjt126com http
HTTP(HyperText Transfer Protocol)是一套计算机通过网络进行通信的规则。计算机专家设计出HTTP，使HTTP客户（如Web浏览器）能够从HTTP服务器(Web服务器)请求信息和服务，HTTP目前协议的版本是1.1.HTTP是一种无状态的协议，无状态是指Web浏览器和Web服务器之间不需要建立持久的连接，这意味着当一个客户端向服务器端发出请求，然后We
判断MySQL记录是否存在方法比较 dcj3sjt126com mysql
把数据写入到数据库的时，常常会碰到先要检测要插入的记录是否存在，然后决定是否要写入。　　我这里总结了判断记录是否存在的常用方法：　　sql语句： select count ( * ) from tablename; 　　然后读取count(*)的值判断记录是否存在。对于这种方法性能上有些浪费，我们只是想判断记录记录是否存在，没有必要全部都查出来。
对HTML XML的一点认识 e200702084 html xml
感谢http://www.w3school.com.cn提供的资料 HTML 文档中的每个成分都是一个节点。节点根据 DOM，HTML 文档中的每个成分都是一个节点。 DOM 是这样规定的：整个文档是一个文档节点每个 HTML 标签是一个元素节点包含在 HTML 元素中的文本是文本节点每一个 HTML 属性是一个属性节点注释属于注释节点 Node 层次
jquery分页插件 genaiwei jquery Web 前端分页插件
//jquery页码控件// 创建一个闭包 (function($) { // 插件的定义 $.fn.pageTool = function(options) { var totalPa
Mybatis与Ibatis对照入门于学习 Josh_Persistence mybatis ibatis 区别联系
一、为什么使用IBatis/Mybatis 对于从事 Java EE 的开发人员来说，iBatis 是一个再熟悉不过的持久层框架了，在 Hibernate、JPA 这样的一站式对象 / 关系映射（O/R Mapping）解决方案盛行之前，iBaits 基本是持久层框架的不二选择。即使在持久层框架层出不穷的今天，iBatis 凭借着易学易用、
C中怎样合理决定使用那种整数类型？秋风扫落叶 c 数据类型
如果需要大数值(大于32767或小于32767), 使用long 型。否则, 如果空间很重要 (如有大数组或很多结构), 使用 short 型。除此之外, 就使用 int 型。如果严格定义的溢出特征很重要而负值无关紧要, 或者你希望在操作二进制位和字节时避免符号扩展的问题, 请使用对应的无符号类型。但是, 要注意在表达式中混用有符号和无符号值的情况。 &nbs
maven问题 zhb8015 maven问题
问题1： Eclipse 中新建maven项目无法添加src/main/java 问题 eclipse创建maevn web项目，在选择maven_archetype_web原型后，默认只有src/main/resources这个Source Floder。按照maven目录结构，添加src/main/ja
(二)androidpn-server tomcat版源码解析之--push消息处理 spjich java androdipn 推送
在 (一)androidpn-server tomcat版源码解析之--项目启动这篇中，已经描述了整个推送服务器的启动过程，并且把握到了消息的入口即XmppIoHandler这个类，今天我将继续往下分析下面的核心代码，主要分为3大块，链接创建，消息的发送，链接关闭。先贴一段XmppIoHandler的部分代码 /** * Invoked from an I/O proc
用js中的formData类型解决ajax提交表单时文件不能被serialize方法序列化的问题中华好儿孙 JavaScript Ajax Web 上传文件 FormData
var formData = new FormData($("#inputFileForm")[0]); $.ajax({ type:'post', url:webRoot+"/electronicContractUrl/webapp/uploadfile", data:formData, async: false, ca
mybatis常用jdbcType数据类型 ysj5125094 mybatis mapper jdbcType
MyBatis 通过包含的jdbcType 类型 BIT FLOAT CHAR

上交AI研究院副院长马利庄：基于大数据的人脸识别技术进展与展望

你可能感兴趣的:(大数据,区块链,人工智能)