维博

IBM中国研究院潘越：从战略角度解读大数据的机遇

发表于 2012-11-30 10:56| 615次阅读| 来源 CSDN| 4 条评论| 作者 CSDN

HBTC 大数据潘越 Hadoop

摘要：IBM中国研究院信息管理与医疗健康首席科学家潘越阐述了大数据的4个V:大数据首先代表的是数据产生的量比传统的量大很多，他认为传统的G级别或者T级别的数据存储和管理的方案，目前看起来都不太合适或者是性价比不高。第二个V是针对机器产生的数据，传统的分析的周期原来可能都是以月、周、天这样...

【CSDN现场报道】中国IT界技术盛会——Hadoop与大数据技术大会（Hadoop&BigData Technology Conference 2012，HBTC 2012）于2012年11月30日-12月1日在北京新云南皇冠假日酒店隆重召开。本次大会以“大数据共享与开放技术”为主题，聚焦于Hadoop与大数据，力邀数十位国内外Hadoop及大数据技术应用的产学界人士和实践企业，探讨大数据技术生态系统的现状和发展趋势，并围绕Hadoop与大数据热点技术和应用实践进行深入解析。

IBM中国研究院信息管理与医疗健康首席科学家潘越，他阐述了大数据的4个V：大数据首先代表的是数据产生的量比传统的量大很多，他认为传统的G级别或者T级别的数据存储和管理的方案，目前看起来都不太合适或者是性价比不高。第二个V是针对机器产生的数据，传统的分析的周期原来可能都是以月、周、天这样的时间来做分析的，现在很多的分析都需要实时的决策，所以数据关键是速度。第三个V当然是涉及到用户数据的多样性。在IBM研究部门还提出来第四个V，数据里包含的不确定性。数据的不确定性和数据的多样性之间可能也有一种天然的联系，但是也不完全地等同。然后得出了三点结论：1.大数据并不能固守在自己的领域里面，要跟企业中其他的数据管理、信息分析结合起来。2.在大数据的部署过程中会采用很多种的技术，我们不仅要看到技术的有效性，还要更多地考虑一下：如果把技术结合在一起，会产生什么样的价值。3.像大数据这样的平台应该是一个共享的平台，应该能为大家创造一个共同协作的环境，这样就能降低成本和风险。

IBM中国研究院信息管理与医疗健康首席科学家潘越

以下是演讲实录：

首先非常感谢大家给我这个机会分享我个人对大数据的看法。对于企业来讲，应该如何使用大数据来获取最大的价值。

我们引用了一个Gartner的数据，我们是用大数据还是BigIIIusion。调查的问题是大数据对企业来说是否有价值，大数据的项目是不是一个成功的项目。大家可以看到大概有不到1/5的企业的CIO很确定大数据对他来讲是一个有价值的投资，并且已经看到了效果。更多还是处于不确定或者是观望要不要投资的阶段，因此我很欣赏这一点，大数据或者是小数据还是数据，既然是数据对一个企业来讲就要涉及到数据怎么去管理，怎么样去利用数据产生商业的价值的问题。所以，我们要放在这样的一个上下文里面来理解大数据和理解大数据的技术。

如果我们看大数据和传统的数据有什么不同，一般来讲有两类的数据，一类是像左边提到的一些用户产生的数据，主要是在社交媒体还有一些用户的活动产生的数据。第二类是机器产生的数据，包括了RFID的设备，IPS的设备，各种各样的智能水表、电表、气表，还有因为智能手机的采用，很多的影像数据，这些都是机器产生的数据。为了理解这些数据有什么价值和特点，我们可以把数据放在企业管理的框架下来看。传统的企业管理侧重于商业流程产生的数据上，比如说用户的信息、市场的信息、产品的信息还有供应链的信息等。刚才讲到的用户产生的数据和机器产生的数据，看到也是在很多商业活动的边缘产生的，可能不见得是传统的商业活动，可能是通过电商的方法来产生的一些在线的数据，可能是通过物联网的手段扩展它的信息采集点产生的数据。所以，它是扩展原来的商业活动的范围。同时，他们有不同的特点。像机器产生的数据实时性要求就会比较高。像用户产生的数据有很多是文本、图像、影像。

大数据的4个V

我们看来需要把这两类数据和无原有的数据结合起来，之后在一起产生商业智能分析，通过这样的过程让这些数据来产生它的价值。所以刚才就提到了数据的几个类型，我想这几个V，前三个V对大家来说都比较熟悉。大数据首先代表的是数据产生的量比传统的量大很多，以至于说传统的G级别的或者是T级别的数据存储和管理的方案目前看起来都不太合适，或者是性价比不够好。第二个V是针对机器产生的数据，传统的分析的周期原来可能都是以月、周、天这样的时间来做分析的，现在有很多的分析需要做一些实时的决策。所以这些数据关键是速度。

第三个V当然是涉及到用户数据的多样性。在IBM研究部门我们还提出来第四个V，就是这种数据里面包含的不确定性。当然你要讲的话，数据的不确定性和数据的多样性之间可能也有一种天然的联系。但是也不完全地等同，一般来讲用户产生的数据这些文本数据本身包含着一些歧义和模糊所以有很多的不确定性，机器产生的数据我们也不能当成不确定性，因为测量的过程中还会产生很多的误差，所以有很多的不确定性。针对不确定性，以前都是在分别不同的分析模块里处理，我们现在单独提出来不确定性可能需要有一些共用的技术来对他进行处理。

IBM是一个传统的厂商，有什么样的经验去处理大数据，我想我们可能从某一个角度来看，在过去的研究活动中也处理了大量的复杂的数据。大家可能有的人知道Watson系统，这是一个自动问答的系统，在2011年智力问答的节目中战胜了人类选手。这是人工智能的里程碑，它凭借什么取得了这样的结果，它后面是有很多的非结构化文本的分析和处理。可以和原来的专家系统和其他系统的区别就在于它的知识获取的能力。所以可以处理维基百科、大英百科全书和IMDP等web上的内容，使它变成自己知识库的一部分，同时也可以学习在过往几十年内人类选手在同样的智力问答节目中的表现，和正确答案、错误答案。从过去的事例中学习到经验，从而帮助提高他回答问题的准确度和自信度。

所以这给我们提供了一个窗口，让我们怎么样理解、怎么样应用这个大数据。可以分享一下我们学到了什么。《危险边缘》这样的一个挑战使得我们在开始确定研究方向和系统的架构之前做过一些分析。这一类的数据有什么样的特点，我们指的问题是用来回答问题的知识源，还有过去的问题。我们首先把问题拿来看了一下。这个问题过往几十年积累了几十万个问题，我们从中挑了两万个问题做类型的分析，把问题都会有期望的大安的问题，期望回答的答案是人或者是动物或者是地点、时间。这个类型往往可以通过问题点重点来标志。可以观察到这个图，这是一个很典型的长尾的现象，最频繁出现的问题的类型，在整个问题中出现的频度。我们传统的方法是能不能建数据库，把这个问题翻译成查询。我们看这是不可能的事情，我们不可能把世界上所有的事物都给它在数据库里建一条记录，这是不可能的事情。

退而求其次，我们不存储个体的数据而是存储关于类型和关系或者是关于之间的一些逻辑联系的表达式，这也是不可能的。因为这个类型实在是太多，我们甚至于无法穷尽所有的类型。对这样的挑战，后来我们采取的一个策略是我们不试图建立数据库，而是在问题处理的过程中实时地分析大量的文本，然后还有一些网上的结构化的知识来做答案的产生、答案的评估、答案最后排序的过程。最后我们还需要把整个的时间控制在节目要求的3秒之内。

在这样的一个架构下，到底有哪些技术能够解决这个问题。很不幸对于这样的一类问题我们很难找到一个单个的技术来满足这样的挑战。事实上，在最后waston的架构下大概集成了100个左右的算法，包括了自然语言的分析，包括了搜索的技术，包括了一些知识的表达和推理的技术，用在假设生存和假设的数据的评分，还有答案的过滤，还用到了很多机器学习的方法，很多个模块都可能用到自己的机器学习的方法。另外over all的话，如何搜集证据给证据不同的权重，这是要根据过去比赛的一些记录来学到评分和排序的模型。所以，真正的挑战在于如何把这么多的技术集成在一个框架下，让他们之间相互增强而不是相互抵消，是这样的一个架构，这是我们学到的一个知识。

另外，在这个过程中很重要的一点是，不管是用什么样的技术，我们都会把这个技术和最终要达到的目标结合起来。这包括了三个方面，准确度、自信度和速度。跟这三个指标比较，看这样技术会不会对最重要的指标有贡献。我们把相应的战略应用到企业里面的信息管理上，这样就会有一个更加全面的视角。我们看到同样的对企业来讲可能很多的客户也在才能多种技术，比如说做预处理需要由于处理的技术，结合结构化和非结构化的分析有很多的技术。结合历史的数据和比较实时的数据，我们也需要不同的技术。还有，对一些探索性的分析我们也要采用不同的分析的方法。

所以，对企业里面的数据管理会更多地从一个信息治理的角度来看，然后在这样的上下文来看做数据分析、做大数据的位置。大体上功能上的划分我们会把跟信息管理有关的活动分成信息的获取和管理，这里面会把数据内容还有一些碎片的数据采集和管理好。

接下去需要对这些信息进行整合，这个整合到现在为止基本上一个企业里面好的数据会存储在三个主要的数据库里面，一个是交易的数据；第二是用于分析的数据的仓库。第三，关于企业里面的关键的信息资产，比如说产品和客户，这些的一些数据我们做在主数据里面，用来为其他的数据提供参照。当然，有了管理和信息之后可以支撑交易型和协作型的应用。

在此之上，我们还有很多做商业分析的应用。这些商业分析的应用有的可能是直接看数据的原始的内勤，所以要提供一个内容的服务，传统的数据得多维分析可以跟数据仓库结合在一起，提供很多数据的keepmodel。大数据是在做数据的挖掘的途径下，大数据为传统的数据分析的方法提供了不同的视角。

整个的技术是在不断的演变过程中，因为现在有很多的技术是在看一些多维分析是不是能够在大数据上来做，或者不是用昂贵的存储的解决方案，甚至是能不能和大数据的平台共享一些虚拟机。这些技术还都在演变的过程中，也许过两三年这个图景会有所不同。现在的大数据阶段，对企业来说支撑它的运营和它的创新还是这样一个比较平衡的架构。

如何利用大数据技术来加速研究和创新的进程

我很喜欢右边这张图，这个图讲的是在医学领域，医学的技术从它的产生到最后的临床上大规模的采用转化的时间和周期。现在在医学上很多讲转化医学，有一些相似的地方。心绞痛的诊断到最后的采用大概花了2400年的时间。青蒿素这是中国对世界医学的贡献，从它最早有采用的记录到最后真正生产出来青蒿素的药大规模临床使用也用了2000多年的时间。从那之后，大家再看一些新技术的采用呈现出越来越短，从研究产生的结果到最后时间越来越短的趋势。像书写大概是100年前出现的，它用了大概20多年变成了医学的常规。盘尼西林的使用是用了20年的时间。如果按这些的趋势来看，到2025年左右会出现医学的基点，很多的技术出现之后马上就可以投入临床的使用。

为什么能够有这样的趋势出来？背后的原因是什么？多多少少跟大数据有一些关系，尤其我觉得近些年如果能要保持这样的创新的速度，可能会依赖于很多大数据的技术。过去医学的研究比较集中在实验的数据，但临床实验的周期是相当地长，分析的话也要花相当长的时间，但现在随着医学影像的技术、电子病例和电子健康档案的采用，还有基因在临床中间的使用会产生大量的数据，所以很多通过临床实验能够得到的一些结论，可以通过一些数据库的研究来实现。比如说一个药是否有效、是否有副作用，可以通过分析获取大量的历史记录来判断是否有这样的问题，而不是通过招募上千个人来进行临床的医学实验来证明这件事。所以大数据对医学的创新有很多的作用。现在提到的第四范式是在实验研究和仿真之后的新的科学研究的方法。

为了支持这个研究和创新的活动，我们做大数据可以有一些什么样的方法来支撑这样的活动。这块用一个词叫insight，以前科学家和实验室的工作人员多数是以一个项目为单位，在项目里面采购他们的设备做实验分析数据。这个过程可能是相当地长，而且比较昂贵。它需要把数据获取提成然后加强在一起，需要按照很多不完整的信息，需要采购相应的设备来管理数据，需要从书本上的一些模型自己实现，实现完了之后再分析它自己的数据，然后做很多实验分析，理解结果，把这些结果再变成论文分享给其他的研究人员。所以，可能一个不是做计算机的科学家要花很多的时间在IT的数据管理、系统管理、分析等领域。而且这些项目之间都要做重复的事情，这会占用大量的时间和金钱。IBM对管理这类研究和创新的活动提出了一个做法是提供一个Plug-and-Play的环境，这个环境集中了一个数据集，人口学的数据、地理的数据，这些数据是公开的，不用每个人都把时间花在寻找数据上。这个数据不仅仅获取或者关联出来。第二，对数据管理和分析建立一个共用的平台，使得大家不要重复地建设模块。第三，分析是可以共用的。第四，提供一个协作的平台，使得不同领域的研究人员能够在一个环境下观察一到数据。

这些是我们的做法，具体来讲成立了一个insitute for massive data。通过一些环境来支持，比如说人机界面的专家、信息管理的专家以及各种各样其他领域的专家结合在一起。上面的应用可以支持能源的、水资源的医疗卫生的和各种各样的商业风险分析等一些研究。

首先的平台并不局限在IBM的研究部门内部使用，而是把它变成了一个开发共享的环境，所以很欢迎大学在这样的平台上进行共同的创新，也包括了一些数据服务的提供者把它的数据共享在这样的一个平台上，还有就是一些工业企业把他们的问题放到这样的平台上，政府也可以把他们的问题和他们的一些希望支持的一些活动放在这个平台上，IBM在后面提供一些架构和分析的服务。我想各方都能够从这样的协作中有投入，也会得到产出。

三点结论

第一，大数据并不能固守在自己的领域里面，要跟企业中其他的数据管理、信息分析结合起来。
第二，在大数据的部署过程中会采用很多种的技术，我们不仅要看到技术的有效性，还要更多地考虑一下：如果把技术结合在一起，会产生什么样的价值。
第三，像大数据这样的平台应该是一个共享的平台，应该能为大家创造一个共同协作的环境，这样就能降低成本和风险。

(论文总结)思维链激发LLM推理能力靈镌sama 论文解读人工智能
研究背景&动机背景:扩大模型规模已被证实具有提升模型性能和模型效率的功效，但是LLM对于完成推理、算术任务仍有较大不足。动机:从之前的应用和研究中得知，可以用生成自然语言解释、使用神经符号等形式语言的方法来提高大模型的算术推理能力，当时采用了从头预训练和微调模型的方法，耗费的成本较多；而且大模型具有根据少量文本提示进行上下文少样本学习的能力，使用少量输入输出示例即可提高LLM的推理性能，而不必对单
＜电子幽灵＞开发笔记:BAT基础笔记(一）
BAT脚本基础笔记(一)介绍费曼学习法最重要的部分，即把知识教给一个完全不懂的孩子——或者小白。为了更好的自我学习，也为了让第一次接触某个知识范畴的同学快速入门，我会把我的学习笔记整理成电子幽灵系列。提示：作为低代码工具的笔记，这里会用特殊字体表示要用到的函数等等。请若要学习，请结合相关工具边用边学。BAT基础笔记（一）BAT脚本基础笔记(一)介绍简介在哪里编写BAT代码？BAT基本语法1.基本命
＜电子幽灵＞前端第一件：HTML基础笔记下靈镌sama 电子幽灵随手记前端 html 笔记
HTML基础笔记（下）介绍费曼学习法最重要的部分，即把知识教给一个完全不懂的孩子——或者小白。为了更好的自我学习，也为了让第一次接触某个知识范畴的同学快速入门，我会把我的学习笔记整理成电子幽灵系列。提示：文章的是以解释-代码块-解释的结构呈现的。当你看到代码块并准备复制复现的时候，最好先保证自己看过了代码块前后的解释。＜电子幽灵＞前端第一件：HTML基础笔记上中，最基础的一部分HTML标签和已经以
深度学习之分类手写数字的网络 newyork major 卷积神经网络CNN 深度学习人工智能
面临的问题定义神经⽹络后，我们回到⼿写识别上来。我们可以把识别⼿写数字问题分成两个⼦问题：把包含许多数字的图像分成⼀系列单独的图像，每个包含单个数字；也就是把图像，分成6个单独的图像分类单独的数字我们将专注于编程解决第⼆个问题，分类单独的数字。这样是因为，⼀旦你有分类单独数字的有效⽅法，分割问题是不难解决的。⼀种⽅法是尝试不同的分割⽅式，⽤数字分类器对每⼀个切分⽚段打分；如果数字分类器对每⼀个⽚段
VR协作香港：虚拟现实技术重塑商业协作新模式 cpsvps_net vr
随着虚拟现实技术的快速发展，VR协作正在全球范围内掀起新一轮的数字化转型浪潮。作为国际金融中心的香港，凭借其独特的地理位置和先进的科技基础设施，正在成为VR协作应用的重要试验场。本文将深入探讨VR协作在香港的发展现状、应用场景、技术优势以及未来趋势，为关注这一领域的读者提供全面洞察。VR协作香港：虚拟现实技术重塑商业协作新模式香港VR协作市场的发展现状香港作为亚洲重要的商业枢纽，VR协作技术的应用
基于 Three.js 与 WebGL 的商场全景 VR 导航系统源码级解析维小帮定位导航 javascript vr 前端开发场景优化 WebGL 物联网智慧商场
本文面向Web前端开发者、WebGL/Three.js爱好者、对VR/AR应用开发感兴趣的技术人员、智慧商场解决方案开发者。详细介绍如何利用WebGL(Three.js框架)构建高性能的商场全景VR环境，并实现精准的室内定位与3D路径规划导航功能。如需获取商场全景VR导航系统解决方案请前往文章最下方获取，如有项目合作及技术交流欢迎私信作者。一、商场全景VR导航的核心技术概述商场全景VR导航融合了全
树莓派上基于Opencv 实现人脸检测与人脸识别土拨鼠不是老鼠 C++opencv 人工智能计算机视觉
一，需求基于树莓派4b，usb1080p摄像头，实现人脸检测与人脸识别。尝试了海陵科的模组和百度的sdk。海陵科的模组无法录入人脸，浪费了100多块钱。百度的sdk在树莓派上也无法录入人脸，官方解决不了。最后只能用opencv自己实现，因为只要实现最简单检测和识别就行，不在乎准确率。经测试opencv能满足基本要求，这里整理下思路。二，（1），加载模型并实例化Ptr和Ptr对象。树莓派4bopen
欧标TH-307EV3.41对讲机写频软件详解侯昂
本文还有配套的精品资源，点击获取简介：对讲机在多个领域中有着广泛应用，欧标TH-307EV3.41是一款针对特定型号对讲机进行频率配置和功能设置的软件工具。它允许用户自定义工作频率、频道管理、功能配置，并执行数据备份与恢复、固件更新等功能。本软件是无线电爱好者和专业用户的实用工具，需在遵守无线电法规的前提下使用。1.欧标TH-307EV3.41对讲机概述1.1对讲机的技术演进对讲机自问世以来，经历
Windows 7上IIS7.0的全面应用侯昂
本文还有配套的精品资源，点击获取简介：IIS7.0是微软为Windows7操作系统推出的Web服务器软件，具备模块化设计、高效管理和丰富的开发环境。它支持多种网络协议，包括HTTP、HTTPS和FTP，并通过集成安全机制和优化的性能特性，如应用程序池、FTP服务、URL重写等，为用户提供了强大的Web服务管理能力。IIS7.0的设计旨在提高资源利用率、管理便捷性，并确保服务器的安全稳定运行。1.I
8、探讨排序算法及其实际应用侯昂排序算法插入排序快速排序
探讨排序算法及其实际应用1.排序算法的重要性排序算法在计算机科学中扮演着至关重要的角色。无论是日常生活中常见的任务，还是复杂的数据处理工作，排序算法都能帮助我们更有效地管理和检索信息。以下是几个实际应用场景：字典中的单词：字典中的单词按顺序排列，忽略大小写差异。这使得查找特定单词变得非常容易。目录中的文件：目录中的文件通常按排序顺序列出，方便用户快速找到所需文件。书籍索引：一本书的索引是排序过的，
基于 Vue + RuoYi 架构设计的商城Web/小程序实训课程速易达网络 spring boot uni-app vue.js
以下是基于Vue+RuoYi架构设计的商城Web/小程序实训课程方案，结合企业级开发需求与教学实践，涵盖全栈技术栈与实战模块：一、课程概述目标：通过Vue前端+RuoYi后端（SpringBoot）开发企业级电商系统，实现多终端（Web/H5/小程序）适配，覆盖从架构设计到部署上线的全流程。周期：8周（建议每日3小时）适合人群：具备基础Java/Vue知识的开发者，熟悉HTML/CSS/JavaS
git和解决冲突代码杂货铺子 git gitlab
安装包：Git-Downloadsgit小乌龟：TortoiseGit–WindowsShellInterfacetoGit简单介绍git一般指git还有gitlab,实际工程使用时依据项目建立的位置或者需要使用到的特性不同，可以自行选择，基础功能都差不多。git安装后会提供类似shell一样的命令行管理工具，直接在git工程所在的目录右键鼠标单击打开就可以。TortoiseGit是提供了一个类似
微信小程序实现websocket及单人聊天功能蝶妹妹微信小程序 websocket 小程序
一、什么是websocket：WebSocket是HTML5下一种新的协议（websocket协议本质上是一个基于tcp的协议）它实现了浏览器与服务器全双工通信，能更好的节省服务器资源和带宽并达到实时通讯的目的Websocket是一个持久化的协议二、websocket的原理：websocket约定了一个通信的规范，通过一个握手的机制，客户端和服务器之间能建立一个类似tcp的连接，从而方便它们之间的
springboot+websocket+微信小程序（实现后端主动推送消息小程序的实时报警功能）
Listitem本项目主要实现的需求为：主要功能汽车在行驶的过程中如果前方遇到限高杆，车前的摄像头在安全距离前测出限高杆的高度后，小程序能够实时报警（当前车辆内否安全通过）。次要功能1.车主利用微信用户名登录后能够绑定车牌，实现车牌的增删改查2.车主可以为自己的车牌号添加家庭成员（绑定微信用户名的方式）3.简单权限管理（车主拥有其名下车牌的增删改查权限，家庭成员则没有）实现方式1.后端使用spri
Java web开发常见中间件多版本下载备用却诚Salong 安装问题和解决方法 java 中间件开发语言
备注：每次换电脑都要重新构建一下环境，下载找资源很麻烦，官网英文网页找个历史版本看不懂，还要慢慢去搜，所以直接整理一波，需要的自行收藏。1.nodejs自选版本下载：地址：https://nodejs.org/download/release/网速快，自选任何版本下载。2.maven自选版本下载：地址：https://archive.apache.org/dist/maven/maven-3/网速
X86和ARM架构的优缺点？心对元&鑫鑫 arm开发架构
x86和ARM是当前主流的两种处理器架构，分别主导不同领域（如PC/服务器和移动/嵌入式设备）。它们的优缺点对比如下：1.x86架构（Intel/AMD）优点：高性能：复杂指令集（CISC）设计，单条指令功能强大，适合高吞吐量计算。强大的单线程性能，尤其在浮点运算和多媒体处理（如视频编辑、游戏）。软件生态成熟：主导PC和服务器市场，兼容Windows、Linux等主流操作系统。支持大量专业软件（如
uptime命令详解半桶水专家运维 linux 网络
uptime是Linux/Unix系统中的一个非常常用的命令，用于显示系统的运行时间、当前时间、登录用户数以及系统负载（loadaverage）。下面是对uptime命令的详细解释。一、基本语法uptime[参数]常用参数：参数说明无显示当前时间、系统运行时间、用户数、平均负载-p只显示系统已运行的时间（pretty格式）-s显示系统最近的启动时间（since）-h显示帮助信息二、命令输出详解示例
MySQL对CPU的占用率很高怎么处理半桶水专家 mysql mysql 数据库
一、确认与定位确认整体CPU使用情况top-b-n1|head-n15观察MySQL(mysqld)进程所占的%CPU。如果是多核系统，关注总和以及单核是否满载。查看系统负载uptimeLoadAverage长期高于CPU核数，说明系统压力大。查看其它进程情况psaux--sort=-%cpu|head-n10确认是否仅MySQL占用高，或与其它进程有关。二、操作系统层面排查磁盘I/O瓶颈iost
从x86到ARM64：CPU架构的进化与未来小俊学长架构
从x86到ARM64：CPU架构的进化与未来在计算机发展的历史长河中，CPU架构的演变是推动计算技术不断前进的重要动力。从早期的x86架构，到现代的x64和ARM64架构，每一次变革都带来了计算性能、能效比以及应用领域的显著提升。本文将深入探讨x86、x64和ARM64这三大主流CPU架构的历史背景、技术特点、市场应用以及未来发展趋势，以期为读者提供一个全面的视角，理解CPU架构的进化路径及其对未
配置MySQL主从复制（一主一从） cici15874 mysql
MySQL主从复制简介MySQL主从复制的目的是实现数据库冗余备份，将master数据库的数据定时同步到slave库中，一旦master数据库宕机，可以将Web应用数据库配置快速切换到slave数据库，确保Web应用有较高的可用性。MySQL主从同步是一个异步复制的过程，要实现复制，首先需要在master上开启bin-log日志功能，bin-log日志用于记录在master库执行的增删改更新操作的
阿里云OSS跨账号迁移过程 IT_狂奔者《玩转Linux终极指南》阿里云云计算对象存储OSS
阿里云OSS跨账号迁移过程关于OSS在线迁移服务的更新说明旧版在线迁移已停止服务，用户需切换至新版在线迁移。与旧版相比，新版在线迁移的主要区别在于身份验证方式的调整。新版不再使用AK/AS（AccessKeyID和AccessKeySecret）进行认证，而是采用了角色授权机制。这一变化旨在提升安全性和简化权限管理。用户需根据新的认证方式进行配置，以确保迁移任务的正常运行。准备工作本文以标准存储进
2024年Python最全人脸检测实战高级：使用 OpenCV、Python 和 dlib 完成眨眼检测 2401_84691757 程序员 python opencv 开发语言
然而，一旦人眨眼（右上），眼睛的纵横比就会急剧下降，接近于零。下图绘制了视频剪辑的眼睛纵横比随时间变化的图表。正如我们所看到的，眼睛纵横比是恒定的，然后迅速下降到接近零，然后再次增加，表明发生了一次眨眼。在下一节中，我们将学习如何使用面部标志、OpenCV、Python和dlib实现眨眼检测的眼睛纵横比。使用面部标志和OpenCV检测眨眼==============================
Redis 功能扩展：Lua 脚本对 Redis 的扩展 cici15874 redis lua 数据库
Redis是一个高性能的内存数据库，支持多种数据结构，如字符串、哈希、列表、集合和有序集合。为了增强其功能，Redis引入了Lua脚本支持，使开发者可以编写自定义的脚本，确保操作的原子性并提高复杂操作的性能。本文将详细介绍如何使用Lua脚本对Redis进行扩展，重点讲解eval命令、redis.call和redis.pcall的用法。一、Lua脚本在Redis中的作用Lua脚本在Redis中的主要
数据库迁移同步 | 两地三中心到异地双活演变及关键技术探讨沃趣数据库管理平台技术专栏服务器数据库网络 mysql 数据库迁移
两地三中心和异地多活都是分布式系统的关键技术，用于保证系统的高可用性和容错性。其中最关键的技术无疑是数据同步、同步防环和数据冲突解决。异地容灾&两地三中心两地三中心架构是一种分布式系统的架构模式，用于保证系统的高可用性和容错性。它将整个系统划分为三个数据中心：两个位于同城，一个位于异地。其中，同城的两个数据中心分别承担主备的角色，异地数据中心则作为备份。在两地三中心架构中，同城的两个数据中心之间通
Spring Boot 中使用 Jackson 实现全局时间格式处理（支持多格式反序列化）喵行星 Jack sping相关 java
好的，以下是整理好的CSDN博文格式内容，适合你发布为一篇讲解Jackson全局时间配置的文章：SpringBoot中使用Jackson实现全局时间格式处理（支持多格式反序列化）在实际开发中，我们经常需要处理前后端交互中的时间字段。为了统一时间格式，通常会在字段上添加@JsonFormat注解，但如果项目中字段很多，这种方式会显得重复且难以维护。本文将介绍如何通过配置Jackson的全局时间格式，
拦截器和过滤器的区别 MaxBruce 工作专栏拦截器过滤器
拦截器和过滤器的区别①拦截器是基于java的反射机制的，而过滤器是基于函数回调。②拦截器不依赖与servlet容器，过滤器依赖与servlet容器。③拦截器只能对action请求起作用，而过滤器则可以对几乎所有的请求起作用。④拦截器可以访问action上下文、值栈里的对象，而过滤器不能访问。⑤在action的生命周期中，拦截器可以多次被调用，而过滤器只能在容器初始化时被调用一次。⑥拦截器可以获取I
LangChain4j在Java企业应用中的实战指南-3 在未来等你大模型应用开发 AI 技术编程 Java Spring
【LangChain4j在Java企业应用中的实战指南】文章标签langchain4j,JavaAI,RAG系统,智能应用开发,LangChain4j实战,企业级AI应用,Java微服务,检索增强生成文章简述随着大语言模型（LLM）的广泛应用，企业对智能应用的需求日益增长。LangChain4j作为一款专为Java生态打造的LLM集成框架，正在成为构建RAG（检索增强生成）系统和智能应用的重要工具
JVM调优实战 Day 14 ：大数据处理中的JVM调优在未来等你 JVM调优实战 JVM Java 性能优化调优虚拟机
【JVM调优实战Day14】大数据处理中的JVM调优文章标签jvm调优,大数据处理,Java性能优化,JVM参数配置,JVMGC调优,Java开发,大数据架构,Jvm实战文章简述在大数据处理场景中，Java应用通常面临内存占用高、GC频率频繁、堆内存不足等挑战。本文作为“JVM调优实战”系列的第14天，深入探讨了大数据处理中的JVM调优策略。文章从概念解析、技术原理、常见问题、诊断方法、调优策略到
设计模式精讲 Day 19：观察者模式（Observer Pattern）在未来等你 23种设计模式精讲设计模式 Java 面向对象软件架构
【设计模式精讲Day19】观察者模式（ObserverPattern）开篇在“设计模式精讲”系列的第19天，我们聚焦于观察者模式（ObserverPattern）。作为行为型设计模式之一，观察者模式是实现对象间一对多依赖关系的经典方式，广泛应用于事件驱动系统、状态变化通知、消息订阅等场景。本篇文章将从理论到实践全面讲解观察者模式，包括其核心思想、结构组成、适用场景、代码实现、优缺点分析、实际案例和
关于java通过背景图生成图片 a未来永远是个未知数 #java的图片处理 java java intellij-idea maven spring boot 图像处理
目录对接部分（碎碎念，可跳过）引入本地jar包文件路径错误尝试解决方案开发部分获取字体的方法关于二维码的生成关于在背景图上添加内容关于在背景图上写字关于在背景图上叠加图片关于保存图片第一次尝试第二次尝试第三次尝试最终方案关于文件读取为MultipartFile类型关于BufferedImage转MultipartFile最近用到了需要生成图片的开发，作为一个没有接触过这个的后端，实在头秃，记录一下
算法单链的创建与删除换个号韩国红果果 c 算法
先创建结构体 struct student { int data; //int tag;//标记这是第几个 struct student *next; }; // addone 用于将一个数插入已从小到大排好序的链中 struct student *addone(struct student *h,int x){ if(h==NULL) //??????
《大型网站系统与Java中间件实践》第2章读后感白糖_ java中间件
断断续续花了两天时间试读了《大型网站系统与Java中间件实践》的第2章，这章总述了从一个小型单机构建的网站发展到大型网站的演化过程---整个过程会遇到很多困难，但每一个屏障都会有解决方案，最终就是依靠这些个解决方案汇聚到一起组成了一个健壮稳定高效的大型系统。看完整章内容，
zeus持久层spring事务单元测试 deng520159 java DAO spring jdbc
今天把zeus事务单元测试放出来,让大家指出他的毛病, 1.ZeusTransactionTest.java 单元测试 package com.dengliang.zeus.webdemo.test; import java.util.ArrayList; import java.util.List; import org.junit.Test; import
Rss 订阅开发周凡杨 html xml 订阅 rss 规范
RSS是 Really Simple Syndication的缩写（对rss2.0而言，是这三个词的缩写，对rss1.0而言则是RDF Site Summary的缩写，1.0与2.0走的是两个体系）。 RSS
分页查询实现 g21121 分页查询
在查询列表时我们常常会用到分页，分页的好处就是减少数据交换，每次查询一定数量减少数据库压力等等。按实现形式分前台分页和服务器分页：前台分页就是一次查询出所有记录，在页面中用js进行虚拟分页，这种形式在数据量较小时优势比较明显，一次加载就不必再访问服务器了，但当数据量较大时会对页面造成压力，传输速度也会大幅下降。服务器分页就是每次请求相同数量记录，按一定规则排序，每次取一定序号直接的数据
spring jms异步消息处理 510888780 jms
spring JMS对于异步消息处理基本上只需配置下就能进行高效的处理。其核心就是消息侦听器容器，常用的类就是DefaultMessageListenerContainer。该容器可配置侦听器的并发数量，以及配合MessageListenerAdapter使用消息驱动POJO进行消息处理。且消息驱动POJO是放入TaskExecutor中进行处理，进一步提高性能，减少侦听器的阻塞。具体配置如下：
highCharts柱状图布衣凌宇 hightCharts 柱图
第一步：导入 exporting.js,grid.js,highcharts.js;第二步：写controller @Controller@RequestMapping(value="${adminPath}/statistick")public class StatistickController { private UserServi
我的spring学习笔记2-IoC（反向控制依赖注入） aijuans spring mvc Spring 教程 spring3 教程 Spring 入门
IoC（反向控制依赖注入）这是Spring提出来了，这也是Spring一大特色。这里我不用多说，我们看Spring教程就可以了解。当然我们不用Spring也可以用IoC，下面我将介绍不用Spring的IoC。 IoC不是框架，她是java的技术，如今大多数轻量级的容器都会用到IoC技术。这里我就用一个例子来说明：如：程序中有 Mysql.calss 、Oracle.class 、SqlSe
TLS java简单实现 antlove java ssl keystore tls secure
1. SSLServer.java package ssl; import java.io.FileInputStream; import java.io.InputStream; import java.net.ServerSocket; import java.net.Socket; import java.security.KeyStore; import
Zip解压压缩文件百合不是茶 Zip格式解压 Zip流的使用文件解压
ZIP文件的解压缩实质上就是从输入流中读取数据。Java.util.zip包提供了类ZipInputStream来读取ZIP文件,下面的代码段创建了一个输入流来读取ZIP格式的文件; ZipInputStream in = new ZipInputStream(new FileInputStream(zipFileName)); &n
underscore.js 学习（一） bijian1013 JavaScript underscore
工作中需要用到underscore.js，发现这是一个包括了很多基本功能函数的js库，里面有很多实用的函数。而且它没有扩展 javascript的原生对象。主要涉及对Collection、Object、Array、Function的操作。学
java jvm常用命令工具——jstatd命令(Java Statistics Monitoring Daemon) bijian1013 java jvm jstatd
1.介绍 jstatd是一个基于RMI（Remove Method Invocation）的服务程序，它用于监控基于HotSpot的JVM中资源的创建及销毁，并且提供了一个远程接口允许远程的监控工具连接到本地的JVM执行命令。 jstatd是基于RMI的，所以在运行jstatd的服务
【Spring框架三】Spring常用注解之Transactional bit1129 transactional
Spring可以通过注解@Transactional来为业务逻辑层的方法(调用DAO完成持久化动作)添加事务能力，如下是@Transactional注解的定义： /* * Copyright 2002-2010 the original author or authors. * * Licensed under the Apache License, Version
我(程序员)的前进方向 bitray 程序员
作为一个普通的程序员,我一直游走在java语言中,java也确实让我有了很多的体会.不过随着学习的深入,java语言的新技术产生的越来越多,从最初期的javase,我逐渐开始转变到ssh,ssi,这种主流的码农,.过了几天为了解决新问题,webservice的大旗也被我祭出来了,又过了些日子jms架构的activemq也开始必须学习了.再后来开始了一系列技术学习,osgi,restful.....
nginx lua开发经验总结 ronin47
使用nginx lua已经两三个月了，项目接开发完毕了，这几天准备上线并且跟高德地图对接。回顾下来lua在项目中占得必中还是比较大的，跟PHP的占比差不多持平了，因此在开发中遇到一些问题备忘一下 1：content_by_lua中代码容量有限制，一般不要写太多代码，正常编写代码一般在100行左右（具体容量没有细心测哈哈，在4kb左右），如果超出了则重启nginx的时候会报 too long pa
java-66-用递归颠倒一个栈。例如输入栈{1,2,3,4,5}，1在栈顶。颠倒之后的栈为{5,4,3,2,1}，5处在栈顶 bylijinnan java
import java.util.Stack; public class ReverseStackRecursive { /** * Q 66.颠倒栈。 * 题目：用递归颠倒一个栈。例如输入栈{1,2,3,4,5}，1在栈顶。 * 颠倒之后的栈为{5,4,3,2,1}，5处在栈顶。 *1. Pop the top element *2. Revers
正确理解Linux内存占用过高的问题 cfyme linux
Linux开机后，使用top命令查看，4G物理内存发现已使用的多大3.2G，占用率高达80%以上： Mem: 3889836k total, 3341868k used, 547968k free, 286044k buffers Swap: 6127608k total,&nb
[JWFD开源工作流]当前流程引擎设计的一个急需解决的问题 comsci 工作流
当我们的流程引擎进入IRC阶段的时候，当循环反馈模型出现之后，每次循环都会导致一大堆节点内存数据残留在系统内存中，循环的次数越多，这些残留数据将导致系统内存溢出，并使得引擎崩溃。。。。。。而解决办法就是利用汇编语言或者其它系统编程语言，在引擎运行时，把这些残留数据清除掉。
自定义类的equals函数 dai_lm equals
仅作笔记使用 public class VectorQueue { private final Vector<VectorItem> queue; private class VectorItem { private final Object item; private final int quantity; public VectorI
Linux下安装R语言 datageek R语言 linux
命令如下：sudo gedit /etc/apt/sources.list1、deb http://mirrors.ustc.edu.cn/CRAN/bin/linux/ubuntu/ precise/ 2、deb http://dk.archive.ubuntu.com/ubuntu hardy universesudo apt-key adv --keyserver ke
如何修改mysql 并发数(连接数)最大值 dcj3sjt126com mysql
MySQL的连接数最大值跟MySQL没关系，主要看系统和业务逻辑了方法一：进入MYSQL安装目录打开MYSQL配置文件 my.ini 或 my.cnf查找 max_connections=100 修改为 max_connections=1000 服务里重起MYSQL即可　　方法二：MySQL的最大连接数默认是100客户端登录：mysql -uusername -ppass
单一功能原则 dcj3sjt126com 面向对象的程序设计软件设计编程原则
单一功能原则[ 编辑] SOLID 原则单一功能原则开闭原则 Liskov代换原则接口隔离原则依赖反转原则查论编在面向对象编程领域中，单一功能原则（Single responsibility principle）规定每个类都应该有
POJO、VO和JavaBean区别和联系 fanmingxing VO POJO javabean
POJO和JavaBean是我们常见的两个关键字，一般容易混淆，POJO全称是Plain Ordinary Java Object / Plain Old Java Object，中文可以翻译成：普通Java类，具有一部分getter/setter方法的那种类就可以称作POJO，但是JavaBean则比POJO复杂很多，JavaBean是一种组件技术，就好像你做了一个扳子，而这个扳子会在很多地方被
SpringSecurity3.X--LDAP：AD配置 hanqunfeng SpringSecurity
前面介绍过基于本地数据库验证的方式，参考http://hanqunfeng.iteye.com/blog/1155226，这里说一下如何修改为使用AD进行身份验证【只对用户名和密码进行验证，权限依旧存储在本地数据库中】。将配置文件中的如下部分删除：
mac mysql 修改密码 IXHONG mysql
$ sudo /usr/local/mysql/bin/mysqld_safe –user=root & //启动MySQL(也可以通过偏好设置面板来启动)$ sudo /usr/local/mysql/bin/mysqladmin -uroot password yourpassword //设置MySQL密码（注意，这是第一次MySQL密码为空的时候的设置命令，如果是修改密码，还需在-
设计模式--抽象工厂模式 kerryg 设计模式
抽象工厂模式：工厂模式有一个问题就是，类的创建依赖于工厂类，也就是说，如果想要拓展程序，必须对工厂类进行修改，这违背了闭包原则。我们采用抽象工厂模式，创建多个工厂类，这样一旦需要增加新的功能，直接增加新的工厂类就可以了，不需要修改之前的代码。总结：这个模式的好处就是，如果想增加一个功能，就需要做一个实现类，
评"高中女生军训期跳楼” nannan408
首先，先抛出我的观点，各位看官少点砖头。那就是，中国的差异化教育必须做起来。孔圣人有云：有教无类。不同类型的人，都应该有对应的教育方法。目前中国的一体化教育，不知道已经扼杀了多少创造性人才。我们出不了爱迪生，出不了爱因斯坦，很大原因，是我们的培养思路错了，我们是第一要“顺从”。如果不顺从，我们的学校，就会用各种方法，罚站，罚写作业，各种罚。军
scala如何读取和写入文件内容？ qindongliang1922 java jvm scala
直接看如下代码： package file import java.io.RandomAccessFile import java.nio.charset.Charset import scala.io.Source import scala.reflect.io.{File, Path} /** * Created by qindongliang on 2015/
C语言算法之百元买百鸡 qiufeihu c 算法
中国古代数学家张丘建在他的《算经》中提出了一个著名的“百钱买百鸡问题”，鸡翁一，值钱五，鸡母一，值钱三，鸡雏三，值钱一，百钱买百鸡，问翁，母，雏各几何？代码如下： #include <stdio.h> int main() { int cock,hen,chick; /*定义变量为基本整型*/ for(coc
Hadoop集群安全性：Hadoop中Namenode单点故障的解决方案及详细介绍AvatarNode wyz2009107220 NameNode
正如大家所知，NameNode在Hadoop系统中存在单点故障问题，这个对于标榜高可用性的Hadoop来说一直是个软肋。本文讨论一下为了解决这个问题而存在的几个solution。 1. Secondary NameNode 原理：Secondary NN会定期的从NN中读取editlog，与自己存储的Image进行合并形成新的metadata image 优点：Hadoop较早的版本都自带，

IBM中国研究院潘越：从战略角度解读大数据的机遇

IBM中国研究院潘越：从战略角度解读大数据的机遇

你可能感兴趣的:(IBM中国研究院潘越：从战略角度解读大数据的机遇)