软件工程小施同学

基于Spark+Redis的实时可视分析探究

及“跑步点亮北京”的可视项目设计

1.引言

2.大数据采集

2.1.大数据特征

2.2.采集方式

“跑步点亮北京”的数据采集方式

2.3.存储方式

a)Hadoop(HDFS)

b)Redis内存数据库（Geo）

2.4数据处理

(1) HDFS 列表

(2)数据添加

(3) 数据清洗

(4) 数据合并

(5) 数据类型管理

2.5.“跑步点亮北京”的数据存储方式

3.大数据分析和挖掘

3.1.计算框架

a)MapReduce

b)Spark

3.2.“跑步点亮北京”计算框架

4.大数据可视化

4.1可视化工具

4.2.可视分析

4.2.1科学可视化

4.2.2大数据可视化分析

4.3可视化平台搭建

4.6面向大数据主流应用的信息可视化技术

4.6.1 文本可视化

4.6.2 网络(图)可视化

4.6.3 时空数据可视化

4.6.4 多维数据可视化

4.7. 支持可视分析的人机交互技术

4.7.1 支持可视分析过程的界面隐喻与交互组件

4.7.2 多尺度、多焦点、多侧面交互技术

4.7..3 面向Post-WIMP的自然交互技术

4.8.“跑步点亮北京”的可视化方案

5.个人针对可视分析未来预测

6.个人学习规划

7.总结

参考文献

1.引言

老师让我阐述对Spark和可视分析的技术理解，我认为实践便是最好的理解。所以，在自身对Redis数据库、PHP、Html5、Css3、JavaScript等web开发技术熟练使用的情况下，结合“跑步点亮北京”的可视产品设计，进一步阐述基于Spark+Redis的实时可视分析的技术理解。

“跑步点亮北京”的灵感来自于两方面，一是“微博签到点亮中国”的可视分析应用；二是我们团队的自有体育项目，想要为当前热火朝天的跑步运动做一些有趣实用的产品应用。

当前的人们跑步越来越喜欢组队跑步，从而出现了很多“跑团”，各个“跑团”的活动区域往往会趋于固定，且逐步缺乏趣味性，内部成员可能逐步趋于懈怠，如何解决这个问题，“跑步点亮北京”的可视分析应用将会解决这个问题。

“跑步点亮北京”将各个跑团在虚拟地图上标记为不同的亮丽颜色，其成员跑过的区域将会用对应的亮丽颜色进行跑步轨迹的标记，跑的区域越广，虚拟地图上被团队颜色覆盖得越广，同一区域跑过的次数越多，轨迹将会叠加，从而在虚拟地图上的颜色标记将会更加显眼亮丽。

不同“跑团”标记的颜色不同，跑过重叠的区域将会显示此区域跑过次数最多的团队标记颜色，从而不仅通过此可视分析应用激发跑友们跑步“占领”地图的热情，通时也通过互相“侵占”对方“跑团”领地的方式增加跑步锻炼过程中的趣味性，此应用也将是比较实用的、针对普通大众的可视分析应用。

图1-1 北京地区跑团轨迹图

“跑步点亮北京”将海量的实时的跑友坐标和轨迹数据基于位置进行抽稀，按照事先机器学习自动设定的可能标记位置点的经过次数聚合,然后再使用百度Echart进行Web可视化。通过对城市里不同地点的可视化，可以清楚的看出人口、道路的空间分布与跑步轨迹等特征，研究“跑团”群体活动的地理空间分布、聚落规模、及活动范围具有一定的参考意义。

图1-2 北京邮电大学及北师跑团轨迹图

我将会根据可视分析的四个基本步骤，分别阐述“跑步点亮北京”里所涉及到的技术理解和最佳的技术解决方案。

主要想解决以下几个问题：

(1) 如何对小而数量巨大的地理位置数据集进行采集、存储、管理

(2) 如何实现快速的海量数据分析、挖掘，以便可视化

(3) 如何可视化，怎样提高用户体验

(4) 响应时间、并发要求

以下阐述，由于对Spark及可视分析理解尚浅，错误之处还望老师指正。

2.大数据采集

2.1.大数据特征

大数据具有4V 特征[1],即:

(1)体量巨大(volume)

(2)类型繁多(variety)

(3)时效性高(velocity)

(4)价值密度低(value)

而我们的项目“跑步点亮北京”所记录的跑友的抽样时刻的地理位置数据同样具有体量巨大、不同客户端类型可能不一致等大数据的特征。

2.2.采集方式

a)互联网网络

b)硬件传感器

c)其它特定方式

“跑步点亮北京”的数据采集方式

我们采用的是基于移动端的GPS+网络定位（比如微信获取地理位置接口），甚至可以采集小米手环、华为手环等智能穿戴设备，不同设备及平台采集的数据格式多,且多来自于异构环境.即使获得数据源,得到的数据的完整性、一致性、准确性都难以保证,数据质量的不确定问题将直接影响可视分析的科学性和准确性。

2.3.存储方式

a)Hadoop(HDFS)

HDFS是Hadoop的具有高度容错特性的分布式文件系统，它为Hadoop分布式计算提供高容错、高可扩展的存储服务[7]。

HDFS架构由一个主节点(NameNode)和多个从节点(DataNode)构成NameNode负责整个HDFS的节点管理工作，它担当着管理文件系统名字空间和控制外部客户机的访问并将数据块映射到DataNode的角色。DataNode是HDFS的运行节点，每一个Hadoop的物理节点都部署着一个DataNode，它负责将数据块存储在文件中，并对文件读写、删除、复制块命令请求进行响应。NameNode和DataNode之间的通信协议采用TCP／IP，NameNode通过一个基于RPC的专有协议与DataNode通信，反之，DataNode和NameNode两者是靠一个基于块的专有协议进行通信。

b)Redis内存数据库（Geo）

Redis是一个先进的key-value内存数据库

·异常快速：Redis的速度非常快，每秒能执行约11万集合，每秒约81000+条记录。

·支持丰富的数据类型：列表，集合，有序集合，散列数据类型。这使得它非常容易解决各种各样的问题，因为我们知道哪些问题是可以处理通过它的数据类型更好。

·操作都是原子性：所有Redis操作是原子的，这保证了如果两个客户端同时访问的Redis服务器将获得更新后的值。

·多功能实用工具：Redis是一个多实用的工具，可以在多个用例如缓存，消息，队列使用(Redis原生支持发布/订阅)，任何短暂的数据，应用程序，如Web应用程序会话，网页命中计数等。

尤其是当前 Redis新增位置查询功能Geo，提供精准而且稳定的位置服务。例如添加经纬度、计算经纬度相似度、计算城市之间的包含关系等多种位置计算功能，该模块在Benchmark上运行的性能表现，每秒可达近5百万次编解码，能满足大部分位置服务应用的需求。

2.4数据处理

由于要处理大量、非构化的数据，跑步时利用移动设备进行的采集来的位置数据，然后将位置数据进行预处理，剔除无用数据，留下有用数据，然后对数据进行映射，跟据处理模块要功能是把非构化据或者半构化据化构化据，把繁大的非结构化据转化成可以直接使用的数据。其中，数据处理模块功能点描述如下：

(1) HDFS 列表

系统在数据存储方面使用Hadoop生态体系中的HDFS。HDFS文件系统下，有数据处理文件DataProcess。HDFS列表是DataProcess文件及其下目录的列表可视化，可以对文件文件夹进行管理。

(2)数据添加

数据添加是指采集据并且导入到文件系统。可以采用两种方式，第一种是数据文件直接上到指定文件夹下；第二种是通配置据源，自动上据文件，数据源包括关系型数据库、日志服务器、TCP端口、UDP端口等。不管采用哪种方式，在上传数据文件，都需要上传数据文件的类型，以便于下面进行数据清洗、合并。

(3) 数据清洗

数据清洗是指处理已经导入文件系统的数据，然后把处理后的有效据再次重新导入文件系统。采用Spark程模型，针对不同类型的数据，对空数据、缺失数据进行补缺操作，无效数据进行数据的替换，无法处理的做标记并进行删除；对正常数据进行数据处理。并将源数据抽取的数据格式转换成为便于进入仓库处理的目标数据格式。

(4) 数据合并

数据合并是指把清洗后的相同或者相似类型的据按照一定的合并规则合并成一组数据，数据规模可以是一个或者多个。数据清洗后的数据是按照一定规则拆分的，不同类型的数据，采用Spark编程模型，使用不同的据操作类型进行数据文件合并，合并后数据文件重新导入文件系统。例如使用lookup操作类型进行数据文件关联，使用join操作类型进行数据文件相交。

(5) 数据类型管理

数据类型管理是指数据类型进行创建、删除、更新、查找。系统处理分析的海量据基本都是公司部或者客户的数据，数据的种类容易区分和归类。不同的据类型需要不同的java或者scala程序进行数据清洗或者据合并，编写后的程序打成jar包。创建数据类型，需要上数据处理jar包。

2.5.“跑步点亮北京”的数据存储方式

相比之下，我们决定采用Redis内存数据库存储最近一段时间的数据，现成动态实时的虚拟地图显示效果，同时定期将过去一段时间的地理位置数据分析统计，合并生成带有一定权值的特殊数据，写入HFDS中，在不影响其它，且最终表现出来的结果与原来一样的情况下，删除原来的大量过期的历史数据，减少Redis的内存占用，合理使用内存+磁盘存储的优势。并且通过数据处理，将接受到的数据进行清洗和合并，产生可以被用作可视分析的合格数据集，存储于Redis数据库中，以待Spark快速读取和操作。

Spark和内存数据库Redis结合后可显著的提高Spark运行任务的性能，这源于Redis优秀的数据结构和执行过程，从而减小数据处理的复杂性和开销。Spark通过一个Redis连接器可以访问Redis的数据和API，加速Spark处理数据[6]。

Spark和Redis结合使用到底有多大的性能提升呢?结合这两者来处理时序数据时可以提高46倍以上。

3.大数据分析和挖掘

3.1.计算框架

a)MapReduce

MapReduce是一种Hadoop计算模式，也是Hadoop的核心所在，它可以将提交的任务自动分割，将大作业分割成若干个小作业，然后进行并行计算。MapReduce又可以分为两个阶段，即Map(映射)和Reduce(归结)。顾名思义，Map负责将数据分成若干个小数据块进行并行运算，Reduce将Map输出进行汇总，即对小数据块根据Key值合并，并将汇总结果输出。

Hadoop任务调度控制模式

Hadoop是一个Master-Slave架构模式，由一台主节点和若干台Slave节点组，其中，主节点负责管理和监控各个Slave节点的任务执行情况，包含一个master服务JobTracker(作业服务器)用于接收Job，它的任务是将作业分配给等待的节点，Slave节点负责具体的任务执行，包含一个Slave服务TaskTracker(任务服务器)，它负责与JobTracker通信并接收作业，再根据每个节点的拆分数据，进行Map和Reduce处理。每一个Slave节点都是并行执行，提高了计算效率。

Hadoop的任务调度控制模式主要依赖TaskTracker和JobTracker来完成，具体任务控制运行原理如下。

1．当Driver程序启动Hadoop时，就已自动启动了JobTracker，用户程序可以通过Job类的submit方法向JobTracker提交作业，也可以通过JobClient类的runJob方法将作业提交到JobTracker。另外JobClient根据InputFormat格式获得相应的InputSplit，以此确定Mapper时的任务数。

2．客户端将作业提交到任务服务器JobTracker，在作业服务器中会定义任务服务器TaskScheduler的成员变量，任务服务器调度作业是采用先进先出的调度算法实现的。

JobTracker中设有两个监听器：JobQueueJoblnprogressListener负责监听Job作业的运行情况；eagerTasklnitializationListener(任务初始化监听器)主要作用就是监视Job作业的初始化工作。

3．作业服务器JobTracker和任务服务器TaskTracker之间的通信是很频繁的，它们之间的通信是通过心跳检测实现的，任务服务器为了证实自己处于正常活跃状态(即可以接收任务状态)，每隔一段时间(可在程序中设定)向作业服务器发送一次心跳检测，作业服务器收到相应的请求，会根据当前任务的实际情况将任务发送给任务服务器。

4．JobTracker对任务根据程序进行指定的Map和Reduce操作，Map任务交给MapLauncher处理，Reduce任务由ReduceLaucher负责，进行相应的MapReduce处理后，把结果写到分布式文件系统HDFS中。

5．当JobTracker获得最后一个Task的运行成功的报告后，将Job的状态改为成功。作业客户端想要获取任务的运行情况是通过向作业服务器轮询实现的，一旦发现作业成功完成，立即打印任务完成消息给用户，进而从运行作业的状态中返回。

b)Spark

Spark是一个新型计算框架模型，是一种能够在集群上对大数据集进行交互式分析的并行计算框架，通过Scala脚本以高效的方式处理数据集，另外，它还提供了本地化的调度、容错和负载平衡机制。与在Hadoop MapReduce中的数据只能保存在HDFS中不同，Spark引入了内存计算的概念，提供persisit和cache方法将RDD缓存到内存中，避免了若在计算过程中想要重用数据，必须重新到HDFS上加载数据的IO过程，从而减轻了磁盘输入输出和序列化的负担，使系统开销减少，缩短了应用执行时间，提高了应用执行效率。

Spark提出的最主要抽象概念是弹性分布式数据集（resilient distributed dataseUIDD)，它是一个元素集合，划分到集群的各个点上，可以被并行操作。 RDDs的建立可以从HDFS(或者任意其他支持Hadoop文件系统）上的一个文件开始，或者通过驱动程序（driver program)中已存在的Scala集合。用户也可以Spark保留一个RDD在内存中，使其能在并行操作中被有效的重复使用。最后，RDD能自动从故障点中恢复。

Spark的第二个抽象概念是共享变量（shared variables)，可以在并行操作中使用。在默认情况下，Spark连通不同点上的一系列任务运行一个函数，它每一个函中用到的变量的拷贝传递到每一个任务中。有时候，一个变置需要在任务之间，或任务与驱动程序之间被共享。Spark支持两种类型的共享变量：广播变量，可以在内存的所有的点上存变量；累加器：只能用于做加法的变量，例如计数或求和。

RDD与分布式共享内存对比图

RDD具有更高的容错性和数据处理的高效性。

1．高效性

当任务处理必须在多个任务节点之间进行并行操作时，或者必须重复使用中间结果时，Hdoop MapReduee框架的缺陷也随之表现出来。MapReduce的数据只能保存在HDFS中，若在计算过程中想要重用数据，必须重新加载数据，从而加大磁盘输入输出和序列化的负担，从而对系统开销带来负担，严重影响了应用执行时间。RDD的出现，为其提供了一个数据重用抽象，提供粗粒度转换，支持基于内存的计算。Spark中最主要的抽象是将数据集抽象成RDD，这种数据集合分布在各个节点上，实现数据的并行处理。另外，RDD可以被缓存到内存上，这种将中间结果缓存在内存中的处理机制，使之在后续的数据处理中可以重用数据，从而改变了MapReduce中数据必须保存在HDFS的机制，极大的提升了数据的查询速度，有效的减少了系统开支，提高了应用的运行效率。

2．容错性

提供的共享内存模型的只读特性有效的降低了容错开销。RDD的容错机制是建立在父RDD和子RDD的依赖关系的基础上的，在各个RDD之间的依赖关系中，窄依赖中RDD的每个partition依赖于常数个数的父RDD的partition，而宽依赖中子RDD的每一个partition依赖于所有父RDD的partition。窄依赖和窄依赖主要有以下两方面的区别：

1．子RDD获得：窄依赖是一个个体对个体的概念，子RDD不必等到父RDD中所有数据块计算完毕后再进行子RDD数据块的计算，而是可以通过直接计算与之对应的父RDD的partition，来得到子RDD所对应的partition。而宽依赖必须是一个整体对个体的概念，所有的子RDD必须等待父RDD的所有partition计算完毕并传入计算节点后，才可进行子RDD的计算工作。

2．失效节点恢复：当数据丢失时，窄依赖可以通过重新计算所丢失的子RDD的partition对应的父RDD上的partition来进行相应的数据恢复操作。而宽依赖，则必须重新计算所有父RDD的数据块。由以上所述可知，窄依赖更加有利于失效节点的恢复。

Spark任务处理流程介绍

Spark任务处理的核心机制是实现了将数据缓存在内存中。与Hadoop需要将所有计算数据(包括中间计算数据)写入HDFS，依赖于JobTracker和TaskTracker来完成Job作业的管理与执行，利用MapReduce负责大规模数据集的并行运算任务的任务处理不同。Spark利用RDD的一系列的粗粒度的任务来执行应用程序，并将RDD存在内存中，使用内存替代了使用HDFS存储中间结果，能有效

的在并行计算阶段实现共享资源。另外，Spark实现了DAGScheduler，DAGScheduler会根据RDD的dependency和dependency先后产生出不同的stageDAG，用于接收用户的Job作业，然后将其按类型划分为不同的stage，并将每一个stage分解成若干个Task，向TaskScheduler提交。HDFS文件作为输入RDD，Spark会将调用过persist的RDD存在内存中，减少了Hadoop中不断与HDFS交互所造成的IO开销，Spark提供了一个通用接口来抽象每个RDD，通过不同RDD之间的依赖关系进行划分。

简单的讲，Spark任务处理流程由以下步骤组成：首先进行集群的资源分配，通过任务资源调度将划分好的若干数据块分配到工作节点进行任务的并行处理，完成后将每个工作节点完成后的数据结果返回，最后，释放程序所占用的资源空间。

具体来说， Spark的任务处理流程由主要包括以下6个步骤：

第一步：环境搭建：提交应用程序Drive Manager来构建应用程序所需要的运行环境。由SparkContext进行指定执行平台为YARN、对程序执行过程中共享量的相关操作、生成RDD和进行RDD之间的转换、进行程序运行的各种action操作等平台相关公共控制操作[4]。

第二步：Spark根据生成的RDD的依赖关系，产生final Stage，然后再根据所产生的final Stage将其划分为若干个Stage。

第三步：根据Stage划分的依赖关系进行DAG调度处理。先提交没有依赖关系的Stage，待所有无依赖关系的Stage都完成提交任务后，再提交依赖关系已经完成的Stage，直到所有Stage都己提交完成。

第四步：将Stage转换成TaskSet，在TaskSet Manager中对TaskSet进行调度。

第五步：利用ResourceOffer机制，实现任务调度与资源管理分离工作，将TaskSet分解为若干个Task，再将Task与空闲worker node绑定并发起Task任务到worker node的ExecutorBackend，通过其中的Executor进行任务处理并将结果返回。

第六步：释放占用资源。

3.2.“跑步点亮北京”计算框架

MpaReduce计算框架是一种简单通用的而且能够自动处理故障的批处理离线计算模型[4]，但是在迭代计算和交互式计算方面仍存在着不足之处。提出了基于Spark的虚拟地图可视化任务处理框架，形成多核多节点的向量场分布式并行计算框架，对具有海量小文件特性的地理位置数据进行大规模任务处理和并行计算，通过减少数据迁移量和增加本地化计算，弥补了Hadoop在交互式计算方面的缺陷，相比与原MapReduce计算模式，Spark提供了更为轻巧的DAG模型、中间数据都以RDD的形式存储在各节点内存中、并且通过Shuffle传递Stage间的数据，只需要读取和写入HDFS一次，提高了虚拟地图可视化的计算效率。

内存迭代计算的引入，极大地提高了计算效率和速度，但是由于内存使用量较大，资源占用需求较高，对高并发的计算请求资源高效合理调度存在着较大问题[6]。

Spark有两种任务调度方法，对应了两种不同类型的任务调度模式：FIFO模式和FAIR模式。先进先出（FIFO）模式直接管理TaskManager，任务执行的过程会根据StageID的顺序来调度ＴTaskManager；公平调度FAIR模式，基本原则是根据所管理的正在运行中的任务数量来判断优先级，并通过任务权重（weight）来调整任务集执行的优先程度，权值越高，越优先执行。

采用以上两种调度模式进行各大预定节点的跑步流量计算，虽然能够一定程度上提高计算的效率，但是由于城区不同位置的的人口密度不同，计算复杂度差别较大，计算时间差距较大，无论使用先进先出调度还是公平模式调度，都可能出现由于个别节点计算任务太大，使得整个虚拟地图渲染计算过程的时间变长。

基于节点计算能力的算法优化，通过设计合理的调度算法，使计算复杂度高的计算任务优先分配到计算能力强的节点上，使节点计算能力达到充分发挥，避免出现长时间等待其他任务结束的情况，避免Spark随机任务分配过程出现的任务节点分配不合理的情况

具体技术实现

根据上述优化算法，设计和实现基于Spark的虚拟地图跑步流量次数计算优化调度方案，具体技术实现方法如下：

（１）建立Spark集群节点计算能力表，根据Spark集群实际计算能力添加信息，包括ＣＰＵ计算能力、ＣＰＵ核心数、内存大小。在启动Spark集群之前创建好该表，并将该表的配置信息放到SparkConf中或者在Spark启动时候由Master进程读取。

（２）建立选定位置计算跑步人数流量任务表，该表的主要作用是对计算每个区域不同跑团跑过的计算量进行定量表示，通过计算经过跑友次数来定量表示计算的复杂度，次数数目越多，计算越复杂。

（３）描述表转化。根据节点计算能力描述表和计算任务描述表进行转化，转化成我们需要的数据结构，进而调用优化后的任务调度算法。

（４）应用层读取任务分配结果：

①读取生成的ｘｍｌ，以host为key，以所有host相同的taskId及其描述信息构成的列表为value生成一个二元元组为元素的数组。

②将生成的数组通过parallelize方法生成一个rdd，并设置该rdd的partition为当前需要执行的taskId的总数。

③对该rdd进行foreach操作，获取当前处理二元元组的第二个元素，可得到在该节点上需要执行的任务列表。

④改写Spark中TaskSchedulerImpl中的resourceOffers

函数，将任务分配部分代码改写为按workOffer中的host绑定task，此时遍历任务列表将对应host的task绑定到对应的host上的executor即可。

通过以上步骤，我们可以把具体任务分发下去，使任务能够根据元组的Host值将任务分发到对应节点，完成调度。

4.大数据可视化

4.1可视化工具

主流编程工具包括以下三种类型[2]：从艺术的角度创作的数据可视

化，比较典型的工具是 Processing.js，它是为艺术家提供的编程

语言；从统计和数据处理的角度，R语言是一款典型的工具，它

本身既可以做数据分析，又可以做图形处理；介于两者之间的工

具，既要兼顾数据处理，又要兼顾展现效果，D3.js是一个不错的

选择，像D3.js这种基于Javascript的数据可视化工具更适合在互联

网上互动的展示数据。

4.2.可视分析

可视分析(visual analytics)是科学/信息可视化、人机交互、认知科学、数据挖掘、信息论、决策理论等研究领域的交叉融合所产生的新的研究方向[1]。两条主线:可视化技术和自动化分析模型,即是面向大规模、动态、模糊、或者常常不一致的数据集来进行分析。此外,信息可视化可以理解为编码(encoding)和解码(decoding)两个映射过程[1]。

4.2.1科学可视化

分布式并行可视化算法

4.2.1.1并行图像合成算法

传统的并行图像合成算法主要包括前分割算法、中间分割算法和后分割算法3种类型[3]，前分割算法主要分为如下3步骤：

(1)将数据分割并分配到每个计算节点上；

(2)每个计算节点独立绘制分配到的数据，在这一步，节点之间不需要数据交换；

(3)将计算节点各自绘制的图形汇总，合成最终的完整图形。

由于节点之间可能需要大量的数据交换，尤其是步骤(3)可能成为算法的瓶颈。解决这个问题的关键是减少计算节点之间的通信开销，可以通过对数据进行划分并在各计算节点间进行分配来实现。划分和分配方案需要与数据的访问一致，原则是计算节点只使用驻留本计算节点的数据进行跟踪，从而减少数据交换。

4.2.1.2并行颗粒跟踪算

将二维的流场可视化方法直接应用在三维流的结构不可能都成功，每个颗粒虽然可以单独跟踪，但是可能出现在空间中的任何一个位置，这就需要计算节点之间通过通信交换颗粒[5]。同时，当大量的颗粒在空间移动时，每个计算节点可能处理不同数量的颗粒，从而造成计算量严重失衡。解决这些问题的关键是减少计算节点之间的通信开销，其基本思路同并行图像合成算法。

4.2.1.3重要信息的提取与显示技术

这一思想的两个技术是流场可视化的层次流线束技术和用于标量数据的基于距离场的可视化技术。

4.2.1.4原位可视化

现有的存储系统无法把所有的计算数据都保存下来。常用方法是采用空间或者时间上的采样方法。

4.2.2大数据可视化分析

4.2.2.1原位交互分析技术

4.2.2.2数据存储技术

4.2.2.3可视化分析算法

4.2.2.4不确定性的量化

4.2.2.5并行计算

4.2.2.7领域资源库、框架以及工具

4.2.2.8用户界面与交互设计，以人为中心的用户界面与交互设计

4.3可视化平台搭建

跑友的移动终端将采集数据通过云计算WEB端口上传信息数据，服务器将数据存储和处理的请求传递给云计算平台，完成数据处理工作。另一方面，可视化用户通过浏览器、微信等入口浏览查看当前所在位置周边“占领区域”的可视化效果。

“跑步点亮北京”可视化平台由1个主节点、1个备用节和N个从节点构成。主节点负责任务调度，它并不担任任务计算角色，是整个云平台的的管理者和调度者。备用主节点是为了防止主节点出现故障或者宕机而导致整个集群工作受阻的情况，它会在主节点出现故障时代替主节点执行对各节点的调度工作，相当于主节点的替补。在主节点和从节点的任务分配上，主节点负责接收客户端提交的作业请求，然后根据相应的算法将作业进行拆分，分配给从节点执行相应的计算，当从节点计算完分配的作业后，主节点负责将从节点的计算结果进行整

合，将最终结果返回给客户端。

4.6面向大数据主流应用的信息可视化技术

4.6.1 文本可视化

文本信息是大数据时代非结构化数据类型的典型代,按照一定规律进行布局排列,用大小、颜色、字体等图形属性对关键词进行可视化.目前,大多用字体大小代表该关键词的重要性

4.6.2 网络(图)可视化

网络关联关系是大数据中最常见的关系,例如互联网与社交网络.层次结构数据也属于网络信息的一种特殊情况.基于网络节点和连接的拓扑关系,直观地展示网络中潜在的模式关系,

规模图可视化的主要手段[5]:

• 一类简化是对边进行聚集处理 ,使得复杂网络可视化效果更为清晰

• 另一类简化是通过层次聚类与多尺度交互,将大规模图转化为层次化树结构,并通过多尺度交互来对不同层次的图进行可视化.

4.6.3 时空数据可视化

时空数据是指带有地理位置与时间标签的数据.传感器与移动终端的迅速普及,使得时空数据成为大数据时代典型的数据类型.时空数据可视化与地理制图学相结合,重点对时间与空间维度以及与之相关的信息

对象属性建立可视化表征,对与时间和空间密切相关的模式及规律进行展示.大数据环境下时空数据的高维性、实时性等特点,也是时空数据可视化的重点.

4.6.4 多维数据可视化

多维数据指的是具有多个维度属性的数据变量,广泛存在于基于传统关系数据库以及数据仓库的应用中,例如企业信息系统以及商业智能系统.多维数据分析的目标是探索多维数据项的分布规律和模式,并揭示不同度属性之间的隐含关系

4.7. 支持可视分析的人机交互技术

信息可视化中的人机交互技术主要可概括为5 类:动态过滤技术(dynamic queries)与动态过滤用户界面、整体+详细技术(overview+detail)与Overview+Detail 用户界面、平移+缩放技术(panning+zooming)与可缩放用户界面(ZUI)、焦点+上下文技术(focus+context)与Focus+Context 用户界面、多视图关联协调技术(multiple coordinated views)与关联多视图用户界面[8]

4.7.1 支持可视分析过程的界面隐喻与交互组件

4.7.2 多尺度、多焦点、多侧面交互技术

(1) 多尺度界面与语义缩放(semantic zooming)技术[8]

当数据的规模超过了屏幕像素的总和,往往无法一次将所有的数据显示出来.多尺度界面(multi-scaleinterfaces是解决这一问题的有效方法,它使用不同级别的空间尺度(scale)组织信息,将尺度(scale)的层次与信息呈现的内容联系起来,将平移与缩放作为主要交互技术.各种信息可视化对象的外观随着尺度的大小进行语义缩放.

(2) 焦点+上下文(focus+context,简称F+C)技术Focus+Context 技术(F+C)的起源是广义鱼眼视图(generalized fisheye views)的提出,它将用户关注的焦点对象(focus)与整体上下文环境(context)同时显示在一个视图内,通过关注度函数(degree of interest function,简称

DOI Function)对视图中的对象进行选择性变形,突出焦点对象,而将周围环境上下文中的对象逐渐缩小

4.7..3 面向Post-WIMP的自然交互技术

Post-WIMP 交互技术极大地提升了交互方式的自然性,

例如多通道交互、触摸式交互、笔交互等,尤其适合可视分析的应用需求.

4.8.“跑步点亮北京”的可视化方案

由于用户群体主要集中于移动端，如微信等平民应用，所以将以H5应用结合当前Css3在3D和更多新特性为“跑步点亮北京”提供基本的可视样式，同时借助百度Echarts等成熟的第三方js图标应用，快速地将我们虚拟地图的“占领”情况显示出来。

如何进行web客户端和后台spark集群通信，正确的方案是，中间还有一个web服务器，客户端不与spark集群直接通信，由于为了不影响用户体验，数据的更新操作将采用后台异步的方式提交和获取数据。由于采用H5,所以可有如下两种比价好的方案：

a)ajax长轮询

b)websocket

每种方案在用户数量不同的阶段各有利弊，不过，建议采用websocket的方式，WebSocket 是 HTML5 一种新的协议。它实现了浏览器与服务器全双工通信，能更好的节省服务器资源和带宽并达到实时通讯，当用户数量较少，且web服务器还能够支持相应的并发量，可采用此种方式作为起步，较为简单。

5.个人针对可视分析未来预测

l移动化（移动端自由缩放、数据将实时更新、简易交互）

l3D多维化、全时空可视化、时空轨迹

l虚拟互动化（VR、MR）、人机交互

l多度关联化（人事物时空关联）

l高速化

l简易化（html5+css3+js）

l多屏互动，可视化的通信、沟通、协作、分享、存储

l服务衍生化（深度分析，预测决策，精准推荐）

l算法（可扩展性、减少搜索空间）

l实用平民化

6.个人学习规划

lhtml5+css3+js进阶

lPython进阶

lR语言

lScala语言+spark深入

l可视化算法、大数据分析算法

7.总结

随着大数据时代的到来，人们越来越难以从海量的数据中提取出有用的价值，而可视分析不仅要更快更准确地把有价值的信息提取出来，更要以用户为中心的进行交互展示，认知、可视化、人机交互的深度融合.“跑步点亮北京”虽然只是一个简单的可视应用，通过不同跑团的跑步进行攻占与拓展区域，可视为简单的打卡游戏，激励人们跑步去认识彼此周遭的环境，更加积极往户外走走，认识一个全新的世界。

通过大概一周的大量阅读各种Spark和可视分析的文章，虽然不能够对一些算法和机理有深刻的理解，可是已有了一个初步的认知，且已逐渐发现在计算机领域，很多知识是相通的，比如Spark中的任务调度和计算机的任务调度是一样的原理，所以，扎实的基础是必要的，我也喜欢这个方向，也想向这个方向做出更大的努力。

参考文献

[1] 任磊, 杜一, 马帅,等. 大数据可视分析综述[J]. 软件学报, 2014(9):1909-1936.

[2] 谢然. TOP50+5大数据可视化分析工具[J]. 互联网周刊, 2014(17):58-59.

[3] 陈明. 大数据可视化分析[J]. 计算机教育, 2015(5).

[4] 王鑫. 基于SPARK的流场可视化任务处理框架研究[D]. 中国海洋大学, 2015.

[5] 李爽. 基于Spark的数据处理分析系统的设计与实现[D]. 北京交通大学, 2015.

[6] 李文, 程华良, 彭耀,等. 基于Spark可视化大数据挖掘平台[C]// 系统仿真技术及其应用学术论文集. 2014.

[7] 秦勃, 朱勇, 秦雪. 基于Spark框架的乘潮水位计算与可视化平台[J]. 计算机工程与科学, 2015, 37(12):2216-2221.

[8] 兰红. 数据挖掘的数据准备与交互式可视化研究[D]. 江西理工大学, 2007.

你可能感兴趣的:(大数据)

飞算科技：以创新科技引领数字化变革，旗下飞算 JavaAI 成开发利器飞算JavaAI开发助手科技
作为国家级高新技术企业，飞算科技专注于自主创新，在数字科技领域持续深耕，用前沿技术为各行业客户赋能，助力其实现数字化转型升级的飞跃。飞算科技凭借深厚的技术积累，将互联网科技、大数据、人工智能等技术与实际应用紧密融合。公司组建了一支由行业资深专家和技术精英构成的团队，他们在相关领域积累了多年实践经验，深刻理解不同行业客户在数字化进程中面临的痛点与挑战。基于这些洞察，飞算科技推出了一系列具有创新性和实
Java 大视界 -- Java 大数据机器学习模型在金融市场情绪分析与投资策略制定中的应用青云交大数据新视界 Java 大视界 java 大数据机器学习情绪分析智能投资多源数据
Java大视界--Java大数据机器学习模型在金融市场情绪分析与投资策略制定中的应用）引言：正文：一、金融情绪数据的立体化采集与治理1.1多模态数据采集架构1.2数据治理与特征工程二、Java机器学习模型的工程化实践2.1情感分析模型的深度优化2.2强化学习驱动的动态投资策略三、顶级机构实战：Java系统的金融炼金术四、技术前沿：Java与金融科技的未来融合4.1量子机器学习集成4.2联邦学习在合
Java 大视界 -- Java 大数据在影视内容推荐与用户兴趣挖掘中的深度实践（183）青云交大数据新视界 Java 大视界 Java+Python 双剑合璧：AI 大数据实战通关秘籍大数据影视内容推荐用户兴趣挖掘协同过滤基于内容推荐数据可视化个性化推荐系统
亲爱的朋友们，热烈欢迎来到青云交的博客！能与诸位在此相逢，我倍感荣幸。在这飞速更迭的时代，我们都渴望一方心灵净土，而我的博客正是这样温暖的所在。这里为你呈上趣味与实用兼具的知识，也期待你毫无保留地分享独特见解，愿我们于此携手成长，共赴新程！全网（微信公众号/CSDN/抖音/华为/支付宝/微博）：青云交一、欢迎加入【福利社群】点击快速加入1：青云交技术圈福利社群（NEW)点击快速加入2：2025CS
Java 大视界 -- 基于 Java 的大数据分布式文件系统在科研数据存储与共享中的应用优化（187）青云交大数据新视界 Java 大视界 Java+Python 双剑合璧：AI 大数据实战通关秘籍大数据大数据分布式文件系统科研数据存储科研数据共享应用优化 HDFS 数据分区
亲爱的朋友们，热烈欢迎来到青云交的博客！能与诸位在此相逢，我倍感荣幸。在这飞速更迭的时代，我们都渴望一方心灵净土，而我的博客正是这样温暖的所在。这里为你呈上趣味与实用兼具的知识，也期待你毫无保留地分享独特见解，愿我们于此携手成长，共赴新程！全网（微信公众号/CSDN/抖音/华为/支付宝/微博）：青云交一、欢迎加入【福利社群】点击快速加入1：青云交技术圈福利社群（NEW)点击快速加入2：CSDN博客
Python医疗大数据实战：基于Scrapy-Redis的医院评价数据分布式爬虫设计与实现 Python爬虫项目 python 开发语言爬虫 selenium scrapy
摘要本文将详细介绍如何使用Python构建一个高效的医院评价数据爬虫系统。我们将从爬虫基础讲起，逐步深入到分布式爬虫架构设计，使用Scrapy框架结合Redis实现分布式爬取，并采用最新的反反爬技术确保数据采集的稳定性。文章包含完整的代码实现、性能优化方案以及数据处理方法，帮助读者掌握医疗大数据采集的核心技术。关键词：Python爬虫、Scrapy-Redis、分布式爬虫、医疗大数据、反反爬技术1
flink-sql读写hive-1.13 第一片心意 flink flink sql hive
1.版本说明本文档内容基于flink-1.13.x，其他版本的整理，请查看本人博客的flink专栏其他文章。1.1.概述ApacheHive已经成为了数据仓库生态系统中的核心。它不仅仅是一个用于大数据分析和ETL场景的SQL引擎，同样也是一个数据管理平台，可用于发现，定义，和演化数据。Flink与Hive的集成包含两个层面。一是利用了Hive的MetaStore作为持久化的Catalog，用户可通
觉察与正念佳佳的宝瓶子
今天因为交电费的事与妈妈沟通。在沟通的过程中，年届八十的母亲一直给我强调着过去怎么怎么。父母家的电费一直是银行代扣的，这样的模式自从可以通过银行代扣便开始了。可见那时候的父母还是蛮新潮的，能接受新事物的。至从有了智能手机，人类便进入了大数据时代。通过微信或支付宝来交电费方便得多。可惜父亲不在了，老母亲是连手机都坚决不用的人。（因为想要掩饰自己的不能、不敢，所以干脆拒绝！不愿意做任何的改变）。今年，
Java大视界：Java大数据在智能医疗电子健康档案数据挖掘与健康服务创新＞ Loving_enjoy 计算机学科论文创新点人工智能深度学习迁移学习经验分享
>本文通过完整代码示例，揭秘如何用Java大数据技术挖掘电子健康档案价值，实现疾病预测、个性化健康管理等创新服务。###一、智能医疗时代的数据金矿电子健康档案（EHR）作为医疗数字化的核心载体，包含海量患者全生命周期健康数据。据统计，全球医疗数据量正以每年**48%的速度增长**，单个三甲医院年数据量可达**PB级**。这些数据蕴藏着疾病规律、治疗效能的宝贵知识，但传统技术难以有效挖掘。**Jav
无人值守人工智能智慧系统数据分析：深度洞察与未来展望呆码科技人工智能数据分析数据挖掘
无人值守人工智能智慧系统数据分析：深度洞察与未来展望随着科技的飞速发展，人工智能（AI）技术已逐渐渗透到社会经济的各个领域，其中无人值守人工智能智慧系统作为AI技术应用的前沿阵地，正引领着一场深刻的行业变革。这类系统通过集成高级算法、大数据分析、物联网（IoT）及云计算等先进技术，实现了对复杂环境的自主监控、智能决策与高效管理，极大地提升了运营效率，降低了人力成本，并开启了数据驱动决策的新纪元。本
浮漂式水质监测设备：智能守护水环境的未来之眼柏峰电子人工智能
浮漂式水质监测设备：智能守护水环境的未来之眼柏峰【BF-FBSZ】随着全球水资源短缺和水污染问题日益严峻，水质监测技术正迎来前所未有的发展机遇。作为这一领域的创新突破，浮漂式水质监测设备凭借其实时性、智能化和网络化优势，正在重塑水资源管理的新格局。本文将深入探讨这一技术的原理、特点、应用场景及未来发展趋势。一、技术原理与系统架构浮漂式水质监测设备是一种集成了现代传感器技术、物联网和大数据分析的智能
基于蜣螂算法优化多头注意力机制的卷积神经网络结合双向长短记忆神经网络实现温度预测DBO-CNN-biLSTM-Multihead-Attention附matlab代码 matlab科研助手神经网络算法 cnn
✅作者简介：热爱科研的Matlab仿真开发者，修心和技术同步精进，代码获取、论文复现及科研仿真合作可私信。个人主页：Matlab科研工作室个人信条：格物致知。更多Matlab完整代码及仿真定制内容点击智能优化算法神经网络预测雷达通信无线传感器电力系统信号处理图像处理路径规划元胞自动机无人机物理应用机器学习内容介绍温度预测在气象学、农业、能源等领域具有重要的应用价值。随着大数据和人工智能技术的快速发
基于Socket来构建无界数据流并通过Flink框架进行处理每天五分钟玩转人工智能 Flink技术实战 flink 大数据 Flink 分布式无界数据
本文重点随着大数据技术的不断发展，实时数据流处理已成为企业应对海量数据、实现快速决策的关键技术。ApacheFlink是一个开源的流处理框架，它能够对无界数据流进行高效的、精确的处理。本文将介绍如何通过Socket构建无界数据流，并利用Flink框架进行无界流处理。基于Socket构建无界数据无界数据指的是源源不断产生的数据，这些数据通常来自各种实时数据源，如用户行为日志、传感器数据等。Socke
sgg大数据全套技术链接[plus] 原来是大华啊~ 资源大数据
写在开头：感谢尚硅谷，尚硅谷万岁，我爱尚硅谷111个技术栈+43个项目，兄弟们，冲！最近小米又又又火了一把，致敬所有造福人民的企业和伟大的企业家，致敬雷军，小米，致敬马云，致敬尚硅谷，致敬所有为人民谋福的英雄人物和企业，再次献上我诚挚的敬意，致敬！尚硅谷大数据全套111个技术1.Java从入门到精通JDK版链接：https://pan.baidu.com/s/1GAc610SYSMmZBuOX4D
疫情下，我的健康码首次变成了黄码唯我一心
3月中旬，老公在广州白云区接了一单生意，要很久才回来，就在那里租了一间房，带我和孩子一起住。房子在七楼，步梯，因孩子小，自己就很少下楼，都是他买菜回来，4月8号，订单完成，返程回了佛山。过了两天突然接到短信通知，白云区要大规模核酸筛查，又过一天收到短信:通过大数据分析，您近期行程涉及疫情防控重点区域，您的健康码将被赋予2次黄码并需开展2次核酸检测，请注意健康码状态，尽快凭码到附近黄码核酸检测点进行
到底应该怎么抓语文成绩山东董纯
上学期期末考试，全区统一采用网上阅卷的形式。在这个大数据时代，在这个极为透明的数据时代，一旦采用这样网络统一阅卷的形式。那丑媳妇就要真的见公婆了。再这样一个要生源没生源。要学习积极性没有学习积极性的氛围里。想取得好的成绩是真的难上加难。尽管已经预料到跟其他兄弟学校有一定的差距。但是没有想到差距如此之大。领导们坐不住了，反复约谈备课组长。理由是其他科目差距不大，甚至有优势。为什么语文学科会有如此大的
告别内存焦虑！用Dask打开Python大数据并行计算的“任意门“ 小张在编程 python 大数据开发语言
引言当你在Jupyter里用Pandas读取20GB的CSV文件，看到内存占用率从10%飙升到90%，最后弹出"MemoryError"时；当你想对亿级数据做分组聚合，却发现单线程计算要等上半小时——这些场景是不是像极了用小推车搬运万吨货物？Python生态中，Dask库就像一台"并行计算推土机"，能把大数据拆分成小块并行处理，让你的普通电脑也能拥有分布式计算的能力。本文将从原理到实战，带你掌握这
python大数据论文_大数据环境下基于python的网络爬虫技术 weixin_39775976 python大数据论文
软件开发大数据环境下基于python的网络爬虫技术作者/谢克武，重庆工商大学派斯学院软件工程学院摘要：随着互联网的发展壮大，网络数据呈爆炸式增长，传统捜索引擎已经不能满足人们对所需求数据的获取的需求，作为搜索引擎的抓取数据的重要组成部分，网络爬虫的作用十分重要，本文首先介绍了在大数据环境下网络爬虫的重要性，接着介绍了网络爬虫的概念，工作原理，工作流程，网页爬行策略，python在编写爬虫领域的优势
Redis性能测试：工具、参数与实战示例 Seal^_^ 数据库专栏 #数据库--Redis redis 数据库 Redis性能测试
Redis性能测试：工具、参数与实战示例1.Redis性能测试概述2.redis-benchmark基础使用2.1基本语法2.2简单示例3.性能测试参数详解4.实战测试示例4.1基础测试4.2指定命令测试4.3带随机key的测试4.4大数据测试4.5管道测试5.性能测试流程图6.测试结果分析与优化建议6.1结果解读6.2优化建议7.高级测试场景7.1持久化影响测试7.2集群测试7.3长时间稳定性测
2025年各细分产业链企业数据(汽车、数字经济、食品、制造业) 经管数据库汽车智能手机数据分析
本数据包含2025年及之前的所有上中下游企业信息，67个细分产业。汽车专区、数字经济专区、数字创意专区、未来产业专区、高端装备专区、新能源专区、食品农业专区、传统制造业专区等71个文件。汽车专区：充电桩制造动力电池汽车材料制造汽车制造汽车制造设备汽车座椅制造驱动电机制造燃料电池汽车制造燃料电池系统制造新能源汽车制造智能驾驶智能视觉数字经济专区：5g边缘计算大数据类服务器光通信集成电路区块链人工智能
C#语法基础总结（超级全面）（二） inwith C#语法基础 c#开发语言
文章目录c#语法基本元素关键字操作符（operator）类型转换标识符（Identifier）语句try语句迭代语句（循环语句）索引器文本（字面值）五大数据类型引用类型：值类型：变量、对象与内存装箱和拆箱类类的实例化类的三大成员（属性、方法、事件）属性（property）方法（函数）方法参数值参数引用参数输出参数数组参数具名参数可选参数扩展方法（this参数）方法的重载构造器（constructo
SQL 常用版本语法概览：标准演进与关键语法分析
一、引言SQL（StructuredQueryLanguage，结构化查询语言）是关系型数据库系统的核心语言，自1986年成为ANSI和ISO标准以来，经历了多次版本演进，不断增强语义表达能力以适应复杂的企业数据需求。随着数据库技术的不断发展，各大数据库厂商（如Oracle、SQLServer、PostgreSQL、MySQL等）在实现标准的基础上扩展了大量方言语法，使得掌握SQL的标准语法版本成
主流数据库语言语法对比两圆相切数据库
以下是五大数据库（MySQL、PostgreSQL、Oracle、SQLServer、SQLite）核心语法对比，涵盖DDL、DML、查询、函数、事务等全场景，包含底层原理差异和实用示例。##一、数据一、类型深度对比分类MySQLPostgreSQLOracleSQLServerSQLite整数TINYINT,INT,BIGINTSMALLINT,INT,BIGINTNUMBER(10)TIN
Hadoop与云原生集成：弹性扩缩容与OSS存储分离架构深度解析
Hadoop与云原生集成的必要性Hadoop在大数据领域的基石地位作为大数据处理领域的奠基性技术，Hadoop自2006年诞生以来已形成包含HDFS、YARN、MapReduce三大核心组件的完整生态体系。根据CSDN技术社区的分析报告，全球超过75%的《财富》500强企业仍在使用Hadoop处理EB级数据，其分布式文件系统HDFS通过数据分片（默认128MB块大小）和三副本存储机制，成功解决了P
深入TA-Lib：量化技术指标详解
深入TA-Lib：量化技术指标详解本文系统讲解TA-Lib技术指标分析，涵盖基础、数据处理、趋势与动量指标、均量线、布林线等，并结合Python代码与大数据、机器学习实战案例，助力读者掌握量化交易实战技巧。本文系统梳理了TA-Lib技术指标分析的核心内容，包括TA-Lib基础、数据处理、趋势与动量指标、均量线、布林线等关键技术指标分析方法，并结合Python代码示例与大数据、机器学习的融合实战案例
大数据时代下的时序数据库选型指南：基于工业场景的IoTDB技术优势与适用性研究 Loving_enjoy 计算机学科论文创新点机器学习 facebook 经验分享课程设计
>在宝钢集团的智能工厂里，5万多个传感器每秒产生150万+数据点，传统数据库系统每天积压3TB未处理数据——这揭示了工业4.0时代的核心矛盾：**海量时序数据处理能力已成为智能制造的关键瓶颈**。###工业时序数据的四大特殊性工业场景下的时序数据与传统互联网数据存在本质差异：1.**高精度时间要求**-数控机床振动监测需微秒级时间戳-电网故障定位要求时间同步精度≤1μs2.**多源异构性**```
斗鱼大数据面试题及参考答案大模型大数据攻城狮大数据大数据面试 hadoop面试 spark面试 flink面试手撕SQL 手撕代码
GC（垃圾回收）相关知识一、常见的GC收集器SerialGCSerialGC是最基本的垃圾收集器，它是单线程的。在进行垃圾收集时，会暂停所有的用户线程，直到垃圾收集完成。它的工作过程比较简单，首先标记出所有的垃圾对象，然后将它们清除。例如，在一个小型的、对响应时间要求不高的Java应用程序中，如简单的命令行工具，SerialGC可以满足垃圾收集的需求。因为这种应用程序通常没有很高的并发要求，暂停用
Java 大视界 -- Java 大数据机器学习模型在金融市场情绪指数构建与投资决策支持中的应用（339）青云交大数据新视界 Java 大视界 java 大数据机器学习金融情绪指数投资决策量化策略情绪分析
Java大视界--Java大数据机器学习模型在金融市场情绪指数构建与投资决策支持中的应用（339）引言：正文：一、Java构建的金融市场情绪数据采集与预处理体系1.1多源异构数据接入引擎1.2数据采集延迟测试报告1.3情绪数据预处理管道二、Java驱动的金融市场情绪指数构建模型2.1多维度情绪指数计算框架2.2情绪指数与投资决策的映射模型三、Java在金融投资决策支持中的实战应用3.1量化私募情绪
数字孪生技术为UI前端注入新活力：实现产品设计的沉浸式体验 ui设计前端开发老司机 ui
hello宝子们...我们是艾斯视觉擅长ui设计、前端开发、数字孪生、大数据、三维建模、三维动画10年+经验!希望我的分享能帮助到您!如需帮助可以评论关注私信我们一起探讨!致敬感谢感恩!一、引言：从“平面交互”到“沉浸体验”的UI革命当用户在电商APP中翻看3D家具模型却无法感知其与自家客厅的匹配度，当设计师在2D屏幕上绘制汽车内饰却难以预判实际乘坐体验——传统UI设计的“平面化、静态化、割裂感”
提升企业级数据处理效率！TDengine 四个集群优化点详解 TDengine （老段） TDengine 运维大数据数据库物联网时序数据库服务器运维 tdengine
为了帮助企业更好地进行大数据处理，我们在此前TDengine3.x系列版本中进行了几项与集群相关的优化和新功能开发，以提升集群的稳定性和在异常情况下的恢复能力。这些优化包括clusterID隔离、leaderrebalance、raftlearner和restorednode。本文将对这几项重要优化进行详细阐述，以解答企业在此领域的疑问，并帮助大家更好地应对相关挑战。clusterID隔离问题fi
中国银联豪掷1亿采购海光C86架构服务器信创新态势海光芯片 C86 国产芯片海光信息
近日，中国银联国产服务器采购大单正式敲定，基于海光C86架构的服务器产品中标，项目金额超过1亿元。接下来，C86服务器将用于支撑中国银联的虚拟化、大数据、人工智能、研发测试等技术场景，进一步提升其业务处理能力、用户服务效率和信息安全水平。作为我国重要的银行卡组织和金融基础设施，中国银联在全球183个国家和地区设有银联受理网络，境内外成员机构超过2600家，是世界三大银行卡品牌之一。此次中国银联发力
C/C++Win32编程基础详解视频下载择善Zach 编程 C++Win32
课题视频：C/C++Win32编程基础详解视频知识：win32窗口的创建 windows事件机制主讲：择善Uncle老师学习交流群：386620625 验证码：625 --
Guava Cache使用笔记 bylijinnan java guava cache
1.Guava Cache的get/getIfPresent方法当参数为null时会抛空指针异常我刚开始使用时还以为Guava Cache跟HashMap一样，get(null)返回null。实际上Guava整体设计思想就是拒绝null的，很多地方都会执行com.google.common.base.Preconditions.checkNotNull的检查。 2.Guava
解决ora-01652无法通过128（在temp表空间中） 0624chenhong oracle
解决ora-01652无法通过128（在temp表空间中）扩展temp段的过程一个sql语句后，大约花了10分钟，好不容易有一个结果，但是报了一个ora-01652错误，查阅了oracle的错误代码说明：意思是指temp表空间无法自动扩展temp段。这种问题一般有两种原因：一是临时表空间空间太小，二是不能自动扩展。分析过程：既然是temp表空间有问题，那当
Struct在jsp标签不懂事的小屁孩 struct
非UI标签介绍：控制类标签： 1：程序流程控制标签 if elseif else <s:if test="isUsed"> <span class="label label-success">True</span> </
按对象属性排序换个号韩国红果果 JavaScript 对象排序
利用JavaScript进行对象排序，根据用户的年龄排序展示 <script> var bob={ name;bob, age:30 } var peter={ name;peter, age:30 } var amy={ name;amy, age:24 } var mike={ name;mike, age:29 } var john={
大数据分析让个性化的客户体验不再遥远蓝儿唯美数据分析
顾客通过多种渠道制造大量数据，企业则热衷于利用这些信息来实现更为个性化的体验。分析公司Gartner表示，高级分析会成为客户服务的关键，但是大数据分析的采用目前仅局限于不到一成的企业。挑战在于企业还在努力适应结构化数据，疲于根据自身的客户关系管理（CRM）系统部署有效的分析框架，以及集成不同的内外部信息源。然而，面对顾客通过数字技术参与而产生的快速变化的信息，企业需要及时作出反应。要想实
java笔记4 a-john java
操作符 1，使用java操作符操作符接受一个或多个参数，并生成一个新值。参数的形式与普通的方法调用不用，但是效果是相同的。加号和一元的正号（+）、减号和一元的负号（-）、乘号（*）、除号（/）以及赋值号（=）的用法与其他编程语言类似。操作符作用于操作数，生成一个新值。另外，有些操作符可能会改变操作数自身的
从裸机编程到嵌入式Linux编程思想的转变------分而治之：驱动和应用程序 aijuans 嵌入式学习
笔者学习嵌入式Linux也有一段时间了，很奇怪的是很多书讲驱动编程方面的知识，也有很多书将ARM9方面的知识，但是从以前51形式的（对寄存器直接操作，初始化芯片的功能模块）编程方法，和思维模式，变换为基于Linux操作系统编程，讲这个思想转变的书几乎没有，让初学者走了很多弯路，撞了很多难墙。笔者因此写上自己的学习心得，希望能给和我一样转变
在springmvc中解决FastJson循环引用的问题 asialee 循环引用 fastjson
我们先来看一个例子： package com.elong.bms; import java.io.OutputStream; import java.util.HashMap; import java.util.Map; import co
ArrayAdapter和SimpleAdapter技术总结百合不是茶 android SimpleAdapter ArrayAdapter 高级组件基础
ArrayAdapter比较简单，但它只能用于显示文字。而SimpleAdapter则有很强的扩展性，可以自定义出各种效果 ArrayAdapter;的数据可以是数组或者是队列 // 获得下拉框对象 AutoCompleteTextView textview = (AutoCompleteTextView) this
九封信 bijian1013 人生励志
有时候，莫名的心情不好，不想和任何人说话，只想一个人静静的发呆。有时候，想一个人躲起来脆弱，不愿别人看到自己的伤口。有时候，走过熟悉的街角，看到熟悉的背影，突然想起一个人的脸。有时候，发现自己一夜之间就长大了。 2014，写给人
Linux下安装MySQL Web 管理工具phpMyAdmin sunjing PHP Install phpMyAdmin
PHP http://php.net/ phpMyAdmin http://www.phpmyadmin.net Error compiling PHP on CentOS x64 一、安装Apache 请参阅http://billben.iteye.com/admin/blogs/1985244 二、安装依赖包 sudo yum install gd
分布式系统理论 bit1129 分布式
FLP One famous theory in distributed computing, known as FLP after the authors Fischer, Lynch, and Patterson, proved that in a distributed system with asynchronous communication and process crashes,
ssh2整合(spring+struts2+hibernate)-附源码白糖_ eclipse spring Hibernate mysql 项目管理
最近抽空又整理了一套ssh2框架，主要使用的技术如下： spring做容器，管理了三层(dao,service,actioin)的对象 struts2实现与页面交互(MVC)，自己做了一个异常拦截器，能拦截Action层抛出的异常 hibernate与数据库交互 BoneCp数据库连接池，据说比其它数据库连接池快20倍，仅仅是据说 MySql数据库项目用eclipse
treetable bug记录 braveCS table
// 插入子节点删除再插入时不能正常显示。修改： //不知改后有没有错，先做个备忘 Tree.prototype.removeNode = function(node) { // Recursively remove all descendants of +node+ this.unloadBranch(node); // Remove
编程之美-电话号码对应英语单词 bylijinnan java 算法编程之美
import java.util.Arrays; public class NumberToWord { /** * 编程之美电话号码对应英语单词 * 题目： * 手机上的拨号盘，每个数字都对应一些字母，比如2对应ABC，3对应DEF.........，8对应TUV，9对应WXYZ， * 要求对一段数字，输出其代表的所有可能的字母组合
jquery ajax读书笔记 chengxuyuancsdn jQuery ajax
1、jsp页面 <%@ page language="java" import="java.util.*" pageEncoding="GBK"%> <% String path = request.getContextPath(); String basePath = request.getScheme()
JWFD工作流拓扑结构解析伪码描述算法 comsci 数据结构算法工作活动 J#
对工作流拓扑结构解析感兴趣的朋友可以下载附件，或者下载JWFD的全部代码进行分析 /* 流程图拓扑结构解析伪码描述算法 public java.util.ArrayList DFS(String graphid, String stepid, int j)
oracle I/O 从属进程 daizj oracle
I/O 从属进程　　I/O从属进程用于为不支持异步I/O的系统或设备模拟异步I/O.例如，磁带设备(相当慢)就不支持异步I/O.通过使用I/O 从属进程，可以让磁带机模仿通常只为磁盘驱动器提供的功能。就好像支持真正的异步I/O 一样，写设备的进程(调用者)会收集大量数据，并交由写入器写出。数据成功地写出时，写入器(此时写入器是I/O 从属进程，而不是操作系统)会通知原来的调用者，调用者则会
高级排序:希尔排序 dieslrae 希尔排序
public void shellSort(int[] array){ int limit = 1; int temp; int index; while(limit <= array.length/3){ limit = limit * 3 + 1;
初二下学期难记忆单词 dcj3sjt126com english word
kitchen 厨房 cupboard 厨柜 salt 盐 sugar 糖 oil 油 fork 叉；餐叉 spoon 匙；调羹 chopsticks 筷子 cabbage 卷心菜；洋白菜 soup 汤 Italian 意大利的 Indian 印度的 workplace 工作场所 even 甚至；更 Italy 意大利 laugh 笑 m
Go语言使用MySQL数据库进行增删改查 dcj3sjt126com mysql
目前Internet上流行的网站构架方式是LAMP，其中的M即MySQL, 作为数据库，MySQL以免费、开源、使用方便为优势成为了很多Web开发的后端数据库存储引擎。MySQL驱动Go中支持MySQL的驱动目前比较多，有如下几种，有些是支持database/sql标准，而有些是采用了自己的实现接口,常用的有如下几种: http://code.google.c...o-mysql-dri
git命令 shuizhaosi888 git
---------------设置全局用户名： git config --global user.name "HanShuliang" //设置用户名 git config --global user.email "[email protected]" //设置邮箱 ---------------查看环境配置 git config --li
qemu-kvm 网络 nat模式 (四) haoningabc kvm qemu
qemu-ifup-NAT #!/bin/bash BRIDGE=virbr0 NETWORK=192.168.122.0 GATEWAY=192.168.122.1 NETMASK=255.255.255.0 DHCPRANGE=192.168.122.2,192.168.122.254 TFTPROOT= BOOTP= function check_bridge()
不要让未来的你，讨厌现在的自己 jingjing0907 生活奋斗工作梦想
故事one 　23岁，他大学毕业，放弃了父母安排的稳定工作，独闯京城，在家小公司混个小职位，工作还算顺手，月薪三千，混了混，混走了一年的光阴。　　　　24岁，有了女朋友，从二环12人的集体宿舍搬到香山民居，一间平房，二人世界，爱爱爱。偶然约三朋四友，打扑克搓麻将，日子快乐似神仙；　　　　25岁，出了几次差，调了两次岗，薪水涨了不过百，生猛狂飙的物价让现实血淋淋，无力为心爱银儿购件大牌
枚举类型详解一路欢笑一路走 enum 枚举详解 enumset enumMap
枚举类型详解一.Enum详解 1.1枚举类型的介绍 JDK1.5加入了一个全新的类型的”类”—枚举类型，为此JDK1.5引入了一个新的关键字enum,我们可以这样定义一个枚举类型。 Demo:一个最简单的枚举类 public enum ColorType { RED
第11章动画效果（上） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Eclipse中jsp、js文件编辑时，卡死现象解决汇总 ljf_home eclipse jsp卡死 js卡死
使用Eclipse编辑jsp、js文件时，经常出现卡死现象，在网上百度了N次，经过N次优化调整后，卡死现象逐步好转，具体那个方法起到作用，不太好讲。将所有用过的方法罗列如下： 1、取消验证 windows–>perferences–>validation 把除了manual 下面的全部点掉，build下只留 classpath dependency Valida
MySQL编程中的6个重要的实用技巧 tomcat_oracle mysql
每一行命令都是用分号(;)作为结束对于MySQL，第一件你必须牢记的是它的每一行命令都是用分号(;)作为结束的，但当一行MySQL被插入在PHP代码中时，最好把后面的分号省略掉，例如： mysql_query("INSERT INTO tablename(first_name,last_name)VALUES('$first_name',$last_name')");
zoj 3820 Building Fire Stations(二分+bfs) 阿尔萨斯 Build
题目链接：zoj 3820 Building Fire Stations 题目大意：给定一棵树，选取两个建立加油站，问说所有点距离加油站距离的最大值的最小值是多少，并且任意输出一种建立加油站的方式。解题思路：二分距离判断，判断函数的复杂度是o(n)，这样的复杂度应该是o(nlogn)，即使常数系数偏大，但是居然跑了4.5s，也是醉了。判断函数里面做了3次bfs，但是每次bfs节点最多