唐名威

数值核反应堆大数据及其应用

点击上方蓝字关注我们

数值核反应堆大数据及其应用

汪岸, 任帅, 苗雪, 董玲玉, 朱迎, 陈丹丹, 胡长军

北京科技大学，北京 100083

摘要：数值核反应堆（数值堆）运行过程中涉及的海量数据可被用于优化现有数值堆模型、获取核能领域科学发现、推动数值堆研究。对现有的数据驱动建模和堆内微观现象预测的相关工作进行综述。在此基础上，结合领域特点提出了数值核反应堆大数据的概念，并分析了它作为工业大数据和模拟大数据的重要特征。以中国数值反应堆原型系统（CVR 1.0）为例，从数值堆大数据的多样性、关联性、非精确性等特征出发，运用神经网络、数理统计、数值分析等多学科的技术开展了建模优化和科学发现两个方向的研究工作，证明了数值核反应堆大数据特征对数值堆研究的指导作用。

关键词：数值核反应堆大数据 ; 工业大数据 ; 数值核反应堆 ; 大数据挖掘

论文引用格式：

汪岸, 任帅, 苗雪, 董玲玉, 朱迎, 陈丹丹, 胡长军. 数值核反应堆大数据及其应用[J]. 大数据, 2021, 7(5): 40-56.

An WANG, Shuai REN, Xue MIAO, Lingyu DONG, Ying ZHU, Dandan CHEN, Changjun HU. Big data of numerical nuclear reactor and its application[J]. Big Data Research, 2021, 7(5):40-56.

1 引言

数值核反应堆（以下简称数值堆）是一种基于超级计算机实现的软件系统，用于核反应堆内多物理耦合过程的高保真数值模拟和预测。数值堆被当成实际反应堆“外在”和“内在”的镜像，可以支撑包括反应堆的设计、建筑安装、运行、退役等过程在内的全周期从微观机理到宏观现象的研究。数值堆在运行中涉及的大量数据通常有两种用途：一是用于建模优化，即作为耦合计算的中间数据，辅助模型的建立和改进；二是用于科学发现，即作为研究分析的原始数据，获取对材料、机理的认识。

这些数据在数值堆这一复杂的多物理场模拟系统中流动，且进行精细计算，可以轻易产生PB级的数据量，因此在存储上要借助高吞吐、高并发的并行文件系统，在计算上要依赖高性能、高可用的处理器资源。在不同计算尺度、不同服役环境下，数据虽然体现为不同的含义、形式，但是它们都属于与核反应堆相关的计算数据，相互之间存在紧密的关联。从计算的部分来看，数值堆是核反应堆各种物理过程及其耦合模拟的算法实现，其中各过程通过计算数据相连；从数据的部分来看，数值堆是核反应堆各种计算数据的关联和相互转换，其中各数据通过物理过程相连。

数值核反应堆大数据就是数值堆运行过程中涉及的数据总和。作为数值堆的关键组成部分，数值核反应堆大数据具有两方面不可忽视的重要作用：对“内”，它为工程人员提供了形式复杂、关联紧密的计算数据，对其关联性的研究可用于改进数值堆的模拟性能；对“外”，它为科研人员提供了大量可供进一步挖掘分析的模拟数据，其中可能蕴含着有关核反应堆材料、物理化学机理的新认识。大数据技术的引入使数值核反应堆大数据的价值比以往更清晰地呈现出来，从而为发挥数值核反应堆大数据对“内”和对“外”的作用奠定了基础。

本文提出了数值核反应堆大数据的概念，阐述了数值堆大数据最重要的特点。从这些特点出发，引出了不同于传统数值堆模拟的研究方向，也就是基于数据的建模优化和科学发现。以中国数值反应堆原型系统（China virtual reactor 1.0， CVR1.0）为研究对象，本文论述了基于数值堆大数据的研究方向及成果，有力地证明了数据自身价值、数据与数据的关联性对数值堆研究的推动作用。

2 相关工作

随着计算机硬件水平的发展及核反应堆数据的积累，已有研究中利用机器学习、人工智能等技术手段对数值核反应堆大数据进行的挖掘分析着重于两个方面的研究工作：一是优化模拟模型，二是基于数据的挖掘分析进行科学发现。

2.1 数据驱动的建模优化方法

数据驱动的建模优化就是利用数值堆大数据改进数值堆的各种数值算法，具体涉及对整个计算模型或模型中部分模块的改进、替换，以及利用数据进行工况预测或模型计算。

（1）整个计算模型的改进和替换研究

改进、替换整个数值计算方法的研究重点集中在建立计算过程中输入与输出的非线性关系。例如，在中子学的研究中，基于细胞神经网络求解简单平板几何上的中子输运方程；将基于人工神经网络的偏微分求解方法应用于非线性源扩散、中子点动力学、辐射输运、一般非线性偏微分方程求解等许多与数值堆相关的问题中。在计算流体力学（computational fluid dynamics，CFD）的研究中，利用基于小样本集的机器学习方法解决数据价值密度低的问题及求解流体力学的NavierStokes方程。上述研究工作极大地节省了求解复杂方程所需的计算资源，但在比较复杂、缺少样本的几何条件下仍然难以达到理想效果。

（2）模型部分模块的改进研究

在模型的部分模块、算法中也可以基于数据驱动提出改进策略。例如，在计算流体力学的研究中，以核反应堆大数据为驱动修正现有湍流模型的经验系数；利用深度神经网络从高精度模拟数据中学习雷诺应力各向异性张量模型；利用监督学习算法建立湍流模型中的闭包项，并将闭包项插入计算流体力学数值模拟中，以得到更好的湍流物理表示；通过训练卷积网格来预测任意给定几何的最优网格密度，加速最优网格的生成。在材料势函数的研究中，通过机器学习对势函数库进行学习，开发用于势函数计算的机器学习模型，该模型可以在保证势函数精度的基础上将计算时间减少几个数量级；将势函数机器学习模型和分子动力学（molecular dynamics，MD）模拟软件LAMMPS集成起来，扩大原有计算规模。上述研究工作通过对部分模块或算法进行改进来达到优化模型整体的目的。

（3）工况预测或模型数据研究

还有许多研究集中在利用实验数据、设备数据直接进行工况预测，或者为数值堆提供计算数据。例如，在中子物理计算方面，基于人工神经网络的方法可用于中子深度剖面分析及中子能谱解谱。在计算流体力学方面，自联想神经网络可用于核电站在线监测及传感器校验技术构建；支持向量机模型与多元状态估计方法可用于核电站的运行工况估计；改进径向基函数网络模型和遗传算法可用于核电站瞬态工况诊断识别技术的构建；利用机器学习等进行棒束子通道热工水力特性的预测。上述研究不依赖对实际物理过程的理解，且训练数据充足，能被广泛应用。

2.2 基于数据挖掘分析的科学发现

基于数据的挖掘分析进行科学发现是数值核反应堆大数据研究的重要目标之一。近几年，机器学习算法已被有效地用于材料和分子的原子尺度模拟，应用领域包括探索结构与属性之间的关系以及模式匹配，以指导材料设计和预测新化合物。随着计算能力不断增长，模拟生成的数据越来越多，使用机器学习从数据中提取知识变得越来越重要。无监督机器学习算法可用于数据模式的探索、可视化和分类，而无须训练样本（具有相应输出值或类别标签的样本输入），它已被有效地应用于材料和分子科学领域。然而，无监督学习在辐照损伤研究领域的应用仍然处于起步阶段。由国际原子能机构（International Atomic Energy Agency， IAEA）开发的建立级联碰撞MD模拟的开源标准化数据库CascadesDB为这个方向上的未来工作奠定了基础。例如，基于该数据库，利用聚类的方法开展对MD级联碰撞数据的分析研究。针对点缺陷分析，传统的方法无法区分基于点缺陷的聚类。例如，传统的方法使用位错提取算法（dislocation extraction algorithm， DXA）来确定位错环，但是无法识别非位错缺陷和小团簇的形态。此外，随着系统规模的增大，位错提取算法会占用大量内存，并且速度很慢。传统的几何方法（如邻域分析等）能够识别晶体中的缺陷区域，但无法描述缺陷的形态和浓度。通过设计新的几何特征向量，可以识别晶格原子中的缺陷，并将其可视化。

3 数值核反应堆大数据特点分析

数值堆涉及的数据主要有两种不同来源，一是在实验、运维等过程中由核反应堆及相关设备产生，二是在数值堆运行过程中由各种算法产生。这些来源使数值堆大数据具备了工业大数据和模拟大数据的特征。由于数值堆的领域特点，模拟大数据最重要的特征是多样性、关联性，以及由数学物理模型和数值方法带来的非精确性。

多样性和关联性是模拟大数据的重要宏观特征。多样性体现在数据类型丰富、数据版本多样。例如，反应堆材料从设计到投入使用要经历成分设计、微观组织调控、工业测试、服役等多道工序，其服役周期达几十年之久，材料性能在不同的时效作用下也会呈现不同的特点。此外，来源于设备和计算的数据是多样的，如原子坐标数据、团簇数据等。关联性体现在数据含义、形式的紧密关联上。例如，反应堆材料的使用寿命与各服役阶段息息相关，优异的服役性能离不开精确的系统测试，离不开大量的工艺参数调控，更离不开合适的成分、结构设计，而每一工程阶段的相应计算工作会涉及不同物理过程、不同时空尺度的数据，各个阶段之间不同来源的数据具有极其复杂的关联关系。

非精确性是模拟大数据的重要微观特征。数值堆包含大量数学物理模型，这些模型是对现实的近似描述，使得数值堆从设计、实现到交付经历了多个层次的近似处理。最终，数值堆大数据中占主要部分的数值型数据包含了不同来源的误差。这些误差的存在促使研究人员追求高精细的模拟以贴近现实，这是数值堆大数据在数量上快速增长的根本原因之一。从近似处理的层次来看，非精确性体现在数学物理模型、数值方法和计算机程序带来的误差上。依据现实建立数学物理模型，是对真实现象在某一组条件下的理想化处理，这一阶段会因条件简化引入一定的误差，如运输过程的粒子模型、冷却剂的流体模型。依据数学物理模型建立数值方法是在有限的计算资源下寻求复杂方程的数值解，并且量化地描述收敛性、复杂度等具有普遍性的特点。这一阶段因离散化引入一定的误差，例如热工水力流体计算和堆芯结构力学计算涉及的有限元方法会受到时间、空间离散误差的影响，MD和动力学蒙特卡洛（kinetic Monte Carlo， KMC）等依赖随机数和随机过程的方法会受到统计误差的影响。依据数值方法开发计算机程序，引入的误差都可以归结为舍入误差。尽管浮点数的模型（单精度、双精度等）以及它们的运算特点在数值方法层面已经得到完整的讨论，并且数值方法已经给出了准确的算法，计算机程序从编码、编译到最终运行的一系列活动仍然无法保证完全贴合它要表达的数值方法。例如，在不同机器上计算同一数学基本函数可能得到不同结果；某些语言的编译器为了保证效率会对原程序代码做一些变换；数值堆计算程序的并行化版本可能会极大地改变原本的浮点运算相关公式和计算顺序。

多样性、关联性和非精确性相互影响，使得面向数值堆大数据的研究能够基于神经网络、数理统计、数值分析等多个细分领域进行。

4 基于数值核反应堆大数据的建模优化

4.1 基于第一性原理数据和神经网络模型的分子动力学势函数建模

势函数计算是材料多尺度模拟关键的一环，也是数值堆高精细模拟实现过程中计算复杂且耗时的部分。MD和KMC中粒子速度、位置的更新，以及随机团簇动力学（stochastic cluster dynamics，SCD）中多元组分材料参数的计算均离不开势函数模型。过去常用的势函数模型通常包括两种，一种基于第一性原理，另一种基于经验函数。前者往往计算复杂，且对于多元合金组分而言，第一性原理势函数的构建过程非常复杂；后者虽然在效率上有所提高，但精度往往不够，对于多元合金组分而言，经验势函数的构建过程更加困难。基于密度泛函理论（density-functional theory， DFT）计算得到的海量数据，提出一种基于机器学习的方法对原子体系模拟参数及势能之间进行拟合的势函数模型——基于人工智能的势函数模型（artificial intelligence based potential model， AIPM）。

AIPM训练所需的时间与原子数量相关，在原子数量相当大时，需要通过采样获取适当规模的训练集。由于数值大数据具有非精确性的特点，不同的数据采样方法可能会导致模型计算结果产生波动。本节不考虑上述采样问题，而是基于筛选好的原子数据验证AIPM。

选取2 000条由DFT计算得到的数值计算大数据，每条数据代表一个原子体系，训练集由1 000个原子坐标及对应的体系势能组成。随后，使用FeCu二元合金体系基于原子坐标进行机器学习模型的特征提取。具体来说，首先按照最近邻法对原子邻域进行划分，并以该原子为中心建立局域坐标系，如图1所示，将第一近邻和第二近邻分别设置为x轴、y轴坐标，将二者的向量积作为z轴坐标，于是可以得到每个原子的坐标，将这些坐标作为神经网络的输入。如图2所示，使用3层全连接的神经网络结构，每层的节点数依次为15、10、6，拟合得到体系内一个原子的势能，然后针对其他原子采用相同的方案进行拟合，最后将所有原子的势能求和，即可得到总的原子体系的势能，将这一势能与数据库中给定的势能进行比较，验证模型的精度。采用AIPM计算1 000个粒子大小的FeCu原子体系势能，并与嵌入原子法（embedded atom method，EAM）势函数模型进行对比，结果见表1，对比结果验证了AIPM的可靠性。模拟结果显示，与EAM相比，AIPM在计算耗时上缩短一半以上，同时计算结果仅有0.7%的相对偏差。将该模型应用于数值核反应堆的高精细模拟，有望实现模型的加速和更大规模的模拟。

图1 局域坐标系的建立方法

图2 FeCu原子体系神经网络构建过程

4.2 基于特征线法数据的敏感性分析

中子输运是数值堆的核心过程之一，它以核数据、堆芯空间信息等复杂时空数据为输入，产生有效增殖因子、中子通量密度分布等描述堆芯核裂变反应状态的数据。特征线法是一种经典的中子输运数值迭代方法，它将连续的空间离散为有限条相互交错的轨迹，将空间上的输运方程求解问题转化为沿轨迹的常微分方程求解问题。如图3所示，特征线法产生的结果会随输入数据的变化而变化，这一敏感性问题是由数值方法本身带来的，并且在计算程序日益复杂化的情况下难以从解析表达式入手解决。使用基于大量数据的统计方法可以让算法从输入和输出中挖掘数据之间的关联性，建立输入变化与输出变化之间定性甚至定量的关系，从而加深对特征线法计算结果波动的理解，也可使得输入数据的选取更加合理、高效。同时，使用尽可能少的数据来建立统计模型，并将它用于更大输入空间中输出数据的波动预测，从而避免尝试各种输入数据组合带来的计算资源的浪费。

图3 输入数据变化引起输出数据变化

以三维特征线法程序ANT-MOC为例，它执行特征线法计算所需的堆芯空间信息包括轨迹分布，该分布可以由一些参数完全确定，其中最重要的参数是方位角（轨迹的平面角度）数量、平面轨迹间距（轨迹在平面上投影的间距）、极角（轨迹的轴向角度）数量、轴向轨迹间距（轨迹在轴向上的间距）。调整角度数量和间距大小就能改变整个空间中轨迹的密度，也就改变了离散化的方程数量。

本文基于ANT-MOC考察方位角数量、平面轨迹间距、极角数量和轴向轨迹间距这4个影响轨迹分布的关键参数对计算结果中有效增殖因子k_eff的影响。有效增殖因子是用整个堆芯中的中子通量密度计算得到的堆芯裂变反应的整体度量，因此它在输出数据中具有一定的代表性。实验选取的计算对象为Takeda国际基准题，它描述了一个简单的压水堆堆芯，其有效增殖因子的参考值k_ref为0.977 8。实验所用的输入数据中仅有4个变量，它们的取值见表2，取值组合共500种。

使用ANT-MOC完成500组计算后，计算每个有效增殖因子k_eff与参考值k_ref的相对误差。由于输入参数的取值范围不大，在这一范围内使用线性模型近似地研究各参数与相对误差的关系。给定显著性水平0.05，可以为这500组数据建立四元线性回归模型：

可以使用该模型估计k_eff的相对误差随轨迹分布的变化情况。回归分析的各参数见表3。

相关系数R和校正的拟合优度R²的数值表明有效增殖因子k_eff的相对误差与选取的4个变量有较好的相关性，F检验的P值远小于0.05表明结果非常显著。各变量的t检验结果见表4，结果表明，方位角和极角数量与结果的相关性非常显著（P值远小于0.05），参数标准误差也表明这两个参数的平均偏离程度较小，这说明四元线性回归模型比较合理地估计了方位角和极角在一定范围内的变化对ANT-MOC计算结果的影响。在Takeda计算中，根据拟合结果以及表2描述的参数区间，还可以比较在参数区间内相对误差随不同参数变化的波动情况，从而指导具体计算时的参数选择。例如，方位角和极角的线性拟合系数为负、平面轨迹间距的系数为正，意味着在一定范围内使这3个参数精细化可以缩小相对误差；轴向轨迹间距的系数为负，意味着ANT-MOC的计算结果难以通过该参数的精细化（缩小）来改善。

线性拟合在一定范围内定量地反映了ANT-MOC计算结果对参数的敏感性，从而可以避免复杂的误差放大和条件数的理论分析，快速给出筛选参数组合的统计依据。对于相当精细的参数空间，ANTMOC数值算法的收敛速率不可以忽略，计算结果的相对误差不再能被线性模型很好地描述，需要在此工作的经验上使用更复杂的学习算法来建立估计模型。

4.3 流固耦合中基于三维R树的大规模流体数据插值分析

热工水力软件CVR-PACA和结构力学软件CVR-HARSA（原CVR-HISRES）的流固耦合模拟是CVR1.0项目的研究重点。PACA与HARSA耦合旨在进行全堆规模的流致振动分析、获得燃料棒和固定支架间的磨损评估数据，有助于堆芯安全分析、设计及反应堆延寿。耦合的本质是完成流固交界面上数值数据的融合转换，其中，数值数据具有数据量巨大、不匹配的特点。数据量巨大是由PACA与HARSA高精细模拟计算的特点决定的，而不匹配是两者建模的网格类型和密度不同导致的。基于此，利用三维R树索引大规模流体数据，完成了PACA输出的流体压力向HARSA的插值计算，即流体压力数据的融合转换计算。实验表明，此种插值计算方式提高了流体压力的融合转换效率和大规模高精细耦合计算效率。

PACA输出的流体数据规模巨大，如10 mm长的双流道模型的顶点数目超过30万；100 mm长的6流道模型的顶点数目超过900万，因此采用三维R树索引大规模流体网格顶点进行流体压力数据的插值计算。另外，PACA输出的网格顶点难以还原拓扑结构，因此在数据融合转换过程中采用邻近点加权平均的匹配计算方式。流体压力数据的整体插值过程包括图4所示的3个阶段。

图4 流体压力数据插值过程展示

● 数据清洗阶段：获取PACA计算输出的原始数据，原始数据中存在许多重复数据和融合转换计算不需要的数据，该阶段对这部分数据进行清洗处理，并输出后续计算所需数据，即流体网格顶点及各顶点对应的压力值。

● 构建三维R树阶段：对上阶段输出数据进行三维R树的构建，其中，树中叶子节点包围的是三维空间中的流体网格顶点，每个顶点都唯一对应一个压力值属性。

● 匹配计算阶段：针对每个固体网格顶点遍历三维R树，搜索距离它最近的前k个流体顶点，并对这k个顶点及压力值进行邻近点加权平均计算，得到固体顶点对应的压力值。

经过上述计算，得到每个固体网格顶点对应的压力值，然后将这些顶点及对应压力值输出为HARSA计算所需的格式。

利用表5中的6组建模数据进行实验，测试了直接插值方式和基于三维R树的插值方式在不同条件下的性能，分别用BaseLine、RTree表示这两种插值方式。其中，直接插值方式直接搜索所有流体顶点，找到距离每个固体顶点最近的k个流体顶点，并进行加权计算得到该顶点对应的压力值。

图5（a）展示了燃料棒数目变化时， PACA与HARSA耦合时两种插值方式的耗时，其中纵轴为消耗时间的对数表示。当燃料棒数目增大时，RTree的耗时远小于BaseLine的耗时。图5（b）展示了燃料棒长度变化时两种插值方式的耗时。当燃料棒长度增大时，RTree的耗时仍远小于BaseLine的耗时。可见，RTree在高精细插值模拟中更具优势。

图5 流体压力数据插值计算效率测试

5 基于数值核反应堆大数据的科学发现

5.1 基于并查集算法的级联碰撞团簇划分方法

级联碰撞模拟后，高能粒子的撞击导致材料原子离开原本所在的晶格位置，而后进一步聚集或湮灭，形成自间隙团簇或空洞，最终导致材料力学性能降级，从而威胁反应堆设施的安全。基于CVR1.0中的分子动力学程序MISA-MD的模拟数据，采用并查集算法可以实现对团簇的有效划分。

数据集采用的晶体结构均为体心立方（body-centred cubic，BCC）晶体，元素都是铁（Fe）元素，晶格常数为2.855 32 nm。模拟数据均来源于大小为[80, 80, 80]的模拟区域，区域大小的含义是x、y、z方向上都是80倍的晶格常数，即80个晶格点。当实验环境的温度为600 K时，随着入射中子能量的不同，时间步长有10 000和100 000两种，总的时间步数有41 000和131 000两种，MISA-MD运行时，每隔1 000时间步输出一个结果，这里选取最后一个时间步的结果。每个时间步的结果数据都是.dump坐标数据，其中包含1 024 000个原子坐标。在上述实验环境下，数据涵盖不同初级离位原子（primary knock-on atom，PKA）能量、不同PKA入射方向，且每种能量每种角度都进行了多次模拟，包括10 keV、30 keV和50 keV共3种不同的能量，<122>、<135>和<235>共3个不同入射方向（以晶向表示），每种参数组合都进行了50次模拟，最终有450次模拟数据。

常规方法是将每个缺陷看成一个单缺陷的团簇，然后遍历其他缺陷，将指定距离内的缺陷加入该团簇进行缺陷的合并。该问题看起来并不复杂，但是当数据量大时，若采用常规方法来解决，往往时间复杂度过大，这是因为它需要反复查找一个缺陷所在的团簇，所以常规方法不能很好地解决该问题。这里采用并查集算法来解决。并查集算法采用一种树形数据结构来处理这种不相交集合的问题。并查集算法有两种操作：合并（union），即把两个不相交的集合合并为一个集合；查询（find），即查询两个元素是否在同一个集合中。所有元素合并完之后，森林中有几棵树就有几种集合。因为并查集算法的数据结构为树形，所以树的高度越高，时间复杂度就越高。因此这里选取的是优化的并查集算法。使用优化的并查集算法划分团簇的伪代码如下。首先设置一个大小与缺陷总数相同的根节点数组root，它的含义为该缺陷所属团簇的编号，初始时将每个缺陷视为单独一个团簇，因此初始数组的值为自身编号。然后设置一个大小与缺陷总数相同的高度数组height，它表示以当前节点为根节点的树的高度，因为初始时每个缺陷都是一个团簇，也就是一棵树，所以初始时树的高度都为1。接下来计算任意两个缺陷之间的距离，在计算的过程中需要判断这两个缺陷的类型。如果这两个缺陷都是间隙原子或者一个是间隙原子、一个是空位，则只要它们的距离在一倍晶格常数（第二近邻）内，就认为它们属于同一个团簇；如果两个缺陷都是空位，且它们的距离不超过晶格常数的2的平方根倍（第三近邻），则认为它们属于一个团簇。如图6所示，此时缺陷2和缺陷9在距离阈值内，第一步先查找两个缺陷的根节点，在查找的过程中，将向上经过的所有缺陷的根节点都设为最上层的缺陷，也就是都直接接到根节点上，这被称为路径压缩，可以降低树的高度，使得以后向上查找根节点时速度更快。在获取根节点后，根据树的高度数组height判断两个根节点的树的高度，将高度小的树接到高度大的树上，如果树高一样，则可以将任意一棵树接到另一棵树上作为孩子节点。遍历根节点数组，将根节点相同的缺陷划分到一个团簇中，从而获得所有团簇的划分结果。将获得的所有团簇信息（包括团簇中的缺陷坐标、缺陷对数、缺陷类型（间隙或者空位）等）存储到团簇数据库中，最终获得了4 483个团簇。

伪代码1 使用优化的并查集算法划分团簇

输入：所有缺陷原子坐标 DEFECTS=[d₁, d₂, …, d_m]

输出：所有团簇

1 设置树的根节点数组和高度数组：root =[1,…, m], height =[1]*m

2 for i ← 1, 2, …, m do

3 for j ← i+1,…, m do

4 if distance(d_i, d_j) < threshold then

5 a ← 找到i的根节点

6 b ← 找到j的根节点

7 根据树的高度数组修改根节点数组

8 end if

9 end for

10 end for

11 将同一根节点的缺陷划分为一个团簇

12 输出所有团簇

图6 并查集算例演示

5.2 基于KMC团簇大数据的环状团簇识别算法

KMC团簇大数据库包含了不同实验条件下经KMC长程演化后的原子团簇信息。KMC团簇大数据库包含PKA能量、PKA入射方向等实验参数以及团簇中各个原子坐标、空位、间隙原子数目等信息。这里共选取500条团簇数据展开分析。因为团簇形态和数目信息是未知的，所以有监督的学习方法在此不适用。无监督的机器学习方法在解决这一问题上具有独特优势，这里采用基于密度的聚类算法。首先，选取的特征向量为缺陷团簇中各缺陷与几何中心的距离、每两个缺陷与几何中心形成的夹角。考虑到几何形状经旋转、放大、缩小后仍然是相同的，对于角度，这里每隔5°形成一维数据，共有36维数据；对于距离，每次将所有的距离除以当前团簇的最大值，进行归一化处理，每隔0.025形成一维数据，共40维数据，因此特征向量为76维数据，如图7所示。选取HDBSCAN聚类算法对团簇进行识别，轮廓系数达到0.643。HDBSCAN聚类算法是一种基于密度的无监督的聚类算法，不需要标记过的数据，也不需要事先知道要划分的类别数。它可以对不同密度的团簇进行聚类，可以忽略噪声，且效率较高。团簇聚类结果如图8所示。这里使用卡方距离作为相似性度量，使用轮廓系数（silhouette coefficient）作为聚类性能的内部评价指标，若轮廓系数接近1，则说明样本聚类合理；若轮廓系数接近-1，则说明样本更应该分类到另外的簇；若轮廓系数近似为0，则说明样本i在两个簇的边界上。图8中的所有缺陷团簇被分为几种不同的类别，每种颜色代表一种类别。本实验共获得了22种形状类别，从这22种类别中随机选取两种类别，每种类别选择两个团簇，将其进行可视化展示。图9为类别1中的两个团簇，1 260和1 867是它们在数据库中的编号，它们具有完全相同的形状，都是四个角构成一个方形，然后有一个顶点。图10则是另一个类别中的两个团簇，它们和类别1不同，它们的缺陷个数有6个，而且它们分为上下两排，每排3个缺陷，这两排构成近似平行的几何形状。

图7 团簇特征提取方法示意

图8 团簇聚类结果

从图9和图10可以得出，本文采用的相似性度量和聚类算法是可行的，它们可以将形状相似的团簇聚类到一起，证明了整个程序的可行性。基于该方法，笔者在KMC长程演化数据中发现了一些类环状的团簇，如图11所示，这一发现与之前报道的材料辐照实验中存在类环状缺陷团簇的结果相吻合。针对团簇的研究仍处在初步阶段，不同形态的团簇对材料性能的影响机理尚不明确，基于KMC团簇大数据和机器学习的方法，实现了KMC长程演化后团簇形态的识别和分类，为后续团簇影响机理的研究提供了智能化手段。

图9 类别1的聚类结果

图10 类别2的聚类结果

图11 KMC长程演化产生的类环状团簇聚类结果

6 结束语

本文提出了数值核反应堆大数据的概念，分析了它具有的多样性、关联性和非精确性等关键特征，并将这些特征和实际数值堆研究结合起来。将数值堆大数据看作数值堆的一个重要组成部分，使得大数据技术和学习算法的思想自然地被引入数值堆的研究中，拓展了研究的思路。从数值堆大数据的特征出发，本文指出了它最重要的两大应用方向：建模优化和科学发现。以CVR1.0为例，在基于数据的建模优化方面，基于神经网络的势函数改进了分子动力学总势能的计算，降低了整个模拟的计算时间；基于统计的敏感性分析和基于三维R树的网格插值研究了模拟数据之间的关联性。在基于数据的科学发现方面，基于聚类的团簇划分和环状原子簇发现，通过学习算法建立了有效的缺陷识别模型，有助于对材料性能进行预测。这些研究工作表明，数值核反应堆大数据概念的建立对于数值堆研究有极大的指导意义。

同时，上述研究也反映出用于数值核反应堆大数据研究的学习模型面临着易用性、准确度和效率等多方面的取舍，目前尚未形成一套具有领域特色的系统的研究方法。在今后的工作中，建立更可靠的学习模型和更完善的误差分析是数值核反应堆大数据应用的努力方向。

作者简介

汪岸（1993-），男，北京科技大学博士生，主要研究方向为高性能计算、数据挖掘。

任帅（1992-），男，北京科技大学博士生，主要研究方向为大数据存储与处理、机器学习、数据挖掘。

苗雪（1992-），女，北京科技大学博士生，主要研究方向为并行与分布式计算、机器学习、多物理场耦合分析。

董玲玉（1996-），女，北京科技大学博士生，主要研究方向为高性能计算、计算流体力学。

朱迎（1997-），女，北京科技大学硕士生，主要研究方向为并行与分布式计算、多物理场耦合分析。

陈丹丹（1995-），女，北京科技大学博士生，主要研究方向为计算材料学、数据挖掘。

胡长军（1963-），男，北京科技大学终身教授、博士生导师，智能超算融合应用技术教育部工程研究中心主任，主要研究方向为高性能计算、领域数据工程。

联系我们:

Tel:010-81055448

010-81055490

010-81055534

E-mail:[email protected]

http://www.infocomm-journal.com/bdr

http://www.j-bigdataresearch.com.cn/

转载、合作：010-81055537

大数据期刊

《大数据（Big Data Research，BDR）》双月刊是由中华人民共和国工业和信息化部主管，人民邮电出版社主办，中国计算机学会大数据专家委员会学术指导，北京信通传媒有限责任公司出版的期刊，已成功入选中国科技核心期刊、中国计算机学会会刊、中国计算机学会推荐中文科技期刊，并被评为2018年、2019年国家哲学社会科学文献中心学术期刊数据库“综合性人文社会科学”学科最受欢迎期刊。

关注《大数据》期刊微信公众号，获取更多内容

你可能感兴趣的:(算法,大数据,数据挖掘,编程语言,python)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
【一起学Rust | 设计模式】习惯语法——使用借用类型作为参数、格式化拼接字符串、构造函数广龙宇一起学Rust #Rust设计模式 rust 设计模式开发语言
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、使用借用类型作为参数二、格式化拼接字符串三、使用构造函数总结前言Rust不是传统的面向对象编程语言，它的所有特性，使其独一无二。因此，学习特定于Rust的设计模式是必要的。本系列文章为作者学习《Rust设计模式》的学习笔记以及自己的见解。因此，本系列文章的结构也与此书的结构相同（后续可能会调成结构），基本上分为三个部分
Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
python os.environ 江湖偌大 python 深度学习
os.environ['TF_CPP_MIN_LOG_LEVEL']='0'#默认值，输出所有信息os.environ['TF_CPP_MIN_LOG_LEVEL']='1'#屏蔽通知信息（INFO）os.environ['TF_CPP_MIN_LOG_LEVEL']='2'#屏蔽通知信息和警告信息（INFO\WARNING）os.environ['TF_CPP_MIN_LOG_LEVEL']='
Python中os.environ基本介绍及使用方法鹤冲天Pro #Python python 服务器开发语言
文章目录python中os.environos.environ简介os.environ进行环境变量的增删改查python中os.environ的使用详解1.简介2.key字段详解2.1常见key字段3.os.environ.get()用法4.环境变量的增删改查和判断是否存在4.1新增环境变量4.2更新环境变量4.3获取环境变量4.4删除环境变量4.5判断环境变量是否存在python中os.envi
Pyecharts数据可视化大屏：打造沉浸式数据分析体验我的运维人生信息可视化数据分析数据挖掘运维开发技术共享
Pyecharts数据可视化大屏：打造沉浸式数据分析体验在当今这个数据驱动的时代，如何将海量数据以直观、生动的方式展现出来，成为了数据分析师和企业决策者关注的焦点。Pyecharts，作为一款基于Python的开源数据可视化库，凭借其丰富的图表类型、灵活的配置选项以及高度的定制化能力，成为了构建数据可视化大屏的理想选择。本文将深入探讨如何利用Pyecharts打造数据可视化大屏，并通过实际代码案例
Goolge earth studio 进阶4——路径修改与平滑陟彼高冈yu Google earth studio 进阶教程旅游
如果我们希望在大约中途时获得更多的城市鸟瞰视角。可以将相机拖动到这里并创建一个新的关键帧。camera_target_clip_7EarthStudio会自动平滑我们的路径，所以当我们通过这个关键帧时，不是一个生硬的角度，而是一个平滑的曲线。camera_target_clip_8路径上有贝塞尔控制手柄，允许我们调整路径的形状。右键单击，我们可以选择“平滑路径”，这是默认的自动平滑算法，或者我们可
Python教程：一文了解使用Python处理XPath 旦莫 Python进阶 python 开发语言
目录1.环境准备1.1安装lxml1.2验证安装2.XPath基础2.1什么是XPath？2.2XPath语法2.3示例XML文档3.使用lxml解析XML3.1解析XML文档3.2查看解析结果4.XPath查询4.1基本路径查询4.2使用属性查询4.3查询多个节点5.XPath的高级用法5.1使用逻辑运算符5.2使用函数6.实战案例6.1从网页抓取数据6.1.1安装Requests库6.1.2代
python os.environ_python os.environ 读取和设置环境变量 weixin_39605414 python os.environ
>>>importos>>>os.environ.keys()['LC_NUMERIC','GOPATH','GOROOT','GOBIN','LESSOPEN','SSH_CLIENT','LOGNAME','USER','HOME','LC_PAPER','PATH','DISPLAY','LANG','TERM','SHELL','J2REDIR','LC_MONETARY','QT_QPA
基于社交网络算法优化的二维最大熵图像分割智能算法研学社（Jack旭）智能优化算法应用图像分割算法 php 开发语言
智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码文章目录智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码1.前言2.二维最大熵阈值分割原理3.基于社交网络优化的多阈值分割4.算法结果：5.参考文献：6.Matlab代码摘要：本文介绍基于最大熵的图像分割，并且应用社交网络算法进行阈值寻优。1.前言阅读此文章前，请阅读《图像分割：直方图区域划分及信息统计介绍》htt
使用Faiss进行高效相似度搜索 llzwxh888 faiss python
在现代AI应用中，快速和高效的相似度搜索是至关重要的。Faiss（FacebookAISimilaritySearch）是一个专门用于快速相似度搜索和聚类的库，特别适用于高维向量。本文将介绍如何使用Faiss来进行相似度搜索，并结合Python代码演示其基本用法。什么是Faiss？Faiss是一个由FacebookAIResearch团队开发的开源库，主要用于高维向量的相似性搜索和聚类。Faiss
python是什么意思中文-在python中%是什么意思编程大乐趣
Python中%有两种：1、数值运算：%代表取模，返回除法的余数。如：>>>7%212、%操作符（字符串格式化，stringformatting），说明如下：%[(name)][flags][width].[precision]typecode(name)为命名flags可以有+，-，''或0。+表示右对齐。-表示左对齐。''为一个空格，表示在正数的左侧填充一个空格，从而与负数对齐。0表示使用0填
Day1笔记-Python简介&标识符和关键字&输入输出 ~在杰难逃~ Python python 开发语言大数据数据分析数据挖掘
大家好，从今天开始呢，杰哥开展一个新的专栏，当然，数据分析部分也会不定时更新的，这个新的专栏主要是讲解一些Python的基础语法和知识，帮助0基础的小伙伴入门和学习Python，感兴趣的小伙伴可以开始认真学习啦！一、Python简介【了解】1.计算机工作原理编程语言就是用来定义计算机程序的形式语言。我们通过编程语言来编写程序代码，再通过语言处理程序执行向计算机发送指令，让计算机完成对应的工作，编程
python八股文面试题分享及解析(1) Shawn________ python
#1.'''a=1b=2不用中间变量交换a和b'''#1.a=1b=2a,b=b,aprint(a)print(b)结果：21#2.ll=[]foriinrange(3):ll.append({'num':i})print(11)结果:#[{'num':0},{'num':1},{'num':2}]#3.kk=[]a={'num':0}foriinrange(3):#0,12#可变类型，不仅仅改变
121. 买卖股票的最佳时机薄荷糖的味道_fb40
给定一个数组，它的第i个元素是一支给定股票第i天的价格。如果你最多只允许完成一笔交易（即买入和卖出一支股票），设计一个算法来计算你所能获取的最大利润。注意你不能在买入股票前卖出股票。示例1:输入:[7,1,5,3,6,4]输出:5解释:在第2天（股票价格=1）的时候买入，在第5天（股票价格=6）的时候卖出，最大利润=6-1=5。注意利润不能是7-1=6,因为卖出价格需要大于买入价格。示例2:输入:
每日算法&面试题，大厂特训二十八天——第二十天（树）肥学 ⚡算法题⚡面试题每日精进 java 算法数据结构
目录标题导读算法特训二十八天面试题点击直接资料领取导读肥友们为了更好的去帮助新同学适应算法和面试题，最近我们开始进行专项突击一步一步来。上一期我们完成了动态规划二十一天现在我们进行下一项对各类算法进行二十八天的一个小总结。还在等什么快来一起肥学进行二十八天挑战吧！！特别介绍小白练手专栏，适合刚入手的新人欢迎订阅编程小白进阶python有趣练手项目里面包括了像《机器人尬聊》《恶搞程序》这样的有趣文章
Python快速入门 —— 第三节：类与对象孤华暗香 Python快速入门 python 开发语言
第三节：类与对象目标：了解面向对象编程的基础概念，并学会如何定义类和创建对象。内容：类与对象：定义类：class关键字。类的构造函数：__init__()。类的属性和方法。对象的创建与使用。示例：classStudent:def__init__(self,name,age,major):self.name&#
pyecharts——绘制柱形图折线图 2224070247 信息可视化 python java 数据可视化
一、pyecharts概述自2013年6月百度EFE(ExcellentFrontEnd）数据可视化团队研发的ECharts1.0发布到GitHub网站以来，ECharts一直备受业界权威的关注并获得广泛好评，成为目前成熟且流行的数据可视化图表工具，被应用到诸多数据可视化的开发领域。Python作为数据分析领域最受欢迎的语言，也加入ECharts的使用行列，并研发出方便Python开发者使用的数据
回溯算法-重新安排行程 chirou_ 算法数据结构图论 c++图搜索
leetcode332.重新安排行程这题我还没自己ac过，只能现在凭着刚学完的热乎劲把我对题解的理解记下来。本题我认为对数据结构的考察比较多，用什么数据结构去存数据，去读取数据，都是很重要的。classSolution{private:unordered_map>targets;boolbacktracking(intticketNum,vector&result){//1.确定参数和返回值//2
Python 实现图片裁剪（附代码） | Python工具剑客阿良_ALiang
前言本文提供将图片按照自定义尺寸进行裁剪的工具方法，一如既往的实用主义。环境依赖ffmpeg环境安装，可以参考我的另一篇文章：windowsffmpeg安装部署_阿良的博客-CSDN博客本文主要使用到的不是ffmpeg，而是ffprobe也在上面这篇文章中的zip包中。ffmpy安装：pipinstallffmpy-ihttps://pypi.douban.com/simple代码不废话了，上代码
【华为OD技术面试真题 - 技术面】- python八股文真题题库（4) 算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选**1.Python中的`with`**用途和功能自动资源管理示例：文件操作上下文管理协议示例代码工作流程解析优点2.\_\_new\_\_和**\_\_init\_\_**区别__new____init__区别总结3.**切片（Slicing）操作**基本切片语法
python os 环境变量 CV矿工 python 开发语言 numpy
环境变量：环境变量是程序和操作系统之间的通信方式。有些字符不宜明文写进代码里，比如数据库密码，个人账户密码，如果写进自己本机的环境变量里，程序用的时候通过os.environ.get（）取出来就行了。os.environ是一个环境变量的字典。环境变量的相关操作importos"""设置/修改环境变量：os.environ[‘环境变量名称’]=‘环境变量值’#其中key和value均为string类
Python爬虫解析工具之xpath使用详解 eqa11 python 爬虫开发语言
文章目录Python爬虫解析工具之xpath使用详解一、引言二、环境准备1、插件安装2、依赖库安装三、xpath语法详解1、路径表达式2、通配符3、谓语4、常用函数四、xpath在Python代码中的使用1、文档树的创建2、使用xpath表达式3、获取元素内容和属性五、总结Python爬虫解析工具之xpath使用详解一、引言在Python爬虫开发中，数据提取是一个至关重要的环节。xpath作为一门
Faiss：高效相似性搜索与聚类的利器网络·魚大数据 faiss
Faiss是一个针对大规模向量集合的相似性搜索库，由FacebookAIResearch开发。它提供了一系列高效的算法和数据结构，用于加速向量之间的相似性搜索，特别是在大规模数据集上。本文将介绍Faiss的原理、核心功能以及如何在实际项目中使用它。Faiss原理：近似最近邻搜索：Faiss的核心功能之一是近似最近邻搜索，它能够高效地在大规模数据集中找到与给定查询向量最相似的向量。这种搜索是近似的，
【华为OD技术面试真题 - 技术面】- python八股文真题题库（1）算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.数据预处理流程数据预处理的主要步骤工具和库2.介绍线性回归、逻辑回归模型线性回归（LinearRegression）模型形式：关键点：逻辑回归（LogisticRegression）模型形式：关键点：参数估计与评估：3.python浅拷贝及深拷贝浅拷贝（Shal
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
《Python数据分析实战终极指南》 xjt921122 python 数据分析开发语言
对于分析师来说，大家在学习Python数据分析的路上，多多少少都遇到过很多大坑**，有关于技能和思维的**：Excel已经没办法处理现有的数据量了，应该学Python吗？找了一大堆Python和Pandas的资料来学习，为什么自己动手就懵了？跟着比赛类公开数据分析案例练了很久，为什么当自己面对数据需求还是只会数据处理而没有分析思路？学了对比、细分、聚类分析，也会用PEST、波特五力这类分析法，为啥
insert into select 主键自增_mybatis拦截器实现主键自动生成 weixin_39521651 insert into select 主键自增 mybatis delete返回值 mybatis insert返回主键 mybatis insert返回对象 mybatis plus insert返回主键 mybatis plus 插入生成id
前言前阵子和朋友聊天，他说他们项目有个需求，要实现主键自动生成，不想每次新增的时候，都手动设置主键。于是我就问他，那你们数据库表设置主键自动递增不就得了。他的回答是他们项目目前的id都是采用雪花算法来生成，因此为了项目稳定性，不会切换id的生成方式。朋友问我有没有什么实现思路，他们公司的orm框架是mybatis，我就建议他说，不然让你老大把mybatis切换成mybatis-plus。mybat
Python中深拷贝与浅拷贝的区别 yuxiaoyu.
转自：http://blog.csdn.net/u014745194/article/details/70271868定义：在Python中对象的赋值其实就是对象的引用。当创建一个对象，把它赋值给另一个变量的时候，python并没有拷贝这个对象，只是拷贝了这个对象的引用而已。浅拷贝：拷贝了最外围的对象本身，内部的元素都只是拷贝了一个引用而已。也就是，把对象复制一遍，但是该对象中引用的其他对象我不复
java类加载顺序 3213213333332132 java
package com.demo; /** * @Description 类加载顺序 * @author FuJianyong * 2015-2-6上午11:21:37 */ public class ClassLoaderSequence { String s1 = "成员属性"; static String s2 = "
Hibernate与mybitas的比较 BlueSkator sql Hibernate 框架 ibatis orm
第一章 Hibernate与MyBatis Hibernate 是当前最流行的O/R mapping框架，它出身于sf.net，现在已经成为Jboss的一部分。 Mybatis 是另外一种优秀的O/R mapping框架。目前属于apache的一个子项目。 MyBatis 参考资料官网：http:
php多维数组排序以及实际工作中的应用 dcj3sjt126com PHP usort uasort
自定义排序函数返回false或负数意味着第一个参数应该排在第二个参数的前面, 正数或true反之, 0相等usort不保存键名uasort 键名会保存下来uksort 排序是对键名进行的 <!doctype html> <html lang="en"> <head> <meta charset="utf-8&q
DOM改变字体大小周华华前端
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
c3p0的配置 g21121 c3p0
c3p0是一个开源的JDBC连接池，它实现了数据源和JNDI绑定，支持JDBC3规范和JDBC2的标准扩展。c3p0的下载地址是：http://sourceforge.net/projects/c3p0/这里可以下载到c3p0最新版本。以在spring中配置dataSource为例：  <bean name="prope
Java获取工程路径的几种方法 510888780 java
第一种： File f = new File(this.getClass().getResource("/").getPath()); System.out.println(f); 结果: C:\Documents%20and%20Settings\Administrator\workspace\projectName\bin 获取当前类的所在工程路径; 如果不加“
在类Unix系统下实现SSH免密码登录服务器 Harry642 免密 ssh
1.客户机 (1)执行ssh-keygen -t rsa -C "[email protected]"生成公钥，xxx为自定义大email地址 (2)执行scp ~/.ssh/id_rsa.pub root@xxxxxxxxx:/tmp将公钥拷贝到服务器上，xxx为服务器地址 (3)执行cat
Java新手入门的30个基本概念一 aijuans java java 入门新手
在我们学习Java的过程中,掌握其中的基本概念对我们的学习无论是J2SE,J2EE,J2ME都是很重要的,J2SE是Java的基础,所以有必要对其中的基本概念做以归纳,以便大家在以后的学习过程中更好的理解java的精髓,在此我总结了30条基本的概念。　　Java概述:　　目前Java主要应用于中间件的开发(middleware)---处理客户机于服务器之间的通信技术,早期的实践证明,Java不适合
Memcached for windows 简单介绍 antlove java Web windows cache memcached
1. 安装memcached server a. 下载memcached-1.2.6-win32-bin.zip b. 解压缩，dos 窗口切换到 memcached.exe所在目录，运行memcached.exe -d install c.启动memcached Server,直接在dos窗口键入 net start "memcached Server&quo
数据库对象的视图和索引百合不是茶索引 oeacle数据库视图
视图视图是从一个表或视图导出的表，也可以是从多个表或视图导出的表。视图是一个虚表，数据库不对视图所对应的数据进行实际存储，只存储视图的定义，对视图的数据进行操作时,只能将字段定义为视图,不能将具体的数据定义为视图为什么oracle需要视图; &
Mockito(一) --入门篇 bijian1013 持续集成 mockito 单元测试
Mockito是一个针对Java的mocking框架，它与EasyMock和jMock很相似，但是通过在执行后校验什么已经被调用，它消除了对期望行为（expectations）的需要。其它的mocking库需要你在执行前记录期望行为（expectations），而这导致了丑陋的初始化代码。 &nb
精通Oracle10编程SQL(5)SQL函数 bijian1013 oracle 数据库 plsql
/* * SQL函数 */ --数字函数 --ABS(n):返回数字n的绝对值 declare v_abs number(6,2); begin v_abs:=abs(&no); dbms_output.put_line('绝对值：'||v_abs); end; --ACOS(n):返回数字n的反余弦值，输入值的范围是-1~1，输出值的单位为弧度
【Log4j一】Log4j总体介绍 bit1129 log4j
Log4j组件：Logger、Appender、Layout Log4j核心包含三个组件：logger、appender和layout。这三个组件协作提供日志功能：日志的输出目标日志的输出格式日志的输出级别(是否抑制日志的输出) logger继承特性 A logger is said to be an ancestor of anothe
Java IO笔记白糖_ java
public static void main(String[] args) throws IOException { //输入流 InputStream in = Test.class.getResourceAsStream("/test"); InputStreamReader isr = new InputStreamReader(in); Bu
Docker 监控 ronin47 docker监控
目前项目内部署了docker，于是涉及到关于监控的事情，参考一些经典实例以及一些自己的想法，总结一下思路。 1、关于监控的内容监控宿主机本身监控宿主机本身还是比较简单的，同其他服务器监控类似，对cpu、network、io、disk等做通用的检查，这里不再细说。额外的，因为是docker的
java-顺时针打印图形 bylijinnan java
一个画图程序要求打印出： 1.int i=5; 2.1 2 3 4 5 3.16 17 18 19 6 4.15 24 25 20 7 5.14 23 22 21 8 6.13 12 11 10 9 7. 8.int i=6 9.1 2 3 4 5 6 10.20 21 22 23 24 7 11.19
关于iReport汉化版强制使用英文的配置方法 Kai_Ge iReport汉化英文版
对于那些具有强迫症的工程师来说，软件汉化固然好用，但是汉化不完整却极为头疼，本方法针对iReport汉化不完整的情况，强制使用英文版，方法如下：在 iReport 安装路径下的 etc/ireport.conf 里增加红色部分启动参数，即可变为英文版。 # ${HOME} will be replaced by user home directory accordin
[并行计算]论宇宙的可计算性 comsci 并行计算
现在我们知道,一个涡旋系统具有并行计算能力.按照自然运动理论,这个系统也同时具有存储能力,同时具备计算和存储能力的系统,在某种条件下一般都会产生意识...... 那么,这种概念让我们推论出一个结论 &nb
用OpenGL实现无限循环的coverflow dai_lm android coverflow
网上找了很久，都是用Gallery实现的，效果不是很满意，结果发现这个用OpenGL实现的，稍微修改了一下源码，实现了无限循环功能源码地址： https://github.com/jackfengji/glcoverflow public class CoverFlowOpenGL extends GLSurfaceView implements GLSurfaceV
JAVA数据计算的几个解决方案1 datamachine java Hibernate 计算
老大丢过来的软件跑了10天，摸到点门道，正好跟以前攒的私房有关联，整理存档。 -----------------------------华丽的分割线------------------------------------- 数据计算层是指介于数据存储和应用程序之间，负责计算数据存储层的数据，并将计算结果返回应用程序的层次。J &nbs
简单的用户授权系统,利用给user表添加一个字段标识管理员的方式 dcj3sjt126com yii
怎么创建一个简单的(非 RBAC)用户授权系统通过查看论坛，我发现这是一个常见的问题，所以我决定写这篇文章。本文只包括授权系统.假设你已经知道怎么创建身份验证系统(登录)。数据库首先在 user 表创建一个新的字段(integer 类型),字段名 'accessLevel',它定义了用户的访问权限扩展 CWebUser 类在配置文件(一般为 protecte
未选之路 dcj3sjt126com 诗
作者:罗伯特*费罗斯特黄色的树林里分出两条路, 可惜我不能同时去涉足, 我在那路口久久伫立, 我向着一条路极目望去, 直到它消失在丛林深处. 但我却选了另外一条路, 它荒草萋萋,十分幽寂; 显得更诱人,更美丽, 虽然在这两条小路上, 都很少留下旅人的足迹. 那天清晨落叶满地, 两条路都未见脚印痕迹. 呵,留下一条路等改日再
Java处理15位身份证变18位蕃薯耀 18位身份证变15位 15位身份证变18位身份证转换
15位身份证变18位，18位身份证变15位 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 201
SpringMVC4零配置--应用上下文配置【AppConfig】 hanqunfeng springmvc4
从spring3.0开始，Spring将JavaConfig整合到核心模块，普通的POJO只需要标注@Configuration注解，就可以成为spring配置类，并通过在方法上标注@Bean注解的方式注入bean。 Xml配置和Java类配置对比如下： applicationContext-AppConfig.xml <!-- 激活自动代理功能参看：
Android中webview跟JAVASCRIPT中的交互 jackyrong JavaScript html android 脚本
在android的应用程序中,可以直接调用webview中的javascript代码,而webview中的javascript代码,也可以去调用ANDROID应用程序(也就是JAVA部分的代码).下面举例说明之: 1 JAVASCRIPT脚本调用android程序要在webview中,调用addJavascriptInterface(OBJ,int
8个最佳Web开发资源推荐 lampcy 编程 Web 程序员
Web开发对程序员来说是一项较为复杂的工作，程序员需要快速地满足用户需求。如今很多的在线资源可以给程序员提供帮助，比如指导手册、在线课程和一些参考资料，而且这些资源基本都是免费和适合初学者的。无论你是需要选择一门新的编程语言，或是了解最新的标准，还是需要从其他地方找到一些灵感，我们这里为你整理了一些很好的Web开发资源，帮助你更成功地进行Web开发。这里列出10个最佳Web开发资源，它们都是受
架构师之面试------jdk的hashMap实现 nannan408 HashMap
1.前言。如题。 2.详述。 (1)hashMap算法就是数组链表。数组存放的元素是键值对。jdk通过移位算法（其实也就是简单的加乘算法），如下代码来生成数组下标(生成后indexFor一下就成下标了）。 static int hash(int h) { h ^= (h >>> 20) ^ (h >>>
html禁止清除input文本输入缓存 Rainbow702 html 缓存 input 输入框 change
多数浏览器默认会缓存input的值，只有使用ctl+F5强制刷新的才可以清除缓存记录。如果不想让浏览器缓存input的值，有2种方法：方法一：在不想使用缓存的input中添加 autocomplete="off"; <input type="text" autocomplete="off" n
POJO和JavaBean的区别和联系 tjmljw POJO java beans
POJO 和JavaBean是我们常见的两个关键字，一般容易混淆，POJO全称是Plain Ordinary Java Object / Pure Old Java Object，中文可以翻译成：普通Java类，具有一部分getter/setter方法的那种类就可以称作POJO，但是JavaBean则比 POJO复杂很多， Java Bean 是可复用的组件，对 Java Bean 并没有严格的规
java中单例的五种写法 liuxiaoling java 单例
/** * 单例模式的五种写法： * 1、懒汉 * 2、恶汉 * 3、静态内部类 * 4、枚举 * 5、双重校验锁 */ /** * 五、双重校验锁，在当前的内存模型中无效 */ class LockSingleton { private volatile static LockSingleton singleton; pri