第二章 Java 数据分析算法引擎系统
线性,非线性,维度,场景,仿生听觉,视觉,排序,搜索,基础应用: 元基催化与肽计算 编译机的仿生分析机
定义: 微分催化排序 一般指 将传统的排序在数据排列计算过程中 进行 内存峰值波动平均,计算逻辑减少,计算算子减少,计算条件减少,计算的频率减少,计算关系减少的催化过程。
价值是方便函数 元基索引 和 新陈代谢,二次新陈代谢。(见之后的 象契排序算法的 新陈代谢催化优化实例)
内存峰值波动平均,(见小高峰过滤左右比对算法)
计算逻辑减少,(见比较函数的 缩进优化)
计算算子减少,(见增序,与减序替换)
计算条件减少,(见狄摩根离散条件or变换)
计算的频率减少,(见选择排序的小于deep的堆栈检测替换,和阀门逻辑序列频率统计 代码排列优化)
计算关系减少 (见算子减少和条件减少的相互关系优化)
的催化过程。
定义人 罗瑶光
催化过程作者认为是提高算能利用的过程,符合生产力的发展。
计算力与算能优化的思想手稿 20190914
最近有WCC1st 长沙 拜听了中科院超算 老师们关于计算力的趋势发展做的详细发言,深有感触,于是结合自
己 10 年基础所学和 6 年国内外工作和实习的经验,写一篇我关于计算力的细节,应用和发展趋势的理解手稿。如下。
计算力的概念 我所理解为 计算能。这是未来世界发展的一种能源,算能。 算能 不是新能源,但是,算能的认知,的确是新的篇章。举个例子,从古代到现代,从树枝,结绳,心算,度量衡, 珠算,到现在的 AMU, IC,等嵌入式或者片上系统,到大规模,集成,和微晶列阵计算单元硬件系统,算能的 趋势微 从简到繁,从大到小,从宏到微,从专到精,从单到群 的过程。而这个过程标志着 算能的利用率逐渐接近人认知的最大化。更为高效的 算能 挖掘方式,是目前主流科学家们一直保持白热化研究的主题。10 年前,社会很少出现这类词汇,但是热衷于这个领域的新兴产业主要是 互联网的普及。这个过程恰恰完成了 算能 的从大到小,从宏到微,从专到精,从单到群的 进化过程。特别是摩尔定律。我思考了很久,摩尔有瓶颈吗?先避开上面这个问题,我得到一个明确的细节,社会的白热化发展趋势,必然 新型算能,能源在被挖掘中。
比如:
1 基础算子能:就是通过非人类所能理解的算子列阵来代替线行的公式来做复杂运算。 比如DNA 计算,德塔的 DNA mask 列阵 initon 链就是一种。
2 量子算能:通过量化的概率比来对带有计算物质进行处理,比如波动微观物质的波动概率,向量集的比例计算,神经网络的 算核卷积等。
3 光算:通过不同频率的电磁波进行耦合计算,达到极度并行算法 散列算力加速。
4 微电的超导计算:在完全没有阻力的电信号运算,永不失真。
我评估了下未来的算能发展 趋势为:从经典到非认知,从可控到主猜测,从自主到自适应,从无机到有机体的过程需求离不开市场,这些 新型算能怎么转化为人类科技呢?我想到了一个答案:机器人上面的部份 强调新型算能改变算力的趋势。这个部份我思考了更多细节来优化新型算能过程。
1:计算逻辑的理解方式。
通常我们认为所能理解的计算逻辑是按照 类人认知的思想,把社会需求封装成计算函数的过程。这个过程终究是人所能理解的范畴。机器是人做的,具备人的思维共性可是机器在计算质量上,以后终将超过人类,那么问题就来了,不被理解的逻辑和思想所形成的概率比,以后只会越来越大。很多不被理解将成为趋势,法律约束问题,我们暂不讨论。接受和顺应一些新的思维方式,必然不断冲击着人类社会的科技和伦理。这是一个社会变革所能产生的巨大压力来源。解决和研发方案以后要有。
2:计算数据的采集模式。
计算的数据形形色色,不同的模式下,数据表现得形式也不一样,能够通过某种观测模式,把数据进行迅速有效得预处理,是一个重要主题。
3:计算过程的相似度过滤机制。
计算得数据多种多样,计算逻辑千姿百态,可是计算过程却极其相似。而相似度高的组件重用,逻辑优化,信息归元,是算能优化的科学方向。
4:计算结果的验证优化。
计算结果是需要检测维护的,检测时手段直接确定结果的区间有效性。我们需要更多的思考。
5:计算进化的知识图谱统计。
计算,实现终究是硬件,软件的有机体组成,这个组成系统终究是变化的。正确的进化和升级直接改进算能体系。 统计学能准确的进行测量计算进化过程中的各种数据数值多观测点分析。当然,还有很多想法,我不敢多写,因为没有得到实际的论证,将来有机会涉及它的细节,我会反复的实践来明确答案。
最后:
如果我能进行定义,我定义 计算算能优化公式为 真实环境中 每 1 秒 函数执行需要走的硬件逻辑门(与或非总数 S)与 软件函数本身执行需要的(与或非总数 s)的比
公式为 N =S(AON)/s(AON)
N= 算能单位
AON= AND +OR+ NEGATIVE (与或非门器件)
S= 每时间秒函数在非结束状态走过的 AON 累计总和 (微秒 对应 微 N,纳秒 对应 纳 N)
s= 函数本身执行需要走的非重复 AON 单元总和
20190914 北京时间 4:34 罗瑶光
注:通过这个函数可以确定函数优化前后的计算能力值,确定优化是否有效。
罗瑶光
20190914
德塔卷积数据分析 例子
Alkaid 罗瑶光的视频
· 34 播放
函数集合
1 德塔的数据分析包,最早是作者在大学的处理 Rohini教授的 C语言数据结构《Data Structure》 和 Renhart教授 计算机视觉卷积的《Computer Vision》课后作业。
《Data Structure》refer page 226,230,235,238,253,作者没有把当年的计算器四则运算器和rotation tree等作业算法归纳在该作品中。
《Computer Vision》refer page 202,204,205,206,209,211,212,213,214,217,218,220,221,259,260,
2 德塔的卷积在2013年后不断的完善,发现其在仿生听觉和视觉计算中都能进行系统的应用,于是开始优化。refer page 191
作者一开始设计卷积是路德大学图片上的应用,2013年,当ETL设计成了节点处理图片像素后,作者开始设计声音 java sound API的处理, 2014年。这个引擎逐渐在计算机仿生系统中进行集成应用。论证了其在具体应用工程中的实践价值。作者当时设计了主要用来测测作者自己的心跳。
3 优化方式为将计算函数进行插件接口模式封装成jar,方便上层调用。refer page 190
4 封装的过程中,不断的进行细化优化,衍生出多个辅助计算函数集,如催化排序,仿生滤波。 refer page 247,655
UML
线性,
1 德塔的数据分析包 包含array的线性排序处理 refer page 见排序
2 德塔的数据分析包 包含array的线性卷积处理 refer page 见卷积
Yann Lecun卷积文字思想 ,罗瑶光画图。版权图片
Yann Lecun卷积文字思想 ,罗瑶光画图,版权图片
Yann Lecun卷积文字思想 ,罗瑶光画图,版权图片
Yann Lecun卷积文字思想 ,罗瑶光画图,版权图片
Refer:根据Yann Lecun卷积文字思想 ,罗瑶光画图,版权图片。
Gitee 20190623 感想 :关于卷积微分法和积分法的应用。作者在这里进行注释下。
第一次接触卷积积分实在南京炮兵学院大三,一堂电磁波课程, 作者仅仅理解了acos b+bsin a的线性公式含义。
第二次接触是作者在瑞拉理工学院读书的时候,班加罗尔大学一位数学教授对线性矩阵求导做了交叉卷积的分式。
第三次接触是作者在上海电气原机床研究所上班,接触到巴特沃斯卷积核,当时驱动组让作者进行卷积表述,作者用原生的傅里叶推导进行矩阵求解做了例子,当时上海电气没有采用,而是为了快速而选择了数字卷积技术。
第四次接触是作者在路德大学的计算机视觉课程,全面用数字卷积技术处理图片流。refer 《计算机视觉教材》 绿皮子那本。
第五次是作者在2014-2015年采用快速傅里叶进行人类语音处理。
第六次是作者在2015年后与牛津大学霍华德教授做阅读障碍脑波数据病理分析,(感谢当时巴黎1大学生提供给作者傅式相位方程组公式)
第七次是作者开始研究微傅阶超快速余弦变换微分做盲分离,在隐写术,量信号,亚声函数领域应用。
最后作者2018年设计德塔图灵自然语言系统,采用了vpcs微分催化矩阵加速原理。作者思考,通过对称计算原理可以知道,微分计算能加速,积分计算同样可以加速,于是在vpcs进化中,进行微,积分催化自适应矩阵生成技术研究,在以后的数字信号处理器中通过量化计算模块组逐步剔除加乘逻辑模块,形成真正人工智能量子量化微积分芯片。
思想价值20220410作者发现之后的作者设计概率钥匙和session token 的pde微化<->pds积化 通过肽展公式加密 的组合拓扑,似乎也和这微积分有点思维灵感。
非卷积视觉计算奠基溯源
作者当是时萌生了一个想法,如果卷积的内核算核越大,那么每一个算子的循环遍历次数变增加,于是为了提升计算质量,整体的速度和计算消费将指数提高,举例,100个矩阵数,算核是2*2, 那么需要遍历 100*2*2计算次数,如果是3*3,那么需要 100*3*3 计算次数,4*4,以此类推,则是计算 400次, 900次,1600次。2500次,损耗接近于m * n**2的指数翻倍。。作者思考,是否有类似于快速卷积如O(n) 或者至少是O(logn)的计算级别算法出现弥补这个缺陷。这个需求极为迫切。这个想法为后来的第十章的非卷积视觉计算奠基。
描述人 罗瑶光
3 ANN RNN DNN 线性深度卷积计算处理 refer page 222,223,223,
关于 Etl Unicorn对 音频卷积处理的文字描述
作者在将计算机视觉的课程进行了pipe line etl处理后看了乐观的结果,作者想,这些cnn卷积算法一定也可以处理线性的声音领域。于是开始基于java sound包来分析语音,如图所示 wave read 的开头还有很多小点的噪音,通过maxmin(低滤高滤)过滤后
https://github.com/yaoguangluo/Data_Processor/blob/master/DP/soundProcessor/MaxMiniPro.java
第71行 comp比例裁剪
就没有噪点,这张图片是作者从早期2014的测试截图,当时还没有涉及傅里叶频率域变换,谐波噪声平滑等高级功能。作者的当时主要动机是测试作者心跳
作者的心跳
是否正常。(图中巴特沃斯是带通数值滤波
https://github.com/yaoguangluo/Data_Processor/blob/master/DP/soundProcessor/ButterworthPro.java
第69行
与拉普拉斯滤波
https://github.com/yaoguangluo/Data_Processor/blob/master/DP/soundProcessor/LaplacianPro.java
第70行
非一种模式)
描述人 罗瑶光
非线性,
1 德塔的数据分析包 包含图论的非线性广度建模 refer page 226,230
2 德塔的数据分析包 包含图论的非线性深度建模 refer page 230,232
3 德塔的数据分析包 包含图论的非线性树建模 refer page 236,243,253
维度,
1 德塔的数据分析包 包含1维 语音数组计算实例 refer page 见智能声诊
2 德塔的数据分析包 包含2维 图片卷积计算实例 refer page 见智能相诊
3 德塔的数据分析包 包含3维 数据循环阶计算实例 refer page 见噪音识别,三阶傅里叶应用,animation等
德塔三阶傅里叶计算定义:一般指将线性的时序语音波进行傅里叶变换,此时的波为 频率域波,通过简单的噪声频率过滤后,让后再进行第二次傅里叶变换。于是输出的时序波结果会非常的均匀和格式化,产生优美的平滑间隔峰区间,于是将此时序波第三次傅里叶变换,再次得到的频率波输出具有明确的间隔峰区间生物特征标记。用于德塔语音识别。
定义人 罗瑶光
具体描述:智能声诊断视频描述
关于声音噪声处理的描述:作者通过java sound的jdk开源语音包api 进行声卡录音处理,通过麦克风物理设备来进行 data readline 函数 record 自然界声音,这时候声音是一串串的1维 double 和 float (具体看api的版本配置)线性数据,于是作者将这些线性的 数据进行每 1024 个数据循环进行一小段小段的提取进行
第一次离散傅里叶DFT变换(快速傅里叶FFT也可以,只是在处理偶数和对称数列比较好), 这时候第一次 时序波变频率域波的 波形变出来了,于是作者进行更进截取低频的主要区间频率,依次进行了拉伸,和高斯平滑处理,然后把处理过的频率波进行波峰线提取, 然后将波峰线进行极值化,更进向左平移对齐(方便格式化取值), 进行
第二次离散傅里叶DFT变换,于是一个稳定的平滑的时序波就出现了。作者将这个稳定的时序波进行 单个的间隔峰裁剪,因为只要一个震荡周期区间即可标识特定周期循环出现声音,(不需要多个 时序的震荡周期,当然多个可以统计增加精准), 于是开始将这个裁剪拉伸的单个间隔峰时序波 进行
第三次离散傅里叶DFT变换,这时候频率就比较稳定了。这个3次傅里叶声音计算过程,可以用来做声音标记等,广泛应用于声音类的工业场景。作者的测试实例主要来自作者(罗瑶光)自己的AOEIU 元音发音记录实例。
描述人 罗瑶光
场景,
1 图片的操作。refer page 214
2 像素的操作。refer page 见视觉
智能相诊多媒体图片描述
作者给养疗经的智能相诊设计了视频暂停,录入的功能,首先,视频录入方便了养疗经进行视频快放和倒放的功能,这样视频的多媒体处理能力得到了加强,其次方便截图和截图的图片进行像素级别操作,如单一帧图片的像素画图和像素标记,标记的图片帧又能融入视频中,复合加强视频多媒体处理能力。 描述人 罗瑶光
3 文件的存储。refer page 214
4 语音的处理。refer page 见听觉
仿生听觉,
1 滤噪计算 高斯1D,median refer page 206, 213, 260
2 频率变换 傅里叶, 快速傅里叶 refer page 258
关于ETL 视觉流的应用描述
首先,我们导入一张图片,如作者的大头贴, 图片因为是用低质量的摄像头进行拍摄,虽然很清晰,但是色阶比较暗淡,作者便用计算机视觉研究生教材的像素拉伸思想进行java编码,将一张0~255的色阶图片拉伸到20~230左右,于是得到棱角分明的图像,因为太多分明,于是用高斯卷积来模糊处理下,这样图片就是棱角分明而且视觉平滑,高斯平滑后进行索贝尔mask梯度(mag+dir)卷积计算,于是可以看到眉毛和眼睛的梯度差如灰色和白色的辨别。最后进行emboss 浮雕卷积计算。作者用这个图片 有力的 举例论证 ETL + 卷积视觉 能够广泛适用于其工业应用场景。
备注作者的计算机视觉绿皮书是没有java代码的,代码来自作者把renhart布置的课后作业都做了一边。甚至连 卡拉森的数据库作业都是作者自己做的,题目是UC戴维斯大学的,而答案全部来自作者自己辛勤劳动。(个人主观略)
描述人 罗瑶光
视觉,
1 德塔的视觉主要包含常见2维卷积滤波函数。refer page
2 边缘计算 索贝尔凸蚀,索贝尔梯度,索贝尔向量,拉普拉斯refer page 218, 212
养疗经 肽计算版本 智慧搜索 结合 智慧相诊 应用实例
Alkaid 罗瑶光的视频
· 4 播放
养疗经 肽计算版本 智慧搜索 结合 智慧相诊 应用实例 文字描述
作者将 医学骨科教材的疾病图片进行格式化存储,用于搜索和像素展示,展示的过程中集成了卷积像素处理的函数。如将图片搜索页的数据进行智能相诊页综合处理,这时候 emboss的浮雕计算可以描绘出三维的立体感,也可以用绿色像素抑制来观测黄色骨架结构。这是一个自主游标操作的环节。可自适应。
描述人 罗瑶光
3 凹度计算 emboss浮雕,索贝尔mask,refer page 204,
4 频率计算 傅里叶时序域,傅里叶频率域,哈尔计算,refer page 258, 211,
5 腐蚀计算 膨胀计算,侵蚀计算,均值计算,高斯计算1D一字, 高斯2D十字。refer page 202, 204, 205, 206
准备描述下德塔Java卷积算法在 索贝尔家族的 场景计算中描述。
主要描述下 索贝尔凹度,凸度,梯度,向量四个属性。作者在路德上课的时候比较系统的学习了索贝尔算子原理,曲力学原理和常见的mag, dir应用边缘求解场景。renhart给作者出的考试题目是关于m,d的mask梯度求解实现。这些都很好解释,如计算机视觉的绿皮教材中有非常详细的单词描述。
作者在2018年后设计红外监控系统。计算索贝尔算法在实际的工程应用中,得到一些经验归纳。发现索贝尔的实际用途不是书上介绍的那么简单。确切的说,索贝尔算法属于力学范畴,只是恰好在计算机视觉中展示比较直白,结果明朗,被人所接受。确切的说索贝尔算法描述的是一种自然场力。我来做着研究描述。当我们设计了mag 和 dir,两种,一种为规范的折叠曲线,我们可以理解为视觉边缘轮廓,一种为梯度曲线,我们可以理解为视觉向量雕塑。在计算机视觉中两种像素集 mask 可以得到边缘的立体视觉, 而这只是对索贝尔的最简单应用。
索贝尔的mag的折叠边缘,在力学中,属于挤压的意思,而 dir的梯度在力学中属于张力和结晶。 不仅挤压有规则,结晶体同样有花纹。这两种力的表达可以将图片进行光影的分布进行有效的三维计算,在mag的边缘部分以为着挤压力差值明显,dir的梯度可以确定是 挤 还是 压, 确定三维力学的向量。这些向量于是可以表现为 张力和曲力,也可以表现为 挤凸蚀 还是 压凹蚀。
上面是索贝尔的力学简单表达的一种规范,跟进力学计算中,如果将索贝尔的力进行微分, 那么这种区间内的向量数量,表达含义将非常丰富。如场力的稳定状态,力场的不规则求解场力的流动性,物体的内部状态,很多人会问到这 力怎么能用像素来表达呢,作者举个例子,像素是扑捉光影,光其实一种能量,确切的说图片 其实 就是一张能量图。这就好理解了。能量是可以进行力学转化的。如作者的头像进行索贝尔mask,可以清楚得到,作者眉毛和眼睛的力学表达是眉毛上凹下凸,眼睛上凹下凸,的向量表达,白色部分代表能量的聚集。可以理解为索贝尔计算表达的是作者头像图片中的不稳定区间能量扑捉,只是刚好体现在棱角边缘而已。而这种能量扑捉能进行3维化。
描述人 罗瑶光 稍后优化
排序,
作者pdf中与dongxinrong 的算法 pk思考:
关于看了dongxinrong的无condition条件排序对比,作者当时随便github搜 天下第一排序法,世界最快排序法 等关键字 搜的,目的是进行速度pk,看自己的算法斤两,今天看了下(20220330)思考一个问题,排序中的剔除IF 条件,作者认为,if 用中文理解,可以定义为某种事件,确切的说是某种确切的事件,因为是确切,所以没有概率,没有条件,必然执行,或者执行了也不会影响本身,可以理解为容错率,这种特性,在一些场景中,一定有可以用得到的地方。作者期待中,希望能够遇到。后面必然是一个世界。
描述人罗瑶光
1 德塔的排序作者早期2009年设计《算法导论》 黑皮书 ,北邮出版社有其 数据结构 影印教材 的 快速排序4代,进行了10年优化,refer pagehttps://github.com/yaoguangluo/Data_Processor/blob/master/DP/sortProcessor/Quick_4D_Sort.java
2 优化过程归纳,逐渐的形成了一个微分催化排序体系。refer page 247,248,250, 658,下册134,
3 左右比对算法优化,小高峰过滤优化,缺陷峰归纳,催化算子优化,离散逻辑优化。refer page 658,下册134,
左右比对算法优化,一般指在不对称的数列中,为了寻找对称性观测面,作者设计了一种比较简单的方法,如将数列逐渐拆分, 取出拆分后的小数列的初值和尾值进行比较,作为一个参照点,用于躲避计算高峰。测试发现具有强大的实用性。
小高峰过滤优化,一般指为了躲避内存计算高峰而导致的延迟,卡顿,死锁,堆栈溢出等问题 而设计的一类高效率算法集合。
缺陷峰归纳, 一般指计算数列在不断的拆分中的中值基偶问题导致了变量,算子,函数的使用频率不对称而出现的一系列蝴蝶效应问题集的归纳。
催化算子优化,一般指 计算的中间过程中 因 变量,算子,函数的使用频率 不对称,不稳定导致的各种问题 ,为了解决这类问题而 进行的不断 的对 变量,算子,函数优化与校正过程。
离散逻辑优化,一般指 对 变量,算子,函数优化与校正过程中 通过离散数学, 迪摩根定律,等客观存在的逻辑定律进行 不断优化与校正过程。
定义人 罗瑶光
4 目前代表作为TopSort5D 极速催化排序。refer page 下册134
搜索,
1 德塔的搜索计算主要做一个编码参照,没有工程用途。refer page 226
2 编码参照有利于作者在设计图论计算和非线性搜索时候发散思维用途。refer page
3 编码开始于作者2009年 完成 Rohini教授布置的作业。refer page 我 qq 313699483 有完整作业备份日记。
4 对作者研究Hash空间 有发散思维的用途,如作者数据预测包设计的辅助。refer page
应用
1 TopSort5D 包含深度算子,包含广度算子,包含滤波算子。refer page 下册134
TopSort5D 版权源码
关于极快速微分催化排序的deep 变量溯源
作者早年仅仅只是完成印度基督大学 rohini教授布置的《数据结构》课后作业,作业做的比较仔细,当时图论的广度和深度计算体现在神经网络的路径探索中。举例如balanced tree的搜索与遍历。和 哈夫曼编码模拟实例。更多的具体应用如 计算器的复杂四字运算括号识别。这个基础意识也是作者的top sort5D 极速排序体系的 deep 变量的定义最早来源,这里有必要描述下。因为极为优秀的快速排序思想 毕竟也有个缺陷便是疯狂的吞噬内存堆栈,一开始国际比较通用range来消除堆栈吞噬问题,如《算法导论》的4代已经包含的range函数原型,作者进行了关联发散思考,作者严谨的认为如果在工业场景中,range用于确定堆栈的损耗减少界限,那么这只是对特定一种balanced堆栈分配的界限 条件状态有价值,如果在一些非对称峰中进行切割和计算,那么range的表达能力变不强了,deep能更好的确定迭代层次,有效的对堆栈吞噬问题直接进行一刀切,于是deep + range的组合界限变问世了。
描述人 罗瑶光
本人调通的算法导论的quicksort4D算法链接如下,可直接区别,再次Refer 快速排序之父 霍尔先生:
https://github.com/yaoguangluo/Data_Processor/blob/master/DP/sortProcessor/Quick_4D_Sort.java
2 索贝尔 dir 向量差 区别三维的立体面特征趋势。refer page 219
3 噪音识别。refer page 720
4 小波分离。refer page 不在此章 涉及鸡尾酒调度,被略去先
5 极速商旅TSP。refer page 538,541,547
6 股票数据抓取 refer page 不在此章, 261, 263, 264, 266可以处理 股票数据线波。
关于股市数据的应用描述
该软件是作者为父亲做个股票分析系统。作者首先设计一个矩阵分行显示股票数据,数据来自作者对雪球,新浪,财富,很多网页的抓取,抓取的网页不是统一的编码格式,于是进行了gbk,2312,utf8等格式编码统一(data swap),这些double数值于是进行多样化的展示,这里便用到了数据分析算法的 平均值,统计,贝叶斯,等知识点的简单应用。 左下图图片是作者在新浪网裁下来的,不是作者自己设计算法生成的。根据进仓资金进行了傅里叶变换来观测庄家进仓频率,右下图所示。 另外包括十大庄家,大资金手笔入仓出仓动态。有力的证明了作者的大数据分析引擎的金融商业领域价值。
作者贡献:当时发现股市金融入仓的15天比 为 -+-时候 有个特征缺陷,发现了一个资金当天涨,当天卖的流入漏洞,容易被恶意短期操盘。 当时作者群发了此现象。 描述人 罗瑶光
极速象契拼音笔画排序描述:
首先作者设计该算法前已经有了极速排序为基础。于是尝试将字符串的按拼音和笔画进行象契综合计算来排序。中文的拼音和笔画,可以在康熙字典,词源和新华字典上进行录入。作者录入的方式比较简单统一为map, 其中文字key对应拼音和笔画value,进行相应的索引。这个过程为索引的map预处理。(作者有百度和豆丁文库的词汇购买记录,如 新华字典的中文汉字,康熙字典,国家语言等级词汇等等。目前百度帐号OK、,但豆丁不是15116110525和qq绑定,而是用作者的微信sweet00048帐号来绑定的,2022年3月2号前莫名被腾讯永久冻结,因为此事非常蹊跷,所以作者至今也不会解绑,当然以后也不会解绑,所以国家依旧能查到。)
作者将这些购买的原材料doc和txt文档进行加工处理生成了2个txt格式的拼音词库文件和笔画词库文件。于是开始计算字符串比对排序。作者按通用的拼音进行指针对应的每两行两行进行极快速微分催化,小高峰过滤,左右比对法综合按快速排序的方式(目前是top sort 5D)进行从a到z进行char对应int大小来计算排列。当出现拼音完全相同的字的时候,于是比对这个同音字的笔画的多少进行深化条件补充排序。如果在这个时候依旧出现既相同拼音,又相同笔画的字的场景,作者便根据字符的char的ascii编码,(utf8,gbk,gb2312 都有相应的文字int编码)来区分。于是把这整个过程中一些恒定的中间变量全局化作为带精度观测入参,进行自适应。目前这个算法的函数一直在进行DNA元基催化编码索引的新陈代谢+二次新陈代谢进化排序优化中。
描述人 罗瑶光
涉及著作权文件:
1.罗瑶光. 《Java数据分析算法引擎系统 V1.0.0》. 中华人民共和国国家版权局,软著登字第4584594号. 2014.
2.罗瑶光. 《数据预测引擎系统 V1.0.0》. 中华人民共和国国家版权局,软著登字第5447819号. 2020.
3.罗瑶光,罗荣武. 《类人DNA与 神经元基于催化算子映射编码方式 V_1.2.2》. 中华人民共和国国家版权局,国作登字-2021-A-00097017. 2021.
4.罗瑶光,罗荣武. 《DNA元基催化与肽计算第二卷养疗经应用研究20210305》. 中华人民共和国国家版权局,国作登字-2021-L-00103660. 2021.
5.罗瑶光,罗荣武. 《DNA 元基催化与肽计算 第三修订版V039010912》. 中华人民共和国国家版权局,国作登字-2021-L-00268255. 2021.
6.类人数据生命的DNA计算思想 Github [引用日期2020-03-05]https://github.com/yaoguangluo/Deta_Resource
7.罗瑶光,罗荣武. 《DNA元基催化与肽计算 第四修订版 V00919》. 中华人民共和国国家版权局,SD-2022Z11L0025809. 2022.
罗瑶光
文件资源
1 jar: https://github.com/yaoguangluo/ChromosomeDNA/blob/main/BloomChromosome_V19001_20220108.jar
2 book 《DNA元基催化与肽计算 第四修订版 V00919》上下册
https://github.com/yaoguangluo/ChromosomeDNA/tree/main/元基催化与肽计算第四修订版本整理
3 函数在git的存储地址:demos
Github:https://github.com/yaoguangluo/ChromosomeDNA/
Coding:https://yaoguangluo.coding.net/public/YangLiaoJingHuaRuiJi/YangliaojingHuaruiji/
Bitbucket:https://bitbucket.org/luoyaoguang/yangliaojing/
Gitee:https://gitee.com/DetaChina/
4 uml: https://blog.csdn.net/weixin_38249398/category_11647527.html