Rebornrn

智能信息处理技术研讨会（天津大学）个人记录

一、前言

1. 关于此次会议
2. 感谢

二、会议内容

1. ABCD时代的智能安防信息技术发展趋势探讨

一、人工智能的诞生和发展历程（简要概括）
二、随之而来的安全问题
三、大数据自然社会理解与感知计算
四、总结一下

2. ICDT融合下的移动网络

一、移动通信的变迁
二、关于FPGA的一些知识
三、关于5G的切片知识

3. 盲评估进化计算方法

一、盲评估起源
二、进化算法
三、个体适应度盲评估方法

4. 智能信息处理在DNA存储中的应用

一、背景
二、具体技术
三、总结

5. 智能时代数据安全典型问题及策略

一、网络空间安全
二、从安全视角看人工智能
三、数据流转中的安全问题
四、数据发布问题中的安全问题
五、数据共享中的安全问题

6. 边缘计算在智能信息处理中的应用

三、个人感想

一、前言

尺有所短，寸有所长，日丰一寸，必见其长

1. 关于此次会议

会议主办单位：中国电子学会标准认证中心
会议承办单位：天津大学自动化学院&天津大学DSP实验室
地点：天津大学&晋滨国际酒店三层

2. 感谢

首先这是天津大学DSP实验室第一次承办这样的研讨会，里边就有我很多同学，首先要为他们用心的付出表示感谢（从饮食，交通，会议安排，时间控制，设备管理等等方面都做的非常好，也感谢天津大学DSP实验室张涛老师对于学生们的培养工作）
感谢每个与会人员和每位学术界或工业界的老师，让我这个普通硕士生能够了解到现如今工业界和学术界相关领域的一些发展情况。

此次博客以我这样一个机器学习方向普通硕士生的视角来写，知识点在笔记本中记录的比较琐碎，未免有分析不到或者错误之处，还希望大家能够批评指正，谢谢大家！！

二、会议内容

1. ABCD时代的智能安防信息技术发展趋势探讨

报告人：胡瑞敏（武汉大学计算机学院、曾任海康威视公司第一任研究院院长）

其中这里的ABCD分别代指：

Artificial intelligence 人工智能
Blockchain 区块链
Cloud computing 云计算
big Data 大数据

一、人工智能的诞生和发展历程（简要概括）

http://www.360doc.com/content/17/1207/13/1609415_710797958.shtml
结论：智能就是机器学习和求解问题的能力
具体可以细分为：

符号智能
计算智能
机器学习
机器感知

其中机器感知包含我们现如今耳熟能详的CV（计算机市局），语音识别，NLP（自然语言处理），IR（图像识别）

二、随之而来的安全问题

跨区域犯罪成为国际犯罪趋势
犯罪规模化、智能化、产业化趋势明显
网络空间犯罪逐渐成为主流

因此有必要引导我们以往的安防模式向全空间模式发展。
我们需要在此基础之上进行理论与思维的变革，将整个的信息空间分成三个部分

人类社会
物理世界
网络空间

由此引出了这三种不同空间的三元空间演进以及全空间安全问题
网络空间安全可以分为三大方面：信息安全、技术安全和社会安全。我们所认知的全部的技术安全都是基于人类认知区域的盲区，也就是利用人所看不到想不到的地方去进行网络攻击问题。
这里老师引出了一个理论：那就是关于数据与行为的可见与理解：人类是无法理解超过一定尺度的行为数据的

三、大数据自然社会理解与感知计算

本质问题有三：

自然行为理解
自然组织理解
自然社会理解

现如今身份安全逐渐成为网络安全的核心，我们平常乘坐高铁有时就利用了身份证+人脸识别的双重信息，那么就可能会有人利用这一点将个人信息窃取之后进行信息盗窃的问题。这就引出了下面一个矛盾
即低维脆弱身份和高纬可信身份的矛盾
我们的身份往往不止一个，在学校里你是学生，将来加入工作你会是另外一个身份，将来进入不同的企业更会有更多的身份，这就引出了身份树的概念，人的身份是在不断生长变化的，有可能每段成长经历会在“身份树”上生长出一片叶子，但是基于你人自己的基本身份是不会变的，因此身份树中既包含基本身份即根身份，又包含以后生长出来的身份即类身份
现如今的人脸识别主要有两个不同的方面，一是有感识别：即验证方式会让你眨眨眼，二就是无感识别：即验证方式就是普通的验证人脸。
同时我们需要研究人的内在行为模式的力量，这里老师举了个例子：假设说一个人在花鸟市场上看到了一个鸟笼，觉得特别的漂亮，于是就把它买回了家并且摆在家里最显眼的地方，但是家里每每有客人来访，就会问：“你家鸟是不是死掉了，怎么只有鸟笼没有小鸟？”，来一个人就这么问，来一个人就这么问，直到这个人被问烦了，于是就把这个鸟笼给拿下去了，这就是人的内在行为模式的力量！！！
与此同时需要分析场景社会安全态势，其中包括：结构、环境和活动三个方面：
例子：如果单纯的分析一个人的活动是不可能判断出一个恐怖分子是不是会对机场产生威胁，因为他的活动可以跟正常人无异，我们需要从更多更广的层面加以分析和判断。

自然社会理解胡老师主要研究的典型技术：

对象可信身份溯源
对象属性关联研究

四、总结一下

新背景下智能安防技术的任务

身份理论与未知对象追踪优化
行为模式与群体属性分离关联
分布差异与虚假属性检测复原（局限：不能有效识别高仿面具）
影响机制与对象影响力路径（通过分解稀疏数据：有点类似于自己的研究方向中实用的方法，即矩阵的低秩表示求解）

2. ICDT融合下的移动网络

报告人：赵明（清华大学）
其中这里的ICDT指的是Information（信息），Communication（通信），Data（数据）

一、移动通信的变迁

模拟到数字
窄带到宽带
话音到数据
toC到toB

其中值得注意的是话音到数据的变迁，这里学到一个知识就是：以前的3G网络更多的其实是针对于话音通信而设计的，并不是针对数据通信而设计的，因此4G在这一点上根据时代的需求进行了相应改进，针对数据通信进行了相应设计

二、关于FPGA的一些知识

之前了解过一些关于FPGA中嵌入神经网络做深度学习的一些应用，从老师那边了解到现在的赛灵思公司有一个大的新业务就是在服务器等等计算平台中，嵌入它的低功耗加速卡，这里有一个例子：大家平时用电脑访问京东，淘宝等购物网站时，用鼠标划过商品图片，这个图片就会被放大，这个并不是用服务器跑出来的，而是用FPGA加速卡弄出来的，好处就是低功耗+速度快

三、关于5G的切片知识

现如今谈到移动通信就不得不说起5G，从老师那边了解到了关于5G切片的一些知识。

网络切片的优势在于其能让网络运营商自己选择每个切片所需的特性，例如低延迟、高吞吐量、连接密度、频谱效率、流量容量和网络效率，这些有助于提高创建产品和服务方面的效率，提升客户体验。不仅如此，运营商无需考虑网络其余部分的影响就可进行切片更改和添加，既节省了时间又降低了成本支出，也就是说，网络切片可以带来更好的成本效益。
关于这个贴上一个链接：关于5G切片

3. 盲评估进化计算方法

报告人：张涛（天津大学）
其中这里的盲评估指的是在无法给出系统或者模型的具体表达式的时候估计出系统的输入输出情况。张老师的研究方向将其应用在了视频处理当中

一、盲评估起源

盲评估最先起源于最优化问题：对于给定的问题，我们往往会根据实际情况对系统进行建模，然后利用最优化理论对模型进行分析；但我们实际遇到的问题很多都是非常复杂，难以建模的，如何在这种情况之下对系统做出评估就是盲评估需要研究的问题。

二、进化算法

进化算法，或称“演化算法” (evolutionary algorithms, EAS) 是一个“算法簇”，尽管它有很多的变化，有不同的遗传基因表达方式，不同的交叉和变异算子，特殊算子的引用，以及不同的再生和选择方法，但它们产生的灵感都来自于大自然的生物进化。与传统的基于微积分的方法和穷举法等优化算法相比，进化计算是一种成熟的具有高鲁棒性和广泛适用性的全局优化方法，具有自组织、自适应、自学习的特性，能够不受问题性质的限制，有效地处理传统优化算法难以解决的复杂问题。
关于进化算法，这里贴一个链接：进化算法

三、个体适应度盲评估方法

在进化算法之中有一个个体适应度的概念，链接：个体适应度
在纷繁复杂的进化算法中，如何利用盲评估求解最优化问题就显得尤为重要，我们需要对复杂的问题进行盲评估建模，然后利用训练出来的模型对系统的输入输出进行分析。

4. 智能信息处理在DNA存储中的应用

报告人：张淑芳（天津大学）

一、背景

首先对比一下传统的信息存储方式：传统方式中采用硬盘等存储器存储，在数据量大的情况之下具有能耗高，保存时间不够长，污染大等特点；而DNA技术则具有保存量大，能耗小，存储时间长的特点。
DNA存储技术的核心思维是：将数据转化为DNA片段存储。
大家都知道DNA都有A、G、C、T四种不同的碱基，那么这些剪辑就可以视作编码的一种方式，传统的计算机硬盘采用0或者1的存储方式，那么我们就可以灵活地用AGCT的模式替代传统的01模式来存储信息。用人工碱基合成做编码，用DNA测序技术读取信息。传统方法具有一定的存储年限，而DNA存储技术要远大于硬盘存储密度与时间，并且具有易恢复的特点，但他也具有合成费用高，时间长的缺点。那么一个小的解决方法就是一段信息并不是合成一整条长的序列对，而是合成好几条短的序列对。DNA合成的另一个缺点就是：不易擦除（全生命周期问题）
DNA数据存储技术研究现状：

欧洲生物信息研究所
哈佛研究团队
微软：DNA服务器

DNA喷泉码概念：就像喷泉周围总会生成落地的小水珠一样，如果我们看不到喷泉的全貌，在喷泉喷的时间够长的情况下，我们是否可以通过落地的小水珠的信息还原出本来的喷泉信息呢？喷泉码就是这个思路，通过长时间的数据采集，每次采集到的原本信息的一部分，然后最终通过这些碎片化的信息还原出原来信息的全貌。

二、具体技术

主要包含三个不同的技术

碱基序列片段
纠错编码
随机存取

在这里介绍一下DNA碱基序列转换的不同方式：

传统计算机采用01存储，DNA有AGCT四种不同碱基，那么我们可以考虑采用A或者G来代表0，C或者T来代表1，这样可以避免生物学中的均聚物出现以及G或者C的含量过高的问题
三进制转换编码

我们知道三进制数据有0,1,2三个数组成，既然我的碱基有四种，那么我可以选择其中一个，利用这一个与下一个的不同进行三进制的编码，编码方式如上图
Huffman加四进制汉明纠错存储编码，这种编码方式需要对序列进行分割，那么它的缺点也就随之而来了：合成成本非常的高，以至于用这种去做视频编码有它的局限性
度分布函数的改进：基于概率转移法
基于RS码（四进制）的DNA存储纠错方法
随机存取：通过添加存取引物，对数据进行精确划分和随机存取

三、总结

就目前的发展情况来看，DNA存储技术是一门跨学科的研究方向，也正是因为如此，其中也存在着很多很多的研究困难，包括DNA快速数据存取，数据迁移，数据擦除等等等等，老师在最后给大家介绍了DNA计算机的概念，同样也是从DNA存储箱中拿数据出来，操作的复杂程度也比传统存取方式高得多，因此DNA信息存储以后还有很长的路要走。

5. 智能时代数据安全典型问题及策略

报告人：刘哲理（南开大学）

一、网络空间安全

网络空间安全共包含具体两大方面：

保护服务器的正常使用（功能正常）
保护数据不被窃取（数据正常）

老师在这里举出了几个例子（以及我自己找的一些链接）

永恒之蓝比特币勒索事件：link
”震网病毒“link
“齐默尔曼电报”link
“图灵机” link

二、从安全视角看人工智能

现如今机器学习和深度学习等人工智能领域取得了巨大成功，但是真实能够转化为资金的数量却不多（x世科技？），而且现如今的独角兽公司一大部分都要靠政府补贴才能够活得下来。
下边以无人驾驶为例子来看这个问题：
攻击类型主要分成两种：数据攻击和模型、应用攻击

这也对应了前边第一点中提到的网络安全的两个方面，即数据安全和功能安全；无人驾驶作为人工智能的应用领域之一，必然是经过大量视频等数据先预处理再训练之后得到的结果，那么在这个过程中数据被破坏则称之为数据攻击；同样在训练模型和实现功能的时候，如果此时模型或者应用场景遭到了破坏，我们把它叫做模型、应用攻击。

三、数据流转中的安全问题

此节包含两个主要问题：1. 数据脱敏（静态或动态）；2. 数据溯源

数据脱敏（data masking）是指对某些敏感信息通过脱敏规则进行数据的变形，实现敏感隐私数据的可靠保护。在涉及客户安全数据或者一些商业性敏感数据的情况下，在不违反系统规则条件下，对真实数据进行改造并提供测试使用，如身份证号、手机号、卡号、客户号等个人信息都需要进行数据脱敏。link

数据溯源（data provenance）是一个新兴的研究领域，诞生于 20 世纪 90 年代。当初，某些文献将其称为数据志或数据档案，后来，大部分文献将其命名为数据起源，有追踪数据的起源和重现数据的历史状态之意。本文称其为数据溯源，从应用的角度出发，强调追踪的过程和方法。link

四、数据发布问题中的安全问题

本节中依旧包含两个主要问题：1. 隐私保护的数据收集；2. 隐私保护的数据发布

关于隐私保护的数据收集和隐私保护的数据发布，讲究的是我们应该如何在保护用户隐私的前提之下收集用户的一些数据，且与此同时还要做到用户数据不被窃取或者攻击；每个企业都拥有敏感数据：商业秘密、知识产权、关键业务信息、业务合作伙伴信息或客户信息。必须根据公司政策、法规要求和行业标准保护所有此类数据。任何收集、使用和存储敏感信息的企业均应制订信息分类政策和标准。该分类政策和标准应按企业的需求包含少数几个分类等级。大多数企业至少设有公共、仅供内部使用和机密等三个类别。
许多企业都有长期沿用的数据分类指导方针。然而，随着不断增多的新法规与行业标准的发展，仅仅存在公司政策已是不够。部分企业付出了大量的时间和精力，通过部署不同的控制措施和工具以尽量减少违规风险，将他们的数据保护政策实体化为信息技术（IT ）基础设施。在过去几年中涌现的数据泄漏检测、预防和保护技术现已获得 IT 机构的广泛采用。应由数据治理、风险管理、合规性和业务要求来决定每项数据类别的数量及定义，以及针对数据标识、存储、分配、披露、保留和销毁的要求。显然，监管与行业规则和标准将在定义过程中扮演重要角色。其他数据同样需要保护，其中包括商业秘密、研究成果、配方、申请专利之前的发现以及各种形式的客户与员工信息。
数据保护的另一个重要方面是了解数据在企业运营中的使用方式，以及数据的存放形式（如硬拷贝、电子文档、数据库内存储）。此外，在生产、生产支持、开发、质量保证（QA）或第三方等不同类型的操作环境中，保护要求也各异。
必须明确规定对敏感或机密数据的保护要求，并在相应的监管与行业规则和标准或业务政策内反映出具体的要求。必须将特定的数据元素标记为敏感数据，且绝不应按真实形态用于开发、质保或其他非生产环境中。数据分类政策应清楚确认数据屏蔽要求。
最后，企业必须实施审计流程，定期提供独立评审以确保对最佳实践的遵行。

五、数据共享中的安全问题

这里老师谈到了一个联邦机器学习的问题：

联邦机器学习又名联邦学习，联合学习，联盟学习。联邦机器学习是一个机器学习框架，能有效帮助多个机构在满足用户隐私保护、数据安全和政府法规的要求下，进行数据使用和机器学习建模。
联邦学习技术及数据隐私保护大会上明确提出了“联邦机器学习”这个概念。数据是机器学习的基础。而在大多数行业中,由于行业竞争、隐私安全、行政手续复杂等问题,数据常常是以孤岛的形式存在的。甚至即使是在同一个公司的不同部门之间实现数据集中整合也面临着重重阻力。在现实中想要将分散在各地、各个机构的数据进行整合几乎是不可能的,或者说所需的成本是巨大的。随着人工智能的进一步发展,重视数据隐私和安全已经成为了世界性的趋势。每一次公众数据的泄露都会引起媒体和公众的极大关注,例如Facebook的数据泄露事件就引起了大范围的抗议行动。

6. 边缘计算在智能信息处理中的应用

报告人：邵鹏（恩智浦半导体公司）

首先需要介绍一下边缘计算的具体概念和想法：
边缘计算起源于传媒领域，是指在靠近物或数据源头的一侧，采用网络、计算、存储、应用核心能力为一体的开放平台，就近提供最近端服务。其应用程序在边缘侧发起，产生更快的网络服务响应，满足行业在实时业务、应用智能、安全与隐私保护等方面的基本需求。边缘计算处于物理实体和工业连接之间，或处于物理实体的顶端。而云端计算，仍然可以访问边缘计算的历史数据。
边缘计算处理数据中心明显的优势有以下几点：

边缘计算可以实时或者更快地进行数据处理和分析，让数据处理更靠近源，而不是外部数据中心或者云，可以缩短延迟时间
在成本预算上可以大大减轻经费预算。企业在本地设备上的数据管理解决方案所花费的成本大大低于云和数据中心网络。
减少网络流量。随着物联网设备的增加，数据生成继续以创纪录的速度增长。结果，网络带宽变得更加有限，压倒了云，导致了更大的数据瓶颈。
提高应用程序效率。通过降低延迟级别，应用程序可以更高效、更快速地运行。
个性化：通过边缘计算，可以持续学习，根据个人的需求调整模型，带来个性化互动体验
参考页面

那么既然说到边缘计算就不得不提它和云计算的关系了，无论是云、雾还是边缘计算，本身只是实现物联网、智能制造等所需要计算技术的一种方法或者模式。严格讲，雾计算和边缘计算本身并没有本质的区别，都是在接近于现场应用端提供的计算。就其本质而言，都是相对于云计算而言的。
首先来看云计算的范式：

可以看到数据传输是在数据库，云和电脑端进行的，这样可能会导致数据量很大的时候云服务的瘫痪。
下面是边缘计算的范式：

这样就减轻了部分云的负担，而且保证了数据的安全性，是比较良好的计算方式。

三、个人感想

如今的社会跟以前大不相同，我所听的第二场报告，讲无线通信5G技术的那个老师就明显感觉是抱着学习的心态来参加研讨会的（包括他自己也说），我们的产业都是随着时间不断发展变化的，我们作为研究这个领域的学生更应该随着时代不断提升自己，还是希望以后有机会能够参加更多这样的研讨会，更多地了解关于云计算和人工智能的相关内容~

尺有所短，寸有所长，日丰一寸，必见其长

【心灵鸡汤】深度学习技能形成树：从零基础到AI专家的成长路径全解析智算菩萨人工智能深度学习
引言：技能树的生长哲学在这个人工智能浪潮汹涌的时代，深度学习犹如一棵参天大树，其根系深深扎入数学与计算科学的沃土，主干挺拔地承载着机器学习的核心理念，而枝叶则繁茂地延伸至计算机视觉、自然语言处理、强化学习等各个应用领域。对于初入此领域的新手而言，理解这棵技能树的生长规律，掌握其形成过程中的关键节点和发展阶段，将直接决定其在人工智能道路上能够走多远、攀多高。技能树的概念源于游戏设计，但在学习深度学习
【计算机毕业设计】基于Springboot的办公用品管理系统+LW 枫叶学长(专业接毕设) Java毕业设计实战案例课程设计 spring boot 后端
博主介绍：✌全网粉丝3W+,csdn特邀作者、CSDN新星计划导师、Java领域优质创作者,掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和学生毕业项目实战,高校老师/讲师/同行前辈交流✌技术范围：SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、小程序、安卓app、大数据、物联网、机器学习等设计与开发。主要内容：
【TVM 教程】如何处理 TVM 报错
ApacheTVM是一个深度的深度学习编译框架，适用于CPU、GPU和各种机器学习加速芯片。更多TVM中文文档可访问→https://tvm.hyper.ai/运行TVM时，可能会遇到如下报错：---------------------------------------------------------------AnerroroccurredduringtheexecutionofTVM.F
【PaddleOCR】OCR文本检测与文本识别数据集整理，持续更新......
博主简介：曾任某智慧城市类企业算法总监，目前在美国市场的物流公司从事高级算法工程师一职，深耕人工智能领域，精通python数据挖掘、可视化、机器学习等，发表过AI相关的专利并多次在AI类比赛中获奖。CSDN人工智能领域的优质创作者，提供AI相关的技术咨询、项目开发和个性化解决方案等服务，如有需要请站内私信或者联系任意文章底部的的VX名片（ID：xf982831907）博主粉丝群介绍：①群内初中生、
ImportError: /nvidia/cusparse/lib/libcusparse.so.12: undefined symbol: __nvJitLinkComplete_12_4 爱编程的喵喵 Python基础课程 python ImportError torch nvJitLink 解决方案
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。本文主要介绍了ImportError:/home/
【机器学习笔记 Ⅱ】11 决策树模型巴伦是只猫机器学习机器学习笔记决策树
决策树模型（DecisionTree）详解决策树是一种树形结构的监督学习模型，通过一系列规则对数据进行分类或回归。其核心思想是模仿人类决策过程，通过不断提问（基于特征划分）逐步逼近答案。1.核心概念节点类型：根节点：起始问题（最佳特征划分点）。内部节点：中间决策步骤（特征判断）。叶节点：最终预测结果（类别或数值）。分支：对应特征的取值或条件判断（如“年龄≥30？”）。2.构建决策树的关键步骤(1)
【机器学习笔记 Ⅱ】10 完整周期
机器学习的完整生命周期（End-to-EndPipeline）机器学习的完整周期涵盖从问题定义到模型部署的全过程，以下是系统化的步骤分解和关键要点：1.问题定义（ProblemDefinition）目标：明确业务需求与机器学习任务的匹配性。关键问题：这是分类、回归、聚类还是强化学习问题？成功的标准是什么？（如准确率>90%、降低10%成本）输出：项目目标文档（含评估指标）。2.数据收集（DataC
【机器学习笔记Ⅰ】13 正则化代价函数
正则化代价函数（RegularizedCostFunction）详解正则化代价函数是机器学习中用于防止模型过拟合的核心技术，通过在原始代价函数中添加惩罚项，约束模型参数的大小，从而提高泛化能力。以下是系统化的解析：1.为什么需要正则化？过拟合问题：当模型过于复杂（如高阶多项式回归、深度神经网络）时，可能完美拟合训练数据但泛化性能差。解决方案：在代价函数中增加对参数的惩罚，抑制不重要的特征权重。2.
【机器学习笔记Ⅰ】6 多类特征巴伦是只猫机器学习机器学习笔记人工智能
多类特征（Multi-classFeatures）详解多类特征是指一个特征（变量）可以取多个离散的类别值，且这些类别之间没有内在的顺序关系。这类特征是机器学习中常见的数据类型，尤其在分类和回归问题中需要特殊处理。1.核心概念(1)什么是多类特征？定义：特征是离散的、有限的类别，且类别之间无大小或顺序关系。示例：颜色：红、绿、蓝（无顺序）。城市：北京、上海、广州（无数学意义的大小关系）。动物类别：猫
图像分割技术详解：从原理到实践 lanjieying
本文还有配套的精品资源，点击获取简介：图像分割是图像处理领域将图像分解为多个区域的过程，用于图像分析、特征提取等。文章介绍了图像分割的原理，并通过一个将图像划分为2*4子块的示例，展示了如何使用Python和matplotlib库中的tight_subplot函数进行图像分割和展示。文章还探讨了图像分割在不同领域的应用，以及如何在机器学习项目中作为数据预处理步骤。1.图像分割基本概念在图像处理领域
机器学习笔记——支持向量机 star_and_sun 机器学习笔记支持向量机
支持向量机参数模型对分布需要假设（这也是与非参数模型的区别之一）间隔最大化，形式转化为凸二次规划问题最大化间隔间隔最大化是意思：对训练集有着充分大的确信度来分类训练数据，最难以分的点也有足够大的信度将其分开间隔最大化的分离超平面的的求解怎么求呢？最终的方法如下1.线性可分的支持向量机的优化目标其实就是找得到分离的的超平面求得参数w和b的值就可以了注意，最大间隔分离超平面是唯一的，间隔叫硬间隔1.1
【机器学习&深度学习】多分类评估策略一叶千舟深度学习【理论】深度学习【应用必备常识】大数据人工智能
目录前言一、多分类3大策略✅宏平均（MacroAverage）✅加权平均（WeightedAverage）✅微平均（MicroAverage）二、类比理解2.1宏平均（MacroAverage）2.1.1计算方式2.1.2适合场景2.1.3宏平均不适用的场景2.1.4宏平均一般用在哪些指标上？2.1.5怎么看macroavg指标？2.1.6宏平均值低说明了什么？2.1.7从宏平均指标中定位模型短板
【机器学习笔记Ⅰ】7 向量化巴伦是只猫机器学习机器学习笔记人工智能
向量化（Vectorization）详解向量化是将数据或操作转换为向量（或矩阵）形式，并利用并行计算高效处理的技术。它是机器学习和数值计算中的核心优化手段，能显著提升代码运行效率（尤其在Python中避免显式循环）。1.为什么需要向量化？(1)传统循环的缺陷低效：Python的for循环逐元素操作，速度慢。代码冗长：需手动处理每个元素。示例：计算两个数组的点积（非向量化）a=[1,2,3]b=[4
李宏毅2025《机器学习》第四讲-Transformer架构的演进
Transformer架构的演进与替代方案：从RNN到Mamba的技术思辨Transformer作为当前AI领域的标准架构，其设计并非凭空而来，也并非没有缺点。本次讨论的核心便是：新兴的架构，如MAMA，是如何针对Transformer的弱点进行改进，并试图提供一个更优的解决方案的。要理解架构的演进，我们必须首先明确一个核心原则：每一种神经网络架构，都有其存在的技术理由。CNN（卷积神经网络）：为
条件概率：不确定性决策的基石大千AI助手人工智能 Python #OTHER 决策树算法机器学习人工智能条件概率概率论
条件概率是概率论中的核心概念，用于描述在已知某一事件发生的条件下，另一事件发生的概率。它量化了事件之间的关联性，是贝叶斯推理、统计建模和机器学习的基础。本文由「大千AI助手」原创发布，专注用真话讲AI，回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我，一起撕掉过度包装，学习真实的AI技术！一、定义与公式设(A)和(B)是两个随机事件，且(P(B)>0)：条件概率(P(A\midB))表示
人工智能动画展示人类的特征 AGI大模型与大数据研究院 AI大模型应用开发实战 java python javascript kotlin golang 架构人工智能
人工智能，动画，人类特征，情感识别，行为模拟，机器学习，深度学习，自然语言处理1.背景介绍人工智能（AI）技术近年来发展迅速，已渗透到生活的方方面面。从智能语音助手到自动驾驶汽车，AI正在改变着我们的世界。然而，尽管AI技术取得了令人瞩目的成就，但它仍然难以完全模拟人类的复杂行为和特征。人类的特征是多方面的，包括情感、认知、社交和创造力等。这些特征是人类区别于其他生物的重要标志，也是人类社会文明发
《支持向量机（SVM）在医疗领域的变革性应用》 CodeJourney. 支持向量机算法机器学习
在医疗科技日新月异的今天，先进的数据分析与机器学习技术正逐渐成为提升诊疗水平、助力医学研究的关键力量。支持向量机（SVM），凭借其独特的优势，在医疗这片复杂且对精准度要求极高的领域崭露头角，带来诸多令人瞩目的应用成果。一、疾病诊断：癌症早期筛查的“火眼金睛”癌症，作为全球健康的“头号杀手”，早期诊断对提升患者生存率意义非凡。在乳腺癌筛查领域，SVM发挥着重要作用。医疗科研人员收集大量乳腺组织的影像
机器学习20-线性网络思考坐吃山猪机器学习机器学习人工智能线性网络
机器学习20-线性网络思考针对线性网络的基础问题，使用基础示例进行解释1-核心知识点1-线性模型家族的线性回归和逻辑回归分别是什么，线性模型家族还有没有其他的模型线性模型家族是一系列基于线性假设的统计模型，它们假设因变量和自变量之间存在线性关系。线性模型家族中的两个最常见模型是线性回归和逻辑回归。线性回归（LinearRegression）:线性回归是一种用于预测连续因变量的模型。它假设因变量yy
机器学习18-强化学习RLHF 坐吃山猪机器学习机器学习人工智能
机器学习18-强化学习RLHF1-什么是RLHFRLHF（ReinforcementLearningfromHumanFeedback）即基于人类反馈的强化学习算法，以下是详细介绍：基本原理RLHF是一种结合了强化学习和人类反馈的机器学习方法。传统的强化学习通常依赖于预定义的奖励函数来指导智能体的学习，而RLHF则通过引入人类的反馈来替代或补充传统的奖励函数。在训练过程中，人类会对智能体的行为或输
机器学习19-Transformer和AlexNet思考坐吃山猪机器学习机器学习 transformer 人工智能
Transformer和AlexNet思考关于Transformer和AlexNet发展的一些思考1-核心知识点Word2Vec的作用是什么，和Transformer的诞生有什么关系吗？AlexNet的主要核心思路是什么，为什么表现那么好？现在有什么比AlexNet更优秀的算法2-思路整理1-Word2Vec的作用是什么，和Transformer的诞生有什么关系吗？Word2Vec的作用Word2
机器学习21-线性网络思考坐吃山猪机器学习机器学习人工智能线性网络
机器学习21-线性网络思考针对线性网络的发展问题，进行补充学习1-核心知识点1-传统机器学习针对线性分类算法求解的方式有哪些？请详细列举不同的算法对应的损失函数和计算思路在传统机器学习中，线性分类算法是一种非常重要的方法，用于将数据划分为不同的类别。以下是几种常见的线性分类算法，包括它们的损失函数和计算思路：1.感知机（Perceptron）损失函数感知机的损失函数是基于误分类点的，其目标是最小化
Spring AI 第二讲之 Chat Model API 第五节HuggingFace Chat
HuggingFaceInferenceEndpoints允许您在云中部署和提供机器学习模型，并通过API对其进行访问。开始使用有关HuggingFaceInferenceEndpoints的更多详细信息，请访问此处。前提条件添加spring-ai-huggingface依赖关系：org.springframework.aispring-ai-huggingface获取HuggingFaceAPI
Python设置国内镜像教程 wh3933 python 开发语言
####引言Python是一种广泛使用的高级编程语言，用于各种编程任务，从简单的脚本到复杂的机器学习算法。在安装Python包时，通常需要从Python包索引（PyPI）下载。由于网络原因，直接从PyPI下载可能速度较慢，因此，使用国内的镜像源可以显著提高下载速度。本文将详细介绍如何在Python中设置国内镜像。####文章目的本篇文章旨在指导用户如何将Python的包管理工具`pip`的默认源切
机器学习宝典——第6章爱看烟花的码农机器学习人工智能
第6章：聚类算法(Clustering)你好，同学！欢迎来到无监督学习的世界。与监督学习不同，这里的我们没有“标准答案”（标签），我们的目标是在数据中发现隐藏的、内在的结构。聚类算法就是实现这一目标的核心工具，它试图将数据集中的样本划分为若干个不相交的子集，我们称之为“簇”(cluster)。本章我们将深入探讨三种最具代表性的聚类算法：K-均值(K-Means)、层次聚类(Hierarchical
结构型智能科技的关键可行性——信息型智能向结构型智能的转变（修改提纲）刘海东刘海东人工智能机器学习算法
结构型智能科技的关键可行性——信息型智能向结构型智能的转变1.信息型智能科技概述1.1传统计算机科技的信息型继承者1.2信息型智能环境1.3信息型智能主体1.4机器学习创造的智能1.5信息型智能科技的缺陷2.结构型智能科技概述2.1传统计算机科技向生命结构的发展2.2结构型智能科技的环境2.3结构型智能科技创造的机器生命2.4结构型智能科技的科学性3.结构型智能科技的关键可行性——信息型智能向结构
多模态大模型：技术原理与实战看清GPT的进化史和创新点 AI天才研究院 Agentic AI 实战计算 AI人工智能与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
多模态大模型：技术原理与实战看清GPT的进化史和创新点1.背景介绍1.1人工智能的发展历程1.1.1早期人工智能1.1.2机器学习时代1.1.3深度学习的崛起1.2自然语言处理的演进1.2.1基于规则的方法1.2.2统计机器学习方法1.2.3深度学习方法1.3大语言模型的出现1.3.1Transformer架构的提出1.3.2GPT系列模型的发展1.3.3多模态大模型的兴起2.核心概念与联系2.1
【机器学习|学习笔记】组合特征（Feature Combinations）是提升模型性能、挖掘特征交互信息、增强非线性表达能力的有效手段。努力毕业的小土博^_^ 机器学习学习笔记机器学习学习笔记人工智能神经网络深度学习
【机器学习|学习笔记】组合特征（FeatureCombinations）是提升模型性能、挖掘特征交互信息、增强非线性表达能力的有效手段。【机器学习|学习笔记】组合特征（FeatureCombinations）是提升模型性能、挖掘特征交互信息、增强非线性表达能力的有效手段。文章目录【机器学习|学习笔记】组合特征（FeatureCombinations）是提升模型性能、挖掘特征交互信息、增强非线性表达
R语言的软件开发工具纪霁然包罗万象 golang 开发语言后端
R语言的软件开发工具引言R语言因其强大的数据分析能力和丰富的统计包，自发布以来便广受欢迎。随着数据科学和分析的迅猛发展，R语言也逐渐成为数据分析、机器学习和统计建模领域的重要工具。为了更好地利用R语言进行软件开发，许多软件开发工具和环境应运而生。本文将深入探讨R语言的主要开发工具，帮助开发者更高效地进行数据处理和分析。1.R和RStudio基础R语言本身是一个用于统计计算和图形绘制的编程语言，而R
结合创新idea：机器学习+运筹优化=CCF高端局 Ai多利机器学习人工智能
2024深度学习发论文&模型涨点之——机器学习+运筹优化机器学习是人工智能的一个分支，它使计算机系统能够从数据中学习并改进其性能，而无需进行明确的编程。运筹优化，也称为运筹学或运营管理，是应用数学的一个分支，它使用数学模型和算法来支持复杂决策过程的制定。机器学习与运筹优化的结合是一个前沿且活跃的研究领域，它们相互补充，为解决复杂问题提供了新的思路和方法。小编整理了一些机器学习+运筹优化【论文+代码
Jupyter安装指南及Python配置 CodeWG python jupyter ide Python
Jupyter是一个非常流行的交互式计算环境，广泛用于数据分析、机器学习和科学计算等领域。本文将详细介绍如何安装Jupyter并配置Python环境。步骤1：安装Python首先，我们需要安装Python。请按照以下步骤进行操作：打开Python官方网站（https://www.python.org）并下载适用于您操作系统的最新版本的Python。运行下载的安装程序，并按照向导的指示进行安装。在安
java责任链模式 3213213333332132 java 责任链模式村民告县长
责任链模式，通常就是一个请求从最低级开始往上层层的请求，当在某一层满足条件时，请求将被处理，当请求到最高层仍未满足时，则请求不会被处理。就是一个请求在这个链条的责任范围内，会被相应的处理，如果超出链条的责任范围外，请求不会被相应的处理。下面代码模拟这样的效果：创建一个政府抽象类,方便所有的具体政府部门继承它。 package 责任链模式; /** *
linux、mysql、nginx、tomcat 性能参数优化 ronin47
一、linux 系统内核参数 /etc/sysctl.conf文件常用参数 net.core.netdev_max_backlog = 32768 #允许送到队列的数据包的最大数目 net.core.rmem_max = 8388608 #SOCKET读缓存区大小 net.core.wmem_max = 8388608 #SOCKET写缓存区大
php命令行界面 dcj3sjt126com PHP cli
常用选项 php -v php -i PHP安装的有关信息 php -h 访问帮助文件 php -m 列出编译到当前PHP安装的所有模块执行一段代码 php -r 'echo "hello, world!";' php -r 'echo "Hello, World!\n";' php -r '$ts = filemtime("
Filter&Session 171815164 session
Filter HttpServletRequest requ = (HttpServletRequest) req; HttpSession session = requ.getSession(); if (session.getAttribute("admin") == null) { PrintWriter out = res.ge
连接池与Spring,Hibernate结合 g21121 Hibernate
前几篇关于Java连接池的介绍都是基于Java应用的，而我们常用的场景是与Spring和ORM框架结合，下面就利用实例学习一下这方面的配置。 1.下载相关内容： &nb
[简单]mybatis判断数字类型 53873039oycg mybatis
昨天同事反馈mybatis保存不了int类型的属性,一直报错，错误信息如下: Caused by: java.lang.NumberFormatException: For input string: "null" at sun.mis
项目启动时或者启动后ava.lang.OutOfMemoryError: PermGen space 程序员是怎么炼成的 eclipse jvm tomcat catalina.sh eclipse.ini
在启动比较大的项目时，因为存在大量的jsp页面，所以在编译的时候会生成很多的.class文件，.class文件是都会被加载到jvm的方法区中，如果要加载的class文件很多，就会出现方法区溢出异常 java.lang.OutOfMemoryError: PermGen space. 解决办法是点击eclipse里的tomcat，在
我的crm小结 aijuans crm
各种原因吧，crm今天才完了。主要是接触了几个新技术： Struts2、poi、ibatis这几个都是以前的项目中用过的。 Jsf、tapestry是这次新接触的，都是界面层的框架，用起来也不难。思路和struts不太一样，传说比较简单方便。不过个人感觉还是struts用着顺手啊，当然springmvc也很顺手，不知道是因为习惯还是什么。jsf和tapestry应用的时候需要知道他们的标签、主
spring里配置使用hibernate的二级缓存几步 antonyup_2006 java spring Hibernate xml cache
．在spring的配置文件中 applicationContent.xml，hibernate部分加入 xml 代码 <prop key="hibernate.cache.provider_class">org.hibernate.cache.EhCacheProvider</prop> <prop key="hi
JAVA基础面试题百合不是茶抽象实现接口 String类接口继承抽象类继承实体类自定义异常
/* * 栈（stack）：主要保存基本类型（或者叫内置类型）（char、byte、short、 *int、long、 float、double、boolean）和对象的引用，数据可以共享，速度仅次于 * 寄存器（register），快于堆。堆（heap）：用于存储对象。 */ &
让sqlmap文件 "继承" 起来 bijian1013 java ibatis sqlmap
多个项目中使用ibatis , 和数据库表对应的 sqlmap文件（增删改查等基本语句)，dao, pojo 都是由工具自动生成的, 现在将这些自动生成的文件放在一个单独的工程中，其它项目工程中通过jar包来引用，并通过"继承"为基础的sqlmap文件，dao,pojo 添加新的方法来满足项
精通Oracle10编程SQL(13)开发触发器 bijian1013 oracle 数据库 plsql
/* *开发触发器 */ --得到日期是周几 select to_char(sysdate+4,'DY','nls_date_language=AMERICAN') from dual; select to_char(sysdate,'DY','nls_date_language=AMERICAN') from dual; --建立BEFORE语句触发器 CREATE O
【EhCache三】EhCache查询 bit1129 ehcache
本文介绍EhCache查询缓存中数据，EhCache提供了类似Hibernate的查询API，可以按照给定的条件进行查询。要对EhCache进行查询，需要在ehcache.xml中设定要查询的属性数据准备 @Before public void setUp() { //加载EhCache配置文件 Inpu
CXF框架入门实例白糖_ spring Web 框架 webservice servlet
CXF是apache旗下的开源框架，由Celtix + XFire这两门经典的框架合成，是一套非常流行的web service框架。它提供了JAX-WS的全面支持，并且可以根据实际项目的需要，采用代码优先（Code First）或者 WSDL 优先（WSDL First）来轻松地实现 Web Services 的发布和使用，同时它能与spring进行完美结合。在apache cxf官网提供
angular.equals boyitech AngularJS AngularJS API AnguarJS 中文API angular.equals
angular.equals 描述: 比较两个值或者两个对象是不是相等。还支持值的类型，正则表达式和数组的比较。两个值或对象被认为是相等的前提条件是以下的情况至少能满足一项：两个值或者对象能通过=== （恒等）的比较两个值或者对象是同样类型，并且他们的属性都能通过angular
java-腾讯暑期实习生-输入一个数组A[1,2,...n]，求输入B，使得数组B中的第i个数字B[i]=A[0]*A[1]*...*A[i-1]*A[i+1] bylijinnan java
这道题的具体思路请参看何海涛的微博：http://weibo.com/zhedahht import java.math.BigInteger; import java.util.Arrays; public class CreateBFromATencent { /** * 题目：输入一个数组A[1,2,...n]，求输入B，使得数组B中的第i个数字B[i]=A
FastDFS 的安装和配置修订版 Chen.H linux fastDFS 分布式文件系统
FastDFS Home:http://code.google.com/p/fastdfs/ 1. 安装 http://code.google.com/p/fastdfs/wiki/Setup http://hi.baidu.com/leolance/blog/item/3c273327978ae55f93580703.html 安装libevent (对libevent的版本要求为1.4.
[强人工智能]拓扑扫描与自适应构造器 comsci 人工智能
当我们面对一个有限拓扑网络的时候,在对已知的拓扑结构进行分析之后,发现在连通点之后,还存在若干个子网络,且这些网络的结构是未知的,数据库中并未存在这些网络的拓扑结构数据....这个时候,我们该怎么办呢? 那么,现在我们必须设计新的模块和代码包来处理上面的问题
oracle merge into的用法 daizj oracle sql merget into
Oracle中merge into的使用 http://blog.csdn.net/yuzhic/article/details/1896878 http://blog.csdn.net/macle2010/article/details/5980965 该命令使用一条语句从一个或者多个数据源中完成对表的更新和插入数据. ORACLE 9i 中，使用此命令必须同时指定UPDATE 和INSE
不适合使用Hadoop的场景 datamachine hadoop
转自：http://dev.yesky.com/296/35381296.shtml。　　Hadoop通常被认定是能够帮助你解决所有问题的唯一方案。当人们提到“大数据”或是“数据分析”等相关问题的时候，会听到脱口而出的回答：Hadoop! 实际上Hadoop被设计和建造出来，是用来解决一系列特定问题的。对某些问题来说，Hadoop至多算是一个不好的选择，对另一些问题来说，选择Ha
YII findAll的用法 dcj3sjt126com yii
看文档比较糊涂，其实挺简单的： $predictions=Prediction::model()->findAll("uid=:uid",array(":uid"=>10)); 第一个参数是选择条件：”uid=10″。其中:uid是一个占位符，在后面的array(“:uid”=>10)对齐进行了赋值；更完善的查询需要
vim 常用 NERDTree 快捷键 dcj3sjt126com vim
下面给大家整理了一些vim NERDTree的常用快捷键了，这里几乎包括了所有的快捷键了，希望文章对各位会带来帮助。切换工作台和目录 ctrl + w + h 光标 focus 左侧树形目录ctrl + w + l 光标 focus 右侧文件显示窗口ctrl + w + w 光标自动在左右侧窗口切换ctrl + w + r 移动当前窗口的布局位置 o 在已有窗口中打开文件、目录或书签，并跳
Java把目录下的文件打印出来蕃薯耀列出目录下的文件文件夹下面的文件目录下的文件
Java把目录下的文件打印出来 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月11日 11:02:
linux远程桌面----VNCServer与rdesktop hanqunfeng Desktop
windows远程桌面到linux，需要在linux上安装vncserver，并开启vnc服务，同时需要在windows下使用vnc-viewer访问Linux。vncserver同时支持linux远程桌面到linux。 linux远程桌面到windows，需要在linux上安装rdesktop，同时开启windows的远程桌面访问。下面分别介绍，以windo
guava中的join和split功能 jackyrong java
guava库中，包含了很好的join和split的功能，例子如下： 1）将LIST转换为使用字符串连接的字符串 List<String> names = Lists.newArrayList("John", "Jane", "Adam", "Tom");
Web开发技术十年发展历程 lampcy android Web 浏览器 html5
回顾web开发技术这十年发展历程： Ajax 03年的时候我上六年级，那时候网吧刚在小县城的角落萌生。传奇，大话西游第一代网游一时风靡。我抱着试一试的心态给了网吧老板两块钱想申请个号玩玩，然后接下来的一个小时我一直在，注，册，账，号。彼时网吧用的512k的带宽，注册的时候，填了一堆信息，提交，页面跳转，嘣，”您填写的信息有误，请重填”。然后跳转回注册页面，以此循环。我现在时常想，如果当时a
架构师之mima-----------------mina的非NIO控制IOBuffer(说得比较好) nannan408 buffer
1.前言。如题。 2.代码。 IoService IoService是一个接口，有两种实现：IoAcceptor和IoConnector；其中IoAcceptor是针对Server端的实现，IoConnector是针对Client端的实现；IoService的职责包括： 1、监听器管理 2、IoHandler 3、IoSession
ORA-00054:resource busy and acquire with NOWAIT specified Everyday都不同 oracle session Lock
[Oracle] 今天对一个数据量很大的表进行操作时，出现如题所示的异常。此时表明数据库的事务处于“忙”的状态，而且被lock了，所以必须先关闭占用的session。 step1，查看被lock的session： select t2.username, t2.sid, t2.serial#, t2.logon_time from v$locked_obj
javascript学习笔记 tntxia JavaScript
javascript里面有6种基本类型的值:number、string、boolean、object、function和undefined。number：就是数字值，包括整数、小数、NaN、正负无穷。string:字符串类型、单双引号引起来的内容。boolean:true、false object:表示所有的javascript对象，不用多说function:我们熟悉的方法，也就是
Java enum的用法详解 xieke90 enum 枚举
Java中枚举实现的分析：示例： public static enum SEVERITY{ INFO,WARN,ERROR } enum很像特殊的class，实际上enum声明定义的类型就是一个类。而这些类都是类库中Enum类的子类 (java.l

智能信息处理技术研讨会（天津大学）个人记录