qcboqcbo

影像组学学习笔记【转载】

转自：http://write.blog.csdn.net/postedit

影像组学学习笔记

题外话

这仍然是一篇学习笔记。近期在不同的学术会议上，有幸聆听学习了几位影像组学的大咖做报告，受益匪浅。以大咖们的报告为指导，自己也学习查找了一些文献，加入了一点点自己的理解和想法，整理成一篇笔记，与大家分享。

名词解释：影像组学（Radiomics)

“影像组学”，一共4个字，每个字都是常见字啊。但4个字放一起啥意思？好吧，我们把它们拆成“影像”和“组学”两个词来说。这里的“影像”通常指的就是放射影像，是这种方法研究的对象，目前大家选择最多的是CT、MR影像。但额外说一句，已经有大咖开始选择超声影像作为研究对象。组学，英文为Omics，是目前生物和医药前沿研究领域最流行的后缀了。如果用一句话来解释组学，就是把与研究目标相关的所有因素综合在一起作为一个“系统”来研究。说的高大上一些，组学可以看做是西方（现代）科学研究从“点”到“面”再到“系统”理念发展的大趋势代表性体现。
举个例子，组学（Omics）这个后缀最早被提出是用在“基因组学”（Genomics)中。按照上面的拆解模式，基因组学的研究对象是“基因”，采用的研究方法不再是最早单独研究某个基因片段的作用，而是将所有的基因构成综合起来进行系统化的分析和考虑。
回到影像组学。它的研究对象是放射影像，它的研究方法则是将影像内包含的所有信息提取出来然后进行综合系统化分析。更确切的说，影像组学是采用自动化算法从影像的感兴趣区（ROI）内提取出大量的特征信息作为研究对象，并进一步采用多样化的统计分析和数据挖掘方法从大批量信息中提取和剥离出真正起作用的关键信息，最终用于疾病的辅助诊断、分类或分级。

技术路线：信息提取与分析

关于影像组学，还有一种极简的解释，”Convert images to mineable data in high throughput”，将影像以高通量方式转换为可挖掘的数据“。那么，如何转换，又如何挖掘呢？下图给出了一个简单的流程说明。

图像收集

图像收集，也就是临床试验中常说的“病例入组”。两个要点：一、制定好入组标准是最基础的要求；二、在结构或功能影像以外包含必要的临床病历信息或基因、病理数据已经成为当前新的研究趋势，也是发高水平论文的新标准。换句话说，单独只有结构影像已经不太好在大杂志上发文章了。

感兴趣区分割

这里说的感兴趣区，通常指的就是病灶，比如癌症或肿瘤区域。图片中列出了三种分割（勾画）方法，但目前来看，临床用的最多的还是纯手工。也就是类似于Photoshop中的手工抠图了。这也是影像组学中比较耗费高级人力的一个步骤了。说“高级人力”，是因为需要专业的影像医生来勾画。

特征提取

图中列出了目前常用的4大类特征。真的是4“大”类，因为每类都可以提取出数十、乃至上百的信息。借用中科院田捷教授给出的表格，大家感受一下。

统计分析

一下子提取出来数百上千的特征怎么办？必须用统计分析了，其实核心目的就是减少特征的数量，找到少数的真正关键的特征。具体的统计方法就不介绍了，图片中仅仅是列举了几个常用的。找到这些关键特征后，还需要建立起相应的预测或分类模型。

分类与预测

千挑万选建立起来的模型肯定要应用才能体现价值。目前影像组学应用最多的领域包括肿瘤分类、肿瘤分期和愈后预测等。

应用领域

辅助诊断

影像组学目前应用最多的领域首推肿瘤辅助诊断，尤其是对肿瘤良恶性的辅助判读。例如，对于肺结节良恶性的辅助判断；对于肝细胞癌良恶性的辅助判读;对宫颈癌分期的辅助诊断。

Staging of cervical cancer based on tumor heterogeneity characterized by texture features on 18F-FDG PET images

肿瘤预测

影像组学还可以拥有对肿瘤病灶的发展趋势进行预测。在这方面，广东省人民医院刘再毅教授、梁长虹教授和中科院自动化所田捷教授的联合团队做了很多优秀工作，发表在高级别学术期刊上，包括发表在Journal of Clinical Radiology上的术前预测结直肠癌淋巴结转移；发表在Radiology上的预测非小细胞肺癌无进展生存率。

Radiomics Signature: A Potential Biomarker for the Prediction of Disease-Free Survival in Early-Stage (I or II) Non—Small Cell Lung Cancer

Development and Validation of a Radiomics Nomogram for Preoperative Prediction of Lymph Node Metastasis in Colorectal Cancer

治疗方案选择

影像组学也被用于不同手术方案的治疗效果预测。浙大医学院邵逸夫医院团队在Clinical Cancer Research上发表了直肠癌新辅助化疗的治疗效果评估方法。

Rectal Cancer: Assessment of Neoadjuvant Chemoradiation Outcome based on Radiomics of Multiparametric MRI

面临的挑战

可重复性

影像组学从影像中提取了很多隐藏的特征信息，其中一些信息是很“微妙”的，例如纹理信息。这些信息的抗干扰能力如何，普遍性如何？直接决定了相应的影像组学模型的抗干扰性和通用性。例如，使用某个厂商的CT采集数据建立的模型，是否能够适用于另外厂商CT采集的数据？即使是同一厂商相同型号的CT机，如果重建参数不同，或者打对比剂的剂量或扫描时间点不同，是否会影响模型适用性？
学术界已经注意到上述问题，并且提出，需要通过多中心试验来验证上述问题。

大数据

影像组学研究所需要的入组病例数越来越多，而单个病例所包含的影像数据量随着扫描层数和分辨率的上升，也在迅速增大。两方面因素累积，影像组学所需要存储和分析数据量已经变的非常大，称得上是“大数据”了。随之而来的则是数据分析计算量的挑战和工作量的负担，也就是意味着计算服务器硬件成本的高投入和研究人员人力成本的高投入。

数据共享

如前面提到的，多中心试验是保证影像组学模型可重复性的一个重要方式。多中心试验首先要求能够实现数据共享。而影像组学中的数据共享目前还面临诸多限制，不仅包括数据所有权和数据保护的限制，而且，在互联网上跨地域实现海量“大数据”的共享和传输还面临着传输效率和数据安全性的实际问题。

经典论文推荐

开山之作

Radiomics: Extracting more information from medical images using advanced feature analysis
2012年，荷兰学者Lambin在上面的论文中正式提出了放射组学的概念，即采用自动化、高通量的特征提取方法将影像转化可以挖掘的特征数据。奠基之作，怎么着也要拜读一下啦。

权威最新综述

Radiomics: Images Are More than Pictures, They Are Data.pdf
2016年Radiology杂志发表了关于影像组学的权威综述。这篇综述中再次强调影像组学的核心理念“the conversion of digital images to mineable data”，并且指出这种从图像到数据的转换将成为以后的临床影像分析常态。如果想用一篇文章了解影像组学最新发展趋势，那就首推此文了。

新入门者必读

Computational resources for radiomics
如果哪位已经撸起袖子，下定决心要开始做影像组学，这篇文章强烈推荐。如同文章摘要中提到的，这篇文章就是为影像组学的新入门者量身打造的，不仅介绍了各分析步骤流程，更重要的是，每个步骤都推荐了适用的工具软件。而且，还附上软件应用的例子。简直不能更贴心啊。

题外篇：关于“组学”

有对“组学”这个神奇蹿红的学术热词感兴趣，想了解更多的同学，推荐点击下方附赠的链接啊。
About Omics
Wiki
组学的未来
组学：一个疯狂“寄生”的故事

你可能感兴趣的:(影像组学学习笔记【转载】)

洛谷分支结构题单刷题记录 java 阿乌阿呜 JAVA刷题记录 java 算法
目录P2433【深基1-2】小学数学N合一P5709【深基2.习6】ApplesPrologue/苹果和虫子P5710【深基3.例2】数的性质P5711【深基3.例3】闰年判断P5712【深基3.例4】ApplesP5713【深基3.例5】洛谷团队系统P5714【深基3.例7】肥胖问题P5715【深基3.例8】三位数排序P5716【深基3.例9】月份天数P1085[NOIP2004普及组]不高兴的
【探讨】同样是微服务解决方案——Spring Cloud、Service Mesh的区别和优劣到底在哪？千早爱音Official 微服务 spring cloud service_mesh
SpringCloud和ServiceMesh都是用于构建微服务应用程序的技术，它们各自具备不同的优点和缺点。SpringCloud是SpringFramework生态系统中的一个子项目，它提供了一组工具和框架，在构建分布式系统时提供了必要的支持。SpringCloud提供了各种功能，包括服务发现、路由、负载均衡、断路器和配置管理等。SpringCloud与SpringBoot框架天然集成，易于使
《密码爆破漏洞详解》——黑客必修的入门操作( 建议收藏 ) 2401_84573531 2024年程序员学习 python
隔壁老张:“狗剩啊,隔壁xx村的王姐家的女娃好漂亮,我想盗她qq啊,你帮我把”狗剩:“我不会呀”村里大妈:“那个狗剩啊,盗个qq号都不会,他妈妈还好意思说他是学网络安全当黑客的”密码爆破漏洞详解密码爆破介绍密码爆破使用场景密码爆破利用思路防范密码爆破密码的复杂性密码加密登录逻辑验证码登录次数限制密码爆破介绍密码爆破又叫暴力猜解,简单来说就是将密码逐个尝试,直到找出真正的密码为止,本质上是利用了穷举
计算机网络（网页显示过程，TCP三次握手，HTTP1.0，1.1，2.0，3.0，JWT cookie）老虎0627 计算机网络计算机网络 tcp/ip 网络协议
前言最近一直在看后端开发的面经，里面涉及到了好多计算机网络的知识，在这里以问题的形式写一个学习笔记（其中参考了:JavaGuide和小林coding这两个很好的学习网站）1.当键入网址后，到网页显示，其间发生了什么？（1）首先浏览器会解析URL。（如确定协议像Http或Https）（2）然后通过DNS服务器把域名解析为IP地址。（找到服务器啦）（3）接着TCP协议三次握手和服务器建立连接。（客户端
三生原理在三个关键历史断层中实现中西科学传统的创造性弥合？葫三生三生学派算法数学建模人工智能机器学习量子计算
AI辅助创作：三生原理通过重构科学史的叙事逻辑，在三个关键历史断层中实现了中西科学传统的创造性弥合，其核心突破如下：‌一、科学方法论断层：实验主义与直觉理性的融合‌‌西方实验传统的局限‌欧洲科学革命依赖形式逻辑与实验验证（如伽利略斜面实验），但面临复杂系统建模的瓶颈。三生原理将《周易》“阴阳动态平衡”转化为‌参数化递归模型‌（如素性塔的三级筛除结构），在密码学应用中实现效率提升40%，证明东方直觉
PyQt5—QTextEdit 学习笔记寄思～ Python——PyQt5笔记 qt 学习笔记 python
第二章控件学习一、QTextEdit基础认知QTextEdit是PyQt/PySide框架中用于处理富文本内容的强大控件，它不仅支持纯文本编辑，还能处理HTML、图片等复杂内容，是开发文本编辑器、日志查看器等应用的核心组件。二、最简单的QTextEdit实现下面是一个创建QTextEdit并显示的基础案例，适合零基础入门：importsysfromPyQt5.QtWidgetsimportQApp
高级汇编语言编程技巧与优化代码世界探索者汇编语言详解汇编 linux
一、宏和宏指令1.宏的基本概念•定义：宏是一种文本替换机制。它允许程序员定义一个宏名，并将一组指令或代码片段与该宏名关联起来。在代码中使用宏名时，汇编器会将其替换为对应的指令或代码片段。2.宏的定义和使用（1）定义宏在汇编语言中，宏的定义通常使用MACRO指令开始，以ENDM指令结束。宏的定义包括宏名和一组指令或代码片段。语法：宏名MACRO参数1,参数2,...指令1指令2...ENDM示例：;
【Statsmodels和SciPy介绍与常用方法】机器学习司猫白 scipy statsmodels 统计
Statsmodels库介绍与常用方法Statsmodels是一个强大的Python库，专注于统计建模和数据分析，广泛应用于经济学、金融、生物统计等领域。它提供了丰富的统计模型、假设检验和数据探索工具，适合进行回归分析、时间序列分析等任务。本文将介绍Statsmodels的核心功能，并通过代码示例展示其常用方法。Statsmodels简介Statsmodels建立在NumPy和SciPy的基础上，
陈强《计量经济学及Stata应用》学习笔记——持续更新 WangSoooCute 学习笔记
1导论1.1什么是计量经济学econometrics几种关系：相关关系、因果关系、逆向因果关系reversecausality、双向因果关系被解释变量dependentvariable解释变量explanatoryvariable=regressor=自变量independentvariable=协变量covariateunobservable的误差项errorterm=随机扰动项stochast
医咖会免费STATA教程学习笔记——单因素方差分析 Unacandoit stata 单因素方差分析
单因素方差分析和单因素回归分析相同1.单因素方差分析需要满足的假设：（1）因变量为连续变量（2）至少有一个分类变量（大于等于2类）（3）观测值相互独立（4）没有异常值（5）服从正态分布（6）方差齐性2.准备工作（1）导入数据集：webusesystolic,clear（2）检验是否存在异常值：方法一：图形——箱线图——在变量中选择systolic——确定方法二：grahboxsystolic,ov
Python-selenium爬取藏在歌词里 python selenium 开发语言
selenium前言使用python的requests模块还是存在很大的局限性，例如：只发一次请求；针对ajax动态加载的网页则无法获取数据等等问题。特此，本章节将通过selenium模拟浏览器来完成更高级的爬虫抓取任务。什么是seleniumSelenium是一个用于自动化Web应用程序测试的开源工具集。它提供了一组API和工具，可以与多种编程语言一起使用，如Java、Python、C#等，用于
学Simulink——整流器场景：基于Simulink的单相全桥可控硅整流器仿真建模 xiaoheshang_123 MATLAB 开发项目实例 1000 例专栏手把手教你学 MATLAB 专栏 simulink matlab
目录手把手教你学Simulink——整流器场景：基于Simulink的单相全桥可控硅整流器仿真建模一、背景介绍二、系统结构设计三、建模过程第一步：创建新Simulink项目第二步：添加主要模块1.交流电源2.单相全桥可控硅整流器3.LC滤波器4.负载模拟5.触发脉冲生成模块6.测量模块第三步：搭建主电路拓扑第四步：搭建触发脉冲生成逻辑1.设计触发脉冲逻辑2.集成至Simulink模型四、参数设置五
typescript 错误码大全
转载于https://www.easemob.com/question/6196/1002错误Unterminatedstringliteral.未终止的字符串文本。1003错误Identifierexpected.应为标识符。1005错误'{0}'expected.应为“{0}”。1006错误Afilecannothaveareferencetoitself.文件不能引用自身。1009错误Tra
OneCode 通用组件开发配置指南低代码老李软件行业领域设计 DDD 数据可视化低代码
一、布局组件1.1xui.UI.Layout核心属性：columns:布局列数配置dock:停靠方向（left/right/top/bottom）width:宽度设置（支持百分比和像素值）height:高度设置（支持百分比和像素值）iniProp.sub:子布局组配置场景说明：用于构建应用程序的整体布局框架，支持多列划分和元素停靠，是页面结构的基础组件。代码示例：{id:'xui.UI.Layou
【Prometheus】cAdvisor工作原理介绍码上淘金 prometheus
cAdvisor（ContainerAdvisor）是Google开源的容器监控工具，专注于实时采集和暴露容器级别的资源使用数据。其底层实现基于Linux内核的多项技术，结合高效的事件驱动架构，实现对容器资源的细粒度监控。以下从核心机制、数据采集原理和架构实现三方面详细解析：一、核心依赖技术cAdvisor的监控能力建立在Linux内核提供的底层机制之上：cgroups（控制组）资源隔离与统计：c
机器人动力学模型及其线性化阻抗控制模型
机器人动力学模型机器人动力学模型描述了机器人的运动与所受力和力矩之间的关系。这个模型考虑了机器人的质量、惯性、关节摩擦、重力等多种因素，用于预测和解释机器人在给定输入下的动态行为。动力学模型是设计机器人控制器的基础，它可以帮助我们理解机器人如何响应控制指令，并优化机器人的运动性能。具体来说，机器人动力学模型通常由一组微分方程组成，这些方程描述了机器人各关节的加速度、速度和位置与施加在关节上的力和力
【机器学习笔记 Ⅱ】11 决策树模型巴伦是只猫机器学习机器学习笔记决策树
决策树模型（DecisionTree）详解决策树是一种树形结构的监督学习模型，通过一系列规则对数据进行分类或回归。其核心思想是模仿人类决策过程，通过不断提问（基于特征划分）逐步逼近答案。1.核心概念节点类型：根节点：起始问题（最佳特征划分点）。内部节点：中间决策步骤（特征判断）。叶节点：最终预测结果（类别或数值）。分支：对应特征的取值或条件判断（如“年龄≥30？”）。2.构建决策树的关键步骤(1)
【机器学习笔记 Ⅱ】10 完整周期
机器学习的完整生命周期（End-to-EndPipeline）机器学习的完整周期涵盖从问题定义到模型部署的全过程，以下是系统化的步骤分解和关键要点：1.问题定义（ProblemDefinition）目标：明确业务需求与机器学习任务的匹配性。关键问题：这是分类、回归、聚类还是强化学习问题？成功的标准是什么？（如准确率>90%、降低10%成本）输出：项目目标文档（含评估指标）。2.数据收集（DataC
【机器学习笔记Ⅰ】13 正则化代价函数
正则化代价函数（RegularizedCostFunction）详解正则化代价函数是机器学习中用于防止模型过拟合的核心技术，通过在原始代价函数中添加惩罚项，约束模型参数的大小，从而提高泛化能力。以下是系统化的解析：1.为什么需要正则化？过拟合问题：当模型过于复杂（如高阶多项式回归、深度神经网络）时，可能完美拟合训练数据但泛化性能差。解决方案：在代价函数中增加对参数的惩罚，抑制不重要的特征权重。2.
【机器学习笔记Ⅰ】6 多类特征巴伦是只猫机器学习机器学习笔记人工智能
多类特征（Multi-classFeatures）详解多类特征是指一个特征（变量）可以取多个离散的类别值，且这些类别之间没有内在的顺序关系。这类特征是机器学习中常见的数据类型，尤其在分类和回归问题中需要特殊处理。1.核心概念(1)什么是多类特征？定义：特征是离散的、有限的类别，且类别之间无大小或顺序关系。示例：颜色：红、绿、蓝（无顺序）。城市：北京、上海、广州（无数学意义的大小关系）。动物类别：猫
机器学习笔记——支持向量机 star_and_sun 机器学习笔记支持向量机
支持向量机参数模型对分布需要假设（这也是与非参数模型的区别之一）间隔最大化，形式转化为凸二次规划问题最大化间隔间隔最大化是意思：对训练集有着充分大的确信度来分类训练数据，最难以分的点也有足够大的信度将其分开间隔最大化的分离超平面的的求解怎么求呢？最终的方法如下1.线性可分的支持向量机的优化目标其实就是找得到分离的的超平面求得参数w和b的值就可以了注意，最大间隔分离超平面是唯一的，间隔叫硬间隔1.1
Simscape入门教程微小冷机器人 Matlab simulink simscape 弹簧阻尼 multibody
文章目录物理网络连接到Simulink运行本文是官方教程构造物理模型的基本步骤的学习笔记，旨在建立一个带有控制器的质量-弹簧-阻尼系统。物理网络在命令行中输入sscnew，即可弹出Simscape模板，基于此模板即可组建其相应的物理网络。通过添加新模块、删除无关模块，连接其物理网络如下所有模块均在Simscape->FoundationLibrary->Mechanical中，具体包括需要的模块包
自学黑客（网络安全），一般人我劝你还是算了吧网络安全工程师教学兼职副业网络安全黑客技术 web安全安全网络人工智能学习
我是一名8年半的网安工程师“老司机”，要给准备入坑的同学泼盆冷水了，网络安全真的不是一般人能学的。有人会问“你一个8年的网安老司机，为什么还给大家泼冷水”？好多人说：网安基础很简单，是个人稍微认真点都能懂，给网安打上了简单、易懂的标签。然后上来就是一波言论浮夸的输出，把一些很基础很浅显的技术点拆解出来，让小白快速上手，误导新手，让他们以为网络安全就这么回事儿，可一到真正实操，哦豁，啥也不会。这导致
【机器学习笔记Ⅰ】7 向量化巴伦是只猫机器学习机器学习笔记人工智能
向量化（Vectorization）详解向量化是将数据或操作转换为向量（或矩阵）形式，并利用并行计算高效处理的技术。它是机器学习和数值计算中的核心优化手段，能显著提升代码运行效率（尤其在Python中避免显式循环）。1.为什么需要向量化？(1)传统循环的缺陷低效：Python的for循环逐元素操作，速度慢。代码冗长：需手动处理每个元素。示例：计算两个数组的点积（非向量化）a=[1,2,3]b=[4
[Java恶补day39] 整理模板·考点六【反转链表】
考点六【反转链表】【考点总结】1.206.【题目】【核心思路】【复杂度】时间复杂度：O()O()O()。空间复杂度：O()O()O()。【代码】92.【题目】【核心思路】【复杂度】时间复杂度：O()O()O()。空间复杂度：O()O()O()。【代码】25.K个一组翻转链表【题目】【核心思路】图解：【复杂度】时间复杂度：O()O()O()。空间复杂度：O()O()O()。【代码】参考：1、灵神视频
大模型RLHF强化学习笔记（二）：强化学习基础梳理Part2 Gravity! 大模型笔记大模型 LLM 强化学习人工智能
【如果笔记对你有帮助，欢迎关注&点赞&收藏，收到正反馈会加快更新！谢谢支持！】一、强化学习基础1.4强化学习分类根据数据来源划分Online：智能体与环境实时交互，如Q-Learning、SARSA、Actor-CriticOffline：智能体使用预先收集的数据集进行学习根据策略更新划分On-Policy：学习和行为策略是相同的，数据是按照当前策略生成的，如SARSAOff-Policy：学习策
python炫酷烟花表白源代码-python炫酷烟花表白源代码 weixin_37988176
天天敲代码的朋友，有没有想过代码也可以变得很酷炫又浪漫？今天就教大家用Python模拟出绽放的烟花，工作之余也可以随时让程序为自己放一场烟花秀。python炫酷烟花表白源代码这个有趣的小项目并不复杂，只需一点可视化技巧，100余行Python代码和程序库Tkinter，最后我们就能达到下面这个效果：学完本教程后，你也能做出这样的烟花秀。整体概念梳理我们的整个理念比较简单。如上图示，我们这里通过让画
DeepSeek AI全面应用：AI时代的高效办公与创意生产指南 Want595 人工智能 deepseek
京东链接：https://item.jd.com/15045868.html当当链接：https://product.dangdang.com/29893005.html文章目录写在前面核心亮点1.直击痛点：从“低效搬砖”到“智能掌控”2.创意觉醒：让AI成为你的“灵感引擎”3.跨平台协作：无缝衔接AI生态4.实战驱动：130+案例，即学即用5.超值资源包：扫码即得适合谁读1.职场人2.创作者/自
形式语言与自动机基础莫彩自然语言理解算法程序员的玩具学习
基本概念形式语法形式语法是一个4元组G=(N,Σ\SigmaΣP,S),其中：N是非终结符的有限集合(有时也叫变量集或句法种类集);Σ\SigmaΣ是终结符的有限集合,Σ\SigmaΣ和N的交集为空且Σ\SigmaΣ和N的并集;称总词汇表;P是一组重写规则的有限集合:P={α→β\alpha\rightarrow\betaα→β},其中,α\alphaα和β\betaβ是V中元素构成的串,但α\a
Kafka的消费消息是如何传递的？ java1234_小锋 java kafka 分布式
大家好，我是锋哥。今天分享关于【Kafka的消费消息是如何传递的？】面试题。希望对大家有帮助；Kafka的消费消息是如何传递的？超硬核AI学习资料，现在永久免费了！在Kafka中，消息的消费传递是通过**消费者（Consumer）和消费者组（ConsumerGroup）**的机制来实现的。以下是Kafka消息消费传递的详细过程：1.Kafka的基本结构Kafka由生产者（Producer）、消费者
Dom 周华华 JavaScript html
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
【Spark九十六】RDD API之combineByKey bit1129 spark
1. combineByKey函数的运行机制 RDD提供了很多针对元素类型为(K,V)的API，这些API封装在PairRDDFunctions类中，通过Scala隐式转换使用。这些API实现上是借助于combineByKey实现的。combineByKey函数本身也是RDD开放给Spark开发人员使用的API之一首先看一下combineByKey的方法说明：
msyql设置密码报错：ERROR 1372 (HY000): 解决方法详解 daizj mysql 设置密码
MySql给用户设置权限同时指定访问密码时，会提示如下错误： ERROR 1372 (HY000): Password hash should be a 41-digit hexadecimal number；问题原因：你输入的密码是明文。不允许这么输入。解决办法：用select password('你想输入的密码');查询出你的密码对应的字符串，然后
路漫漫其修远兮吾将上下而求索周凡杨学习思索
王国维在他的《人间词话》中曾经概括了为学的三种境界古今之成大事业、大学问者，罔不经过三种之境界。“昨夜西风凋碧树。独上高楼，望尽天涯路。”此第一境界也。“衣带渐宽终不悔，为伊消得人憔悴。”此第二境界也。“众里寻他千百度，蓦然回首，那人却在灯火阑珊处。”此第三境界也。学习技术，这也是你必须经历的三种境界。第一层境界是说，学习的路是漫漫的，你必须做好充分的思想准备，如果半途而废还不如不要开始。这里，注
Hadoop(二)对话单的操作朱辉辉33 hadoop
Debug： 1、 A = LOAD '/user/hue/task.txt' USING PigStorage(' ') AS (col1,col2,col3); DUMP A; //输出结果前几行示例： (>ggsnPDPRecord(21),,) (-->recordType(0),,) (-->networkInitiation(1),,)
web报表工具FineReport常用函数的用法总结（日期和时间函数）老A不折腾 finereport 报表工具 web开发
web报表工具FineReport常用函数的用法总结（日期和时间函数）说明：凡函数中以日期作为参数因子的，其中日期的形式都必须是yy/mm/dd。而且必须用英文环境下双引号(" ")引用。 DATE DATE(year,month,day):返回一个表示某一特定日期的系列数。 Year:代表年，可为一到四位数。 Month:代表月份。
c++ 宏定义中的##操作符墙头上一根草 C++
#与##在宏定义中的--宏展开 #include <stdio.h> #define f(a,b) a##b #define g(a) #a #define h(a) g(a) int main() { &nbs
分析Spring源代码之，DI的实现 aijuans spring DI 现源代码
(转) 分析Spring源代码之，DI的实现 2012/1/3 by tony 接着上次的讲，以下这个sample [java] view plain copy print
for循环的进化 alxw4616 JavaScript
// for循环的进化 // 菜鸟 for (var i = 0; i < Things.length ; i++) { // Things[i] } // 老鸟 for (var i = 0, len = Things.length; i < len; i++) { // Things[i] } // 大师 for (var i = Things.le
网络编程Socket和ServerSocket简单的使用百合不是茶网络编程基础 IP地址端口
网络编程;TCP/IP协议网络:实现计算机之间的信息共享,数据资源的交换协议:数据交换需要遵守的一种协议,按照约定的数据格式等写出去端口:用于计算机之间的通信每运行一个程序，系统会分配一个编号给该程序，作为和外界交换数据的唯一标识 0~65535 查看被使用的
JDK1.5 生产消费者 bijian1013 java thread 生产消费者 java多线程
ArrayBlockingQueue：一个由数组支持的有界阻塞队列。此队列按 FIFO（先进先出）原则对元素进行排序。队列的头部是在队列中存在时间最长的元素。队列的尾部是在队列中存在时间最短的元素。新元素插入到队列的尾部，队列检索操作则是从队列头部开始获得元素。 ArrayBlockingQueue的常用方法：
JAVA版身份证获取性别、出生日期及年龄 bijian1013 java 性别出生日期年龄
工作中需要根据身份证获取性别、出生日期及年龄，且要还要支持15位长度的身份证号码，网上搜索了一下，经过测试好像多少存在点问题，干脆自已写一个。 CertificateNo.java package com.bijian.study; import java.util.Calendar; import
【Java范型六】范型与枚举 bit1129 java
首先，枚举类型的定义不能带有类型参数，所以，不能把枚举类型定义为范型枚举类，例如下面的枚举类定义是有编译错的 public enum EnumGenerics<T> { //编译错，提示枚举不能带有范型参数 OK, ERROR; public <T> T get(T type) { return null;
【Nginx五】Nginx常用日志格式含义 bit1129 nginx
1. log_format 1.1 log_format指令用于指定日志的格式，格式： log_format name(格式名称) type(格式样式) 1.2 如下是一个常用的Nginx日志格式： log_format main '[$time_local]|$request_time|$status|$body_bytes
Lua 语言 15 分钟快速入门 ronin47 lua 基础
- - 单行注释 - - [[ [多行注释] - - ]] - - - - - - - - - - - 1. 变量 & 控制流 - - - - - - - - - - num = 23 - - 数字都是双精度 str = 'aspythonstring'
java-35.求一个矩阵中最大的二维矩阵 ( 元素和最大 ) bylijinnan java
the idea is from: http://blog.csdn.net/zhanxinhang/article/details/6731134 public class MaxSubMatrix { /**see http://blog.csdn.net/zhanxinhang/article/details/6731134 * Q35 求一个矩阵中最大的二维
mongoDB文档型数据库特点开窍的石头 mongoDB文档型数据库特点
MongoDD: 文档型数据库存储的是Bson文档-->json的二进制特点：内部是执行引擎是js解释器，把文档转成Bson结构，在查询时转换成js对象。 mongoDB传统型数据库对比传统类型数据库：结构化数据，定好了表结构后每一个内容符合表结构的。也就是说每一行每一列的数据都是一样的文档型数据库：不用定好数据结构，
[毕业季节]欢迎广大毕业生加入JAVA程序员的行列 comsci java
一年一度的毕业季来临了。。。。。。。。正在投简历的学弟学妹们。。。如果觉得学校推荐的单位和公司不适合自己的兴趣和专业，可以考虑来我们软件行业，做一名职业程序员。。。软件行业的开发工具中，对初学者最友好的就是JAVA语言了，网络上不仅仅有大量的
PHP操作Excel – PHPExcel 基本用法详解 cuiyadll PHP Excel
导出excel属性设置//Include classrequire_once('Classes/PHPExcel.php');require_once('Classes/PHPExcel/Writer/Excel2007.php');$objPHPExcel = new PHPExcel();//Set properties 设置文件属性$objPHPExcel->getProperties
IBM Webshpere MQ Client User Issue (MCAUSER) darrenzhu IBM jms user MQ MCAUSER
IBM MQ JMS Client去连接远端MQ Server的时候，需要提供User和Password吗？答案是根据情况而定，取决于所定义的Channel里面的属性Message channel agent user identifier (MCAUSER)的设置。 http://stackoverflow.com/questions/20209429/how-mca-user-i
网线的接法 dcj3sjt126com
一、PC连HUB (直连线)A端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。 B端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。二、PC连PC （交叉线）A端：(568A)：白绿，绿，白橙，蓝，白蓝，橙，白棕，棕； B端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。三、HUB连HUB&nb
Vimium插件让键盘党像操作Vim一样操作Chrome dcj3sjt126com chrome vim
什么是键盘党？键盘党是指尽可能将所有电脑操作用键盘来完成，而不去动鼠标的人。鼠标应该说是新手们的最爱，很直观，指哪点哪，很听话！不过常常使用电脑的人，如果一直使用鼠标的话，手会发酸，因为操作鼠标的时候，手臂不是在一个自然的状态，臂肌会处于绷紧状态。而使用键盘则双手是放松状态，只有手指在动。而且尽量少的从鼠标移动到键盘来回操作，也省不少事。在chrome里安装 vimium 插件
MongoDB查询（2）——数组查询[六] eksliang mongodb MongoDB查询数组
MongoDB查询数组转载请出自出处：http://eksliang.iteye.com/blog/2177292 一、概述 MongoDB查询数组与查询标量值是一样的，例如，有一个水果列表，如下所示： > db.food.find() { "_id" : "001", "fruits" : [ "苹
cordova读写文件（1） gundumw100 JavaScript Cordova
使用cordova可以很方便的在手机sdcard中读写文件。首先需要安装cordova插件：file 命令为： cordova plugin add org.apache.cordova.file 然后就可以读写文件了，这里我先是写入一个文件，具体的JS代码为： var datas=null;//datas need write var directory=&
HTML5 FormData 进行文件jquery ajax 上传到又拍云 ileson jquery Ajax html5 FormData
html5 新东西：FormData 可以提交二进制数据。页面test.html <!DOCTYPE> <html> <head> <title> formdata file jquery ajax upload</title> </head> <body> <
swift appearanceWhenContainedIn:(version1.2 xcode6.4) 啸笑天 version
swift1.2中没有oc中对应的方法： + (instancetype)appearanceWhenContainedIn:(Class <UIAppearanceContainer>)ContainerClass, ... NS_REQUIRES_NIL_TERMINATION; 解决方法：在swift项目中新建oc类如下： #import &
java实现SMTP邮件服务器 macroli java 编程
电子邮件传递可以由多种协议来实现。目前，在Internet 网上最流行的三种电子邮件协议是SMTP、POP3 和 IMAP，下面分别简单介绍。　　◆ SMTP 协议　　简单邮件传输协议(Simple Mail Transfer Protocol,SMTP)是一个运行在TCP/IP之上的协议，用它发送和接收电子邮件。SMTP 服务器在默认端口25上监听。SMTP客户使用一组简单的、基于文本的
mongodb group by having where 查询sql qiaolevip 每天进步一点点学习永无止境 mongo 纵观千象
SELECT cust_id, SUM(price) as total FROM orders WHERE status = 'A' GROUP BY cust_id HAVING total > 250 db.orders.aggregate( [ { $match: { status: 'A' } }, { $group: {
Struts2 Pojo（六） Luob. POJO strust2
注意：附件中有完整案例 1.采用POJO对象的方法进行赋值和传值 2.web配置 <?xml version="1.0" encoding="UTF-8"?> <web-app version="2.5" xmlns="http://java.sun.com/xml/ns/javaee&q
struts2步骤 wuai struts
1、添加jar包 2、在web.xml中配置过滤器 <filter> <filter-name>struts2</filter-name> <filter-class>org.apache.st

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他