Leokadia Rothschild

【VQA文献阅读】PATHVQA: 30000+ QUESTIONS FOR MEDICAL VISUAL QUESTION ANSWERING

原文地址：https://arxiv.org/abs/2003.10286

ABSTRACT

Is it possible to develop an “AI Pathologist" to pass the board-certified examination of the American Board of Pathology? To achieve this goal, the first step is to create a visual question answering(VQA) dataset where the AI agent is presented with a pathology image together with a question and is asked to give the correct answer. Our work makes the first attempt to build such a dataset. Different from creating general-domain VQA datasets where the images are widely accessible and there are many crowdsourcing workers available and capable of generating question-answer pairs, developing a medical VQA dataset is much more challenging. First, due to privacy concerns, pathology images are usually not publicly available. Second, only well-trained pathologists can understand pathology images, but they barely have time to help create datasets for AI research. To address these challenges, we resort to pathology textbooks and online digital libraries. We develop a semi-automated pipeline to extract pathology images and captions from textbooks and generate question-answer pairs from captions using natural language processing. We collect 32,799 open-ended questions from 4,998pathology images where each question is manually checked to ensure correctness. To our best knowledge, this is the first dataset for pathology VQA. Our dataset will be released publicly to promote research in medical VQA.

有可能培养一个“AI病理学家”通过美国病理学委员会认证的考试吗?为了实现这个目标，第一步是创建一个视觉问题回答(VQA)数据集，其中AI代理被呈现一个病理图像和一个问题，并被要求给出正确答案。我们的工作是建立这样一个数据集的第一次尝试。与创建通用领域的VQA数据集不同，后者的图像可广泛访问，有许多众包工作者可用，并有能力生成问答对，开发医疗VQA数据集更具挑战性。首先，出于隐私考虑，病理图像通常不会公开。其次，只有训练有素的病理学家才能理解病理图像，但他们几乎没有时间帮助创建AI研究的数据集。为了应对这些挑战，我们求助于病理学教科书和在线数字图书馆。我们开发了一个半自动的管道来从教科书中提取病理图像和字幕，并使用自然语言处理从字幕中生成问题-答案对。我们从4,998个病理图像中收集了32,799个开放式问题，每个问题都经过手工检查以确保正确性。据我们所知，这是第一个病理VQA数据集。我们的数据集将公开发布，以促进医学VQA的研究。

Keywords

Visual question answering, dataset, pathology, healthcare

视觉问答，数据集，病理学，医疗保健

1 Introduction

病理学研究疾病或伤害的原因和后果。它是病人护理的每个方面的基础，从诊断检测和治疗建议到使用尖端基因技术和预防疾病。从事病理学的医学专业人员被称为病理学家，他们检查身体和身体组织。在美国，医学专业人士要想成为一名获得委员会认证的病理学家，需要通过由美国病理学委员会(ABP)组织的认证考试，这是一项非常具有挑战性的任务。我们有兴趣问:是否可以开发一个人工智能(AI)系统来通过ABP考试?这是实现人工智能辅助临床决策支持和临床教育的重要一步。在ABP测试的问题中，一个主要的类型是了解病理图像。给出一个病理图像和一个问题，要求考生选择一个正确的答案。图1显示了一个示例。为了训练一个AI系统通过这个考试，我们需要收集一个包含类似于ABP测试的问题的数据集。ABP提供了一些示例问题，但它们太少，无法用于培训数据驱动模型。一些商业机构提供的实践问题数量较多，但价格昂贵，且由于版权问题无法与公众分享。

为了解决这些限制，我们的目标是创建一个病理学视觉问题回答(VQA)数据集，其中包含类似于ABP测试的问题，并可以与医疗保健人工智能的广泛研究社区共享。据我们所知，这是第一个病理VQA数据集。VQA[1]是近年来引起广泛关注的跨学科研究问题。给定一幅图像(例如，一幅狗在追球的图像)和一个关于图像视觉内容的问题(例如，“狗在追什么?”)，VQA的目标是开发人工智能算法来推断正确答案(例如，“球”)。VQA需要深入理解图像和文本问题，以及视觉对象和文本实体之间的关系，这在技术上要求很高。虽然通用领域的VQA有几个数据集[2,1,3,4,5]，但医学领域的VQA数据集非常罕见。

医学VQA数据集的构建比一般领域的VQA数据集更具挑战性。首先，亚马逊机械土耳其(Amazon Mechanical Turk)等众包平台的许多员工可以从通用领域的图像中生成问题和答案。这些图像包含的内容(如，狗，猫，湖)很容易理解的人。对图像的理解几乎没有障碍，对视觉对象提出适当的问题，并给出正确的答案。然而，医学图像如病理图像具有高度的领域特异性，这只能由受过良好教育的医学专业人士来解释。雇佣医疗专业人员帮助创建医疗VQA数据集非常困难和昂贵。其次，要创建VQA数据集，首先需要收集图像数据集。尽管普通领域的图像普遍存在，但由于隐私问题，医学图像很难获取。

为了应对这些挑战，我们求助于病理学教科书，尤其是那些可以在网上免费获取的教科书，以及在线数字图书馆。这些教科书包含了很多病理学图像，涵盖了病理学的整个领域。每张图像都有一个描述图像中病理发现的标题(如图2所示)。该标题用词谨慎，临床精确。==我们从教科书和在线数字图书馆中提取图像和字幕，并开发一个半自动的管道，从每个字幕中生成问题-答案对。我们已经手动检查了自动生成的问题和答案，并修正了小语法问题。==最后，我们收集了一个包含4998张图像和32799个问答对的病理VQA数据集。

本文的主要贡献如下:
•我们创建了一个包含4998张病理图像和32799对问答对的病理学视觉问答(VQA)数据集，以促进医学VQA的研究。据我们所知，这是第一个病理VQA数据集。
•我们开发了一个半自动化的管道，以有效地从医学教科书和在线数字图书馆创建医学VQA数据集。我们的流水线可以广泛应用于病理学以外的其他医学成像领域，如放射学、超声等。
•我们将几种成熟和最先进的VQA方法应用到我们的数据集，并生成一组基线结果供其他研究人员基准。
本文的其余部分组织如下。
第2节介绍了现有VQA数据集的概述。
第3节描述了从病理学教科书和在线数字图书馆构建病理学VQA数据集的管道。
第4节展示了我们数据集的统计信息。
第5节介绍基线VQA模型和在我们的数据集上实现的结果。
第6部分是全文的总结

2 Related Works

2.1 Datasets

据我们所知，目前有两个用于医学视觉问题回答的数据集。VQA-Med[6]数据集是在4200张放射图像上创建的，有15292个问答对。临床问题分为四类:形态问题、平面问题、器官系统问题和异常问题。对于前三个类别，QA采用多项选择(MC)风格，可能的答案的数量是固定的(分别为36、16和10)。因此，QA任务可以等价地表述为分别有36、16和10个类别的多路分类问题。这使得这个数据集的难度大大降低。异常类问题是真正具有挑战性的开放式问题。然而，只有2408题(15.7%)。 VQA-RAD[7]是一个人工制作的数据集，其中的问题和答案是由临床医生提供的放射图像。共有情态、平面等11种类型3515题。58%为MC风格，其余为开放式。我们的数据集与VQA-Med和VQA-RAD有两个不同之处。首先，我们的数据集是关于病理学的，而VQA-Med和VQA-RAD[7]都是关于放射学的。其次，我们的数据集是一个真正具有挑战性的QA数据集，其中大多数问题都是开放式的，而在VQA-Med和VQA-RAD中，==大多数问题都有固定数量的候选答案，可以通过多种方式分类来回答。==此外，我们的数据集中的问题数量比VQA-Med和VQA-RAD要大得多。

在一般领域，已经开发了许多可视化问题回答数据集。DAQUAR[2]建立在包含室内场景RGBD图像的NYU-Depth V2数据集[8]之上。DAQUAR由(1)基于文本模板自动生成的合成问题-答案对和(2)由五个注释器生成的人工问题-答案对组成。VQA数据集[1]是以MS COCO[9]中的真实图像和[10,11]中的抽象场景图像为基础开发的。问答对是由人类注解员创建的，他们被鼓励提出“有趣的”和“多样的”问题。VQA v2[5]是从VQA[1]数据集扩展来实现视觉和文本信息之间的更平衡，通过以一种方式收集互补的图像，每个问题都与具有不同答案的一对相似的图像相关联。在COCO-QA[3]数据集中，基于语法解析和语言规则，从图像字幕中自动生成问答对。cleverr[4,12]是一个基于不同尺寸、材质和颜色的空间相关对象(包括立方体、球体和圆柱体)的渲染图像开发的数据集。对象的位置和属性都被标注在每张图片上。这些问题是自动从注释中生成的。

表1给出了不同VQA数据集的比较。前5个数据集属于一般领域，后3个属于医学领域。毫无疑问，通用领域数据集的大小(包括图像和问答对的数量)要比医疗数据集大得多，因为通用领域的图像更容易公开使用，而且有许多合格的人类注释员可以在通用图像上生成QA对。

2.2 Automatic Construction of Question-Answer Pairs

现有的数据集已经使用自动方法来构造问题-答案对。在DAQUAR中，==问题是通过模板生成的，比如“{image_id}中有多少个{object} ?”这些模板是用数据库中的基本事实实例化的。在COCO-QA中，作者开发了一个基于斯坦福句法解析器[13]的问题生成算法，并使用手工制作的规则形成了四种类型的问题——“对象”、“数字”、“颜色”和“位置”。在cleverr中，每幅图像中物体的位置和属性都得到了充分的标注，自动算法在此基础上生成问题。该算法不能应用于难以获得目标和场景详细标注的自然图像。在[14]中，作者开发了一个条件自动编码器[15]模型，可以从图像中自动生成问题。==为了训练这样的模型，需要图像-问题对，这就产生了一个先有鸡还是先有蛋的问题:目标是生成问题，但实现这个目标需要生成问题。在VQA-Med中，作者从medpix1数据库中收集医学图像以及相关侧信息(如标题、模式、平面)，并根据[7]中手动定义的模式生成问题-答案对。为了确保测试集中问题的正确性，两位医生被要求进行手工验证。

3 Dataset Collection

我们开发了一个半自动的管道，从病理学教科书和在线数字图书馆中生成病理学VQA数据集。我们手动检查自动生成的问题-答案对，以修正语法错误。该自动化流程包括两个步骤:
(1)从病理学电子教材和病理学教育信息资源(PEIR)数字图书馆网站中提取病理学图像及其标题;
(2)根据字幕生成问答对。

3.1 Extracting Pathology Images and Captions

鉴于有一本PDF格式的病理学教科书，并且可以在网上公开获得，我们使用两个第三方工具pypdf23和pdfminer4来提取图像和相关的标题。PyPDF2提供api来访问每个PDF页面中的“Resources”对象，其中“XObject”提供关于图像的信息。PDFMiner允许用户获取文本及其在页面中的确切位置。为了从每个页面的文本中提取图像标题，我们使用正则表达式来搜索前缀为“Fig.”或“Figure”，后面跟着数字和标题文本的代码片段。对于包含多个图像的页面，我们根据它们的位置对它们进行排序;字幕也是一样。图像和位置是根据它们的顺序匹配的。给出了一个在线病理数字图书馆，如PEIR，我们使用两个第三方工具request5和Beautiful soup6来抓取图像和相关的字幕。Requests是一个使用Python构建的HTTP库，并提供了发送HTTP/1.1请求的api。Beautiful Soup生成’ http。解析器’，并可以访问网址和标签的图像在网站页面上。给定一组url，我们使用请求来读取网站页面，并使用Beautiful Soup来查找目标HTML标记下的图像，包括内容分割元素hdivi、无序列表元素huli和hlii元素。然后我们就可以下载带有请求的图像，并将它们的说明直接写入本地文件。对提取的图像-标题对进行后处理，包括:
(1)去除非病理图像，如流程图、肖像;
(2)纠正图像与字幕的错误匹配。

3.2 Question Generation

在本节中，我们将讨论如何从字幕半自动生成问题。图3显示了总体框架。我们使用Stanford CoreNLP[13]工具包对标题进行自然语言处理，包括句子拆分、词素化、词性标注、命名实体识别(NER)、成分解析和依赖解析。许多句子都很长，句法结构复杂。我们把一个长句子简化成几个短句子。对经过词性标注和句法解析的主语、动词、子句等，我们采用[16,17]中提出的规则对其进行重新排列，以达到简化的目的。图4显示了一个示例。

给定简化句的POS标记和命名实体，我们为它们生成问题:包括日期和时间实体的“when”类型的问题和短语，如“in/during…”“阶段/时期”、“在……之前”、“在……之后”;“多少/多少”类型的问题标记为数字的单词;用“whose”对物主代词的疑问句(如“its”、“their”);以“内部”、“内部”、“在…的左边/右边”开头的位置实体和介词短语的“where”问题;以“using”，“via”，“with”，“through”开头的形容词或短语用“how”疑问句，其余的名词短语用“what”疑问句。表2显示了每种类型的问题的示例。

我们使用来自Stanford CoreNLP工具的Tregex[18]，这是一种树型查询语言，包括各种基于直接支配性和直接优先级的基本关系的关系运算符，来实现将陈陈述句(标题)转换为问题的[19]规则。为了减少语法错误，我们避免对状语从句的句子产生疑问，如“肺慢性炎症，表现出所有三个典型的组织学特征”。问题传感器主要包括三个步骤。首先，我们根据动词的时态进行主要动词的分解。例如，我们将“显示”分解为“确实显示”。值得注意的是，对于“be+shown/presented/演示”结构的被动句，我们保留了它们原有的形式，而不是进行动词分解。第二，进行主辅倒装。在陈述句中我们把主语和助动词倒装成疑问句。倒置后，出现“是/否”的二元问题，如图5所示，“镜检显示患肠壁凝固性坏死和血栓形成血管”被倒置为“镜检显示患肠壁凝固性坏死和血栓形成血管吗?”为了生成答案为“否”的问题，我们随机从其他标题中选择一个词性相同的短语来替换原问题的头词。例如，我们将“凝固性坏死”一词用其他名词短语代替“显微镜检查是否显示受累肠壁和血栓形成血管的凝固性坏死”。第三，我们删除目标回答短语，插入前面获得的问题短语，生成属于“what”、“where”、“when”、“whose”、“how”和“how much/how many”类型的开放式问题，如表2所示。例如，我们将“显微镜下显示病变肠壁和血栓形成血管的凝固性坏死”转换为“显微镜下显示病变肠壁和血栓形成血管的情况”，如图5所示。

考虑到自动生成的问题可能包含语法和语义错误，我们执行后处理来修复这些问题。我们手工校对所有的问题，以纠正拼写错误、语法错误和语义不一致。问题和答案通过删除额外的空格和不相关的符号被进一步清理。太短或太模糊的问题被删除。出现在答案开头的文章被剥离。

4 Dataset Statistics

我们的PathVQA数据集由32,799个问答对组成，这些问答对来自两个病理学教科书:“病理学教科书”和“基础病理学”的1,670个病理学图像，以及从peir7数字图书馆收集的3,328个病理学图像。图6显示了一些示例。==平均来说，每张图片有6.6个问题。每张图片的最大问题数和最小问题数分别为14和1。每个问题和每个答案的平均字数分别是9.5和2.5。表3总结了这些统计数据。有7类问题:什么，哪里，何时，谁的，如何，多少/多少，是/否。表4显示了问题的数量和每个类别的百分比。前6类题为开放式题，共16465题，占题数的50.2%。其余的都是封闭式的“是/否”问题。“是”和“否”的回答数量相等，分别为8145和8189。==题目涵盖了视觉内容的各个方面，包括颜色、位置、外观、形状等。这种临床多样性对AI模型解决病理VQA问题提出了巨大挑战。

图7显示了开放式问题的不同答案的频率。x轴表示70个最常见的答案，y轴表示每个答案出现的频率。可以看出，答案的频率呈长尾分布，少数答案的频率很高，大部分答案的频率较低。大多数答案都有一两个词。

为了标准化这个数据集上的性能比较，我们创建了一个“正式”分割。我们以0.5、0.3和0.2的比率将图像和相关问题随机划分为训练集、验证集和测试集。统计结果汇总在表5中。

5 Benchmark VQA Performance

在本节中，我们将现有的完善的和最先进的VQA方法应用于我们的PathVQA数据集，以获得一些基准性能数字，供研究团体进行基准测试

5.1 Models

我们使用三种著名的VQA方法来生成基准测试结果。
•方法1:[20]中提出的方法使用门选递归单元(GRU)[21]递归网络和更快的R-CNN[22]网络来嵌入问题和图像。它使用双线性注意网络(BAN)学习双线性注意分布，并使用低秩近似技术来近似问题嵌入和图像嵌入之间的双线性相互作用。
•方法2:在[23]中，使用CNN对图像进行编码，使用LSTM[24]网络对问题和答案进行编码。提出了一种多模态压缩双线性池化机制来匹配图像编码和问题编码，并利用注意机制来推断答案。
•方法3:堆叠注意网络[25]分别使用CNN和LSTM嵌入图像和问题/答案，并利用堆叠注意机制定位与回答问题相关的图像区域。它多次查询图像，以逐步缩小区域，以参加。

5.2 Experimental Settings

给定问题和答案，我们执行标准的预处理，包括删除标点和停止词、标记化和转换为小写。对于问题编码和答案解码，我们创造了一个有2200个单词的词汇表，频率最高。数据增强应用于图像，包括移动、缩放和剪切。在方法1-3中，我们沿用了[20,23,25]的原始模型构型，==分别使用更快的R-CNN、ResNet-152[26]和VGGNet[27]进行视觉特征提取，更快的R-CNN在视觉基因组[28]上预先训练，后两个都在ImageNet[29]上预先训练。问题和答案中的单词使用在通用领域语料如维基百科、Twitter等上预先训练好的GloV e[30]向量来表示。==在方法1中，线性映射的dropout[31]率设为0.2，分类器的dropout[31]率设为0.5。初始学习率设置为0.005使用了Adamax优化器[32]。批量大小设置为512。在方法2中，将dropout应用于LSTM层，概率为0.4。在多模压缩双线性池中，我们将特征维数设为2048。优化器为Adam[32]，初始学习率为0.0001，小批量大小为32。在方法3中，注意层数和LSTM层数都设置为2,LSTM的隐藏维数设置为512。权重参数的学习采用随机梯度下降(SGD)，动量为0.9，学习率为0.1，小批量大小为100。与方法1和方法2相比，我们将方法3中的图像编码器分别换成更快的R-CNN和ResNet-152。我们将这两个基线模型分别称为Method 3 + Faster R-CNN和Method 3 + ResNet。

对于“是/否”的问题，我们使用准确性来评估。对于开放式问题，我们使用三个指标进行评估:(1)精确匹配[2]，它衡量的是推断出的答案与ground-truth完全匹配的百分比;(2)宏观平均F1[33]，衡量预测答案与ground-truth之间的平均重叠，将答案视为一袋代币;(3) BLEU[34]，通过n-gram匹配来度量预测答案与ground-truth的相似度。

5.3 Results

表6显示了不同方法对“是/否”问题的准确率。所有方法都比随机猜测(准确率为50%)更好。这表明该数据集具有临床意义，使得VQA模型具有可学习性。在方法1-3中，方法1表现最好。==一个主要原因是它使用自底向上的机制来提出候选图像区域和提取区域特定的视觉特征。==通常，答案只与整个病理图像的一小部分有关。方法1有效地定位图像区域最有助于推断正确的答案。这可以通过比较方法3 + Faster R-CNN和方法3来进一步验证，前者的性能优于后者。方法3 +更快的R-CNN提取特定区域的特征，方法3提取整个图像的整体特征。此外，注意残差学习的使用以及双线性注意优于其他共同注意方法也使得方法1的准确率最高。另一个观察结果是方法3优于方法2。这是因为方法3利用多层注意力来逐步学习要注意的地方，因此比使用单层注意力的方法2取得更好的成绩。方法3 + ResNet的效果优于方法3，原因是ResNet提取的视觉特征比VGGNet更好。

表7显示了精确的匹配分数，F1和BLEU-(1,2,3)分数，开放式问题属于以下类别:什么，在哪里，如何，谁，和何时。可以看出，这些分数总体上比较低，这说明我们的数据集对于医学VQA来说是非常具有挑战性的。作为参考，我们在表8中总结了这些基线方法在一般域VQA数据集上的精确匹配得分。可以看出，这些数字要高得多。我们的数据集如此具有挑战性的原因在于以下事实。首先，我们数据集中的大多数问题都是开放式的，其中可能答案的数量是O(VL)，其中V是词汇量大小，L是答案的预期长度。这很容易导致词汇量外的问题，即测试示例中的单词可能永远不会出现在训练示例中。其次，与一般的域VQA数据集相比，我们的数据集的大小要小得多。VQA模型需要更多的创新来弥补性能上的差距。开放式问题的精确匹配分数远低于“是/否”问题的准确分数。这并不奇怪，因为回答开放式问题的考生数量很大，而回答“是/否”的只有2个。与表7得出的结论相似，基于双线性注意的方法1表现最好。方法3比方法2更有效，它利用了大量的注意力机制。

图9显示了采用方法1-3的20个最常见答案的F1得分。可以看出，方法1在大多数答案上优于方法2和3。这与表6和表7的结果一致

我们在图8中展示了两个通过方法1-3获得的VQA结果的定性示例。在左边的例子中，所有的方法都不能给出正确的答案，因为这个答案并不常见。但这三个答案在语义上与图像非常相关，表明模型可以学习到有意义的东西。在正确的例子中，方法1和方法3都正确地预测了答案，而方法2则失败了。这表明这两种方法相对于方法2有一定的优势，因为它们有效的注意机制使它们能够更好地识别感兴趣的图像区域，有助于给出正确的答案。

Suggestions for model improvement
==基线方法中使用的视觉特征提取器是在与病理图像有域差异的一般域图像上进行预先训练的。==一种改进的方法是，从教科书、网站等收集与我们数据集中的图像领域更接近的公开医学图像(最好是病理图像)，然后使用这些医学图像对cnn进行预训练。同样，在一般领域语料库上预先训练的词嵌入可能不能有效地捕捉与病理学相关的语义。为了提高词汇嵌入能力，我们可以在医学教科书、临床指南、医学出版物等医学文献上进行预先训练。

6 Conclusion and Future Works

本文对开发人工智能系统的目标通过board-certificated美国董事会病理学检查和培养研究在医学视觉问答,我们建立一个病理学酒瓶数据集,其中包含32799个问答对7的类别,从4998年生成的图像。我们数据集中的大部分问题都是开放式的，这给医学VQA研究带来了巨大的挑战。我们的数据集是公开的。

对于未来的研究，有几个方面需要改进。首先，我们数据集中的问题还没有完全与ABP测试中的问题一致。在ABP测试问题中，每个图像都与描述病人的病史和人口统计资料的简短文本相关联。这些信息在确定答案时很有用。为了弥补这一差距，我们计划从MedPix数据集创建医疗VQA数据集，其中每个图像都与描述病史和患者人口统计信息的标题和文本相关联。其次，在我们现有的方法中，从字幕中生成的问题/答案对大多基于语言规则，这些规则可能不够多样化或健壮。我们计划开发深度生成模型，学习如何从字幕生成QA对。第三，我们计划应用我们的自动化流水线为其他类型的医学图像创建VQA数据集，如放射学、超声、CT扫描等。除了病理学委员会，其他医学影像领域也有自己的委员会，组织不同类型的委员会认证的考试。构建通过这些考试的AI系统也很有趣。

使用numpy或pytorch校验两个张量是否相等
文章目录1、numpy2、pytorch做算法过程中，如果涉及到模型落地，那必然会将原始的深度学习的框架训练好的模型转换成目标硬件模型的格式，如onnx,tensorrt,openvino,tflite;那么就有对比不同格式模型输出的一致性，从而判断模型转换是否成功。1、numpy用到的核心代码就一行，就是：importnumpyasnpnp.testing.assert_allclose(act
【深度学习pytorch-6】张量与numpy相互转换超华东算法王 DL-pytorch 深度学习 pytorch numpy
张量与Numpy数组之间的互相转换在深度学习中，张量（tensor）和Numpy数组（numpyarray）是两种常见的数据结构。张量通常用于深度学习框架（如PyTorch、TensorFlow等），而Numpy数组在科学计算中被广泛使用。为了便于数据处理和计算，常常需要在它们之间进行转换。下面介绍张量和Numpy数组之间的互相转换。1.PyTorch张量与Numpy数组的互相转换PyTorch提
LoRA微调详解：如何为AIGC模型节省90%显存 SuperAGI2025 AI大模型应用开发宝典 AIGC ai
LoRA微调详解：如何为AIGC模型节省90%显存关键词：LoRA、低秩适应、AIGC模型、参数高效微调、显存优化摘要：在AIGC（人工智能生成内容）领域，大模型（如GPT-3、LLaMA、StableDiffusion）的微调需要消耗海量显存，普通用户或企业难以负担。本文将深入解析LoRA（Low-RankAdaptation，低秩适应）这一参数高效微调技术，通过生活类比、数学原理、代码实战和应
探索《非官方知乎 API》：解锁知乎数据潜能指南
探索《非官方知乎API》：解锁知乎数据潜能指南Unofficial-Zhihu-API深度学习模型自动识别验证码，python爬虫库自动管理会话，通过简单易用的API，实现知乎数据的爬取项目地址:https://gitcode.com/gh_mirrors/un/Unofficial-Zhihu-API项目介绍非官方知乎API是一个由社区贡献的开源工具，位于https://github.com/l
结合LangGraph、DeepSeek-R1和Qdrant 的混合 RAG 技术实践大模型之路 RAG rag
一、引言：混合RAG技术的发展与挑战在人工智能领域，检索增强生成（RAG）技术正成为构建智能问答系统的核心方案。传统RAG通过向量数据库存储文档嵌入并检索相关内容，结合大语言模型（LLM）生成回答，有效缓解了LLM的“幻觉”问题。然而，单一的稠密向量检索（如基于Transformer的嵌入模型）在处理关键词匹配和多义词歧义时存在局限性，而稀疏向量检索（如BM25）虽擅长精确关键词匹配，却缺乏语义理
军事，本身就是智能人机与认知实验室人工智能大数据
军事智能后面两个字不重要，军事本身就是智能。军事活动中的许多决策和操作本质上都离不开“智能”，不论是指人类的智慧，还是现代技术和人工智能的应用。军事行动本质上是一种复杂的决策过程，涉及到战略、战术、资源配置、情报分析等多个方面。每一个决策都需要充分的智慧和智能的支持，考虑的因素包括敌我态势、地理环境、气候、技术优势等。人类指挥官的战略智慧和经验在军事行动中至关重要，但随着现代技术的发展，智能化技术
图像分类：从基础原理到前沿技术随机森林404 计算机视觉分类数据挖掘人工智能
引言在当今数字化时代，图像数据正以惊人的速度增长。从社交媒体上的照片分享到医疗影像诊断，从自动驾驶到工业质检，图像分类技术已经成为人工智能领域最基础也最重要的应用之一。本文将全面介绍图像分类的基础概念、发展历程、关键技术、应用场景以及未来趋势，帮助读者系统性地理解这一领域。第一章图像分类概述1.1什么是图像分类图像分类（ImageClassification）是计算机视觉中的一项核心任务，其目标是
通义灵码+DeepSeek：国产代码生成王炸组合，带你飞！
引言在人工智能飞速发展的当下，AI代码生成工具如雨后春笋般涌现，为开发者们带来了前所未有的编程体验。其中，国产的通义灵码结合DeepSeek模型异军突起，成为众多开发者关注的焦点。它们凭借强大的功能和出色的表现，在代码生成领域崭露头角，不仅提升了开发效率，还为编程工作流注入了新的活力。然而，如同任何新兴技术一样，在使用过程中也会遇到各种问题和挑战。本文将通过实测，深入剖析通义灵码与DeepSeek
uni-app 多端开发中 AI 的集成与适配：一次开发，智能多端运行欧阳天羲大前端与 AI 的深度融合 #AI 与大前端框架结合篇 uni-app 人工智能前端
一、引言：uni-app与AI多端集成的背景在当今跨平台开发趋势下，uni-app凭借"一次编写，多端运行"的特性成为企业级应用开发的首选框架之一。随着人工智能技术的普及，将AI能力集成到多端应用中已成为提升用户体验的关键需求。然而，小程序、APP、Web等不同端的运行环境差异显著，如何实现AI功能的统一集成与高效适配成为开发难点。本文将系统讲解在uni-app框架中集成AI能力的完整方案，涵盖跨
大语言模型技术系列讲解：大模型应用了哪些技术知世不是芝士语言模型人工智能自然语言处理 chatgpt 大模型
为了弄懂大语言模型原理和技术细节，笔者计划展开系列学习，并将所学内容从简单到复杂的过程给大家做分享，希望能够体系化的认识大模型技术的内涵。本篇文章作为第一讲，先列出大模型使用到了哪些技术，目的在于对大模型使用的技术有个整体认知。后续我们讲一一详细讲解这些技术概念并解剖其背后原理。正文开始大语言模型（LLMs）在人工智能领域通常指的是参数量巨大、能够处理复杂任务的深度学习模型。这些模型使用的技术主要
免费学中医，这些优质资源不容错过少林659 零基础学中医免费学中医
零基础学中医，学中医如何入门免费学中医！问止精一书院链接：https://tool.nineya.com/qrcode/1iv54b4ts想入门中医却担心成本太高？其实有不少免费又优质的学习资源，问止中医的系列免费课程就是其中的佼佼者，涵盖理论与实操，满足不同学习者的需求。问止中医旗下的精一书院，是免费学中医的绝佳平台。由问止中医联合创始人林大栋博士主讲，课程聚焦中医结构分析、人工智能中医大脑技术
思维树(Tree of Thoughts): 超越链式思维的AI推理新范式司南锤 LLM 人工智能
引言在人工智能快速发展的今天，大语言模型(LLM)的推理能力一直是研究的热点。从最初的直接问答，到链式思维(ChainofThoughts,CoT)的出现，再到如今的思维树(TreeofThoughts,TOT)，AI的推理方式正在变得越来越接近人类的思维过程。思维树作为一种全新的推理框架，不仅继承了链式思维的优势，更通过树状结构的探索和回溯机制，实现了更加复杂和深入的推理过程。本文将深入探讨TO
【深度学习-Day 33】从零到一：亲手构建你的第一个卷积神经网络（CNN）吴师兄大模型深度学习入门到精通深度学习 cnn 人工智能 python 大模型卷积神经网络（CNN）机器学习
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
AttributeError: module ‘openai‘ has no attribute ‘ChatCompletion‘解决方案爱编程的喵喵 Python基础课程 python AttributeError openai ChatCompletion 解决方案
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。本文主要介绍了AttributeError:mod
RAG技术全面对比研究：探索最优检索增强生成策略
检索增强生成（RAG）技术全景解析：从基础到前沿在当今信息爆炸的时代，如何从海量数据中快速准确地获取所需信息，是人工智能领域的一大挑战。Retrieval-AugmentedGeneration（RAG，检索增强生成）技术应运而生，它结合了检索和生成的优势，通过从大量文档中检索相关信息，再利用这些信息生成高质量的回答。本文将系统性地介绍18种RAG技术，通过概念解析、代码示例和实际应用场景分析，帮
基于深度学习的草莓成熟度检测系统：YOLOv5 + UI界面 + 数据集 YOLO实战营深度学习YOLO实战项目深度学习 YOLO ui 人工智能目标跟踪
引言随着农业科技的发展，智能化的农业生产方式正逐步替代传统农业。果实的成熟度检测对于农业生产的管理至关重要，尤其是在果蔬的采摘、分拣和运输过程中。草莓作为一种广泛种植且受消费者喜爱的水果，其成熟度检测一直是农业智能化的重要研究方向。传统的草莓成熟度检测方法大多依赖人工经验，劳动强度大且容易出现误差，因此，基于计算机视觉和深度学习的草莓成熟度自动检测系统成为了一种理想选择。深度学习技术，尤其是卷积神
【人工智能】 AI的进化之路：大模型如何重塑技术格局蒙娜丽宁 Python杂谈人工智能人工智能 python
《PythonOpenCV从菜鸟到高手》带你进入图像处理与计算机视觉的大门！解锁Python编程的无限可能：《奇妙的Python》带你漫游代码世界本文深入探讨了人工智能大模型的进化历程及其对技术格局的深远影响。从早期神经网络到现代大模型的突破，文章分析了关键技术进步，如Transformer架构、预训练机制和分布式计算。结合数学公式和代码示例，详细阐述了大模型的训练原理、优化方法及实际应用场景。文
数字人矩阵源码--基于深度学习的数字人面部表情合成我~18339948121 数字人源码数字人矩阵源码 123数字人源码矩阵深度学习线性代数人工智能 flask tornado python
AI正在席卷全球，数字人市场需求增长，用AI数字分身一天就能生产出几十条高质量短视频，你只需要上传一段视频，甚至都不用开口说话，直接复制粘贴文案，就能得到一个属于你的数字分身。深度学习数字人面部表情合成的关键技术3D面部建模与参数化建立高精度3D面部模型是表情合成的基础，常用Blendshape或面部动作编码系统（FACS）作为参数化控制方法。Blendshape通过线性组合基础表情形状生成新表情
数字人视频剪辑与数字人分身源码开发的的核心技术解析微~18339948121 数字人分身源码数字人剪辑源码数字人源码 django pygame virtualenv plotly scikit-learn flask tornado
数字人视频剪辑与分身的核心技术解析数字人视频剪辑和分身技术是近年来人工智能与计算机视觉领域的热点，涉及虚拟形象生成、动作驱动、语音合成等多项技术。以下从技术实现、应用场景和工具选择三个方面展开分析。数字人视频剪辑的关键技术视频剪辑中数字人的核心在于动态形象的生成与编辑。基于深度学习的生成对抗网络（GAN）和3D建模技术可实现高保真虚拟形象构建。典型流程包括：人物建模：通过多视角图像或视频数据重建3
探秘AI的秘密：leaked-system-prompts 人工智能我来了人工智能 AI 人工智能
揭秘：揭秘系统提示合集背后的秘密在当今这个人工智能技术迅速发展的时代，了解和使用大型语言模型（LLM）已成为技术爱好者、开发者和研究人员的共同目标。而作为核心组成部分，系统提示（systemprompts）的设计和应用直接影响了LLM的表现和功能。今天，我们将为大家揭示一个神秘而又充满吸引力的项目——“leaked-system-prompts”。这个项目为我们打开了一扇窥探这些大型语言模型系统提
代码探秘人工智能万能小贤哥人工智能
当你在手机上用语音发送消息，当短视频平台精准推送你感兴趣的内容，当智能音箱陪你聊天解闷，背后都有一位“隐形伙伴”——人工智能。它就像从科幻电影中走出的神奇力量，正悄然改变着我们的生活。今天，就让我们借助简单的Python代码，开启一场探索人工智能奥秘的奇妙之旅！人工智能：计算机的“超能力大脑”想象一下，如果给计算机装上“大脑”，让它学会像人类一样思考、学习和解决问题，会发生什么？这就是人工智能（A
以智能楼宇自动化控制系统为基石，构筑绿色建筑节能增效新标杆 ctrlworks 楼宇自控康沃思物联楼宇自控系统厂家 ba系统厂商建筑管理系统厂家 ibms系统厂家
在全球“双碳”目标加速推进与能源危机日益凸显的背景下，建筑行业作为能源消耗与碳排放的重点领域，正面临从传统建造向绿色智能化转型的迫切需求。数据显示，我国建筑运行阶段能耗占全社会总能耗超30%，碳排放占比达21.9%，而传统建筑管理模式下设备低效运行、能源浪费等问题普遍存在。智能楼宇自动化控制系统（BACS）凭借物联网、大数据、人工智能等技术，通过对建筑设备的精准监控、智能调度与协同管理，成为破解绿
探索生成式 AI Agent：12类，40+个AI Agent实例应用场景的宝藏库和老莫一起学AI 人工智能产品经理职场和发展面试自然语言处理 ai 大模型
在人工智能的璀璨星空中，生成式AI智能体（GenAIAgents）无疑是最耀眼的星辰之一，正以前所未有的速度改变着我们与技术互动的方式。今天，我将分享GitHub上一个宝藏级的项目——“NirDiamant/GenAI_Agents”，这里汇聚了从基础到高级的各种GenAI智能体技术教程与实现案例，堪称一座智能体开发的知识宝库。1.适合初学者的智能体简单会话智能体概览通过集成语言模型、提示模板和历
VSCode-Copilot的系统提示词 youngqqcn AI vscode copilot ide
title:VSCode-Copilot系统提示词date:2025-07-0211:05categories:技术tags:AI人工智能LLM大语言模型提示词Microsoft开源了VSCodeCopilotChat,以下是其系统提示词的摘录。https://github.com/microsoft/vscode-copilot-chat/blob/main/src/extension/prom
边缘人工智能与医疗AI融合发展路径：技术融合与应用前景（下） Allen_Lyb 数智化医院2025 人工智能健康医疗数据库矩阵
医疗边缘AI的市场趋势医疗边缘AI市场正经历着显著的增长，根据市场研究公司的数据，2024年的边缘AI市场价值为125亿美元，估计在2025至2034年之间，由于各部门越来越多地采用边缘装置，CAGR为24.8%。保健、制造业、零售业和汽车业的企业拥有综合边缘计算解决方案[36]。这一增长趋势表明，边缘AI技术正在各行各业得到广泛应用，其中医疗保健是一个重要的应用领域。2023年全球边缘人工智能市
AI 编程对决：Gemini CLI vs Claude Code，谁是最佳 AI 编码工具？ charieli-fh 人工智能大模型
1.引言：AI编码工具的崛起在软件开发的快节奏世界中，人工智能（AI）工具正迅速从辅助角色转变为不可或缺的伙伴。它们不再仅仅是提供代码补全，而是能够理解复杂上下文、执行多步骤任务，甚至自动化整个工作流的智能代理。这种转变正在重塑开发者的日常工作，提高生产力，并加速创新。在众多涌现的AI编码工具中，Google的GeminiCLI和Anthropic的ClaudeCode脱颖而出，各自代表了AI辅助
百度颠覆了自己，飞算JavaAI造福了中国程序员！飞算JavaAI开发助手百度
在当今这个科技日新月异的时代，企业纷纷寻求技术突破，以期在激烈的市场竞争中脱颖而出。百度，作为中国互联网行业的领军企业之一，凭借其强大的科技实力和创新能力，在人工智能等多个领域取得了显著成就，并正在逐步颠覆自身的传统形象。百度自成立之初，就将技术创新视为企业的生命线。从最初的搜索引擎技术，到如今的深度学习、自然语言处理、计算机视觉等前沿领域，百度始终走在技术革新的前沿。其自主研发的飞桨深度学习平台
Java AI 开发智能体：从入门到实践培风图南以星河揽胜 java java 人工智能开发语言
在人工智能（AI）技术蓬勃发展的今天，智能体作为AI领域的核心概念之一，正逐渐渗透到各个行业与应用场景。而Java凭借其跨平台性、丰富的类库和强大的生态系统，成为开发智能体的热门选择。本文将深入探讨如何使用Java进行AI开发智能体，从基础概念到实践应用，解答常见问题，为你揭开JavaAI开发智能体的神秘面纱。一、Java在AI开发中的优势1.跨平台性Java的“一次编写，到处运行”特性，使得基于
ollama v0.9.4 详解：联网功能、模型目录自定义及macOS性能优化全面升级
近年来，随着人工智能技术的快速发展，模型管理与调用变得尤为重要。作为一款备受关注的本地AI模型管理工具，Ollama在最新发布的v0.9.4版本中带来了多项重磅改进和全新功能，提升了用户体验和应用场景的灵活性。本文将深入解析Ollamav0.9.4版本的功能亮点、技术改进以及实用操作指南，帮助广大开发者和AI爱好者全面掌握这款工具的最新动态。一、版本概述Ollamav0.9.4版本于2025年7月
【深度学习:进阶篇】--4.2.词嵌入和NLP 西柚小萌新吖(●ˇ∀ˇ●) #深度学习深度学习自然语言处理人工智能
在RNN中词使用one_hot表示的问题假设有10000个词每个词的向量长度都为10000，整体大小太大没能表示出词与词之间的关系例如Apple与Orange会更近一些，Man与Woman会近一些，取任意两个向量计算内积都为0目录1.词嵌入1.1.特点1.3.word2vec介绍1.3.Word2Vec案例1.3.1.训练语料1.3.2.步骤1.3.3.代码2.测试代码1.词嵌入定义：指把一个维数
scala的option和some 矮蛋蛋编程 scala
原文地址： http://blog.sina.com.cn/s/blog_68af3f090100qkt8.html 对于学习 Scala 的 Java™ 开发人员来说，对象是一个比较自然、简单的入口点。在本系列前几期文章中，我介绍了 Scala 中一些面向对象的编程方法，这些方法实际上与 Java 编程的区别不是很大。我还向您展示了 Scala 如何重新应用传统的面向对象概念，找到其缺点
NullPointerException Cb123456 android BaseAdapter
java.lang.NullPointerException: Attempt to invoke virtual method 'int android.view.View.getImportantForAccessibility()' on a null object reference 出现以上异常.然后就在baidu上
PHP使用文件和目录天子之骄 php文件和目录读取和写入 php验证文件 php锁定文件
PHP使用文件和目录 1.使用include()包含文件 (1)：使用include()从一个被包含文档返回一个值 (2)：在控制结构中使用include() include_once()函数需要一个包含文件的路径，此外，第一次调用它的情况和include()一样，如果在脚本执行中再次对同一个文件调用，那么这个文件不会再次包含。在php.ini文件中设置
SQL SELECT DISTINCT 语句何必如此 sql
SELECT DISTINCT 语句用于返回唯一不同的值。 SQL SELECT DISTINCT 语句在表中，一个列可能会包含多个重复值，有时您也许希望仅仅列出不同（distinct）的值。 DISTINCT 关键词用于返回唯一不同的值。 SQL SELECT DISTINCT 语法 SELECT DISTINCT column_name,column_name F
java冒泡排序 3213213333332132 java 冒泡排序
package com.algorithm; /** * @Description 冒泡 * @author FuJianyong * 2015-1-22上午09:58:39 */ public class MaoPao { public static void main(String[] args) { int[] mao = {17,50,26,18,9,10
struts2.18 +json,struts2-json-plugin-2.1.8.1.jar配置及问题！ 7454103 DAO spring Ajax json qq
struts2.18 出来有段时间了！（貌似是稳定版）闲时研究下下！貌似 sruts2 搭配 json 做 ajax 很吃香！实践了下下！不当之处请绕过！呵呵网上一大堆 struts2+json 不过大多的json 插件都是 jsonplugin.34.jar strut
struts2 数据标签说明 darkranger jsp bean struts servlet Scheme
数据标签主要用于提供各种数据访问相关的功能，包括显示一个Action里的属性，以及生成国际化输出等功能数据标签主要包括： action ：该标签用于在JSP页面中直接调用一个Action，通过指定executeResult参数，还可将该Action的处理结果包含到本页面来。 bean ：该标签用于创建一个javabean实例。如果指定了id属性，则可以将创建的javabean实例放入Sta
链表.简单的链表节点构建 aijuans 编程技巧
/*编程环境WIN-TC*/ #include "stdio.h" #include "conio.h" #define NODE(name, key_word, help) \ Node name[1]={{NULL, NULL, NULL, key_word, help}} typedef struct node { &nbs
tomcat下jndi的三种配置方式 avords tomcat
jndi(Java Naming and Directory Interface，Java命名和目录接口)是一组在Java应用中访问命名和目录服务的API。命名服务将名称和对象联系起来，使得我们可以用名称访问对象。目录服务是一种命名服务，在这种服务里，对象不但有名称，还有属性。 tomcat配置
关于敏捷的一些想法 houxinyou 敏捷
从网上看到这样一句话：“敏捷开发的最重要目标就是：满足用户多变的需求，说白了就是最大程度的让客户满意。” 感觉表达的不太清楚。感觉容易被人误解的地方主要在“用户多变的需求”上。第一种多变，实际上就是没有从根本上了解了用户的需求。用户的需求实际是稳定的，只是比较多，也比较混乱，用户一般只能了解自己的那一小部分，所以没有用户能清楚的表达出整体需求。而由于各种条件的，用户表达自己那一部分时也有
富养还是穷养，决定孩子的一生 bijian1013 教育人生
是什么决定孩子未来物质能否丰盛？为什么说寒门很难出贵子，三代才能出贵族？真的是父母必须有钱，才能大概率保证孩子未来富有吗？-----作者：@李雪爱与自由事实并非由物质决定，而是由心灵决定。一朋友富有而且修养气质很好，兄弟姐妹也都如此。她的童年时代，物质上大家都很贫乏，但妈妈总是保持生活中的美感，时不时给孩子们带回一些美好小玩意，从来不对孩子传递生活艰辛、金钱来之不易、要懂得珍惜
oracle 日期时间格式转化征客丶 oracle
oracle 系统时间有 SYSDATE 与 SYSTIMESTAMP； SYSDATE：不支持毫秒，取的是系统时间； SYSTIMESTAMP：支持毫秒，日期，时间是给时区转换的，秒和毫秒是取的系统的。日期转字符窜：一、不取毫秒： TO_CHAR(SYSDATE, 'YYYY-MM-DD HH24:MI:SS') 简要说明， YYYY 年 MM 月
【Scala六】分析Spark源代码总结的Scala语法四 bit1129 scala
1. apply语法 FileShuffleBlockManager中定义的类ShuffleFileGroup，定义： private class ShuffleFileGroup(val shuffleId: Int, val fileId: Int, val files: Array[File]) { ... def apply(bucketId
Erlang中有意思的bug bookjovi erlang
代码中常有一些很搞笑的bug，如下面的一行代码被调用两次（Erlang beam） commit f667e4a47b07b07ed035073b94d699ff5fe0ba9b Author: Jovi Zhang <[email protected]> Date: Fri Dec 2 16:19:22 2011 +0100 erts:
移位打印10进制数转16进制-2008-08-18 ljy325 java 基础
/** * Description 移位打印10进制的16进制形式 * Creation Date 15-08-2008 9:00 * @author 卢俊宇 * @version 1.0 * */ public class PrintHex { // 备选字符 static final char di
读《研磨设计模式》-代码笔记-组合模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; abstract class Component { public abstract void printStruct(Str
利用cmd命令将.class文件打包成jar chenyu19891124 cmd jar
cmd命令打jar是如下实现：在运行里输入cmd，利用cmd命令进入到本地的工作盘符。(如我的是D盘下的文件有此路径 D:\workspace\prpall\WEB-INF\classes) 现在是想把D:\workspace\prpall\WEB-INF\classes路径下所有的文件打包成prpall.jar。然后继续如下操作： cd D: 回车 cd workspace/prpal
[原创]JWFD v0.96 工作流系统二次开发包 for Eclipse 简要说明 comsci eclipse 设计模式算法工作 swing
JWFD v0.96 工作流系统二次开发包 for Eclipse 简要说明 &nb
SecureCRT右键粘贴的设置 daizj secureCRT 右键粘贴
一般都习惯鼠标右键自动粘贴的功能，对于SecureCRT6.7.5 ，这个功能也已经是默认配置了。老版本的SecureCRT其实也有这个功能，只是不是默认设置，很多人不知道罢了。菜单： Options->Global Options ...->Terminal 右边有个Mouse的选项块。 Copy on Select Paste on Right/Middle
Linux 软链接和硬链接 dongwei_6688 linux
1.Linux链接概念Linux链接分两种，一种被称为硬链接（Hard Link），另一种被称为符号链接（Symbolic Link）。默认情况下，ln命令产生硬链接。【硬连接】硬连接指通过索引节点来进行连接。在Linux的文件系统中，保存在磁盘分区中的文件不管是什么类型都给它分配一个编号，称为索引节点号(Inode Index)。在Linux中，多个文件名指向同一索引节点是存在的。一般这种连
DIV底部自适应 dcj3sjt126com JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
Centos6.5使用yum安装mysql——快速上手必备 dcj3sjt126com mysql
第1步、yum安装mysql [root@stonex ~]# yum -y install mysql-server 安装结果： Installed: mysql-server.x86_64 0:5.1.73-3.el6_5 &nb
如何调试JDK源码 frank1234 jdk
相信各位小伙伴们跟我一样，想通过JDK源码来学习Java，比如collections包，java.util.concurrent包。可惜的是sun提供的jdk并不能查看运行中的局部变量，需要重新编译一下rt.jar。下面是编译jdk的具体步骤： 1.把C:\java\jdk1.6.0_26\sr
Maximal Rectangle hcx2013 max
Given a 2D binary matrix filled with 0's and 1's, find the largest rectangle containing all ones and return its area. public class Solution { public int maximalRectangle(char[][] matrix)
Spring MVC测试框架详解——服务端测试 jinnianshilongnian spring mvc test
随着RESTful Web Service的流行，测试对外的Service是否满足期望也变的必要的。从Spring 3.2开始Spring了Spring Web测试框架，如果版本低于3.2，请使用spring-test-mvc项目（合并到spring3.2中了）。 Spring MVC测试框架提供了对服务器端和客户端（基于RestTemplate的客户端）提供了支持。 &nbs
Linux64位操作系统（CentOS6.6）上如何编译hadoop2.4.0 liyong0802 hadoop
一、准备编译软件 1.在官网下载jdk1.7、maven3.2.1、ant1.9.4，解压设置好环境变量就可以用。环境变量设置如下：（1）执行vim /etc/profile （2）在文件尾部加入: export JAVA_HOME=/home/spark/jdk1.7 export MAVEN_HOME=/ho
StatusBar 字体白色 pangyulei status
[[UIApplication sharedApplication] setStatusBarStyle:UIStatusBarStyleLightContent]; /*you'll also need to set UIViewControllerBasedStatusBarAppearance to NO in the plist file if you use this method
如何分析Java虚拟机死锁 sesame java thread oracle 虚拟机 jdbc
英文资料： Thread Dump and Concurrency Locks Thread dumps are very useful for diagnosing synchronization related problems such as deadlocks on object monitors. Ctrl-\ on Solaris/Linux or Ctrl-B
位运算简介及实用技巧（一）：基础篇 tw_wangzhengquan 位运算
http://www.matrix67.com/blog/archives/263 去年年底写的关于位运算的日志是这个Blog里少数大受欢迎的文章之一，很多人都希望我能不断完善那篇文章。后来我看到了不少其它的资料，学习到了更多关于位运算的知识，有了重新整理位运算技巧的想法。从今天起我就开始写这一系列位运算讲解文章，与其说是原来那篇文章的follow-up，不如说是一个r
jsearch的索引文件结构 yangshangchuan 搜索引擎 jsearch 全文检索信息检索 word分词
jsearch是一个高性能的全文检索工具包，基于倒排索引，基于java8，类似于lucene，但更轻量级。 jsearch的索引文件结构定义如下： 1、一个词的索引由=分割的三部分组成：第一部分是词第二部分是这个词在多少

【VQA文献阅读】PATHVQA: 30000+ QUESTIONS FOR MEDICAL VISUAL QUESTION ANSWERING