文本分类标准测试集reuters-21578的预处理

原文:http://blog.163.com/andy_tsg/blog/static/1617002462010521027588/

前一个月在赶一篇准备投CIKM 2010的关于transfer learning 和文本分类的paper。虽然实验效果证明了当初的idea不是很work,所以论文最终还是没能make出来,但这个过程还是很有收获的。这里分享下我处理reuters-21578的数据集的一些经验,因为在实验初期处理这个数据集花了我整整两天的时间,费了不少周折,希望对要处理这个数据集的同学有点帮助。

       该测试集可以在http://www.daviddlewis.com/resources/testcollections/reuters21578/下载到。这个测试集应该是使用最广泛的文本分类标准测试集(之一?)了,也是我处理过的测试集中最麻烦的一个(其他的如SRAA,20 Newsgroups等)。

        1.  这个数据集中的所有记录并不是一股脑拿来全部都用的,学术界有好几种划分的方法,通常最最常用的是ModApte划分方法(关于如何划分的细节可以参见下载包里README.txt文件的介绍)

        2.  这些数据文件貌似是有一定的格式的,我刚开始也试图把他们当做标准的xml文档来处理(因为下载包里还像模像样的包含了一个SGML DTD 的文件),但老是报错。最终发现很多的记录格式是错误的,而且错误千奇百怪。所以干脆放弃,直接把它们全部看做文本文件来处理得了

        3.  并不是所有按照ModApte划分得到的记录都能拿来使用,因为有些记录的之间并没有包含任何的topic信息(比如reut2-000.sgm文件的第307行记录,写个程序可以检测出有不少这种情况,仅举一例),所以只好丢弃

        4.  并不是所有的包含topic的记录都包含有字段和字段(比如reut2-000.sgm文件中的第3099行记录,同样这种情况也有不少),但是因为这种情况通常在<TEXT>字段中还是包含了一些文字信息的,所以我选择并不将它丢弃</p> <p style="line-height:28px;color:rgb(51,51,51);font-family:'Hiragino Sans GB W3', 'Hiragino Sans GB', Arial, Helvetica, simsun, u5b8bu4f53;font-size:16px;">         5.  由于有4,所以我处理时并不是只将<BODY>字段和<TITLE>字段看作记录的正文,而是将去除所以包含在成对的<和>之间的内容和有关topic的内容后得到的所剩下的部分当做记录正文来看待。这样处理的后果是包含了<DATA>、<PLACES>、<PEOPLE>、<ORGS>、<EXCHANGES>、<COMPANIES>、<UNKNOWN>等字段的信息。但实际上这些字段提供的信息相对是很少的,而且如果有提供的话也是跟记录的正文有关联的,所以我认为这种处理方式还是比较合适的</p> <p style="line-height:28px;color:rgb(51,51,51);font-family:'Hiragino Sans GB W3', 'Hiragino Sans GB', Arial, Helvetica, simsun, u5b8bu4f53;font-size:16px;">         6. 抽取出记录内容后将其中所有的非英文字符去除,并将英文字符全部转换为小写</p> </div> </div> </div> </div> </div> <!--PC和WAP自适应版--> <div id="SOHUCS" sid="1295300445769637888"></div> <script type="text/javascript" src="/views/front/js/chanyan.js"></script> <!-- 文章页-底部 动态广告位 --> <div class="youdao-fixed-ad" id="detail_ad_bottom"></div> </div> <div class="col-md-3"> <div class="row" id="ad"> <!-- 文章页-右侧1 动态广告位 --> <div id="right-1" class="col-lg-12 col-md-12 col-sm-4 col-xs-4 ad"> <div class="youdao-fixed-ad" id="detail_ad_1"> </div> </div> <!-- 文章页-右侧2 动态广告位 --> <div id="right-2" class="col-lg-12 col-md-12 col-sm-4 col-xs-4 ad"> <div class="youdao-fixed-ad" id="detail_ad_2"></div> </div> <!-- 文章页-右侧3 动态广告位 --> <div id="right-3" class="col-lg-12 col-md-12 col-sm-4 col-xs-4 ad"> <div class="youdao-fixed-ad" id="detail_ad_3"></div> </div> </div> </div> </div> </div> </div> <div class="container"> <h4 class="pt20 mb15 mt0 border-top">你可能感兴趣的:(文本分类标准测试集reuters-21578的预处理)</h4> <div id="paradigm-article-related"> <div class="recommend-post mb30"> <ul class="widget-links"> <li><a href="/article/1891742104263127040.htm" title="PCB加工常用高频板材(厂家)与型号介绍表" target="_blank">PCB加工常用高频板材(厂家)与型号介绍表</a> <span class="text-muted">Turbulence_NB</span> <a class="tag" taget="_blank" href="/search/%E6%9D%90%E6%96%99%E5%B7%A5%E7%A8%8B/1.htm">材料工程</a><a class="tag" taget="_blank" href="/search/%E5%B0%84%E9%A2%91%E5%B7%A5%E7%A8%8B/1.htm">射频工程</a><a class="tag" taget="_blank" href="/search/pcb%E5%B7%A5%E8%89%BA/1.htm">pcb工艺</a><a class="tag" taget="_blank" href="/search/%E5%88%B6%E9%80%A0/1.htm">制造</a><a class="tag" taget="_blank" href="/search/5G/1.htm">5G</a> <div>品牌分类品牌名称高频板系列材料构成进口品牌罗杰斯AD系列聚四氟乙烯-陶瓷-玻璃纤维布增强基板进口品牌罗杰斯RO4000系列碳氢树脂-陶瓷-玻璃纤维布复合材料基板进口品牌罗杰斯RO3000系列聚四氟乙烯-陶瓷复合基板,极低损耗,无玻纤材料进口品牌罗杰斯TMM系列碳氢树脂-陶瓷-随机玻纤增强复合材料进口品牌罗杰斯RT/Duroid5000系列聚四氟乙烯-随机玻纤增强复合基板,毫米波专用进口品牌AGC集</div> </li> <li><a href="/article/1891741977976827904.htm" title="Linux内存管理:深度解析与探索" target="_blank">Linux内存管理:深度解析与探索</a> <span class="text-muted">深度Linux</span> <a class="tag" taget="_blank" href="/search/Linux%E5%86%85%E5%AD%98%E7%AE%A1%E7%90%86/1.htm">Linux内存管理</a><a class="tag" taget="_blank" href="/search/linux/1.htm">linux</a><a class="tag" taget="_blank" href="/search/Linux%E5%86%85%E6%A0%B8/1.htm">Linux内核</a><a class="tag" taget="_blank" href="/search/%E5%86%85%E5%AD%98%E6%98%A0%E5%B0%84/1.htm">内存映射</a> <div>你是否想过,在Linux系统中,当你打开一个程序、浏览网页或者处理文件时,这些数据都存放在哪里呢?答案就是内存。Linux内存管理就像是一个超级大管家,它负责管理着系统中所有数据的“家”。这个“家”的空间有限,却要容纳各种各样的数据,而且要保证每个数据都能被快速准确地找到和使用。它需要智慧地分配房间(内存空间),合理地安排住户(进程),还要及时清理不再需要的杂物(回收内存)。今天,我们就一起深入了</div> </li> <li><a href="/article/1891741599818379264.htm" title="新数据结构(10)——Java抽象类和接口" target="_blank">新数据结构(10)——Java抽象类和接口</a> <span class="text-muted">Ut Relinquam</span> <a class="tag" taget="_blank" href="/search/java/1.htm">java</a><a class="tag" taget="_blank" href="/search/%E6%95%B0%E6%8D%AE%E7%BB%93%E6%9E%84/1.htm">数据结构</a><a class="tag" taget="_blank" href="/search/%E7%AE%97%E6%B3%95/1.htm">算法</a> <div>抽象类抽象类产生原因子类可以重写父类中的方法并覆盖父类中的变量抽象类会将子类里共有的代码逻辑进行提取和抽象化抽象类通常被设计作为父类来实现代码复用抽象类的特点抽象类只需要做方法的定义,不需要实现一个被abstract修饰的类被称为抽象类,一个由abstract修饰的方法则被称为抽象方法。由abstract修饰的抽象方法,通常不在抽象类本身中实现,而是作为必须由子类覆盖和实现的方法的定义存在。只有抽</div> </li> <li><a href="/article/1891741597129830400.htm" title="ocr智能票据识别系统|自动化票据识别集成方案" target="_blank">ocr智能票据识别系统|自动化票据识别集成方案</a> <span class="text-muted">OCR_API</span> <a class="tag" taget="_blank" href="/search/%E6%8E%A5%E5%8F%A3/1.htm">接口</a><a class="tag" taget="_blank" href="/search/ocr/1.htm">ocr</a><a class="tag" taget="_blank" href="/search/%E8%87%AA%E5%8A%A8%E5%8C%96/1.htm">自动化</a><a class="tag" taget="_blank" href="/search/%E8%BF%90%E7%BB%B4/1.htm">运维</a> <div>在企业日常运营中,对大量票据实现数字化管理是一项耗时且容易出错的任务。随着技术的进步,OCR(光学字符识别)智能票据识别系统的出现为企业提供了一个高效、准确的解决方案,不仅简化了财务流程,还大幅提升了工作效率。一、什么是OCR智能票据识别系统?OCR智能票据识别系统是一种基于先进图像处理和深度学习算法的技术,能够自动从各类票据中提取关键信息,并将其转换为结构化数据。翔云发票识别系统可以应用于增值税</div> </li> <li><a href="/article/1891741219051073536.htm" title="【离散数学上机】T235,T236" target="_blank">【离散数学上机】T235,T236</a> <span class="text-muted">咒法师无翅鱼</span> <a class="tag" taget="_blank" href="/search/Xdoj%E5%A4%A7%E4%BD%9C%E4%B8%9A/1.htm">Xdoj大作业</a><a class="tag" taget="_blank" href="/search/%E7%AE%97%E6%B3%95/1.htm">算法</a><a class="tag" taget="_blank" href="/search/%E6%B7%B1%E5%BA%A6%E4%BC%98%E5%85%88/1.htm">深度优先</a><a class="tag" taget="_blank" href="/search/%E5%9B%BE%E8%AE%BA/1.htm">图论</a> <div>T235题目:输入集合A和B,输出A到B上的所有单射函数。问题描述给定非空数字集合A和B,求出集合A到集合B上的所有单射函数。输入格式第一行输入m和n(空格间隔),分别为集合A和集合B中的元素个数;第二行输入非空数字集合A,每个元素之间用空格间隔;第三行输入非空数字集合B,每个元素之间用空格间隔;输出格式输出每一行为集合A到集合B的一个构成单射函数的二元关系,按二元关系的基数大小从小到大输出所有二</div> </li> <li><a href="/article/1891740966931460096.htm" title="python小白系列:标准库-日历库" target="_blank">python小白系列:标准库-日历库</a> <span class="text-muted">某个不知名编程爱好者</span> <a class="tag" taget="_blank" href="/search/python%E5%B0%8F%E7%99%BD%E7%B3%BB%E5%88%97/1.htm">python小白系列</a><a class="tag" taget="_blank" href="/search/python/1.htm">python</a> <div>python中的日历库可以打印出选择年份的日历先引入日历库importcalendarasday再让用户输入年份year=int(input('Entryyouwantsearchyear:'))PS:这里是英文版,要中文版的来个三连就发中文版最后,用日历库的标准命定打印出日历print(day.calendar(year))PS:后面括号里的是年份,再关联前面的变量就可以打印出用户想打印出的年份</div> </li> <li><a href="/article/1891740714824429568.htm" title="pnpm、npm、yarn 包管理工具『优劣对比』及『环境迁移』" target="_blank">pnpm、npm、yarn 包管理工具『优劣对比』及『环境迁移』</a> <span class="text-muted">「已注销」</span> <a class="tag" taget="_blank" href="/search/npm/1.htm">npm</a> <div>前言博主在开发前端网站的时候,发现随着开发的项目的逐渐增多,安装的依赖包越来越臃肿,依赖包的安装速度也是非常越来越慢,多项目开发管理也是比较麻烦。之前我就了解过pnpm,但是当时担心更换包管理环境可能会出现的依赖等问题,并且也没有急切的需求,所以当时并没有立即更换综上所述,随着上面问题的出现,更换包管理环境也逐渐提上日程,所以本文主要将会简单对比pnpm和npm/yarn,并且详细讲解如何在多项目</div> </li> <li><a href="/article/1891739455241383936.htm" title="Assembly语言的正则表达式" target="_blank">Assembly语言的正则表达式</a> <span class="text-muted">夏梓蕙</span> <a class="tag" taget="_blank" href="/search/%E5%8C%85%E7%BD%97%E4%B8%87%E8%B1%A1/1.htm">包罗万象</a><a class="tag" taget="_blank" href="/search/golang/1.htm">golang</a><a class="tag" taget="_blank" href="/search/%E5%BC%80%E5%8F%91%E8%AF%AD%E8%A8%80/1.htm">开发语言</a><a class="tag" taget="_blank" href="/search/%E5%90%8E%E7%AB%AF/1.htm">后端</a> <div>Assembly语言的正则表达式:深入解析引言在计算机科学领域,正则表达式(RegularExpressions,简称为Regex)被广泛应用于字符串处理和模式匹配。它是一种高效的文本处理工具,能够帮助开发者在复杂字符串中找出特定模式。随着编程语言和开发环境的不断演进,正则表达式的实现也逐步渗透到了不同的语言之中,包括低级且强大的Assembly语言。本文将深入探讨Assembly语言中的正则表达</div> </li> <li><a href="/article/1891738699759153152.htm" title="DMA原理,步骤超细详解,一文看懂DMA" target="_blank">DMA原理,步骤超细详解,一文看懂DMA</a> <span class="text-muted">2401_87198107</span> <a class="tag" taget="_blank" href="/search/java/1.htm">java</a><a class="tag" taget="_blank" href="/search/%E5%BC%80%E5%8F%91%E8%AF%AD%E8%A8%80/1.htm">开发语言</a> <div>什么是DMA(DMA的基本定义)DMA,全称DirectMemoryAccess,即直接存储器访问。DMA传输将数据从一个地址空间复制到另一个地址空间,提供在外设和存储器之间或者存储器和存储器之间的高速数据传输。我们知道CPU有转移数据、计算、控制程序转移等很多功能,系统运作的核心就是CPU,CPU无时不刻的在处理着大量的事务,但有些事情却没有那么重要,比方说数据的复制和存储数据,如果我们把这部分</div> </li> <li><a href="/article/1891738573451882496.htm" title="关于用c语言实现简陋版MINE MAP" target="_blank">关于用c语言实现简陋版MINE MAP</a> <span class="text-muted">cuikebinpau</span> <a class="tag" taget="_blank" href="/search/%E6%95%B0%E6%8D%AE%E7%BB%93%E6%9E%84/1.htm">数据结构</a><a class="tag" taget="_blank" href="/search/c%23/1.htm">c#</a> <div>思路游戏规则:扫雷游戏的核心是玩家需要点击格子,避开地雷。每个格子可能是地雷,也可能是数字(表示周围地雷的数量)。玩家通过推理,标记所有地雷的位置即可获胜。数据结构:使用二维数组表示游戏棋盘。一个数组存储地雷的位置(mineMap)。另一个数组存储玩家可见的棋盘状态(playerMap)。游戏流程:初始化棋盘:随机布置地雷,并计算每个格子周围的地雷数量。玩家输入坐标,检查是否踩雷。更新玩家可见的棋</div> </li> <li><a href="/article/1891737691897262080.htm" title="【论文投稿-第五届人工智能与工业技术应用国际学术会议(AIITA 2025)】编程语言大比拼:C、C++、Python 和 Java" target="_blank">【论文投稿-第五届人工智能与工业技术应用国际学术会议(AIITA 2025)】编程语言大比拼:C、C++、Python 和 Java</a> <span class="text-muted">禁默</span> <a class="tag" taget="_blank" href="/search/%E8%AF%9D%E9%A2%98%E6%8E%A2%E8%AE%A8/1.htm">话题探讨</a><a class="tag" taget="_blank" href="/search/%E5%AD%A6%E6%9C%AF%E4%BC%9A%E8%AE%AE/1.htm">学术会议</a><a class="tag" taget="_blank" href="/search/c%E8%AF%AD%E8%A8%80/1.htm">c语言</a><a class="tag" taget="_blank" href="/search/c%2B%2B/1.htm">c++</a><a class="tag" taget="_blank" href="/search/python/1.htm">python</a> <div>第五届人工智能与工业技术应用国际学术会议(AIITA2025)将于2025年3月28-30日在中国西安举行。会议旨在为从事人工智能、智能制造、自动化等领域的专家学者、工程技术人员、研发人员提供一个共享科研成果和前沿技术,了解学术发展趋势,拓宽研究思路,加强学术研究和探讨,促进学术成果产业化合作的平台。编辑AIITA2025已上线至IEEE官方列表,详情请点击....大会时间:2025年3月28日-</div> </li> <li><a href="/article/1891737187897110528.htm" title="Rust 与 WebAssembly 结合的优势" target="_blank">Rust 与 WebAssembly 结合的优势</a> <span class="text-muted">exploration-earth</span> <a class="tag" taget="_blank" href="/search/%E5%AD%A6%E4%B9%A0/1.htm">学习</a> <div>性能卓越:Rust语言以其可预测的性能著称,能够避免垃圾收集(GC)引发的暂停问题,这些问题常被称作停止世界(STW)暂停或即时编译(JIT)性能瓶颈。代码精简:由Rust编译生成的.wasm文件体积小巧,这有助于提升网页的加载速度。这些文件不会包含如垃圾收集器等不必要的额外开销,同时,通过高级优化和摇树技术,可以有效剔除无用代码,进一步精简文件大小。无缝集成与互操作:Rust具备自动生成与Rus</div> </li> <li><a href="/article/1891736684035371008.htm" title="软件测试技术之跨平台的移动端UI自动化测试(上)" target="_blank">软件测试技术之跨平台的移动端UI自动化测试(上)</a> <span class="text-muted">学掌门</span> <a class="tag" taget="_blank" href="/search/%E8%BD%AF%E4%BB%B6%E6%B5%8B%E8%AF%95/1.htm">软件测试</a><a class="tag" taget="_blank" href="/search/IT/1.htm">IT</a><a class="tag" taget="_blank" href="/search/ui/1.htm">ui</a><a class="tag" taget="_blank" href="/search/%E8%BD%AF%E4%BB%B6%E6%B5%8B%E8%AF%95/1.htm">软件测试</a> <div>摘要:本文提出一种跨平台的UI自动化测试方案,一方面使用像素级的截图对比技术,解决传统UI自动化测试难以验证页面样式的问题;另一方面用统一部署在服务器端的JavaScript测试代码代替Android和iOS测试代码,大大提高编写测试代码的效率。该方案经过实际验证,具有效率高、质量好、便于维护等多方面优点,文中将阐述具体设计思路以及各关键步骤的实现方法,为同类测试提供借鉴。一、背景当前金融服务数字</div> </li> <li><a href="/article/1891736305839173632.htm" title="深入理解 Java 模板模式:代码复用与架构优化的利器" target="_blank">深入理解 Java 模板模式:代码复用与架构优化的利器</a> <span class="text-muted">疯狂的键盘侠</span> <a class="tag" taget="_blank" href="/search/%E8%AE%BE%E8%AE%A1%E6%A8%A1%E5%BC%8F/1.htm">设计模式</a><a class="tag" taget="_blank" href="/search/java/1.htm">java</a><a class="tag" taget="_blank" href="/search/java/1.htm">java</a><a class="tag" taget="_blank" href="/search/%E8%AE%BE%E8%AE%A1%E6%A8%A1%E5%BC%8F/1.htm">设计模式</a> <div>深入理解Java模板模式:代码复用与架构优化的利器在Java编程世界中,设计模式如同智慧的结晶,帮助开发者应对各种复杂的软件开发需求。其中,模板模式(TemplatePattern)以其独特的代码复用和流程标准化能力,成为构建灵活且可维护系统的关键工具。今天,让我们一同深入探究Java中的模板模式。一、模板模式:概念初窥模板模式属于行为型设计模式,它定义了一个操作中的算法骨架,将一些步骤延迟到子类</div> </li> <li><a href="/article/1891736304568299520.htm" title="【Excel笔记_6】条件格式和自定义格式设置表中数值超过100保留1位,超过1000保留0位,低于100为默认" target="_blank">【Excel笔记_6】条件格式和自定义格式设置表中数值超过100保留1位,超过1000保留0位,低于100为默认</a> <span class="text-muted">科熊小猪</span> <a class="tag" taget="_blank" href="/search/Office/1.htm">Office</a><a class="tag" taget="_blank" href="/search/excel/1.htm">excel</a><a class="tag" taget="_blank" href="/search/%E7%AC%94%E8%AE%B0/1.htm">笔记</a> <div>方法一:自定义格式选中需要设置格式的单元格区域。右键选择设置单元格格式,或者在工具栏中选择开始->数字->自定义格式。在类型框中输入以下自定义格式:[>1000]0;[>100]0.0;G/通用格式解释:[>1000]0:大于1000时,保留0位小数。[>100]0.0:大于100且小于等于1000时,保留1位小数。G/通用格式:其余情况下(即小于等于100),显示为默认格式(即一般的数字格式)。</div> </li> <li><a href="/article/1891736178227474432.htm" title="现代域架构" target="_blank">现代域架构</a> <span class="text-muted">JNI_42020487</span> <a class="tag" taget="_blank" href="/search/%E5%AE%89%E5%85%A8/1.htm">安全</a> <div>现在的域架构,特别是在WindowsServer环境中,已经经过了显著的发展和变化,从早期的WindowsNT和Windows2000时代的简单结构发展为现代的ActiveDirectory(AD)架构。以下是当前域架构的关键特点和组成部分:1.ActiveDirectory域服务(ADDS)ActiveDirectoryDomainServices(简称ADDS)是WindowsServer中最</div> </li> <li><a href="/article/1891735548595335168.htm" title="python_excel批量插入图片" target="_blank">python_excel批量插入图片</a> <span class="text-muted">ramsey17</span> <a class="tag" taget="_blank" href="/search/python/1.htm">python</a><a class="tag" taget="_blank" href="/search/excel/1.htm">excel</a> <div>提取excel的指定列的值的后4位(数值),在其它列名的单元格中,批量嵌入与该数值匹配的图片(未实现居中),每间隔4行处理一次(合并过单元格)。importpandasaspdfromopenpyxlimportload_workbookfromopenpyxl.drawing.imageimportImagefromopenpyxl.utilsimportget_column_letterimp</div> </li> <li><a href="/article/1891735296341504000.htm" title="DeepSeek与医院电子病历的深度融合路径:本地化和上云差异化分析" target="_blank">DeepSeek与医院电子病历的深度融合路径:本地化和上云差异化分析</a> <span class="text-muted">Allen_LVyingbo</span> <a class="tag" taget="_blank" href="/search/%E5%8C%BB%E7%96%97%E9%AB%98%E6%95%88%E7%BC%96%E7%A8%8B%E7%A0%94%E5%8F%91/1.htm">医疗高效编程研发</a><a class="tag" taget="_blank" href="/search/%E5%81%A5%E5%BA%B7%E5%8C%BB%E7%96%97/1.htm">健康医疗</a><a class="tag" taget="_blank" href="/search/%E7%B3%BB%E7%BB%9F%E6%9E%B6%E6%9E%84/1.htm">系统架构</a><a class="tag" taget="_blank" href="/search/deepseek/1.htm">deepseek</a><a class="tag" taget="_blank" href="/search/%E5%A4%A7%E6%A8%A1%E5%9E%8B/1.htm">大模型</a> <div>一、引言1.1研究背景与意义在医疗信息化快速发展的当下,电子病历系统已成为医院信息管理的核心构成。电子病历(EMR)系统,是指医务人员在医疗活动过程中,使用医疗机构信息系统生成的文字、符号、图标、图形、数据、影像等数字化信息,并能实现存储、管理、传输和重现的医疗记录,是病历的一种记录形式。它承载着患者从初诊到治疗结束的所有关键信息,涵盖症状描述、检查结果、诊断结论、治疗方案等内容。电子病历系统的重</div> </li> <li><a href="/article/1891735169228926976.htm" title="python自定义日历库,与对应calendar库函数功能基本一致" target="_blank">python自定义日历库,与对应calendar库函数功能基本一致</a> <span class="text-muted">Hann Yang</span> <a class="tag" taget="_blank" href="/search/python/1.htm">python</a><a class="tag" taget="_blank" href="/search/calendar/1.htm">calendar</a> <div>目录自定义日历库常用列表日期列表常用函数闰年判断月份天数元旦序号日历表头星期序号序号及天数月历字串打印月历年历字串打印年历对比测试测试结果完整代码运行结果自定义日历库自定义日历库函数,并使得其与pythoncalendar库中对应的函数功能基本一致。常用列表month_name=['January','February','March','April','May','June','July','A</div> </li> <li><a href="/article/1891735169971318784.htm" title="Yarn 常见问题及排查指南" target="_blank">Yarn 常见问题及排查指南</a> <span class="text-muted">艳艳子呀</span> <a class="tag" taget="_blank" href="/search/javascript/1.htm">javascript</a><a class="tag" taget="_blank" href="/search/%E5%89%8D%E7%AB%AF/1.htm">前端</a><a class="tag" taget="_blank" href="/search/yarn/1.htm">yarn</a> <div>介绍Yarn是一个高效、可靠的JavaScript依赖管理工具,但在使用过程中,可能会遇到各种问题。本文总结了一些常见的Yarn错误及其排查方法,帮助你快速定位并解决问题。1.网络相关问题❌错误1:网络超时errorAnunexpectederroroccurred:"https://registry.yarnpkg.com/...:ETIMEDOUT".可能原因✅网络不稳定,导致请求超时✅公司或</div> </li> <li><a href="/article/1891735042879713280.htm" title="sql not in 优化" target="_blank">sql not in 优化</a> <span class="text-muted">dingchengyu</span> <a class="tag" taget="_blank" href="/search/%E6%95%B0%E6%8D%AE%E5%BA%93/1.htm">数据库</a><a class="tag" taget="_blank" href="/search/mysql/1.htm">mysql</a><a class="tag" taget="_blank" href="/search/sql/1.htm">sql</a> <div>sql优化1、notin的优化notin和notexists不会命中索引,可以优化为通过leftjoin实现;例如要查询存在于a表但不存在与b表的数据,比较容易理解的sql写法:SELECT*FROMtable_aWHEREidNOTIN(SELECTaidFROMtable_b)1可以利用leftjoin保左、不保右的特性,改为如下sql,效果是一样的,但是如果b表的aid有索引,那么下面的方法</div> </li> <li><a href="/article/1891734789824770048.htm" title="Go分布式爬虫笔记(五)_golang分布式爬虫架构" target="_blank">Go分布式爬虫笔记(五)_golang分布式爬虫架构</a> <span class="text-muted">2401_87198107</span> <a class="tag" taget="_blank" href="/search/golang/1.htm">golang</a><a class="tag" taget="_blank" href="/search/%E5%88%86%E5%B8%83%E5%BC%8F/1.htm">分布式</a><a class="tag" taget="_blank" href="/search/%E7%88%AC%E8%99%AB/1.htm">爬虫</a> <div>系统级别优化与架构设计:如何对服务进行拆分如何将服务链接在一起服务调用的关系以及调用频率各种问题:如何让服务随着负载的增加具有可扩展性?是否采用DDD的架构设计?如何进行分布式的协调?选择何种中间件、缓存数据库与存储数据库?使用何种通信方式?如何设计缓存与数据库的关系,才能避免缓存失效之后大量数据直接打到数据库导致的服务响应变慢甚至服务雪崩的问题呢?分布式系统中数据的一致性,如果业务能够接受读取到</div> </li> <li><a href="/article/1891734790701379584.htm" title="[python]yfinance国内不能使用" target="_blank">[python]yfinance国内不能使用</a> <span class="text-muted">FL1623863129</span> <a class="tag" taget="_blank" href="/search/Python/1.htm">Python</a><a class="tag" taget="_blank" href="/search/python/1.htm">python</a><a class="tag" taget="_blank" href="/search/%E5%BC%80%E5%8F%91%E8%AF%AD%E8%A8%80/1.htm">开发语言</a> <div>yfinance国内不能使用,可以使用tushare、akshare代替importyfinanceasyf#输入股票代码stock_symbol='AAPL'#替换为你想要查询的股票代码#获取股票数据data=yf.download(stock_symbol)#打印实时数据print(data)pipinstallakshareimportakshareasakdf=ak.stock_zh_a_</div> </li> <li><a href="/article/1891734034288013312.htm" title="实用教程:用微服务搭建你的2025项目" target="_blank">实用教程:用微服务搭建你的2025项目</a> <span class="text-muted">zxzy_org</span> <a class="tag" taget="_blank" href="/search/%E5%BE%AE%E6%9C%8D%E5%8A%A1/1.htm">微服务</a><a class="tag" taget="_blank" href="/search/%E6%9E%B6%E6%9E%84/1.htm">架构</a><a class="tag" taget="_blank" href="/search/%E4%BA%91%E5%8E%9F%E7%94%9F/1.htm">云原生</a><a class="tag" taget="_blank" href="/search/%E7%AE%97%E6%B3%95/1.htm">算法</a> <div>微服务架构为构建现代化项目提供了灵活且高效的解决方案。在2025年,如果你计划采用微服务搭建项目,可以参考以下步骤:首先,明确项目的核心需求,合理划分服务边界。一个好的微服务设计需要确保服务粒度适中,不会因为服务过细而增加不必要的复杂性。接着,选择合适的技术栈,主流的语言如Java、Python和GoLang依然是微服务开发的首选。其次,容器化部署是必不可少的步骤,Docker和Kubernete</div> </li> <li><a href="/article/1891733906697285632.htm" title="破解云原生架构疑难杂症:2025年全解决方案" target="_blank">破解云原生架构疑难杂症:2025年全解决方案</a> <span class="text-muted">zxzy03</span> <a class="tag" taget="_blank" href="/search/%E4%BA%91%E5%8E%9F%E7%94%9F/1.htm">云原生</a><a class="tag" taget="_blank" href="/search/%E6%9E%B6%E6%9E%84/1.htm">架构</a> <div>云原生架构的应用近年来已成为技术界的热点,然而其复杂性和多样性也带来了不少挑战。从应用迁移到服务治理,企业在采用云原生架构时常会面临性能瓶颈、安全隐患以及成本不可控等问题。2025年的全解决方案中,云服务提供商推出了更多专注于优化云原生架构的工具和服务。例如,自动化的微服务部署工具让开发者可以更快速地构建和部署应用,同时实现资源的高效利用。此外,针对安全性的疑难杂症,新方案整合了零信任架构和实时威</div> </li> <li><a href="/article/1891733907339014144.htm" title="从零开始学习代理AI:2025全面指南" target="_blank">从零开始学习代理AI:2025全面指南</a> <span class="text-muted">zxzy_org</span> <a class="tag" taget="_blank" href="/search/%E5%AD%A6%E4%B9%A0/1.htm">学习</a><a class="tag" taget="_blank" href="/search/%E4%BA%BA%E5%B7%A5%E6%99%BA%E8%83%BD/1.htm">人工智能</a><a class="tag" taget="_blank" href="/search/ai/1.htm">ai</a> <div>代理AI作为人工智能的一项重要技术,近年来得到了广泛关注。2025年,代理AI技术的不断进步让许多开发者和企业都迫切希望掌握这项技术。如果你是从零开始学习代理AI,本文将为你提供一份全面的学习指南,帮助你掌握代理AI的基础知识、关键技术和实战经验。首先,你需要理解代理AI的基本概念。代理AI是一种能够自主行动并根据环境反馈调整行为的智能系统。它能够通过学习和推理来完成复杂任务,如自动化客服、智能推</div> </li> <li><a href="/article/1891733907909439488.htm" title="2025年如何选择合适的云原生架构工具" target="_blank">2025年如何选择合适的云原生架构工具</a> <span class="text-muted">zxzy_org</span> <a class="tag" taget="_blank" href="/search/%E4%BA%91%E5%8E%9F%E7%94%9F/1.htm">云原生</a><a class="tag" taget="_blank" href="/search/%E6%9E%B6%E6%9E%84/1.htm">架构</a><a class="tag" taget="_blank" href="/search/ai/1.htm">ai</a> <div>随着云原生技术的不断发展,市场上涌现出大量的工具和平台,供开发者选择。2025年,如何在这些工具中选择适合自己项目需求的架构工具,成为技术决策的重要议题。选择合适的云原生工具,首先需要根据项目的规模、复杂度以及团队的技能水平进行综合考虑。首先,容器化技术是云原生架构的核心。Docker是最受欢迎的容器化工具,适用于大多数开发场景。如果项目规模较大,Kubernetes将成为不可或缺的容器编排平台,</div> </li> <li><a href="/article/1891733654518951936.htm" title="人工智能到底是什么?" target="_blank">人工智能到底是什么?</a> <span class="text-muted">yzx991013</span> <a class="tag" taget="_blank" href="/search/%E5%BC%80%E5%8F%91%E8%AF%AD%E8%A8%80/1.htm">开发语言</a><a class="tag" taget="_blank" href="/search/%E4%BA%BA%E5%B7%A5%E6%99%BA%E8%83%BD/1.htm">人工智能</a><a class="tag" taget="_blank" href="/search/python/1.htm">python</a><a class="tag" taget="_blank" href="/search/django/1.htm">django</a> <div>人工智能(ArtificialIntelligence,简称AI)是一门研究和开发能够模拟、延伸和扩展人类智能的理论、方法、技术及应用系统的学科。以下是关于人工智能的具体介绍:定义-从技术角度:人工智能是让计算机系统具备像人类一样的感知、学习、推理、决策等能力,通过算法和数据使计算机能处理和理解各种复杂信息,如语音识别系统能听懂人类语言并转化为文字。-从学科交叉角度:人工智能融合了计算机科学、控制</div> </li> <li><a href="/article/1891733276532469760.htm" title="deepseek本地部署后做微调训练实现智能对话的一些建议" target="_blank">deepseek本地部署后做微调训练实现智能对话的一些建议</a> <span class="text-muted">慧香一格</span> <a class="tag" taget="_blank" href="/search/AI/1.htm">AI</a><a class="tag" taget="_blank" href="/search/%E5%AD%A6%E4%B9%A0/1.htm">学习</a><a class="tag" taget="_blank" href="/search/deepseek/1.htm">deepseek</a><a class="tag" taget="_blank" href="/search/%E6%9C%8D%E5%8A%A1%E5%99%A8/1.htm">服务器</a><a class="tag" taget="_blank" href="/search/AI/1.htm">AI</a> <div>在本地部署大模型后,进行微调和训练以实现智能对话,通常需要按照以下步骤操作。以下是详细的指导内容:1.准备数据集在微调大模型之前,需要准备适合的训练数据集。数据集应满足以下要求:格式:通常使用JSONL(JSONLines)格式,每行包含一个训练样本。内容:数据应包含对话的上下文和目标输出,例如:{"context":"你好!今天天气不错。","response":"是的,天气很好,适合出去走走。</div> </li> <li><a href="/article/1891733150015483904.htm" title="在linux 中搭建deepseek 做微调,硬件配置要求说明" target="_blank">在linux 中搭建deepseek 做微调,硬件配置要求说明</a> <span class="text-muted">慧香一格</span> <a class="tag" taget="_blank" href="/search/%E5%AD%A6%E4%B9%A0/1.htm">学习</a><a class="tag" taget="_blank" href="/search/AI/1.htm">AI</a><a class="tag" taget="_blank" href="/search/linux/1.htm">linux</a><a class="tag" taget="_blank" href="/search/%E6%9C%8D%E5%8A%A1%E5%99%A8/1.htm">服务器</a><a class="tag" taget="_blank" href="/search/deepseek/1.htm">deepseek</a> <div>搭建可参考使用deepseek-CSDN博客官方网站:DeepSeekDeepSeek是一个基于深度学习的开源项目,旨在通过深度学习技术来提升搜索引擎的准确性和效率。如果你想在Linux系统上搭建DeepSeek,你可以遵循以下步骤。这里我将提供一个基本的指导,帮助你从零开始搭建一个基础的DeepSeek环境。1.安装依赖首先,确保你的Linux系统上安装了Python和pip。DeepSeek主</div> </li> <li><a href="/article/73.htm" title="Hadoop(一)" target="_blank">Hadoop(一)</a> <span class="text-muted">朱辉辉33</span> <a class="tag" taget="_blank" href="/search/hadoop/1.htm">hadoop</a><a class="tag" taget="_blank" href="/search/linux/1.htm">linux</a> <div>今天在诺基亚第一天开始培训大数据,因为之前没接触过Linux,所以这次一起学了,任务量还是蛮大的。 首先下载安装了Xshell软件,然后公司给了账号密码连接上了河南郑州那边的服务器,接下来开始按照给的资料学习,全英文的,头也不讲解,说锻炼我们的学习能力,然后就开始跌跌撞撞的自学。这里写部分已经运行成功的代码吧.    在hdfs下,运行hadoop fs -mkdir /u</div> </li> <li><a href="/article/200.htm" title="maven An error occurred while filtering resources" target="_blank">maven An error occurred while filtering resources</a> <span class="text-muted">blackproof</span> <a class="tag" taget="_blank" href="/search/maven/1.htm">maven</a><a class="tag" taget="_blank" href="/search/%E6%8A%A5%E9%94%99/1.htm">报错</a> <div>转:http://stackoverflow.com/questions/18145774/eclipse-an-error-occurred-while-filtering-resources   maven报错: maven An error occurred while filtering resources   Maven -> Update Proje</div> </li> <li><a href="/article/327.htm" title="jdk常用故障排查命令" target="_blank">jdk常用故障排查命令</a> <span class="text-muted">daysinsun</span> <a class="tag" taget="_blank" href="/search/jvm/1.htm">jvm</a> <div>linux下常见定位命令: 1、jps      输出Java进程       -q       只输出进程ID的名称,省略主类的名称;       -m      输出进程启动时传递给main函数的参数;     &nb</div> </li> <li><a href="/article/454.htm" title="java 位移运算与乘法运算" target="_blank">java 位移运算与乘法运算</a> <span class="text-muted">周凡杨</span> <a class="tag" taget="_blank" href="/search/java/1.htm">java</a><a class="tag" taget="_blank" href="/search/%E4%BD%8D%E7%A7%BB/1.htm">位移</a><a class="tag" taget="_blank" href="/search/%E8%BF%90%E7%AE%97/1.htm">运算</a><a class="tag" taget="_blank" href="/search/%E4%B9%98%E6%B3%95/1.htm">乘法</a> <div>  对于 JAVA 编程中,适当的采用位移运算,会减少代码的运行时间,提高项目的运行效率。这个可以从一道面试题说起:     问题: 用最有效率的方法算出2 乘以8 等於几?” 答案:2 << 3 由此就引发了我的思考,为什么位移运算会比乘法运算更快呢?其实简单的想想,计算机的内存是用由 0 和 1 组成的二</div> </li> <li><a href="/article/581.htm" title="java中的枚举(enmu)" target="_blank">java中的枚举(enmu)</a> <span class="text-muted">g21121</span> <a class="tag" taget="_blank" href="/search/java/1.htm">java</a> <div>从jdk1.5开始,java增加了enum(枚举)这个类型,但是大家在平时运用中还是比较少用到枚举的,而且很多人和我一样对枚举一知半解,下面就跟大家一起学习下enmu枚举。先看一个最简单的枚举类型,一个返回类型的枚举: public enum ResultType { /** * 成功 */ SUCCESS, /** * 失败 */ FAIL, </div> </li> <li><a href="/article/708.htm" title="MQ初级学习" target="_blank">MQ初级学习</a> <span class="text-muted">510888780</span> <a class="tag" taget="_blank" href="/search/activemq/1.htm">activemq</a> <div>1.下载ActiveMQ 去官方网站下载:http://activemq.apache.org/ 2.运行ActiveMQ 解压缩apache-activemq-5.9.0-bin.zip到C盘,然后双击apache-activemq-5.9.0-\bin\activemq-admin.bat运行ActiveMQ程序。 启动ActiveMQ以后,登陆:http://localhos</div> </li> <li><a href="/article/835.htm" title="Spring_Transactional_Propagation" target="_blank">Spring_Transactional_Propagation</a> <span class="text-muted">布衣凌宇</span> <a class="tag" taget="_blank" href="/search/spring/1.htm">spring</a><a class="tag" taget="_blank" href="/search/transactional/1.htm">transactional</a> <div>//事务传播属性 @Transactional(propagation=Propagation.REQUIRED)//如果有事务,那么加入事务,没有的话新创建一个 @Transactional(propagation=Propagation.NOT_SUPPORTED)//这个方法不开启事务 @Transactional(propagation=Propagation.REQUIREDS_N</div> </li> <li><a href="/article/962.htm" title="我的spring学习笔记12-idref与ref的区别" target="_blank">我的spring学习笔记12-idref与ref的区别</a> <span class="text-muted">aijuans</span> <a class="tag" taget="_blank" href="/search/spring/1.htm">spring</a> <div>idref用来将容器内其他bean的id传给<constructor-arg>/<property>元素,同时提供错误验证功能。例如: <bean id ="theTargetBean" class="..." /> <bean id ="theClientBean" class=&quo</div> </li> <li><a href="/article/1089.htm" title="Jqplot之折线图" target="_blank">Jqplot之折线图</a> <span class="text-muted">antlove</span> <a class="tag" taget="_blank" href="/search/js/1.htm">js</a><a class="tag" taget="_blank" href="/search/jquery/1.htm">jquery</a><a class="tag" taget="_blank" href="/search/Web/1.htm">Web</a><a class="tag" taget="_blank" href="/search/timeseries/1.htm">timeseries</a><a class="tag" taget="_blank" href="/search/jqplot/1.htm">jqplot</a> <div>timeseriesChart.html <script type="text/javascript" src="jslib/jquery.min.js"></script> <script type="text/javascript" src="jslib/excanvas.min.js&</div> </li> <li><a href="/article/1216.htm" title="JDBC中事务处理应用" target="_blank">JDBC中事务处理应用</a> <span class="text-muted">百合不是茶</span> <a class="tag" taget="_blank" href="/search/java/1.htm">java</a><a class="tag" taget="_blank" href="/search/JDBC%E7%BC%96%E7%A8%8B/1.htm">JDBC编程</a><a class="tag" taget="_blank" href="/search/%E4%BA%8B%E5%8A%A1%E6%8E%A7%E5%88%B6%E8%AF%AD%E5%8F%A5/1.htm">事务控制语句</a> <div>  解释事务的概念; 事务控制是sql语句中的核心之一;事务控制的作用就是保证数据的正常执行与异常之后可以恢复   事务常用命令:             Commit提交         </div> </li> <li><a href="/article/1343.htm" title="[转]ConcurrentHashMap Collections.synchronizedMap和Hashtable讨论" target="_blank">[转]ConcurrentHashMap Collections.synchronizedMap和Hashtable讨论</a> <span class="text-muted">bijian1013</span> <a class="tag" taget="_blank" href="/search/java/1.htm">java</a><a class="tag" taget="_blank" href="/search/%E5%A4%9A%E7%BA%BF%E7%A8%8B/1.htm">多线程</a><a class="tag" taget="_blank" href="/search/%E7%BA%BF%E7%A8%8B%E5%AE%89%E5%85%A8/1.htm">线程安全</a><a class="tag" taget="_blank" href="/search/HashMap/1.htm">HashMap</a> <div>在Java类库中出现的第一个关联的集合类是Hashtable,它是JDK1.0的一部分。 Hashtable提供了一种易于使用的、线程安全的、关联的map功能,这当然也是方便的。然而,线程安全性是凭代价换来的――Hashtable的所有方法都是同步的。此时,无竞争的同步会导致可观的性能代价。Hashtable的后继者HashMap是作为JDK1.2中的集合框架的一部分出现的,它通过提供一个不同步的</div> </li> <li><a href="/article/1470.htm" title="ng-if与ng-show、ng-hide指令的区别和注意事项" target="_blank">ng-if与ng-show、ng-hide指令的区别和注意事项</a> <span class="text-muted">bijian1013</span> <a class="tag" taget="_blank" href="/search/JavaScript/1.htm">JavaScript</a><a class="tag" taget="_blank" href="/search/AngularJS/1.htm">AngularJS</a> <div>        angularJS中的ng-show、ng-hide、ng-if指令都可以用来控制dom元素的显示或隐藏。ng-show和ng-hide根据所给表达式的值来显示或隐藏HTML元素。当赋值给ng-show指令的值为false时元素会被隐藏,值为true时元素会显示。ng-hide功能类似,使用方式相反。元素的显示或</div> </li> <li><a href="/article/1597.htm" title="【持久化框架MyBatis3七】MyBatis3定义typeHandler" target="_blank">【持久化框架MyBatis3七】MyBatis3定义typeHandler</a> <span class="text-muted">bit1129</span> <a class="tag" taget="_blank" href="/search/TypeHandler/1.htm">TypeHandler</a> <div>什么是typeHandler? typeHandler用于将某个类型的数据映射到表的某一列上,以完成MyBatis列跟某个属性的映射   内置typeHandler MyBatis内置了很多typeHandler,这写typeHandler通过org.apache.ibatis.type.TypeHandlerRegistry进行注册,比如对于日期型数据的typeHandler, </div> </li> <li><a href="/article/1724.htm" title="上传下载文件rz,sz命令" target="_blank">上传下载文件rz,sz命令</a> <span class="text-muted">bitcarter</span> <a class="tag" taget="_blank" href="/search/linux%E5%91%BD%E4%BB%A4rz/1.htm">linux命令rz</a> <div>刚开始使用rz上传和sz下载命令: 因为我们是通过secureCRT终端工具进行使用的所以会有上传下载这样的需求: 我遇到的问题: sz下载A文件10M左右,没有问题 但是将这个文件A再传到另一天服务器上时就出现传不上去,甚至出现乱码,死掉现象,具体问题 解决方法: 上传命令改为;rz -ybe 下载命令改为:sz -be filename 如果还是有问题: 那就是文</div> </li> <li><a href="/article/1851.htm" title="通过ngx-lua来统计nginx上的虚拟主机性能数据" target="_blank">通过ngx-lua来统计nginx上的虚拟主机性能数据</a> <span class="text-muted">ronin47</span> <a class="tag" taget="_blank" href="/search/ngx-lua%E3%80%80%E7%BB%9F%E8%AE%A1+%E8%A7%A3%E7%A6%81ip/1.htm">ngx-lua 统计 解禁ip</a> <div>介绍 以前我们为nginx做统计,都是通过对日志的分析来完成.比较麻烦,现在基于ngx_lua插件,开发了实时统计站点状态的脚本,解放生产力.项目主页: https://github.com/skyeydemon/ngx-lua-stats 功能 支持分不同虚拟主机统计, 同一个虚拟主机下可以分不同的location统计. 可以统计与query-times request-time </div> </li> <li><a href="/article/1978.htm" title="java-68-把数组排成最小的数。一个正整数数组,将它们连接起来排成一个数,输出能排出的所有数字中最小的。例如输入数组{32, 321},则输出32132" target="_blank">java-68-把数组排成最小的数。一个正整数数组,将它们连接起来排成一个数,输出能排出的所有数字中最小的。例如输入数组{32, 321},则输出32132</a> <span class="text-muted">bylijinnan</span> <a class="tag" taget="_blank" href="/search/java/1.htm">java</a> <div> import java.util.Arrays; import java.util.Comparator; public class MinNumFromIntArray { /** * Q68输入一个正整数数组,将它们连接起来排成一个数,输出能排出的所有数字中最小的一个。 * 例如输入数组{32, 321},则输出这两个能排成的最小数字32132。请给出解决问题</div> </li> <li><a href="/article/2105.htm" title="Oracle基本操作" target="_blank">Oracle基本操作</a> <span class="text-muted">ccii</span> <a class="tag" taget="_blank" href="/search/Oracle+SQL%E6%80%BB%E7%BB%93/1.htm">Oracle SQL总结</a><a class="tag" taget="_blank" href="/search/Oracle+SQL%E8%AF%AD%E6%B3%95/1.htm">Oracle SQL语法</a><a class="tag" taget="_blank" href="/search/Oracle%E5%9F%BA%E6%9C%AC%E6%93%8D%E4%BD%9C/1.htm">Oracle基本操作</a><a class="tag" taget="_blank" href="/search/Oracle+SQL/1.htm">Oracle SQL</a> <div>一、表操作 1. 常用数据类型 NUMBER(p,s):可变长度的数字。p表示整数加小数的最大位数,s为最大小数位数。支持最大精度为38位 NVARCHAR2(size):变长字符串,最大长度为4000字节(以字符数为单位) VARCHAR2(size):变长字符串,最大长度为4000字节(以字节数为单位) CHAR(size):定长字符串,最大长度为2000字节,最小为1字节,默认</div> </li> <li><a href="/article/2232.htm" title="[强人工智能]实现强人工智能的路线图" target="_blank">[强人工智能]实现强人工智能的路线图</a> <span class="text-muted">comsci</span> <a class="tag" taget="_blank" href="/search/%E4%BA%BA%E5%B7%A5%E6%99%BA%E8%83%BD/1.htm">人工智能</a> <div>     1:创建一个用于记录拓扑网络连接的矩阵数据表      2:自动构造或者人工复制一个包含10万个连接(1000*1000)的流程图      3:将这个流程图导入到矩阵数据表中      4:在矩阵的每个有意义的节点中嵌入一段简单的</div> </li> <li><a href="/article/2359.htm" title="给Tomcat,Apache配置gzip压缩(HTTP压缩)功能" target="_blank">给Tomcat,Apache配置gzip压缩(HTTP压缩)功能</a> <span class="text-muted">cwqcwqmax9</span> <a class="tag" taget="_blank" href="/search/apache/1.htm">apache</a> <div>背景: HTTP 压缩可以大大提高浏览网站的速度,它的原理是,在客户端请求网页后,从服务器端将网页文件压缩,再下载到客户端,由客户端的浏览器负责解压缩并浏览。相对于普通的浏览过程HTML ,CSS,Javascript , Text ,它可以节省40%左右的流量。更为重要的是,它可以对动态生成的,包括CGI、PHP , JSP , ASP , Servlet,SHTML等输出的网页也能进行压缩,</div> </li> <li><a href="/article/2486.htm" title="SpringMVC and Struts2" target="_blank">SpringMVC and Struts2</a> <span class="text-muted">dashuaifu</span> <a class="tag" taget="_blank" href="/search/struts2/1.htm">struts2</a><a class="tag" taget="_blank" href="/search/springMVC/1.htm">springMVC</a> <div>SpringMVC VS Struts2 1: spring3开发效率高于struts 2: spring3 mvc可以认为已经100%零配置 3: struts2是类级别的拦截, 一个类对应一个request上下文, springmvc是方法级别的拦截,一个方法对应一个request上下文,而方法同时又跟一个url对应 所以说从架构本身上 spring3 mvc就容易实现r</div> </li> <li><a href="/article/2613.htm" title="windows常用命令行命令" target="_blank">windows常用命令行命令</a> <span class="text-muted">dcj3sjt126com</span> <a class="tag" taget="_blank" href="/search/windows/1.htm">windows</a><a class="tag" taget="_blank" href="/search/cmd/1.htm">cmd</a><a class="tag" taget="_blank" href="/search/command/1.htm">command</a> <div>在windows系统中,点击开始-运行,可以直接输入命令行,快速打开一些原本需要多次点击图标才能打开的界面,如常用的输入cmd打开dos命令行,输入taskmgr打开任务管理器。此处列出了网上搜集到的一些常用命令。winver 检查windows版本 wmimgmt.msc 打开windows管理体系结构(wmi) wupdmgr windows更新程序 wscrip</div> </li> <li><a href="/article/2740.htm" title="再看知名应用背后的第三方开源项目" target="_blank">再看知名应用背后的第三方开源项目</a> <span class="text-muted">dcj3sjt126com</span> <a class="tag" taget="_blank" href="/search/ios/1.htm">ios</a> <div>知名应用程序的设计和技术一直都是开发者需要学习的,同样这些应用所使用的开源框架也是不可忽视的一部分。此前《 iOS第三方开源库的吐槽和备忘》中作者ibireme列举了国内多款知名应用所使用的开源框架,并对其中一些框架进行了分析,同样国外开发者 @iOSCowboy也在博客中给我们列出了国外多款知名应用使用的开源框架。另外txx's blog中详细介绍了 Facebook Paper使用的第三</div> </li> <li><a href="/article/2867.htm" title="Objective-c单例模式的正确写法" target="_blank">Objective-c单例模式的正确写法</a> <span class="text-muted">jsntghf</span> <a class="tag" taget="_blank" href="/search/%E5%8D%95%E4%BE%8B/1.htm">单例</a><a class="tag" taget="_blank" href="/search/ios/1.htm">ios</a><a class="tag" taget="_blank" href="/search/iPhone/1.htm">iPhone</a> <div>一般情况下,可能我们写的单例模式是这样的: #import <Foundation/Foundation.h> @interface Downloader : NSObject + (instancetype)sharedDownloader; @end #import "Downloader.h" @implementation</div> </li> <li><a href="/article/2994.htm" title="jquery easyui datagrid 加载成功,选中某一行" target="_blank">jquery easyui datagrid 加载成功,选中某一行</a> <span class="text-muted">hae</span> <a class="tag" taget="_blank" href="/search/jquery/1.htm">jquery</a><a class="tag" taget="_blank" href="/search/easyui/1.htm">easyui</a><a class="tag" taget="_blank" href="/search/datagrid/1.htm">datagrid</a><a class="tag" taget="_blank" href="/search/%E6%95%B0%E6%8D%AE%E5%8A%A0%E8%BD%BD/1.htm">数据加载</a> <div>1.首先你需要设置datagrid的onLoadSuccess $( '#dg' ).datagrid({onLoadSuccess :  function (data){      $( '#dg' ).datagrid( 'selectRow' ,3); }});   2.onL</div> </li> <li><a href="/article/3121.htm" title="jQuery用户数字打分评价效果" target="_blank">jQuery用户数字打分评价效果</a> <span class="text-muted">ini</span> <a class="tag" taget="_blank" href="/search/JavaScript/1.htm">JavaScript</a><a class="tag" taget="_blank" href="/search/html/1.htm">html</a><a class="tag" taget="_blank" href="/search/jquery/1.htm">jquery</a><a class="tag" taget="_blank" href="/search/Web/1.htm">Web</a><a class="tag" taget="_blank" href="/search/css/1.htm">css</a> <div>效果体验:http://hovertree.com/texiao/jquery/5.htmHTML文件代码: <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>jQuery用户数字打分评分代码 - HoverTree</</div> </li> <li><a href="/article/3248.htm" title="mybatis的paramType" target="_blank">mybatis的paramType</a> <span class="text-muted">kerryg</span> <a class="tag" taget="_blank" href="/search/DAO/1.htm">DAO</a><a class="tag" taget="_blank" href="/search/sql/1.htm">sql</a> <div>MyBatis传多个参数: 1、采用#{0},#{1}获得参数:    Dao层函数方法:     public User selectUser(String name,String area); 对应的Mapper.xml    <select id="selectUser" result</div> </li> <li><a href="/article/3375.htm" title="centos 7安装mysql5.5" target="_blank">centos 7安装mysql5.5</a> <span class="text-muted">MrLee23</span> <a class="tag" taget="_blank" href="/search/centos/1.htm">centos</a> <div>首先centos7 已经不支持mysql,因为收费了你懂得,所以内部集成了mariadb,而安装mysql的话会和mariadb的文件冲突,所以需要先卸载掉mariadb,以下为卸载mariadb,安装mysql的步骤。   #列出所有被安装的rpm package rpm -qa | grep mariadb   #卸载 rpm -e mariadb-libs-5.</div> </li> <li><a href="/article/3502.htm" title="利用thrift来实现消息群发" target="_blank">利用thrift来实现消息群发</a> <span class="text-muted">qifeifei</span> <a class="tag" taget="_blank" href="/search/thrift/1.htm">thrift</a> <div>           Thrift项目一般用来做内部项目接偶用的,还有能跨不同语言的功能,非常方便,一般前端系统和后台server线上都是3个节点,然后前端通过获取client来访问后台server,那么如果是多太server,就是有一个负载均衡的方法,然后最后访问其中一个节点。那么换个思路,能不能发送给所有节点的server呢,如果能就</div> </li> <li><a href="/article/3629.htm" title="实现一个sizeof获取Java对象大小" target="_blank">实现一个sizeof获取Java对象大小</a> <span class="text-muted">teasp</span> <a class="tag" taget="_blank" href="/search/java/1.htm">java</a><a class="tag" taget="_blank" href="/search/HotSpot/1.htm">HotSpot</a><a class="tag" taget="_blank" href="/search/%E5%86%85%E5%AD%98/1.htm">内存</a><a class="tag" taget="_blank" href="/search/%E5%AF%B9%E8%B1%A1%E5%A4%A7%E5%B0%8F/1.htm">对象大小</a><a class="tag" taget="_blank" href="/search/sizeof/1.htm">sizeof</a> <div>   由于Java的设计者不想让程序员管理和了解内存的使用,我们想要知道一个对象在内存中的大小变得比较困难了。本文提供了可以获取对象的大小的方法,但是由于各个虚拟机在内存使用上可能存在不同,因此该方法不能在各虚拟机上都适用,而是仅在hotspot 32位虚拟机上,或者其它内存管理方式与hotspot 32位虚拟机相同的虚拟机上 适用。     </div> </li> <li><a href="/article/3756.htm" title="SVN错误及处理" target="_blank">SVN错误及处理</a> <span class="text-muted">xiangqian0505</span> <a class="tag" taget="_blank" href="/search/SVN%E6%8F%90%E4%BA%A4%E6%96%87%E4%BB%B6%E6%97%B6%E6%9C%8D%E5%8A%A1%E5%99%A8%E5%BC%BA%E8%A1%8C%E5%85%B3%E9%97%AD/1.htm">SVN提交文件时服务器强行关闭</a> <div>在SVN服务控制台打开资源库“SVN无法读取current” ---摘自网络 写道 SVN无法读取current修复方法 Can't read file : End of file found 文件:repository/db/txn_current、repository/db/current   其中current记录当前最新版本号,txn_current记录版本库中版本</div> </li> </ul> </div> </div> </div> <div> <div class="container"> <div class="indexes"> <strong>按字母分类:</strong> <a href="/tags/A/1.htm" target="_blank">A</a><a href="/tags/B/1.htm" target="_blank">B</a><a href="/tags/C/1.htm" target="_blank">C</a><a href="/tags/D/1.htm" target="_blank">D</a><a href="/tags/E/1.htm" target="_blank">E</a><a href="/tags/F/1.htm" target="_blank">F</a><a href="/tags/G/1.htm" target="_blank">G</a><a href="/tags/H/1.htm" target="_blank">H</a><a href="/tags/I/1.htm" target="_blank">I</a><a href="/tags/J/1.htm" target="_blank">J</a><a href="/tags/K/1.htm" target="_blank">K</a><a href="/tags/L/1.htm" target="_blank">L</a><a href="/tags/M/1.htm" target="_blank">M</a><a href="/tags/N/1.htm" target="_blank">N</a><a href="/tags/O/1.htm" target="_blank">O</a><a href="/tags/P/1.htm" target="_blank">P</a><a href="/tags/Q/1.htm" target="_blank">Q</a><a href="/tags/R/1.htm" target="_blank">R</a><a href="/tags/S/1.htm" target="_blank">S</a><a href="/tags/T/1.htm" target="_blank">T</a><a href="/tags/U/1.htm" target="_blank">U</a><a href="/tags/V/1.htm" target="_blank">V</a><a href="/tags/W/1.htm" target="_blank">W</a><a href="/tags/X/1.htm" target="_blank">X</a><a href="/tags/Y/1.htm" target="_blank">Y</a><a href="/tags/Z/1.htm" target="_blank">Z</a><a href="/tags/0/1.htm" target="_blank">其他</a> </div> </div> </div> <footer id="footer" class="mb30 mt30"> <div class="container"> <div class="footBglm"> <a target="_blank" href="/">首页</a> - <a target="_blank" href="/custom/about.htm">关于我们</a> - <a target="_blank" href="/search/Java/1.htm">站内搜索</a> - <a target="_blank" href="/sitemap.txt">Sitemap</a> - <a target="_blank" href="/custom/delete.htm">侵权投诉</a> </div> <div class="copyright">版权所有 IT知识库 CopyRight © 2000-2050 E-COM-NET.COM , All Rights Reserved. <!-- <a href="https://beian.miit.gov.cn/" rel="nofollow" target="_blank">京ICP备09083238号</a><br>--> </div> </div> </footer> <!-- 代码高亮 --> <script type="text/javascript" src="/static/syntaxhighlighter/scripts/shCore.js"></script> <script type="text/javascript" src="/static/syntaxhighlighter/scripts/shLegacy.js"></script> <script type="text/javascript" src="/static/syntaxhighlighter/scripts/shAutoloader.js"></script> <link type="text/css" rel="stylesheet" href="/static/syntaxhighlighter/styles/shCoreDefault.css"/> <script type="text/javascript" src="/static/syntaxhighlighter/src/my_start_1.js"></script> </body> </html>