ONLYOFFICE

使用 Ruby 语言来解析开放文档格式 OOXML 文件

在这篇文章中，我们将了解一个开发团队如何解决他们在应用程序中解析数据时遇到的问题。

为了测试 ONLYOFFICE 文档编辑器，我们用Ruby语言开发编写了个docx、xlsx、pptx文件解析器程序，它是免费开源的，被我们放在GitHub和RubyGems.org上面了，采用AGPL V3开源协议。

本文我们将告诉你这是如何开发的以及这是如何工作的。

没有现成的工具集

我们本可以从很多已有的工具中选择一个来用，但是有不少原因阻止了我们采用现有的工具集：

他们大多数都被自己的开发者抛弃了。
他们被分为三个独立的库来提供，也就是文档、表格、幻灯片演示这三大类办公文件，三个库的界面接口不同，这使得它们使用起来非常不方便。
他们只支持基本的功能。

译者注：很多软件如果被废弃就会因为久不升级而逐渐不支持不断更新升级的工作对象文件，过两三年就会彻底无用，GitHub上各个项目我最关注的就是the latest release的时间，死了好几年的项目一大把，每每看见都会扼腕叹息

给ONLYOFFICE质保QA团队开发的解析器

我们需要一个更强大的工具，测试我们的ONLYOFFICE编辑器，因为ONLYOFFICE编辑器：

一直处于活跃开发的状态中
允许文档、表格、幻灯片文件使用各种复杂的格式、风格、等功能
尽可能的最大化的支持开放文档格式OOXML，即docx、xlsx、pptx文件

解析复杂的功能

ONLYOFFICE编辑器对微软Office格式有最大的支持力度，所以这个测试用解析器也要有同样的支持力度。我们按照ECMA-376 standard标准来开发，该标准实际上分为上下四大册书，总共七千多页。

所以，你可能会理解，我们实际上无法实现该标准所有的细节，但为了测试ONLYOFFICE编辑器高级功能，我们必须涵盖这些功能点。

因此，除了解析基本的功能特征，比如段落、表格、形状等，我们的解析器还要支持：

配色主题
段落和表格的风格
图表
分列
自动图形的属性
列表

为什么我们需要一个解析器

开始启动对ONLYOFFICE的自动测试之后，我们采取了一个功能测试的简单概念。

比如：

创建一个新文档
随意输入文字并加粗它
检查文字是否被加粗

ONLYOFFICE编辑器是由HTML5 Canvas来开发实现的，因此文档里面的文字被作为图像显示出来。从图像里面确认文字的字体是否加粗了，这种事并不容易。比如下图所示，Arial Black字体，你能辨识出这个字体是否加粗了呢？

这就是在这个软件测试的场景下，为什么我们要添加一套额外的确认步骤的原因了：

4. 下载为docx文件，检查确认这个文字就是被赋予了Bold加粗的属性配置。

细节上有数百个类似的属性参数，然而现有的解析器工具没有一个能够支持所有这些参数，有的不过是解析文字、表格以及其它一些简单内容，这就是为什么我们开发自己的测试库的原因了。

这个解析器是如何工作的

如果你曾经把.docx作为zip文件来解压缩，你就会注意到压缩率非常高，那是因为一个OOXML开放文档格式文件实际上就是一套压缩的XML文件。

例如，我们在ONLYOFFICE编辑器中创建一个文件简单输入一些自负然后保存下载为docx文件：

现在我们把它当作一个zip文件来解压缩，就会看到类似如下的文件夹结构：

#tree
.       
├── [Content_Types].xml     
├── docProps                
│   ├── app.xml            
│   └── core.xml            
├── _rels                   
└── word
    ├── document.xml        
    ├── fontTable.xml       
    ├── _rels               
    │   └── document.xml.rels                  
    ├── settings.xml        
    ├── styles.xml          
    ├── theme               
    │   ├── _rels           
    │   │   └── theme1.xml.rels                
    │   └── theme1.xml      
    └── webSettings.xml

仔细看看这些文件：

[Content_Types].xml —— 文档的MIME类型列表

app.xml —— 文档元数据、应用程序元数据以及统计数据

core.xml —— 最新修改的元数据

document.xml —— 这就是我们要重点查看的文档内容的文件

fontTable.xml —— 文档的字体列表，可能有用

document.xml.rels —— 压缩包中的所有文件的列表，对于复杂文档例如包含有插图、绘图的来说会有用

settings.xml —— 顾名思义，包含文档各种设置，例如默认缩放、数字的分隔符等等

styles.xml、theme1.xml、theme1.xml.rels —— 非常详细的文件，设置风格和主题等信息，识别这些设置的能力就是Office类软件的关键优势之一了

webSettings.xml —— 文档的web版式版本设置，对于docx类文件并不常用的功能 |

译者注：docx类文件在文档编辑器软件中切换为web版式显示画面，可以让文档编辑器软件不去自动计算分页，这对于长达数百页上千页的超大docx文档来说，是在编写过程和只读阅览过程中防止死机提高效率的非常实用的技巧，当然，在排版过程中还是需要切换回常用的页面视图，这个时候就需要办公电脑拥有具备顶级游戏电脑的硬件配置。

所以，如果我们处理上面这个举例的非常简单的文档，我们只需要解析document.xml文件。

这是非常简单的一个XML。幸运的是，这可以用Ruby来轻松解析，我们使用了Nokogiri这个工具，获取DOM树，然后查看OOXML标准，或者是反向工程技术，来看我们所需的参数在哪里。

这个解析器是如何编写出来的

我们开始开发这个工具的时候遇上了两个错误，好在后来我们发现了并改正了。希望我们的经验能够对后来的你们有用，避免发生同样的问题。

大文件

所以，我们需要测试三种不同的编辑器，编辑文档、表格和幻灯片文件，我们如何为此目的而组织代码呢？这就很有趣了，但是，最初我们有四个文件，第四个是为了测试三种编辑器共有的那些通用特性而准备的，这四个文件每个都长达4000多行。调试这些文件花费了很多时间，我们就精心地重新架构了这些代码，结果是分解成为200多个文件，代替先前的四个大文件，这样，现在就很容易定位bug解决bug了。

没有测试

我们：对这个解析器没有测试！因为我们编写这个解析器是用来测试编辑器的，而不是再多开发一个东西来测试这个解析器。

所有事情：我们纠正一处拼写错误来解决一个bug，结果却全部崩溃

所以，我们不得不创建一个特别的文件夹，把这两百多个文件放进来，检查一堆参数，确保知道我们下班之前所做的commit不会crash第三层菜单中某个选项的确认操作，开发团队没有人会详细记得所写代码的所有细节。

我们也有些好主意，例如

使用RuboCop

RuboCop是一个Ruby静态代码分析器和格式化工具，基于Ruby社区风格指南的。我们喜欢这个工具，它帮助我们避免了很多错误，让代码保持干净，确保我们最后的提交没有让代码变坏，感谢经过overcommit进行集成。

例如，如果，在经历了艰难的一天开发滞后，你不小心忘记了Ruby中的变量是小写的，然后就尝试提交类似如下这样的代码：

— path_to_zip_file = copy_file_and_rename_to_zip(path_to_file)
+ ZIP_file = copy_file_and_rename_to_zip(path_to_file)

就会报错：

Analyze with RuboCop........................................[RuboCop] FAILED

Errors on modified lines:

ooxml_parser/lib/ooxml_parser/common_parser/parser.rb:8:7: E: dynamic constant assignment

如果没有额外的操作，您将无法提交代码。这是一个极好措施来预防傻瓜式错误的出现。

使用我们的文档库

实际上到我们开发出来这个解析器的时候，我们就已经收集了很多的，实际上，各种奇奇怪怪的docx、xlsx、pptx文件了。我们在ONLYOFFICE编辑器开发的早期阶段，收集了这些文件，用它们来检查复杂文档的渲染功能，几年之后，我们用它们来测试我们的解析器。我们检测到了不少的错误，然后花费了数周的时间来修复它们，但这些工作物有所值。

现在我们就有了解析OOXML文件的强大的工具OOXML Parser，我们用它来测试：

ONLYOFFICE文档社区版：开源版本由开源社区维护支持；
ONLYOFFICE文档企业版：2B面向企业端用户的商业销售版本；
ONLYOFFICE文档开发者版：面向开发商的可以进行开发的版本。

希望这一篇文章可以对你的项目有所帮助，就如ONLYOFFICE一样。

另：解析器怎么用

按照OOXML Parser的说明，安装后，编写测试脚本：

#!/usr/bin/env ruby
  
 require 'ooxml_parser'
 docx = OoxmlParser::Parser.parse('/home/WangXiaoShen/Documents/HelloWorld.docx')
 p docx.document_properties.pages
 p docx.file_path

执行，可以看到解析结果：

英文原文：Parsing OOXML Files With Ruby - DZone

译者：天哥

你可能感兴趣的:(教程,ruby,开发语言,后端,onlyoffice,开源)

SenseVoice 实测，阿里开源语音大模型，识别效果和效率优于 Whisper，居然还能检测掌声、笑声！5分钟带你部署体验 AI码上来 AI实战开源 whisper xcode
前段时间，带着大家捏了一个对话机器人：手把手带你搭建一个语音对话机器人，5分钟定制个人AI小助手（新手入门篇）其中语音识别（ASR）方案，采用的是阿里开源的FunASR，这刚不久，阿里又开源了一个更强的音频基础模型，该模型具有如下能力：语音识别（ASR）语种识别（LID）语音情感识别（SER）声学事件分类（AEC）声学事件检测（AED）传送门：https://github.com/FunAudio
怎么使用DeepSeek？DeepSeek使用教程轻创思维网络
1.简介DeepSeek是一款基于人工智能技术的智能搜索引擎和信息检索工具。它能够通过自然语言处理技术理解用户的查询需求，并提供精准、全面的搜索结果。无论您是想查找信息、解答问题还是进行创意写作，DeepSeek都能为您提供高效的支持。2.主要功能智能搜索：支持自然语言输入，快速获取精准结果。多语言支持：支持中文、英文及其他多种语言的输入和输出。知识库覆盖：整合海量互联网信息，覆盖百科、新闻、学术
DeepSeek 本地部署硬件配置全解析喜-喜人工智能深度学习 DeepSeek配置要求
DeepSeek这个开源界的“学霸”，凭借低成本和高性能，收获了超多关注。不少朋友都想把它“请回家”，在本地部署，享受离线使用、更好的数据安全和隐私保护这些福利。今天就来唠唠请DeepSeek“回家”需要准备哪些硬件“装备”。DeepSeek简介DeepSeek可是个厉害角色，在各种应用场景里都能大显身手，提供超准确的预测和分析。而且它可“省钱”了，预训练费用还不到OpenAIGPT-4o模型的十
探索TotalSegmentator：一款强大的全场景图像分割工具计蕴斯Lowell
探索TotalSegmentator：一款强大的全场景图像分割工具项目地址:https://gitcode.com/gh_mirrors/to/TotalSegmentator项目简介是一个开源的、基于深度学习的全场景图像分割框架。它由开发者Wasserth创建，旨在为医学影像分析、自动驾驶、遥感图像处理等多个领域提供高效且准确的像素级分类能力。该项目的亮点在于其模型的通用性和易用性，能够处理多种
SpringBoot 新手入门（实操）李恩11 spring boot 后端 java
SpringBoot是一个开源框架，旨在简化基于Spring的Java应用程序的开发。它通过提供一系列默认配置和约定大于配置的理念，让开发者可以更快速地创建和部署应用。以下是一个SpringBoot新手入门的实操指南，帮助你从零开始创建一个简单的SpringBoot应用程序。环境准备安装JDK:SpringBoot需要JavaDevelopmentKit(JDK)8或更高版本。你可以从Oracle
常用Linux命令 xl.liu Linux Linux命令
常用Linux命令的基本使用目标理解学习Linux终端命令的原因常用Linux命令体验01.学习Linux终端命令的原因Linux刚面世时并没有图形界面，所有的操作全靠命令完成，如磁盘操作、文件存取、目录操作、进程管理、文件权限设定等在职场中，大量的服务器维护工作都是在远程通过SSH客户端来完成的，并没有图形界面，所有的维护工作都需要通过命令来完成在职场中，作为后端程序员，必须要或多或少的掌握一些
macOS M2 安装 Jax (jax-metal) 丽英y 实践笔记 macos jax jax-metal mac metal sonama mps
Apple官方教程：AcceleratedJAXonMachttps://developer.apple.com/metal/jax/使用pipinstalljax或pipinstalljax-metal安装Jax后，运行验证代码：python-c'importjax;print(jax.numpy.arange(10))'会提示loc("-":0:0):error:currentmpsdiale
使用 Docker 部署 Apache Spark 集群教程努力的小T docker docker spark linux 运维服务器云计算容器
简介ApacheSpark是一个强大的统一分析引擎，用于大规模数据处理。本文将详细介绍如何使用Docker和DockerCompose快速部署一个包含一个Master节点和两个Worker节点的Spark集群。这种方法不仅简化了集群的搭建过程，还提供了资源隔离、易于扩展等优势。前置条件在开始之前，请确保你的环境中已经准备好了以下组件：安装并运行DockerEngine。安装DockerCompos
Vue学习教程-11数组变化监测番茄番茄君 vue.js 学习 javascript
文章目录前言一、vue侦听响应数组变更方法二、使用Vue.set或者this.$set三、替换数组总结前言在Vue中，数组变化监测是其响应式系统的一个重要特性。Vue2.x版本中，当使用Vue.set或者this.$set，或者在初始化时就声明好数组的每个元素或者调用数组方法，可以确保数组的变更能够被Vue检测到并触发视图的更新。然而，在某些情况下，直接通过索引修改数组元素，例如array[ind
【编译、链接、装载五】编译器后端——gcc生成的汇编代码郑同学的笔记编译和链接汇编 linux 汇编代码 gcc反汇编
【编译和链接五】编译器后端——gcc到汇编一.栈回溯1.framepointers2.debug_frame(DWARF)3.eh_frame(LSB)4CFIdirectives5、关于.cfi结论5.1、CFI伪指令二、寄存器三、helloworld汇编1、指令解释1.1.cfi伪指令1.2汇编指令四、printf和puts四、如何编译不带：调试用的调用堆栈的五、汇编语法其他、一.栈回溯Unw
如何让C++程序自动生成dump文件？以及如何分析dump文件？ dvlinker C/C++实战专栏 C/C++软件开发从入门到实战 c++生成dump文件 windbg 分析dump文件
目录1、API函数SetUnhandledExceptionFilter介绍2、调用SetUnhandledExceptionFilter设置异常处理函数3、调用MiniDumpWriteDump函数导出包含异常上下文的dump文件4、dump文件的多种生成方式5、使用Windbg分析dump文件6、最后C++软件异常排查从入门到精通系列教程（专栏文章列表，欢迎订阅，持续更新...）https:/
【TVM教程】为 x86 CPU 自动调优卷积网络
ApacheTVM是一个深度的深度学习编译框架，适用于CPU、GPU和各种机器学习加速芯片。更多TVM中文文档可访问→https://tvm.hyper.ai/作者：YaoWang,EddieYan本文介绍如何为x86CPU调优卷积神经网络。注意，本教程不会在Windows或最新版本的macOS上运行。如需运行，请将本教程的主体放在if__name__=="__main__":代码块中。impor
瑞_23种设计模式_中介者模式瑞486 23种设计模式设计模式中介者模式 java
文章目录1中介者模式（MediatorPattern）1.1介绍1.2概述1.3中介者模式的结构1.4中介者模式的优缺点1.5中介者模式的使用场景2案例一2.1需求2.2代码实现3案例二3.1需求3.2代码实现前言：本文章为瑞_系列专栏之《23种设计模式》的中介者模式篇。本文中的部分图和概念等资料，来源于博主学习设计模式的相关网站《菜鸟教程|设计模式》和《黑马程序员Java设计模式详解》，特此注明
Java(JavaEE)学习线路图太阳上的雨天 JAVA JAVA
Java学习线路图Java教程Java教程Java简介Java开发环境配置Java基础语法Java对象和类Java基本数据类型Java变量类型Java修饰符Java运算符Java循环结构Java分支结构JavaNumber类JavaCharacter类JavaString类JavaStringBuffer和StringBuilder类Java数组Java日期和时间Java正则表达式Java方法Ja
Python编程基础教程：量化交易入门 AI天才研究院 AI实战 AI大模型企业级应用开发实战大数据人工智能语言模型 AI LLM Java Python 架构设计 Agent RPA
1.背景介绍市场数据信息是每天都在更新，人们对市场变化的快速反应、精准把握、及时行动和判断将成为未来金融领域的一项重要任务。而传统的方式仍然是依赖于传统的报表分析和定期股票投资策略。如何用程序实现量化交易，并且实时跟踪和分析市场数据是本文将要讨论的重点。一般来说，以下五种程序语言被认为是最适合进行量化交易的语言：Python：是一个通用的高级编程语言，具有简单、易学习、可读性强等特点。其中有很多成
Django-Rules 开源项目安装与使用指南尚虹卿
Django-Rules开源项目安装与使用指南django-rulesAwesomeDjangoauthorization,withoutthedatabase项目地址:https://gitcode.com/gh_mirrors/dj/django-rules目录结构及介绍在Django-Rules的目录中，你可以看到以下主要文件和目录：django_rules:包含了核心逻辑以及权限管理的实现
VeighNa：强大的Python开源量化交易平台 @Unity打怪升级 Python python 开发语言开源软件开源人工智能机器学习深度学习
VeighNa（简称VN或vn.py）是一个基于Python的开源量化交易平台，专为量化交易爱好者和专业交易员设计。VeighNa是由国内开发者社区推动的开源项目，旨在提供一个功能丰富、灵活且易于扩展的量化交易解决方案。该框架不仅支持多种资产类别的交易，如股票、期货、期权、加密货币等，还支持多种交易接口和协议，使得用户能够轻松进行多市场、多品种的交易策略开发和部署。VeighNa提供了丰富的量化交
flash-attention安装教程深度求索者深度学习人工智能
flash-attention不仅能加快速度，还可以节省显存。安装方法如下：首先搞清楚你的python什么版本，torch什么版本，cuda什么版本，操作系统是什么。例如我下载的是：flash_attn-2.7.0.post2+cu12torch2.3cxx11abiTRUE-cp310-cp310-linux_x86_64.whl我的操作系统是Linux，Python3.10，cuda12，to
使用AI自动写代码，DeepSeek+CLine+VSCode实战教程，主打一个便宜实惠用得起！ AI程序猿人人工智能 AI编程 vscode DeepSeek AI AI大模型 Dify
0前言最近DeepSeek火了起来，各个媒体都在宣传，那DeekSeek到底是个啥？从程序员角度来看：DeepSeek一个人工智能助手，可以帮助我们解决代码知识点疑问，以及某个晦涩难懂的知识点问题，处理生活中的一些文本信息问题等。其实这些能力早在数年前ChatGPT也已经具备了，那么为什么最近DeepSeek这么火呢？一个原因就是因为它是国产的，那必须得支持。还有一个原因就是它实惠呀，便宜！目测目
PyTorch使用教程(10)-torchinfo.summary网络结构可视化详细说明深图智能深度学习教程深度学习 python pytorch 人工智能
1、基本介绍torchinfo是一个为PyTorch用户量身定做的开源工具，其核心功能之一是summary函数。这个函数旨在简化模型的开发与调试流程，让模型架构一目了然。通过torchinfo的summary函数，用户可以快速获取模型的详细结构和统计信息，如模型的层次结构、输入/输出维度、参数数量、多加操作(Mult-Adds)等关键信息。2、安装首先，你需要安装torchinfo库。可以通过pi
ollama-chat-ui-vue，一个可以用vue对接ollama的开源项目,可接入deepSeek 是你的小熊啊 ui vue.js 前端 ai
ollama-chat-ui-vue使用vue3+vite+elementUi搭建的前端chat,通过ollama可与模型对话,目前支持独立思考,切换模型(联网查询后续支持)github地址：ollama-chat-ui-vue制作不易github点点star，谢谢前置工作安装ollama,ollama官网地址安装完ollama后，打开cmd，下载模型(我选了个最小的模型，模型地址)ollamar
HTML5的新增标签有哪些？「已注销」 HTML5
2019-07-3009:46我们都知道，想要成为一名合格的前端开发人员，掌握好HTML5是一个重要的先决条件，相比较于HTML，HTML5中新增了许多功能标签，那么这么标签都有哪些呢？格式：定义文本的文本方向，使其脱离其周围文本的方向设置。定义有记号的文本。定义预定义范围内的度量。定义任何类型的任务的进度。定义若浏览器不支持ruby元素显示的内容。定义ruby注释的解释。定义ruby注释。定义日
MacOS Docker 安装指南 froginwe11 开发语言
MacOSDocker安装指南引言Docker是一个开源的应用容器引擎，它允许您将应用程序与基础设施分开，以此快速交付软件。Docker的核心思想是将应用程序及其依赖打包到一个可移植的容器中，然后发布到任何流行的Linux机器上，也可以实现虚拟化。本文将为您详细介绍如何在MacOS系统上安装Docker。安装Docker1.系统要求在开始安装Docker之前，请确保您的MacOS系统满足以下要求：
DeepSeek在linux下的安装部署与应用测试一望无际的大草原 deepseek 后端大模型部署 linux 大模型 deepseek
结合上一篇文章，本篇文章主要讲述在Redhatlinux环境下如何部署和使用DeepSeek大模型，主要包括ollama的安装配置、大模型的加载和应用测试。关于OpenWebUI在docker的安装部署，OpenWebUI官网也提供了完整的docker部署说明，大家可参考github，但对于OpenWebUI前后端分离的部署没有详细说明，这需要修改一部分前后端代码，后面会陆续分享给大家。ollam
观望=没有！郭顺发_ 博客经验分享
“兄弟，Java现在学还有前途吗？”“前端是不是饱和了？”——每天打开私信，这类问题能占大半。我的回复永远只有一句：“如果你非要等我说‘行’才敢行动，那答案已经不重要了。”#技术人总在纠结“能不能”一直在等权威认证有人私信问“学Java还能找到工作吗”，自己却从来没打开过招聘网站——实际上，2024年Java岗位仍占后端需求的百分之四五十。考虑技术风向新手在Vue/React/Svelte之间反复
正式开源：从 Greenplum 到 Cloudberry 迁移工具 cbcopy 发布 greenplum
Hi社区小伙伴们！酷克数据HashData正式宣布：大家期待已久的从Greenplum到Cloudberry数据迁移工具cbcopy正式开源啦！GitHub仓库：https://github.com/hashDataInc/cbcopy/从今日起，大家可以访问GitHub仓库，获取cbcopy源代码以及快速使用指南，期待大家积极反馈使用过程中遇到的问题、以及期待的新增功能与优化。背景随着Green
Meta放大招！首届生成式AI大会LlamaCon即将来袭人工智能大模型metaai开发
Meta宣布将于4月29日举办其首届生成式AI的开发者大会——LlamaCon。这一大会以Meta的生成式AI模型家族Llama命名，旨在分享Meta在开源AI领域的最新进展，帮助开发者构建出色的应用和产品。Meta表示，更多细节将在不久后公布。而Meta的年度开发者大会MetaConnect则仍将按惯例在9月举行。Meta的开源AI战略：从Llama到生态系统的构建几年前，Meta开始拥抱“开源
正式开源：使用Kafka FDW 加载数据到 Apache Cloudberry™ 数据库开源软件
ApacheCloudberry™(Incubating)由GreenplumDatabase核心开发者创建，是一款领先且成熟的开源大规模并行处理（MassivelyParallelProcessing，MPP）数据库。它基于开源版的PivotalGreenplumDatabase®衍生而来，但采用了更新的PostgreSQL内核，并具备更先进的企业级功能。Cloudberry可以作为数据仓库使用
22 FastAPI日志与监控安迪小宝 FastAPI python fastapi
在现代应用开发中，日志记录和监控是确保系统健康和可维护性的重要组成部分。FastAPI提供了内置的日志功能，而Prometheus和Grafana则是常见的开源监控工具组合，广泛用于应用性能监控和可视化。本文将介绍如何配置FastAPI的日志记录，并结合Prometheus和Grafana进行应用监控和数据可视化。1.配置FastAPI的日志记录1.1使用Python内置的logging模块Fas
Chameleon跨端框架——壹个理想主义团队的开源作品 weixin_34049032 javascript 前端 runtime ViewUI
文章较长，信息量很大，请耐心阅读，必然有收获。下面正文开始~背景解决方案原理久经考验生产应用举例易用性好多态协议学习成本低渐进式接入业内对比后期规划理想主义历经近20个月打磨，滴滴跨端方案chameleon终于开源了github.com/didi/chamel…,真正专注于一套代码运行多端。背景微信月活10亿月活（超过网民数量，用户多个账号？）、支付宝4亿月活、百度3.3亿月活；2018Q3中国A
插入表主键冲突做更新 a-john
有以下场景：用户下了一个订单，订单内的内容较多，且来自多表，首次下单的时候，内容可能会不全（部分内容不是必须，出现有些表根本就没有没有该订单的值）。在以后更改订单时，有些内容会更改，有些内容会新增。问题：如果在sql语句中执行update操作，在没有数据的表中会出错。如果在逻辑代码中先做查询，查询结果有做更新，没有做插入，这样会将代码复杂化。解决： mysql中提供了一个sql语
Android xml资源文件中@、@android:type、@*、？、@+含义和区别 Cb123456 @+@?@*
一.@代表引用资源 1.引用自定义资源。格式：@[package:]type/name android：text="@string/hello" 2.引用系统资源。格式：@android:type/name android:textColor="@android:color/opaque_red"
数据结构的基本介绍天子之骄数据结构散列表树、图线性结构价格标签
数据结构的基本介绍数据结构就是数据的组织形式，用一种提前设计好的框架去存取数据，以便更方便，高效的对数据进行增删查改。正确选择合适的数据结构，对软件程序的高效执行的影响作用不亚于算法的设计。此外，在计算机系统中数据结构的作用也是非同小可。例如常常在编程语言中听到的栈，堆等，就是经典的数据结构。经典的数据结构大致如下：一：线性数据结构 (1)：列表 a
通过二维码开放平台的API快速生成二维码一炮送你回车库 api
现在很多网站都有通过扫二维码用手机连接的功能，联图网(http://www.liantu.com/pingtai/)的二维码开放平台开放了一个生成二维码图片的Api,挺方便使用的。闲着无聊，写了个前台快速生成二维码的方法。 html代码如下:(二维码将生成在这div下) ? 1 &nbs
ImageIO读取一张图片改变大小 3213213333332132 java IO image BufferedImage
package com.demo; import java.awt.image.BufferedImage; import java.io.File; import java.io.IOException; import javax.imageio.ImageIO; /** * @Description 读取一张图片改变大小 * @author FuJianyon
myeclipse集成svn（一针见血） 7454103 eclipse SVN MyEclipse
&n
装箱与拆箱----autoboxing和unboxing darkranger J2SE
4.2　自动装箱和拆箱基本数据(Primitive)类型的自动装箱(autoboxing)、拆箱(unboxing)是自J2SE 5.0开始提供的功能。虽然为您打包基本数据类型提供了方便，但提供方便的同时表示隐藏了细节，建议在能够区分基本数据类型与对象的差别时再使用。 4.2.1　autoboxing和unboxing 在Java中，所有要处理的东西几乎都是对象(Object)
ajax传统的方式制作ajax aijuans Ajax
//这是前台的代码 <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <% String path = request.getContextPath(); String basePath = request.getScheme()+
只用jre的eclipse是怎么编译java源文件的？ avords java eclipse jdk tomcat
eclipse只需要jre就可以运行开发java程序了，也能自动编译java源代码，但是jre不是java的运行环境么，难道jre中也带有编译工具？还是eclipse自己实现的？谁能给解释一下呢问题补充：假设系统中没有安装jdk or jre，只在eclipse的目录中有一个jre，那么eclipse会采用该jre，问题是eclipse照样可以编译java源文件，为什么呢？ &nb
前端模块化 bee1314 模块化
背景：前端JavaScript模块化，其实已经不是什么新鲜事了。但是很多的项目还没有真正的使用起来，还处于刀耕火种的野蛮生长阶段。 JavaScript一直缺乏有效的包管理机制，造成了大量的全局变量，大量的方法冲突。我们多么渴望有天能像Java（import），Python (import)，Ruby(require)那样写代码。在没有包管理机制的年代，我们是怎么避免所
处理百万级以上的数据处理 bijian1013 oracle sql 数据库大数据查询
一.处理百万级以上的数据提高查询速度的方法： 1.应尽量避免在 where 子句中使用!=或<>操作符，否则将引擎放弃使用索引而进行全表扫描。 2.对查询进行优化，应尽量避免全表扫描，首先应考虑在 where 及 o
mac 卸载 java 1.7 或更高版本征客丶 java OS
卸载 java 1.7 或更高 sudo rm -rf /Library/Internet\ Plug-Ins/JavaAppletPlugin.plugin 成功执行此命令后，还可以执行 java 与 javac 命令 sudo rm -rf /Library/PreferencePanes/JavaControlPanel.prefPane 成功执行此命令后，还可以执行 java
【Spark六十一】Spark Streaming结合Flume、Kafka进行日志分析 bit1129 Stream
第一步，Flume和Kakfa对接，Flume抓取日志，写到Kafka中第二部，Spark Streaming读取Kafka中的数据，进行实时分析本文首先使用Kakfa自带的消息处理（脚本）来获取消息，走通Flume和Kafka的对接 1. Flume配置 1. 下载Flume和Kafka集成的插件，下载地址：https://github.com/beyondj2ee/f
Erlang vs TNSDL bookjovi erlang
TNSDL是Nokia内部用于开发电信交换软件的私有语言，是在SDL语言的基础上加以修改而成，TNSDL需翻译成C语言得以编译执行，TNSDL语言中实现了异步并行的特点，当然要完整实现异步并行还需要运行时动态库的支持，异步并行类似于Erlang的process（轻量级进程），TNSDL中则称之为hand，Erlang是基于vm(beam)开发，
非常希望有一个预防疲劳的java软件, 预防过劳死和眼睛疲劳,大家一起努力搞一个 ljy325 企业应用
　非常希望有一个预防疲劳的java软件，我看新闻和网站，国防科技大学的科学家累死了，太疲劳，老是加班，不休息，经常吃药，吃药根本就没用，根本原因是疲劳过度。我以前做java,那会公司垃圾，老想赶快学习到东西跳槽离开，搞得超负荷，不明理。深圳做软件开发经常累死人，总有不明理的人，有个软件提醒限制很好，可以挽救很多人的生命。相关新闻：（1）IT行业成五大疾病重灾区：过劳死平均37.9岁
读《研磨设计模式》-代码笔记-原型模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * Effective Java 建议使用copy constructor or copy factory来代替clone()方法： * 1.public Product copy(Product p){} * 2.publi
配置管理---svn工具之权限配置 chenyu19891124 SVN
今天花了大半天的功夫，终于弄懂svn权限配置。下面是今天收获的战绩。安装完svn后就是在svn中建立版本库，比如我本地的是版本库路径是C:\Repositories\pepos。pepos是我的版本库。在pepos的目录结构 pepos component webapps 在conf里面的auth里赋予的权限配置为 [groups]
浅谈程序员的数学修养 comsci 设计模式编程算法面试招聘
浅谈程序员的数学修养
批量执行 bulk collect与forall用法 daizj oracle sql bulk collect forall
BULK COLLECT 子句会批量检索结果，即一次性将结果集绑定到一个集合变量中，并从SQL引擎发送到PL/SQL引擎。通常可以在SELECT INTO、 FETCH INTO以及RETURNING INTO子句中使用BULK COLLECT。本文将逐一描述BULK COLLECT在这几种情形下的用法。有关FORALL语句的用法请参考：批量SQL之 F
Linux下使用rsync最快速删除海量文件的方法 dongwei_6688 OS
1、先安装rsync：yum install rsync 2、建立一个空的文件夹：mkdir /tmp/test 3、用rsync删除目标目录：rsync --delete-before -a -H -v --progress --stats /tmp/test/ log/这样我们要删除的log目录就会被清空了，删除的速度会非常快。rsync实际上用的是替换原理，处理数十万个文件也是秒删。
Yii CModel中rules验证规格 dcj3sjt126com rules yii validate
Yii cValidator主要用法分析： yii验证rulesit 分类： Yii yii的rules验证 cValidator主要属性 attributes ,builtInValidators,enableClientValidation,message,on,safe,skipOnError
基于vagrant的redis主从实验 dcj3sjt126com vagrant
平台: Mac 工具: Vagrant 系统: Centos6.5 实验目的: Redis主从实现思路制作一个基于sentos6.5, 已经安装好reids的box, 添加一个脚本配置从机, 然后作为后面主机从机的基础box 制作sentos6.5+redis的box mkdir vagrant_redis cd vagrant_
Memcached(二)、Centos安装Memcached服务器 frank1234 centos memcached
一、安装gcc rpm和yum安装memcached服务器连接没有找到，所以我使用的是make的方式安装，由于make依赖于gcc，所以要先安装gcc 开始安装，命令如下，[color=red][b]顺序一定不能出错[/b][/color]：建议可以先切换到root用户，不然可能会遇到权限问题：su root 输入密码...... rpm -ivh kernel-head
Remove Duplicates from Sorted List hcx2013 remove
Given a sorted linked list, delete all duplicates such that each element appear only once. For example,Given 1->1->2, return 1->2.Given 1->1->2->3->3, return&
Spring4新特性——JSR310日期时间API的支持 jinnianshilongnian spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
浅谈enum与单例设计模式 247687009 java 单例
在JDK1.5之前的单例实现方式有两种(懒汉式和饿汉式并无设计上的区别故看做一种)，两者同是私有构造器，导出静态成员变量，以便调用者访问。第一种 package singleton; public class Singleton { //导出全局成员 public final static Singleton INSTANCE = new S
使用switch条件语句需要注意的几点 openwrt c break switch
1. 当满足条件的case中没有break，程序将依次执行其后的每种条件（包括default）直到遇到break跳出 int main() { int n = 1; switch(n) { case 1: printf("--1--\n"); default: printf("defa
配置Spring Mybatis JUnit测试环境的应用上下文 schnell18 spring mybatis JUnit
Spring-test模块中的应用上下文和web及spring boot的有很大差异。主要试下来差异有：单元测试的app context不支持从外部properties文件注入属性 @Value注解不能解析带通配符的路径字符串解决第一个问题可以配置一个PropertyPlaceholderConfigurer的bean。第二个问题的具体实例是：
Java 定时任务总结一 tuoni java spring timer quartz timertask
Java定时任务总结一.从技术上分类大概分为以下三种方式： 1.Java自带的java.util.Timer类，这个类允许你调度一个java.util.TimerTask任务; 说明： java.util.Timer定时器，实际上是个线程，定时执行TimerTask类 &
一种防止用户生成内容站点出现商业广告以及非法有害等垃圾信息的方法 yangshangchuan rank 相似度计算文本相似度词袋模型余弦相似度
本文描述了一种在ITEYE博客频道上面出现的新型的商业广告形式及其应对方法，对于其他的用户生成内容站点类型也具有同样的适用性。最近在ITEYE博客频道上面出现了一种新型的商业广告形式，方法如下： 1、注册多个账号（一般10个以上）。 2、从多个账号中选择一个账号，发表1-2篇博文

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他