飞向天空的鹰

python从PDF文件中爬取表格数据 - camelot

简介

camelot是Python的一个模块，它能够让任何人轻松地从PDF文件中提取表格数据。

（安装时间较长）：pip install camelot-py

camelot模块的官方文档地址为：https://camelot-py.readthedocs.io/en/master/

案例

首先，让我们看一个简单的例子：eg.pdf，整个文件只有一页，这一页中只有一个表格，如下：

使用以下Python代码就可以提取该PDF文件中的表格：

import camelot

# 从PDF文件中提取表格
tables = camelot.read_pdf('E://eg.pdf', pages='1', flavor='stream')

# 表格信息
print(tables)
print(tables[0])
# 表格数据
print(tables[0].data)

输出结果为：



[['ID', '姓名', '城市', '性别'], ['1', 'Alex', 'Shanghai', 'M'], ['2', 'Bob', 'Beijing', 'F'], ['3', 'Cook', 'New York', 'M']]分析代码
camelot.read_pdf()  为camelot的从表格中提取数据的函数，输入的参数为PDF文件的路径，页码（pages）和表格解析方法（有stream和lattice两个方法）。
对于表格解析方法，默认的方法为lattice，而stream方法默认会把整个PDF页面当做一个表格来解析，如果需要指定解析页面中的区域，可以使用table_area这个参数。
 
camelot模块的便捷之处还在于它提供了将提取后的表格数据直接转化为pandas，csv，JSON，html的函数，如tables[0].df，tables[0].to_csv()函数等
我们以输出csv文件为例：
import camelot

# 从PDF文件中提取表格
tables = camelot.read_pdf('E://eg.pdf', pages='1', flavor='stream')

# 将表格数据转化为csv文件
tables[0].to_csv('E://eg.csv')
得到的csv文件如下：
 
例2，提取PDF页面中的某一区域的表格的数据。
为了提取整个页面中唯一的表格，我们需要定位表格所在的位置。
PDF文件的坐标系统与图片不一样，它以左下角的顶点为原点，向右为x轴，向上为y轴，可以通过以下Python代码输出整个页面的文字的坐标情况：
import camelot

# 识别指定区域中的表格数据
tables = camelot.read_pdf('G://Statistics-Fundamentals-Succinctly.pdf', pages='53', \
                          flavor='stream', table_area=['50,620,500,540'])

# 绘制PDF文档的坐标，定位表格所在的位置
table_df = tables[0].df

print(type(table_df))
print(table_df.head(n=6))
stream方法默认将整个PDF页面当作表格
table_area参数则是确定表格具体位置
结果：

         0               1                2           3
0  Student  Pre-test score  Post-test score  Difference
1        1              70               73           3
2        2              64               65           1
3        3              69               63          -6
4        …               …                …           …
5       34              82               88           6
 

                    
                        
                        
                             
                        
                        
                        
                            
                        
                        
                        
                            
                        
                    
                

        你可能感兴趣的:(扩展知识,python学习)
        
            
                
                    Python vars() 函数：探索对象的内部
                        程序员喵哥
Pythonpython开发语言
                        更多Python学习内容：ipengtao.comPython是一门具有强大而灵活的编程语言，可以访问和探索对象的内部属性。vars()函数是Python标准库中的一个强大工具，它可以获取对象的属性和属性值，并以字典的形式返回它们。在本文中，将深入研究vars()函数，探讨它的用途、示例和适用场景。前言在Python中，对象是一切。对象可以是数字、字符串、列表、字典、函数、类实例等等。每个对象都可
                    
                    python学习试题（选择，问答，代码等）
                        爱莉希雅&&&
python学习开发语言
                        python选择题（1）以下哪个是合法的Python变量名？[email protected]答案：B（2）表达式True+2的结果是？A.TrueB.3C.2D.TypeError答案：B（3）以下哪个表达式会引发错误？A."1"+"2"B.[1,2]+[3,4]C.(1,2)+(3,4)D.{1,2}+{3,4}答案：D（4）以下哪个是将字符串转换为整数的正确方法？A.str
                    
                    python 元类的继承_Python学习_13_继承和元类
                        五伤先生
python元类的继承
                        继承继承的含义就是子类继承父类的命名空间，子类中可以调用父类的属性和方法，由于命名空间的查找方式，当子类中定义和父类同名属性或者方法时，子类的实例调用的是子类中的属性，而不是父类，这就形成了python中的多态：defSuperClass:defa_method:passdefSubClass(SuperClass):defa_method:passobj=SubClass()obj.a_meth
                    
                    Python元类基础知识示例深度剖析，从新手小白成为Python编程高手
                        只存在于虚拟的King
python开发语言深度学习学习经验分享计算机网络程序人生
                        文章目录引言一、什么是元类？二、元类的工作原理三、如何定义元类四、元类的应用场景五、元类的注意事项六、结论关于Python技术储备一、Python所有方向的学习路线二、Python基础学习视频三、精品Python学习书籍四、Python工具包+项目源码合集①Python工具包②Python实战案例③Python小游戏源码五、面试资料六、Python兼职渠道引言Python是一种强大的编程语言，一部
                    
                    前端技术博客汇总文档
                        长路 ㅤ   
文章目录汇总前端技术HTML5CSS3JavaScriptVue.js
                        文章目录前言前端技术博客汇总链接基础知识点HTMLCSSJavaScript基础语法ES6语法扩展知识点Ajax&Fetch与跨域请求Canvas模块化WebpackNode.jsvite框架与实战VueVue.jsVue-routerVuexvue-cli(脚手架)微信小程序性能提升开源生态组件使用资料获取前言博主介绍：✌目前全网粉丝4W+，csdn博客专家、Java领域优质创作者，博客之星、阿
                    
                    Python学习打卡：day09
                        胜天半子祁厅
Pythonpython学习开发语言
                        day9笔记来源于：黑马程序员python教程，8天python从入门到精通，学python看这套就够了目录day964、字典课后习题65、5类数据容器的总结对比数据容器分类数据容器特点对比66、数据容器的通用操作遍历统计len、max和min转换list(容器)、tuple(容器)、str(容器)、set(容器)排序容器通用功能总览67、拓展——字符串的大小比较ASCII码表字符串比较68、函数
                    
                    Python学习打卡：day02
                        

                        day2笔记来源于：黑马程序员python教程，8天python从入门到精通，学python看这套就够了目录day28、字符串的三种定义方式字符串在Python中有多种定义形式字符串的引号嵌套9、字符串的拼接10、字符串格式化11、格式化的精度控制12、字符串格式化的方式213、对表达式进行格式化14、字符串格式化的课后练习题15、数据输入（input语句）input语句（函数）input语句获取
                    
                    新手必看的python学习心得
                        2401_89815407
python开发语言
                        Python学习心得：从入门到实践的体会Python作为一门简洁高效的编程语言，其学习过程充满趣味与挑战。通过系统学习与实践，总结出以下关键经验与感悟。Python新手常见代码问题及解决方法Python作为一门易学易用的编程语言，吸引了大量初学者。然而新手在学习过程中常会遇到一些典型问题。以下是常见问题及解决方案。缩进错误Python使用缩进区分代码块，新手容易混淆缩进方式或忘记缩进。正确做法是统
                    
                    Python学习笔记2-垃圾回收机制
                        Carrie_Lei
Pythonpython学习笔记
                        Python的垃圾回收机制是自动管理内存的系统，用于回收不再使用的内存，以避免内存泄漏和优化内存使用。Python使用引用计数（ReferenceCounting）和垃圾回收（GarbageCollection）两种方式来管理内存。1.引用计数(ReferenceCounting)引用计数是Python内存管理的基础机制。每个对象都维护一个引用计数器，记录有多少个引用指向该对象。当一个新的引用指向
                    
                    AI编程基础：学习Python是进入AI领域的必经之路（文末含学习路线与知识推荐）
                        Clf丶忆笙
AI人工智能开发全栈教程学习python人工智能ai
                        文章目录Python市场行情：AI开发的首选语言为什么学习Python对AI至关重要AI开发所需的Python知识体系Python编程基础科学计算与数据处理机器学习与深度学习性能优化与并行计算Python学习路线推荐阶段一：Python编程基础（1-2个月）阶段二：科学计算与数据处理（1-2个月）阶段三：机器学习基础（2-3个月）阶段四：深度学习与AI专项（3-6个月）阶段五：进阶与专项深化（持续
                    
                    python学习之路 - python的文件操作
                        

                        目录一、python文件操作1、文件的编码a、概念b、编码分类2、文件的读取a、打开文件a、读取文件字节c、读取文件行d、for循环的读取3、文件的关闭4、文件的写入5、文件的追加6、文件操作综合a、案例一：读取字符个数b、案例二：复制文件一、python文件操作1、文件的编码a、概念计算机只能识别0和1，所以需要用编码技术将内容翻译成0和1b、编码分类UTF-8除非有特殊要求，否则一般都用此编码
                    
                    Python：数学，排列组合，可重复的组合。
                        好开心啊没烦恼
数学python数据分析数据挖掘开发语言
                        目录1示例代码2欢迎纠错3论文写作/Python学习智能体1示例代码  直接上代码。deftest1():"""有“a/b/c/d/e”五个字符用以组成八位字符串，可完全重复如“aaaaaaaa”，也可部分重复如“aaaabcde”。将“aaaabcde”和“bcdeaaaa”、“bacadaea”视作一种组合。问：这样的组合一共有多少种？""""""问题定性：可重复的组合。首先是个组合问题，因为
                    
                    易语言 数据分析小实例：数人头。用到：易数据库
                        好开心啊没烦恼
易语言数据分析数据库数据挖掘开发语言
                        目录（不如Python方便，已弃用易语言，但以“易语言”为工具的朋友可作参考。已测试通过。）------0需求1直接操作Excel表2易语言实现2.1导库2.2处理小插曲3欢迎纠错4论文写作/Python学习智能体------以下关于Markdown编辑器新的改变功能快捷键合理的创建标题，有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内
                    
                    【Python学习】可视化图表-使用matplotlib绘制不同种类散点图
                        西攻城狮北
Python实用案例python学习matplotlib可视化图形
                        一、引言在数据可视化领域，散点图是一种极其强大的工具，它能够直观地展示变量之间的关系、数据分布的模式以及潜在的聚类情况等。通过散点图，我们可以轻松地发现数据中的异常值、相关性以及其他隐藏的特征。Python的matplotlib库提供了丰富而灵活的功能，可以帮助我们绘制出各种类型的散点图，以满足不同的数据分析和展示需求。本文将深入探讨如何使用matplotlib绘制多种类型的散点图，并提供详细的代
                    
                    python系列教程246——多态
                        人工智能AI技术
python系列教程python开发语言
                        朋友们，如需转载请标明出处：https://blog.csdn.net/jiangjunshow声明：在人工智能技术教学期间，不少学生向我提一些python相关的问题，所以为了让同学们掌握更多扩展知识更好地理解AI技术，我让助理负责分享这套python系列教程，希望能帮到大家！由于这套python教程不是由我所写（有时候有空也会参与编写），所以不如我的人工智能教程风趣幽默，学起来比较枯燥；但它的知
                    
                    数据分析案例-全球表面温度数据可视化与统计分析
                        艾派森
数据分析信息可视化python数据分析数据挖掘
                        ‍♂️个人主页：@艾派森的个人主页✍作者简介：Python学习者希望大家多多支持，我们一起进步！如果文章对你有帮助的话，欢迎评论点赞收藏加关注+目录1.项目背景2.数据集介绍
                    
                    python学习记录14
                        彤银浦
学习python
                        1.字符串的编码和解码不同的计算机之间在信道中传输的信息本质上是二进制数据，因此当你有一串文本需要传输给另外一台电脑时，则需要将这串文本编译为二进制类型的数据。python中的二进制数据类型称为byte类型。将字符串的str类型转变为byte类型称为字符串的编码，将byte类型转变为str类型称为字符串的解码。字符串的编码用到的是encode的方法，语法格式为：string.encode(enco
                    
                    Python学习打卡：day13
                        胜天半子祁厅
Pythonpython学习java
                        day13笔记来源于：黑马程序员python教程，8天python从入门到精通，学python看这套就够了目录day1397、初识对象98、类的成员方法类的定义和使用成员变量和成员方法成员方法的定义语法99、类和对象在程序中通过类来描述基于类创建对象100、构造方法课后练习101、魔术方法\_\_str\_\_字符串方法\_\_lt\_\_小于符号比较方法\_\_le\_\_小于等于比较符号方法\
                    
                    python中的高级变量III
                        hbwhmama
python学习python开发语言
                        python中的高级变量III删除列表元素（list）扩展知识点name_list=["Mike","John","Alice"]delname_list[1]#通过delname_list[1]删除“John”print(name_list)#输出['Mike','Alice']注意：del本质上会从内存中删除数据，所以平时要删除列表元素时，建议使用列表提供的方法pop、remove、clear
                    
                    python学习笔记（深度学习）
                        天水幼麟
python学习笔记
                        文章目录1、概述2、学习内容2.1、pytorch常见语法2.1.1、sum2.1.2、广播机制2.1.3、张量1、概述本篇博客用来记录，在深度学习过程中，常用的python语法内容2、学习内容2.1、pytorch常见语法2.1.1、sum在PyTorch中，torch.sum()是一个非常常用的函数，用于对张量（Tensor）进行求和操作。它的核心作用是沿着指定的维度对张量元素进行累加，支持灵
                    
                    Python学习之——装饰器
                        selfsongs
Python学习记录python学习开发语言
                        Python学习之——装饰器参考基础闭包概念装饰器系统自带的装饰器@property@staticmethod@classmethod自定义装饰器函数的装饰器无参数有参数类的装饰器无参数有参数@functools.wraps装饰器类装饰器实现单例模式参考python装饰器的4种类型：函数装饰函数、函数装饰类、类装饰函数、类装饰类9.4定义一个带参数的装饰器Python–在装饰器中获取原始函数参数基
                    
                    Python学习Day42
                        m0_64472246
python打卡学习python
                        学习来源：@浙大疏锦行defhandle_result(result):"""处理计算结果的回调函数"""print(f"计算结果是:{result}")defcalculate(a,b,callback):"""这个函数接受两个数值和一个回调函数，用于处理计算结果。执行计算并调用回调函数"""result=a+bcallback(result)calculate(3,5,handle_resul
                    
                    Python学习Day33
                        m0_64472246
python打卡学习python
                        学习来源：浙大疏锦行一、PyTorch和CUDA的安装：给电脑装“超级计算器”通俗解释PyTorch：是一个专门用于深度学习的“工具箱”，类似程序员的“智能积木”，能快速搭建神经网络。CUDA：是NVIDIA显卡的“加速引擎”，相当于给电脑的显卡装了一个“超级计算器”，让它能快速计算复杂的数学问题（如图像识别、数据训练）。安装逻辑：先装CUDA（显卡的“计算器驱动”），再装PyTorch（用这个计
                    
                    Python学习Day29
                        m0_64472246
python打卡学习学习
                        学习来源：@浙大疏锦行类装饰器是Python中用于动态修改或增强类定义的高级工具，其核心在于接收一个类作为输入并返回一个新类，从而在不修改原始类代码的前提下扩展功能。以下是类装饰器的系统解析：一、类装饰器的核心机制基本结构类装饰器是一个高阶函数，接收类参数cls，通过继承或直接修改返回新类：defclass_decorator(cls):classWrappedClass(cls):#继承原始类d
                    
                    Python学习Day10
                        m0_64472246
python打卡学习python
                        学习来源：@浙大疏锦行知识点：数据集的划分机器学习模型建模的三行代码机器学习模型分类问题的评估对心脏病数据集采用机器学习模型建模和评估importpandasaspdfile_path="heart.csv"data=pd.read_csv(file_path)data.info()data.isnull().sum()#划分训练集和测试机fromsklearn.model_selectionim
                    
                    Python学习Day14
                        m0_64472246
python学习开发语言
                        学习来源：@浙大疏锦行SHAP（SHapleyAdditiveexPlanations）库是一个用于解释机器学习模型预测结果的开源Python库。**一、核心概念**1.**Shapley值***它来源于合作博弈论。在机器学习模型解释的语境下，可以这样理解：对于一个模型的预测结果，每个特征都看作是一个“玩家”，模型的输出是这些“玩家”合作的结果。Shapley值表示每个特征对预测结果的平均边际贡献
                    
                    Python学习Day34
                        m0_64472246
python打卡学习python
                        学习来源：@浙大疏锦行优化耗时：importtorchimporttorch.nnasnnimporttorch.optimasoptimfromsklearn.datasetsimportload_irisfromsklearn.model_selectionimporttrain_test_splitfromsklearn.preprocessingimportMinMaxScalerimpo
                    
                    Python学习—10大高阶调试方法！
                        第⑦颗VC小铁树
python学习数据库开发语言数据分析ipython
                        在Python开发过程中，调试是一项核心技能。无论是初级开发者还是资深工程师，掌握高效的调试技巧都能显著提升开发效率。本文将介绍10个实用的调试方法，帮助开发者更有效地定位和解决问题。包含编程资料、学习路线图、源代码、软件安装包等！【[点击这里]】！1、Python内置调试器pdb的应用Python的内置调试器pdb是一个功能强大的调试工具。它能够在程序执行过程中设置断点，检查变量状态，并支持单步
                    
                    Python学习Day40
                        m0_64472246
python打卡学习python
                        学习来源：@浙大疏锦行importtorchimporttorch.nnasnnimporttorch.optimasoptimfromtorchvisionimportdatasets,transformsfromtorch.utils.dataimportDataLoaderimportmatplotlib.pyplotaspltimportnumpyasnp##设置中文字体支持plt.rcP
                    
                    python25-递归算法
                        文人sec
python自动化算法python
                        课程：B站大学记录python学习，直到学会基本的爬虫，使用python搭建接口自动化测试就算学会了，在进阶webui自动化，app自动化递归算法递归的基本原则递归的使用作业小tips：斐波那契数列阶乘快速排序实践是检验真理的唯一标准递归的基本原则递归函数通常遵循以下原则：定义基本情况确定一个或多个输入的特殊情况，当满足这些条件时，递归函数将直接返回结果而不再调用自身。减小问题规模通过调用自身来解
                    
                                java杨辉三角
                                    3213213333332132
java基础
                                    
package com.algorithm;

/**
 * @Description 杨辉三角
 * @author FuJianyong
 * 2015-1-22上午10:10:59
 */
public class YangHui {
	public static void main(String[] args) {
		//初始化二维数组长度
		int[][] y
                                
                                《大话重构》之大布局的辛酸历史
                                    白糖_
重构
                                    《大话重构》中提到“大布局你伤不起”，如果企图重构一个陈旧的大型系统是有非常大的风险，重构不是想象中那么简单。我目前所在公司正好对产品做了一次“大布局重构”，下面我就分享这个“大布局”项目经验给大家。 
  
 
 背景 
 
        公司专注于企业级管理产品软件，企业有大中小之分，在2000年初公司用JSP/Servlet开发了一套针对中
                                
                                电驴链接在线视频播放源码
                                    dubinwei
源码电驴播放器视频ed2k
                                    本项目是个搜索电驴（ed2k）链接的应用,借助于磁力视频播放器（官网： 
http://loveandroid.duapp.com/ 开放平台），可以实现在线播放视频，也可以用迅雷或者其他下载工具下载。 
项目源码： 
http://git.oschina.net/svo/Emule,动态更新。也可从附件中下载。 
项目源码依赖于两个库项目，库项目一链接： 
http://git.oschina.
                                
                                Javascript中函数的toString()方法
                                    周凡杨
JavaScriptjstoStringfunctionobject
                                    简述 
    The toString() method returns a string representing the source code of the function. 
    简译之，Javascript的toString()方法返回一个代表函数源代码的字符串。 
句法 
    function.
                                
                                struts处理自定义异常
                                    g21121
struts
                                    很多时候我们会用到自定义异常来表示特定的错误情况，自定义异常比较简单，只要分清是运行时异常还是非运行时异常即可，运行时异常不需要捕获，继承自RuntimeException，是由容器自己抛出，例如空指针异常。 
非运行时异常继承自Exception，在抛出后需要捕获，例如文件未找到异常。 
此处我们用的是非运行时异常，首先定义一个异常LoginException: 
/**
 * 类描述：登录相
                                
                                Linux中find常见用法示例
                                    510888780
linux
                                    Linux中find常见用法示例 
 
·find   path   -option   [   -print ]   [ -exec   -ok   command ]   {} \; 
 
 
 
 
find命令的参数；
                                
                                SpringMVC的各种参数绑定方式
                                    Harry642
springMVC绑定表单
                                    1. 基本数据类型(以int为例，其他类似)： 
Controller代码： 
 

    @RequestMapping("saysth.do")
    public void test(int count) {
    }
 
表单代码： 
 

<form action="saysth.do" method="post&q
                                
                                Java 获取Oracle ROWID
                                    aijuans
javaoracle
                                      
A ROWID is an identification tag unique for each row of an Oracle Database table. The ROWID can be thought of as a virtual column, containing the ID for each row. 
The oracle.sql.ROWID class i
                                
                                java获取方法的参数名
                                    antlove
javajdkparametermethodreflect
                                    reflect.ClassInformationUtil.java 
package reflect;

import javassist.ClassPool;
import javassist.CtClass;
import javassist.CtMethod;
import javassist.Modifier;
import javassist.bytecode.CodeAtt
                                
                                JAVA正则表达式匹配 查找 替换 提取操作
                                    百合不是茶
java正则表达式替换提取查找
                                    正则表达式的查找;主要是用到String类中的split(); 
      String str; 
     str.split();方法中传入按照什么规则截取,返回一个String数组 
  
常见的截取规则: 
str.split("\\.")按照.来截取

str.
                                
                                Java中equals()与hashCode()方法详解
                                    bijian1013
javasetequals()hashCode()
                                    一.equals()方法详解 
    equals()方法在object类中定义如下：  
public boolean equals(Object obj) {
    return (this == obj);
}
 
   很明显是对两个对象的地址值进行的比较（即比较引用是否相同）。但是我们知道，String 、Math、I
                                
                                精通Oracle10编程SQL(4)使用SQL语句
                                    bijian1013
oracle数据库plsql
                                    --工资级别表
create table SALGRADE
(
  GRADE    NUMBER(10),
  LOSAL    NUMBER(10,2),
  HISAL    NUMBER(10,2)
)

insert into SALGRADE values(1,0,100);
insert into SALGRADE values(2,100,200);
inser
                                
                                【Nginx二】Nginx作为静态文件HTTP服务器
                                    bit1129
HTTP服务器
                                     Nginx作为静态文件HTTP服务器 
 
  在本地系统中创建/data/www目录，存放html文件(包括index.html) 
 创建/data/images目录，存放imags图片 
 在主配置文件中添加http指令 
 
  
http {
    server {
        listen       80;
        server_name  
                                
                                kafka获得最新partition offset
                                    blackproof
kafkapartitionoffset最新
                                    kafka获得partition下标，需要用到kafka的simpleconsumer 
  
import java.util.ArrayList;
import java.util.Collections;
import java.util.Date;
import java.util.HashMap;
import java.util.List;
import java.
                                
                                centos 7安装docker两种方式
                                    ronin47

                                          第一种是采用yum 方式 
             yum install -y docker 
          
                                
                                java-60-在O(1)时间删除链表结点
                                    bylijinnan
java
                                    

public class DeleteNode_O1_Time {

	/**
	 * Q 60 在O(1)时间删除链表结点
	 * 给定链表的头指针和一个结点指针(!!)，在O(1)时间删除该结点
	 * 
	 * Assume the list is:
	 * head->...->nodeToDelete->mNode->nNode->..
                                
                                nginx利用proxy_cache来缓存文件
                                    cfyme
cache
                                    user  zhangy users;
worker_processes 10;
error_log  /var/vlogs/nginx_error.log  crit;
pid        /var/vlogs/nginx.pid;
#Specifies the value for ma
                                
                                [JWFD开源工作流]JWFD嵌入式语法分析器负号的使用问题
                                    comsci
嵌入式
                                     
    假如我们需要用JWFD的语法分析模块定义一个带负号的方程式，直接在方程式之前添加负号是不正确的，而必须这样做： 
 
    string str01 = "a=3.14;b=2.71;c=0;c-((a*a)+(b*b))" 
 
    定义一个0整数c,然后用这个整数c去
                                
                                如何集成支付宝官方文档
                                    dai_lm
android
                                    官方文档下载地址 
 
https://b.alipay.com/order/productDetail.htm?productId=2012120700377310&tabId=4#ps-tabinfo-hash 
 
集成的必要条件 
1. 需要有自己的Server接收支付宝的消息 
2. 需要先制作app，然后提交支付宝审核，通过后才能集成 
 
调试的时候估计会真的扣款，请注意 

                                
                                应该在什么时候使用Hadoop
                                    datamachine
hadoop
                                    原帖地址：http://blog.chinaunix.net/uid-301743-id-3925358.html 
 
存档，某些观点与我不谋而合，过度技术化不可取，且hadoop并非万能。 
 
--------------------------------------------万能的分割线-------------------------------- 
有人问我，“你在大数据和Hado
                                
                                在GridView中对于有外键的字段使用关联模型进行搜索和排序
                                    dcj3sjt126com
yii
                                    在GridView中使用关联模型进行搜索和排序 
首先我们有两个模型它们直接有关联:   
class Author extends CActiveRecord {
...
}
 
class Post extends CActiveRecord {
...
    function relations() {
        return array(
            '
                                
                                使用NSString 的格式化大全
                                    dcj3sjt126com
Objective-C
                                    格式定义The format specifiers supported by the NSString formatting methods and CFString formatting functions follow the IEEE printf specification; the specifiers are summarized in Table 1. Note that you c
                                
                                使用activeX插件对象object滚动有重影
                                    蕃薯耀
activeX插件滚动有重影
                                        
使用activeX插件对象object滚动有重影       <object style="width:0;" id="abc" classid="CLSID:D3E3970F-2927-9680-BBB4-5D0889909DF6" codebase="activex/OAX339.CAB#
                                
                                SpringMVC4零配置
                                    hanqunfeng
springmvc4
                                    基于Servlet3.0规范和SpringMVC4注解式配置方式，实现零xml配置，弄了个小demo，供交流讨论。 
  
  
项目说明如下： 
1.db.sql是项目中用到的表，数据库使用的是oracle11g 
2.该项目使用mvn进行管理，私服为自搭建nexus,项目只用到一个第三方 jar，就是oracle的驱动； 
3.默认项目为零配置启动，如果需要更改启动方式，请
                                
                                《开源框架那点事儿16》：缓存相关代码的演变
                                    j2eetop
开源框架
                                    问题引入 
上次我参与某个大型项目的优化工作，由于系统要求有比较高的TPS，因此就免不了要使用缓冲。 
该项目中用的缓冲比较多，有MemCache，有Redis，有的还需要提供二级缓冲，也就是说应用服务器这层也可以设置一些缓冲。 
当然去看相关实现代代码的时候，大致是下面的样子。    
[java] 
view plain 
copy 
print 
?   
 
 public vo
                                
                                AngularJS浅析
                                    kvhur
JavaScript
                                    概念 
 
 AngularJS is a structural framework for dynamic web apps. 
 了解更多详情请见原文链接：http://www.gbtags.com/gb/share/5726.htm 
 Directive 
扩展html，给html添加声明语句，以便实现自己的需求。对于页面中html元素以ng为前缀的属性名称，ng是angular的命名空间
                                
                                架构师之jdk的bug排查(一)---------------split的点号陷阱
                                    nannan408
split
                                    1.前言. 
   jdk1.6的lang包的split方法是有bug的,它不能有效识别A.b.c这种类型,导致截取长度始终是0.而对于其他字符,则无此问题.不知道官方有没有修复这个bug. 
2.代码 
 

String[] paths = "object.object2.prop11".split("'");
System.ou
                                
                                如何对10亿数据量级的mongoDB作高效的全表扫描
                                    quentinXXZ
mongodb
                                      本文链接: 
http://quentinXXZ.iteye.com/blog/2149440  
一、正常情况下，不应该有这种需求 
首先，大家应该有个概念，标题中的这个问题，在大多情况下是一个伪命题，不应该被提出来。要知道，对于一般较大数据量的数据库，全表查询，这种操作一般情况下是不应该出现的，在做正常查询的时候，如果是范围查询，你至少应该要加上limit。 
说一下，
                                
                                C语言算法之水仙花数
                                    qiufeihu
c算法
                                    /**
* 水仙花数
*/
#include <stdio.h>
#define N 10
int main()
{
    int x,y,z;
    for(x=1;x<=N;x++)
    	for(y=0;y<=N;y++)
    		for(z=0;z<=N;z++)
    			if(x*100+y*10+z == x*x*x
                                
                                JSP指令
                                    wyzuomumu
jsp
                                     
 jsp指令的一般语法格式： <%@ 指令名 属性 =”值 ” %> 
  常用的三种指令： page,include,taglib 
 page指令语法形式： <%@ page 属性 1=”值 1” 属性 2=”值 2”%> 
 include指令语法形式： <%@include file=”relative url”%> (jsp可以通过 include
                                
                
            
        
    

    
        
            按字母分类：
            ABCDEFGHIJKLMNOPQRSTUVWXYZ其他
        
    

    
        
            首页 -
            关于我们 -
            站内搜索 -
            Sitemap -
            侵权投诉
        
        版权所有 IT知识库 CopyRight © 2000-2050 E-COM-NET.COM , All Rights Reserved.