闲人编程

Pandas使用教程 - Pandas 与 Parquet 数据交互

目录

进阶篇46. Pandas 与 Parquet 数据交互
- 1. Parquet 格式简介
- 2. 使用 Pandas 读取 Parquet 数据
- - 2.1 基本用法
  - 2.2 参数说明
- 3. 使用 Pandas 写入 Parquet 数据
- - 3.1 基本用法
  - 3.2 参数说明
- 4. 依赖库与性能优化
- - 4.1 依赖库
  - 4.2 性能优化策略
- 5. 实际案例：从 Parquet 文件加载与存储股票数据
- 6. 总结
- 7. 参考资料

进阶篇46. Pandas 与 Parquet 数据交互

Parquet 是一种开源的列式存储文件格式，因其高效的压缩和编码技术而在大数据处理中备受青睐。相比传统的 CSV 或 Excel 格式，Parquet 能够显著降低磁盘空间占用，并加速数据的读取和查询。Pandas 从 0.21 版本开始内置支持 Parquet 文件的读写操作，通过 to_parquet() 和 read_parquet() 方法，我们可以方便地将 DataFrame 转换为 Parquet 格式，或者从 Parquet 文件中加载数据进行进一步分析。

本文将详细介绍 Pandas 与 Parquet 数据交互的核心原理、方法和最佳实践，内容包括：

Parquet 格式简介
使用 Pandas 读取 Parquet 数据
使用 Pandas 写入 Parquet 数据
依赖库与性能优化
实际案例和应用场景

1. Parquet 格式简介

Parquet 是一种列式存储格式，具有以下主要特点：

高效压缩：列式存储使得相同类型的数据聚集在一起，能够更好地利用压缩算法，从而减少存储空间。
快速查询：由于数据按列存储，查询时可以只加载需要的列，提高 I/O 效率。
跨平台支持：Parquet 被广泛支持于 Hadoop、Spark、Dask 等大数据处理框架，是现代数据仓库和数据湖中常用的格式。

数学上，可以将一个 Parquet 文件视为一个矩阵：
$\{ x_{ij} \}_{i=1,\dots,m}^{j=1,\dots,n}$
其中 ( m ) 为行数，( n ) 为列数。列式存储的优势在于可以对每一列单独进行高效的压缩和查询。

2. 使用 Pandas 读取 Parquet 数据

2.1 基本用法

Pandas 提供了 read_parquet() 方法，可以直接从 Parquet 文件中加载数据为 DataFrame。示例如下：

import pandas as pd

# 从 Parquet 文件中读取数据，假设文件路径为 'data/sample.parquet'
df = pd.read_parquet('data/sample.parquet')
print("读取到的 DataFrame 预览：")
print(df.head())

2.2 参数说明

path：Parquet 文件的路径，支持本地文件和远程路径（需额外配置）。
engine：指定读取引擎，常用的有 'pyarrow'（默认）和 'fastparquet'。选择不同引擎可能会影响性能和兼容性。
columns：可以指定需要读取的列，适用于只加载部分数据以降低内存占用。

例如，只读取特定列：

df_partial = pd.read_parquet('data/sample.parquet', columns=['col1', 'col2'])

3. 使用 Pandas 写入 Parquet 数据

3.1 基本用法

Pandas 的 to_parquet() 方法可以将 DataFrame 写入 Parquet 文件，支持多种压缩和编码选项：

import pandas as pd
import numpy as np

# 创建示例 DataFrame
df = pd.DataFrame({
    'A': np.random.rand(1000),
    'B': np.random.randint(0, 100, 1000)
})

# 将 DataFrame 写入 Parquet 文件，指定压缩方式
df.to_parquet('output/data.parquet', engine='pyarrow', compression='snappy')
print("数据成功写入 Parquet 文件。")

3.2 参数说明

engine：指定写入引擎，常用 'pyarrow' 或 'fastparquet'。
compression：压缩算法，例如 'snappy', 'gzip', 'brotli' 等。
index：是否写入索引，默认写入。如果不需要索引，可以设置 index=False。

4. 依赖库与性能优化

4.1 依赖库

Pandas 与 Parquet 的读写依赖于第三方库：

pyarrow：官方推荐的引擎，功能全面且性能优越。
fastparquet：另一个流行的 Parquet 引擎，在某些场景下速度较快。

安装方法：

pip install pyarrow
# 或者
pip install fastparquet

4.2 性能优化策略

选择合适的引擎：对于大数据集，通常 pyarrow 性能较好，但在特定场景下，fastparquet 可能表现更优。
分块读取：如果文件非常大，可以结合 Dask 或 PyArrow 的分块读取功能。
只加载必要列：通过 columns 参数只读取需要的列，降低内存占用和 I/O 时间。
压缩选项：选择适合的数据压缩算法，可以在保证读写速度的前提下减小文件大小。

5. 实际案例：从 Parquet 文件加载与存储股票数据

假设我们有一个包含股票历史数据的 DataFrame，并需要将其保存为 Parquet 格式以便快速加载和高效存储。

import pandas as pd
import numpy as np

# 模拟股票数据，包含日期、收盘价和成交量
dates = pd.date_range(start="2024-01-01", periods=100, freq="D")
df_stock = pd.DataFrame({
    'Date': dates,
    'Close': np.random.normal(100, 5, 100),
    'Volume': np.random.randint(1000, 5000, 100)
})
df_stock.set_index('Date', inplace=True)

# 写入 Parquet 文件，使用 pyarrow 引擎和 snappy 压缩
df_stock.to_parquet('output/stock_data.parquet', engine='pyarrow', compression='snappy')
print("股票数据已写入 Parquet 文件。")

# 从 Parquet 文件中读取数据
df_loaded = pd.read_parquet('output/stock_data.parquet', engine='pyarrow')
print("读取股票数据预览：")
print(df_loaded.head())

这个案例展示了如何模拟股票数据、设置日期索引、将 DataFrame 写入 Parquet 文件，并再次加载为 DataFrame。通过 Parquet 格式，可以获得更高的读写速度和更低的磁盘占用，适用于大数据量的场景。

6. 总结

本文详细介绍了 Pandas 与 Parquet 数据交互的高级技巧，主要内容包括：

Parquet 格式简介：列式存储格式，具有高效压缩和快速查询优势。
数据读取：使用 pd.read_parquet() 读取 Parquet 文件，并通过参数选择合适的引擎和读取列。
数据写入：利用 DataFrame.to_parquet() 将数据保存为 Parquet 文件，支持压缩和多种格式选项。
依赖库与性能优化：介绍了 pyarrow 与 fastparquet 两种常用引擎，讨论了性能优化策略，如只加载必要列和分块处理。
实际案例：通过股票数据示例，展示了如何将数据存储到 Parquet 文件中，并高效加载和使用。

掌握这些技术后，你可以在大规模数据存储、实时数据加载以及数据处理过程中充分利用 Parquet 格式，提升数据分析和模型训练的效率。不断实践与优化，将使你在数据科学项目中获得更高效、更可靠的数据支持。

7. 参考资料

Pandas 官方文档：DataFrame.to_parquet
Pandas 官方文档：read_parquet
PyArrow 官方文档：https://arrow.apache.org/docs/python/
Fastparquet 官方文档：https://fastparquet.readthedocs.io/en/latest/
《Python for Data Analysis》 by Wes McKinney
相关博客和论坛文章，如 CSDN、知乎上关于“Pandas Parquet 数据交互”的讨论

希望本文能帮助你深入理解并灵活运用 Pandas 与 Parquet 数据交互的技巧，在大数据存储与高效读写中获得显著提升。不断探索和实践，将使你在数据科学与工程项目中获得更高效、更可靠的数据支持。

你可能感兴趣的:(Pandas使用教程,pandas,Parquet,数据交互,高效压缩,跨平台,python)

Django Channels WebSocket实时通信实战：从聊天功能到消息推送
引言在Web开发中，实时通信功能（如在线聊天、实时通知、数据推送）已成为许多应用的核心需求。传统的HTTP协议由于其请求-响应模式的限制，无法高效实现实时通信。WebSocket作为一种全双工通信协议，为实时Web应用提供了理想的解决方案。本文将详细介绍如何使用DjangoChannels构建WebSocket应用，实现实时聊天和后端主动消息推送功能。一、技术背景1.1DjangoChannels
介绍electron 几道之旅 electron javascript 前端
一、Electron是什么？Electron是一个基于Chromium和Node.js的框架，允许开发者使用前端技术（HTML/CSS/JavaScript）构建原生桌面应用。其核心优势在于：跨平台：一次开发，生成Windows、macOS、Linux三端应用；技术栈统一：前端开发者无需学习新语言，直接复用Web生态（如Vue/React）；混合架构：Chromium：负责渲染界面，支持现代CSS
20个高级DeepSeek指令，帮助你提升200%工作效率，建议收藏！资源客 DeepSeek指令
前两天我帮一个做产品的朋友优化了几个提示词，结果花2小时就完成了原本需要一整天的竞品分析报告。他当时就愣了，说："我之前怎么没想到可以这样用？"其实DeepSeek最大的价值不是给你标准答案，而是成为你的思维伙伴。关键就在于你怎么"提问"。今天我把这段时间总结的20个高效提示词分享出来，都是我在实际工作中反复验证过的。如果你能熟练运用其中的5-6个，保证你的工作效率至少提升2倍。深度思考场景：让A
【深度学习新浪潮】基于扩散模型的图像编辑加速方法小米玄戒Andrew 深度学习新浪潮深度学习人工智能扩散模型 Transformer DiT 图像编辑模型加速
在基于扩散模型的图像编辑任务中，实现高质量与高效加速的平衡需要综合运用模型架构优化、采样策略创新、条件控制增强及硬件加速等多维度技术。一、一步反演与掩码引导的编辑框架通过一步反演框架将输入图像映射到可编辑的潜在空间，结合掩码引导的注意力重缩放机制，实现文本引导的局部编辑。例如，SwiftEdit通过一步反演和注意力重缩放，将编辑时间压缩至0.23秒，比传统多步方法快50倍。具体步骤包括：一步反演：
UI自动化-Appium Oooon_the_way ui 自动化 appium
前言Appium是一款开源的跨平台移动应用UI自动化测试框架，支持Android、iOS和Windows平台的原生（Native）、混合（Hybrid）及移动Web应用。其核心设计基于WebDriver协议（即SeleniumWebDriver的W3C标准），通过客户端-服务器（C/S）架构（常见面试题）实现多语言支持和高扩展性。一、核心架构与工作原理C/S架构分层客户端（Client）：测试脚本
pdfplumber、pandas根据指定字段提取PDF跨页表格数据
importpdfplumberimportpandasaspdfromtypingimportList,Dict,Tuple,Optionaldefextract_table_by_title(pdf_path:str,target_title:str,page_range:Tuple[int,int]=(1,None),#(起始页,结束页)，None表示到最后一页title_padding:f
介绍Flutter
一、Flutter的核心优势：不止于跨平台高性能原生渲染自研引擎Skia：直接调用GPU绘制UI，绕过原生控件依赖，消除JavaScript桥接性能损耗，实现60fps流畅动画。三棵树渲染机制（Widget-Element-RenderObject）：通过差异化更新最小化重绘范围，效率远超传统WebView方案。极速开发体验热重载（HotReload）：代码修改后毫秒级生效，保留应用状态调试，开发
基于Elasticsearch的短视频平台个性化推荐系统设计与实现亲爱的非洲野猪 elasticsearch 音视频推荐算法
在当今内容爆炸的时代，个性化推荐系统已成为短视频平台的核心竞争力之一。本文将详细介绍如何利用Elasticsearch（ES）构建一个高效、可扩展的短视频个性化推荐系统。一、系统架构概述我们的推荐系统将采用混合推荐策略，结合协同过滤、内容相似度和热度推荐等多种方法。Elasticsearch作为核心搜索引擎和数据存储，将承担以下职责：用户画像存储与查询视频内容索引与检索实时行为日志分析推荐结果计算
MySQL CDC与Kafka整合指南：构建实时数据管道的完整方案亲爱的非洲野猪 mysql kafka 数据库
一、引言：现代数据架构的实时化需求在数字化转型浪潮中，实时数据已成为企业的核心资产。传统批处理ETL（每天T+1）已无法满足以下场景需求：实时风险监控（金融交易）即时个性化推荐（电商）物联网设备状态同步微服务间数据一致性本文将深入探讨如何通过MySQLCDC与Kafka的整合，构建高效可靠的实时数据管道。二、技术选型：三大CDC工具深度对比功能矩阵比较特性DebeziumCanalMaxWell多
鸿蒙 ArkTS 应用截图全指南：从组件到离屏长图全搞定谦和的大熊鸿蒙开发鸿蒙
鸿蒙ArkTS应用截图全指南：从组件到离屏长图全搞定在鸿蒙ArkTS应用开发中，截图并不是个边缘需求，而是有非常多实用场景的关键能力：‍UI自动化测试内容卡片、年度报告生成用户分享长图、社交素材用户反馈、崩溃回溯、复现问题离屏渲染组件进行预览或保存鸿蒙框架提供了强大的截图API，配合封装良好的SnapshotUtil工具类，截图可以变得简单、高效、适配各种业务场景。先看工具类：SnapshotUt
ClickHouse【理论篇】02：ClickHouse架构和组件做一个有趣的人Zz ClickHouse clickhouse 架构
ClickHouse的架构设计深度适配OLAP（在线分析处理）场景，通过列式存储、向量化执行、分布式分片与副本等核心技术，实现了对海量数据的高效分析与实时查询。以下从核心存储引擎、查询处理流程、分布式架构、元数据管理、复制与分片等维度详细解析其内部架构与关键组件。一、核心存储引擎：MergeTree系列ClickHouse的存储引擎是其性能的核心，其中MergeTree系列引擎（如MergeTre
【Torch】nn.Embedding算法详解油泼辣子多加深度学习 embedding 算法
1.定义nn.Embedding是PyTorch中的查表式嵌入层（lookup‐table），用于将离散的整数索引（如词ID、实体ID、离散特征类别等）映射到一个连续的、可训练的低维向量空间。它通过维护一个形状为(num_embeddings,embedding_dim)的权重矩阵，实现高效的“索引→向量”转换。2.输入与输出输入类型：整型张量（torch.long或torch.int64），必须
apache-dolphinscheduler-3.2.0调度器简介和集群部署详细安装文档
1、为什么选用apache-dolphinscheduler轻松管理复杂的任务工程支持跨项目和跨工作流程的任务依赖支持Kill、暂停和恢复操作任务支持以租户、Worker分组组和环境中隔离运行每个任务都可以修改输出参数，并将其传递给后续任务在一分钟内创建你的工作流程通过拖拉拽的工作流创建方式提高效率支持Python、Yaml和OpenApi的方式生成工作流支持将一个工作流作为另一个工作流的子流程执
合成生物学奇点：AI驱动CRISPR超进化工厂2025投产纪实
前言前些天发现了一个巨牛的人工智能免费学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站《合成生物学奇点：AI驱动CRISPR超进化工厂2025投产纪实》副标题：全球首座AI-BioFab落地深圳，蛋白质设计周期从3年压缩至11天，生物制造成本暴跌90%一、生物制造范式的历史性颠覆▶︎传统生物工程的三大世纪困局graphTDA[缓慢的试错循环]-->B[单基因改造耗时≥6个月]C[
Node.js特训专栏-实战进阶：13. ORM/ODM工具选型与使用爱分享的程序员 Node.js javascript 前端 node.js
欢迎来到Node.js实战专栏！在这里，每一行代码都是解锁高性能应用的钥匙，让我们一起开启Node.js的奇妙开发之旅！Node.js特训专栏主页专栏内容规划详情ORM/ODM工具选型与使用在当今的软件开发领域，数据库交互是众多应用程序的核心环节。无论是Web应用、移动后端，还是数据分析平台，高效、可靠地操作数据库至关重要。对象关系映射（ORM）和对象文档映射（ODM）工具应运而生，它们简化了数据
聚焦的伟力：注意力机制与Transformer的创世纪田园Coder 人工智能科普人工智能科普
当LSTM和GRU凭借其精密的门控系统，成功驯服了时间的长河，让神经网络能够跨越数十甚至数百步记住关键信息，并在机器翻译、文本生成等领域大放异彩时，一个看似微小却影响深远的瓶颈逐渐浮出水面，尤其是在序列到序列（Seq2Seq）框架中。在标准的Seq2Seq模型（如用于神经机器翻译）里，编码器（通常是一个RNN如LSTM）需要将整个输入序列（如一个英语句子）的信息压缩成一个固定长度的上下文向量（Co
基于python版本secsgem源码开发gem，该gem作为一个中间平台，既要连接EAP，又要连接探针台，应该如何设置devicetype、connectmode SunkingYang #SECS协议 python gem eap 中间平台三方连接设备类型
文章目录一、角色定义与连接模式设计1.中间平台的双向角色2.核心参数设置二、代码实现步骤1.创建两个独立连接实例2.数据转发逻辑实现三、高级配置与注意事项1.状态机管理2.多线程与异步处理3.协议兼容性4.调试与错误排查四、典型应用场景1.配方管理2.事件与报警处理五、扩展方案（多设备协同）总结基于Python的secsgem库开发中间平台需同时连接EAP（作为Host端）和探针台（作为Equip
Python 爬虫入门（九）：Scrapy安装及使用「详细介绍」 blues_C Python爬虫实战 python 爬虫 scrapy
Python爬虫入门（九）：Scrapy安装及使用「详细介绍」前言1.Scrapy简介2.Scrapy的安装2.1环境准备2.2安装Scrapy3.创建Scrapy项目3.1创建项目3.2项目结构简介4.编写爬虫4.1创建爬虫4.2解析数据4.3运行爬虫5.存储数据5.1存储为JSON文件5.2存储到数据库5.2.1MongoDB6.处理请求和响应6.1请求头设置6.2处理响应7.高级功能7.1使
python 会议室预约系统解决方案_会议预约管理系统解决方案 weixin_39963853 python 会议室预约系统解决方案
随着时代快速发展，各大会议中心都有密集的会议安排，同时企业也会有大大小小的会议安排。会议室没有管理，会造成会议室被争抢、重要会议被非重要会议挤占、会议室信息不能及时发布、会议室设备开会时不满足会议要求、会议室设备没有提前调试以及设备因没有及时检修造成故障、会中设备出现故障且没有应急预案等等问题。这些问题往往频繁发生，使人们平时习以为常，用时抱怨连连。如果任由问题发生、日积月累，则会产生严重影响，轻
python 会议室预约系统解决方案_智能会议预约系统解决方案 weixin_39914868 python 会议室预约系统解决方案
随着时代的发展，科技的进步，效率在工作中成为了评价工作能力的一项标准。人的工作效率，机器的工作效率等等，我们都是逐步在提高。达到高效的工作状态离不开智能的解决方案，在此我将分享上海铭港公司做的智能办公空间—会议预约系统的案例。上海铭港做的此项会议预约系统案例的解决方案围绕的主题中心即是：效率提到会议室，可能令大家的头疼的事情随之而来。特别是公司的行政部门人员。哪间会议室是在空闲状态？哪间会议室有人
python 会议室预约系统解决方案_会议室预约管理系统方案书.pdf
会议预约管理系统系统方案目录一、系统概述31.1什么是会议预约管理31.2会议管理趋势4二、系统功能52.1功能特点52.2系统优势62.3系统界面7三、系统部署103.1安装示意图103.2安装实景图11四、会议显示12五、应用行业135.1教育行业135.2法律行业135.3医疗保健135.4企业13一、系统概述为符合现代信息化的考虑，在办公楼的底楼进出大厅设置一套多媒体信息显示公告系统，用于
python 会议室预约系统解决方案_会议预约系统_智能会议预约管理系统_轻松实现会议管理解决方案... weixin_39779032 python 会议室预约系统解决方案
随着社会的发展，会议预约管理系统在近年来呈现高速发展，但是各种等级层次不齐。现代办公会议室是组织的公共资源，会议室及其附属的设备构成召开会议的基础环境。广州朗歌公司以提高会议效率为焦点，以会议全过程管理为理念，开发了会议预定管理系统产品。会议室预约管理系统的目标是为会议的准备提供便捷的服务，实时动态的将会议室预定信息，传递到每个会议室门口、大厅及楼梯口等公共通道的显示屏上，实现会议信息发布引导功能
GitHub每周最火火火项目（6.30-7.6） FutureUniant Github周推 github microsoft 人工智能 ai 计算机视觉
1.NanniCoder/MediaCrawler项目名称：MediaCrawler项目介绍：该项目采用Python语言开发，专注于多平台媒体内容的爬取工作。从用途来看，它能够精准抓取小红书笔记、抖音视频、快手视频、B站视频、微博帖子、百度贴吧帖子及评论、知乎问答文章等各类媒体平台的内容。在使用场景方面，对于新媒体运营者而言，可借助它批量采集行业内多平台的热门内容、竞品动态，为自身内容创作、运营策
python项目使用poetry管理依赖项 zQIANYUN python开发 python 开发语言
1.poetry管理依赖项Poetry是Python项目中用于依赖管理和项目打包的工具。相比传统的pip和requirements.txt，Poetry提供了更加现代和集成的解决方案。优点：Poetry能够自动处理依赖关系冲突，帮助开发者避免版本不兼容问题。在安装新的依赖时，它会检查现有依赖，并更新pyproject.toml文件和生成锁定的poetry.lock文件，以确保项目使用的依赖版本在团
Seaborn 教程 froginwe11 开发语言
Seaborn教程引言Seaborn是一个强大的Python数据可视化库，它建立在Matplotlib的基础上，专门用于统计图形的绘制。Seaborn提供了一系列的绘图功能，使得统计数据的可视化变得更加简单和直观。本文将为您提供一个全面的Seaborn教程，帮助您快速掌握其基本用法和高级技巧。安装与导入在开始之前，请确保您的Python环境中已经安装了Seaborn和Matplotlib。您可以使
python中的logger包的详细使用教程 SunkingYang #python入门之日志使用 python 日志 logger 使用方法说明
文章目录功能说明一、Logger的创建与基础配置二、Handler的配置与使用三、Formatter自定义日志格式四、记录不同级别的日志五、高级配置与最佳实践六、常见问题与调试使用方法一、基础配置与快速使用二、自定义Logger对象三、高级用法四、最佳实践与注意事项五、实际应用场景示例Python的logging模块是标准库中用于记录日志的核心工具，通过灵活配置可实现多级别、多目标、多格式的日志管
wireshark介绍和使用有趣的我网络安全 wireshark 测试工具网络
Wireshark介绍Wireshark是一款开源的网络协议分析工具（PacketSniffer），用于捕获和分析网络数据包。它支持多种协议解析，适用于网络调试、安全分析、网络教学等场景。官网：https://www.wireshark.org/特点：✔跨平台（Windows/macOS/Linux）✔支持2000+种协议解析✔图形化界面+命令行工具（tshark）✔可实时抓包或分析离线抓包文件（
Android studio运行时出现报错：HAXM is deprecated and not supported by Intel any more...如何解决？ bug菌¹ 全栈Bug调优(实战版)android studio java
本文收录于《全栈Bug调优(实战版)》专栏，致力于分享我在项目实战过程中遇到的各类Bug及其原因，并提供切实有效的解决方案。无论你是初学者还是经验丰富的开发者，本文将为你指引出一条更高效的Bug修复之路，助你早日登顶，迈向财富自由的梦想！同时，欢迎大家关注、收藏、订阅本专栏，更多精彩内容正在持续更新中。让我们一起进步，Up！Up！Up！备注：部分问题/难题源自互联网，但经过精心筛选和整理，保证
Kotlin 安装使用教程小奇JAVA面试安装使用教程 kotlin 开发语言 android
一、Kotlin简介Kotlin是JetBrains开发的一种现代、静态类型的编程语言，完全兼容Java，主要应用于Android开发、后端服务开发、前端Web开发（Kotlin/JS）和多平台开发（KotlinMultiplatform）。二、Kotlin安装方式2.1使用IntelliJIDEA（推荐）下载IntelliJIDEA（社区版即可）：https://www.jetbrains.co
10分钟掌握Python缓存
项目背景代码检查项目，需要存储每一步检查的中间结果，最终把结果汇总并写入文件中在中间结果的存储中可以使用context进行上下文的传递，但是整体对代码改动比较大，违背了开闭原则也可以利用缓存存储，处理完成之后再统一读缓存并写入文件在权衡了不同方案后，我决定采用缓存来存储中间结果。接下来，我将探讨Python中可用缓存组件。python缓存分类决定选择缓存，那么python中都有哪些类型的缓存呢?1
统一思想认识永夜-极光思想
1.统一思想认识的基础,才能有的放矢原因: 总有一种描述事物的方式最贴近本质,最容易让人理解. 如何让教育更轻松,在于找到最适合学生的方式. 难点在于,如何模拟对方的思维基础选择合适的方式. &
Joda Time使用笔记 bylijinnan java joda time
Joda Time的介绍可以参考这篇文章： http://www.ibm.com/developerworks/cn/java/j-jodatime.html 工作中也常常用到Joda Time，为了避免每次使用都查API，记录一下常用的用法： /** * DateTime变化（增减） */ @Tes
FileUtils API eksliang FileUtils FileUtils API
转载请出自出处：http://eksliang.iteye.com/blog/2217374 一、概述这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。非常的好用。
各种新兴技术不懂事的小屁孩技术
1:gradle Gradle 是以 Groovy 语言为基础，面向Java应用为主。基于DSL（领域特定语言）语法的自动化构建工具。现在构建系统常用到maven工具，现在有更容易上手的gradle，搭建java环境: http://www.ibm.com/developerworks/cn/opensource/os-cn-gradle/ 搭建android环境： http://m
tomcat6的https双向认证酷的飞上天空 tomcat6
1.生成服务器端证书 keytool -genkey -keyalg RSA -dname "cn=localhost,ou=sango,o=none,l=china,st=beijing,c=cn" -alias server -keypass password -keystore server.jks -storepass password -validity 36
托管虚拟桌面市场势不可挡蓝儿唯美
用户还需要冗余的数据中心，dinCloud的高级副总裁兼首席营销官Ali Din指出。该公司转售一个MSP可以让用户登录并管理和提供服务的用于DaaS的云自动化控制台，提供服务或者MSP也可以自己来控制。在某些情况下，MSP会在dinCloud的云服务上进行服务分层，如监控和补丁管理。 MSP的利润空间将根据其参与的程度而有所不同，Din说。 “我们有一些合作伙伴负责将我们推荐给客户作为个
spring学习——xml文件的配置 a-john spring
在Spring的学习中，对于其xml文件的配置是必不可少的。在Spring的多种装配Bean的方式中，采用XML配置也是最常见的。以下是一个简单的XML配置文件： <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.or
HDU 4342 History repeat itself 模拟 aijuans 模拟
来源：http://acm.hdu.edu.cn/showproblem.php?pid=4342 题意：首先让求第几个非平方数，然后求从1到该数之间的每个sqrt(i)的下取整的和。思路：一个简单的模拟题目，但是由于数据范围大，需要用__int64。我们可以首先把平方数筛选出来，假如让求第n个非平方数的话，看n前面有多少个平方数，假设有x个，则第n个非平方数就是n+x。注意两种特殊情况，即
java中最常用jar包的用途 asia007 java
java中最常用jar包的用途 jar包用途axis.jarSOAP引擎包commons-discovery-0.2.jar用来发现、查找和实现可插入式接口，提供一些一般类实例化、单件的生命周期管理的常用方法.jaxrpc.jarAxis运行所需要的组件包saaj.jar创建到端点的点到点连接的方法、创建并处理SOAP消息和附件的方法，以及接收和处理SOAP错误的方法. w
ajax获取Struts框架中的json编码异常和Struts中的主控制器异常的解决办法百合不是茶 js json编码返回异常
一:ajax获取自定义Struts框架中的json编码出现以下问题: 1,强制flush输出 json编码打印在首页 2, 不强制flush js会解析json 打印出来的是错误的jsp页面却没有跳转到错误页面 3, ajax中的dataType的json 改为text 会
JUnit使用的设计模式 bijian1013 java 设计模式 JUnit
JUnit源代码涉及使用了大量设计模式 1、模板方法模式（Template Method）定义一个操作中的算法骨架，而将一些步骤延伸到子类中去，使得子类可以不改变一个算法的结构，即可重新定义该算法的某些特定步骤。这里需要复用的是算法的结构，也就是步骤，而步骤的实现可以在子类中完成。
Linux常用命令（摘录） sunjing crond chkconfig
chkconfig --list 查看linux所有服务 chkconfig --add servicename 添加linux服务 netstat -apn | grep 8080 查看端口占用 env 查看所有环境变量 echo $JAVA_HOME 查看JAVA_HOME环境变量安装编译器 yum install -y gcc
【Hadoop一】Hadoop伪集群环境搭建 bit1129 hadoop
结合网上多份文档，不断反复的修正hadoop启动和运行过程中出现的问题，终于把Hadoop2.5.2伪分布式安装起来，跑通了wordcount例子。Hadoop的安装复杂性的体现之一是，Hadoop的安装文档非常多，但是能一个文档走下来的少之又少，尤其是Hadoop不同版本的配置差异非常的大。Hadoop2.5.2于前两天发布，但是它的配置跟2.5.0，2.5.1没有分别。 &nb
Anychart图表系列五之事件监听白糖_ chart
创建图表事件监听非常简单：首先是通过addEventListener('监听类型',js监听方法)添加事件监听，然后在js监听方法中定义具体监听逻辑。以钻取操作为例，当用户点击图表某一个point的时候弹出point的name和value，代码如下： <script> //创建AnyChart var chart = new AnyChart(); //添加钻取操作&quo
Web前端相关段子 braveCS web前端
Web标准：结构、样式和行为分离使用语义化标签 0）标签的语义：使用有良好语义的标签，能够很好地实现自我解释，方便搜索引擎理解网页结构，抓取重要内容。去样式后也会根据浏览器的默认样式很好的组织网页内容，具有很好的可读性，从而实现对特殊终端的兼容。 1）div和span是没有语义的：只是分别用作块级元素和行内元素的区域分隔符。当页面内标签无法满足设计需求时，才会适当添加div
编程之美-24点游戏 bylijinnan 编程之美
import java.util.ArrayList; import java.util.Arrays; import java.util.HashSet; import java.util.List; import java.util.Random; import java.util.Set; public class PointGame { /**编程之美
主页面子页面传值总结 chengxuyuancsdn 总结
1、showModalDialog returnValue是javascript中html的window对象的属性,目的是返回窗口值,当用window.showModalDialog函数打开一个IE的模式窗口时,用于返回窗口的值主界面 var sonValue=window.showModalDialog("son.jsp"); 子界面 window.retu
[网络与经济]互联网+的含义 comsci 互联网+
互联网+后面是一个人的名字 = 网络控制系统互联网+你的名字 = 网络个人数据库每日提示:如果人觉得不舒服,千万不要外出到处走动,就呆在床上,玩玩手游,更不能够去开车,现在交通状况不
oracle 创建视图 with check option daizj 视图 view oralce
我们来看下面的例子： create or replace view testview as select empno,ename from emp where ename like ‘M%’ with check option; 这里我们创建了一个视图，并使用了with check option来限制了视图。然后我们来看一下视图包含的结果： select * from testv
ToastPlugin插件在cordova3.3下使用 dibov Cordova
自己开发的Todos应用，想实现“ 再按一次返回键退出程序 ”的功能，采用网上的ToastPlugins插件，发现代码或文章基本都是老版本，运行问题比较多。折腾了好久才弄好。下面吧基于cordova3.3下的ToastPlugins相关代码共享。 ToastPlugin.java package&nbs
C语言22个系统函数 dcj3sjt126com c function
C语言系统函数一、数学函数下列函数存放在math.h头文件中Double floor(double num) 求出不大于num的最大数。Double fmod(x, y) 求整数x/y的余数。Double frexp(num, exp); double num; int *exp; 将num分为数字部分（尾数）x和以2位的指数部分n，即num=x*2n，指数n存放在exp指向的变量中，返回x。D
开发一个类的流程 dcj3sjt126com 开发
本人近日根据自己的开发经验总结了一个类的开发流程。这个流程适用于单独开发的构件，并不适用于对一个项目中的系统对象开发。开发出的类可以存入私人类库，供以后复用。以下是开发流程： 1. 明确类的功能，抽象出类的大概结构 2. 初步设想类的接口 3. 类名设计（驼峰式命名） 4. 属性设置(权限设置) 判断某些变量是否有必要作为成员属
java 并发 shuizhaosi888 java 并发
能够写出高伸缩性的并发是一门艺术在JAVA SE5中新增了3个包 java.util.concurrent java.util.concurrent.atomic java.util.concurrent.locks 在java的内存模型中，类的实例字段、静态字段和构成数组的对象元素都会被多个线程所共享，局部变量与方法参数都是线程私有的，不会被共享。
Spring Security（11）——匿名认证 234390216 Spring Security ROLE_ANNOYMOUS 匿名
匿名认证目录 1.1 配置 1.2 AuthenticationTrustResolver 对于匿名访问的用户，Spring Security支持为其建立一个匿名的AnonymousAuthenticat
NODEJS项目实践0.2[ express,ajax通信...] 逐行分析JS源代码 Ajax nodejs express
一、前言通过上节学习，我们已经 ubuntu系统搭建了一个可以访问的nodejs系统，并做了nginx转发。本节原要做web端服务及 mongodb的存取，但写着写着，web端就
在Struts2 的Action中怎样获取表单提交上来的多个checkbox的值 lhbthanks java html struts checkbox
第一种方法：获取结果String类型在 Action 中获得的是一个 String 型数据，每一个被选中的 checkbox 的 value 被拼接在一起，每个值之间以逗号隔开(,)。所以在 Action 中定义一个跟 checkbox 的 name 同名的属性来接收这些被选中的 checkbox 的 value 即可。以下是实现的代码：前台 HTML 代码：
003.Kafka基本概念 nweiren hadoop kafka
Kafka基本概念：Topic、Partition、Message、Producer、Broker、Consumer。 Topic：消息源（Message）的分类。 Partition： Topic物理上的分组，一
Linux环境下安装JDK roadrunners jdk linux
1、准备工作创建JDK的安装目录： mkdir -p /usr/java/ 下载JDK，找到适合自己系统的JDK版本进行下载： http://www.oracle.com/technetwork/java/javase/downloads/index.html 把JDK安装包下载到/usr/java/目录，然后进行解压： tar -zxvf jre-7
Linux忘记root密码的解决思路 tomcat_oracle linux
1：使用同版本的linux启动系统，chroot到忘记密码的根分区passwd改密码　　2：grub启动菜单中加入init=/bin/bash进入系统，不过这时挂载的是只读分区。根据系统的分区情况进一步判断. 　　3: grub启动菜单中加入 single以单用户进入系统. 　　4:用以上方法mount到根分区把/etc/passwd中的root密码去除　　例如: 　　ro
跨浏览器 HTML5 postMessage 方法以及 message 事件模拟实现 xueyou jsonp jquery 框架 UI html5
postMessage 是 HTML5 新方法，它可以实现跨域窗口之间通讯。到目前为止，只有 IE8+, Firefox 3, Opera 9, Chrome 3和 Safari 4 支持，而本篇文章主要讲述 postMessage 方法与 message 事件跨浏览器实现。postMessage 方法 JSONP 技术不一样，前者是前端擅长跨域文档数据即时通讯，后者擅长针对跨域服务端数据通讯，p

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他