秦岭熊猫

开源网络爬虫汇总

Awesome-crawler-cn

互联网爬虫，蜘蛛，数据采集器，网页解析器的汇总，因新技术不断发展，新框架层出不穷，此文会不断更新...

交流讨论

欢迎推荐你知道的开源网络爬虫，网页抽取框架.
开源网络爬虫QQ交流群:322937592
email address: liinux at qq.com

Python

Scrapy - 一种高效的屏幕,网页数据采集框架。
- django-dynamic-scraper - 基于Scrapy内核由django Web框架开发的爬虫。
- Scrapy-Redis - 基于Scrapy内核采用Redis组件的爬虫。
- scrapy-cluster - 基于Scrapy内核采用Redis 和 Kafka 开发的分布式爬虫框架。
- distribute_crawler - 基于Scrapy内核采用redis, mongodb开发的分布式爬虫框架。
pyspider - 一个强大纯python的数据采集系统.
cola - 一个分布式的爬虫框架.
Demiurge - 基于PyQuery的微型爬虫框架.
Scrapely - 一个纯python的HTML页面捕捉库.
feedparser - 一个通用的feed解析器.
you-get - 静默网站爬去下载器.
Grab - 网站采集框架.
MechanicalSoup - 一个自动化的互动网站Python库.
portia - 基于Scrapy的可视化数据采集框架.
crawley - 基于非阻塞通信(NIO)的python爬虫框架.
RoboBrowser - 一个简单的，不基于Web浏览器的基于Python的Web 浏览器.
MSpider - 一个基于gevent(协程网络库)的python爬虫.
brownant - 一个轻量级的网络数据抽取框架.

Java

Apache Nutch - 用于生产环境的高度可扩展的高度可扩展的网络爬虫.
- anthelion - 一个基于Apache Nutch抓取语义注释在HTML页面插件.
Crawler4j - 简单和轻量级的网络爬虫.
JSoup - 采集，分析，处理和清洗HTML页面.
websphinx - HTML网站特定的处理、信息提取.
Open Search Server - 全套搜索功能，建立你自己的索引策略。分析、提取全文数据，这个框架可以索引的一切.
Gecco - 一个易于使用的轻量级网络爬虫.
WebCollector -简单的抓取网页的界面，可以在不到5分钟内部署一个多线程的网络爬虫.
Webmagic -一个可扩展的爬虫框架.
Spiderman -一个可扩展的，多线程的网络爬虫.
- Spiderman2 - 分布式网络爬虫框架，支持javascript渲染.
Heritrix3 - 可扩展，大规模的网络爬虫项目.
SeimiCrawler - 一个敏捷的分布式爬虫框架.
StormCrawler - 基于开放源代码、构建低延迟的网络资源采集框架，基于Apache Storm.
Spark-Crawler - 基于Apache Nutch 的网络爬虫，可以运行于Spark.

C#

ccrawler - 一个简单的Web内容分类方案，它可以根据其内容分开网页,基于C#3.5.
SimpleCrawler - 简单的多线程网络爬虫，基于REG表达式.
DotnetSpider - 基于C#开发的一个轻量级，交叉平台的网络爬虫.
Abot - 具有很好效率和可扩展性的C#网络爬虫.
Hawk - 用 C#/WPF开发的网络爬虫，具有简单的ETL功能.
SkyScraper - 一个支持异步网络和有很好扩展性的网络爬虫.

JavaScript

scraperjs - 基于JS的一个功能齐全的网络爬虫.
scrape-it - 基于Node.js的网络爬虫.
simplecrawler - 基于事件驱动开发的网络爬虫.
node-crawler - 提供简单API，适于二次开发的网络爬虫.
js-crawler - 基于Node.JS,支持HTTP(S)的网络爬虫.
x-ray - 支持分页的网络爬虫.
node-osmosis - 基于Node.js适于解析HTML结构的网络爬虫.

PHP

Goutte - 基于PHP的网页截屏和爬取程序.
- laravel-goutte - 基于Laravel 5 的网络爬虫.
dom-crawler - 易于抽取DOM文件的网络爬虫.
pspider - 基于PHP的并发网络爬虫.
php-spider - 一个基于PHP的高可扩展的网络爬虫.

C++

open-source-search-engine - 基于C/C++开发的网络爬虫和搜索引擎.

C

httrack - 全部网站整体复制工具。 ## Ruby
upton - 一个易于上手的爬虫框架集合，支持CSS选择器.
wombat - 基于Ruby天然的支持DSL的网络爬虫，易于提取网页正文数据.
RubyRetriever - 基于Ruby的网站数据采集和全网数据收割机.
Spidr - 全站数据采集，支持无限的网站链接地址采集.
Cobweb - 非常灵活，易于扩展的网络爬虫，可以单点部署使用.
mechanize - 自动采集网站数据的框架.

R

rvest - 基于R开发的简单网络爬虫.

Erlang

ebot - 一个分布式，高可扩展的网络爬虫.

Perl

web-scraper - 方便使用HTML、CSS、XPath选择器的网络爬虫。

Go

pholcus - 一个分布式，支持高并发的网络爬虫.
gocrawl - 一个高并发的，轻量级，遵守道德的网络爬虫.
fetchbot -一个遵守robots.txt规则和延迟规则的轻量级网络爬虫.
go_spider - 一个非常好的高并发网络爬虫.
dht -支持DHT协议的网络爬虫.
ants-go - 基于Golang的高并行网络爬虫.
scrape - 一个简单的提供很好开发接口的网络爬虫.

Scala

crawler - 基于Scala DSL的网络爬虫.
scrala - 由Scala开发基于scrapy内核的网络爬虫.
ferrit - 基于Scala开发使用了Akka, Spray，Cassandra的网络爬虫.

你可能感兴趣的:(开源网络爬虫汇总)

DeepSeek部署指南：从入门到精通 wujj_whut 热门应用 c++DeepSeek 嵌入式实时数据库
DeepSeek部署指南：从入门到精通引言在人工智能和深度学习领域，模型的部署是一个至关重要的环节。DeepSeek作为一款强大的深度学习框架，其部署过程不仅关系到模型的性能表现，还直接影响到实际应用的效果。本文将详细介绍DeepSeek的部署流程，涵盖从环境配置到实际应用的各个方面，旨在帮助读者全面掌握DeepSeek的部署技巧。一、DeepSeek简介DeepSeek是一款开源的深度学习框架，
七、Uniapp+vue+腾讯IM+腾讯音视频开发仿微信的IM聊天APP，支持各类消息收发，音视频通话，附vue实现源码(已开源)-聊天消息项的实现智密科技 uniapp插件 IM源码音视频微信 uni-app 源码 im
会话好友列表的实现1、项目引言2、腾讯云后台配置TXIM3、配置项目并实现IM登录4、会话好友列表的实现5、聊天输入框的实现6、聊天界面容器的实现7、聊天消息项的实现8、聊天输入框扩展面板的实现9、聊天会话管理的实现10、聊天记录的加载与消息收发11、定位SD配置与收发定位消息12、贴图表情的定制化开发13、腾讯云后台配置TRTC功能14、集成音视频通话功能15、集成仿微信的拍照，相册选择插件16
windows docker-02-docker 最常用的命令汇总老马啸西风 Docker 容器学习实战笔记 docker eureka 容器 ubuntu maven linux 运维
一、镜像管理命令说明常用参数示例dockerpull:拉取镜像dockerpullnginx:latestdockerimages查看本地镜像dockerimages-a（含中间层镜像）dockerrmi删除镜像dockerrmi-f$(dockerimages-q)（强制删除所有镜像）dockerbuild-t.构建镜像dockerbuild-tmyapp:v1-fDockerfile.prod
星返邀请码是多少?(2024附星返app邀请码填写及获取指南)网络购物和智能省钱凌风导师
关于星返极速版邀请码2024年的最新汇总及填写步骤，由于我无法直接访问实时更新的数据库或官方公告，以下信息基于当前可获取的资料和一般经验进行总结：星返极速版邀请码最新汇总请注意：由于邀请码可能随平台政策、推广活动等因素变化，以下提供的邀请码仅供参考，具体有效性需以星返极速版官方发布的信息为准。常见邀请码：包括但不限于这些邀请码在多个渠道中被提及，但具体使用时请确认其有效性。官方渠道获取：最可靠的方
Agora_Unity_WebGL：实时互动的WebGL解决方案
Agora_Unity_WebGL：实时互动的WebGL解决方案项目介绍Agora_Unity_WebGL是一个开源的UnityWebGL插件，它是对AgoraWebSDK4.x版本的封装。这个项目旨在为开发者提供一种在Unity中轻松集成实时音视频互动功能的方法，特别适用于需要在Web平台运行的Unity项目。通过这个插件，开发者可以快速地实现实时音频、视频通信以及直播等功能。项目技术分析Ago
Netflix DGS Codegen 开源项目教程裴剑苹
NetflixDGSCodegen开源项目教程1.项目的目录结构及介绍NetflixDGSCodegen项目的目录结构如下：dgs-codegen/├──dgs-codegen-core/│├──src/││├──main/│││├──java/││││├──com/│││││├──netflix/││││││├──dgs/│││││││├──codegen/││││││││├──core/│││
部署Zabbix企业级分布式监控 YUNYINGXIA Zabbix
目录一、监控系统概述1.1监控的重要性1.2监控类型1.3监控层次划分二、监控系统的实现原理2.1模块组成2.2采集协议2.3监控模式2.4代理架构三、监控系统的开源产品四、Zabbix系统概述4.1初识zabbix4.2Zabbix的功能特性4.3Zabbix角色及架构五、部署流程5.1资源清单5.2基础环境配置5.3部署zabbixserver5.4zabbix页面配置5.5部署proxy5.
重庆最全合法上户口亲子鉴定10家医院名单汇总一览（附2024年9月鉴定名录前瞻）中量亲鉴生物
重庆可以做上户口亲子鉴定的医院在哪里？像重庆医科大学附属第一医院、重庆医科大学附属第二医院和重庆市人民医院等大型医院都无法提供亲子鉴定服务。因为医疗服务与司法鉴定服务各有专攻，在重庆，医院主要负责治疗疾病，而上户口亲子鉴定这类专业鉴定则交由具备相应资质的机构承担。接下来，小编将为大家介绍重庆的上户口亲子鉴定正规机构，排名不分先后，仅供大家参考和了解。重庆最全上户口亲子鉴定中心地址1、重庆中量国鉴生
Flutter GetX 模板项目常见问题解决方案
FlutterGetX模板项目常见问题解决方案项目基础介绍FlutterGetX模板项目是一个基于Flutter框架的开源项目，旨在为开发者提供一个快速启动Flutter应用的模板。该项目使用了GetX包进行状态管理、路由和依赖注入，并采用了MVVM（Model-View-ViewModel）架构模式。主要的编程语言是Dart，这是Flutter框架的官方编程语言。新手使用注意事项及解决方案1.环
深入探索Hadoop技术：全面学习指南
引言在大数据时代，高效地存储、处理和分析海量数据已成为企业决策与创新的关键驱动力。Hadoop，作为开源的大数据处理框架，以其强大的分布式存储和并行计算能力，以及丰富的生态系统，为企业提供了应对大规模数据挑战的有效解决方案。本文旨在为初学者和进阶者提供一份详尽的Hadoop技术学习指南，涵盖HDFS、MapReduce、YARN等核心组件，以及Hive、Pig、HBase等生态系统工具，助您踏上H
Spring Cloud Gateway过滤器精确控制异常返回(实战，控制http返回码和message字段) 程序员欣宸
欢迎访问我的GitHub这里分类和汇总了欣宸的全部原创(含配套源码)：https://github.com/zq2599/blog_demos本篇概览前文《SpringCloudGateway过滤器精确控制异常返回(分析篇)》咱们阅读源码，了解到SpringCloudGateway是如何处理全局异常信息的，学了那么多理论，不免手痒想实战验证学习效果，今天咱们就来写代码，最终目标是改写下图两个红框中
poi html转换成word文档,poi将html转换为word文档天猪飞翔 poi html转换成word文档
如何使用apachepoi将word转化为htmlJava可以使用这个开源框架，对word进行读取合并等操作，ApachePOI是一个开源的利用Java读写Excel、WORD等微软OLE2组件文档的项目。最新的3.5版本有很多改进，加入了对采用OOXML格式的Office2007支持，如xlsx、docx、pptx文档。示例如下：importorg.apache.poi.POITextExtra
Word模板引擎poi-tl（poi template language）使用入门指南 enjoy编程程序员实用工具集合 Word 模板引擎 poi-tl
什么是poi-tlpoi-tl（poitemplatelanguage）是Word模板引擎，使用模板和数据创建很棒的Word文档poi-tl是一个基于ApachePOI的Word模板引擎，也是一个免费开源的Java类库，可以非常方便的集成到项目中，并使用它已经封装好的功能。为什么选择poi-tl?方案移植性功能性易用性Poi-tlJava跨平台Word模板引擎，基于ApachePOI，提供更友好的
OpenCV引擎：驱动实时应用开发的科技狂飙芯作者 DD：计算机科学领域 opencv 计算机视觉
在人工智能与计算机视觉技术迅猛发展的今天，实时图像处理已成为工业自动化、自动驾驶、医疗诊断、增强现实等领域的核心技术需求。而**OpenCV（OpenSourceComputerVisionLibrary）**作为全球最活跃的开源计算机视觉库，正以其强大的算法生态、跨平台兼容性以及持续进化的架构设计，成为驱动实时应用开发的“数字引擎”。本文将深入剖析OpenCV如何通过技术创新突破实时处理的性能极
PostgreSQL 语法详解沐知全栈开发开发语言
PostgreSQL语法详解引言PostgreSQL是一款功能强大的开源对象关系型数据库管理系统（ORDBMS），广泛应用于各种规模的组织中。其丰富的功能和灵活性使得它成为了众多数据库开发者和运维人员的首选。本文将详细介绍PostgreSQL的语法，帮助读者快速掌握其基本操作。1.数据库连接在操作PostgreSQL之前，首先需要连接到数据库。以下是一个使用PostgreSQL客户端连接到本地数据
Android Camera内核级驱动程序设计荣敢飞 Android驱动学习 2 android 嵌入式硬件人工智能 linux
Camera内核级驱动程序设计一硬件抽象层HAL分析——分析打开设备流程和拍照流程二Ov5640摄像头驱动程序一、硬件抽象层HAL分析——分析打开设备流程和拍照流程首先找到摄像头代码——在vendor…libcamera中只找到对应的.so文件，说明没有开源实际的路径是在hardware/samsung目录下——就是对应平台Rockchip等也是secCameraHWInterface.cpp1、
ROS和autosar区别和联系，以及AP/CP对比ROS Jaliang_ 汽车
ROS和autosar区别和联系ROS(RobotOperatingSystem)和AUTOSAR(AutomotiveOpenSystemArchitecture)是两个不同领域的开源软件框架。应用领域的不同:ROS主要面向机器人技术和相关的智能系统，它为机器人研发提供了一套完整的软件解决方案，包括通信、驱动、算法、模拟等各方面的支持。ROS适合用于机器人的控制、感知、规划、模拟等方面的开发，也
《妈妈朋友的儿子》2024韩剧全集完整未删减版夸克网盘百度云如何获取？妈妈朋友的儿子16集最新汇总及在线观看播放步骤全网优惠分享君
《妈妈朋友的儿子》是一部集喜剧与爱情元素于一身的韩剧，自2024年8月17日播出以来，便以其独特的剧情设定和演员们的精湛演技赢得了观众的广泛关注和喜爱。该剧由知名导演柳济元执导，编剧申夏恩操刀，主演阵容包括丁海寅、庭沼玟（又译郑素敏）、金智恩、尹志温等实力派演员，共同为观众呈现了一段既爆笑又温馨的爱情故事。妈妈朋友的儿子全集资源链接：(尽快保存，随时失效)https://pan.quark.cn/
肇庆九个正规司法亲子鉴定地方大全（附2024年鉴定汇总收费标准）国权基因
肇庆司法亲子鉴定哪家正规？肇庆亲鉴生物亲子鉴定中心是正规的亲子鉴定机构。为了方便肇庆的小伙伴能快速找到鉴定机构，小编整理了肇庆各地区司法鉴定机构名单以及肇庆亲子鉴定咨询机构在此供大家参考，排名不分先后。注：各鉴定机构鉴定范畴不同，请根据自身情况及鉴定机构的业务范围自行选择，内容仅供参考。肇庆司法亲子鉴定机构地址大全1、肇庆亲鉴生物亲子鉴定咨询中心地址：广东省肇庆市端州区服务区域：端州区、鼎湖区、高
Redis入门教程（一）：基本数据类型
一、Redis是什么？为什么你需要它？Redis（RemoteDictionaryServer）是一个开源的内存数据结构存储系统，它可以用作数据库、缓存和消息中间件。与传统的关系型数据库不同，Redis将数据存储在内存中，使其读写速度达到惊人的11万次读/秒和8.1万次写/秒。同时支持数据持久化，重启后数据不丢失，完美平衡了速度与可靠性。Redis的五大核心优势：丰富的数据结构：支持字符串（Str
焦作17家亲子鉴定中心地址大全（附2024年汇总鉴定）民鉴基因科普
焦作亲子鉴定中心在哪里？焦作亲子鉴定中心在焦作市山阳区解放中路。为了方便焦作的小伙伴能快速找到鉴定机构，小编整理了焦作各地区司法鉴定机构名单以及焦作亲子鉴定中心机构在此供大家参考，排名不分先后。注：各鉴定机构鉴定范畴不同，请根据自身情况及鉴定机构的业务范围自行选择，内容仅供参考。焦作17家亲子鉴定中心地址大全（附2024年汇总鉴定）焦作17家亲子鉴定中心地址大全焦作民鉴基因亲子鉴定中心焦作亲子鉴定
LLM初识
从零到一：用Python和LLM构建你的专属本地知识库问答机器人摘要：随着大型语言模型（LLM）的兴起，构建智能问答系统变得前所未有的简单。本文将详细介绍如何使用Python，结合开源的LLM和向量数据库技术，一步步搭建一个基于你本地文档的知识库问答机器人。你将学习到从环境准备、文档加载、文本切分、向量化、索引构建到最终实现问答交互的完整流程。本文包含详细的流程图描述、代码片段思路和关键注意事项，
推荐开源项目：Milvus Lite —— 轻量级向量数据库，助力AI应用快速起飞穆希静
推荐开源项目：MilvusLite——轻量级向量数据库，助力AI应用快速起飞项目介绍MilvusLite是知名开源向量数据库Milvus的轻量级版本，专为需要在小型环境中进行向量嵌入和相似性搜索的AI应用设计。通过将MilvusLite导入您的Python应用，您可以直接使用Milvus的核心向量搜索功能。MilvusLite已集成在PythonSDKofMilvus中，只需通过pipinstal
禅道和rocketchat的消息通信详细介绍(腾讯元宝)
以下是禅道（ZenTao）与Rocket.Chat之间消息通信的详细介绍，涵盖集成方式、技术实现及典型应用场景：1.集成背景禅道：开源项目管理工具，用于需求、任务、Bug跟踪。Rocket.Chat：开源企业级即时通讯平台。集成价值：实现项目动态自动同步至聊天群组，提升团队协作效率。2.通信方式(1)Webhook单向推送原理：禅道通过Webhook将事件（如Bug创建）推送至Rocket.Cha
常见的网络协议汇总（涵盖了不同的网络层次）是理不是里网络网络协议
网络层协议IP协议：IP指网际互连协议（InternetProtocol），是TCP/IP体系中的网络层协议。IP协议包括IPv4和IPv6，用于为数据包提供源地址和目标地址，从而实现网络通信。ICMP协议：ICMP（InternetControlMessageProtocol）即互联网控制报文协议，用于在IP主机、路由器之间传递控制消息。例如，当数据包无法到达目标主机时，ICMP会发送一个“目的
销售易发布中国首款AI CRM，纷享销客什么时候能抄上作业 wq54wq 人工智能
在数字化转型的深水区，客户关系管理、系统已成为企业增长的核心基础设施，一家可以与企业共同成长的CRM厂商才能跟上企业业务的快速发展，帮助企业实现高质量增长。2025年3月19日，销售易在腾讯云城市峰会上高调发布中国首款AICRM产品——NeoAgent。这款融合了腾讯混元大模型与DeepSeek开源技术的智能体矩阵，不仅重新定义了CRM的交互逻辑，更将行业竞争推向了“使技术真正回归赋能业务的本质”
背靠腾讯的销售易，发布中国首款AI CRM，纷享销客接下来怎么办 CC_54321 人工智能
在数字化转型的深水区，客户关系管理、系统已成为企业增长的核心基础设施，一家可以与企业共同成长的CRM厂商才能跟上企业业务的快速发展，帮助企业实现高质量增长。2025年3月19日，销售易在腾讯云城市峰会上高调发布中国首款AICRM产品——NeoAgent。这款融合了腾讯混元大模型与DeepSeek开源技术的智能体矩阵，不仅重新定义了CRM的交互逻辑，更将行业竞争推向了“使技术真正回归赋能业务的本质”
东莞8所最新胎儿亲子鉴定价目表一览【附2024年汇总鉴定】中检国权有限公司
东莞做亲子鉴定多少钱？东莞的亲子鉴定费用从2000元到4500元不等。东莞的亲子鉴定分为三种类型：个人隐私亲子鉴定、司法亲子鉴定和孕期亲子鉴定。以下是东莞市亲子鉴定咨询中心编制的东莞市亲子鉴定收费标准，供您参考。一、东莞市亲子鉴定中心机构一览1、东莞国权亲子鉴定咨询中心（国权基因）机构地址：东莞市东莞街道东莞大道东城段11号环球经贸中心1104室业务范围：DNA鉴定服务咨询预约，包括：个人(隐私)
北京可以做亲子鉴定的中心机构地址（附30家鉴定中心医院机构地址）国医基因黄主任
北京哪里可以做亲子鉴定？北京市丰台区丰科路6号院1号楼的北京国医基因可以做亲子鉴定。本文汇总30家可以做亲子鉴定的北京亲子鉴定中心，一起来看看吧！北京可以做亲子鉴定的中心机构地址（附30家鉴定中心医院机构地址）北京可以做亲子鉴定的机构：1、在必须具备相关资质的认证许可的亲子鉴定机构可以做；2、在亲子鉴定中心法医人员必须具备资质认证持证上岗的亲子鉴定机构可以做；3、在必须要有独立的实验室，机构设备仪
Agent-S：重新定义下一代 AI 智能体开发框架天机️灵韵人工智能编程语言架构设计人工智能开源项目 python
Agent-S：重新定义下一代AI智能体开发框架——探索simular-ai的开源革命引言2025年，AI智能体（Agent）技术正从概念走向产业核心。从自动化工作流到复杂决策系统，开发者亟需更高效的工具链。在这一背景下，simular-ai/Agent-S的诞生引人注目——它承诺以模块化、可扩展的架构，为开发者提供构建企业级智能体的终极工具箱。项目定位：智能体开发的“瑞士军刀”根据GitHub仓
关于旗正规则引擎规则中的上传和下载问题何必如此文件下载压缩 jsp 文件上传
文件的上传下载都是数据流的输入输出，大致流程都是一样的。一、文件打包下载 1.文件写入压缩包 string mainPath="D:\upload\"; 下载路径 string tmpfileName=jar.zip; &n
【Spark九十九】Spark Streaming的batch interval时间内的数据流转源码分析 bit1129 Stream
以如下代码为例（SocketInputDStream）： Spark Streaming从Socket读取数据的代码是在SocketReceiver的receive方法中，撇开异常情况不谈(Receiver有重连机制，restart方法，默认情况下在Receiver挂了之后，间隔两秒钟重新建立Socket连接)，读取到的数据通过调用store(textRead)方法进行存储。数据
spark master web ui 端口8080被占用解决方法 daizj 8080 端口占用 spark master web ui
spark master web ui 默认端口为8080，当系统有其它程序也在使用该接口时，启动master时也不会报错，spark自己会改用其它端口，自动端口号加1，但为了可以控制到指定的端口，我们可以自行设置，修改方法： 1、cd SPARK_HOME/sbin 2、vi start-master.sh 3、定位到下面部分
oracle_执行计划_谓词信息和数据获取周凡杨 oracle 执行计划
oracle_执行计划_谓词信息和数据获取(上) 一：简要说明在查看执行计划的信息中，经常会看到两个谓词filter和access，它们的区别是什么，理解了这两个词对我们解读Oracle的执行计划信息会有所帮助。简单说，执行计划如果显示是access，就表示这个谓词条件的值将会影响数据的访问路径（表还是索引），而filter表示谓词条件的值并不会影响数据访问路径，只起到
spring中datasource配置 g21121 dataSource
datasource配置有很多种，我介绍的一种是采用c3p0的，它的百科地址是： http://baike.baidu.com/view/920062.htm  <bean name="propertiesConfig" class="org.springframework.b
web报表工具FineReport使用中遇到的常见报错及解决办法（三）老A不折腾 finereport FAQ 报表软件
这里写点抛砖引玉，希望大家能把自己整理的问题及解决方法晾出来，Mark一下，利人利己。出现问题先搜一下文档上有没有，再看看度娘有没有，再看看论坛有没有。有报错要看日志。下面简单罗列下常见的问题，大多文档上都有提到的。 1、repeated column width is largerthan paper width：这个看这段话应该是很好理解的。比如做的模板页面宽度只能放
mysql 用户管理墙头上一根草 linux mysql user
1.新建用户 //登录MYSQL@>mysql -u root -p@>密码//创建用户mysql> insert into mysql.user(Host,User,Password) values(‘localhost’,'jeecn’,password(‘jeecn’));//刷新系统权限表mysql>flush privileges;这样就创建了一个名为：
关于使用Spring导致c3p0数据库死锁问题 aijuans spring Spring 入门 Spring 实例 Spring3 Spring 教程
这个问题我实在是为整个 springsource 的员工蒙羞如果大家使用 spring 控制事务，使用 Open Session In View 模式， com.mchange.v2.resourcepool.TimeoutException: A client timed out while waiting to acquire a resource from com.mchange.
百度词库联想 annan211 百度
<!DOCTYPE html> <html> <head> <meta http-equiv="Content-Type" content="text/html; charset=UTF-8"> <title>RunJS</title&g
int数据与byte之间的相互转换实现代码百合不是茶位移 int转byte byte转int 基本数据类型的实现
在BMP文件和文件压缩时需要用到的int与byte转换,现将理解的贴出来; 主要是要理解;位移等概念 http://baihe747.iteye.com/blog/2078029 int转byte; byte转int; /** * 字节转成int,int转成字节 * @author Administrator *
简单模拟实现数据库连接池 bijian1013 java thread java多线程简单模拟实现数据库连接池
简单模拟实现数据库连接池实例1： package com.bijian.thread; public class DB { //private static final int MAX_COUNT = 10; private static final DB instance = new DB(); private int count = 0; private i
一种基于Weblogic容器的鉴权设计 bijian1013 java weblogic
服务器对请求的鉴权可以在请求头中加Authorization之类的key，将用户名、密码保存到此key对应的value中，当然对于用户名、密码这种高机密的信息，应该对其进行加砂加密等，最简单的方法如下： String vuser_id = "weblogic"; String vuse
【RPC框架Hessian二】Hessian 对象序列化和反序列化 bit1129 hessian
任何一个对象从一个JVM传输到另一个JVM，都要经过序列化为二进制数据(或者字符串等其他格式，比如JSON)，然后在反序列化为Java对象，这最后都是通过二进制的数据在不同的JVM之间传输(一般是通过Socket和二进制的数据传输)，本文定义一个比较符合工作中。 1. 定义三个POJO Person类 package com.tom.hes
【Hadoop十四】Hadoop提供的脚本的功能 bit1129 hadoop
1. hadoop-daemon.sh 1.1 启动HDFS ./hadoop-daemon.sh start namenode ./hadoop-daemon.sh start datanode 通过这种逐步启动的方式，比start-all.sh方式少了一个SecondaryNameNode进程，这不影响Hadoop的使用，其实在 Hadoop2.0中，SecondaryNa
中国互联网走在“灰度”上 ronin47 管理灰度
中国互联网走在“灰度”上（转）文/孕峰第一次听说灰度这个词，是任正非说新型管理者所需要的素质。第二次听说是来自马化腾。似乎其他人包括马云也用不同的语言说过类似的意思。灰度这个词所包含的意义和视野是广远的。要理解这个词，可能同样要用“灰度”的心态。灰度的反面，是规规矩矩，清清楚楚，泾渭分明，严谨条理，是决不妥协，不转弯，认死理。黑白分明不是灰度，像彩虹那样
java-51-输入一个矩阵，按照从外向里以顺时针的顺序依次打印出每一个数字。 bylijinnan java
public class PrintMatrixClockwisely { /** * Q51.输入一个矩阵，按照从外向里以顺时针的顺序依次打印出每一个数字。例如：如果输入如下矩阵： 1 2 3 4 5 6 7 8 9
mongoDB 用户管理开窍的石头 mongoDB用户管理
1:添加用户第一次设置用户需要进入admin数据库下设置超级用户（use admin） db.addUsr({user:'useName',pwd:'111111',roles:[readWrite,dbAdmin]}); 第一个参数用户的名字第二个参数
[游戏与生活]玩暗黑破坏神3的一些问题 comsci 生活
暗黑破坏神3是有史以来最让人激动的游戏。。。。但是有几个问题需要我们注意玩这个游戏的时间，每天不要超过一个小时，且每次玩游戏最好在白天结束游戏之后，最好在太阳下面来晒一下身上的暗黑气息，让自己恢复人的生气 &nb
java 二维数组如何存入数据库 cuiyadll java
using System; using System.Linq; using System.Text; using System.Windows.Forms; using System.Xml; using System.Xml.Serialization; using System.IO; namespace WindowsFormsApplication1 {
本地事务和全局事务Local Transaction and Global Transaction(JTA) darrenzhu java spring local global transaction
Configuring Spring and JTA without full Java EE http://spring.io/blog/2011/08/15/configuring-spring-and-jta-without-full-java-ee/ Spring doc -Transaction Management http://docs.spring.io/spri
Linux命令之alias - 设置命令的别名，让 Linux 命令更简练 dcj3sjt126com linux alias
用途说明设置命令的别名。在linux系统中如果命令太长又不符合用户的习惯，那么我们可以为它指定一个别名。虽然可以为命令建立“链接”解决长文件名的问题，但对于带命令行参数的命令，链接就无能为力了。而指定别名则可以解决此类所有问题【1】。常用别名来简化ssh登录【见示例三】，使长命令变短，使常用的长命令行变短，强制执行命令时询问等。常用参数格式：alias 格式：ali
yii2 restful web服务[格式响应] dcj3sjt126com PHP yii2
响应格式当处理一个 RESTful API 请求时，一个应用程序通常需要如下步骤来处理响应格式：确定可能影响响应格式的各种因素，例如媒介类型，语言，版本，等等。这个过程也被称为 content negotiation。资源对象转换为数组，如在 Resources 部分中所描述的。通过 [[yii\rest\Serializer]]
MongoDB索引调优（2）——[十] eksliang mongodb MongoDB索引优化
转载请出自出处：http://eksliang.iteye.com/blog/2178555 一、概述上一篇文档中也说明了，MongoDB的索引几乎与关系型数据库的索引一模一样，优化关系型数据库的技巧通用适合MongoDB，所有这里只讲MongoDB需要注意的地方二、索引内嵌文档可以在嵌套文档的键上建立索引，方式与正常
当滑动到顶部和底部时，实现Item的分离效果的ListView gundumw100 android
拉动ListView，Item之间的间距会变大，释放后恢复原样； package cn.tangdada.tangbang.widget; import android.annotation.TargetApi; import android.content.Context; import android.content.res.TypedArray; import andr
程序员用HTML5制作的爱心树表白动画 ini JavaScript jquery Web html5 css
体验效果：http://keleyi.com/keleyi/phtml/html5/31.htmHTML代码如下： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"><head><meta charset="UTF-8" > <ti
预装windows 8 系统GPT模式的ThinkPad T440改装64位 windows 7旗舰版 kakajw ThinkPad 预装改装 windows 7 windows 8
该教程具有普遍参考性，特别适用于联想的机器，其他品牌机器的处理过程也大同小异。该教程是个人多次尝试和总结的结果，实用性强，推荐给需要的人！缘由小弟最近入手笔记本ThinkPad T440，但是特别不能习惯笔记本出厂预装的Windows 8系统，而且厂商自作聪明地预装了一堆没用的应用软件，消耗不少的系统资源（本本的内存为4G，系统启动完成时，物理内存占用比
Nginx学习笔记 mcj8089 nginx
一、安装nginx 1、在nginx官方网站下载一个包，下载地址是： http://nginx.org/download/nginx-1.4.2.tar.gz 2、WinSCP(ftp上传工
mongodb 聚合查询每天论坛链接点击次数 qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
/* 18 */ { "_id" : ObjectId("5596414cbe4d73a327e50274"), "msgType" : "text", "sendTime" : ISODate("2015-07-03T08:01:16.000Z"
java术语（PO/POJO/VO/BO/DAO/DTO） Luob. DAO POJO DTO po VO BO
PO(persistant object) 持久对象在o/r 映射的时候出现的概念,如果没有o/r映射,就没有这个概念存在了.通常对应数据模型(数据库),本身还有部分业务逻辑的处理.可以看成是与数据库中的表相映射的java对象.最简单的PO就是对应数据库中某个表中的一条记录,多个记录可以用PO的集合.PO中应该不包含任何对数据库的操作. VO(value object) 值对象通
算法复杂度 Wuaner Algorithm
Time Complexity & Big-O： http://stackoverflow.com/questions/487258/plain-english-explanation-of-big-o http://bigocheatsheet.com/ http://www.sitepoint.com/time-complexity-algorithms/

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他