apache 基金会 project 概述

 

====================================================

 

Ambari 是一种基于Web的工具,支持Apache Hadoop集群的供应、管理和监控。Ambari目前已支持大多数Hadoop组件,包括HDFS、MapReduce、Hive、Pig、 Hbase、Zookeper、

Sqoop和Hcatalog等。支持HDFS、MapReduce、Hive、Pig、Hbase、Zookeper、Sqoop和Hcatalog等的集中管理。也是5个顶级hadoop管理工具之一。

 

HTTP Server  html服务器

 

Abdera  是Atom联合协议(Atom Syndication)和Atom发布(Atom Publication)协议的开源实现。这是一个维护版本,主要在性能上有提升同时修复一些bug

 

========================

Accumulo 是一个可靠的、可伸缩的、高性能的排序分布式的 Key-Value 存储解决方案,基于单元访问控制以及可定制的服务器端处理。使用 Google BigTable 设计思路,基于 Apache 

 

Hadoop、Zookeeper 和 Thrift 构建

 

ACE 是一个软件发布框架,用于管理和发布模块化软件的组件、配置数据、其他基于OSGi的产品以及相关目标系统。Apache ACE包含了一组OSGi包,允许开发者轻松管理软件组件安装中

 

依赖关系、部署和反馈

 

ActiveMQ 是Apache出品,最流行的,能力强劲的开源消息总线。ActiveMQ 是一个完全支持JMS1.1和J2EE 1.4规范的 JMS Provider实现,尽管JMS规范出台已经是很久的事情了,但是

 

JMS在当今的J2EE应用中间仍然扮演着特殊的地位。

 

Airavata Airavata[1]是目前用来建立科学网关的软件工具包,但具有更广泛的潜在用途。它提供的功能组成,管理,执行和监测小范围从本地集群,以国家电网和云计算的计算资源进行大规

 

模的应用和工作流程。小工具接口,Airavata后端服务可以部署在开放社会的容器,如Apache Rave 和修改,以满足他们的需求。 airavata构建面向服务的计算,分布式消息,和工作流程的

 

组成和业务流程的一般概念。

 

Ant 是一个将软件编译、测试、部署等步骤联系在一起加以自动化的一个工具,大多用于Java环境中的软件开发。由Apache软件基金会所提供

 

Any23  是一个库、web服务和命令行工具用来从微格式、RDF、为数据、RDF/XML、Turtle、N-Tripes 和 Quards)中抽取结构化数据

 

APR Apache可移植运行库

 

Archiva Apache Archiva是一套可扩展的Artifact Repository管理系统。它能够与Maven,Continuum和ANT等构建工具完美结合。Archiva提供的功能包括:远程Repository代理,基于角

 

色的安全访问管理,Artifact分发、维护、查询,生成使用报告,提供基于Web的管理界面等。

 

Aries 项目提供了一组可嵌入式的 Java 组件,用于企业 OSGi 应用编程模型,该项目还包含了 OSGI 联盟企业专家组的规范实现和扩展。

 

=============================

Avro 是一个数据序列化的系统,它可以提供:

Avro是Hadoop中的一个子项目,也是Apache中一个独立的项目,Avro是一个基于二进制数据传输高性能的中间件

1 丰富的数据结构类型

2 快速可压缩的二进制数据形式

3 存储持久数据的文件容器

4 远程过程调用RPC

5 简单的动态语言结合功能,Avro和动态语言结合后,读写数据文件和使用RPC协议都不需要生成代码,而代码生成作为一种可选的优化只值得在静态类型语言中实现

 

Axis axis全称Apache EXtensible Interaction System 即阿帕奇可扩展交互系统。Axis本质上就是一个SOAP引擎,提供创建服务器端、客户端和网关SOAP操作的基本框架。Axis目前版本是

 

为Java编写的,不过为C++的版本正在开发中。但Axis并不完全是一个SOAP引擎,它还是一个独立的SOAP服务器和一个嵌入Servlet引擎(例如Tomcat)的服务器

 

===================================

Bigtop 是Apache软件基金会一个新的孵化器(Incubator)项目,它能够对用户任意版本的Hadoop部署进行打包与测试。Bigtop就像是Bigdata和Hadoop的结合体,可以让你在任意环境中

 

更加轻松地对Hadoop进行部署和测试。

 

Bloodhound 提供了一个工具来跟踪项目的进展和缺陷,主要侧重于软件项目。Bloodhound 基于著名的 Trac 项目,提供问题跟踪、储存、方便的浏览和简单的wiki语法参考。

 

Bloodhound 的目的是为多个软件项目管理提供直观的支持、先进友好的 UI 接口和安装简单的一些最重要的 Trac的默认提供的插件。

 

Buildr 是一个简单直观的Java项目构建系统,在进行了10个月的开发并获得许多正面反馈之后,Apache基金会将会向Buildr敞开大门并最终接手这个项目,这将是Apache基金会的第一个

 

Ruby项目。

 

BVal 实现了 Java Bean Validation 规范 1.0

 

Camel Apache Camel是Apache基金会下的一个开源项目,它是一个基于规则路由和中介引擎,提供企业集成模式的Java对象的实现,通过应用程序接口(或称为陈述式的Java领域特定语言

 

(DSL))来配置路由和中介的规则。领域特定语言意味着Apache Camel支持你在的集成开发工具中使用平常的,类型安全的,可自动补全的Java代码来编写路由规则,而不需要大量的

 

XML配置文件。同时,也支持在Spring中使用XML配置定义路由和中介规则。 其核心的思想就是从一个from源头得到数据,通过processor处理,再发到一个to目的的.

 

==============================

Cassandra Apache Cassandra是一套开源分布式数据库管理系统。它最初由Facebook开发,用于储存特别大的数据。主要特性:● 分布式 ● 于column的结构化 ● 高伸展性 Cassandra是

 

一个混合型的非关系的数据库,类似于Google的BigTable。Cassandra的主要特点就是它不是一个数据库,而是由一堆数据库节点共同构成的一个分布式网络服务,对Cassandra 的一个写

 

操作,会被复制到其它节点上去,对Cassandra的读操作,也会被路由到某个节点上面去读取。对于一个Cassandra群集来说,扩展性能是比较简单的事情,只管在群集里面添加节点就可以

 

了。Cassandra的主要功能比 Dynamo(分布式的Key-Value存 储系统)更丰富,但支持度却不如文档存储MongoDB(介于关系数据库和非关系数据库之间的开源产品,是非关系数据库当

 

中功能最丰富,最像关系数据库的。支持的数据结构非常松散,是类似json的bjson格式,因此可以存储比较复杂的数据类型。)Cassandra最初由Facebook开发,后转变成了开源项目。它

 

是一个网络社交云计算方面理想的数据库。

 

Cayenne Cayenne是Apache网站上一个开源的数据持久化框架,它提供了一个可视化的工具 

 

Chemistry  提供了 Content Management Interoperability Services (CMIS)规范的开源实现  包含如下子项目:

OpenCMIS - CMIS client and server libraries for Java

cmislib - CMIS client library for Python

phpclient - CMIS client library for PHP

DotCMIS - CMIS client library for .NET

 

Clerezza 是一个基于OSGi(开放服务网关倡议)的服务平台,它提供了一组组件(bundles)用来构建RESTFul Semantic Web应用和服务。它提供了一个API来访问RDF Graphs,一个

JaxRS实现,TypeHandlers: Jax-RS资源绑定到RDF类型。

 

============================web pro=========================

Click  是一个先进的Java企业版的Web应用程序框架,提供一个基于浏览器的富客户端编程模型。非常简单和易用,一般的开发人员在一天内就可以上手使用

是一个 Web 应用程序框架,可以用它快速地构建 Java Web 应用程序。Apache Click 的目标是提供一种无须使用 JSP 或 MVC 框架的构建 Web 应用程序的方法,这可以简化 Web 应用程

 

序的开发。Apache Click 采用 Apache License 许可协议(见 参考资料)。

 

============================================================

CloudStack 是一个开源云计算解决方案。可以加速高伸缩性的公共和私有云(IaaS)的部署、管理、配置。使用CloudStack作为基础,数据中心操作者可以快速方便的通过现存基础架构创

 

建云服务。

 

=======================web Spring====================

Cocoon 是一个基于Spring框架的围绕分离理念建立的构架,在这种框架下的所有处理都被预先定义好的处理组件线性连接起来,能够将输入和产生的输出按照流水线顺序处理。 

用户群:Apache Lenya、Daisy CMS、Hippo CMS、Mindquarry等等,Apache Cocoon通常被作为一个数据抽取、转换、加载工具或者是系统之间传输数据的中转站。 

 

=================================

Commons

 

Continuum 是最新的 CI 服务器之一,也是值得关注的一个新进入者。Continuum 的安装和配置很简单:只要下载和释放 ZIP 文件,运行命令行程序,就可以运行了。基于 Web 的界面使

 

得配置项目很容易。而且,还不需要安装 Web 服务器,因为 Continuum 内置了 Jetty Web 服务器。并且,Continuum 可以作为 Windows 服务运行,还在应用程序的某些部分嵌入了上

 

下文敏感的文档,从而提供了很多帮助。

 

Cordova 是PhoneGap贡献给Apache后的开源项目,是从PhoneGap中抽出的核心代码,是驱动PhoneGap的核心引擎。你可以把他想象成类似于Webkit和Google Chrome的关系。

 

CouchDB  是一个面向文档的数据库管理系统。它提供以 JSON 作为数据格式的 REST 接口来对其进行操作,并可以通过视图来操纵文档的组织和呈现。 CouchDB 是 Apache 基金会的顶级

 

开源项目。 落实到最底层的数据结构就是两类B+Tree 

 

Creadur 

 

Crunch 是一个基于 Adobe AIR 开发的 Less CSS 的编辑器。主要用于 Less 的编辑并编译成 CSS

 

cTAKES 临床的文本分析和知识提取系统 (cTAKES) 是一个开源的自然语言处理系统,用于从临床电子病历自由文本中抽取信息。可处理临床笔记抽取出统一的医学语言系统(UMLS)——药物,

 

疾病/障碍,标志/症状,解剖网站和程序等

 

======================================================

Curator zookeeper 的客户端调用过于复杂,Apache Curator 就是为了简化zookeeper客户端调用而生,利用它,可以更好的使用zookeeper。

 

CXF 一个开源的Service框架,它实现了JCP与Web Service中一些重要标准。CXF简化了构造,集成,面 向服务架构(SOA)业务组件与技术的灵活复用。在CXF中,Service使用WSDL标准定

 

义并能够使用各种不同的消息 格式(或binding)和网络协议(transports)包括SOAP、XML(通过HTTP或JMS)进行访问。CXF同样支持多种model 如:JAX-WS,JBI,SCA和CORBA service

 

。CXF设计成可灵活部署到各种容器中包括Spring-based,JBI,SCA, Servlet和J2EE容器

 

DB

Deltacloud 是RedHat公司于2009年9月开发的一套开源API,其定义了一种RESTful Web服务,旨在提供一种统一的方式,来与云服务提供商以及云端资源进行互动

 

Directory Apache Directory Studio 是一个 LDAP 的工具平台,用来连接到任何 LDAP 服务器并进行管理和开发工作。

主要功能:LDAP浏览器、LDIF编辑器、嵌入式 ApacheDS、ACI编辑器

 

Empire-db 是一个开源的关系型数据持久化组件,能够实现数据库无关的动态查询定义,简便的数据读取和更新。与其它持久化组件相比 如:Hibernate、TopLink、iBATIS或JPA实现,

 

Empire-db更注重编译期类型安全,减少冗余,开发效率的改进。 Empire-db所有的数据库实体都通过动态bean进行管理,因此允许在运行期改变数据模型。

 

ESME Enterprise Social Messaging Environment

 

Etch 是一个跨平台,语言和传输无关的建设和消费的网络服务框架。蚀刻工具集,包括网络服务描述语言,编译器,多种编程语言的绑定库。蚀刻也与传输无关的,可以根据需要和情况,可

 

以使用多种不同的传输。蚀刻的目标是使简单的定义小,有针对性的服务,可以很容易地访问,以类似的方式相结合,并部署。随着蚀刻,比图书馆的发展和消费服务的发展和消费变得更加

 

困难。

 

Felix 是一个OSGi版本4规范的Apache实现。OSGi是一个基于Java的服务平台规范,其目标是被需要长时间运行、动态更新、对运行环境破坏最小化的系统所使用。有许多公司(包括

 

Eclipse IDE,它是第一个采用OSGi技术的重要项目)已经使用OSGi去创建其微内核和插件架构,以允许在运行时刻获得好的模块化和动态组装特性。几个其他项目如Apache Directory、

 

Geronimo、Jackrabbit、Spring以及JOnAS也都正在转向采用OSGi。

 

====================================

Flex 是最初由Macromedia公司在2004年3月发布的,基于其专有的Macromedia Flash平台,它是涵盖了支持RIA(Rich Internet Applications)的开发和部署的一系列技术组合

 

=======================================

Flume 是一个分布式、可靠和高可用的服务,用于收集、聚合以及移动大量日志数据,使用一个简单灵活的架构,就流数据模型。这是一个可靠、容错的服务

 

Forrest  是一个把来自各种不同的输入数据源转换成用一种或多种输出格式(比如HTML,PDF等)来统一显示的发布系统。它基于Apache Cocoon并分离了内容与内容结构,不仅可以生成静态的

 

文档也可以当作一个动态的服务器

 

Geronimo 是 Apache 软件基金会的开放源码J2EE服务器,它集成了众多先进技术和设计理念。 这些技术和理念大多源自独立的项目,配置和部署模型也各不相同。 Geronimo能将这些项

 

目和方法的配置及部署完全整合到一个统一、易用的模型中。

 

===========================================

Giraph  是一个可伸缩的分布式迭代图处理系统,灵感来自 BSP (bulk synchronous parallel) 和 Google 的 Pregel. Giraph 区别于其他项目的是开源、基于 Hadoop 的架构等

 

==========================================

Gora  是一个应用于 NoSQL 数据库的 ORM 框架,支持包括:Apache HBase/Apache Cassandra

 

Gump Apache的整合工具。它以Python寫成、完全支援Apache Ant、Apache Maven等等軟體組建工具。Gump特殊的地方在於,它根據以上軟體計劃最新的版本來編譯、組建軟體。這

 

讓Gump可以在源碼匯入版本控制系統後幾小時 內,就偵測到軟體可能發生的不相容點。

 

======================================

Hadoop 是一个分布式系统基础架构,由Apache基金会开发。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力高速运算和存储。Hadoop实现了一个分

 

布式文件系统(Hadoop Distributed File System),简称HDFS。HDFS有着高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上。而且它提供高传输率(high throughput)

 

来访问应用程序的数据,适合那些有着超大数据集(large data set)的应用程序。HDFS放宽了(relax)POSIX(可移植操作系统接口)的要求(requirements)这样可以流的形式访问

 

(streaming access)文件系统中的数据。

 

======================

Hama 是个计算框架,基于BSP (Bulk Synchronous Parallel大容量同步并行)计算技术,主要针对大规模科学的计算。依赖hadoop

 

 

=======================================

HBase Hadoop Database,是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群

HBase是Google Bigtable的开源实现,类似Google Bigtable利用GFS作为其文件存储系统,HBase利用Hadoop HDFS作为其文件存储系统;Google运行MapReduce来处理Bigtable中的

 

海量数据,HBase同样利用Hadoop MapReduce来处理HBase中的海量数据;Google Bigtable利用 Chubby作为协同服务,HBase利用Zookeeper作为对应。

 

============================================

Hive 是一个基于Hadoop的数据仓库平台。通过hive,我们可以方便地进行ETL的工作。hive定义了一个类似于SQL的查询语言:HQL,能 够将用户编写的QL转化为相应的Mapreduce程序

 

基于Hadoop执行。 Hive是Facebook 2008年8月刚开源的一个数据仓库框架,其系统目标与 Pig 有相似之处,但它有一些Pig目前还不支持的机制,比如:更丰富的类型系统、更类似SQL的

 

查询语言、Table/Partition元数据的持久化等。

 

HttpComponents 也就是以前的httpclient项目,可以用来提供高效的、最新的、功能丰富的支持 HTTP 协议的客户端/服务器编程工具包,并且它支持 HTTP 协议最新的版本和建议

Isis

 

Jackrabbit 是由 Apache Foundation 提供的 JSR-170 的开放源码实现..

随着内容管理应用程序的日益普及,对用于内容仓库的普通、标准化 API 的需求已凸现出来。Content Repository for Java Technology API (JSR-170) 的目标就是提供这样一个接口。

 

JSR-170 的一个主要优点是,它不绑定到任何特定的底层架构。例如,JSR-170 实现的后端数据存储可以是文件系统、WebDAV 仓库、支持 XML 的系统,甚至还可以是 SQL 数据库。此外

 

,JSR-170 的导出和导入功能允许一个集成器在内容后端与 JCR 实现之间无缝地切换。

 

James (Java Apache Mail Enterprise Server)是Apache组织的子项目之一,完全采用纯Java技术开发,实现了SMTP、POP3与NNTP等多种邮件相关协议。

James也是一个邮件应用平台,可以通过Mailet扩充其功能,如Mail2SMS、Mail2Fax等。James提供了比较完善的配置方案,尤其是关于邮件内容存储和用户信息存储部分,可以选择在文

 

件、数据库或其他介质中保存。

James性能稳定、可配置性强,还是开源项目,所有源代码不存在版权问题,因此,James在项目中的应用日益广泛。

 

============================

jclouds 是一个开源的Java类库,用来帮你开始云计算应用开发,并可重用已有的Java和Clojure技能。该API提供云计算环境的可移植抽象层以及云规范特性,支持包括 Amazon, VMWare, 

 

Azure, and Rackspace 等云计算平台

 

Jena 是一个Java工具箱用于开发基于RDF与OWL语义(semantic)Web应用程序。它提供了一个RDF API;ARP,一个RDF解析器;SPARQL,W3C RDF查询语言;一个OWL API;和基于规

 

则的RDFS与OWL接口。

 

=======================================

JMeter 是Apache组织的开放源代码项目,它是功能和性能测试的工具,100%的用java实现。

 

jUDDI (音"Judy")是一个开源的UDDI的Java实现

 

Kafka 是一种高吞吐量的分布式发布订阅消息系统

 

Karaf 是Apache旗下的一个开源项目.Karaf同时也是一个基于OSGi的运行环境,Karaf提供了一个轻量级的OSGi容器,可以用于部署各种组件,应用程序.Karaf提供了很多特性用于帮助开发者和

 

用户更加灵活的部署应用,例如:热部署,动态配置,几种日志处理系统,本地系统集 成,可编程扩展控制台,ssh远程访问,内置安装认证机制等等.同时Karaf作为一款成熟而且优秀的OSGi运行环境以

 

及容器已经被诸多Apache项目作为基础容器,例如:Apache Geronimo, Apache ServiceMix, Fuse ESB,由此可见Karaf在性能,功能和稳定性上都是个不错的选择

 

Lenya 是java的开源内容管理系统。它基于一些标准的技术比如XML 与 XSLT。它其中的代码核心来自于另外一个开源项目Cocoon

 

Libcloud 是一个访问云计算服务的统一接口,该项目已经成为 Apache 组织的顶级项目,采用 Python 开发

 

Logging

 

=================================

Lucene 是apache软件基金会一个开放源代码的全文检索引擎工具包,是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎,部分文本分析引擎。Lucene的目的是为软件开发人

 

员提供一个简单易用的工具包,以方便的在目标系统中实现全文检索的功能,或者是以此为基础建立起完整的全文检索引擎。

 

Lucy 是一个全文搜索引擎库,使用 C 语言编写,主要面向一些动态语言,目前提供 Perl 语言的绑定。相当于是 C 语言版的 Lucene

 

Mahout  (ASF) 开发的一个全新的开源项目,其主要目标是创建一些可伸缩的机器学习算法,供开发人员在 Apache 在许可下免费使用。该项目已经发展到了它的最二个年头,目前只有一个

 

公共发行版。Mahout 包含许多实现,包括集群、分类、CP 和进化程序。此外,通过使用 Apache Hadoop 库,Mahout 可以有效地扩展到云中。

 

ManifoldCF  提供一个开源框架,用于连接源内容库,如:Microsoft Sharepoint、EMC Documentum等, 到目标库或索引, 如Apache Solr、Open Search Server或ElasticSearch等。

 

Apache ManifoldCF也为目标库定义了一个安全模型允许执行源库的安全策略。

 

Maven Maven logo项目构建工具 Maven

 

MINA 是 Apache 组织一个较新的项目,它为开发高性能和高可用性的网络应用程序提供了非常便利的框架。当前发行的 MINA 版本支持基于 Java NIO 技术的 TCP/UDP 应用程序开发、

 

串口通讯程序(只在最新的预览版中提供),MINA 所支持的功能也在进一步的扩展中。

 

================================

MRUnit 是由Couldera公司开发的专门针对 Hadoop中编写MapReduce单元测试的框架,基本原理是JUnit4和 EasyMock。MR就是Map和Reduce的缩写。MRUnit框架非常精简,其核心

 

的单元测试依赖于JUnit。而且MRUnit实现了一套 Mock对象来控制OutputCollector的操作,从而可以拦截OutputCollector的输出,和我们的期望结果进行比较,达到自动断言 的目的。

 

MyFaces 是 JSF (JavaServerFaces) Web框架 (JSR 127)的一个实现。JavaServer(tm) Faces Web框架是一个新的实现MVC模式的规范

 

=========================

Nutch  是一个开源Java 实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。包括全文搜索和Web爬虫。

 

尽管Web搜索是漫游Internet的基本要求, 但是现有web搜索引擎的数目却在下降. 并且这很有可能进一步演变成为一个公司垄断了几乎所有的web搜索为其谋取商业利益.这显然 不利于广大

 

Internet用户.

 

Nutch为我们提供了这样一个不同的选择. 相对于那些商用的搜索引擎, Nutch作为开放源代码 搜索引擎将会更加透明, 从而更值得大家信赖. 现在所有主要的搜索引擎都采用私有的排序算法, 

 

而不会解释为什么一个网页会排在一个特定的位置. 除此之外, 有的搜索引擎依照网站所付的 费用, 而不是根据它们本身的价值进行排序. 与它们不同, Nucth没有什么需要隐瞒, 也没有 动机去

 

扭曲搜索的结果. Nutch将尽自己最大的努力为用户提供最好的搜索结果.

 

Nutch 致力于让每个人能很容易, 同时花费很少就可以配置世界一流的Web搜索引擎. 为了完成这一宏伟的目标, Nutch必须能够做到:

 

每个月取几十亿网页

为这些网页维护一个索引

对索引文件进行每秒上千次的搜索

提供高质量的搜索结果

以最小的成本运作

 

 

ODE 是一个免费的具有工业品质的刚体动力学的库,一款优秀的开源物理引擎,它为主程序员Russell Smith和几位开源社区贡献者共同努力下开发的。它能很好地仿真现实环境中的可移动

 

物体,它是快速,强健和 可移植的。而且它有内建的碰撞检测系统。本人的主要工作是研究 ODE物理引擎在3D游戏中的应用。研究主要是通过学习ODE的用户手册、阅读和理解ODE的代码

 

然后掌握ODE的编程接口从而使用ODE刚体游戏引擎编 写3D游戏场景来体现ODE的应用。3D游戏场景的编写主要使用了3D图形API-OpenGL 和ODE引擎等游戏仿真技术。

 

OFBiz  是开放的电子商务平台,是一个非常著名的开源项目,提供了创建基于最新J2EE/XML规范和技术标准,构建大中型企业级、跨平台、跨数据库、跨应用服务器的多层、分布式电子商

 

务类WEB应用系统的框架。 OFBiz最主要的特点是OFBiz提供了一整套的开发基于Java的web应用程序的组件和工具。包括实体引擎, 服务引擎, 消息引擎, 工作流引擎, 规则引擎等。

 

Oltu 是OAuth协议的Java语言实现。

当前开放平台大行其道,其中的授权安全问题如何处理?oauth2.0协议是当今互联网时代用户授权和认证的标准,很好的解决了这一问题。apache孵化项目amber作为oauth2.0的java参考

 

实现与自有平台的整合

 

Onami

 

OODT  (Object Oriented Data Technology) OODT 面向对象的数据技术,开发和促进科学数据管理和归档制度,使跨学科和天体物理学之间的互操作性,行星和空间科学数据系统。使用

 

OODT的分布式对象和数据库的框架内,由来自世界各地科学家和工程师在这些不同的学科收集的数据可以联合搜索,存储,检索和分析。Apache OODT 的目标是开发一个这样的框架,由

 

社区将使用它,并执行有效率的不断输入。

 

======================

Oozie 是一个开源的工作流和协作服务引擎,基于 Apache Hadoop 的数据处理任务。Oozie 是可扩展的、可伸缩的面向数据的服务,运行在Hadoop 平台上。

Oozie 包括一个离线的Hadoop处理的工作流解决方案,以及一个查询处理 API

 

OpenJPA 是 Apache 组织提供的开源项目,它实现了 EJB 3.0 中的 JPA 标准,为开发者提供功能强大、使用简单的持久化数据管理框架。OpenJPA 封装了和关系型数据库交互的操作,让

 

开发者把注意力集中在编写业务逻辑上。OpenJPA 可以作为独立的持久层框架发挥作用,也可以轻松的与其它 Java EE 应用框架或者符合 EJB 3.0 标准的容器集成

 

OpenMeetings 是一个多语言可定制的视频会议和协作系统。它支持音频、视频,能让你查看每个与会者的桌面。OpenMeetings还包含一个白板,通过白板可以导入各种格式的图片和涂鸦

 

=================================

OpenNLP 是一个机器学习工具包,用于处理自然语言文本。支持大多数常用的 NLP 任务,例如:标识化、句子切分、部分词性标注、名称抽取、组块、解析等。

 

OpenOffice 包含很多 bug 以及新的翻译。包括性能提升和改进对 Windows 8 的升级,建议用户升级

 

OpenWebBeans 将会成为一款对被定义为JSR-299的Web Beans说明实现程序,此外它还获得了ASL的许可。

 

PDFBox

 

Perl

 

===============================================

Pig 大规模数据分析平台 Pig 是一个基于Hadoop的大规模数据分析平台,它提供的SQL-LIKE语言叫Pig Latin,该语言的编译器会把类SQL的数据分析请求转换为一系列经过优化处理的

 

MapReduce运算。Pig为复杂的海量数据并行计算提供了一个简单的操作和编程接口。

 

Pivot 是一套采用Java构建 RIA应用程序的开源平台。Pivot平台的定位是内嵌于浏览器的Flex和Silverlight等富客户端开发技术的直接竞争对手。 Pivot的实现借鉴了其它工具箱的一些点子(

 

比如Swing),此外,它也结合了Java2D在过去几年中实现的优化。在Pivot上实现应用程序的工 作主要是结合Java和XML的开发,可以采用applet的方式或者独立方式运行,同时也支持离

 

线方式或者桌面应用的方式。

 

POI I是一个开源的Java读写Excel、WORD等微软OLE2组件文档的项目。目前POI已经有了Ruby版本。

 

Portals Portals是一个协作的软件开发项目,致力于在广阔的平台和编程语言范围内,提供功能齐全的、商业品质的,及免费的门户网站相关软件。

 

Qpid  (Open Source AMQP Messaging) 是一个跨平台的企业通讯解决方案,实现了高级消息队列协议。提供了 Java、C++ 两种服务端版本以及 Java、C++、.NET、Python和Ruby语言

 

的客户端。

 

Rave 是一个全新的 Web 和社交混搭引擎。

 

River 是一个分布式计算的架构,基于原 Sun 的 JSK Starter Kit 源码,主要使用 Jini 规范

 

Roller 是一个全功能的多用户博客平台。采用Java语言开发,设计得比较精巧,源代码是很好的学习资料。它支持weblogging应有的特性如:评论功能,所见即所得HTML编辑,TrackBack

 

,提供页面模 板,RSS syndication,blogroll管理和提供一个XML-RPC 接口。

 

Santuario 是Apache上一个发展 XML 安全性方面的项目

 

ServiceMix 是一个建立在JBI (JSR 208)语法规则和APIs上的开源ESB(Enterprise Service Bus:企业服务总线)。它包括一个完整的JBI容器,其主要是由标准化信息服务和路由器,JBI管理

 

MBeans,JBI配置单元和Ant任务(安装组 件和管理容器)组成。新版本中集成了BPEL,增加了一个基于router的高性能目录,XPath转换引擎,Drools新规则,对RSS的支持与 JCA的完全结

 

合等等。

 

Shindig 实现了google的opensocial容器开源项目。

提供了一个开源的Open Social容器。有了它,就可以轻松支持Open Social啦,目前它提供了java和php两种版本。

 

Shiro 安全是企业应用中不可缺少的功能,在众多权限框架中,Shiro(其前身是JSecurity)因其简单而又不失强大的特点引起了不少开发者的注 意。随着Grails的关注度越来越高,在Grails

 

社区也出现了Shiro的插件。

 

SIS 是一个空间的框架,可以更好地搜索,数据聚类,归档,或任何其他相关的空间坐标表示的需要。

 

Sling Web内容存储框架 Apache Sling

 

SpamAssassin 这款反垃圾工具是许多商业产品背后的"秘密武器(secret sauce)",同时,很多的电子邮件服务商和垃圾过滤(工具)提供商都在使用它.专家经常将SpamAssassin看作是最好的开源

 

反垃圾工具. (不依赖于操作系统, OS-independent)

 

=======================================

Sqoop 是一个用来将Hadoop和关系型数据库中的数据相互转移的工具,可以将一个关系型数据库(例如 : MySQL ,Oracle ,Postgres等)中的数据导入到Hadoop的HDFS中,也可以将

 

HDFS的数据导入到关系型数据库中

 

Stanbol 是一个为语义内容管理设计的模块化的软件堆栈和可重用组件

 

STDCXX Apache的C++ 标准库项目(代号stdcxx ,发音为“standard C++ library” ,而不是STDCXX )是一个集算法,容器,迭代器等等功能的C++类库

 

Struts 是 Apache软件基金会(ASF)赞助的一个开源项目。它最初是 Jakarta项目中的一个子项目,并在2004年3月成为ASF的顶级项目。它通过采用 Java Servlet/JSP 技术,实现了基于

 

Java EE Web应用的MVC设计模式的应用框架,是MVC经典设计模式中的一个经典产品

 

Subversion 是一个版本控制软件的集成包,集成了包括 Subversion、Apache 和 ViewVC 三个软件。安装简单、管理方便。

 

Synapse 一个易于使用、轻量级的XML与Web Services管理和集成中间件。可用于搭建SOA和ESB的基础平台。Apache Synapse支持多种标准包括:XML、XSLT、XQuery、XPath、

 

SOAP、POX/REST、HTTP/S、JMS、、FTP、 SFTP、WS-RM、WS-Addressing、SMTP等Synapse还提供非常多的实用功能”开箱即用“不需要编程。但是也可以利用一些常用的 语言如

 

Java、JavaScript、Ruby和Groovy对它们进行扩展。

 

Syncope 是用在企业环境的数字身份管理,在JEE技术的实施和Apache 2.0许可下发布的开源系统。

 

Tapestry 是一种基于java的Web应用程序框架。Tapestry采用了组件的概念。程序员可以应用现有的组建或自定义应用程序相关的组建来构建应用程序。相对与现有的其他Web应用程序框

 

架而言,应用Tapestry会让程序员从烦琐的,不必要的底层代码中解放出来。

 

Tcl (最早称为“工具命令语言”"Tool Command Language",但是目前已经不是这个含义,不过我们仍然称呼它为TCL)是一种 脚本语言。由John Ousterhout创建。 TCL很好学,功能

 

很强大。TCL经常被用于快速原型开发,脚本编程,GUI和测试等方面。TCL念作“踢叩”(tickle)。

 

Thrift 是一个可伸缩的跨语言的服务开发框架。It combines a software stack with a code generation engine to build services that work efficiently and seamlessly between C++, 

 

Java, Python, PHP, Ruby, Erlang, Perl, Haskell, C#, Cocoa, Smalltalk, and OCaml. 著名的 Key-Value 存储服务器 Cassandra 就是使用 Thrift 作为其客户端API的

 

Tika 是一个内容抽取的工具集合(a toolkit for text extracting)。它集成了POI, Pdfbox 并且为文本抽取工作提供了一个统一的界面。其次,Tika也提供了便利的扩展API,用来丰富其对第三

 

方文件格式的支持。

 

Tiles 是一个JavaEE应用的页面布局框架。Tiles框架提供了一种模板机制,可以为某一类页面定义一个通用的模板,该模板定义了页面的整体布局。布局由可以复用的多个块组成,每个页面

 

可以有选择性的重新定义块而达到组件的复用。

 

Tomcat 是一个小型的轻量级应用服务器,在中小型系统和并发访问用户不是很多的场合下被普遍使用,是开发和调试JSP 程序的首选。对于一个初学者来说,可以这样认为,当在一台机器

 

上配置好Apache 服务器,可利用它响应对HTML 页面的访问请求。实际上Tomcat 部分是Apache 服务器的扩展,但它是独立运行的,所以当你运行tomcat 时,它实际上作为一个与

 

Apache 独立的进程单独运行的

是一个小型的轻量级应用服务器,在中小型系统和并发访问用户不是很多的场合下被普遍使用,是开发和调试JSP 程序的首选。对于一个初学者来说,可以这样认为,当在一台机器上配置好

 

Apache 服务器,可利用它响应对HTML 页面的访问请求。实际上Tomcat 部分是Apache 服务器的扩展,但它是独立运行的,所以当你运行tomcat 时,它实际上作为一个与Apache 独立的

 

进程单独运行的

 

TomEE  是经过 J2EE 6 认证的 Tomcat 企业版本,Tomcat 是目前市场占有率超过 70% 的Java 应用服务器。

Apache TomEE 是 Apache OpenEJB 的一个子项目,为 Tomcat (7.0.27) 增加了一些 Java EE 的特性,无额外的内存要求,兼容 Tomcat 上的所有应用和工具。

Apache TomEE 可让 Java EE 解决方案开发变得简单和轻松,包含的项目包括:Apache OpenEJB, Apache OpenWebBeans, Apache OpenJPA, Apache MyFaces 等等。

 

Traffic Server 是一套快速、模块化的兼容 HTTP/1.1 的反向代理服务器,与 Nginx 和 Squid 类似,目前该项目已经转到 Apache 基金会。

Traffic Server设计的思想是将一个大系统划分为若干个小的子系统,每个子系统负责专门的任务或应用。比如,Event子系统负责提供任务调度服务,Net子 系统负责提供网络服务。每个子

 

系统抽象为一个Processor,如图1所示。这种高内聚低耦合的设计原则使系统具有更好的重用性,维护性和扩展性。例 如,如果hostDBProcessor需要进行DNS解析,可以直接调用

 

dnsProcessor的相关函数,而无需关注DNS解析的细 节;dnsProcessor也只需封装DNS请求和解析DNS应答,和网络相关的功能可以调用netProcessor来完成。

 

Turbine 是基于Servlet的框架包,也是开放源代码Jakarta项目。目前还没有关于Turbine的大量文档。它类似于Struts,但是 有一些主要区别。突出的一点就是它并没有与JSP耦合。Turbine

 

的特点是它提供了大量可重用的组件。

 

Tuscany 提供一个面向服务的核心架构以支持简单快速地开发和运行面向服务的应用程序。其轻巧的运行环境为嵌入或加载到不同的平台而设计。Apache Tuscany实现服务组件架构(SCA

 

)标准,后者定义了一个简单的基于服务的模型用于创建、组装和发布独立于编程语言的服务网络,包括现有或新开发的服务。目前Tuscany社区正在开发SCA 1.0版本。Apache Tuscany也

 

同时实现服务数据对象(SDO)标准,后者提供统一的接口处理在服务网络内传递的不同格式的数据包括XML文档,并可追踪数据变化。目前Tuscany支持SDO 2.1版本。SCA和SDO技术相

 

互独立,也可协同使用以更好支持SOA。Tuscany同时提供Java和C++的实现。

 

UIMA UIMA Java 框架产生的目的是为了构建一个 UIMA 兼容的 Java 分析引擎。

UIMA 是非结构化信息管理体系结构(Unstructured Information Management Architecture,UIMA)在字处理文档、电子邮件、视频和其他非结构化信息中搜索特定的文本甚至概念。

 

从而发现、组织和传送有用的知识给客户。在分析非结构化的信息的过程中,应用的算法有统计的方法、基于规则的自然语言处 理(NLP)、信息修复(IR)、机器学习(Machine 

 

Learning)和本体论(Ontologies)等。IBM的UIMA 就是一种Framework,该Frmaework便于开发者实现、描述、组合、布署UIMA的组件和应用。

 

VCL  是一个集群平台,允许不需要修改 OpenCL 应用,而直接利用集群中所有的 GPU 设备来处理。

Velocity 是一个基于java的模板引擎(template engine)。它允许任何人仅仅简单的使用模板语言(template language)来引用由java代码定义的对象。 

当Velocity应用于web开发时,界面设计人员可以和java程序开发人员同步开发一个遵循MVC架构的web站点,也就是说,页面设计人员可以只 关注页面的显示效果,而由java程序开发人员

 

关注业务逻辑编码。Velocity将java代码从web页面中分离出来,这样为web站点的长期维护提 供了便利,同时也为我们在JSP和PHP之外又提供了一种可选的方案。 

Velocity的能力远不止web站点开发这个领域,例如,它可以从模板(template)产生SQL和PostScript、XML,它也可以被当 作一个独立工具来产生源代码和报告,或者作为其他系统的集

 

成组件使用。Velocity也可以为Turbine web开发架构提供模板服务(template service)。Velocity+Turbine提供一个模板服务的方式允许一个web应用以一个真正的MVC模型进行开发。

 

Web Services 是基于 Spring 框架的 Web 服务框架,主要侧重于基于文档驱动的Web服务,提供 SOAP 服务开发,允许通过多种方式创建 Web 服务。

 

Whirr 提供了一组 Java 类库用来运行云服务,基于 jclouds 开发(jclouds 是一个开源的Java类库,用来帮你开始云计算应用开发,并可重用已有的Java和Clojure技能。该API提供云计算环

 

境的可移植抽象层以及云规范特性,支持包括 Amazon, VMWare, Azure, and Rackspace 等云计算平台。)

 

==========================

Wicket 是一个Java 语言的Web开发框架,与Struts,WebWork,Tapestry 相类似。其特点在于对Html和代码进行了有效的分离(有利于程序员和美工的合作),基于规则的配置(减少了

 

XML 等配置文件的使用),学习曲线较低(开发方式与C/S相似),更加易于调试(错误类型比较少,而且容易定位)。

 

Wink是一个轻量级的 JavaScript 框架帮你构建手机的web应用

 

Wookie  能够同时作为 Google Wave Gadgets 和 W3C Widget 包的服务器。 Apache Wookie 是一个服务器应用,可以作为一个 Web 应用下载安装,或者作为单独的服务器运行。

获取 Apache Wookie 源代码也是查看 W3C Widget 源代码的一种很好的方法。

 

Xalan 是一套xslt处理器(有C和JAVA语言两种版本),用来将XML文件转换为HTML,TEXT和XML等其他类型文件格式。支持XSLT1.0和XPATH 1.0版。开发人员可以通过命令行方式或在

 

JAVA APPLET和SERVLET中使用,并可以作为自己开发的应用程序的类库使用。xalan-java实现的是transformation API for XML(TRaX)接口,此接口为jaxp1.2标准中的一部分。

 

Xerces 是由Apache组织所推动的一项XML文档解析开源项目,它目前有多种语言版本包括JAVA、C++、PERL、COM等。

下载地址请进入Xerces主页后选择相应的语言版本

 

XMLBeans 是一个XML-Java绑定工具,利用它可以很方便地解析XML文档

 

XML Graphics 发展 XML 与图形进行转换的计划项目

 

==========================================

ZooKeeper 是Hadoop的正式子项目,它是一个针对大型分布式系统的可靠协调系统,提供的功能包括:配置维护、名字服务、分布式同步、组服务等。ZooKeeper的目标就是封装好复杂

 

易出错的关键服务,将简单易用的接口和性能高效、功能稳定的系统提供给用户。

 

 

Foundation Projects

 

Attic  是一个可以保证文件不重复的备份程序。Attic 的主要目标是提供一个高效和安全的方法来备份数据。重复数据删除技术的使用使得 Attic 适合日常备份因为只有实际改变保存。主要特点:空间高效存储、可选的数据加密、场外备份。

 

Conferences

 

Community Development

 

Incubator 是工程希望成为完全独立的Apache 软件基金会工程的跳板。代码来自外部组织和现有的外部工程期望移动到Apache 将通过Incubator 输入。

 

Infrastructure

 

Labs

 

Legal Affairs

 

Public Relations

 

Security

 

Travel Assistance

 

 

 

 

来自维基百科

 

顶级项目

ActiveMQ · Ant · Axis · Apache HTTP Server · APR · Beehive · Camel · Cassandra  · Cayenne · Cocoon · Commons · Continuum · CouchDB · Derby · Directory · Excalibur · Felix · 

 

Forrest · Geronimo · Gump · Hadoop · Harmony · HBase · iBATIS · Jackrabbit · James · Lenya · Lucene · Maven · mod_perl · MyFaces · OFBiz · OpenEJB · OpenJPA · OpenOffice · 

 

POI · Roller · Shale · SpamAssassin · stdcxx · Struts · Subversion · Tapestry · Tomcat · Traffic Server · Tuscany · Velocity · Wicket · XMLBeans

 

其他项目

Jakarta项目 · Apache XML · Apache Incubator

 

子项目

BCEL · BSF · Cactus · JMeter · Slide · Xerces · Batik · FOP · Log4j · XAP · River · ServiceMix · Log4Net · Abdera · Ivy · CXF · ODE · Solr

 

 

HTTP Server:可以在UNIX,MS-Windows,Macintosh和Netware操作系统下运行的HTTP服务器的项目

 

Ant:基于Java语言的构建工具,类似于C语言的Make工具。

 

AXIS2:Web服务(SOAP, WSDL)的处理器,基于AXIS1.X重新构建。

 

APR:(也就是:Apache Portable Runtime)C语言实现的便携运行库的管理工具。

 

Beehive:为了简单构建J2EE应用的对象模型。

 

Apache Camel:一个开源的企业应用集成框架。

 

Cocoon:一个基于组件技术和XML和Web应用开发框架。

 

CloudStack:一个开源的云计算IaaS管理平台。

 

DB:关于数据库管理系统的几个开源项目集合

 

Apache::Deploy:是一个(R)?ex的模块,用来快速发布网站到Apache和WAR文件到Tomcat.简化了多服务器应用的发布过程。支持基于Git的发布和rpm/deb发布,同时简化了构建rpm和

 

deb包。

 

Derby:一个纯JAVA的数据库管理系统

 

Directory:基于JAVA语言的目录服务器,支持LDAP等目录访问协议。

 

Excalibur:Apache Avalon项目的前身。

 

Forrest:一个发布系统框架的项目。

 

Geronimo:J2EE服务器

 

Gump:集成管理器

 

Hadoop:并发运算编程工具和分布式文件系统。

 

Harmony:一个兼容JAVA标准的JAVA语言的开源实现。

 

HiveMind:一个服务(Services)与配置(configuration)的微内核

 

iBATIS:一个基于JAVA语言的数据持久化框架

 

Incubator:为了帮助那些希望获取Apache软件基金会支持的计划进入Apache软件基金会的审核项目

 

Jackrabbit:内容仓库API标准(Content Repository for Java Technology API,即JSR-170)的一个开源实现项目。

 

Jakarta:在ASF中,基于Java语言的一组开源子项目的集合,现在包含的子项目有:BCEL,BSF,Cactus,Commons,ECS,HttpComponents,JCS,JMeter,ORO,Regexp,Slide,

 

Taglibs,Turbine,Velocity

 

James:JAVA语言实现的邮件新闻服务器

 

Labs:为基金会成员提供最新变更的思维的计划

 

Lenya:内容管理系统

 

Logging:一个开发可以在C++、Java、Perl、PHP、.NET 计算机语言下运行的通用日志工具项目集合。

 

Lucene:高性能的,基于Java语言的全文检索项目。

 

Maven:项目集成构建工具

 

MyFaces:一个JavaServer Faces(JSF)的实现框架。

 

mod_perl:为Apache服务器提供Perl语言集成的项目

 

POI:提供API以供JAVA程序对Microsoft Office格式文件的读/写。

 

Portals:与门户(Portal)技术相关的几个项目集合

 

Santuario:发展XML安全性方面的项目

 

Shale:在Struts之后,发展起来基于JAVA语言Web应用框架

 

SpamAssassin:垃圾邮件过滤器

 

Struts:一个基于J2EE平台的MVC 设计模式的Web应用框架

 

Subversion:一个软件版本管理系统。

 

Tapestry:另一个J2EE平台的、能产生动态、高性能Web应用的框架。

 

TCL:为Apache服务器提供Tcl语言集成的项目

 

Tomcat:一个运行Java Servlet与JavaServer Pages(JSP)的容器。

 

Web Services:与Web Services技术相关的项目集合

 

Xalan:XML转换处理器

 

Xerces:一组可以在Java,C++,Perl 计算机语言下使用的XML解析器项目。

 

Apache XML:XML解决方案

 

XMLBeans:基于JAVA语言XML对象绑定工具

 

XML Graphics:发展XML与图形进行转换的计划项目

你可能感兴趣的:(project,apache基金会)