Maven dependency and repository

我们看一个最常见到的例子:
4.0.0
com.mycompany.app
my-app
jar
1.0-SNAPSHOT
junit
junit
3.8.1
test
 
该例子表示你的project有一个junit dependency。你可能会问:这个dependency从哪里来?junit jar在哪里?
 
A dependency 是对 repository 里的某个 artifact 的引用。 POM 定义了一个 dependency ,执行的时候就会根据 dependency groupId, artifactId and version ,来 search it from repository 你根本不需要在pom.xml里指明该dependancy来自哪个repositorymaven会先查找local repository,如果local repository存在该dependancy引用的artifact,就使用它,如果不存在,则搜索所有你设置的remote repository,如果找到它,就把它downloadlocal repository缺省状态下,通常都是从central maven repository( http://www.ibiblio.org/maven2)来download artifact。 如果你的 pom.xml 定义了多个 remote repository ,那么就按顺序依次试图从 remote repository 下载.
 
例如上面的例子,maven会先check local repository看是否有想要的junit artifact,如果没有,则从remote repository download到local repository。这时,local repository里artifact目录结构包含:
  Maven dependency and repository_第1张图片
 
下图是在repository里所有artifact通用的目录结构:
  Maven dependency and repository_第2张图片
 
groupId是fully qualified domain name,例如为x.y.z,则结构为:
  Maven dependency and repository_第3张图片
 
maven 是如何根据定义的 dependancy 来从 repository 里查找呢?例如上例,就会根据 groupId “junit”, artifactId “junit”, and version  3.8.1” ,在 repository 里查找 ~/.m2/repository/junit/junit/3.8.1/junit-3.8.1.jar
 
 
dependancy功能是maven最强大的功能和最显著的优势。以前maven没出现之前,通常的project都会把要用到的jar files都放在project subdirectory下,或开发一个web app,你要把10多个jar添加到classpath,并把它们放到lib目录下。这样如果你开发100个类似的web app,你的每一个web app开发目录下面都会包含有这些jar files。这样如果某个jar的版本出现更新,就会要更新100project里的jar。而使用maven,就会大大减轻你的工作量。
 
例如,你有100个web app都使用了spring 1.2.6 framework,如果你使用maven,你不需要存储所有的spring jars到各个project里,你只需要在POM.XML里定义一个spring dependancy,那么如果升级到spring 2.0,只需要把pom.xml里dependancy的修改为2.0即可。
 
 
Dependency机制介绍
 
Dependency机制的三个知识点
  • Transitive Dependencies
  • Dependency Scope
  • Dependency Management
Transitive Dependencies (可传递的依赖)
这是maven 2.0的新特征。 它使你不需要指定 dependency 的位置而自动定位。而且可传递的依赖就是说依赖能够自动继承和传递,例如 project A 依赖 project B artifact ,而 project B 则依赖 project C artifact ,那么在 build project A 时,就会使用到所有 project 、子 project 的依赖。
 
一个project的 依赖的总个数没有限制,但是如果出现死循环依赖则会出现问题。
 
由于依赖可以传递,因此有可能一个project要依赖的东东会很多,因此可以通过下列几种方式来限制要包括的dependency:
  • Dependency mediation – 意思是强烈建议显式设置你使用的dependency的版本号,因为dependency可能会有多种版本。目前Maven 2.0支持"nearest definition"(见下面的解释)。注意:如果在dependency tree的同一个depth里定义了同一个dependency2个版本,那么使用先定义的那个版本
    • "nearest definition" 表示在dependencies tree里最靠近你的project的版本。例如,如果project A的依赖性为:A -> B -> C -> D 2.0A -> E -> D 1.0, 那么D1.0版本将会被使用。因为从A通过E到达D的路径是最短的。如果本例你硬是想要使用D 2.0,那么你可以在A里定义一个Ddependency
 
  • Dependency management – 表示maven允许你在你的pom.xml里设置你要使用的depedency的版本号,即使这个depedency你可能不知道是从哪里来的可传递依赖,也不知道该依赖定义的版本是什么,你都可以根据“nearest definition”法则来在你的pom.xml里设置版本号。例如上面的例子,你可以直接在A里设置对D的依赖(设置版本号),即使A并不直接使用D
 
  • Dependency scope – 尽量为要包含的dependencies设置要用到它的scope下面会详细解释
 
 
Dependency Scope
Dependency scope 是设置什么 stage 要使用它,用来限制依赖的传递。
 
总共有5种Scopes:
  • compile – 这是缺省scope,表明是所有任务所需的资源。“Compile dependencies are available in all classpaths.
  • provided – 表示该dependencyJDK部分或应用服务器的classpath里已经自带的资源,例如EJBdependency jars,只需要在compile时使用,在例如打包时就不应该把它打包进jar, war or ear里,因为JDK or APP SERVER里本身就有。
  • runtime - this scope indicates that the dependency is not required for compilation, but is for execution. It is in the runtime and test classpaths, but not the compile classpath.
  • test – 表示该dependency只会在test compilation and execution phases使用。例如在使用junit依赖时,scope参数的值为test来告诉Maven这个依赖项只是在测试阶段所需的,而不是运行时所需的资源。
  • system - this scope is similar to provided except that you have to provide the JAR which contains it explicitly. The artifact is always available and is not looked up in a repository. 后面会详细讲解
不同的scope会影响“依赖的依赖”的scope。下表列出的就是当一个“依赖”的scope设置为最左一列的scope,那么设置成最上一行scope的“依赖的依赖”的scope将发生的变化列表。
  Compile provided runtime test
compile compile(*) - runtime -
provided Provided provided provided -
runtime Runtime - runtime _
Test Test - test -
 
 
Dependency Management
在parent pom里 使用< dependencyManagement>来简化dependency设置。举个例子:
Project A:
 ...
 
   
      group-a
      artifact-a
      1.0
     
       
          group-c
          excluded-artifact
       
     
   
   
      group-a
      artifact-b
      1.0
      bar
      runtime
   
 
 
Project B:
 ...
 
   
      group-c
      artifact-b
      1.0
      war
      runtime
   
   
      group-a
      artifact-b
      1.0
      bar
      runtime
   
 
 
下面通过在parent pom里使用< dependencyManagement>来管理child pom要使用的dependencies。
Parent Project:
 ...
 
   
     
        group-a
        artifact-a
        1.0
 
       
         
            group-c
            excluded-artifact
         
       
 
     
 
     
        group-c
        artifact-b
        1.0
        war
        runtime
     
 
     
        group-a
        artifact-b
        1.0
        bar
        runtime
     
   
 
 
使用上面parent pom就会简化child pom的dependency设置:
 ...
 
   
      group-a
      artifact-a
   
 
   
      group-a
      artifact-b
     
      bar
   
 
 
注意:在上面的dependency引用中,非jar的必须使用 element
Dependency management的另一个很有用的用处就是控制dependency的版本。还是举例:
Project A:
 4.0.0
 maven
 A
 pom
 A
 1.0
 
  
    
       test
       a
       1.2
    
    
       test
       b
       1.0
       compile
    
    
       test
       c
       1.2
       compile
    
    
       test
       d
       1.2
    
  
 
 
Project B:
 
    A
    maven
    1.0
 
 4.0.0
 maven
 B
 pom
 B
 1.0
 
   
     
        test
        d
        1.0
     
   
 
 
   
      maven-test
      a
      1.0
      runtime
   
   
      maven-test
      c
      runtime
   
 
 
上面可以看出project A是project B的parent,A和B都定义a, c, d dependencies,那么如果对project B执行maven命令,会采用哪个定义的呢?答案如下:
  • dependency a and c将会采用1.0版本。尽管在parent project A里定义的a and d的版本是1.2,但根据dependency mediation "nearest definition"特性,采用的是project B定义的版本。
  • dependency b只在parent project A里有定义,因此就采用project A的定义。即使Dependency c会使用不同版本的b, 如果执行project B还是会采用project A定义的版本(还是根据dependency mediation "nearest definition"特性)。
  • dependency d的情况和dependency b的差不多:由于它在AB都用定义,因此是采用project B定义的版本1.0。假如Dependency c会使用不同版本的d, 如果执行project B还是会采用project B定义的版本(还是根据dependency mediation "nearest definition"特性)。
System scope Dependency
System scopedependencies总是available的,而且不需要从repository里获取,因为定义成system scopedependencies都是由JDK or VM提供的。典型的例子就是JDBC standard extensionsJava Authentication and Authorization Service (JAAS).
例子 :
 ...
 
   
      javax.sql
      jdbc-stdext
      2.0
      system
      ${java.home}/lib/rt.jar
   
 
 ...
如果你的 artifact 来自 JDK's  tools.jar ,那么 system path 应该定义为:
 ...
 
   
      sun.jdk
      tools
      1.5.0
      system
      ${java.home}/../lib/tools.jar
   
 
 ...
 
 
 
Repository介绍
 
Artifact Repositories
Repository 就是用来存储 artifacts and dependencies (实质也就是 artifact )的地方。
2 种类型的 repositories: local and remote local repository 里存储了因有使用需要而从 remote repository 下载的 artifacts  cache ,还存储了你在本地 build 的,但还没有发布到 remote repository artifacts
Remote repositories 能够被 accessed by  各种协议(如 file://  and  http:// )。 Remote repositories 可以是真正供所有人都可以进入的 repositorie (例如: Maven's central repository  repo1.maven.org 就是典型例子 ) ,也可以是一个 build 在你公司内部 http server internal repositories ,它只在你们的开发团队里共享。
The local and remote repositories 的结构是相同的,但作为 maven 的使用者,我们不需要去深入了解它的结构。
 
Why not Store JARs in CVS?
Maven强烈建议不要在你的project里包含任何要引用的JARs,即project不要存储这些jars,而应该定义对这些jarsdependency。例如,很多的project都会使用到一些常用的jar(如junit, XML parsersstandard utilities),你不要把他们的jar都放入你的project里,而应该使用它们的dependencies
这些dependencies存储在local repositoty里可以供成千上万个project使用 ,其好处有:
·          It uses less storage  –  每个JAR只存储在repository一个地方,所有的project如果要使用它就定义它的dependency即可,节约了空间,同时也使你的project cleaner
·          It makes checking out a project quicker  - initial checkout, and to a small degree updating, a project will be faster if there are no large binary files in CVS. While they may need to be downloaded again afterwards anyway, this only happens once and may not be necessary for some common JARs already in place.
·          No need for versioning  – CVS and other source control systems are designed for versioning files, but external dependencies typically don't change, or if they do their filename changes anyway to indicate the new version. Storing these in CVS doesn't have any added benefit over keeping them in a local artifact cache.
 
Using Repositories
通常, 你不需要对 local repository 做任何事,除非你想重新 download 所有的 artifact 而清空 local repository
而对于 remote repositories,  它们是用来 download and upload artifact  ( 当然,你必须有权限才可以操作 ).
Downloading from a Remote Repository
当一个 project 定义的 dependency  local repository 里找不到,或者 remote repository 包含了新版本时,就会激活 Download the dependency from remote repository 的操作。
缺省情况下,会从 maven central repository (http://repo1.maven.org/maven2 )  下载。如果你还希望能够从其他的 remote repository 下载(比如要下载只供你们 team 使用的 artifact ),你需要在 POM.XML 里做下列设置:
 ...
 
   
      my-internal-site
      http://myserver/repo
   
 
 ...
上述设置也可以在 settings.xml
Using Mirrors for the Central Repository
就象web server一样,central repository有时也会down机。如果这种情况发生了,你可以在settings.xml 里设置 element 详见 Using Mirrors for Repositories .
 
Build Offline
如果你在使用maven build project时你的电脑无法连上网,那么你可以在mvn命令里添加-o参数
 mvn -o package
但要注意:许多 plugins 在设置为 offline 的情况下不会执行任何需要连接上网的操作,就会导致失败。
 
Internal Repositories
 
对于团队合作开发的project,建一个internal repository,使得团队成员能够共享、下载、上传最新的artifact,是非常必要的。 internal repository 并没有什么特别,它实际上就是一个 remote repository
团队成员可以使用 HTTP or the file system (using a  file://  URL) 的方式从 internal repository 下载 artifact ,也可以使用  SCP, FTP, or a file copy 的方式上传 artifact internal repository
之后会有一篇文章专门讲如何 set up, use and deploy internal repository.

转自 http://blog.csdn.net/totogogo/article/details/1956381

你可能感兴趣的:(java)