ruby爬虫 以及在ruby中通过ActiveRecord使用数据库

阅读更多

今天写了个挺好玩的东西,看着数据库里面满满的数据,别提多开心了。

具体代码就不贴了,简单介绍下使用到的东西。

 

Crawler 爬虫

一开始打算用http 和 正则来实现,后来发现这个暴爽的GEM : hpricot

这个东西就是个HTML parser ,使用起来特简单,语法和 protype 类似 。

 

ruby 中使用 ActiveRecord

require "rubygems"
require "active_record"
require "yaml"

#载入外部YML数据库配置文件
dbconfig = YAML::load(File.open 'database.yml')
ActiveRecord::Base.establish_connection dbconfig


#然后就可以和rails 一样正常使用 ActiveRecord了
class Article < ActiveRecord::Base
  has_and_belongs_to_many :tags
end

class Tag < ActiveRecord::Base
  has_and_belongs_to_many :articles
end
 

 

 

你可能感兴趣的:(Ruby,ActiveRecord,Rails,rubygems,HTML)