浏览SIGMOD 2009

(发现CSDN的blog终于可以上传图片了...)

 

想了解一下当前database领域的热点,所以最近摘要性的浏览了一下SIGMOD 2009的session和部分paper,简单的罗列一下:

session 1 & session 4: security
这两个session都是关于security的,database的老牌主题,我个人没啥兴趣,就此打住。

session 2: databases on modern hardware
很有意思的一个话题。研究的是一些新的硬件会给database的设计和性能带来什么样的影响。比如SSD,它的random read的性能要比disk好几个数量级,如果用SSD来做存储的话,原有的一些database的优化和index就可能失去了意义,同时有会出现一些新的更有效的算法。这个session的三篇论文,一篇关于multi-core,一篇关于SSD,一篇关于flash。

session 3: information extraction
没有细看,不确定这里的IE侧重于哪个方面。

session 5: large-scale data analysis
这是个很有趣的主题,侧重于distributed storage。没来得及细看,不过有一篇文章挂了Raghu Ramakrishnan的大名,是关于如何构建分布式存储的view和index的,质量应该不会差吧。

session 6: entity resolution
不懂,不了解。

session 7: testing and security
……

session 8: column stores
热切关注中。column store是近几年比较热的一个topic,打算过阵子单写篇文章,这里就不详述了。

session 9: data on the web
侧重于web数据的处理,包括web exaction和keyword search等内容。说到keyword search,补充一句,这两年貌似很多人做,SIGMOD2009似乎还专门为此单开了一个workshop。

session 10 & session 12: probabilistic databases
大致了解一些。所谓probabilistic database,个人理解,就是将模糊查询以概率的形式引入到了database。这也包括了两方面,一方面,query可以是模糊的,比如“大约在1995年发布的电影”,这样的话,返回的结果不仅仅包括95年的电影,可能还包括94年,97年的电影。另一方面,query的数据也可能是模糊的,这可能是因为存储的数据并不精确,或者已经过时,因此需要一个概率来表示它的精确程度。这个课题做深了还有很多有意思的东西,不细讲了(也讲不了,不懂啊….)。

session 11: database optimization
没啥说的,打有database,就有这个topic。

session 13: skyline query processing
不懂。

session 14: understanding data and queries
从字面上理解,这应该是和database的UI有关的东东。应该是HCI,AI和database的交叉领域吧。

session 15: nearest neighbor search
针对spatial data的session。现在location data这么火,spatial database也跟着重新热起来了。
session 16: query processing on semi-structured data
从其中的几篇论文来看,关注的是XML-based DB和RDF-based DB。用XML或者RDF来表达semi-structure data,然后探讨怎样更好的存储和查询这些类型的数据。

session 17: data integration
真的不懂….

session 18: keyword search
前面提过一下。keyword search的最大好处就是提高了user experience。想想以后可以像用google一样用database,多爽啊。不过以我对NLP和IR的了解,现在还做不到很好吧。

session 19: semi-structured data management
和session 16近似。session 16侧重于对XML或者RDF数据的query processing,这个session侧重于data structure和storage。

session 20: data management pearls
不懂。大杂烩吧。

session 21: indexing
老话题。

后面还有几个industrial session,有关于stream data warehouse的,有关于hardware,有关于query optimization….很多话题和前面重复,就不赘述了。

 

 

 

你可能感兴趣的:(浏览SIGMOD 2009)