收集一些常用的图像处理网站

最近刚好在看“Image and video processing: From Mars to Hollywood with a stop at the hospital”, 有些网站感觉不错,特记录一下


Image Processing On Line (IPOL):  http://www.ipol.im/

Matlab (general purpose): http://cn.mathworks.com/solutions/image-video-processing/index.html

ITK (medical imaging):  http://www.itk.org/

FSL (brain imaging): http://fsl.fmrib.ox.ac.uk/fsl/fslwiki/

Adobe Products: http://www.adobe.com/products/photoshopfamily.html?promoid=JOLIW

Python Imaging Library:  http://www.pythonware.com/products/pil/

OpenCV:   http://opencv.org/

Sparse Modeling 1: http://spams-devel.gforge.inria.fr/

Sparse Modeling 2: http://iie.fing.edu.uy/~nacho/cosmos/

TED Talk: A cinematic journey through visual effects    http://www.ted.com/talks/don_levy_a_cinematic_journey_through_visual_effects#

Optical illusions   http://eyetricks.com/0101.htm


http://rs.io/100-interesting-data-sets-for-statistics/

100+有趣的统计数据集


 如果你想开发反垃圾软件服务,或者只是分析通常垃圾邮件的内容,你需要数据。 UCIrvine提供这些数据。 https://archive.ics.uci.edu/ml/datasets/Spambase

如果你想做反垃圾短信服务,你依旧可以找到 相关数据http://www.dt.fee.unicamp.br/~tiago/smsspamcollection/

MNIST数据库是机器学习领域的一个经典。它是由一组带标签的手写字符组成,这对OCR算法来说是必不可少的。如今,一些算法的判断能力甚至比人类法官还要准确!在将来,我们会要求让机器来做判决  http://yann.lecun.com/exdb/mnist/

UCI的另一个数据集:其中,图像被简单的分为广告和非广告两种。基于该数据集可以自动拦截广告或进行垃圾邮件的检测,也许还能应用到Google Glass中,过滤掉现实生活中的广告,那一定是一件很酷的事情。我们看到的将不再是一个广告牌,而是自然景观的虚拟扩展  http://archive.ics.uci.edu/ml/datasets/Internet+Advertisements

想读他人的邮件么?即使你想,你也没有那个技术,更没有哪个胆量去。来看看安然公司的文集数据库吧。这个数据库包括来自 150多个使用者的100万封邮件,大部分邮件来自Enron公司的管理层,以文件夹的形式呈现。http://www.cs.cmu.edu/~./enron/

Google已经开放了所有的Google Book字串数据(n-gram)。每个字串实际上是由n个单词组成的短语,开放的数据集中包括了1-gram到5-gram等不同长度的字串数据。该数据集的建立是“基于1500年到2008年之间出版的520万册书籍”。我们可以通过这一数据集来判断哪些短语被过度使用,哪些短语已经过时,哪些短语面临被淘汰的危险(友情提醒:有些人甚至已经抢先注册了clichealert.com域名)。

开发了一个新的图像压缩算法,需要数据进行测试?试试 CSAIL的小图像数据集。http://groups.csail.mit.edu/vision/TinyImages/

 如果觉得这些图像太小了,试试 ImageNet数据集。如果你想训练一个算法识别独角鲸,可以先用这些数据训练。http://www.image-net.org/

还不够?试试 维基百科所有的图片。http://meta.wikimedia.org/wiki/Wikix

 有大量的数据可被R操作,你所需的只是安装一个包。 Ecdat是其中的一个包,包括大量的计算数据。我还见到过对数学水平和抽烟量关系的分析。 http://cran.r-project.org/web/packages/Ecdat/index.html

你知不知道你可以 下载Arxiv上所有的PDF?一旦我们可以教会机器自然语言,我们就可以让计算机阅读所有文档为我们提取重点。 http://arxiv.org/help/bulk_data_s3

哈佛大学开放了哈佛大学图书馆持有的“ 超过1200万的材料数据记录”数据集,包括了书籍、期刊、电子资源、手稿、档案材料、音频、视频等各种形式的资料。http://openmetadata.lib.harvard.edu/bibdata

 有一个有趣的数学问题叫名人问题,你需要找出一个每个人都认识,但是不认识任何人的人。但生活中真的有名人问题么?试试 雅虎的明星脸集http://webscope.sandbox.yahoo.com/catalog.php?datatype=r

讲述潜在语义分析LSA  http://blog.sina.com.cn/s/blog_62a9902f0101cjl3.html

傅里叶分析  点击打开链接

文章很简明的介绍了傅里叶级数,尤其是关于正余弦在时间轴上的投影为频域(从侧面看过去)甚是经典,然后就是相位的解释,一直以来学习正余弦总是不能理解相位是怎么个表示方式,在大牛的指导下,原来一切都是起源于圆周运动在时间轴上的投影。还有虚轴和实轴的解释,是我原来没有看到过的,然后将旋转特性很好的加入到正余弦的关系中。实在厉害!

傅里叶分析是很基础的信号处理知识,不仅有明确的物理意义,而且应用广泛,直到现在仍然有很多的创新,如“Recent Developments in the Sparse Fourier Transform, A compressed Four”等等,还有DCT....

因此,在学习基本方法的时候要把握好物理含义,深刻理解,然后才能有所创新。

知乎上大牛:点击打开链接


关于机器学习的入门知识:http://www.52ml.net/16632.html   其中的三本书很经典

关于介绍一下machine learning 方法的总结:http://www.metacademy.org/roadmaps/


稀疏表达、张量文章:http://www.cvchina.info/2010/06/01/sparse-representation-vector-matrix-tensor-1/

压缩感知科普文章:http://www.cvchina.info/2010/06/08/compressed-sensing-2/




     关于tensor method学习中的一些数据测试集: 点击打开链接,可以参看文章“Tensor Decompositions for Signal Processing Applications”



你可能感兴趣的:(data,sets)