lingpy

论文笔记--An Overview of Cross-Media Retrieval: Concepts, Methodologies, ...-2018-(一)

论文信息：
论文-An Overview of Cross-Media Retrieval: Concepts, Methodologies, Benchmarks, and Challenges-2018-彭宇新
文末附50+篇跨媒体相关的英文论文下载地址

笔记包括两个部分。一是关于跨媒体检索相关概念和方法(1.1-1.7)，二是跨媒体检索的实验和总结挑战(1.8-1.11)。整体目录如：

（一）跨媒体检索相关概念和方法
（二）跨媒体检索的实验和总结挑战

文章目录

An Overview of Cross-Media Retrieval: Concepts, Methodologies, Benchmarks, and Challenges(一)
- 文献引用格式
- 摘要和目标
- 跨媒体检索定义
- 跨媒体检索相关工作
- 公共子空间学习(COMMON SPACE LEARNING, CSL)
- 跨媒体相似度衡量（CROSS-MEDIA SIMILARITY MEASUREMENT）
- 跨媒体检索的其它方法
- 资源
- - 50+篇跨媒体相关英文论文
  - 附：论文的参考文献

An Overview of Cross-Media Retrieval: Concepts, Methodologies, Benchmarks, and Challenges(一)

文献引用格式

Y. Peng, X. Huang and Y. Zhao, “An Overview of Cross-Media Retrieval: Concepts, Methodologies, Benchmarks, and Challenges,” in IEEE Transactions on Circuits and Systems for Video Technology, vol. 28, no. 9, pp. 2372-2385, Sept. 2018. doi: 10.1109/TCSVT.2017.2705068

摘要和目标

摘要
跨媒体作为作为一项相对较新的研究主题，其概念，方法和基准在文献中尚不清楚。为解决这些问题，本文回顾了100多篇参考文献，概述了概念，方法，主要挑战和开放性问题，并建立了基准，包括数据集和实验结果。
本文构建了一个新的数据集XMedia，这是第一个公开可用的数据集，最多包含五种媒体类型（文本，图像，视频，音频和三维模型）。
目标

总结现有的工作和方法，以提供概述，这将有助于跨媒体检索的研究。
建立基准，包括数据集和实验结果。这将有助于研究人员专注于算法设计，而不是耗时的比较方法和结果，因为他们可以直接采用基准来及时评估他们提出的方法。
提供新的数据集XMedia，以全面评估跨媒体检索。这是第一个公开可用的数据集，包含多达五种媒体类型（文本，图像，视频，音频和3D模型）。
提出主要挑战和开放性问题，这对于跨媒体检索的进一步研究方向具有重要意义。

跨媒体检索定义

以两种媒体类型 $X$ 和 $Y$ 为例，训练数据可表示为 $D_{tr}=\{X_{tr},Y_{tr}\}$ 其中 $X_{tr}=\{x_{p}\}^{n_{tr}}_{p=1}$ ， $Y_{tr}=\{y_{p}\}^{n_{tr}}_{p=1}$ 。 $n_{tr}$ 表示用于训练的媒体实例的数量，并且 $x_p$ 表示第 $p$ 个媒体实例。 $x_p$ 和 $y_p$ 之间存在共存关系，这意味着不同媒体类型的实例一起存在以描述相关语义。

另外，提供训练数据的语义类别标签，表示为 $\{c^X_p\}^{n_{tr}}_{p=1}$ 和 $\{c^Y_p\}^{n_{tr}}_{p=1}$ ，其指示媒体实例所属的语义类别。

类似地，测试数据表示为 $D_{te}=\{X_{te},Y_{te}\}$ ，其中 $X_{te}=\{x_{p}\}^{n_{te}}_{p=1}$ ， $Y_{te}=\{y_{p}\}^{n_{te}}_{p=1}$ 。

而我们的目标是计算跨媒体相似度 $sim(x_a,x_b)$ ，并在测试数据中检索不同媒体类型的相关实例以用于任何媒体类型的一个查询。

跨媒体检索相关工作

下图是从论文中截取的跨媒体检索相关工作。其中U表示无监督学习，S表示半监督学习，F表示监督学习方法，R是涉及相关反馈的方法(下一节同)。

公共子空间学习(COMMON SPACE LEARNING, CSL)

基于公共空间学习的方法目前是跨媒体检索的主流。本文主要介绍现有方法的七大类，表1.1给出了这7种方法的详细描述，其中优缺点是笔者总结的。

表1.1 基于公共子空间的N（7+n）种方法

方法名称	简介	相关论文	优缺点
Traditional Statistical Correlation Analysis Methods (CCA)	传统的统计相关分析方法是CSL的基本范式和基础，主要通过优化统计值来学习公共空间的线性投影矩阵。	U:[18][19][22][24][30] F:[23][26][27][28][29] U-F:[25]	优:相对有效,容易训练和实施缺:难以模拟跨媒体数据复杂的相关性，大多数只能模拟两种媒体类型
DNN-based	基于DNN的方法以深度神经网络为基本模型，旨在利用其强大的抽象能力进行跨媒体相关学习。	U:[24][33][34][35][36][37][38][39][41][42] F:[12][40][43]	优: 具有处理复杂跨媒体相关性的抽象能力缺: 暂定
Cross-Media Graph Regularization Methods	跨媒体图正则化方法采用图模型来表示复杂的跨媒体相关性	U:[51] F:[7][49]	优:可以模拟两种以上媒体类型缺:时间和空间开销较大
Metric Learning Methods	度量学习方法将跨媒体关联视为一组相似/不相似的约束	F:[7][54]	优:保留了语义相似信息缺:较多依赖于监督信息
Learning to Rank Methods	排序学习方法的重点是跨媒体排名信息作为他们的优化目标（对象）	U:[56] F:[57][58][59]	优:提升最终检索性能缺:一般应用于两种媒体类型
Dictionary Learning Methods	字典学习方法生成字典和学习的公共空间用于（解决）跨媒体数据的稀疏度	U:[61] F:[64] S-F:[62]	优:效率高？缺:数据量大的优化问题是一个挑战
Cross-Media Hashing Methods	跨媒体散列（哈希）方法旨在学习共同的汉明空间以加速检索	U:[67][68][69][73][75][76][79][80][82][83] F:[49][70][71][72][74][77][78][81]	优:在大规模数据集检索效率高缺:小数据集发挥不出效率高的优势
Other Methods	其它方法	U:[20] S:[89] F:[84][85][86][87]	……

跨媒体相似度衡量（CROSS-MEDIA SIMILARITY MEASUREMENT）

跨媒体相似性计算方法旨在直接计算异构数据的相似性，而无需将媒体实例从其单独的空间直接投影到公共空间。因为没有公共空间，所以不能通过距离测量或正常分类器直接计算跨媒体相似性。一种直观的方法是使用数据集中的已知媒体实例和相关性作为桥接“媒体鸿沟”的基础。
用于跨媒体相似性测量的现有方法通常采用使用图中的边来表示媒体实例和多媒体文档（MMD）之间的关系的思想。根据方法的不同侧重点，我们进一步将它们分为两类：（A）基于图的方法（Graph-based methods），其侧重于图的构造，（B）邻近分析方法（neighbor analysis methods）主要考虑如何利用数据的邻居关系相似度量。这两个类别在算法过程中具有重叠，因为可以在构造的图中分析邻居关系。
以上两类方法的介绍如表1.2所示。

表1.2 跨媒体相似性衡量的两种方法

方法名称	简介	相关论文	优缺点
Graph-based methods	基于图的方法的基本思想是将跨媒体数据视为一个或多个图中的顶点，并且边是由跨媒体数据的相关性构成	S:[6]R:[4][90][91][92][93][94][95]	优:对合并不同类型信息有帮助缺:时间和空间开销较大；现实场景中存在挑战
neighbor analysis methods	邻居分析方法通常基于图构造，因为可以在给定图中分析邻居。该方法侧重于使用邻域关系进行相似性测量	U:[2] F:[5] U-F:[8]	优:方法灵活缺:时间和空间开销较大；确保邻居的相关关系困难，性能不稳定

跨媒体检索的其它方法

介绍两种其它方法：（A）相关反馈分析是一种辅助方法，用于提供有关用户意图的更多信息，以提高检索性能。（B）多模式主题模型在主题级别中查看跨媒体数据，并且通常通过计算条件概率来获得跨媒体相似性。这两种具体方法描述如表1.3所示。

表1.3 其它两种方法

方法名称	简介	相关论文	优缺点
Relevance Feedback Analysis	相关反馈广泛应用于跨媒体相似性测量。包括短期和长期两种反馈类型	R:[4][90][93][95]	优:提供更准确的信息，有助于提高检索准确性缺:需要一些人工成本
Multimodal Topic Model	LDA模型在多模态领域的扩展	U:[97][98][99] F:[100]	优:论文中未提到缺:跨媒体主题分布的约束条件…

资源

50+篇跨媒体相关英文论文

下载地址

附：论文的参考文献

[1] M. S. Lew, N. Sebe, C. Djeraba, and R. Jain, “Content-based multimedia information retrieval: State of the art and challenges,” ACM Trans. Multimedia Comput., Commun., Appl., vol. 2, no. 1, pp. 1–19, 2006.
[2] S. Clinchant, J. Ah-Pine, and G. Csurka, “Semantic combination of textual and visual information in multimedia retrieval,” in Proc. ACM Int. Conf. Multimedia Retr. (ICMR), 2011, p. 44.
[3] Y. Liu, W.-L. Zhao, C.-W. Ngo, C.-S. Xu, and H.-Q. Lu, “Coherent bagof audio words model for efficient large-scale video copy detection,” in Proc. ACM Int. Conf. Image Video Retr. (CIVR), 2010, pp. 89–96.
[4] Y. Yang, D. Xu, F. Nie, J. Luo, and Y. Zhuang, “Ranking with local regression and global alignment for cross media retrieval,” in Proc. ACM Int. Conf. Multimedia (ACM MM), 2009, pp. 175–184.
[5] X. Zhai, Y. Peng, and J. Xiao, “Effective heterogeneous similarity measure with nearest neighbors for cross-media retrieval,” in Proc. Int. Conf. MultiMedia Modeling (MMM), 2012, pp. 312–322.
[6] X. Zhai, Y. Peng, and J. Xiao, “Cross-modality correlation propagation for cross-media retrieval,” in Proc. IEEE Int. Conf. Acoust., Speech Signal Process. (ICASSP), Mar. 2012, pp. 2337–2340.
[7] X. Zhai, Y. Peng, and J. Xiao, “Heterogeneous metric learning with joint graph regularization for cross-media retrieval,” in Proc. AAAI Conf. Artif. Intell. (AAAI), 2013, pp. 1198–1204.
[8] D. Ma, X. Zhai, and Y. Peng, “Cross-media retrieval by cluster-based correlation analysis,” in Proc. IEEE Int. Conf. Image Process. (ICIP), Sep. 2013, pp. 3986–3990.
[9] X. Zhai, Y. Peng, and J. Xiao, “Cross-media retrieval by intra-media and inter-media correlation mining,” Multimedia Syst., vol. 19, no. 5, pp. 395–406, Oct. 2013.
[10] X. Zhai, Y. Peng, and J. Xiao, “Learning cross-media joint representation with sparse and semisupervised regularization,” IEEE Trans. Circuits Syst. Video Technol., vol. 24, no. 6, pp. 965–978, Jun. 2014.
[11] Y. Peng, X. Zhai, Y. Zhao, and X. Huang, “Semi-supervised crossmedia feature learning with unified patch graph regularization,” IEEE Trans. Circuits Syst. Video Technol., vol. 26, no. 3, pp. 583–596, Mar. 2016.
[12] Y. Peng, X. Huang, and J. Qi, “Cross-media shared representation by hierarchical learning with multiple deep networks,” in Proc. Int. Joint Conf. Artif. Intell. (IJCAI), 2016, pp. 3846–3853.
[13] J. Jeon, V. Lavrenko, and R. Manmatha, “Automatic image annotation and retrieval using cross-media relevance models,” in Proc. Int. ACM SIGIR Conf. Res. Develop. Inf. Retr. (SIGIR), 2003, pp. 119–126.
[14] J. Mao, W. Xu, Y. Yang, J. Wang, Z. Huang, and A. Yuille. (2014). “Deep captioning with multimodal recurrent neural networks (m-RNN).” [Online]. Available: https://arxiv.org/abs/1412.6632
[15] O. Vinyals, A. Toshev, S. Bengio, and D. Erhan, “Show and tell: A neural image caption generator,” in Proc. IEEE Conf. Comput. Vis. Pattern Recognit. (CVPR), Jun. 2015, pp. 3156–3164.
[16] J. Tang, X. Shu, Z. Li, G.-J. Qi, and J. Wang, “Generalized deep transfer networks for knowledge propagation in heterogeneous domains,” ACM Trans. Multimedia Comput., Commun., Appl., vol. 12, no. 4s, pp. 68:1–68:22, 2016.
[17] S. J. Pan and Q. Yang, “A survey on transfer learning,” IEEE Trans. Knowl. Data Eng., vol. 22, no. 10, pp. 1345–1359, Oct. 2010.
[18] H. Hotelling, “Relations between two sets of variates,” Biometrika, vol. 28, nos. 3–4, pp. 321–377, 1936.
[19] D. R. Hardoon, S. Szedmak, and J. Shawe-Taylor, “Canonical correlation analysis: An overview with application to learning methods,” Neural Comput., vol. 16, no. 12, pp. 2639–2664, 2004.
[20] Y. Verma and C. V. Jawahar, “Im2Text and Text2Im: Associating images and texts for cross-modal retrieval,” in Proc. Brit. Mach. Vis. Conf. (BMVC), 2014, pp. 1–13.
[21] B. Klein, G. Lev, G. Sadeh, and L. Wolf, “Associating neural word embeddings with deep image representations using fisher vectors,” in Proc. IEEE Conf. Comput. Vis. Pattern Recognit. (CVPR), Jun. 2015, pp. 4437–4446.
[22] S. Akaho. (2006). “A kernel method for canonical correlation analysis.” [Online]. Available: https://arxiv.org/abs/cs/0609071
[23] N. Rasiwasia, D. Mahajan, V. Mahadevan, and G. Aggarwal, “Cluster canonical correlation analysis,” in Proc. Int. Conf. Artif. Intell. Statist. (AISTATS), 2014, pp. 823–831.
[24] G. Andrew, R. Arora, J. Bilmes, and K. Livescu, “Deep canonical correlation analysis,” in Proc. Int. Conf. Mach. Learn. (ICML), 2010, pp. 3408–3415.
[25] Y. Gong, Q. Ke, M. Isard, and S. Lazebnik, “A multi-view embedding space for modeling Internet images, tags, and their semantics,” Int. J. Comput. Vis., vol. 106, no. 2, pp. 210–233, Jan. 2014.
[26] V. Ranjan, N. Rasiwasia, and C. V. Jawahar, “Multi-label cross-modal retrieval,” in Proc. IEEE Int. Conf. Comput. Vis. (ICCV), Dec. 2015,pp. 4094–4102.
[27] N. Rasiwasia et al., “A new approach to cross-modal multimedia retrieval,” in Proc. ACM Int. Conf. Multimedia (ACM MM), 2010, pp. 251–260.
[28] J. C. Pereira et al., “On the role of correlation and abstraction in crossmodal multimedia retrieval,” IEEE Trans. Pattern Anal. Mach. Intell., vol. 36, no. 3, pp. 521–535, Mar. 2014.
[29] A. Sharma, A. Kumar, H. Daume, III, and D. W. Jacobs, “Generalized multiview analysis: A discriminative latent space,” in Proc. IEEE Conf. Comput. Vis. Pattern Recognit. (CVPR), Jun. 2012, pp. 2160–2167.
[30] D. Li, N. Dimitrova, M. Li, and I. K. Sethi, “Multimedia content processing through cross-modal association,” in Proc. ACM Int. Conf. Multimedia (ACM MM), 2003, pp. 604–611.
[31] A. Frome et al., “DeViSE: A deep visual-semantic embedding model,” in Proc. Adv. Neural Inf. Process. Syst. (NIPS), 2013, pp. 2121–2129.
[32] R. Kiros, R. Salakhutdinov, and R. Zemel, “Multimodal neural language models,” in Proc. Int. Conf. Mach. Learn. (ICML), 2014, pp. 595–603.
[33] J. Ngiam, A. Khosla, M. Kim, J. Nam, H. Lee, and A. Y. Ng, “Multimodal deep learning,” in Proc. Int. Conf. Mach. Learn. (ICML), 2011, pp. 689–696.
[34] N. Srivastava and R. Salakhutdinov, “Multimodal learning with deep boltzmann machines,” in Proc. Adv. Neural Inf. Process. Syst. (NIPS), 2012, pp. 2222–2230.
[35] F. Yan and K. Mikolajczyk, “Deep correlation for matching images and text,” in Proc. IEEE Conf. Comput. Vis. Pattern Recognit. (CVPR), Jun. 2015, pp. 3441–3450.
[36] F. Feng, X. Wang, and R. Li, “Cross-modal retrieval with correspondence autoencoder,” in Proc. ACM Int. Conf. Multimedia (ACM MM), 2014, pp. 7–16.
[37] H. Zhang, Y. Yang, H. Luan, S. Yang, and T.-S. Chua, “Start from scratch: Towards automatically identifying, modeling, and naming visual attributes,” in Proc. ACM Int. Conf. Multimedia (ACM MM), 2014, pp. 187–196.
[38] W. Wang, R. Arora, K. Livescu, and J. A. Bilmes, “On deep multiview representation learning,” in Proc. Int. Conf. Mach. Learn. (ICML), 2015, pp. 1083–1092.
[39] F. Wu et al., “Learning of multimodal representations with random walks on the click graph,” IEEE Trans. Image Process., vol. 25, no. 2, pp. 630–642, Feb. 2016.
[40] Y. Wei et al., “Cross-modal retrieval with CNN visual features: A new baseline,” IEEE Trans. Cybern., vol. 47, no. 2, pp. 449–460, Feb. 2017.
[41] Y. He, S. Xiang, C. Kang, J. Wang, and C. Pan, “Cross-modal retrieval via deep and bidirectional representation learning,” IEEE Trans. Multimedia, vol. 18, no. 7, pp. 1363–1377, Jul. 2016.
[42] W. Wang, B. C. Ooi, X. Yang, D. Zhang, and Y. Zhuang, “Effective multi-modal retrieval based on stacked auto-encoders,” in Proc. Int. Conf. Very Large Data Bases (VLDB), 2014, pp. 649–660.
[43] L. Castrejon, Y. Aytar, C. Vondrick, H. Pirsiavash, and A. Torralba, “Learning aligned cross-modal representations from weakly aligned data,” in Proc. IEEE Conf. Comput. Vis. Pattern Recognit. (CVPR), Jun. 2016, pp. 2940–2949.
[44] S. E. Reed, Z. Akata, X. Yan, L. Logeswaran, B. Schiele, and H. Lee, “Generative adversarial text to image synthesis,” in Proc. Int. Conf. Mach. Learn. (ICML), 2016, pp. 1060–1069.
[45] S. E. Reed, Z. Akata, S. Mohan, S. Tenka, B. Schiele, and H. Lee, “Learning what and where to draw,” in Proc. Adv. Neural Inf. Process. Syst. (NIPS), 2016, pp. 217–225.
[46] I. Goodfellow et al., “Generative adversarial nets,” in Proc. Adv. Neural Inf. Process. Syst. (NIPS), 2014, pp. 2672–2680.
[47] I. Goodfellow. (2017). “NIPS 2016 tutorial: Generative adversarial networks.” [Online]. Available: https://arxiv.org/abs/1701.00160
[48] M. Belkin, I. Matveeva, and P. Niyogi, “Regularization and semisupervised learning on large graphs,” Learning Theory. Berlin, Germany: Springer, 2004, pp. 624–638.
[49] F. Wu, Z. Yu, Y. Yang, S. Tang, Y. Zhang, and Y. Zhuang, “Sparse multi-modal hashing,” IEEE Trans. Multimedia, vol. 16, no. 2, pp. 427–439, Feb. 2014.
[50] K. Wang, R. He, L. Wang, W. Wang, and T. Tan, “Joint feature selection and subspace learning for cross-modal retrieval,” IEEE Trans. Pattern Anal. Mach. Intell., vol. 38, no. 10, pp. 2010–2023, Oct. 2015.
[51] J. Liang, Z. Li, D. Cao, R. He, and J. Wang, “Self-paced cross-modal subspace matching,” in Proc. Int. ACM SIGIR Conf. Res. Develop. Inf. Retr. (SIGIR), 2016, pp. 569–578.
[52] N. Quadrianto and C. H. Lamppert, “Learning multi-view neighborhood preserving projections,” in Proc. Int. Conf. Mach. Learn. (ICML), 2011, pp. 425–432.
[53] B. McFee and G. Lanckriet, “Metric learning to rank,” in Proc. Int. Conf. Mach. Learn. (ICML), 2010, pp. 775–782.
[54] W. Wu, J. Xu, and H. Li, “Learning similarity function between objects in heterogeneous spaces,” Microsoft Res., Redmond, WA, USA, Tech. Rep. MSR-TR-2010-86, 2010.
[55] B. Bai et al., “Learning to rank with (a lot of) word features,” Inf. Retr., vol. 13, no. 3, pp. 291–314, Jun. 2010.
[56] D. Grangier and S. Bengio, “A discriminative kernel-based approach to rank images from text queries,” IEEE Trans. Pattern Anal. Mach. Intell., vol. 30, no. 8, pp. 1371–1384, Aug. 2008.
[57] F. Wu, X. Lu, Z. Zhang, S. Yan, Y. Rui, and Y. Zhuang, “Cross-media semantic representation via bi-directional learning to rank,” in Proc. ACM Int. Conf. Multimedia (ACM MM), 2013, pp. 877–886.
[58] X. Jiang et al., “Deep compositional cross-modal learning to rank via local-global alignment,” in Proc. ACM Int. Conf. Multimedia (ACM MM), 2015, pp. 69–78.
[59] F. Wu et al., “Cross-modal learning to rank via latent joint representation,” IEEE Trans. Image Process., vol. 24, no. 5, pp. 1497–1509, May 2015.
[60] G. Monaci, P. Jost, P. Vandergheynst, B. Mailhe, S. Lesage, and R. Gribonval, “Learning multimodal dictionaries,” IEEE Trans. Image Process., vol. 16, no. 9, pp. 2272–2283, Sep. 2007.
[61] Y. Jia, M. Salzmann, and T. Darrell, “Factorized latent spaces with structured sparsity,” in Proc. Adv. Neural Inf. Process. Syst. (NIPS), 2010, pp. 982–990.
[62] F. Zhu, L. Shao, and M. Yu, “Cross-modality submodular dictionary learning for information retrieval,” in Proc. ACM Int. Conf. Conf. Inf. Knowl. Manage. (CIKM), 2014, pp. 1479–1488.
[63] S. Wang, L. Zhang, Y. Liang, and Q. Pan, “Semi-coupled dictionary learning with applications to image super-resolution and photo-sketch synthesis,” in Proc. IEEE Conf. Comput. Vis. Pattern Recognit. (CVPR), Jun. 2012, pp. 2216–2223.
[64] Y. Zhuang, Y. Wang, F. Wu, Y. Zhang, and W. Lu, “Supervised coupled dictionary learning with group structures for multi-modal retrieval,” in Proc. AAAI Conf. Artif. Intell. (AAAI), 2013, pp. 1070–1076.
[65] J. Wang, W. Liu, S. Kumar, and S.-F. Chang, “Learning to hash for indexing big data—A survey,” Proc. IEEE, vol. 104, no. 1, pp. 34–57, Jan. 2016.
[66] J. Tang, Z. Li, M. Wang, and R. Zhao, “Neighborhood discriminant hashing for large-scale image retrieval,” IEEE Trans. Image Process., vol. 24, no. 9, pp. 2827–2840, Sep. 2015.
[67] S. Kumar and R. Udupa, “Learning hash functions for cross-view similarity search,” in Proc. Int. Joint Conf. Artif. Intell. (IJCAI), 2011, pp. 1360–1365.
[68] D. Zhang, F. Wang, and L. Si, “Composite hashing with multiple information sources,” in Proc. Int. ACM SIGIR Conf. Res. Develop. Inf. Retr. (SIGIR), 2011, pp. 225–234.
[69] Y. Zhen and D.-Y. Yeung, “Co-regularized hashing for multimodal data,” in Proc. Adv. Neural Inf. Process. Syst. (NIPS), 2012, pp. 1376–1384.
[70] Y. Hu, Z. Jin, H. Ren, D. Cai, and X. He, “Iterative multiview hashing for cross media indexing,” in Proc. ACM Int. Conf. Multimedia (ACM MM), 2014, pp. 527–536.
[71] Y. Zhen and D.-Y. Yeung, “A probabilistic model for multimodal hash function learning,” in Proc. ACM SIGKDD Int. Conf. Knowl. Discovery Data Mining (SIGKDD), 2012, pp. 940–948.
[72] Z. Yu, F. Wu, Y. Yang, Q. Tian, J. Luo, and Y. Zhuang, “Discriminative coupled dictionary hashing for fast cross-media retrieval,” in Proc. Int. ACM SIGIR Conf. Res. Develop. Inf. Retr. (SIGIR), 2014, pp. 395–404.
[73] M. Long, Y. Cao, J. Wang, and P. S. Yu, “Composite correlation quantization for efficient multimodal retrieval,” in Proc. Int. ACM SIGIR Conf. Res. Develop. Inf. Retr. (SIGIR), 2016, pp. 579–588.
[74] M. M. Bronstein, A. M. Bronstein, F. Michel, and N. Paragios, “Data fusion through cross-modality metric learning using similarity-sensitive hashing,” in Proc. IEEE Conf. Comput. Vis. Pattern Recognit. (CVPR), 2010, pp. 3594–3601.
[75] M. Rastegari, J. Choi, S. Fakhraei, D. Hal, and L. Davis, “Predictable dual-view hashing,” in Proc. Int. Conf. Mach. Learn. (ICML), 2013, pp. 1328–1336.
[76] G. Ding, Y. Guo, and J. Zhou, “Collective matrix factorization hashing for multimodal data,” in Proc. IEEE Conf. Comput. Vis. Pattern Recognit. (CVPR), Jun. 2014, pp. 2083–2090.
[77] D. Zhai, H. Chang, Y. Zhen, X. Liu, X. Chen, and W. Gao, “Parametric local multimodal hashing for cross-view similarity search,” in Proc. Int. Joint Conf. Artif. Intell. (IJCAI), 2013, pp. 2754–2760.
[78] Y. Zhuang, Z. Yu, W. Wang, F. Wu, S. Tang, and J. Shao, “Crossmedia hashing with neural networks,” in Proc. ACM Int. Conf. Multimedia (ACM MM), 2014, pp. 901–904.
[79] Q. Wang, L. Si, and B. Shen, “Learning to hash on partial multimodal data,” in Proc. Int. Joint Conf. Artif. Intell. (IJCAI), 2015, pp. 3904–3910.
[80] D. Wang, X. Gao, X. Wang, and L. He, “Semantic topic multimodal hashing for cross-media retrieval,” in Proc. Int. Joint Conf. Artif. Intell. (IJCAI), 2015, pp. 3890–3896.
[81] H. Liu, R. Ji, Y. Wu, and G. Hua, “Supervised matrix factorization for cross-modality hashing,” in Proc. Int. Joint Conf. Artif. Intell. (IJCAI), 2016, pp. 1767–1773.
[82] D. Wang, P. Cui, M. Ou, and W. Zhu, “Deep multimodal hashing with orthogonal regularization,” in Proc. Int. Joint Conf. Artif. Intell. (IJCAI), 2015, pp. 2291–2297.
[83] J. Zhou, G. Ding, and Y. Guo, “Latent semantic sparse hashing for cross-modal similarity search,” in Proc. Int. ACM SIGIR Conf. Res. Develop. Inf. Retr. (SIGIR), 2014, pp. 415–424.
[84] L. Zhang, Y. Zhao, Z. Zhu, S. Wei, and X. Wu, “Mining semantically consistent patterns for cross-view data,” IEEE Trans. Knowl. Data Eng., vol. 26, no. 11, pp. 2745–2758, Nov. 2014.
[85] C. Kang, S. Xiang, S. Liao, C. Xu, and C. Pan, “Learning consistent feature representation for cross-modal multimedia retrieval,” IEEE Trans. Multimedia, vol. 17, no. 3, pp. 370–381, Mar. 2015.
[86] Y. Hua, S. Wang, S. Liu, Q. Huang, and A. Cai, “TINA: Cross-modal correlation learning by adaptive hierarchical semantic aggregation,” in Proc. IEEE Int. Conf. Data Mining (ICDM), Dec. 2014, pp. 190–199.
[87] Y. Wei et al., “Modality-dependent cross-media retrieval,” ACM Trans. Intell. Syst. Technol., vol. 7, no. 4, pp. 57:1–57:13, 2016.
[88] J. H. Ham, D. D. Lee, and L. K. Saul, “Semisupervised alignment of manifolds,” in Proc. Int. Conf. Uncertainty Artif. Intell. (UAI), vol. 10. 2005, pp. 120–127.
[89] X. Mao, B. Lin, D. Cai, X. He, and J. Pei, “Parallel field alignment for cross media retrieval,” in Proc. ACM Int. Conf. Multimedia (ACM MM), 2013, pp. 897–906.
[90] Y.-T. Zhuang, Y. Yang, and F. Wu, “Mining semantic correlation of heterogeneous multimedia data for cross-media retrieval,” IEEE Trans. Multimedia, vol. 10, no. 2, pp. 221–229, Feb. 2008.
[91] H. Tong, J. He, M. Li, C. Zhang, and W.-Y. Ma, “Graph based multimodality learning,” in Proc. ACM Int. Conf. Multimedia (ACM MM), 2005, pp. 862–871.
[92] Y. Yang, F. Wu, D. Xu, Y. Zhuang, and L.-T. Chia, “Cross-media retrieval using query dependent search methods,” Pattern Recognit., vol. 43, no. 8, pp. 2927–2936, Aug. 2010.
[93] Y. Yang, F. Nie, D. Xu, J. Luo, Y. Zhuang, and Y. Pan, “A multimedia retrieval framework based on semi-supervised ranking and relevance feedback,” IEEE Trans. Pattern Anal. Mach. Intell., vol. 34, no. 4, pp. 723–742, Apr. 2012.
[94] Y. Zhuang, H. Shan, and F. Wu, “An approach for cross-media retrieval with cross-reference graph and pagerank,” in Proc. IEEE Int. Conf. Multi-Media Modelling (MMM), Jan. 2006, pp. 161–168.
[95] Y. Yang, Y.-T. Zhuang, F. Wu, and Y.-H. Pan, “Harmonizing hierarchical manifolds for multimedia document semantics understanding and cross-media retrieval,” IEEE Trans. Multimedia, vol. 10, no. 3, pp. 437–446, Apr. 2008.
[96] D. M. Blei, A. Y. Ng, and M. I. Jordan, “Latent Dirichlet allocation,” J. Mach. Learn. Res., vol. 3, pp. 993–1022, Mar. 2003.
[97] D. M. Blei and M. I. Jordan, “Modeling annotated data,” in Proc. Int. ACM SIGIR Conf. Res. Develop. Inf. Retr. (SIGIR), 2003, pp. 127–134.
[98] D. Putthividhy, H. T. Attias, and S. S. Nagarajan, “Topic regression multi-modal latent Dirichlet allocation for image annotation,” in Proc. IEEE Conf. Comput. Vis. Pattern Recognit. (CVPR), Jun. 2010, pp. 3408–3415.
[99] Y. Jia, M. Salzmann, and T. Darrell, “Learning cross-modality similarity for multinomial data,” in Proc. IEEE Int. Conf. Comput. Vis. (ICCV), Nov. 2011, pp. 2407–2414.
[100] Y. Wang, F. Wu, J. Song, X. Li, and Y. Zhuang, “Multi-modal mutual topic reinforce modeling for cross-media retrieval,” in Proc. ACM Int. Conf. Multimedia (ACM MM), 2014, pp. 307–316.
[101] T.-S. Chua, J. Tang, R. Hong, H. Li, Z. Luo, and Y. Zheng, “Nuswide: A real-world Web image database from national University of Singapore,” in Proc. ACM Int. Conf. Image Video Retr. (CIVR), 2009, p. 48.
[102] G. A. Miller, “WordNet: A lexical database for English,” Commun. ACM, vol. 38, no. 11, pp. 39–41, 1995.
[103] M. Everingham, L. Van Gool, C. K. I. Williams, J. Winn, and A. Zisserman, “The Pascal visual object classes (VOC) challenge,” Int. J. Comput. Vis., vol. 88, no. 2, pp. 303–338, Sep. 2009.
[104] X. Hua et al., “Clickage: Towards bridging semantic and intent gaps via mining click logs of search engines,” in Proc. ACM Int. Conf. Multimedia (ACM MM), 2013, pp. 243–252.
[105] Y. Pan, T. Yao, X. Tian, H. Li, and C. Ngo, “Click-throughbased subspace learning for image search,” in Proc. ACM Int. Conf. Multimedia (ACM MM), 2014, pp. 233–236.
[106] G. B. Huang, M. Ramesh, T. Berg, and E. Learned-Miller, “Labeled faces in the wild: A database for studying face recognition in unconstrained environments,” Dept. Comput. Sci., Univ. Massachusetts, Amherst, MA, USA, Tech. Rep. 07-49, 2007.
[107] J. Deng, W. Dong, R. Socher, L.-J. Li, K. Li, and L. Fei-Fei, “ImageNet: A large-scale hierarchical image database,” in Proc. IEEE Conf. Comput. Vis. Pattern Recognit. (CVPR), Jun. 2009, pp. 248–255.

你可能感兴趣的:(Cross-Media,note,cross-media,retrieval)

@NotNull、@NotBlank、@NotEmpty的区别 SuperChen12356 java spring boot
@NotNull：平常用于基本数据的包装类(Integer，Long，Double等等)，如果@NotNull注解被使用在String类型的数据上，则表示该数据不能为Null，但是可以为空字符串(“”)，空格字符串（“”）等。@NotEmpty：平常用于String、Collection集合、Map、数组等等，@NotEmpty注解的参数不能为Null或者长度为0，如果用在String类型上，则字
LeetCode //C - 650. 2 Keys Keyboard Navigator_Z LeetCode leetcode c语言算法
650.2KeysKeyboardThereisonlyonecharacter‘A’onthescreenofanotepad.Youcanperformoneoftwooperationsonthisnotepadforeachstep:CopyAll:Youcancopyallthecharacterspresentonthescreen(apartialcopyisnotallowed).
对该Django ORM查询的改进方案及详细说明大霸王龙 django python 后端
以下是对该DjangoORM查询的改进方案及详细说明：一、基础安全性改进try:instance=mc_groupcustomerlkwist.objects.get(filenamemark=filenamemark)returninstance.toJson()exceptmc_groupcustomerlkwist.DoesNotExist:returnJsonResponse({'erro
第十三章:优化内存管理_《C++性能优化指南》_notes 郭涤生性能优化 c/c++c++性能优化笔记
优化内存管理一、内存管理基础概念二、自定义分配器三、智能指针优化重点知识代码示例：智能指针性能对比四、性能优化关键点总结多选题设计题答案与详解多选题答案设计题示例答案（第1题）一、内存管理基础概念重点知识动态内存分配开销new和delete涉及系统调用，频繁操作会导致性能瓶颈内存碎片化会降低内存利用率自定义内存管理预分配内存块（内存池）类专属内存管理器自定义分配器代码示例：类专属内存管理器#inc
第12章:优化并发_《C++性能优化指南》notes 郭涤生性能优化 c/c++c++性能优化算法笔记
优化并发一、并发基础与优化核心知识点二、关键代码示例与测试三、关键优化策略总结四、性能测试方法论多选题设计题答案与详解多选题答案：设计题答案示例一、并发基础与优化核心知识点线程vs异步任务核心区别：std::thread直接管理线程，std::async由运行时决定异步策略（可能用线程池）。优化点：频繁创建线程开销大，优先用std::async。原子操作与内存序原子类型：std::atomic确保
第七章:优化热点语句_《C++性能优化指南》_notes 郭涤生 c/c++c++开发语言性能优化笔记
优化热点语句第七章重难点详解与代码示例1.从循环中移除代码2.从函数中移除代码3.优化表达式4.控制流程优化总结《C++性能优化指南》第七章核心内容多选题目设计题目多选题答案与解析设计题答案与示例代码第七章重难点详解与代码示例1.从循环中移除代码1.1缓存循环结束条件原理：在循环条件中频繁调用size()或length()可能带来额外开销，尤其是当容器大小不变时。示例代码：#include#inc
第 8 章:使用更好的库_《C++性能优化指南》_notes 郭涤生性能优化 c/c++c++性能优化算法笔记
使用更好的库第八章核心知识点解析编译与测试建议总结优化原则重点内容：第一部分：多选题（10题）第二部分：设计题答案与解析多选题答案：设计题答案示例（部分）：测试用例设计原则：第八章核心知识点解析优化标准库的使用知识点：选择合适的数据结构、预分配内存、减少拷贝#include#include#include//测试vector的reserve对性能的影响voidtest_vector_reserve
Chapter 24: Typelists_《C++ Templates》notes 郭涤生 c/c++c++笔记开发语言
Typelists1.AnatomyofaTypelist2.AccessingElements3.AppendingTypes4.ReversingaTypelist5.LengthofTypelist6.Compile-TimeTestingwith`main`Multiple-ChoiceQuestionsDetailedDesignQuestionsAnswers&Explanations
LangChain开发（九）基于Rag实现文档问答丶只有影子 #LangChain langchain ai
文章目录关联阅读Rag是什么？Rag工作流索引（Indexing）检索和生成（Retrievalandgeneration）文档问答实现流程代码实现源码地址参考资料关联阅读LangChain开发（一）LangChain介绍和对话demoLangChain开发（二）LangChain提示词模板Template使用LangChain开发（三）工作流编排(LCEL)LangChain开发（四）服务监控（
【大模型技术】RAG系统的难题和解决方案（一）大数据追光猿人工智能 python 学习方法语言模型 prompt
RAG（Retrieval-AugmentedGeneration）系统是一种结合了检索（Retrieval）和生成（Generation）能力的混合模型架构，广泛应用于问答系统、对话系统、知识密集型任务等领域。然而，尽管RAG系统在理论上具有强大的优势，但在实际应用中仍面临许多挑战。以下是RAG系统的难题及其解决方案之一：一、数据质量与覆盖率不足问题：检索模块依赖于外部知识库或文档集合，如果知识
【大模型技术】RAG系统的难题和解决方案（二）大数据追光猿 prompt microsoft 人工智能数据库深度学习
在RAG（Retrieval-AugmentedGeneration）系统中，召回排序环节的关键文档被遗漏是一个常见问题。这种情况通常发生在检索阶段的召回结果未能将正确的文档排在头部，导致生成模型无法基于正确信息生成答案。以下是针对这一问题的详细分析和解决方案：1.问题原因分析a.召回质量不足检索模块可能未能有效捕捉用户问题与知识库文档之间的语义匹配关系。使用的检索方法（如基于关键词匹配或简单的向
python的环境管理第五只狗 python学习 python
python的环境管理-总结虚拟环境虚拟环境管理器virtualenvvirtualenv的安装和使用：虚拟环境的配置venv创建虚拟环境安装的virtualenv创建虚拟环境激活虚拟环境离开虚拟环境condaconda的安装和使用conda软件源管理为jupyternotebook添加多版本python内核虚拟环境虚拟环境是一个Python环境，安装到其中的Python解释器、库和脚本与其他虚拟
第一章：优化概述_《C++性能优化指南》notes 郭涤生 c/c++c++性能优化开发语言笔记
优化概述第一章核心知识点详解1.性能优化的必要性2.编译器优化选项3.减少内存分配总结第一章重点内容回顾第一部分：多项选择题第二部分：程序设计题（5题）答案及详解多选题答案：程序设计题答案示例1.优化字符串类实现：性能对比输出：2.热点循环优化3.算法优化实践优化后的二分查找实现4.并发优化设计实现5.高性能数学计算优化实现优化代码示例(矩阵乘法)推荐编译选项(GCC/Clang)优化技术解析性能
Linux操作系统中的文本编辑器，Vim的使用方法云计算课代表日常运维问题合集 linux vim 运维
在使用Linux操作系统的过程中，经常需要对文本文件进行操作，如新建、编辑等，常用的方法有以下几种：1、使用第三方SFTP的工具，连接服务器上传下载文件进行创建修改2、在图形界面的Linux操作系统中使用图形化文本编辑器，如Gedit、Kate、Nano等3、使用vi或vim（推荐）vi及vim介绍vi和vim都是Linux系统下的文本编辑器，类似于Windows系统中的Notepad（记事本）。
【大模型知识点】检索增强生成（Retrieval Augmented Generation，RAG）简要介绍自信的小螺丝钉 AI知识 RAG 重排序大模型召回检索
RAG介绍1.RAG是什么？2.RAG的应用3.为什么需要RAGforLLM？4.RAG的一般流程5.检索优化6.重排序1.RAG是什么？Retrieval-Augmented-Generation：检索-增强-生成一句话总结：通过引入外部数据库或知识库中的信息来增强LLM生成内容2.RAG的应用问答系统：RAG从外部知识库中检索相关信息，生成更加准确可靠的答案。如医疗、法律领域的专业问答系统智能
matlab代码快速格式化及去除空行的方法（使用快捷键和notepad++替换的方法） superior tigre notepad++matlab
快速格式化这个方法很常见就是在.m文件里使用快捷键Ctrl+A（全选），Ctrl+I（格式化），这样就可以将所有代码进行格式化，十分快捷。但是格式化的代码会有很多空行，在打印时会占用不必要的资源。特别是在作业的提交和软著等申请时，往往要求去除空行，所以我们还要再进行下一步操作，来去除空行。去除空行本人倾向于使用notepad++去除空行，因为notepad++可以按照代码的语言把代码进行美化，复制
第二十章:类型属性的重载_《C++ Templates》notes 郭涤生 c/c++c++开发语言笔记
类型属性的重载核心知识点测试用例与编译验证多选题设计题测试用例说明关键总结核心知识点基于类型属性的函数重载通过type_traits和SFINAE实现条件编译，选择不同函数实现：#include#include//基础模板：处理非指针类型template,int>=0>voidprocess(constT&value){std::cout,int>=0>voidprocess(Tptr){std:
第二十一章:模板与继承_《C++ Templates》notes 郭涤生 c/c++c++笔记开发语言
模板与继承重点和难点编译与测试说明第一部分：多选题(10题)第二部分：设计题(5题)答案与详解多选题答案：设计题参考答案测试说明重点和难点21.1空基类优化（EBCO）知识点空基类优化（EmptyBaseClassOptimization）允许编译器在派生类中优化空基类的存储空间。若基类没有非静态成员变量、虚函数或虚基类，其大小可被优化为0字节，避免空间浪费。代码示例#include//空基类cl
Chapter 26:Discriminated Unions_《C++ Templates》notes 郭涤生 c/c++c++笔记开发语言
DiscriminatedUnions1.KeyConcepts&Implementation2.VisitorPatternImplementation3.Copy/MoveSemantics4.ExceptionSafetyMultiple-ChoiceQuestionsDesignQuestionsCodeTesting5.KeyChallenges1.KeyConcepts&Impleme
第十九章:实现 Traits_《C++ Templates》notes 郭涤生 c/c++c++服务器开发语言
实现Traits1.Traits概念2.示例：累加序列（AccumulatingaSequence）3.固定特性（FixedTraits）4.值特性（ValueTraits）5.参数化特性（ParameterizedTraits）6.SFINAE-basedTraits多选题（附答案与详解）设计题（附答案与详解）总结1.Traits概念Traits（特性类）是用于在编译期提取或推断类型信息的模板类
chapter 4: Smart Pointers_《Effective Modern C++》notes 郭涤生 c/c++c++开发语言笔记
SmartPointersItem18:`std::unique_ptr`forExclusiveOwnershipItem19:`std::shared_ptr`forSharedOwnershipItem20:`std::weak_ptr`forNon-OwningReferencesItem21:`make_unique`and`make_shared`Item22:PimplIdiomwi
第十四章：模板实例化_《C++ Templates》notes 郭涤生 c/c++c++开发语言笔记
模板实例化核心知识点解析多选题设计题关键点总结核心知识点解析两阶段查找（Two-PhaseLookup）原理：模板在编译时分两个阶段处理：第一阶段（定义时）：检查模板语法和非依赖名称（Non-dependentNames），此时不依赖模板参数。第二阶段（实例化时）：检查依赖名称（DependentNames），并绑定到具体类型。代码示例：#includetemplatevoidfoo(Tt){//
借助 Gitee Go 将博客(文档知识库)上传至阿里云 OSS 中恐咖兵糖阿里云云计算
Gitee借助GiteeGo将博客(文档知识库)上传至阿里云OSS中博客文章链接:https://www.ftls.xyz/posts/gitee-oss/本文借助GiteeGo实现上传博客到阿里云中，成品在https://note.ftls.xyz。有两种方法可以实现。准备工作博客本体，存储至Gitee中。并开通了GiteeGo。阿里云存储桶一个。准备存储桶参数endpoint，bucketna
【MySQL高可用】Orchestrator GugodChen mysql 数据库
部署教程部署MySQLorchestrator的元数据服务依赖MySQL,所以这里需要给每个orchestrator节点部署一个MySQL作为元数据服务。具体如何部署MySQL这里不详细展开。元数据初始化CREATEDATABASEIFNOTEXISTSorchestrator;CREATETABLEIFNOTEXISTSorchestrator.`failover_circuit_breaker
pyecharts在jupyter notebook中保存图片忧王 python
自己在使用的时候遇到的问题，也是看了很多博客实际上，官网就有使用方法附链接https://pyecharts.org/#/zh-cn/render_images我使用的是snapshot-phantomjssnapshot-phantomjs是pyecharts+phantomjs渲染图片的扩展，需要先安装phantomjs，安装方法请参照官网phantomjs.org/download.html
Chapter 27: Expression Templates_《C++ Templates》notes 郭涤生 c/c++c++开发语言笔记
ExpressionTemplatesKeyConcepts:Part1:CoreConcepts&CodeImplementationPart2:AdvancedConcepts&ExtensionsPart3:OptimizationAnalysisMultipleChoiceQuestions(HardDifficulty)DetailedDesignQuestionsAnswers&Exp
Not enough information to list image symbols. Not enough information to list load addresses in ... Water_Sounds 学习笔记 keil mdk
除了绝大部分网上给的解决方法外：Notenoughinformationtolistimagesymbols.Notenoughinformationtolistloadaddressesin…我在向正点原子例程“输入捕获”中添加lcd驱动程序时，发现按照上述链接的做法填了路径什么的，还是报错，最后发现是这个.c文件文件没有添加进来导致这两句话一直是无定义，填进来就好了。
【Python工具】Jupyter Notebook常用快捷键清平乐的技术博客 Python高级应用由浅入深学Python jupyter ide python
1.JupyterNotebook的启动与停止环境为Windows10系统首先win+R进入命令提示符cmd，用cd命令切换到工作目录，键入命令jupyternotebook2.JupyterNotebook常用快捷键2.1模式切换当前cell侧边为蓝色时，表示此时为命令模式，按Enter切换为编辑模式当前cell侧边为绿色时，表示此时为编辑模式，按Esc切换为命令模式2.2命令模式快捷键H：显示
云计算习题「已注销」
云计算一、单选题二、多选题三、实操题单选题多选题实操题一、单选题下面哪个是软件代码版本控制软件？（B）A.projectB.SVNC.notepad++D.Xshell为满足金融业务的监管和安全要求，平台不需要考虑下列哪个应用?（A）A.文档版本管理B.防火墙策略C.安全漏洞扫描D.多租户安全隔离以下哪一个是项目收尾过程的正确顺序？（C）A.得到正式验收、解散团队、写出经验教训、结束合同B.写出经
第二十二章: 静态多态与动态多态的衔接_《C++ Templates》notes 郭涤生 c/c++c++开发语言笔记
静态多态与动态多态的衔接核心知识点代码示例与测试用例测试用例输出多选题设计题关键技术总结核心知识点静态多态vs动态多态静态多态：编译期多态，通过模板实现，代码生成效率高，但灵活性差。动态多态：运行期多态，通过虚函数实现，灵活性高，但存在虚表开销。类型擦除（TypeErasure）核心思想：将不同类型的对象统一为通用接口，隐藏具体类型信息。实现方式：通常结合基类指针和模板注册机制。桥接模式（Brid
java工厂模式 3213213333332132 java 抽象工厂
工厂模式有 1、工厂方法 2、抽象工厂方法。下面我的实现是抽象工厂方法, 给所有具体的产品类定一个通用的接口。 package 工厂模式; /** * 航天飞行接口 * * @Description * @author FuJianyong * 2015-7-14下午02:42:05 */ public interface SpaceF
nginx频率限制+python测试 ronin47 nginx 频率 python
部分内容参考：http://www.abc3210.com/2013/web_04/82.shtml 首先说一下遇到这个问题是因为网站被攻击，阿里云报警，想到要限制一下访问频率，而不是限制ip（限制ip的方案稍后给出）。nginx连接资源被吃空返回状态码是502，添加本方案限制后返回599，与正常状态码区别开。步骤如下：
java线程和线程池的使用 dyy_gusi ThreadPool thread Runnable timer
java线程和线程池一、创建多线程的方式 java多线程很常见，如何使用多线程，如何创建线程，java中有两种方式，第一种是让自己的类实现Runnable接口，第二种是让自己的类继承Thread类。其实Thread类自己也是实现了Runnable接口。具体使用实例如下： 1、通过实现Runnable接口方式 1 2
Linux 171815164 linux
ubuntu kernel http://kernel.ubuntu.com/~kernel-ppa/mainline/v4.1.2-unstable/ 安卓sdk代理 mirrors.neusoft.edu.cn 80 输入法和jdk sudo apt-get install fcitx su
Tomcat JDBC Connection Pool g21121 Connection
Tomcat7 抛弃了以往的DBCP 采用了新的Tomcat Jdbc Pool 作为数据库连接组件，事实上DBCP已经被Hibernate 所抛弃，因为他存在很多问题，诸如：更新缓慢，bug较多，编译问题，代码复杂等等。 Tomcat Jdbc P
敲代码的一点想法永夜-极光 java 随笔感想
入门学习java编程已经半年了,一路敲代码下来,现在也才1w+行代码量,也就菜鸟水准吧,但是在整个学习过程中,我一直在想,为什么很多培训老师,网上的文章都是要我们背一些代码?比如学习Arraylist的时候,教师就让我们先参考源代码写一遍,然
jvm指令集程序员是怎么炼成的 jvm 指令集
转自：http://blog.csdn.net/hudashi/article/details/7062675#comments 将值推送至栈顶时 const ldc push load指令 const系列该系列命令主要负责把简单的数值类型送到栈顶。(从常量池或者局部变量push到栈顶时均使用) 0x02 &nbs
Oracle字符集的查看查询和Oracle字符集的设置修改 aijuans oracle
本文主要讨论以下几个部分：如何查看查询oracle字符集、修改设置字符集以及常见的oracle utf8字符集和oracle exp 字符集问题。一、什么是Oracle字符集 Oracle字符集是一个字节数据的解释的符号集合,有大小之分,有相互的包容关系。ORACLE 支持国家语言的体系结构允许你使用本地化语言来存储，处理，检索数据。它使数据库工具，错误消息，排序次序，日期，时间，货
png在Ie6下透明度处理方法 antonyup_2006 css 浏览器 Firebug IE
由于之前到深圳现场支撑上线，当时为了解决个控件下载，我机器上的IE8老报个错，不得以把ie8卸载掉，换个Ie6,问题解决了，今天出差回来，用ie6登入另一个正在开发的系统，遇到了Png图片的问题，当然升级到ie8(ie8自带的开发人员工具调试前端页面JS之类的还是比较方便的，和FireBug一样，呵呵)，这个问题就解决了，但稍微做了下这个问题的处理。我们知道PNG是图像文件存储格式，查询资
表查询常用命令高级查询方法(二) 百合不是茶 oracle 分页查询分组查询联合查询
----------------------------------------------------分组查询 group by having --平均工资和最高工资 select avg(sal)平均工资,max(sal) from emp ; --每个部门的平均工资和最高工资
uploadify3.1版本参数使用详解 bijian1013 JavaScript uploadify3.1
使用：绑定的界面元素<input id='gallery'type='file'/>$("#gallery").uploadify({设置参数，参数如下}); 设置的属性： id: jQuery(this).attr('id'),//绑定的input的ID langFile: 'http://ww
精通Oracle10编程SQL(17)使用ORACLE系统包 bijian1013 oracle 数据库 plsql
/* *使用ORACLE系统包 */ --1.DBMS_OUTPUT --ENABLE:用于激活过程PUT,PUT_LINE,NEW_LINE,GET_LINE和GET_LINES的调用 --语法：DBMS_OUTPUT.enable(buffer_size in integer default 20000); --DISABLE:用于禁止对过程PUT,PUT_LINE,NEW
【JVM一】JVM垃圾回收日志 bit1129 垃圾回收
将JVM垃圾回收的日志记录下来，对于分析垃圾回收的运行状态，进而调整内存分配(年轻代，老年代，永久代的内存分配)等是很有意义的。JVM与垃圾回收日志相关的参数包括： -XX:+PrintGC -XX:+PrintGCDetails -XX:+PrintGCTimeStamps -XX:+PrintGCDateStamps -Xloggc -XX:+PrintGC 通
Toast使用白糖_ toast
Android中的Toast是一种简易的消息提示框，toast提示框不能被用户点击，toast会根据用户设置的显示时间后自动消失。创建Toast 两个方法创建Toast makeText(Context context, int resId, int duration) 参数：context是toast显示在
angular.identity boyitech AngularJS AngularJS API
angular.identiy 描述: 返回它第一参数的函数. 此函数多用于函数是编程. 使用方法: angular.identity(value); 参数详解: Param Type Details value * to be returned. 返回值: 传入的value 实例代码: <!DOCTYPE HTML>
java-两整数相除，求循环节 bylijinnan java
import java.util.ArrayList; import java.util.List; public class CircleDigitsInDivision { /** * 题目：求循环节，若整除则返回NULL，否则返回char*指向循环节。先写思路。函数原型：char*get_circle_digits(unsigned k,unsigned j)
Java 日期周年 Chen.H java C++c C#
/** * java日期操作(月末、周末等的日期操作) * * @author * */ public class DateUtil { /** */ /** * 取得某天相加(减)後的那一天 * * @param date * @param num *
[高考与专业]欢迎广大高中毕业生加入自动控制与计算机应用专业 comsci 计算机
不知道现在的高校还设置这个宽口径专业没有,自动控制与计算机应用专业,我就是这个专业毕业的,这个专业的课程非常多,既要学习自动控制方面的课程,也要学习计算机专业的课程,对数学也要求比较高.....如果有这个专业,欢迎大家报考...毕业出来之后,就业的途径非常广..... 以后
分层查询（Hierarchical Queries） daizj oracle 递归查询层次查询
Hierarchical Queries If a table contains hierarchical data, then you can select rows in a hierarchical order using the hierarchical query clause: hierarchical_query_clause::= start with condi
数据迁移 daysinsun 数据迁移
最近公司在重构一个医疗系统，原来的系统是两个.Net系统，现需要重构到java中。数据库分别为SQL Server和Mysql，现需要将数据库统一为Hana数据库，发现了几个问题，但最后通过努力都解决了。 1、原本通过Hana的数据迁移工具把数据是可以迁移过去的，在MySQl里面的字段为TEXT类型的到Hana里面就存储不了了，最后不得不更改为clob。 2、在数据插入的时候有些字段特别长
C语言学习二进制的表示示例 dcj3sjt126com c basic
进制的表示示例 # include <stdio.h> int main(void) { int i = 0x32C; printf("i = %d\n", i); /* printf的用法 %d表示以十进制输出 %x或%X表示以十六进制的输出 %o表示以八进制输出 */ return 0; }
NsTimer 和 UITableViewCell 之间的控制 dcj3sjt126com ios
情况是这样的: 一个UITableView, 每个Cell的内容是我自定义的 viewA viewA上面有很多的动画, 我需要添加NSTimer来做动画, 由于TableView的复用机制, 我添加的动画会不断开启, 没有停止, 动画会执行越来越多. 解决办法: 在配置cell的时候开始动画, 然后在cell结束显示的时候停止动画查找cell结束显示的代理
MySql中case when then 的使用 fanxiaolong casewhenthenend
select "主键", "项目编号", "项目名称","项目创建时间", "项目状态","部门名称","创建人" union (select pp.id as "主键", pp.project_number as &
Ehcache（01）——简介、基本操作 234390216 cache ehcache 简介 CacheManager crud
Ehcache简介目录 1 CacheManager 1.1 构造方法构建 1.2 静态方法构建 2 Cache 2.1&
最容易懂的javascript闭包学习入门 jackyrong JavaScript
http://www.ruanyifeng.com/blog/2009/08/learning_javascript_closures.html 闭包（closure）是Javascript语言的一个难点，也是它的特色，很多高级应用都要依靠闭包实现。下面就是我的学习笔记，对于Javascript初学者应该是很有用的。一、变量的作用域要理解闭包，首先必须理解Javascript特殊
提升网站转化率的四步优化方案 php教程分享数据结构 PHP 数据挖掘 Google 活动
网站开发完成后,我们在进行网站优化最关键的问题就是如何提高整体的转化率，这也是营销策略里最最重要的方面之一，并且也是网站综合运营实例的结果。文中分享了四大优化策略：调查、研究、优化、评估，这四大策略可以很好地帮助用户设计出高效的优化方案。 PHP开发的网站优化一个网站最关键和棘手的是，如何提高整体的转化率，这是任何营销策略里最重要的方面之一，而提升网站转化率是网站综合运营实力的结果。今天，我就分
web开发里什么是HTML5的WebSocket？ naruto1990 Web html5 浏览器 socket
当前火起来的HTML5语言里面，很多学者们都还没有完全了解这语言的效果情况，我最喜欢的Web开发技术就是正迅速变得流行的 WebSocket API。WebSocket 提供了一个受欢迎的技术，以替代我们过去几年一直在用的Ajax技术。这个新的API提供了一个方法，从客户端使用简单的语法有效地推动消息到服务器。让我们看一看6个HTML5教程介绍里的 WebSocket API：它可用于客户端、服
Socket初步编程——简单实现群聊 Everyday都不同 socket 网络编程初步认识
初次接触到socket网络编程，也参考了网络上众前辈的文章。尝试自己也写了一下，记录下过程吧：服务端：（接收客户端消息并把它们打印出来） public class SocketServer { private List<Socket> socketList = new ArrayList<Socket>(); public s
面试：Hashtable与HashMap的区别（结合线程） toknowme
昨天去了某钱公司面试，面试过程中被问道 Hashtable与HashMap的区别？当时就是回答了一点，Hashtable是线程安全的，HashMap是线程不安全的，说白了，就是Hashtable是的同步的，HashMap不是同步的，需要额外的处理一下。今天就动手写了一个例子，直接看代码吧 package com.learn.lesson001; import java
MVC设计模式的总结 xp9802 设计模式 mvc 框架 IOC
随着Web应用的商业逻辑包含逐渐复杂的公式分析计算、决策支持等，使客户机越来越不堪重负，因此将系统的商业分离出来。单独形成一部分，这样三层结构产生了。其中‘层’是逻辑上的划分。三层体系结构是将整个系统划分为如图2.1所示的结构[3] （1）表现层（Presentation layer）：包含表示代码、用户交互GUI、数据验证。该层用于向客户端用户提供GUI交互，它允许用户