micromichael

transfer learning

在机器学习领域，迁移学习(Transfer learning)是一个比较新的名词。目前国内做这个方面的很少，我目前只知道香港科技大学杨强教授及上海交大的机器学习小组在从事这方面的研究，近几年他们已经取得大量的成果，发表了十几篇AI领域顶级的会议论文，着实让我崇拜不已。接下来的研究生活，偶希望能循着他们的足迹慢慢摸索！

Qiang Yang

http://www.cse.ust.hk/~qyang/

Sinno Jialin Pan

http://www.cse.ust.hk/~sinnopan/

———————-苗条分割线——————————

转载于： http://apex.sjtu.edu.cn/apex_wiki/Transfer%20Learning

迁移学习（ Transfer Learning ）

薛贵荣

在传统的机器学习的框架下，学习的任务就是在给定充分训练数据的基础上来学习一个分类模型；然后利用这个学习到的模型来对测试文档进行分类与预测。然而，我们看到机器学习算法在当前的Web挖掘研究中存在着一个关键的问题：一些新出现的领域中的大量训练数据非常难得到。我们看到Web应用领域的发展非常快速。大量新的领域不断涌现，从传统的新闻，到网页，到图片,再到博客、播客等等。传统的机器学习需要对每个领域都标定大量训练数据，这将会耗费大量的人力与物力。而没有大量的标注数据，会使得很多与学习相关研究与应用无法开展。其次，传统的机器学习假设训练数据与测试数据服从相同的数据分布。然而，在许多情况下，这种同分布假设并不满足。通常可能发生的情况如训练数据过期。这往往需要我们去重新标注大量的训练数据以满足我们训练的需要，但标注新数据是非常昂贵的，需要大量的人力与物力。从另外一个角度上看，如果我们有了大量的、在不同分布下的训练数据，完全丢弃这些数据也是非常浪费的。如何合理的利用这些数据就是迁移学习主要解决的问题。迁移学习可以从现有的数据中迁移知识，用来帮助将来的学习。迁移学习（Transfer Learning）的目标是将从一个环境中学到的知识用来帮助新环境中的学习任务。因此，迁移学习不会像传统机器学习那样作同分布假设。

我们在迁移学习方面的工作目前可以分为以下三个部分：同构空间下基于实例的迁移学习，同构空间下基于特征的迁移学习与异构空间下的迁移学习。我们的研究指出，基于实例的迁移学习有更强的知识迁移能力，基于特征的迁移学习具有更广泛的知识迁移能力，而异构空间的迁移具有广泛的学习与扩展能力。这几种方法各有千秋。

1.同构空间下基于实例的迁移学习

基于实例的迁移学习的基本思想是，尽管辅助训练数据和源训练数据或多或少会有些不同，但是辅助训练数据中应该还是会存在一部分比较适合用来训练一个有效的分类模型，并且适应测试数据。于是，我们的目标就是从辅助训练数据中找出那些适合测试数据的实例，并将这些实例迁移到源训练数据的学习中去。在基于实例的迁移学习方面，我们推广了传统的AdaBoost算法，提出一种具有迁移能力的boosting算法：Tradaboosting [9]，使之具有迁移学习的能力，从而能够最大限度的利用辅助训练数据来帮助目标的分类。我们的关键想法是，利用boosting的技术来过滤掉辅助数据中那些与源训练数据最不像的数据。其中，boosting的作用是建立一种自动调整权重的机制，于是重要的辅助训练数据的权重将会增加，不重要的辅助训练数据的权重将会减小。调整权重之后，这些带权重的辅助训练数据将会作为额外的训练数据，与源训练数据一起从来提高分类模型的可靠度。

基于实例的迁移学习只能发生在源数据与辅助数据非常相近的情况下。但是，当源数据和辅助数据差别比较大的时候，基于实例的迁移学习算法往往很难找到可以迁移的知识。但是我们发现，即便有时源数据与目标数据在实例层面上并没有共享一些公共的知识，它们可能会在特征层面上有一些交集。因此我们研究了基于特征的迁移学习，它讨论的是如何利用特征层面上公共的知识进行学习的问题。

2.同构空间下基于特征的迁移学习

在基于特征的迁移学习研究方面，我们提出了多种学习的算法，如CoCC算法[7]，TPLSA算法[4]，谱分析算法[2]与自学习算法[3]等。其中利用互聚类算法产生一个公共的特征表示，从而帮助学习算法。我们的基本思想是使用互聚类算法同时对源数据与辅助数据进行聚类，得到一个共同的特征表示，这个新的特征表示优于只基于源数据的特征表示。通过把源数据表示在这个新的空间里，以实现迁移学习。应用这个思想，我们提出了基于特征的有监督迁移学习与基于特征的无监督迁移学习。

2.1 基于特征的有监督迁移学习

我们在基于特征的有监督迁移学习方面的工作是基于互聚类的跨领域分类[7]，这个工作考虑的问题是：当给定一个新的、不同的领域，标注数据及其稀少时，如何利用原有领域中含有的大量标注数据进行迁移学习的问题。在基于互聚类的跨领域分类这个工作中，我们为跨领域分类问题定义了一个统一的信息论形式化公式，其中基于互聚类的分类问题的转化成对目标函数的最优化问题。在我们提出的模型中，目标函数被定义为源数据实例，公共特征空间与辅助数据实例间互信息的损失。

2.2 基于特征的无监督迁移学习：自学习聚类

我们提出的自学习聚类算法[3]属于基于特征的无监督迁移学习方面的工作。这里我们考虑的问题是：现实中可能有标记的辅助数据都难以得到，在这种情况下如何利用大量无标记数据辅助数据进行迁移学习的问题。自学习聚类的基本思想是通过同时对源数据与辅助数据进行聚类得到一个共同的特征表示，而这个新的特征表示由于基于大量的辅助数据，所以会优于仅基于源数据而产生的特征表示，从而对聚类产生帮助。

上面提出的两种学习策略（基于特征的有监督迁移学习与无监督迁移学习）解决的都是源数据与辅助数据在同一特征空间内的基于特征的迁移学习问题。当源数据与辅助数据所在的特征空间中不同时，我们还研究了跨特征空间的基于特征的迁移学习，它也属于基于特征的迁移学习的一种。

３　异构空间下的迁移学习：翻译学习

我们提出的翻译学习[1][5]致力于解决源数据与测试数据分别属于两个不同的特征空间下的情况。在[1]中，我们使用大量容易得到的标注过文本数据去帮助仅有少量标注的图像分类的问题，如上图所示。我们的方法基于使用那些用有两个视角的数据来构建沟通两个特征空间的桥梁。虽然这些多视角数据可能不一定能够用来做分类用的训练数据，但是，它们可以用来构建翻译器。通过这个翻译器，我们把近邻算法和特征翻译结合在一起，将辅助数据翻译到源数据特征空间里去，用一个统一的语言模型进行学习与分类。

引文：

[1]. Wenyuan Dai, Yuqiang Chen, Gui-Rong Xue, Qiang Yang, and Yong Yu. Translated Learning: Transfer Learning across Different Feature Spaces. Advances in Neural Information Processing Systems 21 (NIPS 2008), Vancouver, British Columbia, Canada, December 8-13, 2008.

[2]. Xiao Ling, Wenyuan Dai, Gui-Rong Xue, Qiang Yang, and Yong Yu. Spectral Domain-Transfer Learning. In Proceedings of the Fourteenth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (KDD 2008), Pages 488-496, Las Vegas, Nevada, USA, August 24-27, 2008.

[3]. Wenyuan Dai, Qiang Yang, Gui-Rong Xue and Yong Yu. Self-taught Clustering. In Proceedings of the Twenty-Fifth International Conference on Machine Learning (ICML 2008), pages 200-207, Helsinki, Finland, 5-9 July, 2008.

[4]. Gui-Rong Xue, Wenyuan Dai, Qiang Yang and Yong Yu. Topic-bridged PLSA for Cross-Domain Text Classification. In Proceedings of the Thirty-first International ACM SIGIR Conference on Research and Development on Information Retrieval (SIGIR2008), pages 627-634, Singapore, July 20-24, 2008.

[5]. Xiao Ling, Gui-Rong Xue, Wenyuan Dai, Yun Jiang, Qiang Yang and Yong Yu. Can Chinese Web Pages be Classified with English Data Source? In Proceedings the Seventeenth International World Wide Web Conference (WWW2008), Pages 969-978, Beijing, China, April 21-25, 2008.

[6]. Xiao Ling, Wenyuan Dai, Gui-Rong Xue and Yong Yu. Knowledge Transferring via Implicit Link Analysis. In Proceedings of the Thirteenth International Conference on Database Systems for Advanced Applications (DASFAA 2008), Pages 520-528, New Delhi, India, March 19-22, 2008.

[7]. Wenyuan Dai, Gui-Rong Xue, Qiang Yang and Yong Yu. Co-clustering based Classification for Out-of-domain Documents. In Proceedings of the Thirteenth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (KDD 2007), Pages 210-219, San Jose, California, USA, Aug 12-15, 2007.

[8]. Wenyuan Dai, Gui-Rong Xue, Qiang Yang and Yong Yu. Transferring Naive Bayes Classifiers for Text Classification. In Proceedings of the Twenty-Second National Conference on Artificial Intelligence (AAAI 2007), Pages 540-545, Vancouver, British Columbia, Canada, July 22-26, 2007.

[9]. Wenyuan Dai, Qiang Yang, Gui-Rong Xue and Yong Yu. Boosting for Transfer Learning. In Proceedings of the Twenty-Fourth International Conference on Machine Learning (ICML 2007), Pages 193-200, Corvallis, Oregon, USA, June 20-24, 2007.

[10]. Dikan Xing, Wenyuan Dai, Gui-Rong Xue and Yong Yu. Bridged Refinement for Transfer Learning. In Proceedings of the Eleventh European Conference on Principles and Practice of Knowledge Discovery in Databases (PKDD 2007), Pages 324-335, Warsaw, Poland, September 17-21, 2007. （Best Student Paper Award）

[11]. Xin Zhang, Wenyuan Dai, Gui-Rong Xue and Yong Yu. Adaptive Email Spam Filtering based on Information Theory. In Proceedings of the Eighth International Conference on Web Information Systems Engineering (WISE 2007), Pages 159–170, Nancy, France, December 3-7, 2007.

———————华丽分割线————————-

List of Conferences and Workshops Where Transfer Learning Paper Appear

From: http://www.cse.ust.hk/~sinnopan/conferenceTL.htm

List of Conferences and Workshops Where Transfer Learning Paper AppearThis webpage will be updated regularly.
Main Conferences
Machine Learning and Artificial Intelligence Conferences
AAAI	2008	Transfer Learning via Dimensionality Reduction [Link] [Bibtex]
		Transferring Localization Models across Space [Link] [Bibtex]
		Transferring Localization Models over Time [Link] [Bibtex]
		Transferring Multi-device Localization Models using Latent Multi-task Learning [Link] [Bibtex]
		Text Categorization with Knowledge Transfer from Heterogeneous Data Sources [Link] [Bibtex]
		Zero-data Learning of New Tasks [Link] [Bibtex]
	2007	Transferring Naive Bayes Classifiers for Text Classification [Link] [Bibtex]
		Mapping and Revising Markov Logic Networks for Transfer Learning [Link] [Bibtex]
		Measuring the Level of Transfer Learning by an AP Physics Problem-Solver [Link] [Bibtex]
	2006	Using Homomorphisms to Transfer Options across Continuous Reinforcement Learning Domains [Link] [Bibtex]
	2006	Value-Function-Based Transfer for Reinforcement Learning Using Structure Mapping [Link] [Bibtex]
IJCAI	2009	Transfer Learning Using Task-Level Features with Application to Information Retrieval [Link] [Bibtex]
		Transfer Learning from Minimal Target Data by Mapping across Relational Domains [Link] [Bibtex]
		Domain Adaptation via Transfer Component Analysis [Link] [Bibtex]
		Knowledge Transfer on Hybrid Graph [Link] [Bibtex]
		Manifold Alignment without Correspondence [Link] [Bibtex]
		Robust Distance Metric Learning with Auxiliary Knowledge [Link] [Bibtex]
		Can Movies and Books Collaborate? Cross-Domain Collaborative Filtering for Sparsity Reduction [Link] [Bibtex]
		Exponential Family Sparse Coding with Application to Self-taught Learning [Link] [Bibtex]
	2007	Learning and Transferring Action Schemas [Link] [Bibtex]
		General Game Learning Using Knowledge Transfer [Link] [Bibtex]
		Building Portable Options: Skill Transfer in Reinforcement Learning [Link] [Bibtex]
		Transfer Learning in Real-Time Strategy Games Using Hybrid CBR/RL [Link] [Bibtex]
		An Experts Algorithm for Transfer Learning [Link] [Bibtex]
		Transferring Learned Control-Knowledge between Planners [Link] [Bibtex]
		Effective Control Knowledge Transfer through Learning Skill and Representation Hierarchies [Link] [Bibtex]
		Efficient Bayesian Task-Level Transfer Learning [Link] [Bibtex]
ICML	2009	Deep Transfer via Second-Order Markov Logic [Link] [Bibtex]
		Feature Hashing for Large Scale Multitask Learning [Link] [Bibtex]
		A Convex Formulation for Learning Shared Structures from Multiple Tasks [Link] [Bibtex]
		EigenTransfer: A Unified Framework for Transfer Learning [Link] [Bibtex]
		Domain Adaptation from Multiple Sources via Auxiliary Classifiers [Link] [Bibtex]
		Transfer Learning for Collaborative Filtering via a Rating-Matrix Generative Model [Link] [Bibtex]
	2008	Bayesian Multiple Instance Learning: Automatic Feature Selection and Inductive Transfer [Link] [Bibtex]
		Multi-Task Learning for HIV Therapy Screening [Link] [Bibtex]
		Self-taught Clustering [Link] [Bibtex]
		Manifold Alignment using Procrustes Analysis [Link] [Bibtex]
		Automatic Discovery and Transfer of MAXQ Hierarchies [Link] [Bibtex]
		Transfer of Samples in Batch Reinforcement Learning [Link] [Bibtex]
		Hierarchical Kernel Stick-Breaking Process for Multi-Task Image Analysis [Link] [Bibtex]
		Multi-Task Compressive Sensing with Dirichlet Process Priors [Link] [Bibtex]
		A Unified Architecture for Natural Language Processing: Deep Neural Networks with Multitask Learning [Link] [Bibtex]
	2007	Boosting for Transfer Learning [Link] [Bibtex]
		Self-taught Learning: Transfer Learning from Unlabeled Data [Link] [Bibtex]
		Robust Multi-Task Learning with t-Processes [Link] [Bibtex]
		Multi-Task Learning for Sequential Data via iHMMs and the Nested Dirichlet Process [Link] [Bibtex]
		Cross-Domain Transfer for Reinforcement Learning [Link] [Bibtex]
		Learning a Meta-Level Prior for Feature Relevance from Multiple Related Tasks [Link] [Bibtex]
		Multi-Task Reinforcement Learning: A Hierarchical Bayesian Approach [Link] [Bibtex]
		The Matrix Stick-Breaking Process for Flexible Multi-Task Learning [Link] [Bibtex]
		Asymptotic Bayesian Generalization Error When Training and Test Distributions Are Different [Link] [Bibtex]
		Discriminative Learning for Differing Training and Test Distributions [Link] [Bibtex]
	2006	Autonomous Shaping: Knowledge Transfer in Reinforcement Learning [Link] [Bibtex]
	2006	Constructing Informative Priors using Transfer Learning [Link] [Bibtex]
NIPS	2008	Clustered Multi-Task Learning: A Convex Formulation [Link] [Bibtex]
		Multi-task Gaussian Process Learning of Robot Inverse Dynamics [Link] [Bibtex]
		Transfer Learning by Distribution Matching for Targeted Advertising [Link] [Bibtex]
		Translated Learning: Transfer Learning across Different Feature Spaces [Link] [Bibtex]
		An empirical Analysis of Domain Adaptation Algorithms for Genomic Sequence Analysis [Link] [Bibtex]
		Domain Adaptation with Multiple Sources [Link] [Bibtex]
	2007	Learning Bounds for Domain Adaptation [Link] [Bibtex]
		Transfer Learning using Kolmogorov Complexity: Basic Theory and Empirical Evaluations [Link] [Bibtex]
		A Spectral Regularization Framework for Multi-Task Structure Learning [Link] [Bibtex]
		Multi-task Gaussian Process Prediction [Link] [Bibtex]
		Semi-Supervised Multitask Learning [Link] [Bibtex]
		Gaussian Process Models for Link Analysis and Transfer Learning [Link] [Bibtex]
		Multi-Task Learning via Conic Programming [Link] [Bibtex]
		Direct Importance Estimation with Model Selection and Its Application to Covariate Shift Adaptation [Link] [Bibtex]
	2006	Correcting Sample Selection Bias by Unlabeled Data [Link] [Bibtex]
		Dirichlet-Enhanced Spam Filtering based on Biased Samples [Link] [Bibtex]
		Analysis of Representations for Domain Adaptation [Link] [Bibtex]
		Multi-Task Feature Learning [Link] [Bibtex]
AISTAT	2009	A Hierarchical Nonparametric Bayesian Approach to Statistical Language Model Domain Adaptation [Link] [Bibtex]
	2007	Kernel Multi-task Learning using Task-specific Features [Link] [Bibtex]
	2007	Inductive Transfer for Bayesian Network Structure Learning [Link] [Bibtex]
ECML/PKDD	2009	Relaxed Transfer of Different Classes via Spectral Partition [Link] [Bibtex]
		Feature Selection by Transfer Learning with Linear Regularized Models [Link] [Bibtex]
		Semi-Supervised Multi-Task Regression [Link] [Bibtex]
	2008	Actively Transfer Domain Knowledge [Link] [Bibtex]
		An Algorithm for Transfer Learning in a Heterogeneous Environment [Link] [Bibtex]
		Transferred Dimensionality Reduction [Link] [Bibtex]
		Modeling Transfer Relationships between Learning Tasks for Improved Inductive Transfer [Link] [Bibtex]
		Kernel-Based Inductive Transfer [Link] [Bibtex]
	2007	Graph-Based Domain Mapping for Transfer Learning in General Games [Link] [Bibtex]
		Bridged Refinement for Transfer Learning [Link] [Bibtex]
		Transfer Learning in Reinforcement Learning Problems Through Partial Policy Recycling [Link] [Bibtex]
		Domain Adaptation of Conditional Probability Models via Feature Subsetting [Link] [Bibtex]
	2006	Skill Acquisition via Transfer Learning and Advice Taking [Link] [Bibtex]
COLT	2009	Online Multi-task Learning with Hard Constraints [Link] [Bibtex]
		Taking Advantage of Sparsity in Multi-Task Learning [Link] [Bibtex]
		Domain Adaptation: Learning Bounds and Algorithms [Link] [Bibtex]
	2008	Learning coordinate gradients with multi-task kernels [Link] [Bibtex]
	2008	Linear Algorithms for Online Multitask Classification [Link] [Bibtex]
	2007	Multitask Learning with Expert Advice [Link] [Bibtex]
	2006	Online Multitask Learning [Link] [Bibtex]
UAI	2009	Bayesian Multitask Learning with Latent Hierarchies [Link] [Bibtex]
	2009	Multi-Task Feature Learning Via Efficient L2,1-Norm Minimization [Link] [Bibtex]
	2008	Convex Point Estimation using Undirected Bayesian Transfer Hierarchies [Link] [Bibtex]
Data Mining Conferences
KDD	2009	Cross Domain Distribution Adaptation via Kernel Mapping [Link] [Bibtex]
	2009	Extracting Discriminative Concepts for Domain Adaptation in Text Mining [Link] [Bibtex]
	2008	Spectral domain-transfer learning [Link] [Bibtex]
	2008	Knowledge transfer via multiple model local structure mapping [Link] [Bibtex]
	2007	Co-clustering based Classification for Out-of-domain Documents [Link] [Bibtex]
	2006	Reverse Testing: An Efficient Framework to Select Amongst Classifiers under Sample Selection Bias [Link] [Bibtex]
ICDM	2008	Unsupervised Cross-domain Learning by Interaction Information Co-clustering [Link] [Bibtex]
ICDM	2008	Using Wikipedia for Co-clustering Based Cross-domain Text Classification [Link] [Bibtex]
SDM	2008	Type-Independent Correction of Sample Selection Bias via Structural Discovery and Re-balancing [Link] [Bibtex]
	2008	Direct Density Ratio Estimation for Large-scale Covariate Shift Adaptation [Link] [Bibtex]
	2007	On Sample Selection Bias and Its Efficient Correction via Model Averaging and Unlabeled Examples [Link] [Bibtex]
	2007	Probabilistic Joint Feature Selection for Multi-task Learning [Link] [Bibtex]
Application Conferences
SIGIR	2009	Mining Employment Market via Text Block Detection and Adaptive Cross-Domain Information Extraction [Link] [Bibtex]
	2009	Knowledge transformation for cross-domain sentiment classification [Link] [Bibtex]
	2008	Topic-bridged PLSA for cross-domain text classification [Link] [Bibtex]
	2007	Cross-Lingual Query Suggestion Using Query Logs of Different Languages [Link] [Bibtex]
	2006	Tackling Concept Drift by Temporal Inductive Transfer [Link] [Bibtex]
		Constructing Informative Prior Distributions from Domain Knowledge in Text Classification [Link] [Bibtex]
		Building Bridges for Web Query Classification [Link] [Bibtex]
WWW	2009	Latent Space Domain Transfer between High Dimensional Overlapping Distributions [Link] [Bibtex]
WWW	2008	Can Chinese web pages be classified with English data source? [Link] [Bibtex]
ACL	2009	Transfer Learning, Feature Selection and Word Sense Disambiguation [Link] [Bibtex]
		Graph Ranking for Sentiment Transfer [Link] [Bibtex]
		Multi-Task Transfer Learning for Weakly-Supervised Relation Extraction [Link] [Bibtex]
		Cross-Domain Dependency Parsing Using a Deep Linguistic Grammar [Link] [Bibtex]
		Heterogeneous Transfer Learning for Image Clustering via the SocialWeb [Link] [Bibtex]
	2008	Exploiting Feature Hierarchy for Transfer Learning in Named Entity Recognition [Link] [Bibtex]
		Multi-domain Sentiment Classification [Link] [Bibtex]
		Active Sample Selection for Named Entity Transliteration [Link] [Bibtex]
		Mining Wiki Resources for Multilingual Named Entity Recognition [Link] [Bibtex]
		Multi-Task Active Learning for Linguistic Annotations [Link] [Bibtexs]
	2007	Domain Adaptation with Active Learning for Word Sense Disambiguation [Link] [Bibtex]
		Frustratingly Easy Domain Adaptation [Link] [Bibtex]
		Instance Weighting for Domain Adaptation in NLP [Link] [Bibtex]
		Biographies, Bollywood, Boom-boxes and Blenders: Domain Adaptation for Sentiment Classification [Link] [Bibtex]
		Self-Training for Enhancement and Domain Adaptation of Statistical Parsers Trained on Small Datasets [Link] [Bibtex]
	2006	Estimating Class Priors in Domain Adaptation for Word Sense Disambiguation [Link] [Bibtex]
	2006	Simultaneous English-Japanese Spoken Language Translation Based on Incremental Dependency Parsing and Transfer [Link] [Bibtex]
CVPR	2009	Domain Transfer SVM for Video Concept Detection [Link] [Bibtex]
	2009	Boosted Multi-Task Learning for Face Verification With Applications to Web Image and Video Search [Link] [Bibtex]
	2008	Transfer Learning for Image Classification with Sparse Prototype Representations [Link] [Bibtex]

Workshops

NIPS 2005 Workshop – Inductive Transfer: 10 Years Later

NIPS 2005 Workshop – Interclass Transfer

NIPS 2006 Workshop – Learning when test and training inputs have different distributions

AAAI 2008 Workshop – Transfer Learning for Complex Tasks

你可能感兴趣的:(machine,learning)

client-go: k8s选主
快速上手下面这个代码就是一个选主的大概逻辑packagemainimport("context""flag""fmt"_"net/http/pprof""os""path/filepath""time""golang.org/x/exp/rand"v1"k8s.io/api/core/v1"metav1"k8s.io/apimachinery/pkg/apis/meta/v1""k8s.io/ap
如何调整优化器的参数来优化神经网络性能？ Idividuals 深度学习神经网络机器学习 python scikit-learn
不同优化器有不同的可调整参数，下面以常见的优化器为例，讲解如何调整其参数来优化神经网络性能：Adam优化器Adam优化器有几个关键参数：learning_rate（学习率）、beta_1、beta_2和epsilon。1.学习率(learning_rate)-作用：控制每次参数更新的步长。学习率过大，模型可能无法收敛，在最优解附近振荡甚至发散；学习率过小，训练速度会非常缓慢。-调整方法：通常初始值
人工智能入门指南：从基础概念到实际应用
前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站。https://www.captainbed.cn/north文章目录1.**人工智能的基本概念**1.1什么是人工智能？1.2人工智能的分类2.**人工智能的核心技术**2.1机器学习（MachineLearning）2.1.1机器学习的类型2.1.2机器学习流程2.2深度学习（DeepLearni
基于探路者算法优化的核极限学习机(KELM)分类算法智能算法研学社（Jack旭）智能优化算法应用机器学习 #核极限学习机（KELM）算法分类数据挖掘
基于探路者算法优化的核极限学习机(KELM)分类算法文章目录基于探路者算法优化的核极限学习机(KELM)分类算法1.KELM理论基础2.分类问题3.基于探路者算法优化的KELM4.测试结果5.Matlab代码摘要：本文利用探路者算法对核极限学习机(KELM)进行优化，并用于分类1.KELM理论基础核极限学习机（KernelBasedExtremeLearningMachine，KELM）是基于极限
【转】【译】How to Handle Very Long Sequences with LSTM（LSTM RNN 超长序列处理）开始奋斗的胖子机器学习 RNN LSTM 序列深度学习
原文地址http://machinelearningmastery.com/handle-long-sequences-long-short-term-memory-recurrent-neural-networks/一个长的输入序列却只对应一个或者一小段输出就是我们经常说的序列标注和序列分类。主要包括下面一些例子：包含上千个词的文件情感分类（NLP）包含上千个时间状态的脑电痕迹分类（Medici
KAIST：LLM混合递归推理大模型任我行大模型-推理优化人工智能自然语言处理语言模型论文笔记
标题：Mixture-of-Recursions:LearningDynamicRecursiveDepthsforAdaptiveToken-LevelComputation来源：arXiv,2507.10524摘要缩放语言模型解锁了令人印象深刻的能力，但伴随的计算和内存需求使训练和部署都很昂贵。现有的效率工作通常针对参数共享或自适应计算，留下了如何同时实现两者的问题。我们引入了混合递归(MoR
【HDLBits习题详解 2】Circuit - Sequential Logic（5）Finite State Machines 【更新中...】薄荷雪 fpga开发
1.Fsm1（SimpleFSM1-asynchronousreset）moduletop_module#(parameterA=0;parameterB=1;),(outputregout,inputclk,inputareset,inputin);regstate,next_state;//Outputlogic//assignout=(state==...);assignout=;alway
How to SSH into your Ubuntu machine from macOS as superuser captainOO7 Networking ssh ubuntu macos
ToSSHintoyourUbuntumachinefrommacOSassuperuser,you’llfirstconnectasaregularuser,thenelevateprivilegesonceloggedin.Here'showtodoitstepbystep:Step1:EnableSSHonUbuntuMakesuretheSSHserverisinstalledandrun
SPARKLE：深度剖析强化学习如何提升语言模型推理能力
摘要：强化学习（ReinforcementLearning，RL）已经成为赋予语言模型高级推理能力的主导范式。尽管基于RL的训练方法（例如GRPO）已经展示了显著的经验性收益，但对其优势的细致理解仍然不足。为了填补这一空白，我们引入了一个细粒度的分析框架，以剖析RL对推理的影响。我们的框架特别研究了被认为可以从RL训练中受益的关键要素：（1）计划遵循和执行，（2）问题分解，以及（3）改进的推理和知
Python机器学习教程
Python机器学习教程(MachineLearningwithPythonTutorial)PDFVersionQuickGuideResourcesJobSearchDiscussionPDF版本快速指南资源资源求职讨论区MachineLearning(ML)isbasicallythatfieldofcomputersciencewiththehelpofwhichcomputersyste
【DW11月-深度学习】Task03前馈神经网络沫2021
参考链接：https://datawhalechina.github.io/unusual-deep-learning/#/4.%E5%89%8D%E9%A6%88%E7%A5%9E%E7%BB%8F%E7%BD%91%E7%BB%9C一、神经元模型2.1神经元1943年，美国神经生理学家沃伦·麦卡洛克(WarrenMcCulloch)和数学家沃尔特·皮茨(WalterPitts)对生物神经元进行
边缘智能革命：嵌入式机器学习如何让万物“思考” 万能小贤哥机器学习人工智能
当智能手表精准识别你的健身动作，工业传感器预测设备故障于毫秒之间，农业传感器自动调节灌溉水量——这些并非科幻场景，而是嵌入式机器学习（EmbeddedMachineLearning,或TinyML）正在悄然重塑的现实。这场发生在设备边缘的智能革命，正将AI从云端的数据中心拉近到我们指尖的每一台设备中。一、嵌入式机器学习：定义与核心价值嵌入式机器学习是指在资源极端受限的微控制器（MCU）、微处理器（
预测导管原位癌浸润性复发的深度学习：利用组织病理学图像和临床特征浪漫的诗人论文深度学习人工智能
文章目录研究内容目的方法数据集模型开发模型训练与评估外部验证统计分析研究结果模型性能风险分层外部验证特征重要性原文链接原文献：Deeplearningforpredictinginvasiverecurrenceofductalcarcinomainsitu:leveraginghistopathologyimagesandclinicalfeatures研究背景【DCIS与IBC的关联】乳腺导管
《How to Take Smart Notes》读书笔记1 LY320
最近在读一本书，题为《HowtoTakeSmartNotes:OneSimpleTechniquetoBoostWriting,LearningandThinking–forStudents,AcademicsandNonfictionBookWriters》1。尚未读完，分享一些读这本书的感想，我的一些心得，和不解。这本书让我觉得最有收获的点是更新了我对记录和整理笔记的认识。通常我们在记录笔记时
2021-03-22 每日打卡来多喜
昨日完成情况：1.完成了3k跑，太久没锻炼体力跟不上，没力气做帕梅拉了。2.MathematicsforMachineLearning:LinearAlgebra学完了week3和week4，week5还剩大概一个小时学完，没有开始做思维导图。早上跑步回来后看《你是我的城池堡垒》看了两个小时，虽然一边看一边洗碗，洗完碗一边看一边吃饭，但是从三点多才开始学习。重要的事情要先做！3.没有时间做Pyth
Opencv学习_2 （opencv结构&显示图像）
opencv结构：1：主要包含：cxcorecvmachinelearninghighguicvcamcvaux2：cxcore:基础结构:CvPoint,CvSize,CvScalar等数组结构:cvCreateImage,cvCreateMat等动态结构:CvMemStorage,CvMemBlock等绘图函数:cvLine,cvRectangle等数据保存和运行时类型信息：CvFileSto
#Datawhale组队学习#7月-强化学习Task1 fzyz123 Datawhale组队学习强化学习人工智能 AI
这里是Datawhale组织的组队学习《强化学习入门202507》，Datawhale是一个开源的社区。第一章绪论1.1为什么要学习强化学习？强化学习（ReinforcementLearning,RL）是机器学习中专注于智能体（Agent）如何通过与环境交互学习最优决策策略的分支。与监督学习依赖静态数据集、无监督学习聚焦数据内在结构不同，强化学习的核心在于序贯决策：智能体通过试错探索环境，根据行动
图机器学习（13）——图相似性检测
图机器学习（13）——图相似性检测0.前言1.基于图嵌入的方法2.基于图核的方法3.基于GNN的方法4.应用0.前言图机器学习(machinelearning,ML)方法能广泛应用于各类任务，其应用场景涵盖从药物设计到社交网络推荐系统等多个领域。值得注意的是，由于这类方法在设计上具有通用性，同一算法可用于解决不同问题。学习图之间相似性的定量度量是一个关键问题。事实上，这是网络分析的重要步骤，同时也
状态机（State Machine）是什么？ Yashar Qian 计算机体系结构的那些事儿计算机体系结构设计模式数学模型
状态机（StateMachine）是什么？状态机（StateMachine）详解状态机是一种描述系统行为的数学模型，用于表示一个对象或程序在有限状态之间的转换逻辑。它通过状态（State）、**事件（Event）和动作（Action）**的交互，清晰地定义系统如何响应外部输入或内部条件变化。以下是其核心解析：状态机的核心组成组件说明示例（红绿灯）状态（State）系统所处的稳定模式，包含特定属性或
Cool Pi CM5-LAPTOP Linux Quick Start Guide george-coolpi linux 运维服务器开源 arm开发 AI编程
MachineIntroductionCOOLPICM5open-sourcenotebookisaproductthatcombineshighperformance,portability,andopen-sourcespirit.Itnotonlymeetsthebasiccomputingneedsofusers,butalsoprovidesanidealplatformforthose
JVM初学者指南：Java虚拟机基础知识笔记 lenyan~ 笔记技术 JVM jvm java 笔记
JVM初学者指南：Java虚拟机基础知识全解析摘要：本文记录了Java虚拟机(JVM)的基本概念、架构、内存模型及工作原理的相关笔记-lenyan。一、JVM简介1.1什么是JVM？JVM(JavaVirtualMachine，Java虚拟机)是运行Java字节码的虚拟机。JVM是Java"一次编写，到处运行"这一特性的关键所在。无论什么平台，只要安装了对应的JVM，就能运行Java程序。JVM有
强化学习之 DQN、Double DQN、PPO JNU freshman 强化学习强化学习
文章目录通俗理解DQNDoubleDQNPPO结合公式理解通俗理解DQN一个简单的比喻和分步解释来理解DQN（DeepQ-Network，深度Q网络），就像教小朋友学打游戏一样：先理解基础概念：Q学习（Q-Learning）想象你在教一只小狗玩电子游戏（比如打砖块）。小狗每做一个动作（比如“向左移动”或“发射球”），游戏会给出一个奖励（比如得分增加）或惩罚（比如球掉了）。小狗的目标是通过不断尝试，
来聊聊一个轻量级的有限状态机Cola-StateMachine shark-chili Java核心技术精讲 java
文章目录写在文章开头状态机基本概念扫盲基于Cola-StateMachine落地下单业务业务流程说明状态机落地最终效果演示小结参考写在文章开头简单研究了一下研究了一下市面上的几个状态机框架，包括但不限制于SpringStatemachine以及Cola-StateMachine，考虑到前者上下文会记录当前状态机的相关属性(当前状态信息、上一次状态)，对此我们就必须要通过工厂模式等方式规避这些问题，
什么是ARM架构和Cortex内核？ cykaw2590 单片机MCU arm开发架构
ARM（AdvancedRISCMachine）架构是一种基于精简指令集（RISC，ReducedInstructionSetComputing）的计算机处理器架构，广泛应用于移动设备、嵌入式系统、物联网设备等领域。ARM架构的处理器以其高效的功耗和较低的发热量著称，是目前移动设备中最主流的处理器架构之一。ARM架构的特点高效的功耗：ARM架构设计旨在减少功耗，这对于需要长时间续航的设备非常重要，
使用Python进行机器学习入门指南软考和人工智能学堂 Python开发经验 python 机器学习开发语言
使用Python进行机器学习入门指南机器学习（MachineLearning）是人工智能（ArtificialIntelligence,AI）的一个重要分支，旨在通过算法和统计模型，使计算机系统能够自动从数据中学习和改进。Python作为机器学习领域的主流编程语言，提供了丰富的库和工具来实现各种机器学习任务。本文将介绍如何使用Python进行机器学习，包括基本概念、常用库以及一个实战项目示例。目录
少样本图学习（few-shot learning on graph）知识背景 so.far_away 网络空间安全学习机器学习人工智能
Few-ShotLearningonGraph少样本学习简介少样本图学习简介1.SupportSet和QuerySet（针对单个任务）（1）SupportSet（支持集）（2）QuerySet（查询集）2.BaseData和NovelData（针对整个数据集）（1）BaseData/Classes（基类数据）（2）NovelData/Classes（新类数据）少样本学习简介少样本学习（FSL）旨在
Building Apps with AI Tools: ChatGPT, Semantic Kernel, and Langchain 项目推荐滕娴殉
BuildingAppswithAITools:ChatGPT,SemanticKernel,andLangchain项目推荐building-apps-with-ai-tools-chatgpt-semantic-kernel-langchain-4469616ThisisacoderepositoryfortheLinkedInLearningcourseBuildingAppswithAIT
量子机器学习入门：从理论到实践
量子机器学习入门：从理论基石到实践路径元数据框架标题量子机器学习入门：从理论基石到实践路径——连接量子计算与人工智能的未来桥梁关键词量子计算；机器学习；量子算法；量子神经网络；Qiskit；PennyLane；量子变分算法摘要量子机器学习（QuantumMachineLearning,QML）是量子计算与机器学习的交叉领域，通过量子计算的叠加态、纠缠和并行性解决传统机器学习的计算瓶颈（如高维数据处
量子计算突破：8比特扩散模型实现指数级加速晨曦543210 人工智能
目录一、量子扩散模型（QuantumDiffusion）二、DNA存储生成（Biological-GAN）三、光子计算加速四、神经形态生成五、引力场渲染六、分子级生成七、星际生成网络八、元生成系统极限挑战方向一、量子扩散模型（QuantumDiffusion）量子线路模拟经典扩散过程fromqiskitimportQuantumCircuitfromqiskit_machine_learning.
大模型的“涌现能力“：现象、表现与成因解析北辰alk AI 深度学习人工智能
文章目录一、涌现能力的本质与特征1.1基本定义1.2识别标准二、三种典型涌现能力表现2.1少样本上下文学习（Few-shotIn-contextLearning）表现特征实证数据可能成因2.2思维链推理（Chain-of-ThoughtReasoning）表现特征典型案例可能成因2.3指令跟随（InstructionFollowing）表现特征能力对比可能成因三、涌现能力的理论解释3.1相变理论视
JVM StackMapTable 属性的作用及理解 lijingyao8206 jvm 字节码 Class文件 StackMapTable
在Java 6版本之后JVM引入了栈图(Stack Map Table)概念。为了提高验证过程的效率，在字节码规范中添加了Stack Map Table属性，以下简称栈图，其方法的code属性中存储了局部变量和操作数的类型验证以及字节码的偏移量。也就是一个method需要且仅对应一个Stack Map Table。在Java 7版
回调函数调用方法百合不是茶 java
最近在看大神写的代码时,.发现其中使用了很多的回调 ,以前只是在学习的时候经常用到 ,现在写个笔记记录一下代码很简单: MainDemo :调用方法得到方法的返回结果
[时间机器]制造时间机器需要一些材料 comsci 制造
根据我的计算和推测,要完全实现制造一台时间机器,需要某些我们这个世界不存在的物质和材料... 甚至可以这样说,这种材料和物质,我们在反应堆中也无法获得......
开口埋怨不如闭口做事邓集海邓集海做人做事工作
“开口埋怨，不如闭口做事。”不是名人名言，而是一个普通父亲对儿子的训导。但是，因为这句训导，这位普通父亲却造就了一个名人儿子。这位普通父亲造就的名人儿子，叫张明正。　　　　张明正出身贫寒，读书时成绩差，常挨老师批评。高中毕业，张明正连普通大学的分数线都没上。高考成绩出来后，平时开口怨这怨那的张明正，不从自身找原因，而是不停地埋怨自己家庭条件不好、埋怨父母没有给他创造良好的学习环境。　　　　
jQuery插件开发全解析，类级别与对象级别开发 IT独行者 jquery 开发插件　函数
jQuery插件的开发包括两种：一种是类级别的插件开发，即给 jQuery添加新的全局函数，相当于给 jQuery类本身添加方法。 jQuery的全局函数就是属于 jQuery命名空间的函数，另一种是对象级别的插件开发，即给 jQuery对象添加方法。下面就两种函数的开发做详细的说明。 1 、类级别的插件开发类级别的插件开发最直接的理解就是给jQuer
Rome解析Rss 413277409 Rome解析Rss
import java.net.URL; import java.util.List; import org.junit.Test; import com.sun.syndication.feed.synd.SyndCategory; import com.sun.syndication.feed.synd.S
RSA加密解密无量加密解密 rsa
RSA加密解密代码代码有待整理 package com.tongbanjie.commons.util; import java.security.Key; import java.security.KeyFactory; import java.security.KeyPair; import java.security.KeyPairGenerat
linux 软件安装遇到的问题 aichenglong linux 遇到的问题 ftp
1 ftp配置中遇到的问题 500 OOPS: cannot change directory 出现该问题的原因:是SELinux安装机制的问题.只要disable SELinux就可以了修改方法:1 修改/etc/selinux/config 中SELINUX=disabled 2 source /etc
面试心得 alafqq 面试
最近面试了好几家公司。记录下；支付宝，面试我的人胖胖的，看着人挺好的；博彦外包的职位，面试失败；阿里金融，面试官人也挺和善，只不过我让他吐血了。。。由于印象比较深，记录下； 1，自我介绍 2，说下八种基本类型；（算上string。楼主才答了3种，哈哈，string其实不是基本类型，是引用类型） 3，什么是包装类，包装类的优点； 4，平时看过什么书？NND，什么书都没看过。。照样
java的多态性探讨百合不是茶 java
java的多态性是指main方法在调用属性的时候类可以对这一属性做出反应的情况 //package 1; class A{ public void test(){ System.out.println("A"); } } class D extends A{ public void test(){ S
网络编程基础篇之JavaScript-学习笔记 bijian1013 JavaScript
1.documentWrite <html> <head> <script language="JavaScript"> document.write("这是电脑网络学校"); document.close(); </script> </h
探索JUnit4扩展：深入Rule bijian1013 JUnit Rule 单元测试
本文将进一步探究Rule的应用，展示如何使用Rule来替代@BeforeClass，@AfterClass，@Before和@After的功能。在上一篇中提到，可以使用Rule替代现有的大部分Runner扩展，而且也不提倡对Runner中的withBefores()，withAfte
[CSS]CSS浮动十五条规则 bit1129 css
这些浮动规则，主要是参考CSS权威指南关于浮动规则的总结，然后添加一些简单的例子以验证和理解这些规则。 1. 所有的页面元素都可以浮动 2. 一个元素浮动后，会成为块级元素，比如<span>,a, strong等都会变成块级元素 3.一个元素左浮动，会向最近的块级父元素的左上角移动，直到浮动元素的左外边界碰到块级父元素的左内边界；如果这个块级父元素已经有浮动元素停靠了
【Kafka六】Kafka Producer和Consumer多Broker、多Partition场景 bit1129 partition
0.Kafka服务器配置 3个broker 1个topic，6个partition，副本因子是2 2个consumer，每个consumer三个线程并发读取 1. Producer package kafka.examples.multibrokers.producers; import java.util.Properties; import java.util.
zabbix_agentd.conf配置文件详解 ronin47 zabbix 配置文件
Aliaskey的别名，例如 Alias=ttlsa.userid:vfs.file.regexp[/etc/passwd,^ttlsa:.:([0-9]+),,,,\1]，或者ttlsa的用户ID。你可以使用key：vfs.file.regexp[/etc/passwd,^ttlsa:.: ([0-9]+),,,,\1]，也可以使用ttlsa.userid。备注: 别名不能重复，但是可以有多个
java--19.用矩阵求Fibonacci数列的第N项 bylijinnan fibonacci
参考了网上的思路，写了个Java版的： public class Fibonacci { final static int[] A={1,1,1,0}; public static void main(String[] args) { int n=7; for(int i=0;i<=n;i++){ int f=fibonac
Netty源码学习-LengthFieldBasedFrameDecoder bylijinnan java netty
先看看LengthFieldBasedFrameDecoder的官方API http://docs.jboss.org/netty/3.1/api/org/jboss/netty/handler/codec/frame/LengthFieldBasedFrameDecoder.html API举例说明了LengthFieldBasedFrameDecoder的解析机制，如下：实
AES加密解密 chicony 加密解密
AES加解密算法，使用Base64做转码以及辅助加密： package com.wintv.common; import javax.crypto.Cipher; import javax.crypto.spec.IvParameterSpec; import javax.crypto.spec.SecretKeySpec; import sun.misc.BASE64Decod
文件编码格式转换 ctrain 编码格式
package com.test; import java.io.File; import java.io.FileInputStream; import java.io.FileOutputStream; import java.io.IOException; import java.io.InputStream; import java.io.OutputStream;
mysql 在linux客户端插入数据中文乱码 daizj mysql 中文乱码
1、查看系统客户端，数据库，连接层的编码查看方法： http://daizj.iteye.com/blog/2174993 进入mysql，通过如下命令查看数据库编码方式： mysql> show variables like 'character_set_%'; +--------------------------+------
好代码是廉价的代码 dcj3sjt126com 程序员读书
长久以来我一直主张：好代码是廉价的代码。当我跟做开发的同事说出这话时，他们的第一反应是一种惊愕，然后是将近一个星期的嘲笑，把它当作一个笑话来讲。当他们走近看我的表情、知道我是认真的时，才收敛一点。当最初的惊愕消退后，他们会用一些这样的话来反驳： “好代码不廉价，好代码是采用经过数十年计算机科学研究和积累得出的最佳实践设计模式和方法论建立起来的精心制作的程序代码。” 我只
Android网络请求库——android-async-http dcj3sjt126com android
在iOS开发中有大名鼎鼎的ASIHttpRequest库，用来处理网络请求操作，今天要介绍的是一个在Android上同样强大的网络请求库android-async-http，目前非常火的应用Instagram和Pinterest的Android版就是用的这个网络请求库。这个网络请求库是基于Apache HttpClient库之上的一个异步网络请求处理库，网络处理均基于Android的非UI线程，通
ORACLE 复习笔记之SQL语句的优化 eksliang SQL优化 Oracle sql语句优化 SQL语句的优化
转载请出自出处：http://eksliang.iteye.com/blog/2097999 SQL语句的优化总结如下 sql语句的优化可以按照如下六个步骤进行：合理使用索引避免或者简化排序消除对大表的扫描避免复杂的通配符匹配调整子查询的性能 EXISTS和IN运算符下面我就按照上面这六个步骤分别进行总结：
浅析：Android 嵌套滑动机制（NestedScrolling） gg163 android 移动开发滑动机制嵌套
谷歌在发布安卓 Lollipop版本之后，为了更好的用户体验，Google为Android的滑动机制提供了NestedScrolling特性 NestedScrolling的特性可以体现在哪里呢？ 比如你使用了Toolbar，下面一个ScrollView，向上滚
使用hovertree菜单作为后台导航 hvt JavaScript jquery .net hovertree asp.net
hovertree是一个jquery菜单插件，官方网址：http://keleyi.com/jq/hovertree/ ，可以登录该网址体验效果。 0.1.3版本：http://keleyi.com/jq/hovertree/demo/demo.0.1.3.htm hovertree插件包含文件： http://keleyi.com/jq/hovertree/css
SVG 教程（二）矩形天梯梦 svg
SVG <rect> SVG Shapes SVG有一些预定义的形状元素，可被开发者使用和操作：矩形 <rect> 圆形 <circle> 椭圆 <ellipse> 线 <line> 折线 <polyline> 多边形 <polygon> 路径 <path>
一个简单的队列 luyulong java 数据结构队列
public class MyQueue { private long[] arr; private int front; private int end; // 有效数据的大小 private int elements; public MyQueue() { arr = new long[10]; elements = 0; front
基础数据结构和算法九：Binary Search Tree sunwinner Algorithm
A binary search tree (BST) is a binary tree where each node has a Comparable key (and an associated value) and satisfies the restriction that the key in any node is larger than the keys in all
项目出现的一些问题和体会 Steven-Walker DAO Web servlet
第一篇博客不知道要写点什么，就先来点近阶段的感悟吧。这几天学了servlet和数据库等知识，就参照老方的视频写了一个简单的增删改查的，完成了最简单的一些功能，使用了三层架构。 dao层完成的是对数据库具体的功能实现，service层调用了dao层的实现方法，具体对servlet提供支持。 &
高手问答：Java老A带你全面提升Java单兵作战能力！ ITeye管理员 java
本期特邀《Java特种兵》作者：谢宇，CSDN论坛ID: xieyuooo 针对JAVA问题给予大家解答，欢迎网友积极提问，与专家一起讨论! 作者简介：淘宝网资深Java工程师，CSDN超人气博主，人称“胖哥”。 CSDN博客地址： http://blog.csdn.net/xieyuooo 作者在进入大学前是一个不折不扣的计算机白痴，曾经被人笑话过不懂鼠标是什么，