从alphago zero职场中准备多种可能的重要性

        强化学习(深度强化学习)是目前AI领域的热点研究方向,强化学习相比于常见机器学习算法(监督学习)的一个特点是,是对当前状态(state,类比监督学习中的样本)采取行为(action)后,环境(environment)会给系统一个反信号(reward),系统根据会根据反馈信号调整自己的行为,不断迭代进而学习出对给定状态的最优决策(policy,环境到行为的映射)。基于反馈,不断根据反馈调整学习策略,强化学习因此也被认为是最接近人或动物学习过程的学习范式,是通往真正人工智能的重要路径。

        在之前的文章中提到过,alphago zero的一个重要创新是提出了一种新的强化学习算法来训练围棋局面评估网络(同时也是下棋的策略网络),使得系统的棋力能够超越利用人类棋谱的天花板。围棋这种规则明确的封闭游戏,使得能对下的每一步棋低成本的获得反馈成为可能,事实上alphago zero算法也巧妙的利用了这一点。但是有了反馈就一定能够学习出最为强大的围棋系统吗?个人认为反馈只是alphago zero成功的必要条件之一,能够不局限于当前最优的策略,有机会进行自由(随机)探索(exploration),是alphago zero成功的另一个必要条件。

        啰嗦了这么多,与我们今天要聊的的职场有啥关系呢,我们再聊下中年职业发展危机。

        中兴员工跳楼事件,或多或少都会给每一个职场工作多年的人带来心理冲击。当我们工作10年左右,大部分已经步入中年或即将步入中年.

        曹政大牛说的很形象:“有些人工作体面,职业稳定,可能已经做到中高级管理,脱离一线技术和产品了,然后,突然某种原因,比如企业裁员,或其他问题,失业了。已经习惯了一种工作方式,一种企业文化,一种业务模式,而且,岁数又大,待遇要求又高,技术技术不行了,产品产品不行了,可能真就一下子找不到工作了。这样的例子,中外都有,行业很残酷,岁数一大,又没有能在技能上与时俱进,结果陷入极为尴尬的境地。”有兴趣的战友可以看曹政大牛的文章(职场通病,搞不成低不就的尴尬)。

        那对于我们来讲怎么样来突破职业发展瓶颈,或者说避免职业发展危机呢?alphago zero带给我们的启示是:多准备一些可能性。那怎么样准备职业发展的多种可能性呢?个人的一些想法,欢迎大家探讨。

(1)工作中多用一些新的方法或工具解决问题。异类中提到过10万小时定律,但是如果总是重复之前的练习,成为专家是不可能的。我们需要刻意的去练习,尝试一些自己不熟或者不顺手新方法或新工具,来解决工作中的问题,针对性提高行业所需要的技能,才能不断提升专业能力。能否针对自己的弱点去刻意的去练习,也是业余选手与职业选手的一个重要分水岭。

(2)跳出舒适区,进入相关的新领域或新的工作方向。如果仅在一个领域时间长了,即使顶尖的专家,也会遇到瓶颈。这个时候我们可能需要尝试一些新领域,在一个新的领域,面对的问题是全新的,不断的解决新问题尤其是有挑战性的新问题,成长速度往往是最快的。此外,新领域往往竞争对手会相对较少,容易获得先发优势。但是也要要注意,如果不是绝对自信,要谨慎选择自己完全不熟悉的领域,一般选择相关或者能迁移利用自己之前积累的领域。

(3)多参加行业会议与培训。参加行业会议或培训,可以了解相关领域的最新进展,对开阔平时工作中解决问题的思路,大有裨益。同样的问题,要学会选择质量高的会议,同时在会议中要去多交流,多获得新想法。

        职场老兵如果能有危机意识,对未来保持多种可能性,多尝试,相信我们的日子过得不会差。

你可能感兴趣的:(从alphago zero职场中准备多种可能的重要性)