R语言中文社区

如何成为一名卓越的数据科学家 ——七剑之一：问题定义

关于作者：

杨滔，桃树科技（TaoData）创始人，专注于下一代人工智能产品的研发、应用与商业化。拥有超过十年机器学习研究与应用经验。奥克兰大学机器学习博士，悉尼科技大学博士后。曾任阿里巴巴集团数据科学家，建立淘宝网数据科学团队，首创聚划算爆款模型。曾任F团首席科学家，建立F团数据化运营体系。

并非所有问题都可以用数据解决，数据也并非解决所有问题的万能钥匙。

找到合适的问题，并将问题转化为适合用数据解决的问题，是数据科学家工作的第一步。

许多问题看上去并不能用数据解决，但经过数据科学家的破解，数据和算法便可以为这些问题创造价值。也有许多问题看似是数据问题，但实际上数据起到的作用却是微乎其微的。

大数据到底能解决什么问题？

一般来讲，适合用数据解决的问题有以下五个特点：

问题有明确、可量化的目标

机器与人的思维是截然不同的。在机器的每一次决策中，必须存在且只能存在一个目标，并且这个目标是可以量化的。陀思妥耶夫斯基说，“一个人不能同时追逐两只兔子”。实际上，不能同时追逐两只兔子的是机器，而人每一次决策永远存在多重目标，只不过有的目标显得格外重要罢了。

人的思维是一个网状思维，而机器所拥有的却是线性思维。数据科学家需要打通这两种思维，让机器理解人的思维并从数据中学习如何解决人提出的问题。

人与机器各有所长。人擅长定义目标，机器则善于基于定义好的目标24小时不间断地持续学习。大部分被成功应用的数据模型都需要人来定义一个可以量化的目标，而这目标正是机器学习算法学习的对象。

如果我们告诉机器，“请找到淘宝网上最好的商品”，机器一定不能满足我们的要求，因为机器并不知道什么叫做“好”，好的标准是需要人来定义的。

但是，数据科学家可以告诉机器，通过数据为每个用户找到他们最有可能购买的商品。商品是否被用户购买，是一个清晰且可以量化的目标，机器基于这个目标找到合适的商品。

当数据科学家告诉机器，通过数据为每个用户找到他们最有可能点击到商品详情页的商品，机器同样可以基于这个目标找到不同的商品。在两个不同的目标下，机器为用户找到的商品是完全不同的，一个模型侧重满足用户有明确意向的购物需求，而另外一个模型侧重满足用户逛的需求。

许多时候，数据科学家解决一个商业问题需要定义多个目标，每个目标对应一个模型，而最终的数据科学解决方案由多个模型组成。

例如，设计一个电商搜索引擎，需要从不同的角度考虑什么是一个合理的流量分配机制。如果电商搜索的目标仅仅是提高成交转化率，那么这可能会导致搜索所浮现的商品高度同质化。

优化一个电商搜索引擎不仅需要关注成交转化率，同时需要关注浏览转化率、类目丰富度、消费者满意度、新品成交比例、作弊比例等多种因素。

由于机器仅仅能解决单一目标的问题，一个优秀的数据科学家的价值体现在充分理解问题背后的业务背景，站在业务角度提炼明确、可量化的目标，让机器可以在不同目标下从数据中学习，最终完成数据科学的完整解决方案。

可以收集到丰富全面的数据样本

当机器有了清晰的目标之后，它需要足够全面的数据样本才能学习到数据中存在的规律。请注意，数据不一定是越多越好，但是数据一定是越全面越好。百岁山矿泉水喝得次数再多，也不会有可口可乐的味道。许多相似样本出现次数再多，也无法帮助机器获得更多知识。

当数据样本可以覆盖问题的不同侧面时，机器便可以更加完整地从数据中学习到规律。一个人如果只见过白色的天鹅，他自然会认为天鹅全是白色的，黑天鹅便是他决策的盲点。在这一点上，机器与人并无区别。

许多时候，数据科学家在开始实施一个项目之前，需要判断描述问题的样本是否足够全面，问题的不同侧面是否都有足够的样本描述。并且，数据科学家往往需要调整不同类别样本的比例，以保证机器学习算法可以充分理解问题。

在信用风险评估模型中，正常客户的样本一般都会远大于逾期还款客户的样本。如果数据科学家直接把这个数据喂给机器，机器往往会盲目乐观，认为大部分客户都不会逾期还款。在统计学中，只有数据中不同类别的样本相对均匀时，统计推断才是合理的。

当数据中两个类别的样本高度不均衡的时候，机器学习算法从小类别中学习到的信息往往严重少于它从大类别中学到的信息。尤其，逾期还款客户之所以逾期的原因是多种多样的，当这个类别样本量相对不足时，算法很难充分挖掘不同类型逾期还款的信息。

在这种情况下，数据科学家需要重新调整正常客户和逾期还款客户的比例，例如模拟逾期还款客户的样本并从正常客户样本中进行筛选，使得两个类别的样本近似均衡。基于数据科学家处理过的数据，机器学习算法才可以充分从数据样本中识别完整规律。

如果没有大量的围棋比赛数据样本输入给AlphaGo, 纵使AlphaGo使用的算法再高超，也难以胜过李世石。在癌症数据分析中，癌症病人的数据样本是非常稀缺的，而癌症诊断模型是否有效往往取决于患者样本的大小。并且，不同人群的数据样本往往存着巨大的差异，从一个人群的数据样本中得到的结论不一定适用于另一个人群的诊断。

在医学领域，数据科学家往往仅能获得有限的样本数据。在这种情况下，机器学习算法使用的数据变量越多，模型的效果往往越不好。

这就是机器学习中的“维度咒诅问题”——模型使用数据变量个数要随着样本量的增加而增加，不然模型会“过拟合”（即从有限的数据中过度学习从而得到错误推断）。

数据样本的丰富度决定了机器学习的能力。这就是为什么机器不善于创新——机器学习算法很难成功解决一个全新的问题。在新问题中，即使问题目标被定义清晰，数据科学家也很难为机器准备出足够丰富的样本来描述问题。

为了增强机器学习能力，数据科学家有时需要设计“人工标注”任务，让人对数据进行标注从而获得足够的样本。如果人工标注任务设计合理，不仅企业的业务人员，用户也可以参与到人工标注中。例如，用户在产品中的点赞或者收藏行为，其实都是一种数据样本标注行为。

数据收集和数据建模不是两个割裂的步骤，卓越的数据科学家善于设计数据收集机制，让数据模型的使用者一起参与到数据的收集中，让数据收集步骤动态内嵌于数据科学的整个流程中。

描述问题的核心特征可以被数据化

让机器学习技术发挥它的威力，不仅需要一个清晰的目标和丰富的数据样本，也需要描述问题的核心特征可以被数据化。机器学习算法的原理是利用统计模型从数据样本中学习描述问题的特征和目标之间的映射关系。

如果描述问题的特征不能被数据化，机器学习算法便无法学习到这个映射关系。

数据科学家需要用数据分解问题的核心特征，从而让算法来从数据中寻找规律。并且，数据科学家不仅需要判断问题是否可以被数据化，同时需要在数据收集的环节设计特征抽取算法。

在以后的数据科学七剑的第二剑“数据准备”中，我会详细描述数据科学家应该如何收集和准备数据。（数据科学的七剑都是什么？请参见杨滔所著的“如何成为一名卓越的数据科学家——开篇七剑”，详见公众号：桃树科技）

虽然我们身处大数据时代，但并不是所有事物都能被数据化，至少许多事物非常难被数据化。只有当一个事物被充分浸泡在数据空间时，机器学习技术才可以基于数据从中捕获规律。例如，判断一个项目是否值得被投资是很难纯粹依靠数据来决策的，因为影响投资决策的许多因素是不能被数据化的。

同理，人脸识别技术可以精准识别人脸，但人的气质则很难靠机器来分辨，因为气质是很难被数据化的。在图像识别和语音识别等领域，算法往往可以比较直接地发挥作用，这是因为图像和语音特征可以完全被数据化。

在量化交易领域，数据和算法也是可以发挥巨大价值的，这是因为判断股票需要的核心因素大部分都可以被数据化。虽然金融市场不一定存在恒定规律，但机器持续不间断的学习往往可以及时捕捉到局部规律，从而帮助人更好的决策。

然而值得注意的是，在一些复杂决策的问题中，即使问题可以被充分数据化，数据科学家仍需要像侦探一样，将描述问题的关键特征勾勒出来。

在这些问题中，寻找描述问题的关键特征的起点往往是行业经验。人们常以为行业规则和数据建模是对立的。实际上，经验规则正是机器学习的起点。一个领域如果完全没有经验的积累，机器学习技术的启动往往也非常困难。数据科学家需要善于从经验中提炼基础数据，并找到从基础数据生成更多经验规则的方法。

有许多问题，从表面看描述问题的关键特征已经存在，但实际上关键特征却是缺失的。例如，在银行的小微企业线下信贷业务中，判断小微企业信用风险的核心数据往往需要线下实地收集。数据科学家需要设计问卷收集数据，并借助算法来判断什么数据是关键数据。

在现场调查中，信贷员往往需要收集以下数据：商家在调研当时有多少现金、调研时商家厂房用电量、商家家庭状况和对贷款态度、调研时商家的货物库存状况。如果这些关键数据不能获取，基于有限数据的机器学习结果会给人误导。

数据科学家是一个特殊的职业，要成为一名卓越的数据科学家绝非易事。数据科学家一方面需要深入理解数据和算法技术，一方面又要深入理解行业和企业特性。

通过大量的实战经验，数据科学家可以积累数据判断力——什么是影响行业应用中的关键特征，描述这个问题的关键特征是否足够。

人工成本高

数据科学家和战略家最大的区别是，数据科学家找到适合机器解决的问题，而战略家找到适合人解决的问题。从商业的原则来思考，一个问题之所以需要交给机器去解决，主要是因为人工成本比机器执行成本高。

目前可以广泛应用的机器学习技术，其本质就是延续人的智慧，从而提升解决问题的效率。在单独一个问题上，机器是很难比人更加聪明的。如果解决一个问题所涉及的人工成本并不高，人其实并不那么需要机器学习技术。

机器学习技术的效率提升主要源于分布式架构。机器学习算法的最新进展，不仅源于海量数据的方便获取，也源于分布式系统的进步。基于分布式架构的机器学习算法技术，是人工智能大规模应用的基础。

当数以万台机器被链接在一起，机器学习的效率得到了质的提升。与李世石对弈的AlphaGo，背后是无数台具备学习能力且可以链接智慧的机器。

搜索是一个数据可以充分发挥价值的应用，因为没有运营人员可以满足每个用户的每个关键字搜索需求，因此搜索必须靠机器解决，尽管机器解决得不一定那么完美。个性化推荐也是数据可以发挥优势的应用，因为没有企业可以负担让客户经理去照顾每个客户个性化需求的人工成本。

同理，量化交易也是数据科学可以创造价值的领域之一，没有任何交易员可以24小时关注大量信息，而且这些信息可能包括许许多多曲线和大量资讯。当数据科学家设定好交易目标，并获取充足的样本和数据变量后，机器便可以极低的成本不停运转计算。

在医学领域，真正为大众带来创新价值的数据挖掘不一定是寻找灵丹妙药，而是以更高的频率关注人身体的健康与疾病信息。如果关键信息可以通过机器学习算法被提前发现，许多疾病便可以在更早期被干预治疗，甚至是完全避免。

许多人工智能技术是完美的科研项目，但由于它所解决的问题的人工成本并不高，所以并不适合被大规模商业化。许多在商业上被成功应用的机器学习技术，其本质都是通过提升企业运营效率来为企业创造利润或者其他竞争优势。

典型的成功案例有机器学习技术在Google成功提升搜索广告匹配到目标客户的效率，在PayPal成功提高了金融欺诈检测的效率。

存在合适的应用场景

如果一个问题有明确的目标，并且存在丰富的数据样本和特征，机器学习技术往往可以产出满意的效果。但是，这个问题是否可以被数据解决，不仅需要计算人工成本高低，同时需要存在一个适合数据解决的应用场景。

“合适的应用场景”是机器学习技术可以大规模应用的最后一个环节，但也是影响数据是否可以创造价值的关键因素。判断和寻找合适的数据应用场景，需要数据科学家深入理解数据所服务的行业应用与产品特性。

数据科学家往往需要深入理解行业，判断在不同行业中什么应用场景是最适合用数据解决的问题。例如，互联网行业的核心是流量，因此试图优化流量分配机制的排序算法在互联网行业中价值巨大；而金融行业的核心是风险管理，因此起到基础作用的金融模型一直围绕着风控。受行业特性影响，互联网排序算法尤其强调计算效率，但信用风险评估模型对计算效率要求并不高，反而对模型的可解释性和稳定性却有很高的要求。

数据科学家需要理解数据嵌入的产品最终为谁服务，数据是否提升产品服务的附加值。一个准确猜中用户需求的产品推荐算法是否可以被大规模应用，取决于产品推荐的结果出现在哪个场景。如果这个产品推荐的结果出现在购物车中，用户可能会发现惊喜；但如果这个推荐结果出现在搜索引擎旁边，用户可能完全无视推荐结果。

一个贷款审批模型可能可以精准预测客户的信用风险，但是如果信贷业务的客户经理主观上并不希望其审批权力被取代，则再准确的信用风控模型也不会发挥任何实际价值。

数据科学家不仅需要选择适合数据发挥价值的场景，也需要主动为机器学习技术设计场景。在这个场景中，机器学习技术与行业应用中的核心痛点和产品服务对象的兴趣是高度匹配的。只有在这种匹配下，数据和算法的价值才可以被最大化。

大数据和机器学习技术并不是万能的，它是否可以被成功应用取决于许多先决条件。数据科学家需要非常小心地关注这些条件，并且主动创造适合让数据与算法发挥价值的条件，从而释放大数据的价值。

只有当数据科学家充分理解需要解决的问题，选择合适的问题，并将问题转化为适合数据解决的问题时，海量数据与复杂算法才能被成功应用。

虽然数据原材料和机器学习算法技术在不同行业中拥有很强的普适性，但是数据科学解决方案确是定制化的。数据科学家的职责既不是向企业兜售软件系统，也不是帮助企业去收集数据材料。

数据科学家的职责是通过向企业提供数据科学解决方案，并通过“问题定义-数据收集-算法调优-知识发现-效果分析-线上部署-模型更新”的闭环体系让计算机系统大幅度提升企业的运营效率。这个完整的数据科学工作流，也就是我们所说的数据科学七剑。

今天先砍完“问题定义”这第一剑。以后依然是想到哪，砍到哪。

文章来源：杭州桃树科技有限公司（TaoData）

原文链接：http://www.taodatarobot.com/more-news.html?article_id=35

斤斤计较的婚姻到底有多难？白心之岂必有为
很多人私聊我会问到在哪个人群当中斤斤计较的人最多？我都会回答他，一般婚姻出现问题的斤斤计较的人士会非常多，以我多年经验，在婚姻落的一塌糊涂的人当中，斤斤计较的人数占比在20～30%以上，也就是说10个婚姻出现问题的斤斤计较的人有2-3个有多不减。在婚姻出问题当中，有大量的心理不平衡的、尖酸刻薄的怨妇。在婚姻中仅斤斤计较有两种类型：第一种是物质上的，另一种是精神上的。在物质与精神上抠门已经严重的影响
情绪觉察日记第37天露露_e800
今天是家庭关系规划师的第二阶最后一天，慧萍老师帮我做了个案，帮我处理了埋在心底好多年的一份恐惧，并给了我深深的力量！这几天出来学习，爸妈过来婆家帮我带小孩，妈妈出于爱帮我收拾东西，并跟我先生和婆婆产生矛盾，妈妈觉得他们没有照顾好我…。今晚回家见到妈妈，我很欣赏她并赞扬她，妈妈说今晚要跟我睡我说好，当我们俩躺在床上准备睡觉的时候，我握着妈妈的手对她说:妈妈这几天辛苦你了，你看你多利害把我们的家收拾得
芦花鞋一四许叶晗
又是在一个寒冷的夏日里，青铜和葵花决定今天一起去卖芦花鞋，奶奶亲手给他们做了一碗热乎乎的粥对他们说:“就靠你们两挣生活费了这碗粥赶紧趁热喝了吧！”于是青铜和葵花喝完了奶奶给她们做的粥，就准备去镇上卖卢花鞋，这回青铜和葵花穿着新的芦花鞋来到了镇上。青铜这回看到了很多人都在卖，用手势表达对葵花说:“这回有好多人在抢我们生意呢！我们必须得吆喝起来。”葵花点了点头。可是谁知他们也大声的叫，卖芦花喽！卖芦花
QQ群采集助手，精准引流必备神器 2401_87347160 其他经验分享
功能概述微信群查找与筛选工具是一款专为微信用户设计的辅助工具，它通过关键词搜索功能，帮助用户快速找到相关的微信群，并提供筛选是否需要验证的群组的功能。主要功能关键词搜索：用户可以输入关键词，工具将自动查找包含该关键词的微信群。筛选功能：工具提供筛选机制，用户可以选择是否只显示需要验证或不需要验证的群组。精准引流：通过上述功能，用户可以更精准地找到目标群组，进行有效的引流操作。3.设备需求该工具可以
关于沟通这件事，项目经理不需要每次都面对面进行流程大师兄
很多项目经理都会遇到这样的问题，项目中由于事情太多，根本没有足够的时间去召开会议，那在这种情况下如何去有效地管理项目中的利益相关者？当然，不建议电子邮件也不需要开会的话，建议可以采取下面几种方式来形成有效的沟通，这几种方式可以帮助你努力的通过各种办法来保持和各方面的联系。项目经理首先要问自己几个问题，项目中哪些利益相关者是必须要进行沟通的？可以列出项目中所有的利益相关者清单，同时也整理出项目中哪些
机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
铭刻于星（四十二）随风至
69夜晚，绍敏同学做完功课后，看了眼房外，没听到动静才敢从书包的夹层里拿出那个心形纸团。折痕压得很深，都有些旧了，想来是已经写好很久了。绍敏同学慢慢地、轻轻地捏开折叠处，待到全部拆开后，又反复抚平纸张，然后仔细地一字字默看。只是开头的三个字是第一次看到，让她心漏跳了几拍。“亲爱的绍敏：从四年级的时候，我就喜欢你了，但是我一直不敢说，怕影响你学习。六年级的时候听说有人跟你表白，你接受了，我很难过，但
底层逆袭到底有多难，不甘平凡的你准备好了吗？让吴起给你说说造命者说
底层逆袭到底有多难，不甘平凡的你准备好了吗？让吴起给你说说我叫吴起，生于公元前440年的战国初期，正是群雄并起、天下纷争不断的时候。后人说我是军事家、政治家、改革家，是兵家代表人物。评价我一生历仕鲁、魏、楚三国，通晓兵家、法家、儒家三家思想，在内政军事上都有极高的成就。周安王二十一年（公元前381年），因变法得罪守旧贵族，被人乱箭射死。我出生在卫国一个“家累万金”的富有家庭，从年轻时候起就不甘平凡
2020-01-25 晴岚85
郑海燕坚持分享590天2020.1.24在生活中只存在两个问题。一个问题是：你知道想要达成的目标是什么，但却不知道如何才能达成；另一个问题是：你不知道你的目标是什么。前一个是行动的问题，后一个是结果的问题。通过制定具体的下一步行动，可以解决不知道如何开始行动的问题。而通过去想象结果，对结果做预估，可以解决找不着目标的问题。对于所有吸引我们注意力，想要完成的任务，你可以先想象一下，预期的结果究竟是什
随笔 | 仙一般的灵气海思沧海
仙岛今天，我看了你全部，似乎已经进入你的世界我不知道，这是否是梦幻，还是你仙一般的灵气吸引了我也许每一个人都要有一份属于自己的追求，这样才能够符合人生的梦想，生活才能够充满着阳光与快乐我不知道，我为什么会这样的感叹，是在感叹自己的人生，还是感叹自己一直没有孜孜不倦的追求只感觉虚度了光阴，每天活在自己的梦中，活在一个不真实的世界是在逃避自己，还是在逃避周围的一切有时候我嘲笑自己，嘲笑自己如此的虚无，
想家爆米花机
也许不同于大家对家乡的思念，我对家乡甚至是疯狂的不舍。还未踏出车站就感觉到幸福，我享受这里的夕阳、这里的浓烈柴火味、这里每一口家常菜。我是宅女，我贪恋家的安逸。刚刚踏出大学校门，初出茅庐，无法适应每年只能国庆和春节回家。我焦虑、失眠、无端发脾气，是无法适应工作的节奏，是无法接受我将一步步离开家乡的事实。我不想承认自己胸无大志，选择再次踏上征程。图片发自App
【iOS】MVC设计模式 Magnetic_h ios mvc 设计模式 objective-c 学习 ui
MVC前言如何设计一个程序的结构，这是一门专门的学问，叫做"架构模式"（architecturalpattern），属于编程的方法论。MVC模式就是架构模式的一种。它是Apple官方推荐的App开发架构，也是一般开发者最先遇到、最经典的架构。MVC各层controller层Controller/ViewController/VC（控制器）负责协调Model和View，处理大部分逻辑它将数据从Mod
OC语言多界面传值五大方式 Magnetic_h ios ui 学习 objective-c 开发语言
前言在完成暑假仿写项目时，遇到了许多需要用到多界面传值的地方，这篇博客来总结一下比较常用的五种多界面传值的方式。属性传值属性传值一般用前一个界面向后一个界面传值，简单地说就是通过访问后一个视图控制器的属性来为它赋值，通过这个属性来做到从前一个界面向后一个界面传值。首先在后一个界面中定义属性@interfaceBViewController:UIViewController@propertyNSSt
一百九十四章. 自相矛盾巨木擎天
唉！就这么一夜，林子感觉就像过了很多天似的，先是回了阳间家里，遇到了那么多不可思议的事情儿。特别是小伙伴们，第二次与自己见面时，僵硬的表情和恐怖的气氛，让自己如坐针毡，打从心眼里难受！还有东子，他现在还好吗？有没有被人欺负？护城河里的小鱼小虾们，还都在吗？水不会真的干枯了吧？那对相亲相爱漂亮的太平鸟儿，还好吧！春天了，到了做窝、下蛋、喂养小鸟宝宝的时候了，希望它们都能够平安啊！虽然没有看见家人，也
UI学习——cell的复用和自定义cell Magnetic_h ui 学习
目录cell的复用手动（非注册）自动（注册）自定义cellcell的复用在iOS开发中，单元格复用是一种提高表格（UITableView）和集合视图（UICollectionView）滚动性能的技术。当一个UITableViewCell或UICollectionViewCell首次需要显示时，如果没有可复用的单元格，则视图会创建一个新的单元格。一旦这个单元格滚动出屏幕，它就不会被销毁。相反，它被添
element实现动态路由+面包屑软件技术NINI vue案例 vue.js 前端
el-breadcrumb是ElementUI组件库中的一个面包屑导航组件，它用于显示当前页面的路径，帮助用户快速理解和导航到应用的各个部分。在Vue.js项目中，如果你已经安装了ElementUI，就可以很方便地使用el-breadcrumb组件。以下是一个基本的使用示例：安装ElementUI（如果你还没有安装的话）:你可以通过npm或yarn来安装ElementUI。bash复制代码npmi
10月|愿你的青春不负梦想-读书笔记-01 Tracy的小书斋
本书的作者是俞敏洪，大家都很熟悉他了吧。俞敏洪老师是我行业的领头羊吧，也是我事业上的偶像。本日摘录他书中第一章中的金句：『一个人如果什么目标都没有，就会浑浑噩噩，感觉生命中缺少能量。能给我们能量的，是对未来的期待。第一件事，我始终为了进步而努力。与其追寻全世界的骏马，不如种植丰美的草原，到时骏马自然会来。第二件事，我始终有阶段性的目标。什么东西能给我能量？答案是对未来的期待。』读到这里的时候，我便
C语言宏函数南林yan C语言 c语言
一、什么是宏函数？通过宏定义的函数是宏函数。如下，编译器在预处理阶段会将Add(x,y)替换为((x)*(y))#defineAdd(x,y)((x)*(y))#defineAdd(x,y)((x)*(y))intmain(){inta=10;intb=20;intd=10;intc=Add(a+d,b)*2;cout<
地推话术，如何应对地推过程中家长的拒绝校师学
相信校长们在做地推的时候经常遇到这种情况：市场专员反馈家长不接单，咨询师反馈难以邀约这些家长上门，校区地推疲软，招生难。为什么？仅从地推层面分析，一方面因为家长受到的信息轰炸越来越多，对信息越来越“免疫”；而另一方面地推人员的专业能力和营销话术没有提高，无法应对家长的拒绝，对有意向的家长也不知如何跟进，眼睁睁看着家长走远；对于家长的疑问，更不知道如何有技巧地回答，机会白白流失。由于回答没技巧和专业
谢谢你们，爱你们！鹿游儿
昨天家人去泡温泉，二个孩子也带着去，出发前一晚，匆匆下班，赶回家和孩子一起收拾。饭后，我拿出笔和本子（上次去澳门时做手帐的本子）写下了1\2\3\4\5\6\7\8\9,让后让小壹去思考，带什么出发去旅游呢？她在对应的数字旁边画上了，泳衣、泳圈、肖恩、内衣内裤、tapuy、拖鞋……画完后，就让她自己对着这个本子，将要带的，一一带上，没想到这次带的书还是这本《便便工厂》(晚上姑婆发照片过来，妹妹累得
C语言如何定义宏函数？小九格物 c语言
在C语言中，宏函数是通过预处理器定义的，它在编译之前替换代码中的宏调用。宏函数可以模拟函数的行为，但它们不是真正的函数，因为它们在编译时不会进行类型检查，也不会分配存储空间。宏函数的定义通常使用#define指令，后面跟着宏的名称和参数列表，以及宏展开后的代码。宏函数的定义方式：1.基本宏函数：这是最简单的宏函数形式，它直接定义一个表达式。#defineSQUARE(x)((x)*(x))2.带参
微服务下功能权限与数据权限的设计与实现 nbsaas-boot 微服务 java 架构
在微服务架构下，系统的功能权限和数据权限控制显得尤为重要。随着系统规模的扩大和微服务数量的增加，如何保证不同用户和服务之间的访问权限准确、细粒度地控制，成为设计安全策略的关键。本文将讨论如何在微服务体系中设计和实现功能权限与数据权限控制。1.功能权限与数据权限的定义功能权限：指用户或系统角色对特定功能的访问权限。通常是某个用户角色能否执行某个操作，比如查看订单、创建订单、修改用户资料等。数据权限：
理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
小丽成长记（四十三）玲玲54321
小丽发现，即使她好不容易调整好自己的心态下一秒总会有不确定的伤脑筋的事出现，一个接一个的问题，人生就没有停下的时候，小问题不断出现。不过她今天看的书，她接受了人生就是不确定的，厉害的人就是不断创造确定性，在Ta的领域比别人多的确定性就能让自己脱颖而出，显示价值从而获得的比别人多的利益。正是这样的原因，因为从前修炼自己太少，使得她现在在人生道路上打怪起来困难重重，她似乎永远摆脱不了那种无力感，有种习
学点心理知识，呵护孩子健康静候花开_7090
昨天听了华中师范大学教育管理学系副教授张玲老师的《哪里才是学生心理健康的最后庇护所，超越教育与技术的思考》的讲座。今天又重新学习了一遍，收获匪浅。张玲博士也注意到了当今社会上的孩子由于心理问题导致的自残、自杀及伤害他人等恶性事件。她向我们普及了一个重要的命题，她说心理健康的一些基本命题，我们与我们通常的一些教育命题是不同的，她还举了几个例子，让我们明白我们原来以为的健康并非心理学上的健康。比如如果
2021年12月19日，春蕾教育集团团建活动感受——黄晓丹黄错错加油
感受:1.从陌生到熟悉的过程。游戏环节让我们在轻松的氛围中得到了锻炼，也增长了不少知识。2.游戏过程中，我们贡献的是个人力量，展现的是团队的力量。它磨合的往往不止是工作的熟悉，更是观念上契合度的贴近。3.这和工作是一样的道理。在各自的岗位上，每个人摆正自己的位置、各司其职充分发挥才能，并团结一致劲往一处使，才能实现最大的成功。新知:1.团队精神需要不断地创新。过去，人们把创新看作是冒风险，现在人们
Cell Insight | 单细胞测序技术又一新发现，可用于HIV-1和Mtb共感染个体诊断尐尐呅
结核病是艾滋病合并其他疾病中导致患者死亡的主要原因。其中结核病由结核分枝杆菌（Mycobacteriumtuberculosis,Mtb）感染引起，获得性免疫缺陷综合症（艾滋病）由人免疫缺陷病毒（Humanimmunodeficiencyvirustype1,HIV-1）感染引起。国家感染性疾病临床医学研究中心/深圳市第三人民医院张国良团队携手深圳华大生命科学研究院吴靓团队，共同研究得出单细胞测序
c++ 的iostream 和 c++的stdio的区别和联系黄卷青灯77 c++算法开发语言 iostream stdio
在C++中，iostream和C语言的stdio.h都是用于处理输入输出的库，但它们在设计、用法和功能上有许多不同。以下是两者的区别和联系：区别1.编程风格iostream（C++风格）：C++标准库中的输入输出流类库，支持面向对象的输入输出操作。典型用法是cin（输入）和cout（输出），使用>操作符来处理数据。更加类型安全，支持用户自定义类型的输入输出。#includeintmain(){in
瑶池防线谜影梦蝶
冥华虽然逃过了影梦的军队，但他是一个忠臣，他选择上报战况。败给影梦后成逃兵，高层亡尔还活着，七重天失守......随便一条，即可处死冥华。冥华自然是知道以仙界高层的习性此信一发自己必死无疑，但他还选择上报实情，因为责任。同样此信送到仙宫后，知道此事的人，大多数人都认定冥华要完了，所以上到仙界高层，下到扫大街的，包括冥华自己，全都准备好迎接冥华之死。如果仙界现在还属于两方之争的话，冥华必死无疑。然而
爬山后遗症璃绛
爬山，攀登，一步一步走向制高点，是一种挑战。成功抵达是一种无法言语的快乐，在山顶吹吹风，看看风景，这是从未有过的体验。然而，爬山一时爽，下山腿打颤，颠簸的路，一路向下走，腿部力量不够，走起来抖到不行，停不下来了！第二天必定腿疼，浑身酸痛，坐立难安！
java工厂模式 3213213333332132 java 抽象工厂
工厂模式有 1、工厂方法 2、抽象工厂方法。下面我的实现是抽象工厂方法, 给所有具体的产品类定一个通用的接口。 package 工厂模式; /** * 航天飞行接口 * * @Description * @author FuJianyong * 2015-7-14下午02:42:05 */ public interface SpaceF
nginx频率限制+python测试 ronin47 nginx 频率 python
部分内容参考：http://www.abc3210.com/2013/web_04/82.shtml 首先说一下遇到这个问题是因为网站被攻击，阿里云报警，想到要限制一下访问频率，而不是限制ip（限制ip的方案稍后给出）。nginx连接资源被吃空返回状态码是502，添加本方案限制后返回599，与正常状态码区别开。步骤如下：
java线程和线程池的使用 dyy_gusi ThreadPool thread Runnable timer
java线程和线程池一、创建多线程的方式 java多线程很常见，如何使用多线程，如何创建线程，java中有两种方式，第一种是让自己的类实现Runnable接口，第二种是让自己的类继承Thread类。其实Thread类自己也是实现了Runnable接口。具体使用实例如下： 1、通过实现Runnable接口方式 1 2
Linux 171815164 linux
ubuntu kernel http://kernel.ubuntu.com/~kernel-ppa/mainline/v4.1.2-unstable/ 安卓sdk代理 mirrors.neusoft.edu.cn 80 输入法和jdk sudo apt-get install fcitx su
Tomcat JDBC Connection Pool g21121 Connection
Tomcat7 抛弃了以往的DBCP 采用了新的Tomcat Jdbc Pool 作为数据库连接组件，事实上DBCP已经被Hibernate 所抛弃，因为他存在很多问题，诸如：更新缓慢，bug较多，编译问题，代码复杂等等。 Tomcat Jdbc P
敲代码的一点想法永夜-极光 java 随笔感想
入门学习java编程已经半年了,一路敲代码下来,现在也才1w+行代码量,也就菜鸟水准吧,但是在整个学习过程中,我一直在想,为什么很多培训老师,网上的文章都是要我们背一些代码?比如学习Arraylist的时候,教师就让我们先参考源代码写一遍,然
jvm指令集程序员是怎么炼成的 jvm 指令集
转自：http://blog.csdn.net/hudashi/article/details/7062675#comments 将值推送至栈顶时 const ldc push load指令 const系列该系列命令主要负责把简单的数值类型送到栈顶。(从常量池或者局部变量push到栈顶时均使用) 0x02 &nbs
Oracle字符集的查看查询和Oracle字符集的设置修改 aijuans oracle
本文主要讨论以下几个部分：如何查看查询oracle字符集、修改设置字符集以及常见的oracle utf8字符集和oracle exp 字符集问题。一、什么是Oracle字符集 Oracle字符集是一个字节数据的解释的符号集合,有大小之分,有相互的包容关系。ORACLE 支持国家语言的体系结构允许你使用本地化语言来存储，处理，检索数据。它使数据库工具，错误消息，排序次序，日期，时间，货
png在Ie6下透明度处理方法 antonyup_2006 css 浏览器 Firebug IE
由于之前到深圳现场支撑上线，当时为了解决个控件下载，我机器上的IE8老报个错，不得以把ie8卸载掉，换个Ie6,问题解决了，今天出差回来，用ie6登入另一个正在开发的系统，遇到了Png图片的问题，当然升级到ie8(ie8自带的开发人员工具调试前端页面JS之类的还是比较方便的，和FireBug一样，呵呵)，这个问题就解决了，但稍微做了下这个问题的处理。我们知道PNG是图像文件存储格式，查询资
表查询常用命令高级查询方法(二) 百合不是茶 oracle 分页查询分组查询联合查询
----------------------------------------------------分组查询 group by having --平均工资和最高工资 select avg(sal)平均工资,max(sal) from emp ; --每个部门的平均工资和最高工资
uploadify3.1版本参数使用详解 bijian1013 JavaScript uploadify3.1
使用：绑定的界面元素<input id='gallery'type='file'/>$("#gallery").uploadify({设置参数，参数如下}); 设置的属性： id: jQuery(this).attr('id'),//绑定的input的ID langFile: 'http://ww
精通Oracle10编程SQL(17)使用ORACLE系统包 bijian1013 oracle 数据库 plsql
/* *使用ORACLE系统包 */ --1.DBMS_OUTPUT --ENABLE:用于激活过程PUT,PUT_LINE,NEW_LINE,GET_LINE和GET_LINES的调用 --语法：DBMS_OUTPUT.enable(buffer_size in integer default 20000); --DISABLE:用于禁止对过程PUT,PUT_LINE,NEW
【JVM一】JVM垃圾回收日志 bit1129 垃圾回收
将JVM垃圾回收的日志记录下来，对于分析垃圾回收的运行状态，进而调整内存分配(年轻代，老年代，永久代的内存分配)等是很有意义的。JVM与垃圾回收日志相关的参数包括： -XX:+PrintGC -XX:+PrintGCDetails -XX:+PrintGCTimeStamps -XX:+PrintGCDateStamps -Xloggc -XX:+PrintGC 通
Toast使用白糖_ toast
Android中的Toast是一种简易的消息提示框，toast提示框不能被用户点击，toast会根据用户设置的显示时间后自动消失。创建Toast 两个方法创建Toast makeText(Context context, int resId, int duration) 参数：context是toast显示在
angular.identity boyitech AngularJS AngularJS API
angular.identiy 描述: 返回它第一参数的函数. 此函数多用于函数是编程. 使用方法: angular.identity(value); 参数详解: Param Type Details value * to be returned. 返回值: 传入的value 实例代码: <!DOCTYPE HTML>
java-两整数相除，求循环节 bylijinnan java
import java.util.ArrayList; import java.util.List; public class CircleDigitsInDivision { /** * 题目：求循环节，若整除则返回NULL，否则返回char*指向循环节。先写思路。函数原型：char*get_circle_digits(unsigned k,unsigned j)
Java 日期周年 Chen.H java C++c C#
/** * java日期操作(月末、周末等的日期操作) * * @author * */ public class DateUtil { /** */ /** * 取得某天相加(减)後的那一天 * * @param date * @param num *
[高考与专业]欢迎广大高中毕业生加入自动控制与计算机应用专业 comsci 计算机
不知道现在的高校还设置这个宽口径专业没有,自动控制与计算机应用专业,我就是这个专业毕业的,这个专业的课程非常多,既要学习自动控制方面的课程,也要学习计算机专业的课程,对数学也要求比较高.....如果有这个专业,欢迎大家报考...毕业出来之后,就业的途径非常广..... 以后
分层查询（Hierarchical Queries） daizj oracle 递归查询层次查询
Hierarchical Queries If a table contains hierarchical data, then you can select rows in a hierarchical order using the hierarchical query clause: hierarchical_query_clause::= start with condi
数据迁移 daysinsun 数据迁移
最近公司在重构一个医疗系统，原来的系统是两个.Net系统，现需要重构到java中。数据库分别为SQL Server和Mysql，现需要将数据库统一为Hana数据库，发现了几个问题，但最后通过努力都解决了。 1、原本通过Hana的数据迁移工具把数据是可以迁移过去的，在MySQl里面的字段为TEXT类型的到Hana里面就存储不了了，最后不得不更改为clob。 2、在数据插入的时候有些字段特别长
C语言学习二进制的表示示例 dcj3sjt126com c basic
进制的表示示例 # include <stdio.h> int main(void) { int i = 0x32C; printf("i = %d\n", i); /* printf的用法 %d表示以十进制输出 %x或%X表示以十六进制的输出 %o表示以八进制输出 */ return 0; }
NsTimer 和 UITableViewCell 之间的控制 dcj3sjt126com ios
情况是这样的: 一个UITableView, 每个Cell的内容是我自定义的 viewA viewA上面有很多的动画, 我需要添加NSTimer来做动画, 由于TableView的复用机制, 我添加的动画会不断开启, 没有停止, 动画会执行越来越多. 解决办法: 在配置cell的时候开始动画, 然后在cell结束显示的时候停止动画查找cell结束显示的代理
MySql中case when then 的使用 fanxiaolong casewhenthenend
select "主键", "项目编号", "项目名称","项目创建时间", "项目状态","部门名称","创建人" union (select pp.id as "主键", pp.project_number as &
Ehcache（01）——简介、基本操作 234390216 cache ehcache 简介 CacheManager crud
Ehcache简介目录 1 CacheManager 1.1 构造方法构建 1.2 静态方法构建 2 Cache 2.1&
最容易懂的javascript闭包学习入门 jackyrong JavaScript
http://www.ruanyifeng.com/blog/2009/08/learning_javascript_closures.html 闭包（closure）是Javascript语言的一个难点，也是它的特色，很多高级应用都要依靠闭包实现。下面就是我的学习笔记，对于Javascript初学者应该是很有用的。一、变量的作用域要理解闭包，首先必须理解Javascript特殊
提升网站转化率的四步优化方案 php教程分享数据结构 PHP 数据挖掘 Google 活动
网站开发完成后,我们在进行网站优化最关键的问题就是如何提高整体的转化率，这也是营销策略里最最重要的方面之一，并且也是网站综合运营实例的结果。文中分享了四大优化策略：调查、研究、优化、评估，这四大策略可以很好地帮助用户设计出高效的优化方案。 PHP开发的网站优化一个网站最关键和棘手的是，如何提高整体的转化率，这是任何营销策略里最重要的方面之一，而提升网站转化率是网站综合运营实力的结果。今天，我就分
web开发里什么是HTML5的WebSocket？ naruto1990 Web html5 浏览器 socket
当前火起来的HTML5语言里面，很多学者们都还没有完全了解这语言的效果情况，我最喜欢的Web开发技术就是正迅速变得流行的 WebSocket API。WebSocket 提供了一个受欢迎的技术，以替代我们过去几年一直在用的Ajax技术。这个新的API提供了一个方法，从客户端使用简单的语法有效地推动消息到服务器。让我们看一看6个HTML5教程介绍里的 WebSocket API：它可用于客户端、服
Socket初步编程——简单实现群聊 Everyday都不同 socket 网络编程初步认识
初次接触到socket网络编程，也参考了网络上众前辈的文章。尝试自己也写了一下，记录下过程吧：服务端：（接收客户端消息并把它们打印出来） public class SocketServer { private List<Socket> socketList = new ArrayList<Socket>(); public s
面试：Hashtable与HashMap的区别（结合线程） toknowme
昨天去了某钱公司面试，面试过程中被问道 Hashtable与HashMap的区别？当时就是回答了一点，Hashtable是线程安全的，HashMap是线程不安全的，说白了，就是Hashtable是的同步的，HashMap不是同步的，需要额外的处理一下。今天就动手写了一个例子，直接看代码吧 package com.learn.lesson001; import java
MVC设计模式的总结 xp9802 设计模式 mvc 框架 IOC
随着Web应用的商业逻辑包含逐渐复杂的公式分析计算、决策支持等，使客户机越来越不堪重负，因此将系统的商业分离出来。单独形成一部分，这样三层结构产生了。其中‘层’是逻辑上的划分。三层体系结构是将整个系统划分为如图2.1所示的结构[3] （1）表现层（Presentation layer）：包含表示代码、用户交互GUI、数据验证。该层用于向客户端用户提供GUI交互，它允许用户

如何成为一名卓越的数据科学家 ——七剑之一：问题定义

你可能感兴趣的:(如何成为一名卓越的数据科学家 ——七剑之一：问题定义)