nkwshuyi

文科生如何高效学数据科学？

看似无边无际、高深难懂而又时刻更新的数据科学知识，该怎样学才更高效呢？希望读过本文后，你能获得一些帮助。

（由于微信公众号外部链接的限制，文中的部分链接可能无法正确打开。如有需要，请点击文末的“阅读原文”按钮，访问可以正常显示外链的版本。）

疑惑

周五下午，我给自己的研究生开组会。主题是工作坊教学，尝试搭建自己的第一个深度神经网络。

参考资料是我的文章《如何用Python和深度神经网络发现即将流失的客户？》。我带着学生们从下载最新版Anaconda安装包开始，直到完成第一个神经网络分类器。

过程涉及编程虚拟环境问题，他们参考了《如何在Jupyter Notebook中使用Python虚拟环境？》一文，比较顺利地掌握了如何在虚拟环境里安装软件包和执行命令。

我要求他们，一旦遇到问题就立即提出。我帮助解决的时候，所有人围过来一起看解决方案，以提升效率。

我给学生们介绍了神经网络的层次结构，并且用Tensorboard可视化展示。他们对神经网络和传统的机器学习算法（师兄师姐答辩的时候，他们听过，有印象）的区别不是很了解，我就带着他们一起玩儿了一把深度学习实验场。

看着原本傻乎乎的直线绕成了曲线，然后从开放到闭合，把平面上的点根据内外区分，他们都很兴奋。还录了视频发到了微信朋友圈。

欣喜之余，一个学生不无担忧地问我：

老师，我现在能够把样例跑出来了，但是里面有很多内容现在还不懂。这么多东西该怎么学呢？

我觉得这是个非常好的问题。

对于非IT类本科毕业生，尤其是“文科生”（定义见这里），读研阶段若要用到数据科学方法，确实有很多知识和技能需要补充。他们中不少人因此很焦虑。

但是焦虑是没有用的，不会给你一丝一毫完善和进步。学会拆解和处理问题，才是你不断进步的保证。

这篇文章，我来跟你谈一谈，看似无边无际、高深难懂而又时刻更新的数据科学知识，该怎样学才更高效。

许多读者曾经给我留言，询问过类似的问题。因此我把给自己学生的一些建议分享给你，希望对你也有一些帮助。

目标

你觉得自己在数据科学的知识海洋里面迷失，是因为套用的学习模式不对。

从上小学开始，你就习惯了把要学习的内容当成学科知识树，然后系统地一步步学完。前面如果学不好，必然会影响后面内容的理解消化。

知识树的学习，也必须全覆盖。否则考试的时候，一旦考察你没有掌握的内容，就会扣分。

学习的进程，有教学大纲、教材和老师来负责一步步喂给你，并且督促你不断预习、学习和复习。

现在，你突然独自面对一个新的学科领域。没了教学大纲和老师的方向与进度指引，教材又如此繁多，根本不知道该看哪一本，茫然无措。

其实如果数据科学的知识是个凝固的、静态的集合，你又有无限长的学习时间，用原先的方法来学习，也挺好。

可现实是，你的时间是有限的，数据科学的知识却是日新月异。今年的热点，兴许到了明年就会退潮。深度学习专家Andrej Karpathy评论不同的机器学习框架时说：

Matlab is so 2012. Caffe is so 2013. Theano is so 2014. Torch is so 2015. TensorFlow is so 2016. :D

怎么办呢？

你需要以目标导向来学习。

例如说，你手头要写的论文里，需要做数据分类。那你就研究分类模型。

分类模型属于监督学习。传统机器学习里，KNN, 逻辑回归，决策树等都是经典的分类模型；如果你的数据量很大，希望用更为复杂而精准的模型，那么可以尝试深度神经网络。

如果你要需要对图片进行识别处理，便需要认真学习卷积神经网络（Convolutional Neural Network），以便高效处理二维图形数据。

如果你要做的研究，是给时间序列数据（例如金融资产价格变动）找到合适的模型。那么你就得认真了解递归神经网络（recurrent neural network），尤其是长短期记忆(Long short-term memory, LSTM)模型。这样用人工智能玩儿股市水晶球才能游刃有余。

但如果你目前还没有明确的研究题目，怎么办？

不要紧。可以在学习中，以案例为单位，不断积累能力。

实践领域需求旺盛，数据科学的内容又过于庞杂，近年来MOOC上数据科学类课程的发展，越来越有案例化趋势。

一向以技术培训类见长的平台，如Udacity, Udemy等自不必说。就连从高校生长出来的Coursera，也大量在习题中加入实际案例场景。Andrew Ng最新的Deep Neural Network课程就是很好的例证。

我之前推荐过的华盛顿大学机器学习课程，更是非常激进地在第一门课中，通过案例完整展示后面若干门课的主要内容。

注意，学第一门课时，学员们对于相关的技术（甚至是术语）还一无所知呢！

然而你把代码跑完，出现了结果的时候，真的会因为不了解和掌握细节就一无所获吗？

当然不是。

退一万步说，至少你见识了可以用这样的方法成功解决该场景的问题。这就叫认知。

告诉你一个小窍门：在生活、工作和学习中，你跟别人比拼的，基本上都是认知。

你获得了认知后，可以快速了解整个领域的概况。知道哪些知识对自己目前的需求更加重要，学习的优先级更高。

比案例学习更高效的“找目标”方式，是参加项目，动手实践。

动手实践，不断迭代的原理，在《如何高效学Python？》和《创新怎么教？》文中我都有详细分析，欢迎查阅。

这里我给你讲一个真实的例子。

我的一个三年级研究生，本科学的是工商管理。刚入学的时候按照我的要求，学习了密歇根大学的Python课程，并且拿到了系列证书。但是很长的一段时间里，他根本就不知道该怎么实际应用这些知识，论文自然也写不出来。

一个偶然的机会，我带着他参加了另一个老师的研究项目，负责技术环节，做文本挖掘。因为有了实际的应用背景和严格的时间限定，他学得很用心，干得非常起劲儿。之前学习的技能在此时真正被激活了。

等到项目圆满结束，他主动跑来找我，跟我探讨能否把这些技术方法应用于本学科的研究，写篇小论文出来。

于是我俩一起确定了题目，设计了实验。然后我把数据采集和分析环节交给了他，他也很完满地做出了结果。

有了这些经验，他意识到了自己毕业论文数据分析环节的缺失，于是又顺手改进了毕业论文的分析深度。

恰好是周五工作坊当天，我们收到了期刊的正式录用通知。

看得出来，他很激动，也很开心。

深度

确定目标后，你就明白了该学什么，不该学什么。

但是下一个问题就来了，该学的内容，要学到多深、多细呢？

在《贷还是不贷：如何用Python和机器学习帮你决策？》一文里，我们尝试了决策树模型。

所谓应用决策树模型，实际上就是调用了一个包。

from sklearn import tree
clf = tree.DecisionTreeClassifier()
clf = clf.fit(X_train_trans, y_train)

只用了三行语句，我们就完成了决策树的训练功能。

这里我们用的是默认参数。如果你需要了解可以进行哪些参数调整设置，在函数的括号里使用shift+tab按键组合，就能看到详细的参数列表，并且知道了默认的参数取值是多少。

如果你需要更详细的说明，可以直接查文档。在搜索引擎里搜索sklearn tree DecisionTreeClassifier这几个关键词，你会看到以下的结果。

点击其中的第一项，就可以看到最新版本scikit-learn相关功能的官方文档。

当你明白了每个函数工作的方法、参数可以调整的类型和取值范围时，你是否可以宣称自己了解这个功能了？

你好像不太有信心。

因为你觉得这只是“知其然”，而没有做到“知其所以然”。

但是，你真的需要进一步了解这个函数/功能是如何实现的吗？

注意图中函数定义部分，有一个指向source的链接。

[图片上传失败…(image-23c2da-1511666826794)]

点开它，你就会导航到这个函数的源代码，托管在github上。

如果你是个专业人士，希望研究、评估或者修改该函数，认真阅读源代码就不仅必要，而且必须。

但是作为文科生的你，如果仅是为了应用，那完全可以不必深入到这样的细节。将别人写好的，广受好评的软件包当成黑箱，正确地使用就好了。

这就如同你不需要了解电路原理，就可以看电视；不需要了解川菜的技艺和传承，就可以吃麻婆豆腐。只要你会用遥控器，会使筷子，就能享受这些好处。

越来越多的优秀软件包被创造出来，数据科学的门槛也因此变得越来越低。甚至低到被声讨的地步。例如这篇帖子，就大声疾呼“进入门槛太低正在毁掉深度学习的名声！”

但是，不要高兴得太早。觉得自己终于遇到一门可以投机取巧的学问了。

你的基础必须打牢。

数据科学应用的基础，主要是编程、数学和英语。

数学（包括基础的微积分和线性代数）和英语许多本科专业都会开设。文科生主要需要补充的，是编程知识。

只有明白基础的语法，你才能和计算机之间无障碍交流。

一门简单到令人发指的编程语言，可以节省你大量的学习时间，直接上手做应用。

程序员圈子里，流行一句话，叫做：

人生苦短，我用Python。

Python有多简单？我的课上，一个会计学本科生，为了拿下证书去学Python基础语法，一门课在24小时内，便搞定了。这还包括做习题、项目和系统判分时间。

怎么高效入门和掌握Python呢？欢迎读读《如何高效学Python？》，希望对你快速上手能有帮助。

协作

了解了该学什么，学多深入之后，我们来讲讲提升学习效率的终极秘密武器。

这个武器，就是协作的力量。

协作的好处，似乎本来就是人人都知道的。

但是，在实践中，太多的人根本就没有这样做。

因为，我们都过于长期地被训练“独立”完成问题了。

例如考试的时候跟别人交流，那叫作弊。

但是，你即便再习惯一个人完成某些“创举”，也不得不逐渐面对一个真实而残酷的世界——一个人的单打独斗很难带来大成就，你必须学会协作。

这就像《权力的游戏》里史塔克家族的名言：

When the cold winds blow the lone wolf dies and the pack survives. （凛冬将至，独狼死，群狼活。）

文科生面对屏幕编程，总会有一种孤独无助的感觉，似乎自己被这个世界抛弃了。

这种错误的心态会让你变得焦虑、恐慌，而且很容易放弃。

正确的概念却能够拯救你——你正在协作。而且你需要主动地、更好地协作。

你面前这台电脑或者移动终端，就是无数人的协作成果。

你用的操作系统，也是无数人的协作成果。

你用的编程语言，还是无数人的协作成果。

你调用的每一个软件包，依然是无数人的协作成果。

并非只有你所在的小团队沟通和共事，才叫做协作。协作其实早已发生在地球级别的尺度上。

当你从Github上下载使用了某个开源软件包的时候，你就与软件包的作者建立了协作关系。想想看，这些人可能受雇于大型IT企业，月薪6位数（美元），能跟他们协作不是很难得的机会吗？

当你在论坛上抛出技术问题、并且获得解答的时候，你就与其他的使用者建立了协作关系。这些人有可能是资深的IT技术专家，做咨询的收费是按照秒来算的。

这个社会，就是因为分工协作，才变得更加高效的。

数据科学也是一样。Google, 微软等巨头为什么开源自己的深度学习框架，给全世界免费使用？正是因为他们明白协作的终极含义，知道这种看似吃亏的傻事儿，带来的回报无法估量。

这种全世界范围内的协作，使得知识产生的速度加快，用户的需求被刻画得更清晰透彻，也使得技术应用的范围和深度空前提高。

如果你在这个协作系统里，就会跟系统一起日新月异地发展。如果你不幸自外于这个系统，就只能落寞地看着别人一飞冲天了。

这样的时代，你该怎么更好地跟别人协作呢？

首先，你要学会寻找协作的伙伴。这就需要你掌握搜索引擎、问答平台和社交媒体。不断更新自己的认知，找到更适合解决问题的工具，向更可能回答你问题的人来提问。经常到Github和Stackoverflow上逛一逛，收获可能大到令你吃惊。

其次，你要掌握清晰的逻辑和表达方式。不管是搜寻答案，还是提出问题，逻辑能力可以帮助你少走弯路，表达水平决定了你跟他人协作的有效性和深度。具体的阐释，请参考《Python编程遇问题，文科生怎么办？》。

第三，不要只做个接受帮助者。要尝试主动帮助别人解决问题，把自己的代码开源在Github上，写文章分享自己的知识和见解。这不仅可以帮你在社交资本账户中储蓄（当你需要帮助的时候，相当于在提现），也可以通过反馈增长自己的认知。群体的力量可以通过“赞同”、评论等方式矫正你的错误概念，推动你不断进步。

可以带来协作的链接，就在那里。

你不知道它们的存在，它们对你来说就是虚幻。

你了解它们、掌握它们、使用它们，它们给你带来的巨大益处，就是实打实的。

小结

我们谈了目标，可以帮助你分清楚哪些需要学，哪些不需要学。你现在知道了找到目标的有效方法——项目实践或者案例学习。

我们聊了深度，你了解到大部分的功能实现只需要了解黑箱接口就可以，不需要深入到内部的细节。然而对于基础知识和技能，务必夯实，才能走得更远。

我们强调了协作。充分使用别人优质的工作成果，主动分享自己的认知，跟更多优秀的人建立链接。摆脱单兵作战的窘境，把自己变成优质协作系统中的关键节点。

愿你在学习数据科学过程中，获得认知的增长，享受知识和技能更新带来的愉悦。放下焦虑感，体验心流的美好感受。

讨论

到今天为止，你掌握了哪些数据科学知识和技能？你为此花了多少时间？这个过程痛苦吗？有没有什么经验教训可以供大家借鉴？欢迎留言，把你的感悟分享给大家，我们一起交流讨论。

如果你对我的文章感兴趣，欢迎点赞，并且微信关注和置顶我的公众号“玉树芝兰”(nkwangshuyi)。

如果本文可能对你身边的亲友有帮助，也欢迎你把本文通过微博或朋友圈分享给他们。让他们一起参与到我们的讨论中来。

如果喜欢我的文章，请微信扫描下方二维码，关注并置顶我的公众号“玉树芝兰”。

如果你希望支持我继续输出更多的优质内容，欢迎微信识别下方的赞赏码，打赏本文。感谢支持！

欢迎微信扫码加入我的“知识星球”圈子。第一时间分享给你我的发现和思考，优先解答你的疑问。

关于沟通这件事，项目经理不需要每次都面对面进行流程大师兄
很多项目经理都会遇到这样的问题，项目中由于事情太多，根本没有足够的时间去召开会议，那在这种情况下如何去有效地管理项目中的利益相关者？当然，不建议电子邮件也不需要开会的话，建议可以采取下面几种方式来形成有效的沟通，这几种方式可以帮助你努力的通过各种办法来保持和各方面的联系。项目经理首先要问自己几个问题，项目中哪些利益相关者是必须要进行沟通的？可以列出项目中所有的利益相关者清单，同时也整理出项目中哪些
机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
2020-01-25 晴岚85
郑海燕坚持分享590天2020.1.24在生活中只存在两个问题。一个问题是：你知道想要达成的目标是什么，但却不知道如何才能达成；另一个问题是：你不知道你的目标是什么。前一个是行动的问题，后一个是结果的问题。通过制定具体的下一步行动，可以解决不知道如何开始行动的问题。而通过去想象结果，对结果做预估，可以解决找不着目标的问题。对于所有吸引我们注意力，想要完成的任务，你可以先想象一下，预期的结果究竟是什
【iOS】MVC设计模式 Magnetic_h ios mvc 设计模式 objective-c 学习 ui
MVC前言如何设计一个程序的结构，这是一门专门的学问，叫做"架构模式"（architecturalpattern），属于编程的方法论。MVC模式就是架构模式的一种。它是Apple官方推荐的App开发架构，也是一般开发者最先遇到、最经典的架构。MVC各层controller层Controller/ViewController/VC（控制器）负责协调Model和View，处理大部分逻辑它将数据从Mod
地推话术，如何应对地推过程中家长的拒绝校师学
相信校长们在做地推的时候经常遇到这种情况：市场专员反馈家长不接单，咨询师反馈难以邀约这些家长上门，校区地推疲软，招生难。为什么？仅从地推层面分析，一方面因为家长受到的信息轰炸越来越多，对信息越来越“免疫”；而另一方面地推人员的专业能力和营销话术没有提高，无法应对家长的拒绝，对有意向的家长也不知如何跟进，眼睁睁看着家长走远；对于家长的疑问，更不知道如何有技巧地回答，机会白白流失。由于回答没技巧和专业
C语言如何定义宏函数？小九格物 c语言
在C语言中，宏函数是通过预处理器定义的，它在编译之前替换代码中的宏调用。宏函数可以模拟函数的行为，但它们不是真正的函数，因为它们在编译时不会进行类型检查，也不会分配存储空间。宏函数的定义通常使用#define指令，后面跟着宏的名称和参数列表，以及宏展开后的代码。宏函数的定义方式：1.基本宏函数：这是最简单的宏函数形式，它直接定义一个表达式。#defineSQUARE(x)((x)*(x))2.带参
微服务下功能权限与数据权限的设计与实现 nbsaas-boot 微服务 java 架构
在微服务架构下，系统的功能权限和数据权限控制显得尤为重要。随着系统规模的扩大和微服务数量的增加，如何保证不同用户和服务之间的访问权限准确、细粒度地控制，成为设计安全策略的关键。本文将讨论如何在微服务体系中设计和实现功能权限与数据权限控制。1.功能权限与数据权限的定义功能权限：指用户或系统角色对特定功能的访问权限。通常是某个用户角色能否执行某个操作，比如查看订单、创建订单、修改用户资料等。数据权限：
理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
《投行人生》读书笔记小蘑菇的树洞
《投行人生》----作者詹姆斯-A-朗德摩根斯坦利副主席40年的职业洞见-很短小精悍的篇幅，比较适合初入职场的新人。第一部分成功的职业生涯需要规划1.情商归为适应能力分享与协作同理心适应能力，更多的是自我意识，你有能力识别自己的情并分辨这些情绪如何影响你的思想和行为。2.对于初入职场的人的建议，细节，截止日期和数据很重要截止日期，一种有效的方法是请老板为你所有的任务进行优先级排序。和老板喝咖啡的好
如何在 Fork 的 GitHub 项目中保留自己的修改并同步上游更新？github_fork_update iBaoxing github
如何在Fork的GitHub项目中保留自己的修改并同步上游更新？在GitHub上Fork了一个项目后，你可能会对项目进行一些修改，同时原作者也在不断更新。如果想要在保留自己修改的基础上，同步原作者的最新更新，很多人会不知所措。本文将详细讲解如何在不丢失自己改动的情况下，将上游仓库的更新合并到自己的仓库中。问题描述假设你在GitHub上Fork了一个项目，并基于该项目做了一些修改，随后你发现原作者对
店群合一模式下的社区团购新发展——结合链动 2+1 模式、AI 智能名片与 S2B2C 商城小程序源码说私域人工智能小程序
摘要：本文探讨了店群合一的社区团购平台在当今商业环境中的重要性和优势。通过分析店群合一模式如何将互联网社群与线下终端紧密结合，阐述了链动2+1模式、AI智能名片和S2B2C商城小程序源码在这一模式中的应用价值。这些创新元素的结合为社区团购带来了新的机遇，提升了用户信任感、拓展了营销渠道，并实现了线上线下的完美融合。一、引言随着互联网技术的不断发展，社区团购作为一种新兴的商业模式，在满足消费者日常需
html 中如何使用 uniapp 的部分方法某公司摸鱼前端 html uni-app 前端
示例代码：Documentconsole.log(window);效果展示：好了，现在就可以uni.使用相关的方法了
【一起学Rust | 设计模式】习惯语法——使用借用类型作为参数、格式化拼接字符串、构造函数广龙宇一起学Rust #Rust设计模式 rust 设计模式开发语言
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、使用借用类型作为参数二、格式化拼接字符串三、使用构造函数总结前言Rust不是传统的面向对象编程语言，它的所有特性，使其独一无二。因此，学习特定于Rust的设计模式是必要的。本系列文章为作者学习《Rust设计模式》的学习笔记以及自己的见解。因此，本系列文章的结构也与此书的结构相同（后续可能会调成结构），基本上分为三个部分
Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
腾讯云技术深度探索：构建高效云原生微服务架构我的运维人生云原生架构腾讯云运维开发技术共享
腾讯云技术深度探索：构建高效云原生微服务架构在当今快速发展的技术环境中，云原生技术已成为企业数字化转型的关键驱动力。腾讯云作为行业领先的云服务提供商，不断推出创新的产品和技术，助力企业构建高效、可扩展的云原生微服务架构。本文将深入探讨腾讯云在微服务领域的最新进展，并通过一个实际案例展示如何在腾讯云平台上构建云原生应用。腾讯云微服务架构概览腾讯云微服务架构基于云原生理念，旨在帮助企业快速实现应用的容
Pyecharts数据可视化大屏：打造沉浸式数据分析体验我的运维人生信息可视化数据分析数据挖掘运维开发技术共享
Pyecharts数据可视化大屏：打造沉浸式数据分析体验在当今这个数据驱动的时代，如何将海量数据以直观、生动的方式展现出来，成为了数据分析师和企业决策者关注的焦点。Pyecharts，作为一款基于Python的开源数据可视化库，凭借其丰富的图表类型、灵活的配置选项以及高度的定制化能力，成为了构建数据可视化大屏的理想选择。本文将深入探讨如何利用Pyecharts打造数据可视化大屏，并通过实际代码案例
从鸡肉高汤到记忆的魔法再到有效提示的艺术步子哥人工智能
还记得小时候那些天马行空的白日梦吗？也许只要按下键盘上的某个神奇组合，电脑就会发出滴滴的声响，一个隐藏的世界突然在你眼前展开，让你获得超凡的能力，摆脱平凡的生活。这听起来像是玩过太多电子游戏的幻想，但实际上，间隔重复系统给人的感觉惊人地相似。在最佳状态下，这些系统就像魔法一样神奇。本文将以一个看似平凡的鸡肉高汤食谱为例，深入浅出地探讨如何编写有效的间隔重复提示，让你像掌握烹饪技巧一样轻松地掌握记忆
18-115 一切思考不能有效转化为行动，都TM是扯淡！成长时间线
7月25号写了一篇关于为什么会断更如此严重的反思，然而，之后日更仅仅维持了一周，又出现了这次更严重的现象。从8月2号到昨天8月6号，5天！又是5天没有更文！虽然这次断更时间和上次一样，那为什么说这次更严重？因为上次之后就分析了问题的原因，以及应该如何解决，按理说应该会好转，然而，没过几天严重断更的现象再次出现，想想，经过反思，问题依然没有解决与改变，这让我有些担忧。到底是哪里出了问题，难道我就真的
我在意的 Yuexiaofeng
我所在意的，往往是你最容易忽略的，这让我感到为难。我所感动的，你却无动于衷，这使我感到惭愧。我所做的，你却视而不见，这让我不知如何是好。
四章-32-点要素的聚合彩云飘过
本文基于腾讯课堂老胡的课《跟我学Openlayers--基础实例详解》做的学习笔记，使用的openlayers5.3.xapi。源码见1032.html，对应的官网示例https://openlayers.org/en/latest/examples/cluster.htmlhttps://openlayers.org/en/latest/examples/earthquake-clusters.
如果做到轻松在股市赚钱？只要坚持这三个原则。履霜之人
大A股里向来就有七亏二平一赚的说法，能赚钱的都是少数人。否则股市就成了慈善机构，人人都有钱赚，谁还要上班？所以说亏钱是正常的，或者说是应该的。那么那些赚钱的人又是如何做到的呢？普通人能不能找到捷径去分一杯羹呢？方法是有的，但要做到需要你有极高的自律。第一，控制仓位，散户最大的问题是追涨杀跌，只要涨起来，就把钱往股票上砸，然后被套，隔天跌的受不了，又一刀切，全部割肉。来来回回间，遍体鳞伤。所以散户首
2020-04-12每天三百字之连接与替代冷眼看潮
不知道是不是好为人师，有时候还真想和别人分享一下我对某些现象的看法或者解释。人类社会不断发展进步的过程，就是不断连接与替代的过程。人类发现了火并应用火以后，告别了茹毛饮血的野兽般的原始生活（火烧、烹饪替代了生食）人类用石器代替了完全手工，工具的使用使人类进步一大步。类似这样的替代还有很多，随着科技的发展，有更多的原始的事物被替代，代之以更高效、更先进的技术。在近现代，汽车替代了马车，高速公路和铁路
【加密社】Solidity 中的事件机制及其应用加密社闲侃区块链智能合约区块链
加密社引言在Solidity合约开发过程中，事件（Events）是一种非常重要的机制。它们不仅能够让开发者记录智能合约的重要状态变更，还能够让外部系统（如前端应用）监听这些状态的变化。本文将详细介绍Solidity中的事件机制以及如何利用不同的手段来触发、监听和获取这些事件。事件存储的地方当我们在Solidity合约中使用emit关键字触发事件时，该事件会被记录在区块链的交易收据中。具体而言，事件
从0到500+，我是如何利用自媒体赚钱？一列脚印
运营公众号半个多月，从零基础的小白到现在慢慢懂了一些运营的知识。做好公众号是很不容易的，要做很多事情；排版、码字、引流…通通需要自己解决，业余时间全都花费在这上面涨这么多粉丝是真的不容易，对比知乎大佬来说，我们这种没资源，没人脉，还没钱的小透明来说，想要一个月涨粉上万，怕是今天没睡醒（不过你有的方法，算我piapia打脸）至少我是清醒的，自己慢慢努力，实现我的万粉目标！大家快来围观、支持我吧！孩子
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
使用Faiss进行高效相似度搜索 llzwxh888 faiss python
在现代AI应用中，快速和高效的相似度搜索是至关重要的。Faiss（FacebookAISimilaritySearch）是一个专门用于快速相似度搜索和聚类的库，特别适用于高维向量。本文将介绍如何使用Faiss来进行相似度搜索，并结合Python代码演示其基本用法。什么是Faiss？Faiss是一个由FacebookAIResearch团队开发的开源库，主要用于高维向量的相似性搜索和聚类。Faiss
使用LLaVa和Ollama实现多模态RAG示例 llzwxh888 python 人工智能开发语言
本文将详细介绍如何使用LLaVa和Ollama实现多模态RAG（检索增强生成），通过提取图像中的结构化数据、生成图像字幕等功能来展示这一技术的强大之处。安装环境首先，您需要安装以下依赖包：!pipinstallllama-index-multi-modal-llms-ollama!pipinstallllama-index-readers-file!pipinstallunstructured!p
使用Apify加载Twitter消息以进行微调的完整指南 nseejrukjhad twitter easyui 前端 python
#使用Apify加载Twitter消息以进行微调的完整指南##引言在自然语言处理领域，微调模型以适应特定任务是提升模型性能的常见方法。本文将介绍如何使用Apify从Twitter导出聊天信息，以便进一步进行微调。##主要内容###使用Apify导出推文首先，我们需要从Twitter导出推文。Apify可以帮助我们做到这一点。通过Apify的强大功能，我们可以批量抓取和导出数据，适用于各类应用场景。
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
利用LangChain的StackExchange组件实现智能问答系统 nseejrukjhad langchain microsoft 数据库 python
利用LangChain的StackExchange组件实现智能问答系统引言在当今的软件开发世界中，StackOverflow已经成为程序员解决问题的首选平台之一。而LangChain作为一个强大的AI应用开发框架，提供了StackExchange组件，使我们能够轻松地将StackOverflow的海量知识库集成到我们的应用中。本文将详细介绍如何使用LangChain的StackExchange组件
java线程Thread和Runnable区别和联系 zx_code java jvm thread 多线程 Runnable
我们都晓得java实现线程2种方式，一个是继承Thread，另一个是实现Runnable。模拟窗口买票，第一例子继承thread，代码如下 package thread; public class ThreadTest { public static void main(String[] args) { Thread1 t1 = new Thread1(
【转】JSON与XML的区别比较丁_新 json xml
1.定义介绍 (1).XML定义扩展标记语言 (Extensible Markup Language, XML) ，用于标记电子文件使其具有结构性的标记语言，可以用来标记数据、定义数据类型，是一种允许用户对自己的标记语言进行定义的源语言。 XML使用DTD(document type definition)文档类型定义来组织数据;格式统一，跨平台和语言，早已成为业界公认的标准。 XML是标
c++ 实现五种基础的排序算法 CrazyMizzz C++c 算法
#include<iostream> using namespace std; //辅助函数，交换两数之值 template<class T> void mySwap(T &x, T &y){ T temp = x; x = y; y = temp; } const int size = 10; //一、用直接插入排
我的软件麦田的设计者我的软件音乐类娱乐放松
这是我写的一款app软件，耗时三个月，是一个根据央视节目开门大吉改变的，提供音调，猜歌曲名。1、手机拥有者在android手机市场下载本APP，同意权限，安装到手机上。2、游客初次进入时会有引导页面提醒用户注册。（同时软件自动播放背景音乐）。3、用户登录到主页后，会有五个模块。a、点击不胫而走，用户得到开门大吉首页部分新闻，点击进入有新闻详情。b、
linux awk命令详解被触发 linux awk
awk是行处理器: 相比较屏幕处理的优点，在处理庞大文件时不会出现内存溢出或是处理缓慢的问题，通常用来格式化文本信息 awk处理过程: 依次对每一行进行处理，然后输出 awk命令形式: awk [-F|-f|-v] ‘BEGIN{} //{command1; command2} END{}’ file [-F|-f|-v]大参数，-F指定分隔符，-f调用脚本，-v定义变量 var=val
各种语言比较 _wy_ 编程语言
Java Ruby PHP 擅长领域
oracle 中数据类型为clob的编辑知了ing oracle clob
public void updateKpiStatus(String kpiStatus,String taskId){ Connection dbc=null; Statement stmt=null; PreparedStatement ps=null; try { dbc = new DBConn().getNewConnection(); //stmt = db
分布式服务框架 Zookeeper -- 管理分布式环境中的数据矮蛋蛋 zookeeper
原文地址： http://www.ibm.com/developerworks/cn/opensource/os-cn-zookeeper/ 安装和配置详解本文介绍的 Zookeeper 是以 3.2.2 这个稳定版本为基础，最新的版本可以通过官网 http://hadoop.apache.org/zookeeper/来获取，Zookeeper 的安装非常简单，下面将从单机模式和集群模式两
tomcat数据源 alafqq tomcat
数据库 JNDI(Java Naming and Directory Interface，Java命名和目录接口)是一组在Java应用中访问命名和目录服务的API。没有使用JNDI时我用要这样连接数据库： 03. Class.forName("com.mysql.jdbc.Driver"); 04. conn
遍历的方法百合不是茶遍历
遍历在java的泛
linux查看硬件信息的命令 bijian1013 linux
linux查看硬件信息的命令一.查看CPU： cat /proc/cpuinfo 二.查看内存： free 三.查看硬盘： df linux下查看硬件信息 1、lspci 列出所有PCI 设备； lspci - list all PCI devices:列出机器中的PCI设备（声卡、显卡、Modem、网卡、USB、主板集成设备也能
java常见的ClassNotFoundException bijian1013 java
1.java.lang.ClassNotFoundException: org.apache.commons.logging.LogFactory 添加包common-logging.jar2.java.lang.ClassNotFoundException: javax.transaction.Synchronization
【Gson五】日期对象的序列化和反序列化 bit1129 反序列化
对日期类型的数据进行序列化和反序列化时，需要考虑如下问题： 1. 序列化时，Date对象序列化的字符串日期格式如何 2. 反序列化时，把日期字符串序列化为Date对象，也需要考虑日期格式问题 3. Date A -> str -> Date B,A和B对象是否equals 默认序列化和反序列化 import com
【Spark八十六】Spark Streaming之DStream vs. InputDStream bit1129 Stream
1. DStream的类说明文档： /** * A Discretized Stream (DStream), the basic abstraction in Spark Streaming, is a continuous * sequence of RDDs (of the same type) representing a continuous st
通过nginx获取header信息 ronin47 nginx header
1. 提取整个的Cookies内容到一个变量，然后可以在需要时引用，比如记录到日志里面， if ( $http_cookie ~* "(.*)$") { set $all_cookie $1; } 变量$all_cookie就获得了cookie的值，可以用于运算了
java-65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 bylijinnan java
参考了网上的http://blog.csdn.net/peasking_dd/article/details/6342984 写了个java版的： public class Print_1_To_NDigit { /** * Q65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 * 1.使用字符串
Netty源码学习-ReplayingDecoder bylijinnan java netty
ReplayingDecoder是FrameDecoder的子类，不熟悉FrameDecoder的，可以先看看 http://bylijinnan.iteye.com/blog/1982618 API说，ReplayingDecoder简化了操作，比如： FrameDecoder在decode时，需要判断数据是否接收完全： public class IntegerH
js特殊字符过滤 cngolon js特殊字符 js特殊字符过滤
1.js中用正则表达式过滤特殊字符, 校验所有输入域是否含有特殊符号function stripscript(s) { var pattern = new RegExp("[`~!@#$^&*()=|{}':;',\\[\\].<>/?~！@#￥……&*（）——|{}【】‘；：”“'。，、？]"
hibernate使用sql查询 ctrain Hibernate
import java.util.Iterator; import java.util.List; import java.util.Map; import org.hibernate.Hibernate; import org.hibernate.SQLQuery; import org.hibernate.Session; import org.hibernate.Transa
linux shell脚本中切换用户执行命令方法 daizj linux shell 命令切换用户
经常在写shell脚本时，会碰到要以另外一个用户来执行相关命令，其方法简单记下： 1、执行单个命令：su - user -c "command" 如：下面命令是以test用户在/data目录下创建test123目录 [root@slave19 /data]# su - test -c "mkdir /data/test123"
好的代码里只要一个 return 语句 dcj3sjt126com return
别再这样写了：public boolean foo() { if (true) { return true; } else { return false;
Android动画效果学习 dcj3sjt126com android
1、透明动画效果方法一：代码实现 public View onCreateView(LayoutInflater inflater, ViewGroup container, Bundle savedInstanceState) { View rootView = inflater.inflate(R.layout.fragment_main, container, fals
linux复习笔记之bash shell (4)管道命令 eksliang linux管道命令汇总 linux管道命令 linux常用管道命令
转载请出自出处： http://eksliang.iteye.com/blog/2105461 bash命令执行的完毕以后，通常这个命令都会有返回结果，怎么对这个返回的结果做一些操作呢？那就得用管道命令‘|’。上面那段话，简单说了下管道命令的作用，那什么事管道命令呢？答：非常的经典的一句话，记住了，何为管
Android系统中自定义按键的短按、双击、长按事件 gqdy365 android
在项目中碰到这样的问题：由于系统中的按键在底层做了重新定义或者新增了按键，此时需要在APP层对按键事件（keyevent）做分解处理，模拟Android系统做法，把keyevent分解成： 1、单击事件：就是普通key的单击； 2、双击事件：500ms内同一按键单击两次； 3、长按事件：同一按键长按超过1000ms（系统中长按事件为500ms）； 4、组合按键：两个以上按键同时按住；
asp.net获取站点根目录下子目录的名称 hvt .net C#asp.net hovertree Web Forms
使用Visual Studio建立一个.aspx文件(Web Forms)，例如hovertree.aspx,在页面上加入一个ListBox代码如下： <asp:ListBox runat="server" ID="lbKeleyiFolder" /> 那么在页面上显示根目录子文件夹的代码如下： string[] m_sub
Eclipse程序员要掌握的常用快捷键 justjavac java eclipse 快捷键 ide
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。写道程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可
c++编程随记 lx.asymmetric C++笔记
为了字体更好看，改变了格式…… &&运算符： #include<iostream> using namespace std; int main(){ int a=-1,b=4,k; k=(++a<0)&&!(b--
linux标准IO缓冲机制研究音频数据 linux
一、什么是缓存I/O(Buffered I/O)缓存I/O又被称作标准I/O,大多数文件系统默认I/O操作都是缓存I/O。在Linux的缓存I/O机制中，操作系统会将I/O的数据缓存在文件系统的页缓存(page cache)中，也就是说，数据会先被拷贝到操作系统内核的缓冲区中，然后才会从操作系统内核的缓冲区拷贝到应用程序的地址空间。1.缓存I/O有以下优点:A.缓存I/O使用了操作系统内核缓冲区，
随想生活暗黑小菠萝生活
其实账户之前就申请了，但是决定要自己更新一些东西看也是最近。从毕业到现在已经一年了。没有进步是假的，但是有多大的进步可能只有我自己知道。毕业的时候班里12个女生，真正最后做到软件开发的只要两个包括我，PS：我不是说测试不好。当时因为考研完全放弃找工作，考研失败，我想这只是我的借口。那个时候才想到为什么大学的时候不能好好的学习技术，增强自己的实战能力，以至于后来找工作比较费劲。我
我认为POJO是一个错误的概念 windshome java POJO 编程 J2EE 设计
这篇内容其实没有经过太多的深思熟虑，只是个人一时的感觉。从个人风格上来讲，我倾向简单质朴的设计开发理念；从方法论上，我更加倾向自顶向下的设计；从做事情的目标上来看，我追求质量优先，更愿意使用较为保守和稳妥的理念和方法。 &

文科生如何高效学数据科学？

疑惑

目标

深度

协作

小结

讨论

你可能感兴趣的:(文科生如何高效学数据科学？)