wang--moumou

学习机器学习开始的一些别人的看法

AI科技大本营

人工智能技术和产业社区

RSS订阅

个人资料

AI科技大本营

关注

原创

444

粉丝

1398

喜欢

625

708

等级：

访问：

96万+

积分：

1万+

排名：

1085

勋章：

个人分类

AI163篇
人工智能167篇
机器人3篇
神经网络1篇
机器学习3篇
Python2篇
百度1篇
图像开放平台1篇
区块链1篇

展开

联系我们

请扫描二维码联系客服

[email protected]

400-660-0108

QQ客服客服论坛

关于招聘广告服务百度

京ICP证09002463号

经营性网站备案信息

网络110报警服务

中国互联网举报中心

北京互联网违法和不良信息举报中心

转

你走过最长的路，就是机器学习过程中的弯路

2018年01月08日 00:00:00

阅读数：2924

营长的一位转型AI的朋友，最近对营长抱怨，“走过的最远的路，就是机器学习过程中的弯路”，然后开始各种blablabla，从论文的坑，到模型的坑，再到培训的坑...一路吐槽。

尤其是论文，他骂道：“最讨厌的就是那种，高高在上、假装清高、站着说话不腰疼、戳不到痛点的论文。比如那一堆只能在理论中刷存在感，实际落地中只能‘呵呵哒’的论文，根本就是浪费时间。”

的确，对于现在刚刚入行的机器学习新人来说，不怕吃苦，但最怕走弯路，最怕白白浪费时间。

那么，总结起来，都有怎样的弯路呢？来看几位点赞量颇高的知乎答主的总结：

那些年，他们在机器学习中走过的弯路...

在知乎答主张馨宇（就职于百度地图）看来，机器学习的弯路有以下四个：

最大的弯路就是自己xjb学xjb试，和加入一个真正能做出东西的团队或跟随真正的牛人一起学习相比，速度要慢十倍都不止。学是要学，但不要以为自己xjb学就够了，差得远呢。

第二大的弯路就是成天xjb看论文，以为这样就能打通任督二脉，从来不复现论文或者尝试自己做出一些东西，这都是〇。

第三大弯路浅尝辄止，有些东西不往死里怼屁都做不出来。

第四大弯路迷信复杂的东西和新技术，以为新东西怼上去肯定就效果爆棚。其实都是不存在的。

个人主页：https://www.zhihu.com/people/diegozhang/activities

还有一位知乎答主ycszen，在他看来，最大弯路，就是迷信论文，不去实验。

DL\ML其实是一门实践性的学科，只有通过实验才能把握到其中的细节与真谛。虽说也是在写程序，但是DL的程序基本上无法直观地debug，所以非得自己去复现一下，实践一下，用performance来说话，才知道有没有出错。

尤其是DL，研究发展到现在，论文和实际做的东西脱节已经是心照不宣的事了。正因为NN+GD的鲁棒性，你xjb搞好像也能搞上去，所以写论文很多纯粹在编故事(好论文除外)

所以，我们最好不要一味相信论文所说，尤其是各种解释(经典算法，优秀论文除外)。NN就是个黑盒，谁也别说谁。而我们能做的，更重要的是，去实践去复现，去去伪存真，去发现其中真正的本质所在。

专栏地址：https://www.zhihu.com/people/yu-chang-qian/columns

而知乎答主：YukiRain（CV/ML方向研究生在读）则认为，非科班出身，刚转型AI的程序员最大的弯路是：没学好数学。

而对于数学基础好，科班出生的AI程序员来说，则应注意以下几个问题：

1.一开始没人带的时候，看论文喜欢看最新的，很大程度上忽视了很多比较老比较基础的论文，嫌弃以前的方法performance不好什么的......感觉我身边一些人也走进过这个误区......

2.永远不要迷信某个特定的模型，不要因为random forest在某个任务上效果好，就以后遇到什么任务都上random forest；也不要觉得深度学习就是万能的，什么都可以套神经网络解决；不要看到比赛里面大家整天用xgboost就整人云亦云地复制。学各种算法的时候，书上一般会告诉你这个算法有balabala优点一堆，但是一般不会告诉你这个算法也有balabala一堆缺点，我花了蛮长时间在这个坑里，慢慢摸索各种不同模型的特性。

3. 不要迷信一些理论性很强的论文，我一开始的时候，经常看到一大堆公式就下意识会觉得这个模型可能效果不错。事实上很多论文的理论推导和它的代码毫无关联（参见已经彻底回归炼丹的WGAN GP），还有很多论文的推导需要很强的assumption支持（参见每年都会出现在顶会的一些给模型加riemannian geometry的论文），等等。

个人主页：https://www.zhihu.com/people/yukio-2/activities

那么面对这些弯路，又应该如何解决呢？

机器学习新人应该注意的5个问题

知乎用户a88i99（微信公众号：yiqixue_ai）对此提供了非常接地气的论述。他曾是写后台的码农，此后又做了两三年数据挖掘工作，最近一年多正在学深度学习、强化学习。以下为他对于如何少走弯路这个话题的经验分享，也许能对你有帮助。（一起学AI专栏地址：https://zhuanlan.zhihu.com/yiqixue-ai）

首先，这个圈子里有价值的工作无非就三块

1. 发明牛逼的模型、算法、理论

2. 底层系统搭建，如各种框架

3. 学懂1中大神的部分发明，再会使用2中大神搭建的框架，来解决实际业务中的问题，产生商业价值。大部分人属于这里吧！！！

对于1与2，我读过理论物理博士，虽由于某种原因中途退学，也还是能说两句。那就是走正统的教育路线，能出国的出国，毕业后能去好公司的去好公司。但这里只强调一点：你跟的人是真正做事情的人，做的业务是真正有价值的业务，否则也是浪费青春。

我想大部分都是转行过来的吧，你看机器学习/深度学习的关注人数快100万了，科班出身能占10%，我觉得都高估了。下面只针对这群人来简单说下，莫怕，你们才是主流人群，就像三四线的用户是快手/头条的主流用户一样。

1. 不要求快，没有捷径。自己首先有个心理预期，数学好的入门也得一年半载的，数学需要补基础的估计要1-2年。可以去上培训班，交点钱，但也就跟机器学习混个脸熟。想入门还得花时间慢慢磨，真的没捷径，真的没捷径，真的没捷径！

2. 模型不求多，精通几个常见的，把机器学习的套路摸透就可以了。比如LR，朴素贝叶斯，决策树，基于SVD相关的简单模型，如推荐系统等。

把机器学习的套路摸透什么意思呢？比如LR为什么用logloss，而不是平方损失？为什么logloss 是凸函数，而平方的不是？优化算法啥时候用一阶mini-batch sgd，啥时候用二阶方法，为什么？这还只是说了损失函数与优化算法，还有模型结构，模型的效果评估指标，如何利用欠拟合/过拟合来分析指导优化模型等等。

因为简单的模型容易理解，有时数学上的证明也是可行的。这样，以它们为例子更容易理解机器学习这套东西，建立自己的直觉，自己的直觉，自己的直觉，几何的或物理的。

3. 选择规模中等的公开数据集，实战。一般有两个目的，首先是验证或纠正你前面学习的理解，其次是尝试解决实际问题。实际应用中的流程大概是：

a) 根据业务选择合适的线下与线上评估指标。

线下的指标可以辅助快速迭代，因为线上测试流程较长。线下指标缺点是过于片面。所以，一般利用线下指标来迭代，找到觉得不错的特征与模型，再搬到线上去测。

b) 快速构建基线模型与线上测试系统。

c) 调试系统，迭代想法

对工程师来讲，理解业务与线上系统真的很重要！因为你既没能力发明牛逼的算法模型，也没本事写框架，你若只会乱调包，那你的价值在哪里呢？所以，不深刻理解业务而是去瞎换模型算法，真得不合适，效果分分钟打脸。

4. 结伴而行，尽量不要放弃。只是觉得没有个讨论具体技术问题的社区，知乎说的东西太泛了，不系统。大家也不爱答具体的技术问题。

5. 这条专门送给码农转行过来的。

机器学习这套系统与传统技术系统有个非常大的差别。搭建个web/app系统难度不大，且做的好与坏，短期内不好区分与评价。垃圾系统在用户量不大的时候也能表现得不错。只有在用户量变得较大时，才会掉链子而遭打脸。机器学习的系统不是这样，它是分分钟打脸。也就是我们常说的，这个系统不确定性较大，驾驭它的门槛略高。

掌握了以上几个要点，那么新人应该如何系统地学习机器学习呢？

新人该如何系统地学习机器学习？

以下来自阿萨姆（普华永道，数据科学家）的回答，他从宏观的角度，按照职业规划、学习方法、实际应用三个方向，系统性地回答了“新人应如何学习机器学习”这个话题。

机器学习中有很多弯路，从宏观角度分享一些我的观察。回答分为三个部分：a) 职业规划。 b) 学习方法。c) 实际应用。

职业规划篇

1. 一个好的老板/老师远胜于自学。机器学习还没有达到批量化流水生产的阶段，因此一个好的“老师傅”比自学效果好很多。不仅如此，老师傅们一般都有自己多年经验总结出来的经验，往往可以避免很多不必要弯路。但选择老师傅应该注意是不是“挂羊头卖狗肉”，尤其要提防跨专业但号称多年的经验的人，有很高的概率是在蹭热点。这在选择导师以及选择工作分组时要尤其注意，毕竟已经是全民ML，all in AI的时代了...

2. 如果是转行来机器学习，不要和科班的人比拼编程能力和数学，要取巧利用自己已经了解的领域知识做结合。换句话说，转行做机器学习的最大的优势是你曾经所熟悉的领域，如果能与机器学习有所结合，你比科班出身的机器学习工程师更有市场。

参看：未来 3~5 年内，哪个方向的机器学习人才最紧缺？

https://www.zhihu.com/question/63883507/answer/227019715

和阿萨姆：转行人士如何在人工智能领域保持一定的竞争力？

https://www.zhihu.com/question/67036323/answer/248527279

3. 如果有机会读一个相关学位(统计、计算机、应用数学等)，去读。现阶段的就业市场还面临有价无市的局面，一方面企业开出高薪吸引机器学习人才，一方面符合条件的人太少。一般来说，名校相关学位硕士以上学历是大企业的基本要求，更高端的岗位还需要顶会和PhD。磨刀不误砍柴工，如果有可能，读一个硕士项目能很大程度的扫清路障，防止简历卡在人事手里。

参看阿萨姆：外行应届毕业生找数据分析工作多难？

https://www.zhihu.com/question/57618120/answer/155396514

4. 调整心理预期，放宽搜索域。国内的机器学习领域除了BAT这种大公司，厉害的中小型(创业)公司比如商汤科技以外，还有很多其他不错的公司。很多同学都抱着非牛逼公司不去，但没有考虑到僧多肉少的问题，这不成熟。计算机科学作为常年霸占毕业生人数排行榜的专业，有再多科技公司都很难容纳所有人，更何况现在是人人都想机器学习的时代。人生不是线性的，不是高考高分->名校->好工作->升职加薪->走上人生巅峰一定会发生。所以，你即使没有进入谷歌实习也不代表你这辈子就完蛋了。想开一些，眼界再放的远一些，人生没那么急。

5. 机器学习面试是有规律的，摸清楚面试内容有助于盲目准备。机器学习的面试和传统的软件工程师不同，不仅有基本的编程能力考查，还有对数学、模型、以及业务理解的考查。更多机器学习面试经验分享可以参考：面试官如何判断面试者的机器学习水平？

更多的讨论可以参考：

现在的大数据、AI 这么火，会不会像曾经的 Android 和 iOS 一样，五年后也回归平淡？https://www.zhihu.com/question/67120248/answer/281427231

和阿萨姆：工科生一年时间转行 cs 是否有可能？

https://www.zhihu.com/question/66421918/answer/245974321

和阿萨姆：机器学习门下，有哪些在工业界应用较多，前景较好的小方向？

https://www.zhihu.com/question/57072166/answer/280824223

学习篇

1. 不要把深度学习作为入门第一课，建议从经典机器学习开始入手。虽然很多人都是冲着深度学习来的，但把深度学习作为机器学习第一课不是个好主意。

原因如下：

深度学习的黑箱性更加明显，很容易学得囫囵吞枣
深度学习的理论/模型架构/技巧还在一直变化当中，并未尘埃落定
深度学习实验对硬件要求高，不太适合自学或者使用个人电脑进行学习

2. 不要过度收集材料，机器学习的资料有很大的时效性。机器学习的资料很多，动辄就有几个G的材料可以下载或者观看。而很多朋友都有“收集癖”，一下子购买十几本书的人我也常常能够看到。而机器学习的发展和变化速度很快。在入门期间，建议“小而精”的选择资料，选择近期出版的且口碑良好的书籍。这不仅可以节约重复学习的时间，也可以读有品位的材料。

3. 选择符合自己风格的材料，进行T字形阅读。举个简单的例子，很多人认为PRML比ESL好读，但如果个人对贝叶斯的理解有限，ESL更符合你的认知，翻阅起来也更得心应手。至于阅读方式，建议以一本书为主深入理解，同时备着多本参考书，遇到问题时横向搜索阅读。

4. 如果在读，优先进实验室，再去找实习，最后一条路是好好刷GPA。一般来说，大三的时候你应该已经有了基本的机器学习知识，尽管还比较浅。这个时候可以向老师/学长/学姐毛遂自荐进实验室，即使是无偿劳动和做基本的苦力活。进实验室有两个明显的好处：

a. 对某个小方向会有比较深入的了解。一般实验室做纯理论的不大需要本科生，做机器视觉或者自然语言处理(NLP)等小方向的比较需要本科生，所以这是很好的深入了解一个方向的机会。

b. 补充了研究经历也可以明白自己是否适合这个领域。如果运气好的话，你也有可能成为论文的作者之一，甚至可以去开会(公款旅游顺道见一下业内大佬)。这对于继续深造和去国外继续学习都很有帮助，有科研经历和论文是很大的筹码，对于找工作来说也绝对有利无害。

5. 学好英语，至少打下阅读和听力的基础。虽然人工智能领域中国现在已经做得很不错，但主流的书籍、期刊和会议，资料都是英文的。我们可以接受翻译版，但最好的方法还是自己有能力直接阅读。即使你将来不做机器学习，英文阅读能力还是会有很大的帮助。

6. 不要试图掌握所有的相关数学知识再开始学习。一般人如果想要把这些知识都补全再开始机器学习往往需要很长时间，容易半途而废。而且这些知识是工具不是目的，我们的目标又不是成为运筹学大师。建议在机器学习的过程中哪里不会补哪里，这样更有目的性且耗时更低。

参看阿萨姆：如何看待「机器学习不需要数学，很多算法封装好了，调个包就行」这种说法？

https://www.zhihu.com/question/60064269/answer/172305599

网络或者线下培训班是否值得上？我觉得需要一分为二的看待。机器学习培训班有一定的帮助，但最大的帮助应该是看是否有可能推荐靠谱的工作。一个尴尬的局面是，大师级的从业者有更好的选项，一般不会做那种三个月包分配的商业培训班。因此大量的机器学习讲师资质往往良莠不齐，而且存在经历造假的情况。如果选择上培训班，要有心理预期而且避免昂贵的天价培训班。当然，培训班有一定的价值，往往比自学的效果还是要好，但千万不要孤注一掷倾其所有的押宝，往往会输。

更多的讨论可以参考：如何用3个月零基础入门机器学习

https://zhuanlan.zhihu.com/p/29704017

和阿萨姆：深度学习的教学和课程，与传统 CS 的教学和课程有什么区别

https://www.zhihu.com/question/63883727/answer/225499427

应用篇

1. 即使选择做学术，也试着去工业界了解一下。在其他很多答案中我都提到过，其实工业界用的大部分技术并不酷炫，广义线性模型(generalized linear models)如逻辑回归还是占据了大壁江山。做一些实习和工业界活动有助于：

a). 打破幻想，了解工业界的主流模型。工业界用的大部分技术并不酷炫，你很少能看到深度强化学习那种AlphaGo一样酷炫的模型。

b). 补上学术界忽视的内容，比如可视化和数据清洗。工业界的最终目的是输出商业价值，而获得商业洞见的过程其实是非常痛苦的，比如第一步就是令人深恶痛绝的数据清洗。

c). 了解技术商业化中的取舍，培养大局观。做技术的人往往一头扎进技术里面，而忽视了从全局思考。更多的讨论可以参考：阿萨姆：现在机器学习工业界和学术界的差别越来越大了吗？尽早实习和踏实科研各有什么利弊？

2. 机器学习虽然是一门技术，但良好的大局观可以帮助你走的更远。很多人以为机器学习是一门专精岗位，但在中小型企业，公司希望机器学习工程师可以独挑大梁，完成从数据收集、清理、建模、调整、到部署上线，甚至维护和更新的一系列工作。因此在大部分中小型公司的机器学习工程师也做了全栈的工作，捎带着把网站做了的也不是没有...因此，不要抓着机器学习不放，适当了解不同的知识有时候也很有用。

可参考：阿萨姆：怎样才算是一个合格的机器学习工程师和阿萨姆：机器学习与移动端会碰出怎样的火花？

3. 在实际应用机器学习时，总结论文中或者书本里面不会提到的技巧，比如：a) 数据质量不高，数据质量不连续时，可以选择抛弃一部分数据。 b) 如果有必要，需要把回归问题转化为分类问题。 c. 特征工程不是每个模型都必须的，表示学习的方法一般要避免过度的特征工程等。d. 选择交叉验证的k值不是越大越好(「交叉验证」到底如何选择K值？)。更多实用小技巧可以参考我前一阵子的免费分享课。

4. 在机器学习的实际应用中，有很多“玄学”或者难以解释的部分，对机器学习理念的抽象理解有助于避免困惑。

可参考：带你了解机器学习(一): 机器学习中的“哲学”

https://zhuanlan.zhihu.com/p/27680090

和带你了解机器学习(二)：机器学习中的稳定性

https://zhuanlan.zhihu.com/p/27787096

5. 调参不是最终目的，而是迫不得已的手段。避免过度调参主要还是依赖经验选对方向，在小的区间正确的模型上调。如果选错了模型方向，那是无论如何都调不出好效果的。

可以参考：阿萨姆：机器学习如何才能避免「只是调参数」？

https://www.zhihu.com/question/264528062/answer/282229458

写在最后

机器学习的路不好走，而且往往都有鲜明的个人主义色彩，正是条条大路通罗马。人大的周孝正教授说过：“一个问题不能证实，也不能证伪，那就要存疑。” 而机器学习就是这样一门学科，我们必须抱着“批判”和“怀疑”的精神来学习，不管是看书、读论文、还是听老师傅的教诲都要有这样的精神。

机器学习的路上没有捷径，想要避免走弯路就要摒弃急于求成的想法，因为捷径往往才是最长的弯路。

营长注：你走过的机器学习最长的弯路是什么？欢迎在评论区分享你的心得~~

热文精选

AI领域真正最最最最最稀缺的人才是……会解牛的那个庖丁

2018年了，但愿你还有被剥削的价值！因为AI失业潮真的开始了...

2018 年了，该不该下定决心转型AI呢？

不用数学也能讲清贝叶斯理论的马尔可夫链蒙特卡洛方法？这篇文章做到了

盘点深度学习一年来在文本、语音和视觉等方向的进展，看强化学习如何无往而不利

先搞懂这八大基础概念，再谈机器学习入门！

这三个普通程序员，几个月就成功转型AI，他们的经验是...

干货 | AI 工程师必读，从实践的角度解析一名合格的AI工程师是怎样炼成的

AI校招程序员最高薪酬曝光！腾讯80万年薪领跑，还送北京户口

详解 | 如何用Python实现机器学习算法

龙城小将m 2018-03-11 14:58:10 #1楼

顶

2
目录
收藏
评论
微信
微博
QQ

你可能感兴趣的:(学习机器学习开始的一些别人的看法)

算法每日一练 (16) 张胤尘算法每日一练算法数据结构
欢迎来到张胤尘的技术站技术如江河，汇聚众志成。代码似星辰，照亮行征程。开源精神长，传承永不忘。携手共前行，未来更辉煌文章目录算法每日一练(16)使用最小花费爬楼梯题目描述解题思路解题代码`c/c++``golang``lua`官方站点：力扣Leetcode算法每日一练(16)使用最小花费爬楼梯题目地址：使用最小花费爬楼梯题目描述给你一个整数数组cost，其中cost[i]是从楼梯第i个台阶向上爬需
使用vite+react+ts+Ant Design开发后台管理项目（五）吕彬-前端 react.js javascript 前端
前言本文将引导开发者从零基础开始，运用vite、react、react-router、react-redux、AntDesign、less、tailwindcss、axios等前沿技术栈，构建一个高效、响应式的后台管理系统。通过详细的步骤和实践指导，文章旨在为开发者揭示如何利用这些技术工具，从项目构思到最终实现的全过程，提供清晰的开发思路和实用的技术应用技巧。项目gitee地址：lbking666
Tiny RDM：为什么说程序员都需要他，这款开源项目，太好用，轻量化的跨平台Redis桌面客户端，谁用谁知道！！小华同学ai 开源 redis 数据库
嗨，大家好，我是小华同学，关注我们获得“最新、最全、最优质”开源项目和高效工作学习方法TinyRDM是一款现代化、轻量级的跨平台Redis桌面客户端。它支持Mac、Windows和Linux系统，提供了丰富的功能特性，旨在为开发者提供便捷、高效的Redis操作体验。功能特性极度轻量TinyRDM基于Webview2构建，不内嵌浏览器，这使得它在保持轻量级的同时，也拥有出色的性能。感谢Wails框架
「差生文具多系列」推荐两个好看的 Redis 客户端古时的风筝杂说 redis 数据库缓存 Redis客户端
声明：大家好，我是风筝作者主页：【古时的风筝CSDN主页】。⚠️本文目的为个人学习记录及知识分享。如果有什么不正确、不严谨的地方请及时指正，不胜感激。直达博主：「古时的风筝」。（搜索或点击扫码）————————————————大家好，我是风筝软件推荐时间到，推荐两款我常用的Redis客户端，都是免费的，且支持Mac、Windows，如果你之前的Redis客户端用的不顺手，可以试试下面这两个。Re
C#进阶之路：揭秘反序列化漏洞与解决方案计算机学长开发工具 C#web安全网络 c#
一、引言在现代软件开发中，数据的持久化和传输是至关重要的环节。C#作为一种广泛使用的编程语言，其序列化与反序列化机制在这两个环节中扮演着不可或缺的角色。序列化，是将对象的状态信息转换为可以存储或传输的形式的过程，比如将对象转换为字节流、JSON字符串或者XML格式。而反序列化则是将这些序列化后的数据重新转换回原始对象的过程。在实际应用中，当我们需要将对象保存到文件系统、数据库，或者通过网络在不同的
Tiny RDM：轻量级跨平台Redis桌面管理工具廉峥旭
TinyRDM：轻量级跨平台Redis桌面管理工具tiny-rdmAModernRedisGUIClient项目地址:https://gitcode.com/gh_mirrors/ti/tiny-rdm项目基础介绍TinyRDM（TinyRedisDesktopManager）是一款现代化的轻量级Redis桌面管理工具，适用于Mac、Windows和Linux平台。该项目主要使用Go、Vue和Ja
数据库设计20条军规：血泪教训换来的实战指南潘多编程数据库
优秀的数据库设计不是炫技，而是用最低的成本规避最痛的坑。在经历过数百次深夜故障复盘后，我总结了这些真正经得起生产环境考验的铁律：一、基础生存法则第三范式是起点不是终点订单表里的收货地址必须拆成独立地址表？先看业务场景：日均10万订单的电商系统，拆分会带来3表关联查询，不拆可能存储冗余。实战解法：高频查询字段适当冗余，低频字段严格范式化。命名规范要强制执行user_order_2023比tbl_us
推荐一款新兴的开源项目：Nakama 施刚爽
推荐一款新兴的开源项目：Nakamanakama-unityUnityclientforNakamaserver.项目地址:https://gitcode.com/gh_mirrors/na/nakama-unity项目介绍在开放源代码的世界中，我们常常会发现一些令人眼前一亮的创新之作。今天，我们要向您推荐的就是这样一个项目——Nakama。它是一个高度可扩展的游戏服务器和社交平台，专为现代游戏开
Redis桌面工具:Tiny RDM 微刻时光微秒速递 redis 数据库缓存笔记
1.TinyRDM介绍TinyRDM（TinyRedisDesktopManager）是一个现代化、轻量级的Redis桌面客户端，支持Linux、Mac和Windows操作系统。它专为开发和运维人员设计，使得与Redis服务器的交互操作更加便捷愉快。TinyRDM提供了丰富的Redis数据操作功能，具备现代化的界面设计和良好的用户体验，使得Redis的管理和运维变得更加简单高效。2.核心功能极致轻
Qt学习之路学习笔记3 delphi863
1，文件对方框创建file对象，选择打开方式，打开后传递给QTextStream，读取，赋给QText显示，关闭文件。（QTextStream::readAll()直接读取文件所有内容，如果这个文件有100M，程序会立刻死掉）实际应用中，分段读入怎么处理？2、事件中的继承自QLabel的鼠标事件label->setMouseTracking(true);设置后才能允许就跟踪，否则需要点击一次，才跟
C# 技术使用笔记：Asp.Net Core MVC 中控制器 Controllers 中返回数据使用详解 caifox菜狐狸 C#技术使用笔记 c#笔记 asp.net core ViewResult JsonResult Redirect 控制器
本文将深入探讨ASP.NETCoreMVC控制器中返回数据的多种方式，从基础的ViewResult到灵活的IActionResult，再到强大的ActionResult，我们将逐一剖析它们的使用场景、优缺点以及最佳实践。通过丰富的代码示例和详细的解释，帮助读者全面掌握控制器返回数据的技巧，从而提升开发效率，构建更加健壮和高效的Web应用程序。无论你是初学者还是有一定经验的开发者，本文都将为你提供有
SpringCloud框架下的注册中心比较：Eureka与Consul的实战解析耶耶Norsea 网络杂烩 spring cloud
摘要在探讨SpringCloud框架中的两种注册中心之前，有必要回顾单体架构与分布式架构的特点。单体架构将所有业务功能集成在一个项目中，优点是架构简单、部署成本低，但耦合度高。分布式架构则根据业务功能对系统进行拆分，每个模块作为独立服务开发，降低了服务间的耦合，便于升级和扩展，然而其复杂性增加，运维、监控和部署难度也随之提高。关键词SpringCloud,注册中心,单体架构,分布式架构,服务拆分一
【赛题】2024年MathorCup数学应用挑战赛D题赛题发布睿森竞赛数学建模 MathorCup 数学应用挑战赛
2024年MathorCup数学应用挑战赛——正式开赛！！！D题量子计算在矿山设备配置及运营中的建模应用赛题已发布，后续无偿分享各题的解题思路、参考文献、完整论文+可运行代码，帮助大家最快时间，选择最适合是自己的赛题。祝大家都能取得一个好成绩，加油，加油，加油！！
在控制台中监控 Linux 性能的十种方法小郎碎碎念 Linux运维 linux 运维服务器
对下面的文章内容进行了总结，也是自己mark一下，以后用到可以直接来这里查看https://www.jeffgeerling.com/blog/2025/top-10-ways-monitor-linux-console10个linux系统重用来查看性能的工具（类top）top：用于监控Linux（或包括macOS在内的任何UNIX系统）的资源使用情况，能展示基本的系统指标，如CPU、内存、任务等
程序员晋升架构师实战指南甘苦人生职业规划职场和发展
以下是为程序员量身定制的晋升架构师实战指南，结合行业案例与可落地路径，助你完成技术跃迁：一、晋升路径拆解（从Code到Architecture）程序员→高级工程师核心任务：独立完成模块开发（需求分析+方案设计+编码实现）技术重点：掌握1-2门核心语言（如Java/Go）、熟悉主流框架（SpringCloud/Dubbo）案例：主导用户中心模块开发，通过缓存优化将接口响应时间从800ms降至150m
C++学习系列（11）：智能指针（unique_ptr、shared_ptr、weak_ptr） DoYangTan C++学习系列 c++学习 java
C++学习系列（11）：智能指针（unique_ptr、shared_ptr、weak_ptr）1.引言在C++传统的内存管理方式中，动态分配的对象需要手动释放，否则可能会导致内存泄漏（MemoryLeak）。为了解决这个问题，C++11引入了智能指针（SmartPointer），它能自动管理资源，避免内存泄漏。本篇博客将介绍：智能指针的概念三种智能指针：unique_ptr、shared_ptr
语音识别学习系列（13）：语音识别中的情感识别与表达 DoYangTan 语音识别学习人工智能
语音识别学习系列（13）：语音识别中的情感识别与表达前言在语音识别领域，仅仅将语音准确转换为文字内容已不能满足日益多样化的人机交互需求。人们在交流过程中往往蕴含着丰富的情感信息，语音识别若能对情感进行识别与表达，将会使交互变得更加自然、智能且贴合人性化需求。本期我们就围绕语音识别中的情感识别与表达这一重要主题展开深入探讨，了解其背后的原理、方法以及实际应用价值。一、语音情感识别的基本原理与常用方法
目标检测领域总结：从传统方法到 Transformer 时代的革新 DoYangTan 目标检测系列目标检测 transformer 人工智能
目标检测领域总结：从传统方法到Transformer时代的革新目标检测是计算机视觉领域的一个核心任务，它的目标是从输入图像中识别并定位出目标物体。随着深度学习的兴起，目标检测方法已经取得了显著的进展。从最早的传统方法到现如今基于Transformer的先进算法，目标检测的发展经历了多个重要的阶段。本文将详细总结目标检测领域的演进，涵盖传统方法、两阶段检测方法、单阶段检测方法和基于Transform
2024MathorCup数学建模之——MathorCup奖杯”获得者经验思路分享美赛数学建模数学建模
一、经验分享1.工具选择：顺手即可。Matlab和Python都是比较主流的选择，二者的应用场合各有不同。Python在数据分析、深度学习方面的优势愈发明显，而Matlab更适合进行物理仿真和数值计算。不过随着Python社区不断发展，其功能也愈发全面与强大，因此我们比较推荐学有余力的情况下可以更早接触Python。2.模型算法：多多益善。不一定要精通所有的算法，但是手上至少要准备一些常用的算法（
Linux 启动Jar脚本&&设置开机自启【超级详细】黑taoA linux jar python
Linux启动Jar脚本&&设置开机自启【超级详细】概要服务器开机自启服务重启脚本概要最近在Linux服务器中部署了一个项目（单机版），每次更新服务的时候需要用到好几个命令，停止服务，再重启，并且服务器突然重启后，还需要人工重启服务，非常繁琐，下面展示了两个脚本的写法。。服务器开机自启检查系统是否安装jdk；java-version查看jdk安装位置whereisjava编写脚本restart_y
【操作系统】双缓冲机制(含原理、优势、实现方式、应用场景) 司六米希嵌入式
双缓冲机制一、双缓冲机制的原理二、双缓冲的典型应用场景三、双缓冲的优势四、双缓冲的实现方式1.硬件级双缓冲2.软件级双缓冲3.性能提升对比五、双缓冲的挑战与解决方案六、总结双缓冲机制是一种通过使用两个缓冲区（BufferA和BufferB）来优化数据传输或处理效率的技术，其核心原理是并行处理与交替切换。以下是详细解析：一、双缓冲机制的原理基本概念：双缓冲区：系统维护两个相同大小的内存区域。分工协作
Spring Cloud Config 快速介绍与实例 oscar999 Spring Boot实战开发大全 Spring Boot Cloud Config
SpringCloudConfig是什么？SpringCloudConfig是一个用于分布式系统的配置管理工具，提供集中化的外部配置支持。它适用于微服务架构，能够将各个服务的配置集中存储在服务端（如Git仓库），客户端按需动态获取配置，解决了配置分散、环境切换复杂等问题。SpringCloudConfig核心概念ConfigServer：配置中心服务端，统一管理配置，支持Git、本地文件等存储方式
STM32 Cube MX 软件使用教程和技巧(纯干货分享~~！) 立量嵌入式IDE stm32 单片机嵌入式硬件
以下是关于STM32CubeMX的详细使用教程和一些实用技巧，帮助您快速上手并高效开发STM32项目：一、STM32CubeMX简介功能：ST官方推出的图形化配置工具，用于生成STM32微控制器的初始化代码（基于HAL库/LL库），支持引脚分配、时钟树配置、外设初始化等。优势：减少底层代码编写时间，避免手动配置寄存器，兼容多种IDE（Keil、IAR、STM32CubeIDE等）。二、基础使用教程
Linux——信号量（定义、示例、信号量接口、ipcs命令） Sweep- Linux c++c语言算法 linux 开发语言
目录1、信号量2、信号量举例3、信号量的接口4、通过控制进程来完成打印机操作5、ipcs命令1、信号量（1）定义:信号量是一个特殊的变量，一般取正数值。它的值代表允许访问的资源数目，获取资源时，需要对信号量的值进行原子减一，该操作被称为Р操作。当信号量值为О时，代表没有资源可用，Р操作会阻塞。释放资源时工需要对信号量的值进行原子加一，该操作被称为V操作。信号量主要用来同步进程。信号量的值如果只取0
蓝桥杯单片机刷题——串口发送显示 lzb759 一个月备赛蓝桥杯单片机蓝桥杯单片机
设计要求通过串口接收字符控制数码管的显示，PC端发送字符'A'，数码管显示'A'，发送其它非法字符时，数码管显示'E'。数码管显示格式如下：备注：单片机IRC振荡器频率设置为12MHz。串口通信波特率：9600bps。按键模式：BTN;扩展方式：IO模式除字符'A'外，其它字符均为非法字符。个人代码#includecodeunsignedcharSeg_Table[]={0x88,//A00x86
RabbitMQ基本原理码农小伙消息队列 rabbitmq 分布式
一、基本结构所有中间件技术都是基于TCP/IP协议基础之上进行构建新的协议规范，RabbitMQ遵循的是AMQP协议（AdvancedMessageQueuingProtocol-高级消息队列协议）。生产者发送消息流程：1、生产者和Broker建立TCP连接；2、生产者和Broker建立通道；3、生产者通过通道消息发送给Broker，由Exchange将消息进行转发；4、Exchange将消息转发
万字深度解析：DeepSeek-V3为何成为大模型时代的“速度之王“？羊不白丶大模型算法
引言在AI军备竞赛白热化的2024年，DeepSeek-V3以惊人的推理速度震撼业界：相比前代模型推理速度提升3倍，训练成本降低70%。这背后是十余项革命性技术的叠加创新，本文将为您揭开这艘"AI超跑"的性能密码。DeepSeek-V3的技术路径证明：计算效率的本质是知识组织的效率。其MoE架构中2048个专家的动态协作，恰似人脑神经网络的模块化运作——每个专家不再是被动执行计算的"劳工"，而是具
React性能优化的8种方式 Mr.BoBo. 前端 #React react.js 性能优化前端
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言1、Reac.memo缓存组件2、使用useMemo缓存大量的计算3、避免使用内联对象4、避免使用匿名函数5、延迟加载不是立即需要的组件6、调整CSS而不是强制组件加载和卸载7、使用React.Fragment避免添加额外的DOM8、使用React.PureComponent,shouldComponentUpdate9、
包管理工具她的双马尾 JS javascript 包管理工具 npm yarn pnpm
JavaScript包管理工具对比：npm、yarn和pnpm1.npm1.1历史与背景npm（NodePackageManager）是Node.js的默认包管理工具，首次发布于2010年。它是JavaScript生态系统中最早的包管理工具，主要用于管理和共享JavaScript模块。目前，npm拥有全球最大的JavaScript包注册中心（npmregistry），包含数百万个开源包。1.2核心
React状态管理她的双马尾 React react.js 前端 javascript
状态管理概念状态管理是指如何高效地管理和共享组件中的状态。React提供了useState和useReducer来管理本地状态，而对于全局状态，可以使用ContextAPI或第三方库（如Redux）。用法本地状态：使用useState或useReducer。全局状态：使用ContextAPI或Redux。使用场景本地状态：组件内部的状态，如表单输入、按钮点击。全局状态：需要跨组件共享的状态，如用户
统一思想认识永夜-极光思想
1.统一思想认识的基础,才能有的放矢原因: 总有一种描述事物的方式最贴近本质,最容易让人理解. 如何让教育更轻松,在于找到最适合学生的方式. 难点在于,如何模拟对方的思维基础选择合适的方式. &
Joda Time使用笔记 bylijinnan java joda time
Joda Time的介绍可以参考这篇文章： http://www.ibm.com/developerworks/cn/java/j-jodatime.html 工作中也常常用到Joda Time，为了避免每次使用都查API，记录一下常用的用法： /** * DateTime变化（增减） */ @Tes
FileUtils API eksliang FileUtils FileUtils API
转载请出自出处：http://eksliang.iteye.com/blog/2217374 一、概述这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。非常的好用。
各种新兴技术不懂事的小屁孩技术
1:gradle Gradle 是以 Groovy 语言为基础，面向Java应用为主。基于DSL（领域特定语言）语法的自动化构建工具。现在构建系统常用到maven工具，现在有更容易上手的gradle，搭建java环境: http://www.ibm.com/developerworks/cn/opensource/os-cn-gradle/ 搭建android环境： http://m
tomcat6的https双向认证酷的飞上天空 tomcat6
1.生成服务器端证书 keytool -genkey -keyalg RSA -dname "cn=localhost,ou=sango,o=none,l=china,st=beijing,c=cn" -alias server -keypass password -keystore server.jks -storepass password -validity 36
托管虚拟桌面市场势不可挡蓝儿唯美
用户还需要冗余的数据中心，dinCloud的高级副总裁兼首席营销官Ali Din指出。该公司转售一个MSP可以让用户登录并管理和提供服务的用于DaaS的云自动化控制台，提供服务或者MSP也可以自己来控制。在某些情况下，MSP会在dinCloud的云服务上进行服务分层，如监控和补丁管理。 MSP的利润空间将根据其参与的程度而有所不同，Din说。 “我们有一些合作伙伴负责将我们推荐给客户作为个
spring学习——xml文件的配置 a-john spring
在Spring的学习中，对于其xml文件的配置是必不可少的。在Spring的多种装配Bean的方式中，采用XML配置也是最常见的。以下是一个简单的XML配置文件： <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.or
HDU 4342 History repeat itself 模拟 aijuans 模拟
来源：http://acm.hdu.edu.cn/showproblem.php?pid=4342 题意：首先让求第几个非平方数，然后求从1到该数之间的每个sqrt(i)的下取整的和。思路：一个简单的模拟题目，但是由于数据范围大，需要用__int64。我们可以首先把平方数筛选出来，假如让求第n个非平方数的话，看n前面有多少个平方数，假设有x个，则第n个非平方数就是n+x。注意两种特殊情况，即
java中最常用jar包的用途 asia007 java
java中最常用jar包的用途 jar包用途axis.jarSOAP引擎包commons-discovery-0.2.jar用来发现、查找和实现可插入式接口，提供一些一般类实例化、单件的生命周期管理的常用方法.jaxrpc.jarAxis运行所需要的组件包saaj.jar创建到端点的点到点连接的方法、创建并处理SOAP消息和附件的方法，以及接收和处理SOAP错误的方法. w
ajax获取Struts框架中的json编码异常和Struts中的主控制器异常的解决办法百合不是茶 js json编码返回异常
一:ajax获取自定义Struts框架中的json编码出现以下问题: 1,强制flush输出 json编码打印在首页 2, 不强制flush js会解析json 打印出来的是错误的jsp页面却没有跳转到错误页面 3, ajax中的dataType的json 改为text 会
JUnit使用的设计模式 bijian1013 java 设计模式 JUnit
JUnit源代码涉及使用了大量设计模式 1、模板方法模式（Template Method）定义一个操作中的算法骨架，而将一些步骤延伸到子类中去，使得子类可以不改变一个算法的结构，即可重新定义该算法的某些特定步骤。这里需要复用的是算法的结构，也就是步骤，而步骤的实现可以在子类中完成。
Linux常用命令（摘录） sunjing crond chkconfig
chkconfig --list 查看linux所有服务 chkconfig --add servicename 添加linux服务 netstat -apn | grep 8080 查看端口占用 env 查看所有环境变量 echo $JAVA_HOME 查看JAVA_HOME环境变量安装编译器 yum install -y gcc
【Hadoop一】Hadoop伪集群环境搭建 bit1129 hadoop
结合网上多份文档，不断反复的修正hadoop启动和运行过程中出现的问题，终于把Hadoop2.5.2伪分布式安装起来，跑通了wordcount例子。Hadoop的安装复杂性的体现之一是，Hadoop的安装文档非常多，但是能一个文档走下来的少之又少，尤其是Hadoop不同版本的配置差异非常的大。Hadoop2.5.2于前两天发布，但是它的配置跟2.5.0，2.5.1没有分别。 &nb
Anychart图表系列五之事件监听白糖_ chart
创建图表事件监听非常简单：首先是通过addEventListener('监听类型',js监听方法)添加事件监听，然后在js监听方法中定义具体监听逻辑。以钻取操作为例，当用户点击图表某一个point的时候弹出point的name和value，代码如下： <script> //创建AnyChart var chart = new AnyChart(); //添加钻取操作&quo
Web前端相关段子 braveCS web前端
Web标准：结构、样式和行为分离使用语义化标签 0）标签的语义：使用有良好语义的标签，能够很好地实现自我解释，方便搜索引擎理解网页结构，抓取重要内容。去样式后也会根据浏览器的默认样式很好的组织网页内容，具有很好的可读性，从而实现对特殊终端的兼容。 1）div和span是没有语义的：只是分别用作块级元素和行内元素的区域分隔符。当页面内标签无法满足设计需求时，才会适当添加div
编程之美-24点游戏 bylijinnan 编程之美
import java.util.ArrayList; import java.util.Arrays; import java.util.HashSet; import java.util.List; import java.util.Random; import java.util.Set; public class PointGame { /**编程之美
主页面子页面传值总结 chengxuyuancsdn 总结
1、showModalDialog returnValue是javascript中html的window对象的属性,目的是返回窗口值,当用window.showModalDialog函数打开一个IE的模式窗口时,用于返回窗口的值主界面 var sonValue=window.showModalDialog("son.jsp"); 子界面 window.retu
[网络与经济]互联网+的含义 comsci 互联网+
互联网+后面是一个人的名字 = 网络控制系统互联网+你的名字 = 网络个人数据库每日提示:如果人觉得不舒服,千万不要外出到处走动,就呆在床上,玩玩手游,更不能够去开车,现在交通状况不
oracle 创建视图 with check option daizj 视图 view oralce
我们来看下面的例子： create or replace view testview as select empno,ename from emp where ename like ‘M%’ with check option; 这里我们创建了一个视图，并使用了with check option来限制了视图。然后我们来看一下视图包含的结果： select * from testv
ToastPlugin插件在cordova3.3下使用 dibov Cordova
自己开发的Todos应用，想实现“ 再按一次返回键退出程序 ”的功能，采用网上的ToastPlugins插件，发现代码或文章基本都是老版本，运行问题比较多。折腾了好久才弄好。下面吧基于cordova3.3下的ToastPlugins相关代码共享。 ToastPlugin.java package&nbs
C语言22个系统函数 dcj3sjt126com c function
C语言系统函数一、数学函数下列函数存放在math.h头文件中Double floor(double num) 求出不大于num的最大数。Double fmod(x, y) 求整数x/y的余数。Double frexp(num, exp); double num; int *exp; 将num分为数字部分（尾数）x和以2位的指数部分n，即num=x*2n，指数n存放在exp指向的变量中，返回x。D
开发一个类的流程 dcj3sjt126com 开发
本人近日根据自己的开发经验总结了一个类的开发流程。这个流程适用于单独开发的构件，并不适用于对一个项目中的系统对象开发。开发出的类可以存入私人类库，供以后复用。以下是开发流程： 1. 明确类的功能，抽象出类的大概结构 2. 初步设想类的接口 3. 类名设计（驼峰式命名） 4. 属性设置(权限设置) 判断某些变量是否有必要作为成员属
java 并发 shuizhaosi888 java 并发
能够写出高伸缩性的并发是一门艺术在JAVA SE5中新增了3个包 java.util.concurrent java.util.concurrent.atomic java.util.concurrent.locks 在java的内存模型中，类的实例字段、静态字段和构成数组的对象元素都会被多个线程所共享，局部变量与方法参数都是线程私有的，不会被共享。
Spring Security（11）——匿名认证 234390216 Spring Security ROLE_ANNOYMOUS 匿名
匿名认证目录 1.1 配置 1.2 AuthenticationTrustResolver 对于匿名访问的用户，Spring Security支持为其建立一个匿名的AnonymousAuthenticat
NODEJS项目实践0.2[ express,ajax通信...] 逐行分析JS源代码 Ajax nodejs express
一、前言通过上节学习，我们已经 ubuntu系统搭建了一个可以访问的nodejs系统，并做了nginx转发。本节原要做web端服务及 mongodb的存取，但写着写着，web端就
在Struts2 的Action中怎样获取表单提交上来的多个checkbox的值 lhbthanks java html struts checkbox
第一种方法：获取结果String类型在 Action 中获得的是一个 String 型数据，每一个被选中的 checkbox 的 value 被拼接在一起，每个值之间以逗号隔开(,)。所以在 Action 中定义一个跟 checkbox 的 name 同名的属性来接收这些被选中的 checkbox 的 value 即可。以下是实现的代码：前台 HTML 代码：
003.Kafka基本概念 nweiren hadoop kafka
Kafka基本概念：Topic、Partition、Message、Producer、Broker、Consumer。 Topic：消息源（Message）的分类。 Partition： Topic物理上的分组，一
Linux环境下安装JDK roadrunners jdk linux
1、准备工作创建JDK的安装目录： mkdir -p /usr/java/ 下载JDK，找到适合自己系统的JDK版本进行下载： http://www.oracle.com/technetwork/java/javase/downloads/index.html 把JDK安装包下载到/usr/java/目录，然后进行解压： tar -zxvf jre-7
Linux忘记root密码的解决思路 tomcat_oracle linux
1：使用同版本的linux启动系统，chroot到忘记密码的根分区passwd改密码　　2：grub启动菜单中加入init=/bin/bash进入系统，不过这时挂载的是只读分区。根据系统的分区情况进一步判断. 　　3: grub启动菜单中加入 single以单用户进入系统. 　　4:用以上方法mount到根分区把/etc/passwd中的root密码去除　　例如: 　　ro
跨浏览器 HTML5 postMessage 方法以及 message 事件模拟实现 xueyou jsonp jquery 框架 UI html5
postMessage 是 HTML5 新方法，它可以实现跨域窗口之间通讯。到目前为止，只有 IE8+, Firefox 3, Opera 9, Chrome 3和 Safari 4 支持，而本篇文章主要讲述 postMessage 方法与 message 事件跨浏览器实现。postMessage 方法 JSONP 技术不一样，前者是前端擅长跨域文档数据即时通讯，后者擅长针对跨域服务端数据通讯，p

学习机器学习开始的一些别人的看法

AI科技大本营

个人资料

最新文章

个人分类

归档

热门文章

最新评论

联系我们

请扫描二维码联系客服

你走过最长的路，就是机器学习过程中的弯路

职业规划篇

学习篇

应用篇

写在最后

你可能感兴趣的:(学习机器学习开始的一些别人的看法)

学习机器学习开始的一些别人的看法

AI科技大本营

个人资料

最新文章

个人分类

归档

热门文章

最新评论

联系我们

请扫描二维码联系客服

你走过最长的路，就是机器学习过程中的弯路

职业规划篇

学习篇

应用篇

写在最后

【知乎转载】机器学习、数据挖掘 如何进阶成为大神？

初学者必读的八个趣味机器学习项目 ‖ 教程+数据集

所以，你自认为是一个合格的机器学习工程师？

机器学习求职

一起开始机器学习吧——知乎live笔记

机器学习培训班这么多，你该如何选择？

浅谈机器学习步骤

机器学习的八个步骤

【机器学习】为什么机器学习难于应用

为什么现在机器学习如此火爆

推荐这六本关于机器学习的书籍，并说说它们的优缺点

机器学习基石笔记(3-6)——机器学习的类型及机器学习有效性证明

一个机器学习博士生的忠告

机器学习比较经典的书籍 PRML ESL MLAPP 资源

资源|5本深度学习和10本机器学习书籍（免费下载）

工程师也该学习机器学习了！

【机器学习】2018年机器学习技术改变制造业的十种方式

周志华《机器学习》版本空间

[kaggle实战] Digit Recognizer -- 从KNN,LR,SVM,RF到深度学习

值得收藏 | 关于机器学习，这可能是目前最全面最无痛的入门路径和资源！

你可能感兴趣的:(学习机器学习开始的一些别人的看法)

【知乎转载】机器学习、数据挖掘如何进阶成为大神？