政安晨

政安晨：政安晨：机器学习快速入门（三）{pandas与scikit-learn} {模型验证及欠拟合与过拟合}

这一篇中，咱们使用Pandas与Scikit-liarn工具进行一下模型验证，之后再顺势了解一些过拟合与欠拟合，这是您逐渐深入机器学习的开始！

$政安晨：政安晨：机器学习快速入门（三）{pandas与scikit-learn} {模型验证及欠拟合与过拟合}_第1张图片$

模型验证

评估您的模型性能，以便测试和比较其他选择。

在上一篇中，您已经建立了一个模型。但它有多好呢？

在本篇中，你将学会使用模型验证来衡量模型的质量。衡量模型质量是不断改进模型的关键。

什么是模型验证

还是得先讲一下概念：

模型验证（Model Validation）是机器学习中的一个重要步骤，用于评估和验证训练好的机器学习模型的性能和准确性。

在模型训练完成后，模型验证可以帮助我们确定模型是否具有良好的泛化能力，即应用于新数据时是否能够准确预测。模型验证通常在一个独立的测试数据集上进行，该数据集与训练数据集不重叠。模型验证的目的是检查模型的预测结果与实际观测值之间的差异，并使用适当的指标来量化模型的性能。

常用的模型验证方法包括：准确率（accuracy）、精确率（precision）、召回率（recall）、F1 值等。这些指标可以帮助评估模型在不同任务和数据集上的表现，并帮助我们选择最合适的模型。除了使用单一的测试数据集进行模型验证外，还可以使用交叉验证（cross-validation）等技术来更全面地评估模型的性能。交叉验证将数据集划分为多个子集，然后使用其中一部分数据进行验证，其他部分数据进行训练。通过重复这个过程，可以获得多个模型验证结果，并计算其平均值，从而更准确地评估模型的性能。总之，模型验证是机器学习中必不可少的一环，它可以帮助我们评估和选择最好的模型，并为实际应用提供可靠的预测能力。

你将想评估你构建的几乎每个模型。在大多数（尽管不是所有）应用中，模型质量的相关衡量标准是预测准确度。换句话说，模型的预测结果是否接近实际发生的情况。

很多人在衡量预测准确度时犯了一个巨大的错误。他们使用训练数据进行预测，并将这些预测与训练数据中的目标值进行比较。你将会在接下来看到这种方法的问题以及如何解决它，但我们先来思考一下如何做这个。

你首先需要将模型质量总结为一种可理解的方式。如果你比较了对于1万个房屋的预测值和实际值，你可能会发现好坏参半的预测。浏览1万个预测和实际值的列表是没有意义的。我们需要将其总结为一个单一的度量标准。

有很多用于总结模型质量的度量标准，但我们会从一个叫做均方绝对误差（Mean Absolute Error，也称为MAE）的度量标准开始。让我们逐个解释这个度量标准，从最后一个词开始，误差。

接着上一篇看，每个房屋的预测误差是：

error=actual−predicted

所以，如果一所房子的价格是15万元，而你预测它的价格是10万元，那么误差就是5万元。

"使用 MAE 指标时，我们取每个误差的绝对值。这将每个误差转换为正数。然后我们取这些绝对误差的平均值。这是我们衡量模型质量的标准。用简单的词来说，可以称之为:

平均而言，我们的预测误差大约为X。

要计算MAE，我们首先需要一个模型。该模型在下面一个隐藏的单元格中构建，您可以通过点击代码按钮来查看。

# Data Loading Code Hidden Here
import pandas as pd

# Load data
melbourne_file_path = './melb_data.csv'
melbourne_data = pd.read_csv(melbourne_file_path) 
# Filter rows with missing price values
filtered_melbourne_data = melbourne_data.dropna(axis=0)
# Choose target and features
y = filtered_melbourne_data.Price
melbourne_features = ['Rooms', 'Bathroom', 'Landsize', 'BuildingArea', 
                        'YearBuilt', 'Lattitude', 'Longtitude']
X = filtered_melbourne_data[melbourne_features]

from sklearn.tree import DecisionTreeRegressor
# Define model
melbourne_model = DecisionTreeRegressor()
# Fit model
melbourne_model.fit(X, y)

对这段代码陌生没关系，先大概浏览一下我的上两篇文章：

政安晨：机器学习快速入门（一）{基于Python与Pandas}https://blog.csdn.net/snowdenkeke/article/details/136046028政安晨：机器学习快速入门（二）{基于Python与Pandas} {建立您的第一个机器学习模型}https://blog.csdn.net/snowdenkeke/article/details/136047590接下来，咱们执行上述代码：

$政安晨：政安晨：机器学习快速入门（三）{pandas与scikit-learn} {模型验证及欠拟合与过拟合}_第2张图片$

一旦我们有了一个模型，下面就是我们如何计算平均绝对误差的方法：

from sklearn.metrics import mean_absolute_error

predicted_home_prices = melbourne_model.predict(X)
mean_absolute_error(y, predicted_home_prices)

$政安晨：政安晨：机器学习快速入门（三）{pandas与scikit-learn} {模型验证及欠拟合与过拟合}_第3张图片$

关于“样本内”得分的问题

刚刚计算的度量可以称为“样本内”分数。我们在构建模型和评估模型时使用了同一个房屋样本。以下是为什么这样做不好。

想象一下，在庞大的房地产市场中，门的颜色与房价无关。

然而，在你用来构建模型的数据样本中，所有有绿色门的房屋都非常昂贵。模型的任务是寻找预测房价的模式，所以它会发现这个模式，并且总是预测有绿色门的房屋价格很高。

由于这个模式是从训练数据中得出的，模型在训练数据中看起来是准确的。

但是如果这个模式在模型看到新数据时不成立，那么在实际使用中，模型将非常不准确。

由于模型的实际价值来自于对新数据的预测，我们需要在没有用于构建模型的数据上评估模型的性能。最直接的方法是将一些数据从模型构建过程中排除，然后使用这些数据测试模型在之前未见过的数据上的准确性。这些数据被称为验证数据。

咱们编个码（Coding）

scikit-learn库有一个train_test_split函数，用于将数据分成两部分。我们将使用其中一部分数据作为训练数据来拟合模型，而将另一部分数据作为验证数据来计算平均绝对误差。

以下是代码：

from sklearn.model_selection import train_test_split

# split data into training and validation data, for both features and target
# The split is based on a random number generator. Supplying a numeric value to
# the random_state argument guarantees we get the same split every time we
# run this script.
train_X, val_X, train_y, val_y = train_test_split(X, y, random_state = 0)
# Define model
melbourne_model = DecisionTreeRegressor()
# Fit model
melbourne_model.fit(train_X, train_y)

# get predicted prices on validation data
val_predictions = melbourne_model.predict(val_X)
print(mean_absolute_error(val_y, val_predictions))

$政安晨：政安晨：机器学习快速入门（三）{pandas与scikit-learn} {模型验证及欠拟合与过拟合}_第4张图片$

哇！看到了吧！

你在样本内的平均绝对误差约为500元。样本外的误差超过250,000元。

这是几乎完全正确的模型与对于大多数实际目的而言不可用的模型之间的区别。作为一个参考点，验证数据中的平均房屋价值为110万元。因此，新数据中的误差约为平均房屋价值的四分之一。

这样看来，这个模型的问题很多，但是有许多方法可以改进这个模型，例如尝试寻找更好的特征或不同的模型类型。

欠拟合与过拟合

优化你的模型以获得更好的性能。

在这一步骤结束时，您将理解欠拟合和过拟合的概念，并能够应用这些思想来使您的模型更准确。

尝试使用不同的模型进行实验

现在你已经有了一种可靠的测量模型准确性的方法，你可以尝试使用其他模型，并看看哪个模型能给出最好的预测结果。但是你有哪些模型选择呢？

你可以在scikit-learn的文档中看到，决策树模型有很多选项（比你很长一段时间内想要或需要的要多）。最重要的选项决定了树的深度。回想一下，在本课程的第一课中我们提到，树的深度是一个衡量在做出预测之前它进行了多少次拆分的标志。这是一棵相对较浅的树。

$政安晨：政安晨：机器学习快速入门（三）{pandas与scikit-learn} {模型验证及欠拟合与过拟合}_第5张图片$

在实践中，一棵树在顶层（所有房屋）和叶子节点之间拥有10次分割并不罕见。随着树的深入，数据集被切分成含有较少房屋的叶子节点。如果一棵树只有1次分割，它将数据分成两组。如果每个组再次分割，我们将得到4组房屋。再次对每组进行分割，将创建8组。如果我们通过在每个层级添加更多的分割来使组数翻倍，到达第10层时，我们将有210组房屋。这意味着有1024个叶子节点。

当我们将房屋分配给很多叶子节点时，每个叶子节点中的房屋数量也较少。房屋数量较少的叶子节点会对这些房屋的实际价值做出非常接近的预测，但对于新数据的预测可能非常不可靠（因为每个预测仅基于少数房屋）。

这是一种称为过拟合的现象，即模型几乎完美地匹配训练数据，但在验证和其他新数据上表现不佳。另一方面，如果我们将决策树变得非常浅，它将无法将房屋划分为非常明显的群组。

在极端情况下，如果一棵树将房屋分为仅有2个或4个组，每个组仍然有各种各样的房屋。由此得出的预测可能对大多数房屋来说偏离较远，即使在训练数据中也如此（出于同样的原因，在验证中也会表现糟糕）。当模型未能捕捉到数据中的重要差异和模式，以至于即使在训练数据中表现不佳，这就被称为欠拟合。

由于我们关心新数据的准确性，我们根据验证数据来估计，我们希望找到欠拟合和过拟合之间的最佳点。从视觉上看，我们希望在下面图中的（红色）验证曲线的低点。

$政安晨：政安晨：机器学习快速入门（三）{pandas与scikit-learn} {模型验证及欠拟合与过拟合}_第6张图片$

举个例子

有一些控制树深度的替代方法，其中许多方法允许树中的某些路径比其他路径更深。但是，max_leaf_nodes参数提供了一种非常合理的方法来控制过拟合和欠拟合。我们允许模型生成更多的叶节点，就会从上图中的欠拟合区域移动到过拟合区域。

我们可以使用效用函数来帮助比较不同max_leaf_nodes值的MAE分数。

from sklearn.metrics import mean_absolute_error
from sklearn.tree import DecisionTreeRegressor

def get_mae(max_leaf_nodes, train_X, val_X, train_y, val_y):
    model = DecisionTreeRegressor(max_leaf_nodes=max_leaf_nodes, random_state=0)
    model.fit(train_X, train_y)
    preds_val = model.predict(val_X)
    mae = mean_absolute_error(val_y, preds_val)
    return(mae)

数据已经使用你已经看过并写过的代码加载到train_X、val_X、train_y和val_y中。

接下来，咱们重新实现刚刚模型验证章节实现过的代码，只是稍稍改了点点，大家自己观察：

# Data Loading Code Runs At This Point
import pandas as pd
    
# Load data
melbourne_file_path = './melb_data.csv'
melbourne_data = pd.read_csv(melbourne_file_path) 
# Filter rows with missing values
filtered_melbourne_data = melbourne_data.dropna(axis=0)
# Choose target and features
y = filtered_melbourne_data.Price
melbourne_features = ['Rooms', 'Bathroom', 'Landsize', 'BuildingArea', 
                        'YearBuilt', 'Lattitude', 'Longtitude']
X = filtered_melbourne_data[melbourne_features]

from sklearn.model_selection import train_test_split

# split data into training and validation data, for both features and target
train_X, val_X, train_y, val_y = train_test_split(X, y,random_state = 0)

我们可以使用for循环来比较使用不同max_leaf_nodes值构建的模型的准确率。

# compare MAE with differing values of max_leaf_nodes
for max_leaf_nodes in [5, 50, 500, 5000]:
    my_mae = get_mae(max_leaf_nodes, train_X, val_X, train_y, val_y)
    print("Max leaf nodes: %d  \t\t Mean Absolute Error:  %d" %(max_leaf_nodes, my_mae))

执行如下：

$政安晨：政安晨：机器学习快速入门（三）{pandas与scikit-learn} {模型验证及欠拟合与过拟合}_第7张图片$

从列出的选项中，500是最佳叶子数量。

结论

这里的要点是，模型可能会遭受以下两种情况：

过拟合：捕捉到未来不会再次出现的虚假模式，导致预测结果不准确;

欠拟合：未能捕捉到相关模式，同样导致预测结果不准确。

我们使用验证数据来衡量候选模型的准确性，而这些验证数据不用于模型训练。这样可以让我们尝试多个候选模型，并选择出最好的一个。

告一段落

现在您已经理解了模型验证，以及欠拟合与过拟合，跟着做一下。

瞧瞧，机器学习中这么复杂的概念您都学会了。

RabbitMQ---面试题 huapiaoy java-rabbitmq rabbitmq java
常见面试题1.MQ的作用及应用场景类似问题：项目什么情况下用到了MQ，为什么要用MQMQ的主要应用场景，消息队列的应用场景，为什么说消息队列可以削峰首先MQ是一种用来接收和转发消息的队列，常见的应用常见如下：1）异步解耦：在业务中，一些操作需要消耗大量时间，但是并不需要我们立刻返回结果，我们就可以使用MQ来把操作异步化2）流量削峰：在访问量突增的情况下，我们应用仍然要保证持续处理请求，但是突然把大
c语言网 1127 尼科彻斯定理 Xzh0423 算法 c++数据结构
原题题目描述验证尼科彻斯定理，即：任何一个整数m的立方都可以写成m个连续奇数之和。输入格式任一正整数输出格式该数的立方分解为一串连续奇数的和样例输入13样例输出13*13*13=2197=157+159+161+163+165+167+169+171+173+175+177+179+181#includeusingnamespacestd;intmain(){intm;cin>>m;intm_c
23.501中英对照（45）：5G Qos特征 51学通信 5G 23.501
前言本文是对5G最基础也是最重要的规范TS23.501的中英对照翻译。但不是全文翻译，有以下重要说明：不是全文翻译，一些国内不可能用到的特性不翻。原文有些章节没有内容，或者意义不大，直接跳过。所以是从第4章开始翻译。一句英文原文，一句中文。方便对照。采用最新的2024年12月发布的R18.8版本。任何问题，欢迎微信交流。作者微信：gprshome201101，微信名：爱卫生5.7.35GQoSch
Java代码-八种数组排序方法忧郁小王子x 算法 java
一.冒泡排序1.1概述对于一组，多次将数组中的数两两比较，较大或者较小的数向后排（经过一轮比较后，最大/最小的数就会到结尾），循环直至有序排列。1.2代码实现importjava.lang.reflect.Array;importjava.util.Arrays;importjava.util.Scanner;publicclassmaopao{publicstaticvoidmain(Strin
【产品经理修炼之道】-商业的本质：需求、价值与交易 xiaoli8748_软件开发产品经理
商业的本质是什么？本文将从需求、价值和交易三个核心要素出发，深入探讨商业活动的底层逻辑，供大家参考。商业分析的对象是商业，想得道商业分析，就要懂商业本身。这样平平无奇的一段话，却包含了巨大的威力。不同行业，其商业理解不一致，同时底层又是相通的。Costco联合创始人辛尼格对零售业的总结——“它不是一门复杂的生意，需要的只是以更低的成本销售高质量的商品，即好产品低价格。”而Line创始人森川亮的总结
【Java】Java Lambda List转List 奔向理想的星辰大海云原生技术研发开发语言 java
JavaLambdaList转List的实现方法引言在Java开发中，Lambda表达式是一种非常强大和常用的特性，它允许我们以一种更加简洁和灵活的方式编写代码。在处理集合类数据时，我们经常需要对列表进行转换操作，将其转换为另一种类型的列表。本文将介绍如何使用JavaLambda表达式将一个List转换为另一个List。实现步骤为了更好地理解整个过程，我们可以使用表格来展示每个步骤的具体操作。下面
咱们一起学C++第二十七篇：之C++程序结构与“Hello, World!”深度剖析一杯年华@编程空间咱们一起学习C++visual studio vim emacs docker vscode
咱们一起学C++第二十七篇：之C++程序结构与“Hello,World!”深度剖析在C++学习的征程中，我们共同探索，不断深入理解这门语言的奥秘。此前，我们学习了编写第一个C++程序所需的基础知识，包括iostream类的使用和命名空间的初步概念。今天，我们将进一步剖析C++程序的基本结构，详细解读经典的“Hello,World!”程序，深入理解其背后的原理和C++语言的特性，这对于我们掌握C++
平台经济事前治理的国际经验和中国路径罗伯特之技术屋人工智能与智能系统专栏大数据人工智能
摘要：平台经济事前治理已成为全球关注焦点，中国探索平台经济事前治理具有深刻的政策、现实和理论需求。以欧盟和美国为代表的全球平台经济治理，在平台的市场势力、平台势力、数字守门人等理论发展驱动下，经历了放松监管、平台反垄断和事前监管的治理导向演化。当前，欧盟和美国正探索平台作为服务者和竞争者的事前监管，在监管对象、监管规则和处罚方式等维度开展创新，在治理立场、监管框架、分类施策、关注焦点等关键方面形成
AI绘画能取代设计师吗？网络安全我来了 IT技术 AI作画
AI绘画能取代设计师吗？在日益数字化的时代，人工智能（AI）正在快速渗透我们的生活和工作中。特别是在设计领域，AI绘画这一新兴技术引发了热烈讨论。你是否也曾好奇，AI绘画是否有可能取代设计师的工作？让我们一同探讨这个引人深思的话题。1.AI绘画的现状1.1AI绘画技术的形成与发展AI绘画的背后，离不开图像风格迁移、图文预训练模型和扩散模型这三大技术的共同推动。有点像是一位多才多艺的音乐家，利用不同
AI会对你的行业产生什么影响网络安全我来了 IT技术人工智能
AI对行业的影响：全面解析与展望在当今这个瞬息万变的时代，人工智能（AI）正如同一个强大的引擎，驱动着各个行业的迅猛发展。这不仅仅是一种技术的崛起，更是全球经济和社会结构的深刻变革。今天，让我们深入解析AI，尤其是生成式AI，如何影响我们的工作与生活，以及我们可以期待的未来。生成式AI的迅猛崛起生成式AI的定义与特点生成式AI，简单来说，就是机器学习的一个分支，通过学习大量数据，生成新的内容。这就
谈谈你所了解的AR技术吧！网络安全我来了 IT技术 ar
深入探讨AR技术的原理与应用在科技飞速发展的今天，AR（增强现实）技术已经悄然改变了我们与周围世界互动的方式。你是否曾想象过如何能够通过手机屏幕与虚拟物体进行实时互动？在这篇文章中，我们将深入探讨AR技术的原理、核心技术及其多元应用领域，让你对这一前沿科技有更深的理解。1.什么是AR技术1.1定义与概念增强现实（AR）技术是一种将虚拟信息与现实环境相结合的技术。简单来说，AR就像是在你的现实世界中
用vue写一个内网请求chatgpt的网页可以返回图片请求【内含一个key】 steamedbread321 vue.js chatgpt javascript
最近不是chatgpt很活吗？可是必须要科技上网才可以进入，所以我就参考其他人写的页面改写了一个网页版不需要chatgpt请求的网页，还可以请求图片哦。部署以后就可以直接使用废话不多说了直接上代码海洋生物详情{{x.msg}}{{x.msg}}{{sentext}}{{sentexttp}}const{createApp}=VuecreateApp({data(){return{api:'',ms
从零开始学RSA：已知n,e,d求p,q和私钥文件修复网络安全我来了 Crypto python 网络安全算法
(8)已知n,e,d求p,q一看这个标题你就应该有个觉悟，n一定无法直接分解得到p和q。题目:10-存货5题目给出了两个文件，一个是加密脚本chall.py，一个是加密后输出的内容output.txt。分析一下加密脚本：fromgmpy2importinvertfrommd5importmd5fromsecretimportp,qe=65537n=p*qphi=(p-1)*(q-1)d=inver
stm32hal库can使用记录田彼南山 stm32 嵌入式硬件单片机
一、单片机最小系统板使用can资料：https://blog.csdn.net/yoie01/article/details/136921034https://blog.csdn.net/qq_36561846/article/details/117431769这里面有一个问题，最小系统板没有can收发器，所以没法直接用，只能测试一下回环模式二、stm32f103vet6测试达妙电机我用的是正点原
9. 马科维茨资产组合模型+FF5+GARCH风险模型优化方案（理论+Python实战） AI量金术师金融资产组合模型进化论 python 开发语言金融人工智能机器学习算法
目录0.承前1.核心风险函数代码讲解1.1数据准备和初始化1.2单资产GARCH建模1.3模型拟合和波动率预测1.4异常处理机制1.5相关系数矩阵计算1.6构建波动率矩阵1.7计算协方差矩阵1.8确保矩阵对称性1.9确保矩阵半正定性1.10格式转换和返回1.11calculate_covariance_matrix函数汇总2.代码汇总3.反思3.1不足之处3.2提升思路4.启后0.承前本篇博文是对
Open WebUI应用实践孙将帼
open-webui/open-webui:User-friendlyWebUIforLLMs(FormerlyOllamaWebUI)(github.com)Tutorial|OpenWebUIOpenWebUITip:OpenWebUI、Ollama、Helm、ChromaDB、RAG、Pipelines、sentence-transformers库、1、OpenWebUI是一个可扩展的、自托
【高效学习方法分享】费曼学习法 AI天才研究院每月推书学习
费曼学习法费曼学习法是美国著名物理学家理查德·费曼总结出来的一种学习方法。费曼学习法的核心是：“用转述、教给别人的方法巩固自己的知识”。具体步骤包括四个步骤：确定学习目标：将一个自己不理解的、没见过的概念或难题写在纸上。像老师一样教给别人：模拟自己是一位老师,面对完全不懂这个领域的人,用自己的话,尽可能具体形象地讲诉。回顾：找到漏洞，重新学习反思第2步遇到的问题，哪些地方卡壳了?哪些地方对方没有真
【PDF合并】利用 Python 合并 PDF 文件 Encarta1993 tools pdf
依赖安装pipinstallPyPDF2在Python中，可以使用PyPDF2模块来合并多个PDF文件。fromPyPDF2importPdfFileMerger#创建一个PdfFileMerger对象merger=PdfFileMerger()#添加要合并的PDF文件pdf_files=['file1.pdf','file2.pdf','file3.pdf']forpdf_fileinpdf_f
从脑科学角度分析高效学习方法 ka__ka__ 经历思考学习方法
从脑科学角度分析高效学习方法先说说为什么要从脑科学角度分析高效学习方法。很多时候，关于高效学习方法，人们往往都是参考成功人士或者大神学霸的经验分享。但是，这种非常个人化并且主观性很强的东西一般没有很强的广泛使用性。那么如何找到更加科学的更加客观的高效学习方法呢？针对这个问题，应该从事物本质出发，按照第一性原理来思考。从第一性原理分析，学习知识的本质在某种程度上就是让大脑对特定的知识产出对应的神经网
python保存和调用模型 sphinxrascal168 大幅度
2.创建文件目录，保存模型importosfromsklearn.externalsimportjoblib#创建文件目录dirs='testModel'ifnotos.path.exists(dirs):os.makedirs(dirs)#保存模型joblib.dump(LR,dirs+'/LR.pkl')3.读取模型#读取模型LR=joblib.load(dirs+'/LR.pkl')test
面向切面之集中式登录架构设计 roy_xing android 架构
普通登录流程图集中式登录流程图把共有的业务通过AOP统一管理这里我们就需要使用AspectJ来实现面向切面的集中式登录什么是AspectJAspectJ是一个面向切面的框架，它扩展了Java语言。AspectJ定义了AOP语法，它有一个专门的编译器用来生成遵守Java字节编码规范的Class文件。Aspect是切面是切入点(PointCuts)和通知(Advice)的集合。Pointcut切入点通
tomcat系统架构及运用极致人生-010 tomcat 系统架构 java
文章目录下面是Tomcat架构的详细解析：1.**Server（服务器）**2.**Service（服务）**3.**Container（容器）**-分层结构4.**Connectors（连接器）**5.**类加载器（ClassLoader）**6.**Catalina**7.**配置文件与目录结构**8.**监听器（Listeners）**9.**安全性**10.**性能调优与监控**Tomca
语言模型与向量模型：深入解析与实例剖析 ♢.＊语言模型人工智能自然语言处理
亲爱的小伙伴们，在求知的漫漫旅途中，若你对深度学习的奥秘、Java与Python的奇妙世界，亦或是读研论文的撰写攻略有所探寻，那不妨给我一个小小的关注吧。我会精心筹备，在未来的日子里不定期地为大家呈上这些领域的知识宝藏与实用经验分享。每一个点赞，都如同春日里的一缕阳光，给予我满满的动力与温暖，让我们在学习成长的道路上相伴而行，共同进步✨。期待你的关注与点赞哟！在自然语言处理领域，语言模型和向量模型
字节跳动的发展历史：技术驱动的创新征程 ♢.＊字节跳动
在当今数字化时代，字节跳动已然成为全球互联网行业中熠熠生辉的巨头。它以独特的技术创新和敏锐的市场洞察力，打造出一系列广受欢迎的产品，深刻改变了人们获取信息、娱乐和社交的方式。让我们一同回顾字节跳动的发展历程，探寻其背后的技术密码。创业初期：技术萌芽与探索（2012年）字节跳动成立于2012年3月，在北京正式启航。创业初期，团队规模较小，但怀揣着对互联网技术的无限热情与创新精神。同年8月，字节跳动推
【C语言】Main函数解析 Nebula嵌入式 c语言
目录前言Main函数解析代码前言我们从刚才是学习编程就学习了main函数，在linux中你执行一个可执行文件./a.out此时你同时想传入参数那应该怎么办呢？这时你就要了解main函数的一些用法才能实现上面的目的。Main函数解析intmain(intargc,char*argv[])也可以写成intmain(intargc,char**argv)。一般我们都习惯写前者。argc表示程序运行时发送
240. 搜索二维矩阵|| cccc楚染rrrr LeetCode 矩阵线性代数 java 算法数据结构
参考题解：https://leetcode.cn/problems/search-a-2d-matrix-ii/solutions/2361487/240-sou-suo-er-wei-ju-zhen-iitan-xin-qin-7mtf将矩阵旋转45度，可以看作一个二叉搜索树。假设以左下角元素为根结点，当target比root大的时候，则舍弃当前列，右移一列；当target比root小的时候，则
RTX4060+ubuntu22.04+cuda11.8.0+cuDNN8.6.0 & 如何根据显卡型号和系统配置cuda和cuDNN所需的安装环境 computer_vision_chen 带你跑通人工智能项目 cuda cuDNN
文章目录电脑原配置安装cuda和cuDNN前的环境选择cuDNN与CUDAtookit和nvidiadriver的对应关系cuda版本选择⭐查看自己的nvidiadriver版本和最大支持的CUDA版本⭐最小支持版本查看11.8.0版本的cuda和ubuntu22.04对应的cuDNN版本查看ubuntu22.04中cuDNN支持的内核，GCC最终安装前的环境选择下载安装linux6.2.0内核安
「焦虑永存」悖论：一个自媒体人的两年通关实录小路哥v 副业思考经验分享
在一个没有阳光的晚上，打开灯望着电脑不知道写什么，于是无聊的整理起flomo上以前写过的内容，标签太乱，边看边整理，重新分类打标签。随着一篇篇整理，看着那些用文字描写着当时的心境，我被带入到了2022年，2023年上半年，原来我当时在经历这些事情，在做这些事情。原来我当时是这样思考问题的，原来我当时同样很焦虑，不知道做什么，只能一遍一遍的尝试，一遍又一遍的探索新的东西。也同样面临看到同行的其他人一
消失的时间，都去哪里了小路哥v 副业思考经验分享
时间都去哪里了，对于主副业并行的职场人来说，时间是非常宝贵的，我恨不得一分钟掰成两半来花，一分钟当两分钟用。时间，精力，心力，对于做副业的人是绝大的考验，多数人如果盲干，不出三个月就得歇菜，有可能一分钱没赚到，有可能赚了几千块。这个时候离放弃就只有一念之差，差什么？差一个对自己的灵魂拷问，我最近三个月，忙成狗，天天摸鱼写文章，或者回答问题，找选题，找素材，下班了搞到11点，12点，有时候还凌晨。结
记录式写作，怕你停不下来小路哥v 副业思考经验分享
记录思考，你会写的很开心，有人问我，你怎么每天写那么多东西，我做不到，太懒了，太累了，想不出那么多可写的。当一个事情变成一个任务，每天不得不做的时候，你就很难喜欢它了，把热爱变成工作，有人觉得是幸福，有人觉得是悲哀。其实区别在于，这件事是否真的是你所热爱的，以及是否符合你的价值观，是否认同。有些时候，爱好和工作是两回事。写作其实包含非常多东西，而这里只说一个角度，那就是从记录自己思考的角度。记录，
[星球大战]阿纳金的背叛 comsci
本来杰迪圣殿的长老是不同意让阿纳金接受训练的......... 但是由于政治原因,长老会妥协了...这给邪恶的力量带来了机会所以......现代的地球联邦接受了这个教训...绝对不让某些年轻人进入学院
看懂它，你就可以任性的玩耍了！ aijuans JavaScript
javascript作为前端开发的标配技能，如果不掌握好它的三大特点：1.原型 2.作用域 3. 闭包 ,又怎么可以说你学好了这门语言呢？如果标配的技能都没有撑握好，怎么可以任性的玩耍呢？怎么验证自己学好了以上三个基本点呢，我找到一段不错的代码，稍加改动，如果能够读懂它，那么你就可以任性了。 function jClass(b
Java常用工具包 Jodd Kai_Ge java jodd
Jodd 是一个开源的 Java 工具集，包含一些实用的工具类和小型框架。简单，却很强大！写道 Jodd = Tools + IoC + MVC + DB + AOP + TX + JSON + HTML < 1.5 Mb Jodd 被分成众多模块，按需选择，其中工具类模块有： jodd-core &nb
SpringMvc下载 120153216 springMVC
@RequestMapping(value = WebUrlConstant.DOWNLOAD) public void download(HttpServletRequest request,HttpServletResponse response,String fileName) { OutputStream os = null; InputStream is = null;
Python 标准异常总结 2002wmj python
Python标准异常总结 AssertionError 断言语句（assert）失败 AttributeError 尝试访问未知的对象属性 EOFError 用户输入文件末尾标志EOF（Ctrl+d） FloatingPointError 浮点计算错误 GeneratorExit generator.close()方法被调用的时候 ImportError 导入模块失
SQL函数返回临时表结构的数据用于查询 357029540 SQL Server
这两天在做一个查询的SQL，这个SQL的一个条件是通过游标实现另外两张表查询出一个多条数据，这些数据都是INT类型，然后用IN条件进行查询，并且查询这两张表需要通过外部传入参数才能查询出所需数据，于是想到了用SQL函数返回值，并且也这样做了，由于是返回多条数据，所以把查询出来的INT类型值都拼接为了字符串，这时就遇到问题了，在查询SQL中因为条件是INT值，SQL函数的CAST和CONVERST都
java 时间格式化 | 比较大小| 时区个人笔记 7454103 java eclipse tomcat c MyEclipse
个人总结！不当之处多多包含！引用 1.0 如何设置 tomcat 的时区：位置：(catalina.bat---JAVA_OPTS 下面加上) set JAVA_OPT
时间获取Clander的用法 adminjun Clander 时间
/** * 得到几天前的时间 * @param d * @param day * @return */ public static Date getDateBefore(Date d,int day){ Calend
JVM初探与设置 aijuans java
JVM是Java Virtual Machine（Java虚拟机）的缩写，JVM是一种用于计算设备的规范，它是一个虚构出来的计算机，是通过在实际的计算机上仿真模拟各种计算机功能来实现的。Java虚拟机包括一套字节码指令集、一组寄存器、一个栈、一个垃圾回收堆和一个存储方法域。 JVM屏蔽了与具体操作系统平台相关的信息，使Java程序只需生成在Java虚拟机上运行的目标代码（字节码）,就可以在多种平台
SQL中ON和WHERE的区别 avords
SQL中ON和WHERE的区别数据库在通过连接两张或多张表来返回记录时，都会生成一张中间的临时表，然后再将这张临时表返回给用户。 www.2cto.com 在使用left jion时，on和where条件的区别如下： 1、 on条件是在生成临时表时使用的条件，它不管on中的条件是否为真，都会返回左边表中的记录。
说说自信 houxinyou 工作生活
自信的来源分为两种,一种是源于实力,一种源于头脑.实力是一个综合的评定,有自身的能力,能利用的资源等.比如我想去月亮上,要身体素质过硬,还要有飞船等等一系列的东西.这些都属于实力的一部分.而头脑不同,只要你头脑够简单就可以了!同样要上月亮上,你想,我一跳,1米,我多跳几下,跳个几年,应该就到了!什么?你说我会往下掉?你笨呀你!找个东西踩一下不就行了吗? 无论工作还
WEBLOGIC事务超时设置 bijian1013 weblogic jta 事务超时
系统中统计数据，由于调用统计过程，执行时间超过了weblogic设置的时间，提示如下错误：统计数据出错! 原因：The transaction is no longer active - status: 'Rolling Back. [Reason=weblogic.transaction.internal
两年已过去，再看该如何快速融入新团队 bingyingao java 互联网融入架构新团队
偶得的空闲，翻到了两年前的帖子该如何快速融入一个新团队，有所感触，就记下来，为下一个两年后的今天做参考。时隔两年半之后的今天，再来看当初的这个博客，别有一番滋味。而我已经于今年三月份离开了当初所在的团队，加入另外的一个项目组，2011年的这篇博客之后的时光，我很好的融入了那个团队，而直到现在和同事们关系都特别好。大家在短短一年半的时间离一起经历了一
【Spark七十七】Spark分析Nginx和Apache的access.log bit1129 apache
Spark分析Nginx和Apache的access.log，第一个问题是要对Nginx和Apache的access.log文件进行按行解析，按行解析就的方法是正则表达式： Nginx的access.log解析正则表达式 val PATTERN = """([^ ]*) ([^ ]*) ([^ ]*) (\\[.*\\]) (\&q
Erlang patch bookjovi erlang
Totally five patchs committed to erlang otp, just small patchs. IMO, erlang really is a interesting programming language, I really like its concurrency feature. but the functional programming style
log4j日志路径中加入日期 bro_feng java log4j
要用log4j使用记录日志，日志路径有每日的日期，文件大小5M新增文件。实现方式 log4j: <appender name="serviceLog" class="org.apache.log4j.RollingFileAppender"> <param name="Encoding" v
读《研磨设计模式》-代码笔记-桥接模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 个人觉得关于桥接模式的例子，蜡笔和毛笔这个例子是最贴切的：http://www.cnblogs.com/zhenyulu/articles/67016.html * 笔和颜色是可分离的，蜡笔把两者耦合在一起了：一支蜡笔只有一种
windows7下SVN和Eclipse插件安装 chenyu19891124 eclipse插件
今天花了一天时间弄SVN和Eclipse插件的安装，今天弄好了。svn插件和Eclipse整合有两种方式，一种是直接下载插件包，二种是通过Eclipse在线更新。由于之前Eclipse版本和svn插件版本有差别，始终是没装上。最后在网上找到了适合的版本。所用的环境系统：windows7JDK：1.7svn插件包版本：1.8.16Eclipse：3.7.2工具下载地址：Eclipse下在地址：htt
[转帖]工作流引擎设计思路 comsci 设计模式工作应用服务器 workflow 企业应用
作为国内的同行，我非常希望在流程设计方面和大家交流，刚发现篇好文(那么好的文章，现在才发现，可惜)，关于流程设计的一些原理，个人觉得本文站得高，看得远，比俺的文章有深度，转载如下 ================================================================================= 自开博以来不断有朋友来探讨工作流引擎该如何
Linux 查看内存，CPU及硬盘大小的方法 daizj linux cpu 内存硬盘大小
一、查看CPU信息的命令 [root@R4 ~]# cat /proc/cpuinfo |grep "model name" && cat /proc/cpuinfo |grep "physical id" model name : Intel(R) Xeon(R) CPU X5450 @ 3.00GHz model name :
linux 踢出在线用户 dongwei_6688 linux
两个步骤： 1.用w命令找到要踢出的用户，比如下面： [root@localhost ~]# w 18:16:55 up 39 days, 8:27, 3 users, load average: 0.03, 0.03, 0.00 USER TTY FROM LOGIN@ IDLE JCPU PCPU WHAT
放手吧,就像不曾拥有过一样 dcj3sjt126com
内容提要：静悠悠编著的《放手吧就像不曾拥有过一样》集结“全球华语世界最舒缓心灵”的精华故事，触碰生命最深层次的感动，献给全世界亿万读者。《放手吧就像不曾拥有过一样》的作者衷心地祝愿每一位读者都给自己一个重新出发的理由，将那些令你痛苦的、扛起的、背负的，一并都放下吧！把憔悴的面容换做一种清淡的微笑，把沉重的步伐调节成春天五线谱上的音符，让自己踏着轻快的节奏，在人生的海面上悠然漂荡，享受宁静与
php二进制安全的含义 dcj3sjt126com PHP
PHP里，有string的概念。 string里，每个字符的大小为byte（与PHP相比，Java的每个字符为Character，是UTF8字符，C语言的每个字符可以在编译时选择）。 byte里，有ASCII代码的字符，例如ABC，123，abc，也有一些特殊字符，例如回车，退格之类的。特殊字符很多是不能显示的。或者说，他们的显示方式没有标准，例如编码65到哪儿都是字母A，编码97到哪儿都是字符
Linux下禁用T440s，X240的一体化触摸板(touchpad) gashero linux ThinkPad 触摸板
自打1月买了Thinkpad T440s就一直很火大，其中最让人恼火的莫过于触摸板。 Thinkpad的经典就包括用了小红点(TrackPoint)。但是小红点只能定位，还是需要鼠标的左右键的。但是自打T440s等开始启用了一体化触摸板，不再有实体的按键了。问题是要是好用也行。实际使用中，触摸板一堆问题，比如定位有抖动，以及按键时会有飘逸。这就导致了单击经常就
graph_dfs hcx2013 Graph
package edu.xidian.graph; class MyStack { private final int SIZE = 20; private int[] st; private int top; public MyStack() { st = new int[SIZE]; top = -1; } public void push(i
Spring4.1新特性——Spring核心部分及其他 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
配置HiveServer2的安全策略之自定义用户名密码验证 liyonghui160com
具体从网上看 http://doc.mapr.com/display/MapR/Using+HiveServer2#UsingHiveServer2-ConfiguringCustomAuthentication LDAP Authentication using OpenLDAP Setting
一位30多的程序员生涯经验总结 pda158 编程工作生活咨询
1.客户在接触到产品之后，才会真正明白自己的需求。　　这是我在我的第一份工作上面学来的。只有当我们给客户展示产品的时候，他们才会意识到哪些是必须的。给出一个功能性原型设计远远比一张长长的文字表格要好。 2.只要有充足的时间，所有安全防御系统都将失败。　　安全防御现如今是全世界都在关注的大课题、大挑战。我们必须时时刻刻积极完善它，因为黑客只要有一次成功，就可以彻底打败你。 3.
分布式web服务架构的演变自由的奴隶 linux Web 应用服务器互联网
最开始，由于某些想法，于是在互联网上搭建了一个网站，这个时候甚至有可能主机都是租借的，但由于这篇文章我们只关注架构的演变历程，因此就假设这个时候已经是托管了一台主机，并且有一定的带宽了，这个时候由于网站具备了一定的特色，吸引了部分人访问，逐渐你发现系统的压力越来越高，响应速度越来越慢，而这个时候比较明显的是数据库和应用互相影响，应用出问题了，数据库也很容易出现问题，而数据库出问题的时候，应用也容易
初探Druid连接池之二——慢SQL日志记录 xingsan_zhang 日志连接池 druid 慢SQL
由于工作原因，这里先不说连接数据库部分的配置，后面会补上，直接进入慢SQL日志记录。 1.applicationContext.xml中增加如下配置： <bean abstract="true" id="mysql_database" class="com.alibaba.druid.pool.DruidDataSourc