anmin1992

机器学习常用函数解析

逻辑回归

from sklearn.preprocessing import StandardScaler

1. StandardScaler(copy=True, with_mean=True, with_std=True)
    使用:
        scaler = StandardScaler(copy=True, with_mean=True, with_std=True)
        
    参数:
        copy: copy=True不会inplace数据
        with_mean: with_mean=True会让数据的均值为0
        with_std: with_std=True会让数据的方差为1
        
    返回结果:
        一个StandardScaler对象

    联系:
        要使用StandardScaler对象, 一般需要与$2配合      
    PS:
        scaler.copy = False
        scaler.with_mean = False
        scaler.with_std = False
        可以通过赋值的方式修改copy, with_mean, with_std属性值
        
        scaler的其他属性:
            mean_: 均值
            std_: 方差
     
    

2.  scaler.fit(X, y=None)
    使用:
        data = [[1, 2], [3, 4], [5, 6]]
        scaler = scaler.fit(data)
    
    参数:
        X: 一个array-like的数据, 是矩阵(矩阵至少是二维的, 所以data = [1, 2, 3]不可以)的形式即可
        y: 现在已经不再使用了, 转移到了Pipeline类中了
    返回结果:
        一个StandardScaler对象
    
    联系:
        fit函数在StandardScaler对象创建出来就要调用, 因为fig函数中封装的算法是后续继续调用scaler对象的API的基础
        一般在fit之后就会使用$3函数
    PS:

3. scaler.transform(X, copy=None)   :
    使用:
        data = scaler.transform(data)
    
    参数:
        X: 一个array-like的数据, 是矩阵
        copy: bool值, 一般使用默认即可
    
    返回结果:
        nd.array
    
    联系:
        这里使用scaler.transform与scaler.fit_transform函数一样
        均值和方差缩放都是按照列来的, 见$4
        
        scaler.fit_transform函数的效果与$5一样
        
        fit_transform(X)
            参数:
                X: array-like
            返回:
                np.array
            PS:
                使用的也挺方便的, 但是还是推荐使用fit(X), transform(X)  
    PS:
        
        $1-$3这个步骤常用于特征中有一个方差不稳定, 就采用sklearn的preprocessing模块去均值和方差缩放
        
4. data.mean(axis=0), scaler.std(axis=0)
    使用:
        In [97]: print(data.mean(axis=0))
        Out[98]: array([0., 0.])
        
        In [99]: print(data.std(axis=0))
        Out [100]: array([1., 1.])
    
    参数:
        axis=None: 0表示列, 1表示行, None表示全部
    
    返回结果:
        nd.array
    
    PS:
        这里的data是np.array, 所以这里的mean和std参见numpy.mean和numpy.std


5. scale(X, axis=0, with_mean=True, with_std=True, copy=True)
    使用:
        data = scale(data)
        
    参数:
        X: array-like矩阵
        axis=0: 0表示列优先, 1表示行优先
        with_mean=True: True表示去均值化
        with_std=True: True表示对方差进行缩放
        copy=True: True表示inplace, 不会修改原始数据
        
    返回结果:
        nd.array
        
    联系:
        与scaler.fit_transform功能一样, 但是与scaler.fit(data), scaler.transform(data)相比, scaler这个对象可以存储更多的数据, 如.mean_, .scale_等, 这里的mean_和scale_属性都是
        scaler.fit(X)中的X而言的, 调用了scaler.transform(X)也不会改变, 所以相比较于直接使用scale(X)函数, scaler.transform函数可以保存原始的值

from sklearn.linear_model import LogisticRegression

1. LogisticRegression(self, penalty='l2', dual=False, tol=0.0001, C=1.0, fit_intercept=True, intercept_scaling=1, class_weight=None, random_state=None, solver='liblinear', max_iter=100, multi_class='ovr', verbose=0, warm_start=False, n_jobs=1)
    使用:
        lr = LogisticRegression(C='0.01', penalty='l1') # 最长用的, 延伸一下, 一般默认很多库的函数的默认参数都是设计好的, 很多很多情况下, 不需要修改
    
    参数:
        penalty='l2‘: 正则化惩罚的算法类型, 默认为l2, l2对应的solver='liblinear'这个默认参数, 在penalty='l2'时, solver有很多参数, 但是为l1时之后'liblinear'
        C: 正则化惩罚的参数, 小于1, 去零点多
    
    返回:
        LogisticRegression对象
    
    联系:
        得到lr对象之后, 会立马调用$2方法计算出目标函数, 在sklearn库中, 所有求目标函数的方法名为$2

2、 lr.fit(self, X, y, sample_weight=None)
    使用:
        lr.fit(X_train, y_train)
    
    参数:
        X: 训练集中的特征矩阵, array-like
        y: 训练集中的标签向量, array-like, 一维的, 一般小写的为一维的
    
    返回:
        None
    
    联系:
        调用了fit函数之后, 就在lr中封装了一个目标函数, 一般调用$3方法进行测试

3. lr.predict(self, X)
    使用:
        y_pred = lr.predict(X_test)
    
    参数:
        X: array-like
    
    返回:
        nd.array
        里面的值时候两种
    联系:
        该方法计算默认的阈值为0.5, 我们无法修改, 但是使用类似的$4方法可以修改

4. lr.predict_proba(self, X)
    使用:
        y_pred_probability = lr.predict_proba(X_test) 
    
    参数:
        X: array-like
    
    返回:
        nd.array
        存放的是fit方法计算出来的目标函数根据自变量X_test得出来的直接结果值, 因为逻辑回归的推导, 结果在0-1之间, 成为概率
    
    联系:
        自定义阈值, y_pred_probability_bool = y_pred_probability[:, 1] > your_threhold
        延伸一下:
            sklearn.metrics库中的confusion_matrix函数的构造函数__init__(y_true, y_pred, labels=None, sample_weight=None)
            中y_true理所当然为测试标签集, y_pred可以predict方法得出的array-like的nd.array, 也可以是bool类型的nd.array, 遇到True表示肯定, False表示False
            confusion_matrix()返回np.array

from imblearn.over_sampling import SMOTE

1. SMOTE(self, ratio='auto', random_state=None, k=None, k_neighbors=5, m=None, m_neighbors=10, out_step=0.5, kind='regular', svm_estimator=None, n_jobs=1)
    使用:
        over_sample = SMOTE(random_state=0) 
    参数:
        random_state=None:
    
    返回:
        SMOTE对象
    
    联系:
        该函数用于过采样, 实际上相比于下采样, 使用过采样的情况多, 因为过采样数据量大
        得到over_sample对象之后, 会调用$2方法进行过采样
    
2. over_sample.fit_sample(self, X, y)
    使用:
        over_sampled_features, over_sampled_label = over_sample.fit_sample(X_train, y_train)
    参数:         
        X: array-like
        y: array-like, 一维的  
    
    返回:
        tuple
        凡是返回的形式一个x1, x2, x3的都可以判定一个函数或者方法的返回值为tuple
    联系:
        检查y列表中的不同元素的个数, 使用SMOTE算法将少的元素的个数达到和多的一个
        在这之后, 就是一般的操作了, 比如现在我们通过fit_sample函数得到了过采样的样本, 接着使用K-CV(KFold cross validation)进行交叉验证, 再使用LogisticRegression的fit, predict_pro
        ba再配合recall_score, confusion_matrix分析

from sklearn.model_selection import KFold

1. __init__(self, n_splits=3, shuffle=False, random_state=None)
    使用:
        kf = KFlod(n_splits=5, shuffle=False, random_state=0)
        
    参数:
        n_splits: 将之后调用$2方法, 将该方法中的矩阵切成几份
        shuffle: 不清楚 
        random_state: 不清楚
    返回:
        KFlod对象
    
    联系:
        kf在调用了$2方法之后一般在for循环中进行迭代, 取出index
        KFold对象与$3对象类似, 但是$3采用分层的方法对X进行划分下标
    PS:
        在sklearn中, 一个构造函数中默认参数, 在后去是可以直接修改的, 默认参数就是sklearn的属性, 直接为属性赋值即可
    
2. kf.split(X, y=None, groups=None):
    使用:
        for train_index, test_index in kf.split(X):
            print('%s %s'%(train_index, test_index))
        
    参数:
        X: array-like, 在help文档中显示的格式(n_samples, n_features), 这是什么意思呢? n表示number of, 这个格式是X的shape属性返回的元组, 告诉我们要传入的array-like的shape
        y=None: array-like, 为None表示无监督学习, 按照管理, 在sklearn中有许多的默认参数都是设计好的, 一般不需要我们修改, 反而比较关注位置参数
        groups=None: 没用过
    
    返回:
        generator生成器, 主要用于迭代, 在for循环中, 当然也可是调用生成器的send(None)函数返回

from sklearn.model_selection import KFold

3. __init__(self, n_splits=3, shuffle=False, random_state=None)
    使用:
        skf = KFlod(n_splits=5, shuffle=False, random_state=0)
    参数:
        n_splits: 将之后调用$2方法, 将该方法中的矩阵切成几份
        shuffle: 不清楚 
        random_state: 不清楚
    返回:
        StratifiedKFold对象
    
    联系:
        skf在调用了$4方法之后一般在for循环中进行迭代, 取出index, 但是这里的$3还有一个y要传入
    
4. skf.split(X, y, groups=None)
    使用:
        for train_index, test_index in skf.split(X, y):
            print('%s %s'%(train_index, test_index))
    
    参数:
        X: array-like
        y: array-like
        groups=None
    
    返回:
        generator生成器
    
    联系:
        注意到这里的y是未知参数, StratifiedKFold对象在调用split函数时会根据y的值进行划分, 使得每一个划分都比较均匀, 额, 还是看官网上吧

from sklearn.model_selection import train_test_split

5. train_test_split(*arrays, **options)
    使用:
        X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=0)
    
    参数:
        *arrays: 基本上就是X和y了
        **options:
            test_size: 测试集所占百分比
            random_state: shuffle数据
            shuffle:
    返回:
        list
    
    联系:
        就如${使用}写到的, 一般采用拆包的形式接受返回值
        train_test_split是机器学习在建模之前必须的操作, 在格式化了我们的数据, 去掉了多余的特征, 采用了下采样或者过采样之后, 就会对数据进行划分成训练集和评估集

from sklearn.tree import DecisionTreeClassifier

1.  __init__(self, criterion='gini', splitter='best', max_depth=None, min_samples_split=2, min_samples_leaf=1, min_weight_fraction_leaf=0.0, max_features=None, random_state=None, max_leaf_nodes=None, min_impurity_decrease=0.0, min_impurity_split=None, class_weight=None, presort=False)
    使用:
        clf = DecisionTreeClassifier(max_depth=3, max_features=4, random_state=0)
        
    参数:
        大部分的默认参数是用于预剪枝
        criterion='gini': 指明构建决策树的算法, 常用的有gini(基尼)和entropy(熵值)
        max_depth=None: 用于预剪枝, 当树的深度达到max_depth就停止构建
        min_samples_split=2: 用于预剪枝, 如果某节点的样本数少于min_samples_split，则不会继续再尝试选择最优特征来进行划分
        min_samples_leaf: 这个值限制了叶子节点最少的样本数，如果某叶子节点数目小于样本数，则会和兄弟节点一起被剪枝
        class_weight:指定样本各类别的的权重，主要是为了防止训练集某些类别的样本过多
                 导致训练的决策树过于偏向这些类别; 这里可以自己指定各个样本的权重
                 如果使用“balanced”, 则算法会自己计算权重, 样本量少的类别所对应的样本权重会高
       max_leaf_nodes: 通过限制最大叶子节点数，可以防止过拟合，默认是"None”，即不限制最大的叶子节点数
    
    联系:
        在构建决策树时如果不加限制, 构建出来的模型容易过拟合, 所以一般需要指明max_depth和max_features, 当然我们很多时候对max_depth和max_features的选择是通过sklearn的${from sklearn.
        model_selection import GridSreachCV: GridSearchCV --> $2}方法进行网格搜索得出的, 一旦使用了GridSearchCV, 主动权就交给了GridSearchCV, 也就是说原来的clf就可以不用管了, 
        GridSearchCV对象在调用了${from sklearn.model_selection import GridSreachCV: GridSearchCV --> $2之后内部就封住了一个已经生成的clf, clf已经是优化过的了

from sklearn.model_selection import GridSearchCV

1. __init__(self, estimator, param_grid, scoring=None, fit_params=None, n_jobs=1, iid=True, refit=True, cv=None, verbose=0, pre_dispatch=‘2*n_jobs’, error_score=’raise’, return_train_score=’warn’)
    使用:
        parameters = {'max_depth': [1, 2, 3, 4, 5], 'max_features': [1, 2, 3, 4]} # 这里的键都是clf(DecisionTreeClassifier)的属性, 通过GridSearchCV选择最优的值
        grid_search = GridSearchCV(clf, param_grid=parameters, cv=3) # 可以看出, 该函数自带CV(Cross Validation, 就是只提到的KFold或者StratifiedKFold的功能)
    
    参数:
        estimator: 指的就是分类器(决策树[DecisionTreeClassifier, DecisionTreeRegression], 随机森林[RandomForest])
        param_grid: 值为字典或者列表，即需要最优化的参数的取值, param_test1={'max_depth': range(10,71,10)}
        scoring: 准确度评价标准，默认None,这时需要使用score函数；或者如scoring='roc_auc'，根据所选模型不同，评价准则不同; 如果是None，则使用estimator的误差估计函数
        cv :交叉验证参数，默认None，使用三折交叉验证。指定fold数量，默认为3，也可以是yield训练/测试数据的生成器。
        refit: 默认为True, 程序将会以交叉验证训练集得到的最佳参数, 重新对所有可用的训练集与开发集进行, 作为最终用于性能评估的最佳模型参数, 即在搜索参数结束后, 用最佳参数结果再次fit一遍全部数
        集
        iid: 默认True,为True时, 默认为各个样本fold概率分布一致, 误差估计为所有样本之和, 而非各个fold的平均
        verbose: 日志冗长度, int: 冗长度; 0: 不输出训练过程; 1: 偶尔输出; >1: 对每个子模型都输出
        n_jobs: 并行数; int: 个数; -1: 跟CPU核数一致; 1: 默认值
        pre_dispatch：指定总共分发的并行任务数; 当n_jobs大于1时, 数据将在每个运行点进行复制, 这可能导致OOM, 而设置pre_dispatch参数, 则可以预先划分总共的job数量，使数据最多被复制pre_dispatch次
        
        常用的就stimator, param_grid, cv
    
    返回:
        GridSearchCV对象
    
    联系:
        常用属性:
            以下在调用了$2方法才有意义
            grid_scores_: 给出不同参数情况下的评价结果, 一个list, 里面是_CVScoreTuple对象
            best_params_: 描述了已取得最佳结果的参数的组合
            best_score_: 成员提供优化过程期间观察到的最好的评分, 就是最大的精度
            best_estimator: 返回最优的决策树

2. grid_search.fit(X, y=None, groups=None, **fit_params)
        使用:
            grid_search.fit(X, y) # 执行该函数需要一些实现, 因为需要调优(不断的迭代和标胶), 因为传入了X, y, 可想而知, 调用完该函数, 目标函数已经出来了, 可以直接进入评估阶段了
     
        参数:
            X: array-like, train
            y: array-like train labels
            
        返回:
            None
        
        联系:
            接下来查看属性:
                grid_scores_: 给出不同参数情况下的评价结果, 一个list, 里面是_CVScoreTuple对象
                best_params_: 描述了已取得最佳结果的参数的组合
                best_score_: 成员提供优化过程期间观察到的最好的评分, 就是最大的精度
                best_estimator_: 返回最优的决策树
            最重要的是best_estimator_:
                wanted_estimator = grid_search.best_estimator_
                score = wanted_estimator.score(X_test, y_test) # 返回精度, 就是评估的过程, 如果满意, 使用wanted_estimator.predict()方法应用到实际问题中

from sklearn.ensemble import RandomForestClassifier

1. __init__(tstrap=True, class_weight=None, criterion='gini',
               max_depth=2, max_features='auto', max_leaf_nodes=None,
               min_impurity_decrease=0.0, min_impurity_split=None,
               min_samples_leaf=1, min_samples_split=2,
               min_weight_fraction_leaf=0.0, n_estimators=10, n_jobs=1,
               oob_score=False, random_state=0, verbose=0, warm_start=False)
    使用:
        clf = RandomForestClassifier(n_estimators=3, max_depth=3, max_features=4) # 使用方法与决策树的构造方法一样, 只不过最好指定n_estimators的个数(森林中树的个数)
    
    参数:
        大部分的默认参数是用于预剪枝
        n_estimator: 树的个数
        criterion='gini': 指明构建决策树的算法, 常用的有gini(基尼)和entropy(熵值)
        max_depth=None: 用于预剪枝, 当树的深度达到max_depth就停止构建
        min_samples_split=2: 用于预剪枝, 如果某节点的样本数少于min_samples_split，则不会继续再尝试选择最优特征来进行划分
        min_samples_leaf: 这个值限制了叶子节点最少的样本数，如果某叶子节点数目小于样本数，则会和兄弟节点一起被剪枝
        class_weight:指定样本各类别的的权重，主要是为了防止训练集某些类别的样本过多
                 导致训练的决策树过于偏向这些类别; 这里可以自己指定各个样本的权重
                 如果使用“balanced”, 则算法会自己计算权重, 样本量少的类别所对应的样本权重会高
       max_leaf_nodes: 通过限制最大叶子节点数，可以防止过拟合，默认是"None”，即不限制最大的叶子节点数
    
    联系:
        使用方法与决策树一样, 只不过parameter中要指定'n_estimators': [1, 2, 3]

转载于:https://www.cnblogs.com/megachen/p/9555836.html

Rasa的工作流程不会编程的程序猿ᅟ rasa
Rasa的工作流程分为两个主要部分：NLU（自然语言理解）和Core（对话管理）。整个流程包括从用户输入到最终响应的多个步骤，下面是详细的工作流程解析：1.用户输入用户通过聊天界面（如微信、Telegram、Slack或Web前端）发送自然语言消息，例如："我想预订一张明天去北京的火车票"2.自然语言理解（NLU）Rasa的NLU模块解析用户输入，提取意图和实体。2.1意图识别NLU模块会识别用户
架构蓝图的力量：引领企业数字化转型的最佳路径 AZone架构院数字化转型微服务架构运维大数据
企业数字化转型中的架构蓝图企业数字化转型不仅是一个技术升级的过程，更是企业从战略、技术到业务模式的全方位变革。在这个过程中，构建清晰的架构蓝图至关重要。架构蓝图不仅能确保技术与业务战略的一致性，还能够帮助企业在转型过程中管理复杂性，保障合规性，最终实现数字化转型的成功。本文将从企业如何利用和实施架构蓝图的角度出发，深入解析其在数字化转型中的关键作用，并提供实际操作的指导原则和最佳实践，帮助企业有效
华为OD机试E卷 --分苹果 --24年OD统一考试（Java & JS & Python & C & C++）飞码创造者最新华为OD机试题库2024 华为od java javascript python js c语言
文章目录题目描述输入描述输出描述用例题目解析JS算法源码Java算法源码python算法源码c算法源码c++算法源码题目描述A、B两个人把苹果分为两堆，A希望按照他的计算规则等分苹果，他的计算规则是按照二进制加法计算，并且不计算进位12+5=9(1100+0101=9)，B的计算规则是十进制加法，包括正常进位，B希望在满足A的情况下获取苹果重量最多。输入苹果的数量和每个苹果重量，输出满足A的情况下
【Lora微调】提高模型效率的创新方法 @fishv 人工智能大模型微调 Lora
前言在自然语言处理（NLP）和机器学习的研究和应用中，随着模型规模的不断扩大，模型训练的计算成本和存储需求也不断攀升。大型预训练模型，如GPT、BERT等，虽然在许多任务上表现出色，但它们的训练和微调通常需要巨大的计算资源，这使得许多研究者和开发者无法充分利用这些模型进行个性化或领域特定的调整。为了在保持模型性能的同时减少计算开销，**Lora（Low-RankAdaptation）**应运而生。
MySQL 主从同步一致性详解 Java之路行者 JAVA后端 SpringBoot MySql mysql android 数据库
MySQL主从同步是一种数据复制技术，它允许数据从一个数据库服务器（主服务器）自动同步到一个或多个数据库服务器（从服务器）。这种技术主要用于实现读写分离、提升数据库性能、容灾恢复以及数据冗余备份等目的。下面将详细解析MySQL主从同步的一致性问题，并通过案例分析其工作原理。一、MySQL主从同步一致性详解主从同步原理MySQL主从同步基于二进制日志（binlog）进行。主库将数据的变更写入binl
2023第二十届华为杯研究生数学建模竞赛C题思路解析及代码 HeartOfDog 数学建模华为
已更新C题包括成品论文等全部内容———————————————老粉可能知道，我是为爱发电，一般分享完思路偶尔会做对应的建模（一般都是帮助同门师兄妹情况下），杜绝各位被骗，由于个人工作问题，我尽可能在比赛期间更新思路，建议收藏或者关注。注：2023.9.22更新，有许多同学私信我说希望发一些论文模板等资料和进度分享，有时间的话会在里边上传一些资料、回答问题737.388.193，去掉符号，或点击此处
【电商平台的架构】启山智软商城源码架构
文章目录前言电商平台的架构是一个复杂而庞大的系统，涉及多个核心模块和技术选型，旨在高效协调信息流、货物流和资金流。具体如下：一、核心模块二、技术选型三、架构设计四、发展趋势五、系统设计六、全链路解析总结前言电商平台的架构是一个复杂而庞大的系统，涉及多个核心模块和技术选型，旨在高效协调信息流、货物流和资金流。具体如下：一、核心模块用户模块负责用户注册、登录、个人信息管理等功能。商品模块展示商品详情，
vite webpack原理和区别
Vite和Webpack的工作原理有显著的不同，以下是对它们各自原理的简要说明：Vite原理原生ES模块：Vite利用浏览器对原生ES模块（ESM）的支持，实现按需加载和编译。开发服务器启动时，Vite只需解析入口文件，并将导入的模块路径记录下来。按需编译：当浏览器请求某个模块时，Vite会实时编译该模块及其依赖。使用esbuild或Vite自带的编译器快速处理JavaScript和CSS。热模块
短视频去水印接口支持全网解析源码/自定义API接口亿多多宝源码网站 ajax php
|简介：短视频去水印接口支持全网解析源码，主要是可自定义API随时更换，一次二次解析均可，完全可以对接全网各大站点。后台UI美丽，功能强大~~特色功能：1.内置本地解析接口2.支持各大网站二次解析3.支持自己开放API权限4.支持网站用户开通VIP后可申请API权限5.强大的模块管理6.完整的VIP开发文档7.支持支付宝当面付8.新增广告位9.全站ajax数据提交<
通俗理解IP地址概念：网络号、主机号、子网掩码与网段解析小小野猪网络-IP 网络 tcp/ip 服务器
通俗理解IP地址概念：网络号、主机号、子网掩码与网段解析网络号（NetworkID）主机号（HostID）子网掩码网段总结在互联网中，IP地址扮演着至关重要的角色，它是连接网络世界的桥梁。这里深入浅出地讲解几个关键概念：网络号、主机号、子网掩码以及网段，帮助大家构建起对IP地址体系的全面理解。网络号（NetworkID）含义：网络号是IP地址中用于识别设备所属网络的那一部分。就像你家的街道地址，告
PLS_INTEGER：Oracle PL/SQL中的整数类型深度解析小小野猪 Oracle PL/SQL语法与案例深度解析 oracle sql 数据库 PLS_INTEGER
PLS_INTEGER：OraclePL/SQL中的整数类型深度解析一、概述二、PLS_INTEGER简介三、PLS_INTEGER的优点四、PLS_INTEGER的简单示例示例1：声明并使用PLS_INTEGER变量示例2：在存储过程中使用PLS_INTEGER五、资深应用的代码示例示例3：使用PLS_INTEGER进行复杂的数学计算六、结论七、学习与成长一、概述在Oracle数据库中，PL/S
Kafka的Partition故障恢复机制与HW一致性保障-Epoch更新机制详解大树~~ #Kafka java kafka 分布式后端
在分布式系统中，节点的故障是不可避免的。为了确保系统的高可用性和数据的一致性，Kafka设计了一系列机制来应对Broker或Partition的故障。本文将详细解析Kafka的Partition故障恢复机制和HW一致性保障-Epoch更新机制，帮助深入理解Kafka在面对故障时的处理逻辑和一致性保障手段。一、Partition故障恢复机制1.概述Kafka中的每个Topic被划分为多个Partit
DuckDB：详细解析CMakeLists.txt Whoisbug SQL引擎服务器 duckdb 存储引擎 sql cpp java
引言CMake简介CMake（Cross-PlatformMake）是一种跨平台的构建系统生成器，用于管理和自动化软件的构建过程。它通过编写配置文件（通常是CMakeLists.txt）来定义项目的构建规则，支持多种编译器和操作系统，能够生成本地化的构建文件（如Makefile、VisualStudio解决方案等）。CMake广泛应用于以下场景：跨平台项目：需要在多种操作系统上构建和部署的项目。大
解析MPU与MCU的核心差异：定义、架构、功能、性能、应用及厂家全方面对比东辰芯力单片机 risc-v 嵌入式硬件人工智能单片机
MPU（MicroProcessorUnit，微处理器单元）和MCU（MicroControllerUnit，微控制器单元）是两种不同的嵌入式处理芯片类型，它们在定义、架构、功能、性能、应用以及厂家方面都有所不同。以下是对这些方面的详细分析：定义MCU：是一种高度集成的单片机，它将CPU、内存（RAM/ROM）、定时器/计数器和其他外设接口集成为一个芯片，用于执行特定控制任务。MPU：通常指的是一
自动驾驶系列—自动驾驶MCU架构全方位解析：从单核到多核的选型指南与应用实例学步_技术自动驾驶自动驾驶单片机架构 MCU
欢迎来到我的技术小筑，一个专为技术探索者打造的交流空间。在这里，我们不仅分享代码的智慧，还探讨技术的深度与广度。无论您是资深开发者还是技术新手，这里都有一片属于您的天空。让我们在知识的海洋中一起航行，共同成长，探索技术的无限可能。探索专栏：学步_技术的首页——持续学习，不断进步，让学习成为我们共同的习惯，让总结成为我们前进的动力。技术导航：人工智能：深入探讨人工智能领域核心技术。自动驾驶：分享自动
PC端后台管理系统实现在线预览文件在下不知好歹前端 javascript html
PC端后台管理系统实现在线预览文件后台管理系统是每个新手前端必然接触的项目，当产品要求在线预览文件的预览的时候，我收集了两种在线预览的方法，希望对一些刚入门的小白有所帮助1.使用iframe标签微软有一个解析地址，Word、Xls、PPT这些文件需要使用微软官方的解析地址，如微软解析地址：https://view.officeapps.live.com/op/view.aspx?src=你的文件地
【python学习】一篇带你玩转 Python JSON 操作的终极指南：dump、dumps、load、loads 全解析 NLP仙人 python python 学习 json
在现代编程中，JSON(JavaScriptObjectNotation)是一种广泛使用的数据交换格式。在Python中，处理JSON数据是一项常见的任务，Python提供了强大的json模块来轻松地进行JSON编码和解码。本文将详细介绍json.dump、json.dumps、json.load和json.loads四个函数的用法，并通过代码示例帮助你掌握这些工具。json.dump和json.
图像效果的一些专业测试工具和指标：追心嵌入式 C语言测试工具音视频
图像效果的一些专业测试工具和指标：1，色卡：色卡是行业通用的，也是标准的，一般相机出图后会与色卡对比，来衡量是否发生了色偏，颜色还原度，失真度的差异。2，图像测试卡，一般是来测试图像中心和四角的清晰度的。测试方法，用摄像头对着图纸，使摄像头中看到图纸占满，即可测试。3，灰阶值：是反应了该相机对图像灰阶值的解析度。4，帧率，码率，分辨率H264/5i帧间隔。这些指标可以通过potplayer去看，一
Python读取JSON文件 UIEdit python json 前端 Python
在Python中，我们可以使用内置的json模块来读取和解析JSON文件。JSON（JavaScriptObjectNotation）是一种常用的数据交换格式，它以易于阅读和编写的文本形式存储数据。下面是使用Python读取JSON文件的详细步骤。步骤1:导入所需模块首先，我们需要导入Python的json模块，该模块提供了处理JSON数据的函数和方法。importjson步骤2:打开JSON文件
[Python从零到壹] 七十七.图像识别及经典案例篇之目标检测入门普及和ImageAI对象检测详解 Eastmount Python从零到壹 python 目标检测 ImageAI 图像是被基础系列
欢迎大家来到“Python从零到壹”，在这里我将分享约200篇Python系列文章，带大家一起去学习和玩耍，看看Python这个有趣的世界。所有文章都将结合案例、代码和作者的经验讲解，真心想把自己近十年的编程经验分享给大家，希望对您有所帮助，文章中不足之处也请海涵。Python系列整体框架包括基础语法10篇、网络爬虫30篇、可视化分析10篇、机器学习20篇、大数据分析20篇、图像识别30篇、人工智
Python 读取Json的方法 AresGod python python json
一种直接用open的方法importjsonld=json.load(open(r’D:\temp\in.json’))另外一种方法importjsonf=file(r’D:\temp\in.json’))ld=json.load(f)这两种方法都可以直接对文件进行解析而对于字符串的解析，就要用到loadsfoo=‘{“age”:38}’my_json=json.loads(foo)
Python之time时间库 CodeDevMaster Python python 后端
time时间库概述获取当前时间time库datetime库区别时间元组处理获取时间元组的各个部分时间戳和时间元组的转换格式化时间格式化时间解析时间格式符号说明暂停程序计时操作简单计时高精度计时计时器类的实现UTC时间操作time库datetime库概述time是Python标准库中的一个模块，用于处理时间相关的操作。它提供了各种函数来获取当前时间、格式化时间、进行时间的转换和计算等。首先，需要导入
华为OD机试E卷 --货币单位换算--24年OD统一考试（Java & JS & Python & C & C++）飞码创造者最新华为OD机试题库2024 华为od java javascript python js c语言
文章目录题目描述输入描述输出描述用例题目解析JS算法源码Java算法源码python算法源码c算法源码c++算法源码题目描述记账本上记录了若干条多国货币金额，需要转换成人民币分（fen），汇总后输出。每行记录一条金额，金额带有货币单位，格式为数字+单位，可能是单独元，或者单独分，或者元与分的组合。要求将这些货币全部换算成人民币分（fen）后进行汇总，汇总结果仅保留整数，小数部分舍弃。元和分的换算关
Kafka 原理深入解析啥子都不会吖分布式 kafka 分布式
1.Kafka简介ApacheKafka是一个分布式流处理平台，由LinkedIn开发并于2011年开源，后成为Apache软件基金会的顶级项目。核心概念Topic：主题，是消息分类的逻辑概念，生产者将消息发送到特定的Topic，消费者从Topic中订阅消息。Partition：分区，每个Topic可以被划分为多个Partition，每个Partition是一个有序的队列。Broker：Kafka
Spring MVC 中的 DispatcherServlet：工作流程与应用场景解析码农小灰 SpringMVC 面试题 SpringBoot spring mvc java
目录一、初始化阶段二、请求处理阶段三、异常处理四、使用场景说明在SpringMVC框架中，DispatcherServlet扮演着至关重要的角色，它作为前端控制器（FrontController），负责接收客户端的HTTP请求，并根据配置将其分发给相应的处理器进行处理。以下是对其工作流程的详细解析，并结合使用场景进行说明。一、初始化阶段加载配置文件：DispatcherServlet在启动时会读取
探秘Xss：原理、类型与防范全解析咕德猫宁丶网络 xss java
一、Xss究竟是什么？（一）Xss的定义简述Xss全称是跨站脚本攻击（CrossSiteScripting），为了不和层叠样式表（CascadingStyleSheets，CSS）的缩写混淆，故将其缩写为Xss。它是一种常见的网络安全漏洞，指的是攻击者利用网站对用户输入内容校验不严格等漏洞，将恶意脚本（通常是JavaScript，也可以是Java、VBScript、ActiveX、Flash等）注
华为OD机试E卷 --增强的strstr--24年OD统一考试（Java & JS & Python & C & C++）飞码创造者最新华为OD机试题库2024 华为od java javascript python c语言
文章目录题目描述输入描述输出描述用例题目解析JS算法源码Java算法源码python算法源码题目描述C语言有一个库函数:char*strstr(constchar*haystack,constchar*needle),实现在字符串haystack中查找第一次出现字符串needle的位置，如果未找到则返回null。现要求实现一个strstr的增强函数，可以使用带可选段的字符串来模糊查询，strstr
使用 Python 指定内容爬取百度引擎搜索结果 m0_74825614 python 百度开发语言
在本篇博客中，我将展示如何使用Python编写一个简单的百度搜索爬虫。这个爬虫可以自动化地从百度获取搜索结果，并提取每个结果的标题和链接。我们将使用requests库来发送HTTP请求，使用BeautifulSoup库来解析HTML内容。需求分析在实现爬虫之前，我们需要明确以下需求：通过构建百度搜索的URL来发送搜索请求。解析百度搜索结果页面，提取每个结果的标题和链接。将搜索结果以列表形式返回，方
字符串解析为指定格式 Sun_小杰杰哇工具类 #JavaScript web javascript 前端
将“张三、李四、王五、赵六”解析为“张三、李四...（共4人）”使用：letstr='张三、李四、王五、赵六';empsDeal(str);//'张三、李四...(共4人)'方法：constempsDeal=(emps)=>{console.log("emps",emps);letempsDeal=emps?emps.split(','):[];letempsText='';if(empsDeal
C++软件设计模式之解释器模式捕鲸叉软件设计模式 C++c++设计模式解释器模式
解释器模式的目的和意图解释器模式（InterpreterPattern）是一种行为设计模式，主要用于定义一种语言的文法，并通过该文法解释语言中的句子（表达式）。解释器模式的核心思想是将一个特定的语言表示为其文法规则，并使用该文法规则来解释语言中的句子。目的意图：定义语言的文法：解释器模式的核心目的是定义一种语言的文法规则。通过这些规则，我们可以解析并执行该语言中的表达式。解释语言中的句子：解释器模
统一思想认识永夜-极光思想
1.统一思想认识的基础,才能有的放矢原因: 总有一种描述事物的方式最贴近本质,最容易让人理解. 如何让教育更轻松,在于找到最适合学生的方式. 难点在于,如何模拟对方的思维基础选择合适的方式. &
Joda Time使用笔记 bylijinnan java joda time
Joda Time的介绍可以参考这篇文章： http://www.ibm.com/developerworks/cn/java/j-jodatime.html 工作中也常常用到Joda Time，为了避免每次使用都查API，记录一下常用的用法： /** * DateTime变化（增减） */ @Tes
FileUtils API eksliang FileUtils FileUtils API
转载请出自出处：http://eksliang.iteye.com/blog/2217374 一、概述这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。非常的好用。
各种新兴技术不懂事的小屁孩技术
1:gradle Gradle 是以 Groovy 语言为基础，面向Java应用为主。基于DSL（领域特定语言）语法的自动化构建工具。现在构建系统常用到maven工具，现在有更容易上手的gradle，搭建java环境: http://www.ibm.com/developerworks/cn/opensource/os-cn-gradle/ 搭建android环境： http://m
tomcat6的https双向认证酷的飞上天空 tomcat6
1.生成服务器端证书 keytool -genkey -keyalg RSA -dname "cn=localhost,ou=sango,o=none,l=china,st=beijing,c=cn" -alias server -keypass password -keystore server.jks -storepass password -validity 36
托管虚拟桌面市场势不可挡蓝儿唯美
用户还需要冗余的数据中心，dinCloud的高级副总裁兼首席营销官Ali Din指出。该公司转售一个MSP可以让用户登录并管理和提供服务的用于DaaS的云自动化控制台，提供服务或者MSP也可以自己来控制。在某些情况下，MSP会在dinCloud的云服务上进行服务分层，如监控和补丁管理。 MSP的利润空间将根据其参与的程度而有所不同，Din说。 “我们有一些合作伙伴负责将我们推荐给客户作为个
spring学习——xml文件的配置 a-john spring
在Spring的学习中，对于其xml文件的配置是必不可少的。在Spring的多种装配Bean的方式中，采用XML配置也是最常见的。以下是一个简单的XML配置文件： <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.or
HDU 4342 History repeat itself 模拟 aijuans 模拟
来源：http://acm.hdu.edu.cn/showproblem.php?pid=4342 题意：首先让求第几个非平方数，然后求从1到该数之间的每个sqrt(i)的下取整的和。思路：一个简单的模拟题目，但是由于数据范围大，需要用__int64。我们可以首先把平方数筛选出来，假如让求第n个非平方数的话，看n前面有多少个平方数，假设有x个，则第n个非平方数就是n+x。注意两种特殊情况，即
java中最常用jar包的用途 asia007 java
java中最常用jar包的用途 jar包用途axis.jarSOAP引擎包commons-discovery-0.2.jar用来发现、查找和实现可插入式接口，提供一些一般类实例化、单件的生命周期管理的常用方法.jaxrpc.jarAxis运行所需要的组件包saaj.jar创建到端点的点到点连接的方法、创建并处理SOAP消息和附件的方法，以及接收和处理SOAP错误的方法. w
ajax获取Struts框架中的json编码异常和Struts中的主控制器异常的解决办法百合不是茶 js json编码返回异常
一:ajax获取自定义Struts框架中的json编码出现以下问题: 1,强制flush输出 json编码打印在首页 2, 不强制flush js会解析json 打印出来的是错误的jsp页面却没有跳转到错误页面 3, ajax中的dataType的json 改为text 会
JUnit使用的设计模式 bijian1013 java 设计模式 JUnit
JUnit源代码涉及使用了大量设计模式 1、模板方法模式（Template Method）定义一个操作中的算法骨架，而将一些步骤延伸到子类中去，使得子类可以不改变一个算法的结构，即可重新定义该算法的某些特定步骤。这里需要复用的是算法的结构，也就是步骤，而步骤的实现可以在子类中完成。
Linux常用命令（摘录） sunjing crond chkconfig
chkconfig --list 查看linux所有服务 chkconfig --add servicename 添加linux服务 netstat -apn | grep 8080 查看端口占用 env 查看所有环境变量 echo $JAVA_HOME 查看JAVA_HOME环境变量安装编译器 yum install -y gcc
【Hadoop一】Hadoop伪集群环境搭建 bit1129 hadoop
结合网上多份文档，不断反复的修正hadoop启动和运行过程中出现的问题，终于把Hadoop2.5.2伪分布式安装起来，跑通了wordcount例子。Hadoop的安装复杂性的体现之一是，Hadoop的安装文档非常多，但是能一个文档走下来的少之又少，尤其是Hadoop不同版本的配置差异非常的大。Hadoop2.5.2于前两天发布，但是它的配置跟2.5.0，2.5.1没有分别。 &nb
Anychart图表系列五之事件监听白糖_ chart
创建图表事件监听非常简单：首先是通过addEventListener('监听类型',js监听方法)添加事件监听，然后在js监听方法中定义具体监听逻辑。以钻取操作为例，当用户点击图表某一个point的时候弹出point的name和value，代码如下： <script> //创建AnyChart var chart = new AnyChart(); //添加钻取操作&quo
Web前端相关段子 braveCS web前端
Web标准：结构、样式和行为分离使用语义化标签 0）标签的语义：使用有良好语义的标签，能够很好地实现自我解释，方便搜索引擎理解网页结构，抓取重要内容。去样式后也会根据浏览器的默认样式很好的组织网页内容，具有很好的可读性，从而实现对特殊终端的兼容。 1）div和span是没有语义的：只是分别用作块级元素和行内元素的区域分隔符。当页面内标签无法满足设计需求时，才会适当添加div
编程之美-24点游戏 bylijinnan 编程之美
import java.util.ArrayList; import java.util.Arrays; import java.util.HashSet; import java.util.List; import java.util.Random; import java.util.Set; public class PointGame { /**编程之美
主页面子页面传值总结 chengxuyuancsdn 总结
1、showModalDialog returnValue是javascript中html的window对象的属性,目的是返回窗口值,当用window.showModalDialog函数打开一个IE的模式窗口时,用于返回窗口的值主界面 var sonValue=window.showModalDialog("son.jsp"); 子界面 window.retu
[网络与经济]互联网+的含义 comsci 互联网+
互联网+后面是一个人的名字 = 网络控制系统互联网+你的名字 = 网络个人数据库每日提示:如果人觉得不舒服,千万不要外出到处走动,就呆在床上,玩玩手游,更不能够去开车,现在交通状况不
oracle 创建视图 with check option daizj 视图 view oralce
我们来看下面的例子： create or replace view testview as select empno,ename from emp where ename like ‘M%’ with check option; 这里我们创建了一个视图，并使用了with check option来限制了视图。然后我们来看一下视图包含的结果： select * from testv
ToastPlugin插件在cordova3.3下使用 dibov Cordova
自己开发的Todos应用，想实现“ 再按一次返回键退出程序 ”的功能，采用网上的ToastPlugins插件，发现代码或文章基本都是老版本，运行问题比较多。折腾了好久才弄好。下面吧基于cordova3.3下的ToastPlugins相关代码共享。 ToastPlugin.java package&nbs
C语言22个系统函数 dcj3sjt126com c function
C语言系统函数一、数学函数下列函数存放在math.h头文件中Double floor(double num) 求出不大于num的最大数。Double fmod(x, y) 求整数x/y的余数。Double frexp(num, exp); double num; int *exp; 将num分为数字部分（尾数）x和以2位的指数部分n，即num=x*2n，指数n存放在exp指向的变量中，返回x。D
开发一个类的流程 dcj3sjt126com 开发
本人近日根据自己的开发经验总结了一个类的开发流程。这个流程适用于单独开发的构件，并不适用于对一个项目中的系统对象开发。开发出的类可以存入私人类库，供以后复用。以下是开发流程： 1. 明确类的功能，抽象出类的大概结构 2. 初步设想类的接口 3. 类名设计（驼峰式命名） 4. 属性设置(权限设置) 判断某些变量是否有必要作为成员属
java 并发 shuizhaosi888 java 并发
能够写出高伸缩性的并发是一门艺术在JAVA SE5中新增了3个包 java.util.concurrent java.util.concurrent.atomic java.util.concurrent.locks 在java的内存模型中，类的实例字段、静态字段和构成数组的对象元素都会被多个线程所共享，局部变量与方法参数都是线程私有的，不会被共享。
Spring Security（11）——匿名认证 234390216 Spring Security ROLE_ANNOYMOUS 匿名
匿名认证目录 1.1 配置 1.2 AuthenticationTrustResolver 对于匿名访问的用户，Spring Security支持为其建立一个匿名的AnonymousAuthenticat
NODEJS项目实践0.2[ express,ajax通信...] 逐行分析JS源代码 Ajax nodejs express
一、前言通过上节学习，我们已经 ubuntu系统搭建了一个可以访问的nodejs系统，并做了nginx转发。本节原要做web端服务及 mongodb的存取，但写着写着，web端就
在Struts2 的Action中怎样获取表单提交上来的多个checkbox的值 lhbthanks java html struts checkbox
第一种方法：获取结果String类型在 Action 中获得的是一个 String 型数据，每一个被选中的 checkbox 的 value 被拼接在一起，每个值之间以逗号隔开(,)。所以在 Action 中定义一个跟 checkbox 的 name 同名的属性来接收这些被选中的 checkbox 的 value 即可。以下是实现的代码：前台 HTML 代码：
003.Kafka基本概念 nweiren hadoop kafka
Kafka基本概念：Topic、Partition、Message、Producer、Broker、Consumer。 Topic：消息源（Message）的分类。 Partition： Topic物理上的分组，一
Linux环境下安装JDK roadrunners jdk linux
1、准备工作创建JDK的安装目录： mkdir -p /usr/java/ 下载JDK，找到适合自己系统的JDK版本进行下载： http://www.oracle.com/technetwork/java/javase/downloads/index.html 把JDK安装包下载到/usr/java/目录，然后进行解压： tar -zxvf jre-7
Linux忘记root密码的解决思路 tomcat_oracle linux
1：使用同版本的linux启动系统，chroot到忘记密码的根分区passwd改密码　　2：grub启动菜单中加入init=/bin/bash进入系统，不过这时挂载的是只读分区。根据系统的分区情况进一步判断. 　　3: grub启动菜单中加入 single以单用户进入系统. 　　4:用以上方法mount到根分区把/etc/passwd中的root密码去除　　例如: 　　ro
跨浏览器 HTML5 postMessage 方法以及 message 事件模拟实现 xueyou jsonp jquery 框架 UI html5
postMessage 是 HTML5 新方法，它可以实现跨域窗口之间通讯。到目前为止，只有 IE8+, Firefox 3, Opera 9, Chrome 3和 Safari 4 支持，而本篇文章主要讲述 postMessage 方法与 message 事件跨浏览器实现。postMessage 方法 JSONP 技术不一样，前者是前端擅长跨域文档数据即时通讯，后者擅长针对跨域服务端数据通讯，p

机器学习常用函数解析

机器学习常用函数解析

逻辑回归

from sklearn.preprocessing import StandardScaler

from sklearn.linear_model import LogisticRegression

from imblearn.over_sampling import SMOTE

from sklearn.model_selection import KFold

from sklearn.model_selection import KFold

from sklearn.model_selection import train_test_split

from sklearn.tree import DecisionTreeClassifier

from sklearn.model_selection import GridSearchCV

from sklearn.ensemble import RandomForestClassifier

你可能感兴趣的:(机器学习常用函数解析)