王蒟蒻

机器学习入门项目——加州房价预测

一个项目的完整代码

获取数据

import os
import tarfile # 这个模块解压缩用的
import urllib.request

#获取数据
DOWNLOAD_ROOT = "https://raw.githubusercontent.com/ageron/handson-ml2/master/"
HOUSING_PATH = os.path.join("datasets", "housing")
HOUSING_URL = DOWNLOAD_ROOT + "datasets/housing/housing.tgz"

def fetch_housing_data(housing_url=HOUSING_URL, housing_path=HOUSING_PATH):
    #路径不存在则创建路径
    if not os.path.isdir(housing_path):
        os.makedirs(housing_path)
    tgz_path = os.path.join(housing_path, "housing.tgz")
    
    #将URL表示的网络对象复制到本地文件
    urllib.request.urlretrieve(housing_url, tgz_path) 
    
    #下面是和解压相关的代码
    housing_tgz = tarfile.open(tgz_path) 
    housing_tgz.extractall(path=housing_path)
    housing_tgz.close()

fetch_housing_data()

一些说明
urllib.request.urlretrieve
python tarfile模块基本使用
python路径拼接os.path.join()函数的用法

快速查看数据结构

import pandas as pd

def load_housing_data(housing_path=HOUSING_PATH):
    csv_path = os.path.join(housing_path, "housing.csv")
    return pd.read_csv(csv_path)
housing = load_housing_data()
housing.info()

通过查看数据得知有区域缺失特征值

创建测试集

#对房价中位数这个重要指标进行分层抽样
#pd.cut创建5个不同的收入类别 0-1.5为类别1  1.5-3.0为类别2
import numpy as np
housing["income_cat"] = pd.cut(housing["median_income"],
                               bins=[0., 1.5, 3.0, 4.5, 6., np.inf],
                               labels=[1, 2, 3, 4, 5])

from sklearn.model_selection import StratifiedShuffleSplit

split = StratifiedShuffleSplit(n_splits=1, test_size=0.2, random_state=42)

#这个返回的是分组后数在原数组中的索引
#该for循环只执行一次
for train_index, test_index in split.split(housing, housing["income_cat"]):
    strat_train_set = housing.loc[train_index]
    strat_test_set = housing.loc[test_index]

#income_cat只是临时用于创建测试集，完了要删除，恢复原数据
for set_ in (strat_train_set, strat_test_set):
    set_.drop("income_cat", axis=1, inplace=True)

数据准备

要预测的是房价中位数，所以训练的数据需要将房价中位数除去，房价中位数作为标签以验证结果

housing = strat_train_set.drop("median_house_value", axis=1) # drop labels for training set
housing_labels = strat_train_set["median_house_value"].copy()

处理缺失值

大部分机器学习无法在缺失的特征上工作，所以我们要处理缺失值

from sklearn.impute import SimpleImputer
imputer = SimpleImputer(strategy="median")

#用中位数填充的话，文本属性值要去掉
housing_num = housing.drop("ocean_proximity", axis=1)
#fit()这步就是将imputer实例适配到训练数据
#它计算了每个属性的中位值，并将结果存储在其实例变量中
imputer.fit(housing_num)

#这步才是真正将缺失值替换成中位数值
#完成训练集的转换，但X的结果是数组
X = imputer.transform(housing_num)

#重新生成dataframe格式
housing_tr = pd.DataFrame(X, columns=housing_num.columns,
                          index=housing_num.index)

处理文本属性

对于机器学习来说，数字比文本更加好处理
ocean_proximity这个属性的文本是有限个可能的取值，而不是任意文本

采用独热编码

housing_cat = housing[["ocean_proximity"]]
from sklearn.preprocessing import OneHotEncoder

cat_encoder = OneHotEncoder()
housing_cat_1hot = cat_encoder.fit_transform(housing_cat)

自定义转换器

属性组合可以达到更好的效果，将组合后的属性添加进去
注意这里的array知识

from sklearn.base import BaseEstimator, TransformerMixin

# column index
rooms_ix, bedrooms_ix, population_ix, households_ix = 3, 4, 5, 6

class CombinedAttributesAdder(BaseEstimator, TransformerMixin):
    def __init__(self, add_bedrooms_per_room=True): # no *args or **kargs
        self.add_bedrooms_per_room = add_bedrooms_per_room
    def fit(self, X, y=None):
        return self  # nothing else to do
    def transform(self, X):
        rooms_per_household = X[:, rooms_ix] / X[:, households_ix]
        population_per_household = X[:, population_ix] / X[:, households_ix]
        if self.add_bedrooms_per_room:
            bedrooms_per_room = X[:, bedrooms_ix] / X[:, rooms_ix]
            return np.c_[X, rooms_per_household, population_per_household,
                         bedrooms_per_room]
        else:
            return np.c_[X, rooms_per_household, population_per_household]

attr_adder = CombinedAttributesAdder(add_bedrooms_per_room=False)
housing_extra_attribs = attr_adder.transform(housing.values)

最终代码
这里使用转换流水线，将前面的转换合在一起，并多了特征缩放
list用法：pandas 几种获取dataframe列名的方式

from sklearn.pipeline import Pipeline
from sklearn.preprocessing import StandardScaler
from sklearn.compose import ColumnTransformer

#这些都必须有fit_transform（）方法
num_pipeline = Pipeline([
        ('imputer', SimpleImputer(strategy="median")),
        ('attribs_adder', CombinedAttributesAdder()),
        ('std_scaler', StandardScaler()),
    ])

#升级为能够处理所有列的转换器
#list说明
num_attribs = list(housing_num)
cat_attribs = ["ocean_proximity"]

full_pipeline = ColumnTransformer([
        ("num", num_pipeline, num_attribs),
        ("cat", OneHotEncoder(), cat_attribs),
    ])

housing_prepared = full_pipeline.fit_transform(housing)

训练模型

def display_scores(scores):
    print("Scores:", scores)
    print("Mean:", scores.mean())
    print("Standard deviation:", scores.std())

使用线性模型模型

from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error

lin_reg = LinearRegression()
lin_reg.fit(housing_prepared, housing_labels)

housing_predictions = lin_reg.predict(housing_prepared)
lin_mse = mean_squared_error(housing_labels, housing_predictions)
lin_rmse = np.sqrt(lin_mse)
lin_rmse

结果

使用决策树模型

from sklearn.tree import DecisionTreeRegressor

tree_reg = DecisionTreeRegressor(random_state=42)
tree_reg.fit(housing_prepared, housing_labels)

housing_predictions = tree_reg.predict(housing_prepared)
tree_mse = mean_squared_error(housing_labels, housing_predictions)
tree_rmse = np.sqrt(tree_mse)
tree_rmse

结果为

使用随机森林模型

from sklearn.ensemble import RandomForestRegressor

forest_reg = RandomForestRegressor(n_estimators=100, random_state=42)
forest_reg.fit(housing_prepared, housing_labels)
housing_predictions = forest_reg.predict(housing_prepared)
forest_mse = mean_squared_error(housing_labels, housing_predictions)
forest_rmse = np.sqrt(forest_mse)
forest_rmse

结果

似乎是决策树最好

为了更好的进行评估，我们采用交叉验证
对线性模型进行交叉验证

from sklearn.model_selection import cross_val_score
lin_scores = cross_val_score(lin_reg, housing_prepared, housing_labels,
                             scoring="neg_mean_squared_error", cv=10)
lin_rmse_scores = np.sqrt(-lin_scores)
display_scores(lin_rmse_scores)

评估结果：

对决策树进行交叉验证

from sklearn.model_selection import cross_val_score

scores = cross_val_score(tree_reg, housing_prepared, housing_labels,
                         scoring="neg_mean_squared_error", cv=10)
tree_rmse_scores = np.sqrt(-scores)
display_scores(tree_rmse_scores)

结果

对随机森林进行交叉验证

from sklearn.model_selection import cross_val_score

forest_scores = cross_val_score(forest_reg, housing_prepared, housing_labels,
                                scoring="neg_mean_squared_error", cv=10)
forest_rmse_scores = np.sqrt(-forest_scores)
display_scores(forest_rmse_scores)

结果

微调模型

从上面看来，使用随机森林效果比较好，接下来我们对随机森林进行微调
就是尝试大量的组合

from sklearn.model_selection import GridSearchCV

param_grid = [
    # try 12 (3×4) combinations of hyperparameters
    {'n_estimators': [3, 10, 30], 'max_features': [2, 4, 6, 8]},
    # then try 6 (2×3) combinations with bootstrap set as False
    {'bootstrap': [False], 'n_estimators': [3, 10], 'max_features': [2, 3, 4]},
  ]

forest_reg = RandomForestRegressor(random_state=42)
# train across 5 folds, that's a total of (12+6)*5=90 rounds of training 
grid_search = GridSearchCV(forest_reg, param_grid, cv=5,
                           scoring='neg_mean_squared_error',
                           return_train_score=True)
grid_search.fit(housing_prepared, housing_labels)

#找出最佳的组合
grid_search.best_estimator_

结果为：

参看分数

cvres = grid_search.cv_results_
for mean_score, params in zip(cvres["mean_test_score"], cvres["params"]):
    print(np.sqrt(-mean_score), params)

结果为：
最佳模型的评分为 49682 比默认参数的评分50182好

至此找到最佳模型了

分析最佳模型及其误差

#得出一组关于每个属性相对重要程度的数值
feature_importances = grid_search.best_estimator_.feature_importances_

#之前额外加进去的属性
extra_attribs = ["rooms_per_hhold", "pop_per_hhold", "bedrooms_per_room"]
#获取独热编码转换器
cat_encoder = full_pipeline.named_transformers_["cat"]
#获取独热编码的属性，注意独热编码里面的文本值现在作为了属性名
cat_one_hot_attribs = list(cat_encoder.categories_[0])
attributes = num_attribs + extra_attribs + cat_one_hot_attribs
sorted(zip(feature_importances, attributes), reverse=True)

sort 排序

结果：

用测试集评估系统

经过前面的训练，你找到了最佳模型，现在可以用测试集评估最终模型

final_model = grid_search.best_estimator_

X_test = strat_test_set.drop("median_house_value", axis=1)
y_test = strat_test_set["median_house_value"].copy()

X_test_prepared = full_pipeline.transform(X_test)
final_predictions = final_model.predict(X_test_prepared)

final_mse = mean_squared_error(y_test, final_predictions)
final_rmse = np.sqrt(final_mse)

final_rmse

最终结果为

如果想知道计算泛化误差的95%置信区间

from scipy import stats

confidence = 0.95
squared_errors = (final_predictions - y_test) ** 2
np.sqrt(stats.t.interval(confidence, len(squared_errors) - 1,
                         loc=squared_errors.mean(),
                         scale=stats.sem(squared_errors)))

其他尝试

尝试支持向量机超参数

from sklearn.model_selection import GridSearchCV

param_grid = [
        {'kernel': ['linear'], 'C': [10., 30., 100., 300., 1000., 3000., 10000., 30000.0]},
        {'kernel': ['rbf'], 'C': [1.0, 3.0, 10., 30., 100., 300., 1000.0],
         'gamma': [0.01, 0.03, 0.1, 0.3, 1.0, 3.0]},
    ]

svm_reg = SVR()
grid_search = GridSearchCV(svm_reg, param_grid, cv=5, scoring='neg_mean_squared_error', verbose=2)
grid_search.fit(housing_prepared, housing_labels)

grid_search.best_params_

到这里，我们已经确定了模型的参数，然后还要将全部数据放入这个参数已经确定的模型中重新进行训练

将网格搜索改为随机搜索

from sklearn.model_selection import RandomizedSearchCV
from scipy.stats import randint

param_distribs = {
        'n_estimators': randint(low=1, high=200),
        'max_features': randint(low=1, high=8),
    }

forest_reg = RandomForestRegressor(random_state=42)
rnd_search = RandomizedSearchCV(forest_reg, param_distributions=param_distribs,
                                n_iter=10, cv=5, scoring='neg_mean_squared_error', random_state=42)
rnd_search.fit(housing_prepared, housing_labels)

查看结果

cvres = rnd_search.cv_results_
for mean_score, params in zip(cvres["mean_test_score"], cvres["params"]):
    print(np.sqrt(-mean_score), params)

如果是对上个问题的支持向量机应用

from sklearn.model_selection import RandomizedSearchCV
from scipy.stats import expon, reciprocal

# see https://docs.scipy.org/doc/scipy/reference/stats.html
# for `expon()` and `reciprocal()` documentation and more probability distribution functions.

# Note: gamma is ignored when kernel is "linear"
param_distribs = {
        'kernel': ['linear', 'rbf'],
        'C': reciprocal(20, 200000),
        'gamma': expon(scale=1.0),
    }

svm_reg = SVR()
rnd_search = RandomizedSearchCV(svm_reg, param_distributions=param_distribs,
                                n_iter=50, cv=5, scoring='neg_mean_squared_error',
                                verbose=2, random_state=42)
rnd_search.fit(housing_prepared, housing_labels)

创建一个覆盖完整的数据准备和最终预测的流水线

full_pipeline_with_predictor = Pipeline([
        ("preparation", full_pipeline),
        ("linear", LinearRegression())
    ])

full_pipeline_with_predictor.fit(housing, housing_labels)
full_pipeline_with_predictor.predict(some_data)

添加一个转化器，只选出最重要的属性

from sklearn.base import BaseEstimator, TransformerMixin

#选出最大的几个数，返回列名
def indices_of_top_k(arr, k):
    return np.sort(np.argpartition(np.array(arr), -k)[-k:])

class TopFeatureSelector(BaseEstimator, TransformerMixin):
    def __init__(self, feature_importances, k):
        self.feature_importances = feature_importances
        self.k = k
    def fit(self, X, y=None):
        self.feature_indices_ = indices_of_top_k(self.feature_importances, self.k)
        return self
    def transform(self, X):
        return X[:, self.feature_indices_]

preparation_and_feature_selection_pipeline = Pipeline([
    ('preparation', full_pipeline),
    ('feature_selection', TopFeatureSelector(feature_importances, k))
])

housing_prepared_top_k_features = preparation_and_feature_selection_pipeline.fit_transform(housing)

numpy中的argpartition

2024华为OD机试真题-免单统计(C++/Java/Python)-E卷-100分 2024剑指offer 华为od c++python java
2024华为OD机试题库-(E卷+C卷+D卷)-(JAVA、Python、C++)目录题目描述输入描述输出描述用例1用例2用例3考点题目解析代码c++javapython题目描述华为商城举办了一个促销活动，如果某顾客是某一秒内最早时刻下单的顾客（可能是多个人），则可以获取免单。请你编程计算有多少顾客可以获取免单。输入描述输入为n行数据，每一行表示一位顾客的下单时间以（年-月-日时-分-秒.毫秒）形
win11编译llama_cpp_python cuda128 RTX30/40/50版本 System_sleep llama python windows cuda
Geforce50xx系显卡最低支持cuda128，llama_cpp_python官方源只有cpu版本，没有cuda版本，所以自己基于0.3.5版本源码编译一个RTX30xx/40xx/50xx版本。1.前置条件1.访问https://developer.download.nvidia.cn/compute/cuda/12.8.0/local_installers/cuda_12.8.0_571
AIGC实战——Transformer模型盼小辉丶 AIGC transformer 深度学习
AIGC实战——Transformer模型0.前言1.T52.GPT-3和GPT-43.ChatGPT小结系列链接0.前言我们在GPT(GenerativePre-trainedTransformer)一节所构建的GPT模型是一个解码器Transformer，它逐字符地生成文本字符串，并使用因果掩码只关注输入字符串中的前一个单词。另一些编码器Transformer，不使用因果掩码，而是关注整个输入
基于Python的CATIA V5二次开发实战：工程图视图批量重链接技术解析 Python×CATIA工业智造 python 开发语言 pycharm CATIA二次开发
引言在汽车、航空航天等制造领域，CATIAV5作为核心的CAD设计平台，其工程图模块的自动化处理能力直接影响设计效率。本文针对工程图视图与三维模型断链的常见问题，深入解析基于pycatia的二次开发解决方案，提供一套可批量重链接视图的Python实现代码。该方案已通过实际项目验证，支持CATIAR2020x~R2023x版本，可提升85%以上的视图维护效率。功能概述本工具核心功能为工程图视图的批量
CATIA V5 二次开发实战：Python实现零件实体智能转产品装配 Python×CATIA工业智造 python pycharm 自动化 CATIA二次开发
引言在汽车、航空等制造行业中，CATIAV5因其强大的参数化建模能力被广泛应用。当面对包含多个独立几何体的零件文档（.CATPart）时，工程师常需将其转为产品文档（.CATProduct）以实现装配管理。本文将通过Python+pycatia库，实现自动化批量转换，提升10倍工作效率。功能概述核心功能：自动遍历零件文档中的实体，将其转换为产品文档中的独立零件组件技术亮点：基于CATIACOM接口
基于Python的微博舆情分析与可视化系统【附源码】 AI博士小张 python 数据分析数据库
基于Python的微博舆情分析与可视化系统摘要研究背景及意义一、数据流程总体架构二、详细处理流程与代码实现1.数据采集模块2.数据清洗与预处理3.情感分析与特征工程4.舆情分析模型5.可视化呈现三、性能优化要点摘要基于Python的微博舆情分析与可视化系统旨在利用大数据和自然语言处理技术，实时抓取、分析微博平台上的用户言论，并通过可视化手段揭示舆情的动态演变规律。系统采用Python技术栈，结合网
《DeepSeek-V3：动态温度调节算法，开启推理新境界！》人工智能深度学习
在人工智能领域不断探索的征程中，DeepSeek-V3以其卓越的创新技术，尤其是动态温度调节算法，成为了备受瞩目的焦点。这项算法犹如一把神奇的钥匙，巧妙地开启了推理速度与精度动态平衡的大门，为大语言模型的发展开辟了新的道路。温度，在大语言模型的世界里，是一个极为关键的参数，它掌控着模型输出的随机性。这一概念，脱胎于热力学，却在人工智能的领域中被赋予了全新的使命。当温度较低时，模型倾向于选择高概率词
颠覆认知！C++ RAII 竟然是这样实现资源自动管理的！ c++后端
大家好，我是小康。今天我们来聊下C++的一个神器魔法—RAII。前言：如果你刚刚学完C++的内存管理，可能已经对new和delete有了点了解。你一定已经意识到，内存管理就像一场没有规则的游戏，你得时刻警惕，不然就可能掉进内存泄漏的陷阱里。那么，问题来了，能不能有一种方法，让资源管理变得简单又安全？答案是：RAII！它就像是C++的“魔法钥匙”，一旦掌握，你的代码将变得又干净又优雅。但别急，这不是
基于PySide6的CATIA零件自动化着色工具开发实践 Python×CATIA工业智造自动化运维 python pycharm
引言在汽车及航空制造领域，CATIA作为核心的CAD设计软件，其二次开发能力对提升设计效率具有重要意义。本文介绍一种基于Python的CATIA零件着色工具开发方案，通过PySide6实现GUI交互，结合COM接口操作实现零件着色自动化。该方案成功解决了传统手动操作效率低下等问题，可提升90%以上的色彩管理效率。一、工具实现原理1.1技术架构本工具采用分层架构设计，包含：交互层：基于PySide6
测试中，哪些地方可以有效的利用deepseek 海姐软件测试测试工具
在软件测试全生命周期中，以下10个关键环节可高效利用DeepSeek实现智能化升级，每个场景均附带典型应用示例：---###一、需求分析阶段1.**需求漏洞挖掘**```python#输入PRD文档检测逻辑漏洞vulnerabilities=deepseek.detect_ambiguity(prd_text)#输出：发现未定义密码复杂度规则、缺少登录会话超时说明```2.**测试点自动提取**`
Python绘制表白代码，又是一个表白神器（赠源码，文章内有效果展示）「已注销」 python python 开发语言
前言嗨呀，又是我，又给你们带来了表白的代码之前发了那些照片里面加文字的…还有烟花…还有跳动爱心…emm你们也可以去看看哦今天带来的这个，也是很不错哦只不过它出来的有些慢，我这里先给你们看看这个效果图吧效果展示这里事先声明一下这里的文字数字还有那个Python都是可以自己改的数字的画，你们是可以改成自己想说的五句话爱心内的就可以是两个人的名字咯代码实现okok。话不多说马上开始导入模块所有源码点击此
白盒测试基础知识-辅助理解 Ben_F 系统架构功能测试
类别详细内容定义白盒测试（WhiteBoxTesting）是一种基于代码内部结构和逻辑的测试方法，测试人员需要了解程序的内部实现细节。别名结构测试、透明盒测试、玻璃盒测试、逻辑驱动测试测试对象程序的源代码、内部结构、逻辑路径、控制流、数据流等测试目标验证代码的正确性、逻辑覆盖、路径覆盖、边界条件等主要技术-语句覆盖：确保每条语句至少执行一次。-分支覆盖：确保每个分支（如if-else）至少执行一次
Python 中自动打开网页并点击[自动化脚本],Selenium Ben_F Python python 自动化 selenium
要在Python中自动打开网页并点击第一个标签，你需要使用Selenium，它可以控制浏览器并执行像点击这样的操作。requests和BeautifulSoup只能获取并解析网页内容，但不能进行网页交互操作。步骤：安装Selenium安装WebDriver（例如ChromeDriver）编写代码来自动点击网页的第一个标签1.安装Selenium使用pip安装Selenium：pipinstalls
ABP框架综合示例代码及消息队列(MQ)集成教程 KX-EZ
本文还有配套的精品资源，点击获取简介：ABP框架是一个基于.NET的企业级应用程序开发框架，它集成了领域驱动设计、模块化、分层架构、依赖注入、CQRS、事件溯源等最佳实践。本教程包含所有ABP核心功能和模块的示例代码，展示如何利用ABP开发不同类型的项目，并详细讲解了ABP支持的消息队列（如RabbitMQ）的集成方法。开发者可以利用这些示例深入学习ABP的使用和扩展，从而在构建企业级应用程序时提
Python 自动化探索性数据分析（EDA）工具东方佑量子变法 python 自动化数据分析
1.PandasProfiling功能特点：自动生成详细的统计报告，包含数据概览、单变量分析、相关性矩阵、缺失值分析等。支持交互式HTML报告，可导出为PDF或其他格式。适合快速生成数据集的全面摘要。使用示例：importpandasaspdfrompandas_profilingimportProfileReportdf=pd.read_csv("data.csv")profile=Profil
chatgpt赋能python：Python生成噪声：让你的声音不再单调无味 test100t ChatGpt python chatgpt numpy 计算机
Python生成噪声：让你的声音不再单调无味如果你的项目需要制作音效或者游戏开发，你可能需要一些噪声来为场景增添真实感。而在Python中，生成各种形态的噪声将会变得非常容易。这篇文章将会探讨Python中如何生成多种类型的噪声，并且如何利用它们来让你的项目变得更加动态和生动。什么是噪声在音效和图形处理中，噪声是一种随机产生的信号，通常被用来模拟自然事件中的随机变化。在图像处理中，噪声常常被用来为
大数据实战：Spark + Hive 逐笔计算用户盈亏 WuJiWeb3 区块链链上数据分析从0到1搭建区块链大数据平台 spark hive 大数据 web3 区块链 hadoop
简介本文将通过使用Spark+Hive实现逐笔计算区块链上用户交易数据的盈亏需求。由于我们是进行离线计算，所以我们的数据源是Hive表数据，Sink表也是Hive表，即Spark读取Hive表数据进行批计算之后写回到Hive表并供后续使用。通过本文你将会学到：如何使用SparkSQLAPI读取Hive数据源如何通过读取配置文件进行传参执行SQL如何将SparkSQL转换为JavaRDD进行处理如何
Flink 实战：如何计算实时热门合约 WuJiWeb3 区块链链上数据分析 flink 大数据 web3 数据分析智能合约 kafka big data
本文将通过使用Flink框架实现实时热门合约需求。实际业务过程中，如何判断合约是否属于热门合约，可以从以下几个方面进行分析，比如：交易数量：合约被调用的次数可以作为其热门程度的指标之一。交易金额：合约处理的资金量也是评判热门程度的重要指标。活跃用户数量：调用合约的用户数量可以反映合约的受欢迎程度。交易频率：合约的调用频率可以反映其热门程度和使用情况。但我们本次目的主要是关于学习FlinkAPI的一
Vscode编辑器：解读文件结构、插件的导入导出、常用快捷键&配置技巧及其常见问题的解决方案我是苏苏前端编辑器 vscode ide
一、文件与文件夹结构1.文件结构文件名作用.babelrc配置Babel编译选项，指定代码转译规则。.editorconfig定义项目代码格式规范，如缩进风格和空格数量等。.eslintignore列出ESLint忽略的文件或文件夹。.eslintrc.js配置ESLint的规则和插件。.gitignore列出Git忽略的文件或文件夹。.postcssrc.js配置PostCSS插件和选项。ind
2022IJCAI速读：SparseTT，使用稀疏Transformers进行视觉跟踪夜深人静打代码目标检测跟踪论文速读专栏视觉跟踪计算机视觉目标检测人工智能
原文标题：SparseTT:VisualTrackingwithSparseTransformers中文标题：SparseTT：使用稀疏Transformers进行视觉跟踪代码地址：GitHub-fzh0917/SparseTT:Theofficialimplementationforpaper"SparseTT:VisualTrackingwithSparseTransformers"具体见：2
python之匿名函数 mumux183 python python 开发语言
有没有想过定义一个很短的回调函数，但又不想用def的形式去写一个那么长的函数，那么有没有快捷方式呢？答案是有的。python使用lambda来创建匿名函数，也就是不再使用def语句这样标准的形式定义一个函数。匿名函数主要有以下特点：lambda只是一个表达式，函数体比def简单很多。lambda的主体是一个表达式，而不是一个代码块。仅仅能在lambda表达式中封装有限的逻辑进去。lambda函数拥
python之迭代 mumux183 python #基础 python 开发语言
什么叫做迭代？比如在Java中，我们通过List集合的下标来遍历List集合中的元素，在Python中，给定一个list或tuple，我们可以通过for循环来遍历这个list或tuple，这种遍历就是迭代。可是，Python的for循环抽象程度要高于Java的for循环的，为什么这么说呢？因为Python的for循环不仅可以用在list或tuple上，还可以作用在其他可迭代对象上。也就是说，只要是
推荐项目：Python中的高性能Perlin噪声库——`noise` 毛彤影
推荐项目：Python中的高性能Perlin噪声库——noise项目地址:https://gitcode.com/gh_mirrors/nois/noise1、项目介绍在Python编程中寻找一种简单且快速的方法来生成Perlin噪声吗？那么noise库就是你的理想之选。这个开源项目由CaseyDuncan开发，提供了一个强大的工具集，用于在Python程序中轻松实现Perlin噪声的生成，适用于
性能测试详解（一）概述小高写BUG 性能测试与分析压力测试前端运维
文章目录性能测试详解（一）概述1.性能测试基础2.性能测试主要指标3.性能需求分析4.性能场景设计5.性能测试监控6.性能的分析与调优7.持续集成8.项目性能测试综合实战性能测试详解（一）概述1.性能测试基础结合实际应用对性能测试中所关联的所有性能理论知识进行详细讲解。性能测试的发展史性能测试的概念性能测试的分类性能测试的目的性能瓶颈的测试的测试方法性能测试的准入准出条件性能测试的流程为什么需要性
核函数及其常见类型 Shockang 机器学习数学通关指南机器学习人工智能数学线性代数概率统计
前言本文隶属于专栏《机器学习数学通关指南》，该专栏为笔者原创，引用请注明来源，不足和错误之处请在评论区帮忙指出，谢谢！本专栏目录结构和参考文献请见《机器学习数学通关指南》正文核心概念核函数（KernelFunction）是机器学习中处理非线性可分数据的关键工具。它的核心思想是隐式映射：通过将数据从原始低维空间映射到高维空间，使得在高维空间中线性可分，从而无需显式计算高维映射，仅需在低维空间高效计算
接口自动化如何封装mysql操作天才测试猿 mysql python 软件测试测试工具测试用例自动化测试数据库
数据查询类封装1.功能分析可以连接不同sql数据库查一条数据，多条数据可以获取不同格式的数据2.封装成数据库查询类封装思路:数据库查询模块有多个功能，且需要复用，所以封装成类创建对象方法实现各种查询在构造方法中创建连接废话不多说，直接上代码！！！#-*-coding:utf-8-*-#@Time:2019/11/1314:51#@Author:kira#@Email:262667641@qq.co
软件测试基础详解天才测试猿 python 测试工具测试用例功能测试软件测试自动化测试职场和发展
1、黑盒测试、白盒测试、灰盒测试1.1黑盒测试黑盒测试又叫功能测试、数据驱动测试或基于需求规格说明书的功能测试。该类测试注重于测试软件的功能性需求。采用这种测试方法，测试工程师把测试对象看作一个黑盒子，完全不考虑程序内部的逻辑结构和内部特性，只依据程序的《需求规格说明书》，检查程序的功能是否符合它的功能说明。测试工程师无需了解程序代码的内部构造，完全模拟软件产品的最终用户使用该软件，检查软件产品是
用python实现烟花代码，完整代码拿走不谢 mumux183 知识沉淀 python #基础 python pygame 开发语言
有时候用python实现一些有趣的代码，既有趣，又能提升知识使用Python实现动态烟花代码效果如下：不废话，直接上代码：importpygamefromrandomimportrandint,uniform,choiceimportmathvector=pygame.math.Vector2gravity=vector(0,0.3)DISPLAY_WIDTH=DISPLAY_HEIGHT=800
Python构建基于协同过滤的推荐系统：从理论到实践清水白石008 python Python题库 python 开发语言
构建基于协同过滤的推荐系统：从理论到实践推荐系统在现代应用中无处不在，从电商平台的商品推荐到流媒体服务的内容推荐，推荐系统极大地提升了用户体验。本文将详细介绍如何使用Python构建一个基于协同过滤算法的推荐系统，内容涵盖理论基础、数据处理、算法实现以及实际应用。一、推荐系统概述推荐系统主要分为三类：基于内容的推荐、基于协同过滤的推荐和混合推荐系统。本文重点介绍基于协同过滤的推荐系统。协同过滤（C
C语言单链表头插法小猿_00 C语言入门到超神数据结构 c语言开发语言
文章目录一.单链表二.头插法三.具体实现过程全部代码一.单链表什么是单链表？想象一串珍珠项链，每颗珍珠（节点）包含：数据域：存放具体数据（如数字、字符串）指针域：一根「看不见的线」指向下一颗珍珠二.头插法通俗理解单链表的「头插法」：像给火车加车厢一样简单链表是数据结构中的「珍珠项链」，而头插法就是其中最常用的「穿珠手法」。用生活中的例子来理解：头插法就像在火车最前面加车厢，每次新节点都成为新的车头
xml解析小猪猪08 xml
1、DOM解析的步奏准备工作： 1.创建DocumentBuilderFactory的对象 2.创建DocumentBuilder对象 3.通过DocumentBuilder对象的parse(String fileName)方法解析xml文件 4.通过Document的getElem
每个开发人员都需要了解的一个SQL技巧 brotherlamp linux linux视频 linux教程 linux自学 linux资料
对于数据过滤而言CHECK约束已经算是相当不错了。然而它仍存在一些缺陷，比如说它们是应用到表上面的，但有的时候你可能希望指定一条约束，而它只在特定条件下才生效。使用SQL标准的WITH CHECK OPTION子句就能完成这点，至少Oracle和SQL Server都实现了这个功能。下面是实现方式： CREATE TABLE books ( id &
Quartz——CronTrigger触发器 eksliang quartz CronTrigger
转载请出自出处：http://eksliang.iteye.com/blog/2208295 一.概述 CronTrigger 能够提供比 SimpleTrigger 更有具体实际意义的调度方案，调度规则基于 Cron 表达式，CronTrigger 支持日历相关的重复时间间隔（比如每月第一个周一执行），而不是简单的周期时间间隔。二.Cron表达式介绍 1）Cron表达式规则表 Quartz
Informatica基础 18289753290 Informatica Monitor manager workflow Designer
1. 1）PowerCenter Designer：设计开发环境，定义源及目标数据结构；设计转换规则，生成ETL映射。 2）Workflow Manager：合理地实现复杂的ETL工作流，基于时间，事件的作业调度 3）Workflow Monitor：监控Workflow和Session运行情况，生成日志和报告 4）Repository Manager：
linux下为程序创建启动和关闭的的sh文件，scrapyd为例酷的飞上天空 scrapy
对于一些未提供service管理的程序每次启动和关闭都要加上全部路径，想到可以做一个简单的启动和关闭控制的文件下面以scrapy启动server为例，文件名为run.sh： #端口号，根据此端口号确定PID PORT=6800 #启动命令所在目录 HOME='/home/jmscra/scrapy/' #查询出监听了PORT端口
人--自私与无私永夜-极光
今天上毛概课,老师提出一个问题--人是自私的还是无私的,根源是什么? 从客观的角度来看,人有自私的行为,也有无私的
Ubuntu安装NS-3 环境脚本随便小屋 ubuntu
将附件下载下来之后解压，将解压后的文件ns3environment.sh复制到下载目录下（其实放在哪里都可以，就是为了和我下面的命令相统一）。输入命令： sudo ./ns3environment.sh >>result 这样系统就自动安装ns3的环境，运行的结果在result文件中，如果提示 com
创业的简单感受 aijuans 创业的简单感受
2009年11月9日我进入a公司实习，2012年4月26日，我离开a公司，开始自己的创业之旅。今天是2012年5月30日，我忽然很想谈谈自己创业一个月的感受。当初离开边锋时，我就对自己说：“自己选择的路，就是跪着也要把他走完”，我也做好了心理准备，准备迎接一次次的困难。我这次走出来，不管成败
如何经营自己的独立人脉 aoyouzi 如何经营自己的独立人脉
独立人脉不是父母、亲戚的人脉，而是自己主动投入构造的人脉圈。“放长线，钓大鱼”，先行投入才能产生后续产出。现在几乎做所有的事情都需要人脉。以银行柜员为例，需要拉储户，而其本质就是社会人脉，就是社交！很多人都说，人脉我不行，因为我爸不行、我妈不行、我姨不行、我舅不行……我谁谁谁都不行，怎么能建立人脉？我这里说的人脉，是你的独立人脉。以一个普通的银行柜员
JSP基础百合不是茶 jsp 注释隐式对象
1,JSP语句的声明 <%! 声明 %> 　　声明：这个就是提供java代码声明变量、方法等的场所。表达式 <%= 表达式 %> 　　这个相当于赋值，可以在页面上显示表达式的结果，程序代码段/小型指令　<% 程序代码片段 %> 2,JSP的注释
web.xml之session-config、mime-mapping bijian1013 java web.xml servlet session-config mime-mapping
session-config 1.定义： <session-config> <session-timeout>20</session-timeout> </session-config> 2.作用：用于定义整个WEB站点session的有效期限，单位是分钟。 mime-mapping 1.定义： <mime-m
互联网开放平台（1） Bill_chen 互联网 qq 新浪微博百度腾讯
现在各互联网公司都推出了自己的开放平台供用户创造自己的应用，互联网的开放技术欣欣向荣，自己总结如下： 1.淘宝开放平台(TOP) 网址：http://open.taobao.com/ 依赖淘宝强大的电子商务数据，将淘宝内部业务数据作为API开放出去，同时将外部ISV的应用引入进来。目前TOP的三条主线： TOP访问网站：open.taobao.com ISV后台：my.open.ta
【MongoDB学习笔记九】MongoDB索引 bit1129 mongodb
索引可以在任意列上建立索引索引的构造和使用与传统关系型数据库几乎一样,适用于Oracle的索引优化技巧也适用于Mongodb 使用索引可以加快查询,但同时会降低修改,插入等的性能内嵌文档照样可以建立使用索引测试数据 var p1 = { "name":"Jack", "age&q
JDBC常用API之外的总结白糖_ jdbc
做JAVA的人玩JDBC肯定已经很熟练了，像DriverManager、Connection、ResultSet、Statement这些基本类大家肯定很常用啦，我不赘述那些诸如注册JDBC驱动、创建连接、获取数据集的API了，在这我介绍一些写框架时常用的API，大家共同学习吧。 ResultSetMetaData获取ResultSet对象的元数据信息
apache VelocityEngine使用记录 bozch VelocityEngine
VelocityEngine是一个模板引擎，能够基于模板生成指定的文件代码。使用方法如下： VelocityEngine engine = new VelocityEngine();// 定义模板引擎 Properties properties = new Properties();// 模板引擎属
编程之美-快速找出故障机器 bylijinnan 编程之美
package beautyOfCoding; import java.util.Arrays; public class TheLostID { /*编程之美假设一个机器仅存储一个标号为ID的记录，假设机器总量在10亿以下且ID是小于10亿的整数，假设每份数据保存两个备份，这样就有两个机器存储了同样的数据。 1.假设在某个时间得到一个数据文件ID的列表，是
关于Java中redirect与forward的区别 chenbowen00 java servlet
在Servlet中两种实现： forward方式：request.getRequestDispatcher(“/somePage.jsp”).forward(request, response); redirect方式：response.sendRedirect(“/somePage.jsp”); forward是服务器内部重定向，程序收到请求后重新定向到另一个程序，客户机并不知
[信号与系统]人体最关键的两个信号节点 comsci 系统
如果把人体看做是一个带生物磁场的导体,那么这个导体有两个很重要的节点,第一个在头部,中医的名称叫做百汇穴, 另外一个节点在腰部,中医的名称叫做命门如果要保护自己的脑部磁场不受到外界有害信号的攻击,最简单的
oracle 存储过程执行权限 daizj oracle 存储过程权限执行者调用者
在数据库系统中存储过程是必不可少的利器，存储过程是预先编译好的为实现一个复杂功能的一段Sql语句集合。它的优点我就不多说了，说一下我碰到的问题吧。我在项目开发的过程中需要用存储过程来实现一个功能，其中涉及到判断一张表是否已经建立，没有建立就由存储过程来建立这张表。 CREATE OR REPLACE PROCEDURE TestProc IS fla
为mysql数据库建立索引 dengkane mysql 性能索引
前些时候，一位颇高级的程序员居然问我什么叫做索引，令我感到十分的惊奇，我想这绝不会是沧海一粟，因为有成千上万的开发者（可能大部分是使用MySQL的）都没有受过有关数据库的正规培训，尽管他们都为客户做过一些开发，但却对如何为数据库建立适当的索引所知较少，因此我起了写一篇相关文章的念头。最普通的情况，是为出现在where子句的字段建一个索引。为方便讲述，我们先建立一个如下的表。
学习C语言常见误区如何看懂一个程序如何掌握一个程序以及几个小题目示例 dcj3sjt126com c 算法
如果看懂一个程序，分三步 1、流程 2、每个语句的功能 3、试数如何学习一些小算法的程序尝试自己去编程解决它，大部分人都自己无法解决如果解决不了就看答案关键是把答案看懂，这个是要花很大的精力，也是我们学习的重点看懂之后尝试自己去修改程序，并且知道修改之后程序的不同输出结果的含义照着答案去敲调试错误
centos6.3安装php5.4报错 dcj3sjt126com centos6
报错内容如下: Resolving Dependencies --> Running transaction check ---> Package php54w.x86_64 0:5.4.38-1.w6 will be installed --> Processing Dependency: php54w-common(x86-64) = 5.4.38-1.w6 for
JSONP请求 flyer0126 jsonp
使用jsonp不能发起POST请求。 It is not possible to make a JSONP POST request. JSONP works by creating a <script> tag that executes Javascript from a different domain; it is not pos
Spring Security（03）——核心类简介 234390216 Authentication
核心类简介目录 1.1 Authentication 1.2 SecurityContextHolder 1.3 AuthenticationManager和AuthenticationProvider 1.3.1 &nb
在CentOS上部署JAVA服务 java--hhf java jdk centos Java服务
本文将介绍如何在CentOS上运行Java Web服务，其中将包括如何搭建JAVA运行环境、如何开启端口号、如何使得服务在命令执行窗口关闭后依旧运行第一步：卸载旧Linux自带的JDK ①查看本机JDK版本 java -version 结果如下 java version "1.6.0"
oracle、sqlserver、mysql常用函数对比[to_char、to_number、to_date] ldzyz007 oracle mysql SQL Server
oracle &n
记Protocol Oriented Programming in Swift of WWDC 2015 ningandjin protocol WWDC 2015 Swift2.0
其实最先朋友让我就这个题目写篇文章的时候，我是拒绝的，因为觉得苹果就是在炒冷饭，把已经流行了数十年的OOP中的“面向接口编程”还拿来讲，看完整个Session之后呢，虽然还是觉得在炒冷饭，但是毕竟还是加了蛋的，有些东西还是值得说说的。通常谈到面向接口编程，其主要作用是把系统设计和具体实现分离开，让系统的每个部分都可以在不影响别的部分的情况下，改变自身的具体实现。接口的设计就反映了系统
搭建 CentOS 6 服务器(15) - Keepalived、HAProxy、LVS rensanning keepalived
（一）Keepalived （1）安装 # cd /usr/local/src # wget http://www.keepalived.org/software/keepalived-1.2.15.tar.gz # tar zxvf keepalived-1.2.15.tar.gz # cd keepalived-1.2.15 # ./configure # make &a
ORACLE数据库SCN和时间的互相转换 tomcat_oracle oracle sql
SCN（System Change Number 简称 SCN）是当Oracle数据库更新后，由DBMS自动维护去累积递增的一个数字，可以理解成ORACLE数据库的时间戳，从ORACLE 10G开始，提供了函数可以实现SCN和时间进行相互转换；　　用途：在进行数据库的还原和利用数据库的闪回功能时，进行SCN和时间的转换就变的非常必要了；　　操作方法：　　1、通过dbms_f
Spring MVC 方法注解拦截器 xp9802 spring mvc
应用场景，在方法级别对本次调用进行鉴权，如api接口中有个用户唯一标示accessToken,对于有accessToken的每次请求可以在方法加一个拦截器，获得本次请求的用户，存放到request或者session域。 python中，之前在python flask中可以使用装饰器来对方法进行预处理，进行权限处理先看一个实例,使用@access_required拦截： ?