CS数模

2023 年数维杯（C题）国际大学生数学建模挑战赛 |数学建模完整代码+建模过程全解全析

问题重述

信息技术和人工智能的迅速发展，特别关注大型语言模型（Large Language Models，LLMs）在全球范围内的广泛应用，以ChatGPT为代表。这些模型在机器人导航、语音识别、图像识别、自然语言处理和智能推荐等领域表现出色，为人们提供了丰富、智能和便捷的体验。
然而，随着这些技术的普及，也出现了一些潜在问题。首先，这些大型语言模型是基于文本训练的，而不同领域的语言和文化背景可能对生成的结果产生重要影响。其次，生成的文本可能存在语义偏见、逻辑不连贯和缺乏创造力的问题。最后，涉及隐私保护、版权保护以及学术不端行为等问题，特别是在学术领域可能存在使用AI生成论文导致的相关问题。
因此，虽然这些模型为我们带来了很多便利，但也需要认识到其潜在风险和挑战。在这个背景下，题目提出了一系列问题，旨在深入探讨使用AI生成文本可能引发的问题，并提出建立模型和方法来解决这些问题。

问题一

我们可以定义一些关键变量，然后通过对这些变量进行统计分析来寻找AI文本生成的基本规律。以下是一些可能的变量：

$W$ ：生成的字数要求，取值为200字、500字等。
$G$ ：生成次数，包括首次生成和点击"重新生成"按钮的次数。
$T$ ：是否中英文翻译，取值为0表示未翻译，1表示中文翻译，2表示英文翻译。
$S$ ：生成文本的风格，可以用一个离散值表示。

我们可以通过一个包含这些变量的矩阵 $X$ 来表示数据：

$\begin{bmatrix} W_1 & G_1 & T_1 & S_1 \\ W_2 & G_2 & T_2 & S_2 \\ \vdots & \vdots & \vdots & \vdots \\ W_N & G_N & T_N & S_N \end{bmatrix}$

接下来，我们可以通过对矩阵 $X$ 进行统计分析，找到生成文本的基本规律。例如，我们可以计算在特定字数要求下，重新生成的次数的平均值、中英文翻译的频率分布、不同风格的出现频率等。

使用统计学方法，例如计算均值、方差、频率分布等。例如，我们可以定义一个函数 (f(W, G, T, S)) 来表示生成文本的某个方面，然后通过对 (X) 中的数据进行分析，得到关于这个函数的统计信息。

$\text{某个方面的特征}$

在简单多元回归中，通过回归模型的输出来判断文本是否为AI生成，设置一个阈值，当模型的输出超过这个阈值时，认为文本是由AI生成的。

在多元回归中，模型的输出 $Y$ 可以表示为：

$\beta_0 + \beta_1 \cdot W + \beta_2 \cdot G + \beta_3 \cdot T + \beta_4 \cdot S + \epsilon$

其中， $\beta_0, \beta_1, \beta_2, \beta_3, \beta_4$ 是回归系数， $\epsilon$ 是误差项。

设置一个阈值 $T_{\text{AI}}$ ，当 $T_{\text{AI}}$ 时，认为文本是由AI生成的，否则认为不是。

在进行假设检验时，我们的目标是判断某个回归系数是否显著不为零。假设检验通常涉及到以下步骤：

首先，我们建立两个假设，即零假设 $H_0$ 和备择假设 $H_1$ 。

$H_0$ : 回归系数等于零，即 $\beta_i = 0$ ，表示该变量对生成文本的某个方面没有显著影响。
$H_1$ : 回归系数不等于零，即 $\beta_i \neq 0$ ，表示该变量对生成文本的某个方面有显著影响。

选择显著性水平（Significance Level），通常用 (\alpha) 表示，例如取 (\alpha = 0.05)。这代表我们允许的错误发生率，即在零假设为真时错误地拒绝它的概率。

计算检验统计量（Test Statistic），该统计量用于在给定显著性水平下决定是否拒绝零假设。对于回归系数 (\beta_i)，检验统计量通常计算为：

$\frac{\hat{\beta}_i}{\text{SE}(\hat{\beta}_i)}$

其中， $\hat{\beta}_i$ 是回归系数的估计值， $\text{SE}(\hat{\beta}_i)$ 是估计的标准误差。
根据检验统计量计算 p-值，p-值表示在零假设为真的情况下，观察到当前检验统计量或更极端情况的概率。

在给定的显著性水平下（通常为 (\alpha = 0.05)），比较 p-值和显著性水平，如果 (p < \alpha)，则拒绝零假设，认为回归系数显著不为零；如果 (p \geq \alpha)，则接受零假设，表示没有足够的证据拒绝零假设。

如果拒绝了零假设，说明相应的变量对生成文本的某个方面有显著影响。反之，如果接受了零假设，说明该变量对生成文本的某个方面没有显著影响。

通过假设检验的步骤，判断每个变量的回归系数是否显著不为零，从而在统计学上推断它们对生成文本的影响。

问题二

我们可以考虑使用一种二元分类的方法，通过分析每一段文本的多个因素来判断该段是否由AI生成。

定义一些可能影响判断的变量：

$L$ ：生成语言，0表示未生成，1表示中文生成，2表示英文生成。
(T)：是否翻译，0表示未翻译，1表示中文翻译，2表示英文翻译。
(G)：生成次数，表示生成的次数。
(L)：输出字数限制，0表示没有字数限制，1表示有字数限制。

将这些变量用一个矩阵 (Y) 表示，其中每一行代表一段文本。

$\begin{bmatrix} L_1 & T_1 & G_1 & L_1 \\ L_2 & T_2 & G_2 & L_2 \\ \vdots & \vdots & \vdots & \vdots \\ L_N & T_N & G_N & L_N \end{bmatrix}$

步骤二：建立二元分类模型

使用Transformer进行二元分类提供一些更具体的数学公式解释。我们将主要关注Transformer的Self-Attention机制和二元分类的数学表达。

1. Transformer的Self-Attention机制

Self-Attention机制允许模型在处理输入序列时对不同位置的信息分配不同的权重。对于一个输入序列 $X$ ，经过Self-Attention的计算，我们可以得到新的表示 (Z)，其中 $Z_i$ 表示第 $i$ 个位置的表示。Self-Attention的计算可以用以下公式表示：

$Z_i = \sum_{j} \text{Attention}(X_i, X_j) \cdot X_j$

其中， $\text{Attention}(X_i, X_j)$ 表示第 $i$ 个位置和第 $j$ 个位置之间的注意力权重。

2. 文本表示

对于文本段落的表示，我们可以使用Transformer的输出中的某一维度，通常是CLS标记的输出。表示为 $C$ ：

$\text{Transformer}(X)$

3. 二元分类层

将文本表示输入二元分类层，其中 (W) 是权重，(b) 是偏置，(f) 是激活函数（通常是Sigmoid函数）：

$\hat{y} = f(W \cdot C + b)$

4. 损失函数

使用二元交叉熵损失函数：

$\text{Loss} = -\frac{1}{N} \sum_{i=1}^{N} \left[ y_i \log(\hat{y}_i) + (1-y_i) \log(1-\hat{y}_i) \right]$

其中， $N$ 是样本数量， $y_i$ 是实际标签（0或1）， $\hat{y}_i$ 是模型的预测输出。

5. 训练过程

通过反向传播算法，优化模型参数以最小化损失函数。使用梯度下降算法或其他优化算法。

6. 推断过程

在推断过程中，将新的文本输入模型，得到输出概率。可以根据概率设定一个阈值，例如0.5，判断文本是由AI生成还是非AI生成。

这些数学公式提供了对问题二中使用Transformer进行二元分类任务的详细解释。在实践中，可以根据具体情况调整模型结构和超参数。

步骤三：训练模型

使用已有的数据集，包含标记好的文本段落和对应的变量值，对模型进行训练。在训练中，模型将学习不同变量对于文本生成的影响，从而能够判断一段文本是否由AI生成。

在实际应用中，基于Transformer的二元分类任务的代码通常使用深度学习框架，例如TensorFlow或PyTorch。由于代码的长度较长，这里提供一个简化版本的伪代码，展示了关键的步骤和概念。

这个伪代码使用PyTorch作为深度学习框架，同时使用Hugging Face的Transformers库以便快速使用预训练的Transformer模型。

import torch
import torch.nn as nn
from transformers import BertModel, BertTokenizer

# 定义Transformer模型
class TransformerClassifier(nn.Module):
    def __init__(self, hidden_size, num_classes):
        super(TransformerClassifier, self).__init__()
        self.transformer = BertModel.from_pretrained('bert-base-uncased')
        self.fc = nn.Linear(hidden_size, num_classes)
        self.sigmoid = nn.Sigmoid()

    def forward(self, input_ids, attention_mask):
        outputs = self.transformer(input_ids, attention_mask=attention_mask)
        cls_output = outputs.last_hidden_state[:, 0, :]
        logits = self.fc(cls_output)
        proba = self.sigmoid(logits)
        return proba

# 数据预处理
tokenizer = BertTokenizer.from_pretrained('bert-base-uncased')
text = "This is a sample text."
inputs = tokenizer(text, return_tensors="pt", padding=True, truncation=True)

# 构建模型
hidden_size = 768  # BERT-base的隐藏层大小
num_classes = 1    # 二元分类
model = TransformerClassifier(hidden_size, num_classes)

# 模型输入
input_ids = inputs["input_ids"]
attention_mask = inputs["attention_mask"]

# 模型输出
output_proba = model(input_ids, attention_mask)

# 计算损失
criterion = nn.BCELoss()
target = torch.tensor([1.0])  # 实际标签
loss = criterion(output_proba, target)

# 反向传播与优化
optimizer = torch.optim.Adam(model.parameters(), lr=0.001)
optimizer.zero_grad()
loss.backward()
optimizer.step()

使用BERT模型进行文本表示，使用了Sigmoid激活函数和二元交叉熵损失函数进行二元分类。

步骤四：模型评估

使用另外的数据集对模型进行评估，检查模型的性能，包括准确率、召回率、精确率等指标。这些指标可以衡量模型在判断每一段文本生成情况上的表现。

import torch
from transformers import BertTokenizer

# 加载已训练的模型
model = TransformerClassifier(hidden_size, num_classes)
model.load_state_dict(torch.load('your_trained_model.pth'))  # 请替换为你实际的模型文件路径
model.eval()

# 数据预处理
tokenizer = BertTokenizer.from_pretrained('bert-base-uncased')
text = "This is a new text for inference."
inputs = tokenizer(text, return_tensors="pt", padding=True, truncation=True)

# 模型输入
input_ids = inputs["input_ids"]
attention_mask = inputs["attention_mask"]

# 推断
with torch.no_grad():
    output_proba = model(input_ids, attention_mask)

# 输出概率
print("预测概率:", output_proba.item())

# 根据阈值进行分类
threshold = 0.5
prediction = 1 if output_proba.item() > threshold else 0
print("预测结果:", prediction)

推理代码加载了之前训练好的模型权重，并使用该模型对新的文本进行推断。

这个方法结合了机器学习的思想，通过学习不同变量对文本生成的影响，使得模型能够在给定输入变量的情况下判断文本是否由AI生成。

问题三

对于语言模型特征中的信息熵，以及统计验证、特征工程、文献网络分析和社交网络分析等方法。

1. 语言模型特征：

1.1 信息熵：

信息熵是用来度量一个随机变量不确定度的概念，可以应用于文本的信息量评估。

$\sum_{i=1}^{n} P(x_i) \log_2 P(x_i)$

其中， $P(x_i)$ 是词汇表中第 $i$ 个词出现的概率。

2. 实验设计与验证：

2.1 统计验证：

在统计验证中，一个常见的做法是使用 t 检验。

$\frac{\bar{X} - \mu}{s/\sqrt{n}}$

其中， $\bar{X}$ 是样本均值， $\mu$ 是总体均值， $s$ 是样本标准差， $n$ 是样本大小。

3. 技术细节：

3.1 特征工程：

使用 TF-IDF进行关键词权重计算。

$\text{TF-IDF}(t, d) = \text{TF}(t, d) \times \text{IDF}(t)$

其中，TF 表示词频，IDF 表示逆文档频率。

4. 引用和参考文献：

4.1 文献网络分析：

可以使用图论的相关指标，如节点度、中心性等。

$\text{centrality} = \frac{\text{连接到节点的边数}}{\text{总节点数}-1}$

5. 作者身份可疑：

5.1 社交网络分析：

使用社交网络中的中心性指标，例如介数中心性。

$\text{介数中心性} = \sum_{s \neq v \neq t} \frac{\sigma(s, t|v)}{\sigma(s, t)}$

其中， $\sigma(s, t)$ 表示从节点 $s$ 到节点 $t$ 的最短路径数， $\sigma(s, t|v)$ 表示通过节点 (v) 的最短路径数。

结合多个特征进行加权得分和二元分类判断：

class BinaryClassifier:
    def __init__(self, weights, threshold):
        self.weights = weights
        self.threshold = threshold

    def calculate_total_score(self, features):
        # 计算总得分
        total_score = sum(f * w for f, w in zip(features, self.weights))
        return total_score

    def classify(self, total_score):
        # 进行二元分类判断
        return "AI生成" if total_score > self.threshold else "人类创作"

# 示例特征和权重
example_features = [feature1, feature2, feature3]  # 请替换为实际特征的值
example_weights = [weight1, weight2, weight3]  # 请替换为实际权重的值

# 示例阈值
example_threshold = 0.5  # 请替换为实际阈值

# 创建二元分类器对象
classifier = BinaryClassifier(weights=example_weights, threshold=example_threshold)

# 计算总得分
total_score_example = classifier.calculate_total_score(example_features)

# 进行二元分类判断
classification_result = classifier.classify(total_score_example)

# 打印结果
print(f"总得分: {total_score_example}")
print(f"分类结果: {classification_result}")

问题四：

了解，建立一个综合的抄袭检测模型需要综合考虑文本、图像和公式等多个方面。以下是一个简化的框架，其中包括文本相似性、图像处理和公式匹配等不同模块：

文本相似性模块：

使用文本相似性度量方法，如余弦相似度，来比较文章中数学模型的文本描述。

from sklearn.feature_extraction.text import CountVectorizer
from sklearn.metrics.pairwise import cosine_similarity

def calculate_text_similarity(text1, text2):
    vectorizer = CountVectorizer().fit_transform([text1, text2])
    vectors = vectorizer.toarray()
    similarity = cosine_similarity([vectors[0]], [vectors[1]])[0][0]
    return similarity

图像处理模块：

使用深度学习方法对图像进行特征提取，然后比较图像的相似性。

# 使用适当的深度学习库导入模型和相关功能
from tensorflow.keras.applications import VGG16
from tensorflow.keras.preprocessing import image
from tensorflow.keras.applications.vgg16 import preprocess_input
from tensorflow.keras.models import Model
import numpy as np

def calculate_image_similarity(image_path1, image_path2):
    # 使用预训练的VGG16模型提取图像特征
    model = VGG16(weights='imagenet', include_top=False)
    img1 = image.load_img(image_path1, target_size=(224, 224))
    img2 = image.load_img(image_path2, target_size=(224, 224))
    img1 = image.img_to_array(img1)
    img2 = image.img_to_array(img2)
    img1 = preprocess_input(np.expand_dims(img1, axis=0))
    img2 = preprocess_input(np.expand_dims(img2, axis=0))
    features1 = model.predict(img1)
    features2 = model.predict(img2)

    # 使用余弦相似度计算特征向量的相似性
    similarity = cosine_similarity(features1.flatten().reshape(1, -1), features2.flatten().reshape(1, -1))[0][0]
    return similarity

公式匹配模块：

使用LaTeX解析器将公式解析成结构化的数据，然后比较两个公式的结构相似性。

# 使用适当的LaTeX解析库导入模型和相关功能
from sympy import Eq, latex, simplify, symbols
from sympy.parsing.latex import parse_latex

def calculate_formula_similarity(formula1, formula2):
    # 解析LaTeX公式
    expr1 = parse_latex(formula1)
    expr2 = parse_latex(formula2)

    # 简化表达式
    simplified_expr1 = simplify(expr1)
    simplified_expr2 = simplify(expr2)

    # 比较两个公式的相似性
    similarity = float(simplified_expr1.equals(simplified_expr2))
    return similarity

模型整合：

将以上三个模块整合为一个综合的抄袭检测模型：

class PlagiarismDetectionModel:
    def __init__(self, text_weight, image_weight, formula_weight):
        self.text_weight = text_weight
        self.image_weight = image_weight
        self.formula_weight = formula_weight

    def detect_plagiarism(self, text1, text2, image_path1, image_path2, formula1, formula2):
        # 计算各模块相似性
        text_similarity = calculate_text_similarity(text1, text2)
        image_similarity = calculate_image_similarity(image_path1, image_path2)
        formula_similarity = calculate_formula_similarity(formula1, formula2)

        # 综合得分
        total_score = self.text_weight * text_similarity + self.image_weight * image_similarity + self.formula_weight * formula_similarity

        # 返回结果
        return total_score

消融实验

消融实验是为了评估模型中各个组成部分的重要性，通常通过逐步移除某个组件并观察模型性能的变化来进行。在抄袭检测模型中，我们可以进行消融实验以评估文本、图像和公式模块对整体抄袭检测性能的贡献。

以下是一个简单的消融实验示例，假设我们有一个包含文本、图像和公式的抄袭检测模型，我们分别对这三个模块进行消融实验：

class AblationExperiment:
    def __init__(self, model):
        self.model = model

    def text_ablation(self, text1, text2, image_path1, image_path2, formula1, formula2):
        # 移除文本模块
        self.model.text_weight = 0
        total_score = self.model.detect_plagiarism(text1, text2, image_path1, image_path2, formula1, formula2)
        return total_score

    def image_ablation(self, text1, text2, image_path1, image_path2, formula1, formula2):
        # 移除图像模块
        self.model.image_weight = 0
        total_score = self.model.detect_plagiarism(text1, text2, image_path1, image_path2, formula1, formula2)
        return total_score

    def formula_ablation(self, text1, text2, image_path1, image_path2, formula1, formula2):
        # 移除公式模块
        self.model.formula_weight = 0
        total_score = self.model.detect_plagiarism(text1, text2, image_path1, image_path2, formula1, formula2)
        return total_score

在这个示例中，我们创建了一个AblationExperiment类，该类允许我们分别移除文本、图像和公式模块，然后检查模型性能的变化。

plagiarism_model = PlagiarismDetectionModel(text_weight=0.5, image_weight=0.3, formula_weight=0.2)
experiment = AblationExperiment(plagiarism_model)

# 示例文本、图像和公式
example_text1 = ""
example_text2 = ""
example_image_path1 = "path/to/image1.jpg"
example_image_path2 = "path/to/image2.jpg"
example_formula1 = "a = b + c"
example_formula2 = "x = y * z"

# 消融实验：移除文本模块
text_ablation_score = experiment.text_ablation(example_text1, example_text2, example_image_path1, example_image_path2, example_formula1, example_formula2)

# 消融实验：移除图像模块
image_ablation_score = experiment.image_ablation(example_text1, example_text2, example_image_path1, example_image_path2, example_formula1, example_formula2)

# 消融实验：移除公式模块
formula_ablation_score = experiment.formula_ablation(example_text1, example_text2, example_image_path1, example_image_path2, example_formula1, example_formula2)

# 打印结果
print(f"移除文本模块后得分: {text_ablation_score}")
print(f"移除图像模块后得分: {image_ablation_score}")
print(f"移除公式模块后得分: {formula_ablation_score}")

2023 年数维杯（C题） CS数模国际大学生数学建模挑战赛全解全析

c语言找出递增子数组的长度,C语言实现最长递增子序列问题的解决方法梁肖松 c语言找出递增子数组的长度
本文实例展示了C语言实现最长递增子序列问题的解决方法。分享给大家供大家参考。具体方法如下：问题描述：给定一个序列，找出其最长递增子序列长度。比如输入1375输出3算法解决思路：利用动态规划的思想，以序列的每个点最为最右端，找出每个点作为最右端时的子序列长度的最大值，即问题的求解。因此，在计算前面的每个点的时候，将其结果保存下来，后面的点与前面的点的数值进行比较，如果大，则在其长度基础上加1，并且找
用C程序编写一个程序，打印空心倒置直角三角形程序员极光 C语言练习 c语言算法开发语言
用C程序编写一个程序，打印空心倒置直角三角形在C语言学习过程中，图案打印是非常经典且实用的练习，能够帮助你熟悉循环嵌套与条件判断的配合使用。本文将详细解析如何打印一个左对齐空心倒直角三角形。程序目标打印一个10行的左对齐空心倒直角三角形，效果如下：***************************完整代码#includeintmain(){introw,column;introw_length
用C程序编写一个程序，打印空心星号正方形
用C程序编写一个程序，打印空心星号正方形在C语言学习过程中，for循环与条件判断的结合应用非常重要。今天通过一个打印空心矩形的例子，帮助大家理解嵌套循环与if语句的组合技巧。程序目标用C语言在控制台打印一个5行5列的空心矩形：****************完整C语言代码#includeintmain(){introw,column;introw_length=5;//行数intcolumn_le
【学生成绩管理系统----C语言】
还在为期末程序设计而烦恼吗，不要担心，大师帮你安利一波完整的的管理系统代码，对你有帮助记得加关注噢！文章目录一、学生成绩管理系统是什么？二、信息管理的七个模块1.Stepone2.StepTwo3.StepThree4.Stepfour5.Stepfive6.StepSix7.Next总结一、学生成绩管理系统是什么？学生信息管理系统能够方便地查询和变更学生的基本数据（例如增删改查），节省大量工作时
学生成绩管理系统（C语言）
学生成绩管理系统思路学生成绩管理系统，首先要初始化系统，开始一个新的学生成绩系统初始化记录学生姓名，学号，院系，然后输入学生各科成绩，数学，英语，语文成绩。记录完各课成绩以后，可查看学生平均成绩和是否及格，成绩查询其中有学号查询，姓名查询，院系查询，还有全部输出，可以清晰的看到及格人数，按照分数高低排列，最后还可以添加和删除学生成绩，或者更改学生成绩，避免人为录入成绩错误。基本函数1.结构体str
【Pandas超实用经验汇总-数据建模分析】 Mr.小海 Python 数据挖掘数据分析 python
Pandas超实用经验汇总-数据分析前言基本方法1.读取文件2.查看数据3.修改、删除、替换数据等总结前言看见了很多教程虽然很全，但是很多技巧容易忘记且几乎用不上，读起来晦涩难懂，今天我给大家总结了Pandas的一些学习经验技巧，包含常见日常使用的pandas知识，以及一些技巧,这些技巧常见于数学建模，数据分析，数据挖掘比赛等。基本方法1.读取文件方法如下：importpandasaspd#正常写
C#进行串口应用开发如何处理串口的异常情况 openwin_top c#串口应用开发问题系列 c#开发语言串口通讯上位机
python编程示例系列python编程示例系列二python的Web神器Streamlit如何应聘高薪职位C#视觉应用开发问题系列c#串口应用开发问题系列microPythonPython最小内核源码解析NI-motion运动控制c语言示例代码解析在C#中进行串口应用开发时，处理串口的异常情况是非常重要的。常见的串口异常包括端口不可用、数据传输错误、超时等
Github 2024-06-07开源项目日报 Top10
根据GithubTrendings的统计，今日(2024-06-07统计)共有10个项目上榜。根据开发语言中项目的数量，汇总情况如下：开发语言项目数量Python项目3C++项目3JavaScript项目2JupyterNotebook项目1TypeScript项目1Vue项目1比特币核心：开源比特币软件创建周期：4919天开发语言：C++协议类型：MITLicenseStar数量：76760个F
C语言基础（5）穆霖祎 c语言开发语言
一、条件表达式表达格式为表达式1？表达式2：表达式执行顺序为自左向右表达式1为逻辑或关系表达式，判断表达式1为真，输出结果为2，若1为假，则输出结果3。例如intx=10，inty=9a=（--x==y++）？--x：++y其中式子1为真，所以输出--x，a的输出结果为8。二、循环控制2.1goto语句goto语句又称无条件跳转语句，用法为goto+自定义函数名，执行到该语句时自动跳转到自定义函数
C语言-动态内存管理第三世界的诗人动态内存管理 c语言 c语言
目录C语言-动态内存管理相关库函数内存耗尽野指针野指针产生原因：动态内存分配应用经验C语言-动态内存管理动态内存管理，就是程序执行的过程中，由程序编写者动态的申请和回收内存空间。C语言内存的动态分配一般通过库函数实现，主要有malloc和free函数。位置：在堆上。连接：https://blog.csdn.net/USA_AM_1966/article/details/89509589相关库函数1
C语言--内存管理小蘑菇二号 c++算法数据结构 c语言
在C语言中，内存管理是一项重要的编程任务，它涉及到了解程序如何分配、使用和释放内存。C语言提供了多种内存管理方式，主要包括静态内存分配、栈内存分配和动态内存分配。1静态内存分配全局变量和静态变量：编译时就已经确定了内存空间，它们在整个程序生命周期内持续存在，直到程序结束。这类内存由编译器自动分配和回收。intglobalVar=10;//全局变量，静态分配staticintstaticVar=20
ica算法c语言,独立成分分析(ICA)的模拟实验(R语言) weixin_39632212 ica算法c语言
本笔记是ESL14.7节图14.42的模拟过程。第一部分将以ProDenICA法为例试图介绍ICA的整个计算过程；第二部分将比较ProDenICA、FastICA以及KernelICA这种方法，试图重现图14.42。ICA的模拟过程生成数据首先我们得有一组独立(ICA的前提条件)分布的数据$S$(未知)，然后经过矩阵$A_0$混合之后得到实际的观测值$X$，即$$X=SA_0$$也可以写成$$S=
列梅兹remez算法求解最佳一致逼近多项式(C语言实现) landcruiser007 计算方法计算方法数值分析列梅兹算法
//remzf.h//实现remez算法#include#includevoidremz(a,b,p,n,eps,f)intn;doublea,b,eps,p[],(*f)(double);{inti,j,k,m;doublex[21],g[21],d,t,u,s,xx,x0,h,yy;if(n>20)n=20;//逼近多项式的最高次数为19m=n+1;d=1.0e+35;for(k=0;k<=n
3C++类 LicHermione c++c++开发语言
目录1.空类2.构造函数3析构函数4.拷贝构造5.赋值构造6.取地址函数重载7.初始化列表8.隐含的this指针第一空类空类是没有任何成员属性的类空类对象在内存中仍然占据至少1字节空间，以确保不同对象地址不同（否则两个对象地址可能一样，无法区分）。C++类的计算大小和C语言的结构体是一样的，不需要计算C++类的成员方法。下面两种叫法是一样的C++类的变量和函数C++类的成员属性和成员方法C++类只
c语言学习15四则运算
四则运算练习需求：进入一个界面选择+-*/printf选择运算法则（如果选择错误，提示重新选择）switchcasedefult显示100以内两个随机数，输入运算结果rand系统显示正确答案，并且判断正确错误要求：封装函数分析：intmain(void){//界面程序-----界面函数//输入和识别程序-----按键识别函数//随机数程序----产生随机数函数//系统计算并且对比答案----对比答
【华为OD机试真题 2025C卷】161、机器人可活动的最大网格点数目 | 机试真题+思路参考+代码解析（C++、Java、Py、C语言、JS） KFickle 最新华为OD机试(C++Java Py C JS)+OJ 华为od 机器人 c++华为OD机试真题 java 机器人可活动的最大网格点数目 c语言
文章目录一、题目题目描述输入输出样例1二、代码与思路参考C++代码Java代码Python代码C语言代码JS代码订阅本专栏后即可解锁在线OJ刷题权限个人博客首页：KFickle专栏介绍：最新的华为OD机试真题，使用C++，Java，Python，C语言，JS五种语言进行解答，每个题目都包含解题思路，五种语言的解法，每日持续更新中，订阅后支持开通在线OJ测试刷题！！！一次订阅永久享受更新，有代码问题
PTA浙大版《C语言程序设计（第3版）》题目集.2 Xiao 竹 zi c语言算法数据结构
习题4-10猴子吃桃问题#includeintmain(){intn,m=1;scanf("%d",&n);for(inti=1;iintmain(){intn,a=1,b=1,i;scanf("%d",&n);if(n==1){printf("1");}else{for(i=3;(a+b)intmain(){charc;intre=0,t,flag=0;scanf("%d%c",&re,&c);
【C语言】语义陷阱探秘(一)：指针与数组 byte轻骑兵 C 语言实战避坑：从新手到 “老油条”的蜕变 c语言开发语言
目录一、指针与数组的基本关系1.1.数组名与指针1.2.数组下标与指针运算1.3.示例二、常见的语义陷阱2.1指针未初始化2.1.1.陷阱描述：指针未初始化2.1.2.解决方法2.1.3.示例2.2数组越界2.2.1.陷阱描述2.2.2.解决方法2.2.3.示例2.2.4.注意事项2.3指针和数组的相互转换错误2.3.1.陷阱描述2.3.2.解决方法2.3.3.示例2.3.4.注意事项2.4指针引
【C语言进阶】使用memcpy你需要注意的一个问题架构师李肯嵌入式物联网开发进阶 c语言单片机 memcpy
【C语言进阶】使用memcpy你需要注意的一个问题日常编程中，memcpy可以算得上是使用频次非常高的函数，那么有些小点可能你没有关注到，本文将给你提个小醒。文章目录1写在前面2问题现场3知识点补充3.1标准库对memcpy的描述3.2一个简易版本的源码实现3.3问题答疑4小小总结5更多分享1写在前面作为一个C语言程序员，标准库函数使用频次排行榜上，memcpy在上面的排行一定会非常靠前，就算排不
手撕C语言数组：从青铜到王者的逆袭之路！！！
文章目录一、数组的"出生证明"（超重要！）1.1数组的定义姿势1.2数组初始化の艺术二、数组内存布局大揭秘三、新手必踩的5大深坑（血泪教训）3.1数组越界访问3.2sizeof的陷阱3.3数组赋值妄想症四、高手进阶技巧（秀起来~）4.1动态计算数组长度4.2多维数组の奥义4.3数组与指针的量子纠缠五、实战代码示范5.1数组反转算法5.2数组去重骚操作六、总结与思考天天用数组，你真的了解它吗？这个看
初识C语言（上）想要成为计算机高手 c语言笔记
目录1.第一个C语言程序2.数据类型3.变量、常量3.1定义变量的方法3.2变量的分类3.3变量的使用3.4变量的作用域和生民周期3.5常量4.字符串；转义字符4.1字符串4.2转义字符5.注释6.选择语句7.循环语句1.第一个C语言程序#includeintmain(){printf("hellocode\n");return0;}//main函数是程序的入口//一个工程中main函数有且仅有一
【PTA数据结构 | C语言版】Windows消息队列秋说 PTA 数据结构题目集数据结构 c语言算法
本专栏持续输出数据结构题目集，欢迎订阅。文章目录题目代码题目消息队列是Windows系统的基础。对于每个进程，系统维护一个消息队列。如果在进程中有特定事件发生，如点击鼠标、文字改变等，系统将把这个消息连同表示此消息优先级高低的正整数（称为优先级值）加到队列当中。同时，如果队列不是空的，这一进程循环地从队列中按照优先级获取消息。请注意优先级值低意味着优先级高。请编辑程序模拟消息队列，将消息加到队列中
【PTA数据结构 | C语言版】前序遍历二叉树秋说 PTA 数据结构题目集数据结构 c语言算法
本专栏持续输出数据结构题目集，欢迎订阅。文章目录题目代码题目请编写程序，创建一棵有3个结点的二叉树，并输出其前序遍历序列。输入格式：输入给出3个整数，依次为二叉树根结点的左孩子、右孩子、根结点本身存储的键值。输出格式：输出二叉树的前序遍历序列，每个数字占一行。输入样例：123输出样例：312代码#include#includetypedefstructTreeNode{intdata;struct
【PTA数据结构 | C语言版】根据前序序列重构二叉树
本专栏持续输出数据结构题目集，欢迎订阅。文章目录题目代码题目请编写程序，根据给定二叉树的前序序列化结果，重构二叉树，并输出其前序遍历结果。输入格式：输入首先给出一个不超过20的正整数n，随后一行给出n个前序序列的元素。其中键值都是不超过9位的正整数，空结点对应符号#。输出格式：输出二叉树的前序遍历结果，每个数字占一行。输入样例：1112#4##35###输出样例：12435代码#include#i
【PTA数据结构 | C语言版】字符串插入操作（不限长）秋说 PTA 数据结构题目集数据结构 c语言算法
本专栏持续输出数据结构题目集，欢迎订阅。文章目录题目代码题目请编写程序，将给定字符串t插入到另一个给定字符串s的第pos个字符的位置。输入格式：输入先后给出主串s和待插入的字符串t，每个非空字符串占一行，长度无固定上限，以回车结束（回车不算在字符串内）。第三行给出插入的位序pos，是int范围内的任意整数（注意正常的位序从1开始）。输出格式：在一行中输出将t插入s的第pos个字符的位置后的结果字符
【C语言】从零实现 memcpy：原理、陷阱与实战 BabyZZの秘密日记 C语言 c语言开发语言
个人主页：BabyZZの秘密日记收入专栏：C语言文章目入1.什么是`memcpy`？2.标准库版本示例3.自己写一个`my_memcpy`3.1思路拆解3.2完整实现3.3测试代码4.常见坑&面试追问5.小结本文面向C语言初学者与面试复习人群，通过两个完整示例带你深入理解memcpy的工作机制，并亲手实现一个“简化版”的my_memcpy。阅读时间约5分钟。1.什么是memcpy？memcpy是C
Python+Selenium自动化
1，什么是seleniumselenium是一个开源的自动化测试框架，主要适用WEB测试，可以支持多种语言(Java,C#,Python,php等)，既然支持多语言开发，那跨平台自然就不用多说啦，selenium有几个版本，一个是seleniumIDE(是一个安装在火狐浏览器上的一个插件，可以用来录制脚本，然后导出自动生成对应的开发语言文件)，seleniumGrid(自动化辅助工具，楼主还没深入
那些年的我们第七十九章梦见令狐冲
曾祥宇从李卓对陈健铭的深情里，发现原来她也有非常真诚的一面，只是她隐藏得太深，不愿意表现出来。而且李卓的那句话至少说明她不再看不起曾祥宇了。这让他对李卓的印象大为改观，而这种改观的背后，是她的话让他的自信心又有了提升。能够通过努力让别人改变对自己的看法，还是挺让他引以为豪的。李卓是从曾祥宇努力学习编程技术上改变了对他的看法。曾祥宇上学期C语言考试不及格她是知道的，也曾暗地因此更加看不起他。可是她惊
【2024国赛C题】【农作物的种植策略】2024 年全国大学生数学建模比赛思路、代码更新中..... 程序猿鑫数学建模
欢迎来到本博客❤️❤️博主优势：博客内容尽量做到思维缜密，逻辑清晰，为了方便读者。⛳️座右铭：行百里者，半于九十。本文目录如下：目录⛳️竞赛事件及参赛1找程序网站推荐2公式编辑器、流程图、论文排版324年国赛C题及资源下载4思路、代码分享......⛳️竞赛事件及参赛根据乡村的实际情况，充分利用有限的耕地资源，因地制宜，发展有机种植产业，对乡村经济的可持续发展具有重要的现实意义。选择适宜的农作物，
【C语言】基于 DEV C++的简单扫雷游戏九.九 C 语言游戏 c++游戏算法 c语言编辑器开发语言
目录一、代码二、实训报告三、答辩PPT一、代码这学期C语言大作业选题:基于DEVC++的简单扫雷游戏,以下是devc++适配代码。#define_CRT_SECURE_NO_WARNINGS1#include#include#include#defineROWS9#defineCOLS9#defineMINE_COUNT10voidInitBoard(charboard[][COLS],intro
Nginx负载均衡 510888780 nginx 应用服务器
Nginx负载均衡一些基础知识: nginx 的 upstream目前支持 4 种方式的分配 1)、轮询（默认）每个请求按时间顺序逐一分配到不同的后端服务器，如果后端服务器down掉，能自动剔除。 2)、weight 指定轮询几率，weight和访问比率成正比
RedHat 6.4 安装 rabbitmq bylijinnan erlang rabbitmq redhat
在 linux 下安装软件就是折腾，首先是测试机不能上外网要找运维开通，开通后发现测试机的 yum 不能使用于是又要配置 yum 源，最后安装 rabbitmq 时也尝试了两种方法最后才安装成功机器版本： [root@redhat1 rabbitmq]# lsb_release LSB Version: :base-4.0-amd64:base-4.0-noarch:core
FilenameUtils工具类 eksliang FilenameUtils common-io
转载请出自出处：http://eksliang.iteye.com/blog/2217081 一、概述这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。非常的好用。
xml文件解析SAX 不懂事的小屁孩 xml
xml文件解析:xml文件解析有四种方式， 1.DOM生成和解析XML文档(SAX是基于事件流的解析) 2.SAX生成和解析XML文档(基于XML文档树结构的解析) 3.DOM4J生成和解析XML文档 4.JDOM生成和解析XML 本文章用第一种方法进行解析，使用android常用的DefaultHandler import org.xml.sax.Attributes;
通过定时任务执行mysql的定期删除和新建分区，此处是按日分区酷的飞上天空 mysql
使用python脚本作为命令脚本，linux的定时任务来每天定时执行 #!/usr/bin/python # -*- coding: utf8 -*- import pymysql import datetime import calendar #要分区的表 table_name = 'my_table' #连接数据库的信息 host,user,passwd,db =
如何搭建数据湖架构？听听专家的意见蓝儿唯美架构
Edo Interactive在几年前遇到一个大问题：公司使用交易数据来帮助零售商和餐馆进行个性化促销，但其数据仓库没有足够时间去处理所有的信用卡和借记卡交易数据 “我们要花费27小时来处理每日的数据量，”Edo主管基础设施和信息系统的高级副总裁Tim Garnto说道：“所以在2013年，我们放弃了现有的基于PostgreSQL的关系型数据库系统，使用了Hadoop集群作为公司的数
spring学习——控制反转与依赖注入 a-john spring
控制反转（Inversion of Control，英文缩写为IoC）是一个重要的面向对象编程的法则来削减计算机程序的耦合问题，也是轻量级的Spring框架的核心。控制反转一般分为两种类型，依赖注入（Dependency Injection，简称DI）和依赖查找（Dependency Lookup）。依赖注入应用比较广泛。
用spool+unixshell生成文本文件的方法 aijuans xshell
例如我们把scott.dept表生成文本文件的语句写成dept.sql,内容如下: 　　set pages 50000; 　　set lines 200; 　　set trims on; 　　set heading off; 　　spool /oracle_backup/log/test/dept.lst; 　　select deptno||','||dname||','||loc
1、基础--名词解析(OOA/OOD/OOP) asia007 学习基础知识
OOA:Object-Oriented Analysis（面向对象分析方法）是在一个系统的开发过程中进行了系统业务调查以后，按照面向对象的思想来分析问题。OOA与结构化分析有较大的区别。OOA所强调的是在系统调查资料的基础上，针对OO方法所需要的素材进行的归类分析和整理，而不是对管理业务现状和方法的分析。　　OOA（面向对象的分析）模型由5个层次（主题层、对象类层、结构层、属性层和服务层）
浅谈java转成json编码格式技术百合不是茶 json编码 java转成json编码
json编码;是一个轻量级的数据存储和传输的语言在java中需要引入json相关的包,引包方式在工程的lib下就可以了 JSON与JAVA数据的转换（JSON 即 JavaScript Object Natation，它是一种轻量级的数据交换格式，非常适合于服务器与 JavaScript 之间的数据的交
web.xml之Spring配置(基于Spring+Struts+Ibatis) bijian1013 java web.xml SSI spring配置
指定Spring配置文件位置 <context-param> <param-name>contextConfigLocation</param-name> <param-value> /WEB-INF/spring-dao-bean.xml,/WEB-INF/spring-resources.xml, /WEB-INF/
Installing SonarQube（Fail to download libraries from server） sunjing Install Sonar
1. Download and unzip the SonarQube distribution 2. Starting the Web Server The default port is "9000" and the context path is "/". These values can be changed in &l
【MongoDB学习笔记十一】Mongo副本集基本的增删查 bit1129 mongodb
一、创建复本集假设mongod,mongo已经配置在系统路径变量上，启动三个命令行窗口，分别执行如下命令： mongod --port 27017 --dbpath data1 --replSet rs0 mongod --port 27018 --dbpath data2 --replSet rs0 mongod --port 27019 -
Anychart图表系列二之执行Flash和HTML5渲染白糖_ Flash
今天介绍Anychart的Flash和HTML5渲染功能 HTML5 Anychart从6.0第一个版本起，已经逐渐开始支持各种图的HTML5渲染效果了，也就是说即使你没有安装Flash插件，只要浏览器支持HTML5，也能看到Anychart的图形（不过这些是需要做一些配置的）。这里要提醒下大家，Anychart6.0版本对HTML5的支持还不算很成熟，目前还处于
Laravel版本更新异常4.2.8-> 4.2.9 Declaration of ... CompilerEngine ... should be compa bozch laravel
昨天在为了把laravel升级到最新的版本，突然之间就出现了如下错误： ErrorException thrown with message "Declaration of Illuminate\View\Engines\CompilerEngine::handleViewException() should be compatible with Illuminate\View\Eng
编程之美-NIM游戏分析-石头总数为奇数时如何保证先动手者必胜 bylijinnan 编程之美
import java.util.Arrays; import java.util.Random; public class Nim { /**编程之美 NIM游戏分析问题：有N块石头和两个玩家A和B，玩家A先将石头随机分成若干堆，然后按照BABA...的顺序不断轮流取石头，能将剩下的石头一次取光的玩家获胜，每次取石头时，每个玩家只能从若干堆石头中任选一堆，
lunce创建索引及简单查询 chengxuyuancsdn 查询创建索引 lunce
import java.io.File; import java.io.IOException; import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.analysis.standard.StandardAnalyzer; import org.apache.lucene.document.Docume
[IT与投资]坚持独立自主的研究核心技术 comsci it
和别人合作开发某项产品....如果互相之间的技术水平不同,那么这种合作很难进行,一般都会成为强者控制弱者的方法和手段..... 所以弱者,在遇到技术难题的时候,最好不要一开始就去寻求强者的帮助,因为在我们这颗星球上,生物都有一种控制其
flashback transaction闪回事务查询 daizj oracle sql 闪回事务
闪回事务查询有别于闪回查询的特点有以下3个：（1）其正常工作不但需要利用撤销数据，还需要事先启用最小补充日志。（2）返回的结果不是以前的“旧”数据，而是能够将当前数据修改为以前的样子的撤销SQL（Undo SQL）语句。（3）集中地在名为flashback_transaction_query表上查询，而不是在各个表上通过“as of”或“vers
Java I/O之FilenameFilter类列举出指定路径下某个扩展名的文件游其是你 FilenameFilter
这是一个FilenameFilter类用法的例子，实现的列举出“c:\\folder“路径下所有以“.jpg”扩展名的文件。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
C语言学习五函数，函数的前置声明以及如何在软件开发中合理的设计函数来解决实际问题 dcj3sjt126com c
# include <stdio.h> int f(void) //括号中的void表示该函数不能接受数据，int表示返回的类型为int类型 { return 10; //向主调函数返回10 } void g(void) //函数名前面的void表示该函数没有返回值 { //return 10; //error 与第8行行首的void相矛盾 } in
今天在测试环境使用yum安装，遇到一个问题： Error: Cannot retrieve metalink for repository: epel. Pl dcj3sjt126com centos
今天在测试环境使用yum安装，遇到一个问题： Error: Cannot retrieve metalink for repository: epel. Please verify its path and try again 处理很简单，修改文件“/etc/yum.repos.d/epel.repo”，将baseurl的注释取消， mirrorlist注释掉。即可。 &n
单例模式 shuizhaosi888 单例模式
单例模式懒汉式 public class RunMain { /** * 私有构造 */ private RunMain() { } /** * 内部类，用于占位，只有 */ private static class SingletonRunMain { priv
Spring Security（09）——Filter 234390216 Spring Security
Filter 目录 1.1 Filter顺序 1.2 添加Filter到FilterChain 1.3 DelegatingFilterProxy 1.4 FilterChainProxy 1.5
公司项目NODEJS实践0.1 逐行分析JS源代码 mongodb nginx ubuntu nodejs
一、前言前端如何独立用nodeJs实现一个简单的注册、登录功能，是不是只用nodejs+sql就可以了？其实是可以实现，但离实际应用还有距离，那要怎么做才是实际可用的。网上有很多nod
java.lang.Math liuhaibo_ljf java Math lang
System.out.println(Math.PI); System.out.println(Math.abs(1.2)); System.out.println(Math.abs(1.2)); System.out.println(Math.abs(1)); System.out.println(Math.abs(111111111)); System.out.println(Mat
linux下时间同步 nonobaba ntp
今天在linux下做hbase集群的时候，发现hmaster启动成功了，但是用hbase命令进入shell的时候报了一个错误 PleaseHoldException: Master is initializing，查看了日志，大致意思是说master和slave时间不同步，没办法，只好找一种手动同步一下，后来发现一共部署了10来台机器，手动同步偏差又比较大，所以还是从网上找现成的解决方
ZooKeeper3.4.6的集群部署 roadrunners zookeeper 集群部署
ZooKeeper是Apache的一个开源项目，在分布式服务中应用比较广泛。它主要用来解决分布式应用中经常遇到的一些数据管理问题，如：统一命名服务、状态同步、集群管理、配置文件管理、同步锁、队列等。这里主要讲集群中ZooKeeper的部署。 1、准备工作我们准备3台机器做ZooKeeper集群，分别在3台机器上创建ZooKeeper需要的目录。数据存储目录
Java高效读取大文件 tomcat_oracle java
　　读取文件行的标准方式是在内存中读取，Guava 和Apache Commons IO都提供了如下所示快速读取文件行的方法：　　Files.readLines(new File(path), Charsets.UTF_8); 　　FileUtils.readLines(new File(path)); 　　这种方法带来的问题是文件的所有行都被存放在内存中，当文件足够大时很快就会导致
微信支付api返回的xml转换为Map的方法 xu3508620 xml map 微信api
举例如下： <xml> <return_code><![CDATA[SUCCESS]]></return_code> <return_msg><![CDATA[OK]]></return_msg> <appid><

2023 年 数维杯（C题）国际大学生数学建模挑战赛 |数学建模完整代码+建模过程全解全析