Lau_Sen

TensorFlow初尝试：CNN for Text Classification

1. Graph and Session in TensorFlow

import tensorflow as tf

# create a graph, and define a constant in it
with tf.Graph().as_default() as g:
	c = tf.constant(1.0)

# define a tensor in the default graph
t = tf.zeros([4, 4])

with tf.Session() as sess:
    assert t.graph == tf.get_default_graph()
    assert c.graph == g

with语句结束后Graph g， Session sess并不会被清除。不定义在指定Graph中的变量，会被定义在default graph中；而在Graph中定义的变量所在的图即为指定的graph。

如果不在sess中对相应的操作、变量等run的话，是无法获取其对应值的。

with tf.Session() as sess:
    t_value = sess.run(t)
    c_value = sess.run(c)  # raise error

上面报错的原因是，因为c定义在with tf.Graph().as_default() as g:中会导致两次创建的图不一样。

2. TensorFlow构建模型流程

1. 新建网络的类

将网络结构定义成一个类，将网络的参数作为class的成员变量，将网络的操作作为成员函数。

class TextCNN(object):

    def __init__(self, filter_sizes, filter_nums, embedding_size, vocab_size, max_length, num_classes):
        self.x_input = tf.placeholder(tf.int32, [None, max_length], name='x_input')
        self.y_input = tf.placeholder(tf.int32, [None, num_classes], name='y_input')

        with tf.device('/cpu:0'), tf.name_scope("embedding"):
            # Map scalars from x_input into random vectors
            embedding_matrix = tf.Variable(tf.random_uniform([vocab_size, embedding_size], -1.0, 1.0), name="embedding_matrix")
            embedded_chars = tf.nn.embedding_lookup(embedding_matrix, self.x_input)
            embedded_chars_expanded = tf.expand_dims(embedded_chars, -1)

        result_pooled = []
        for filter_size, filter_num in zip(filter_sizes, filter_nums):
            with tf.name_scope("conv-maxpool-%d" % filter_size):
                filter_shape = [filter_size, embedding_size, 1, filter_num]
                W = tf.Variable(tf.truncated_normal(filter_shape, stddev=0.1), name="W")
                b = tf.Variable(tf.constant(0.1, shape=[filter_num]), name="b")
                conv = tf.nn.conv2d(embedded_chars_expanded, W, strides=[1, 1, 1, 1], padding="VALID", name="conv")

                # Add bias/ Apply nonlinearity/ the activation function
                h = tf.nn.relu(tf.nn.bias_add(conv, b), name="relu")

                # Max-pooling over the outputs
                pooled = tf.nn.max_pool(h, ksize=[1, max_length - filter_size + 1, 1, 1], strides=[1, 1, 1, 1], padding='VALID', name="pool")
                result_pooled.append(pooled)

        # Combine all the pooled features
        num_filters_total = np.sum(filter_nums)
        h_pool = tf.concat(result_pooled, axis=3)
        h_pool_flat = tf.reshape(h_pool, [-1, num_filters_total])

        # Dropout layer
        h_drop = tf.nn.dropout(h_pool_flat, dropout_keep_prob, name='dropout')

        # Fully connected layer
        l2_loss = 0.0
        W = tf.get_variable("W", shape=[num_filters_total, num_classes], initializer=tf.contrib.layers.xavier_initializer())
        b = tf.Variable(tf.constant(0.1, shape=[num_classes]), name="b")
        l2_loss += tf.nn.l2_loss(W)
        l2_loss += tf.nn.l2_loss(b)
        scores = tf.nn.xw_plus_b(h_drop, W, b, name="scores")

        # Calculate mean cross-entropy loss
        losses = tf.nn.softmax_cross_entropy_with_logits_v2(logits=scores, labels=self.y_input)
        self.loss = tf.reduce_mean(losses) + l2_reg_lambda * l2_loss

        # Accuracy
        predictions = tf.argmax(scores, 1, name="predictions")
        correct_predictions = tf.equal(predictions, tf.argmax(self.y_input, 1))
        self.accuracy = tf.reduce_mean(tf.cast(correct_predictions, "float"), name="accuracy")

TextCNN类没有定义其他的成员函数，全部定义在__init__函数中，传入的参数是一些与网络结构相关的超参数。
主要的成员变量需要定义：input (包括features和labels)， loss，accuracy，loss和accuracy是input的函数。训练的时候run模型的loss，accuracy即可。
learning rate和optimizer是不在该类中进行定义的。

2. 处理数据集

# data pre-processing
def HandlePunctuation(str):
    # 匹配任意不为A-Za-z0-9(),!?\'\`这些字符的符号，将其替换为" "
    str = re.sub(r"[^A-Za-z0-9(),!?\'\`]", " ", str)
    str = re.sub(r"\'s", " \'s", str)
    str = re.sub(r"\'ve", " \'ve", str)
    str = re.sub(r"n\'t", " n\'t", str)
    str = re.sub(r"\'re", " \'re", str)
    str = re.sub(r"\'d", " \'d", str)
    str = re.sub(r"\'ll", " \'ll", str)
    str = re.sub(r",", " , ", str)
    str = re.sub(r"!", " ! ", str)
    str = re.sub(r"\(", " \( ", str)
    str = re.sub(r"\)", " \) ", str)
    str = re.sub(r"\?", " \? ", str)
    str = re.sub(r"\s{2,}", " ", str)
    return str.strip().lower()


def DataPreparation(pos_path, neg_path, val_percentage):
    print("loading data...")
    with open(pos_path, 'r', encoding='utf-8') as f:
        x_pos = f.readlines()
    with open(neg_path, 'r', encoding='utf-8') as f:
        x_neg = f.readlines()

    # strip '\n' in the end of every str, and handle the punctuations
    x_pos = [HandlePunctuation(x.strip()) for x in x_pos]
    x_neg = [HandlePunctuation(x.strip()) for x in x_neg]

    # generate one_hot labels
    y_pos = [[0, 1] for _ in range(len(x_pos))]
    y_neg = [[1, 0] for _ in range(len(x_neg))]
    y = np.concatenate([y_pos, y_neg], axis=0)

    # map words into ids. There is no need to tokenize documents.
    x_text = x_pos + x_neg  # Not     x_text = [x_pos, x_neg]
    max_length = max([len(x.split()) for x in x_text])
    vocab_processor = learn.preprocessing.VocabularyProcessor(max_length)
    x = np.array(list(vocab_processor.fit_transform(x_text)))

    # shuffle data
    np.random.seed(63)
    shuffle_index = np.random.permutation(np.arange(len(x)))  # not np.random.shuffle
    x_shuffled = x[shuffle_index]
    y_shuffled = y[shuffle_index]

    # split train/validation set
    split_postion = int(val_percentage * len(x))
    x_train, y_train = x_shuffled[split_postion:, :], y_shuffled[split_postion:, :]
    x_val, y_val = x_shuffled[:split_postion, :], y_shuffled[:split_postion, :]

    print("Data preparation is completed!\n")
    vocab_size = vocab_processor.vocabulary_.__len__()
    print("vocabulary size: %i"%vocab_size)

    del x_pos, x_neg, x_shuffled, y_shuffled, x, y
    return x_train, y_train, x_val, y_val, max_length, vocab_size

对原始数据集进行处理，包括分词，生成one-hot类标签，打乱数据，划分train set和 val set（也见有叫其为development set的）。

3. Batch生成器

def BatchGenerator(data, shuffle=True):
    data_size = data.shape[0]
    num_batches_per_epoch = data_size // batch_size + 1
    # shuffle data every epoch
    if shuffle is True:
        shuffle_indices = np.random.permutation(np.arange(data_size))
        data_shuffled = data[shuffle_indices]
    else:
        data_shuffled = data

    # split out data for every batch
    # 当for循环将range遍历之后，下一次调用BatchGenerator函数时，yield指向下一行，即跳出函数
    for idx in range(num_batches_per_epoch):
        start_pos = idx * batch_size
        end_pos = min(start_pos + batch_size, data_size - 1)

        yield data_shuffled[start_pos:end_pos]

此处的逻辑与训练过程中的循环有关。训练中包括一个epoch的大循环，小循环就是循环访问该BatchGenerator函数。每次循环中会访问BatchGenerator函数，但都会在函数内部的循环中，yield语句的下一行开始执行，执行到yeield语句时会返回一组训练数据（as a batch）。当数据集划分的batches读取完毕后，跳出小循环，开始下一次epoch大循环。
再次访问BatchGenerator时会从函数的第一行执行，对训练数据进行打乱。

4. 训练函数Trainer

def Trainer(x_train, y_train, x_val, y_val, max_length, num_classes, vocab_size):
    data = np.array(list(zip(x_train, y_train)))

    with tf.Graph().as_default() as g:

        # session configuration
        # with tf.Session(config=tf.ConfigProto(log_device_placement=True)) as sess: 会打印出来一堆CPU，GPU的配置信息
        # 设置了os.environ['CUDA_VISIBLE_DEVICES'] = '0' 即可

        # session configuration

        session_config = tf.ConfigProto(
            log_device_placement=False,
            allow_soft_placement=True,
        )
        session_config.gpu_options.allow_growth = True

        with tf.Session(config=session_config) as sess:

            # Class instantiation
            cnn = TextCNN(
                filter_sizes,
                filter_nums,
                embedding_size,
                vocab_size,
                max_length,
                num_classes
            )

            # Set Saver
            saver = tf.train.Saver(max_to_keep=5)

            # 指数衰减学习率
            # global decay_rate
            global_step = tf.Variable(0, name="global_step", trainable=False)
            lr = tf.train.exponential_decay(1e-2, global_step, decay_steps=20, decay_rate=decay_rate)

            # Set Optimizer（如果在optimizer中不加global_step, 则global_step不自增，原因是minimize()函数为全局计数）
            optimizer = tf.train.AdamOptimizer(lr)
            train_op = optimizer.minimize(cnn.loss, global_step=global_step)

            # Record summary
            loss_summary = tf.summary.scalar('loss', cnn.loss)
            acc_summary = tf.summary.scalar('accuracy', cnn.accuracy)
            merged_summary = tf.summary.merge([loss_summary, acc_summary])
            summary_writer_train = tf.summary.FileWriter(os.path.join(sum_path, 'train'), sess.graph)
            summary_writer_val = tf.summary.FileWriter(os.path.join(sum_path, 'val'), sess.graph)

            # Initialize all variables (这一句应该写在最后，run之前)
            sess.run(tf.global_variables_initializer())

            # check if checkpoint already exist
            if tf.train.get_checkpoint_state(ckpt_path):
                print("loading model from checkpoint...")
                # load latest checkpoint
                checkpoint = tf.train.latest_checkpoint(ckpt_path)
                saver.restore(sess, checkpoint)

            def train_step(x_batch, y_batch, train_op):
                feed = {
                    cnn.x_input: x_batch,
                    cnn.y_input: y_batch,
                }

                # Set global variable decay_rate to control exponential-decay leaning rate
                # global decay_rate
                global step
                _, step, learning_rate, loss, accuracy, summaries = sess.run(  # 此处learning_rate如果命名为lr会报重名错误
                    [train_op, global_step, lr, cnn.loss, cnn.accuracy, merged_summary],
                    feed_dict=feed)
                time_str = datetime.datetime.now().strftime('%Y-%m-%d %H:%M:%S')
                print("{}  |  step {:>5}  |  loss {:>9g}  |  acc {:>9g}  |  lr {:>5}".format(time_str, step, loss, accuracy, learning_rate))
                summary_writer_train.add_summary(summaries, step)

            def val_step(x_val, y_val):
                feed = {
                    cnn.x_input: x_val,
                    cnn.y_input: y_val
                }
                global step
                # Feed data to member variable of class TextCNN
                loss, accuracy, summaries = sess.run([cnn.loss, cnn.accuracy, merged_summary], feed_dict=feed)
                time_str = datetime.datetime.now().strftime('%Y-%m-%d %H:%M:%S')
                print("{}  |  step   val  |  loss {:9g}  |  acc {:9g}".format(time_str, loss, accuracy), '\n')
                summary_writer_val.add_summary(summaries, step)
                return accuracy

            acc_history = []
            for ep in range(num_epoch):
                print('\nepoch {:>4}'.format(ep))
                batcher = BatchGenerator(data, shuffle=True)
                for batch in batcher:
                    x_batch, y_batch = zip(*batch)
                    train_step(np.array(x_batch), np.array(y_batch), train_op)
                    cur_step = tf.train.global_step(sess, global_step)

                    if cur_step % val_interval == 0:
                        print('evaluating current model...')
                        acc_history.append(val_step(x_val, y_val))

                        # Save best model
                        if acc_history[-1] == max(acc_history):
                            print('save model checkpoint to %s\\\n'%ckpt_path)
                            saver.save(sess, os.path.join(ckpt_path, 'model-%s.ckpt'%str(int(time.time()))))

            print('evaluating current model...')
            val_step(x_val, y_val)

首先创建了一个默认图，在默认图中：1. 配置session； 2. 打开session，对网络类进行实例化； 3. 设置summary和saver，用来保存训练信息（主要是loss和accuracy）和checkpoints；4. 定义训练和验证操作的函数；5. 写循环进行训练，每个训练step记录summary，每隔val_interval对模型进行一次评价，并保存最佳模型（as a checkpoint）

在训练之前，需要检查ckpt_dir文件夹中是否已经有checkpoint文件，如果有，则可以直接载入之前训练过程中保存的模型，来接着训练。

5. 主函数main

def main(argv=None):

    # Check if the paths to contain summary and checkpoint exist. if not, make directories
    if not os.path.exists(sum_path):
        os.makedirs(sum_path)
    if not os.path.exists(ckpt_path):
        os.mkdir(ckpt_path)

    x_train, y_train, x_val, y_val, max_length, vocab_size = DataPreparation(pos_path, neg_path, val_percentage)
    Trainer(x_train, y_train, x_val, y_val, max_length, num_classes, vocab_size)


if __name__ == '__main__':
    tf.app.run()

在执行tf.app.run()的时候，需要先解析tf.app.FLAGS（相当于解析命令行），获得全局变量。
在main函数中确认保存summary，和checkpoint的目录是否存在，如果不存在，需要创建对应的目录。

3. 其他

1. TensorBoard

为了将实验结果可视化，利用保存的summary信息，在TensorBoard中进行展示。

win+R打开命令行窗口，输入：tensorboard --logdir=xxx，其中xxx是保存summary的地方文件目录（不必输入summary的文件名）
回车，得到一个网址： http://DESKTOP-O0K5FTH:6006。
保持命令行窗口打开，复制网址到浏览器，即可看到summary中保存的loss和accuracy的图像化展示。

2. CUDA assignment

# control the visibility of GPUs
os.environ['CUDA_VISIBLE_DEVICES'] = 0  # only gpu0 can be used, other device 

# session configuration
session_config = tf.ConfigProto(
    log_device_placement=False,  # 是否打印设备分配日志
    allow_soft_placement=True,  # 如果指定设备不存在，允许TF自动分配设备
)

# control the occupancy of computing resource of your GPU：gradually increasing
session_config.gpu_options.allow_growth = True

with tf.Session(config=session_config) as sess:
	pass

with tf.device(‘/gpu:0’):
    # 程序将只会在gpu0上运行，但仍然会默认使用全部的计算资源
    pass

3. 一些报错及解决方案

loss急速增大，变为nan
考虑是梯度爆炸，或者是学习率过大的问题。实际上是因为指数衰减学习率的decay rate设置成了一个大于1的数，导致学习率指数上升。

# lr=tf.train.exponential_decay(1e-2,global_step,decay_steps=10,decay_rate=2)
lr=tf.train.exponential_decay(1e-2,global_step,decay_steps=20,decay_rate=0.95)

UnknownError 一般只需要关闭IDE，再重启即可

UnknownError (see above for traceback): Failed to get convolution algorithm. This is probably because cuDNN failed to initialize, so try looking to see if a warning log message was printed above.
		 [[node conv-maxpool-2/conv (defined at D:/Develop/Exercises/tf/tf05_cnn.py:131)  = Conv2D[T=DT_FLOAT, data_format="NCHW", dilations=[1, 1, 1, 1], padding="VALID", strides=[1, 1, 1, 1], use_cudnn_on_gpu=true, _device="/job:localhost/replica:0/task:0/device:GPU:0"](gradients/conv-maxpool-5/conv_grad/Conv2DBackpropFilter-0-TransposeNHWCToNCHW-LayoutOptimizer, conv-maxpool-2/W/read)]]
		 [[{{node gradients/embedding/embedding_lookup_grad/Reshape/_29}} = _Recv[client_terminated=false, recv_device="/job:localhost/replica:0/task:0/device:CPU:0", send_device="/job:localhost/replica:0/task:0/device:GPU:0", send_device_incarnation=1, tensor_name="edge_410_gradients/embedding/embedding_lookup_grad/Reshape", tensor_type=DT_FLOAT, _device="/job:localhost/replica:0/task:0/device:CPU:0"]()]]

要把变量定义在同一个Graph下
因此建议除了超参数，其他的变量都在with tf.Graph().as_default_graph:中进行定义。

ValueError: Tensor("Adam/update_embedding/embedding_matrix/Sqrt:0", shape=(), dtype=float32, device=/device:CPU:0) must be from the same graph as Tensor("ExponentialDecay:0", shape=(), dtype=float32)

有变量定义在了sess.run(tf.global_variables_initializer())之后，导致参数没有被初始化

FailedPreconditionError (see above for traceback): Attempting to use uninitialized value embedding/embedding_matrix/Adam
 [[node embedding/embedding_matrix/Adam/read (defined at D:/Develop/Exercises/tf/tf05_cnn.py:212)  = Identity[T=DT_FLOAT, _class=["loc:@Adam/update_embedding/embedding_matrix/AssignSub"], _device="/job:localhost/replica:0/task:0/device:CPU:0"](embedding/embedding_matrix/Adam)]]

定义main函数的时候要写def main(argv=None):
只写def main(argv):会报错。

TypeError: main() takes 0 positional arguments but 1 was given

4. Jupyter Notebook

win + R: 进入命令行窗口；
输入： jupyter notebook，或ipython notebook
将在默认浏览器中弹出如下页面，找到.ipynb即可打开

但是默认打开的是C盘目录，当此时.ipynb文件存放在其他盘符之下，就需要在命令行窗口中切换盘符，再输入jupyter notebook。如下所示：

即可打开d盘目录：

Python socket编程可爱的蜗牛牛 python 服务器 linux
服务端#服务端importsocket#引入socket模块#importcommands#执行系统命令模块#HOST='0.0.0.0'#指定服务端地址HOST=''#ip地址PORT=50007#指定端口号s=socket.socket(socket.AF_INET,socket.SOCK_STREAM)#定义socket类型，网络通信，TCPs.bind((HOST,PORT))#绑定IP与
Python 学习之旅：持续学习和扩展（一）单元测试（unittest 模块）喜-喜 Python学习 python 学习单元测试
在Python学习的高级阶段，持续提升代码质量和可靠性是关键。单元测试作为软件开发过程中的重要一环，能够帮助我们发现代码中的潜在问题，确保程序的正确性。Python的unittest模块提供了一套丰富的工具，让我们可以轻松地编写和执行单元测试。接下来，让我们深入了解unittest模块，看看如何通过它来提升代码的质量。一、单元测试的重要性你可以把单元测试想象成建筑中的质量检测环节。在建造高
【FL0091】基于SSM和微信小程序的社区二手物品交易小程序猿毕设小程序微信小程序 spring boot python 后端 java
‍博主介绍‍全网粉丝10W+,CSDN全栈领域优质创作者，博客之星、掘金/知乎/b站/华为云/阿里云等平台优质作者、专注于Java、小程序/APP、python、大数据等技术领域和毕业项目实战，以及程序定制化开发、文档编写、答疑辅导等。精彩专栏推荐订阅计算机毕业设计精品项目案例（持续更新）文末获取源码+数据库+文档感兴趣的可以先收藏起来，还有大家在毕设选题，项目以及论文编写等相关问题都可以和学长沟
使用Android Studio编写Python代码海上的风浪 android studio python android Android
使用AndroidStudio编写Python代码随着移动应用的快速发展，AndroidStudio成为了开发者们首选的集成开发环境。虽然AndroidStudio主要用于开发Android应用程序，但是我们也可以在其中编写和运行Python代码。在本文中，我将详细介绍如何在AndroidStudio中编写Python代码，并附上相应的源代码。首先，确保你已经安装了AndroidStudio并且环
用PyTorch玩转数据：从整理到“看图说话开心快乐幸福一家人 pytorch 人工智能 python
最近在实验室鼓捣深度学习项目，发现PyTorch的数据处理流程简直像搭乐高——每个模块都精准卡位。今天就把这套"厨房级"工具链拆解给大家看看，连我这种手残党都能轻松上手。01数据收纳术：你的专属AI管家想象你有一堆杂乱照片需要整理。PyTorch的Dataset类就像智能相册，只要定义好__getitem__（怎么找照片）和__len__（总共有多少张），它就能瞬间把你的数据码得整整齐齐。而Dat
11个案例讲透 Python 函数参数！洪峰科技大数据
大家好，我是洪峰今天给大家分享一下明哥整理的一篇Python参数的内容，内容非常的干，全文通过案例的形式来理解知识点，自认为比网上80%的文章讲的都要明白，如果你是入门不久的python新手，相信本篇文章应该对你会有不小的帮助。接下来是正文。1.参数分类函数，在定义的时候，可以有参数的，也可以没有参数。从函数定义的角度来看，参数可以分为两种：必选参数：调用函数时必须要指定的参数，在定义时没有等号可
Python大数据可视化：基于Python的王者荣耀战队的数据分析系统设计与实现_flask+hadoop+spider m0_74823490 面试学习路线阿里巴巴 python flask hadoop
开发语言：Python框架：flaskPython版本：python3.7.7数据库：mysql5.7数据库工具：Navicat11开发软件：PyCharm系统展示管理员登录管理员功能界面比赛信息管理看板展示系统管理摘要本文使用Python与MYSQL技术搭建了一个王者荣耀战队的数据分析系统。对用户提出的功能进行合理分析，然后搭建开发平台以及配置计算机软硬件；通过对数据流图以及系统结构的设计，创建
Selenium按文本查找元素全解析 test猿 selenium 测试工具
以下方法基于Python语言实现，适用于最新版Selenium4.15+，建议收藏备用！‌方法一：XPath文本定位‌pythonCopyCode#精确匹配文本（全字符匹配）element=driver.find_element(By.XPATH,'//*[text()="完整文本内容"]')#部分匹配文本（包含指定字符串）element=driver.find_element(By.XPATH,
deepseek+python实现对话中上传文件守着黎明看日出 python 开发语言
部署本地api：https://blog.csdn.net/qq_35809258/article/details/145481113实现持续对话：https://blog.csdn.net/qq_35809258/article/details/145490986通过以上两个链接基本对话环境齐备，直接进行下一步上传的文件类型可能有多种，需要安装所用到的python库pipinstallpytho
Python在实际工作中的运用-通用格式CSV文件自动转换XLSX 老胖闲聊 Python python excel
继续上篇《Python在实际工作中的运用-CSV无损转XLSX的几个方法》我们虽然对特定格式的CSV实现了快速转换XLSX的目标，但是在运行Py脚本前，还是需要编辑表格创建脚本和数据插入脚本，自动化程度很低，实用性不强，为减少人工提高效率，实现输入CSV文件路径即可自动适配完成转换。现将改进后的脚本发出来，供大家共同交流学习。脚本说明：1、本脚本适合字段之间用空格分隔或者用逗号分隔的CSV文本2、
在Anaconda的虚拟环境中安装R，并在vscode中使用 smx6666668 r语言 vscode 开发语言
在Anaconda的虚拟环境中使用R，并且希望在VSCode中同时使用Python和R，确实需要同时安装Python和R。这是因为VSCode的Jupyter插件和内核管理依赖于Python，而R则作为Jupyter的另一个内核运行。以下是具体的操作步骤和逻辑：1.为什么需要同时安装Python和RVSCode的Jupyter插件：VSCode的Jupyter扩展是基于Python的，安装后需要P
通过Python编程语言实现“机器学习”小项目教程案例指尖下的技术 DeepSeek python 机器学习开发语言
以下为你提供一个使用Python实现简单机器学习项目的教程案例，此案例将使用鸢尾花数据集进行分类任务，运用经典的支持向量机（SVM）算法。步骤1：环境准备首先，你要确保已经安装了必要的Python库，像scikit-learn、pandas、matplotlib和seaborn。可以使用以下命令进行安装：pipinstallscikit-learnpandasmatplotlibseaborn步骤
conda创建环境/安装包报错网络问题胖胖大王叫我来巡山 conda python
1.报错(base)xx@xxxdeMacBook-Proanaconda3%condacreate-nworkpython=3.7.11Collectingpackagemetadata(current_repodata.json):failedCondaHTTPError:HTTP000CONNECTIONFAILEDforurlElapsed:-AnHTTPerroroccurredwhen
python多版本与虚拟环境克金森沐沐 python 学习基础入门 python
这篇纯python技术文章，平时也会用到，在此记录一下。用macOS和Ubutntu的同学都知道系统默认安装的Python2.7.x，然后，我们平时python开发用的python3，所以，需要额外安装一个Python3.x的版本。之前，是使用robotframework-ride但它只支持python3.7，于是，安装python3.7。（注：现在已经支持3.8了）前几天，想学习一下tinygr
自编大模型系列之 01 使用 Python 从头构建 LLaMA 3 编写您自己的十亿参数LLM（教程含源码）知识大胖 NVIDIA GPU和大语言模型开发教程 python llama 开发语言
LLaMA3是继Mistral之后最有前途的开源模型之一，可以解决各种任务。我之前在Medium上写过一篇博客，介绍如何使用LLaMA架构从头开始创建一个具有超过230万个参数的LLM。现在LLaMA-3已经发布，我们将以更简单的方式重新创建它。我们不会在本博客中使用GPU，但您至少需要17GB的RAM，因为我们将加载一些大小超过15GB的文件。如果这对您来说是个问题，您可以使用Kaggle作为解
模式识别课程设计：人脸识别背景与问题引入之问题描述 XLYcmy 模式识别网络安全人工智能课程设计模式识别人脸识别 PCA LLM
1.2问题描述通过之前的背景介绍可以知道人脸识别技术作为计算机视觉和模式识别领域的重要研究方向，已广泛应用于身份验证、安全监控、智能家居等多个领域。随着计算机硬件性能的不断提升和深度学习技术的成熟，人脸识别的精度和应用场景不断扩展。本研究设计了一种基于主成分分析（PCA）[7]和K-L变换的人脸识别系统，利用ORL人脸数据库作为数据源，对输入的人脸图像进行识别，并输出与其特征最相似的人脸。该系统的
Python多环境管理 JoyceLiu_Ronghua python 开发语言
这里介绍两种常用的环境管理。第一种，利用python内置的venv创建。创建环境：Linux：python3-mvenv/path/to/new/virtual/environmentwindow：python-mvenvD:\py\my_env激活环境：my_venv\Scripts\activate激活后，前面会显示环境名称(my_env)D:\py\my_env\Scripts\>pipin
深度学习模型大小与模型推理速度的探讨 ICUD 深度学习人工智能 python
**昨天看到了非常好的两篇文章想在此记录和保存，由于模型的实时推理包含很多方面的因素，因而也庆幸能有机会看到这样的文章。**参考大佬：https://zhuanlan.zhihu.com/p/411522457
2025年CTF夺旗赛-从零基础入门到竞赛，看这一篇就稳了！白帽安全-黑客4148 网络安全 web安全 linux 密码学 CTF
目录一、CTF简介二、CTF竞赛模式三、CTF各大题型简介四、CTF学习路线4.1、初期1、html+css+js（2-3天）2、apache+php（4-5天）3、mysql（2-3天）4、python(2-3天)5、burpsuite（1-2天）4.2、中期1、SQL注入（7-8天）2、文件上传（7-8天）3、其他漏洞（14-15天）4.3、后期五、CTF学习资源5.1、CTF赛题复现平台5.
python曲线回归小案例教程 jackispy python 回归开发语言
一、曲线回归的定义曲线回归是一种统计方法，用于建立自变量（独立变量）和因变量（依赖变量）之间的非线性关系模型。与线性回归不同，线性回归假设自变量和因变量之间的关系是线性的，即可以通过一条直线来描述数据点的趋势；而曲线回归则允许这种关系是非线性的，可能表现为曲线、抛物线、指数、对数或其他复杂的数学形式。其主要特征如下：非线性关系：曲线回归适用于那些不能用直线来充分描述的数据关系。它允许模型以曲线形式
AIGC生图技术剖析：文本生成图像的核心算法与创新应用喵手零基础学Java AIGC 算法
全文目录：开篇语前言AIGC技术核心：从文本到图像的转换1.文本编码与语义提取2.生成对抗网络（GAN）3.变分自编码器（VAE）4.融合模型：CLIP+VQ-GAN核心算法示例：使用Python生成图像使用OpenAI的DALL-E生成图像解释AIGC在多个领域的应用前景1.艺术创作2.广告设计3.虚拟现实（VR）与增强现实（AR）4.游戏开发总结：AIGC生图技术的未来文末开篇语哈喽，各位小伙
Python-sys.argv[] 哗啦呼啦嘿 python Python sys.argv[]
sys.argv[]说白了就是一个从程序外部获取参数的桥梁，这个“外部”很关键，所以那些试图从代码来说明它作用的解释一直没看明白。因为我们从外部取得的参数可以是多个，所以获得的是一个列表（list)，也就是说sys.argv其实可以看作是一个列表，所以才能用[]提取其中的元素。其第一个元素是程序本身，随后才依次是外部给予的参数。1.下面我们通过一个极简单的test.py程序的运行结果来说明它的用法
通义灵码 - 你的 AI 智能编码小助手甘蓝聊Java 【更新中...】项目中的那些事人工智能 AI 通义灵码 Java 编码助手
文章目录核心功能快速安装版本选择安装插件登录通义灵码相关配置体验功能基础功能研发智能问答AI程序员体验有感参考官网：https://lingma.aliyun.com/⭐版本：2.0.3【截至2025/02/05】❓简介：通义灵码，一款基于通义大模型的智能编码辅助工具。支持多种编程语言，比如Java、Go、Python、JavaScript、TypeScript等支持多种IDE，比如IDEA、VS
「Selenium+Python自动化从0到1①｜2025最新环境搭建+浏览器驱动避坑指南（附验证代码）」俗人咖 selenium python 自动化
Selenium+Python自动化1-环境搭建一、Selenium简介Selenium是一个广泛使用的自动化测试工具，主要用于Web应用程序的自动化测试。它支持多种编程语言（如Java、Python、C#、Ruby、JavaScript等），并允许用户控制浏览器执行自动化任务，例如点击按钮、填写表单、验证页面内容等。Selenium可以在多种浏览器（如Chrome、Firefox、Edge、Sa
大模型成本优化实战：从分布式训练到量化剪枝，轻松降低AI计算开销网罗开发 AI 大模型人工智能机器学习深度学习
网罗开发（小红书、快手、视频号同名）大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、HarmonyOS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。图书作者：《ESP32-C3物联网工程开发实战》图书作者：《SwiftUI入门，进阶与实战》超级个体：CO
高并发微服务日志管理：ELK、Loki、Fluentd 终极对决与实战指南网罗开发 java集后端云原生微服务 elk 架构
网罗开发（小红书、快手、视频号同名）大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、HarmonyOS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。图书作者：《ESP32-C3物联网工程开发实战》图书作者：《SwiftUI入门，进阶与实战》超级个体：CO
python基础之零基础入门【参数说明+代码实战】步入烟尘 Python超入门指南全册 python 开发语言高级语言 Python入门
本文已收录于《Python超入门指南全册》本专栏专门针对零基础和需要进阶提升的同学所准备的一套完整教学，从基础到精通不断进阶深入，后续还有实战项目，轻松应对面试，专栏订阅地址：https://blog.csdn.net/mrdeam/category_12647587.html优点：订阅限时19.9付费专栏，私信博主还可进入全栈VIP答疑群，作者优先解答机会（代码指导、远程服务），群里大佬众多可以
python学习第七天之面向对象 code_talking python 学习开发语言
面向对象及作用域一、面向对象1.__init__方法(构造方法)1.语法__init__方法是一个特殊的方法，在创建一个对象时自动调用。2.类的方法3.继承1.语法4.多继承1.语法4.方法重写5.类属性与方法1.类的私有属性2.类的方法3.类的私有方法4.类的专有方法5.运算符重载二、命名空间1.作用域2.关键字一、面向对象变量使用之前要先定义定义方法给就是给变量赋值#定义整数变量x=10#定义
导读：生活中的设计模式——启程之前，请不要错过我陌尘(MoChen) 精品课设计模式 Python 榜单
为什么叫设计模式什么是设计模式设计模式与生活有什么联系为什么要学设计模式如何进行学习为什么选择Python弥补市场空缺大势所趋，Python已然成风简单的Python基础Python的特点基本语法常用容器List（列表）Tuple（元组）Dictionary（字典）类的定义Demo让你顿悟重要说明两年前CSDN出了一个产品叫ink，旨在提供一个高质量的写作环境，那时就有写设计模式这一系列的想法了，
用 PyTorch/TensorFlow 搭建简单全连接神经网络 gs80140 AI pytorch tensorflow 神经网络
目录用PyTorch/TensorFlow搭建简单全连接神经网络网络结构概述1.使用PyTorch构建网络2.使用TensorFlow构建网络总结用PyTorch/TensorFlow搭建简单全连接神经网络在本篇博客中，我们将介绍如何使用两大深度学习框架——PyTorch和TensorFlow，构建一个简单的全连接神经网络。该网络包含输入层、一个隐藏层和输出层，适合初学者理解神经网络的基本构建模块
多线程编程之卫生间周凡杨 java 并发卫生间线程厕所
如大家所知，火车上车厢的卫生间很小，每次只能容纳一个人，一个车厢只有一个卫生间，这个卫生间会被多个人同时使用，在实际使用时，当一个人进入卫生间时则会把卫生间锁上，等出来时打开门，下一个人进去把门锁上，如果有一个人在卫生间内部则别人的人发现门是锁的则只能在外面等待。问题分析：首先问题中有两个实体，一个是人，一个是厕所，所以设计程序时就可以设计两个类。人是多数的，厕所只有一个（暂且模拟的是一个车厢）。
How to Install GUI to Centos Minimal sunjing linux Install Desktop GUI
http://www.namhuy.net/475/how-to-install-gui-to-centos-minimal.html I have centos 6.3 minimal running as web server. I’m looking to install gui to my server to vnc to my server. You can insta
Shell 函数 daizj shell 函数
Shell 函数 linux shell 可以用户定义函数，然后在shell脚本中可以随便调用。 shell中函数的定义格式如下： [function] funname [()]{ action; [return int;] } 说明： 1、可以带function fun() 定义，也可以直接fun() 定义,不带任何参数。 2、参数返回
Linux服务器新手操作之一周凡杨 Linux 简单操作
1.whoami 当一个用户登录Linux系统之后，也许他想知道自己是发哪个用户登录的。此时可以使用whoami命令。 [ecuser@HA5-DZ05 ~]$ whoami e
浅谈Socket通信（一）朱辉辉33 socket
在java中ServerSocket用于服务器端，用来监听端口。通过服务器监听，客户端发送请求，双方建立链接后才能通信。当服务器和客户端建立链接后，两边都会产生一个Socket实例，我们可以通过操作Socket来建立通信。首先我建立一个ServerSocket对象。当然要导入java.net.ServerSocket包 ServerSock
关于框架的简单认识西蜀石兰框架
入职两个月多，依然是一个不会写代码的小白，每天的工作就是看代码，写wiki。前端接触CSS、HTML、JS等语言，一直在用的CS模型，自然免不了数据库的链接及使用，真心涉及框架，项目中用到的BootStrap算一个吧，哦，JQuery只能算半个框架吧，我更觉得它是另外一种语言。后台一直是纯Java代码，涉及的框架是Quzrtz和log4j。都说学前端的要知道三大框架，目前node.
You have an error in your SQL syntax; check the manual that corresponds to your 林鹤霄
You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'option,changed_ids ) values('0ac91f167f754c8cbac00e9e3dc372
MySQL5.6的my.ini配置 aigo mysql
注意：以下配置的服务器硬件是：8核16G内存 [client] port=3306 [mysql] default-character-set=utf8 [mysqld] port=3306 basedir=D:/mysql-5.6.21-win
mysql 全文模糊查找便捷解决方案 alxw4616 mysql
mysql 全文模糊查找便捷解决方案 2013/6/14 by 半仙 [email protected] 目的: 项目需求实现模糊查找. 原则: 查询不能超过 1秒. 问题: 目标表中有超过1千万条记录. 使用like '%str%' 进行模糊查询无法达到性能需求. 解决方案: 使用mysql全文索引. 1.全文索引 : MySQL支持全文索引和搜索功能。MySQL中的全文索
自定义数据结构链表(单项 ,双向,环形) 百合不是茶单项链表双向链表
链表与动态数组的实现方式差不多, 数组适合快速删除某个元素链表则可以快速的保存数组并且可以是不连续的单项链表;数据从第一个指向最后一个实现代码: //定义动态链表 clas
threadLocal实例 bijian1013 java thread java多线程 threadLocal
实例1： package com.bijian.thread; public class MyThread extends Thread { private static ThreadLocal tl = new ThreadLocal() { protected synchronized Object initialValue() { return new Inte
activemq安全设置—设置admin的用户名和密码 bijian1013 java activemq
ActiveMQ使用的是jetty服务器, 打开conf/jetty.xml文件，找到 <bean id="adminSecurityConstraint" class="org.eclipse.jetty.util.security.Constraint"> <p
【Java范型一】Java范型详解之范型集合和自定义范型类 bit1129 java
本文详细介绍Java的范型，写一篇关于范型的博客原因有两个，前几天要写个范型方法(返回值根据传入的类型而定)，竟然想了半天，最后还是从网上找了个范型方法的写法；再者，前一段时间在看Gson, Gson这个JSON包的精华就在于对范型的优雅简单的处理，看它的源代码就比较迷糊，只其然不知其所以然。所以，还是花点时间系统的整理总结下范型吧。范型内容范型集合类范型类
【HBase十二】HFile存储的是一个列族的数据 bit1129 hbase
在HBase中，每个HFile存储的是一个表中一个列族的数据，也就是说，当一个表中有多个列簇时，针对每个列簇插入数据，最后产生的数据是多个HFile，每个对应一个列族，通过如下操作验证 1. 建立一个有两个列族的表 create 'members','colfam1','colfam2' 2. 在members表中的colfam1中插入50*5
Nginx 官方一个配置实例 ronin47 nginx 配置实例
user www www; worker_processes 5; error_log logs/error.log; pid logs/nginx.pid; worker_rlimit_nofile 8192; events { worker_connections 4096;} http { include conf/mim
java-15.输入一颗二元查找树，将该树转换为它的镜像，即在转换后的二元查找树中，左子树的结点都大于右子树的结点。用递归和循环 bylijinnan java
//use recursion public static void mirrorHelp1(Node node){ if(node==null)return; swapChild(node); mirrorHelp1(node.getLeft()); mirrorHelp1(node.getRight()); } //use no recursion bu
返回null还是empty bylijinnan java apache spring 编程
第一个问题，函数是应当返回null还是长度为0的数组（或集合）？第二个问题，函数输入参数不当时，是异常还是返回null？先看第一个问题有两个约定我觉得应当遵守： 1.返回零长度的数组或集合而不是null（详见《Effective Java》）理由就是，如果返回empty，就可以少了很多not-null判断： List<Person> list
[科技与项目]工作流厂商的战略机遇期 comsci 工作流
在新的战略平衡形成之前，这里有一个短暂的战略机遇期，只有大概最短6年，最长14年的时间，这段时间就好像我们森林里面的小动物，在秋天中，必须抓紧一切时间存储坚果一样，否则无法熬过漫长的冬季。。。。在微软，甲骨文，谷歌，IBM,SONY
过度设计-举例 cuityang 过度设计
过度设计，需要更多设计时间和测试成本，如无必要，还是尽量简洁一些好。未来的事情，比如访问量，比如数据库的容量，比如是否需要改成分布式都是无法预料的再举一个例子，对闰年的判断逻辑：　　1、 if($Year%4==0) return True; else return Fasle; 　　2、if ( ($Year%4==0 &am
java进阶，《Java性能优化权威指南》试读 darkblue086 java性能优化
记得当年随意读了微软出版社的.NET 2.0应用程序调试，才发现调试器如此强大，应用程序开发调试其实真的简单了很多，不仅仅是因为里面介绍了很多调试器工具的使用，更是因为里面寻找问题并重现问题的思想让我震撼，时隔多年，Java已经如日中天，成为许多大型企业应用的首选，而今天，这本《Java性能优化权威指南》让我再次找到了这种感觉，从不经意的开发过程让我刮目相看，原来性能调优不是简单地看看热点在哪里，
网络学习笔记初识OSI七层模型与TCP协议 dcj3sjt126com 学习笔记
协议：在计算机网络中通信各方面所达成的、共同遵守和执行的一系列约定　　计算机网络的体系结构：计算机网络的层次结构和各层协议的集合。　　两类服务：　　面向连接的服务通信双方在通信之前先建立某种状态，并在通信过程中维持这种状态的变化，同时为服务对象预先分配一定的资源。这种服务叫做面向连接的服务。　　面向无连接的服务通信双方在通信前后不建立和维持状态，不为服务对象
mac中用命令行运行mysql dcj3sjt126com mysql linux mac
参考这篇博客：http://www.cnblogs.com/macro-cheng/archive/2011/10/25/mysql-001.html 感觉workbench不好用（有点先入为主了）。 1，安装mysql 在mysql的官方网站下载 mysql 5.5.23 http://www.mysql.com/downloads/mysql/，根据我的机器的配置情况选择了64
MongDB查询（1）——基本查询[五] eksliang mongodb mongodb 查询 mongodb find
MongDB查询转载请出自出处：http://eksliang.iteye.com/blog/2174452 一、find简介 MongoDB中使用find来进行查询。 API:如下 function ( query , fields , limit , skip, batchSize, options ){.....} 参数含义： query:查询参数 fie
base64，加密解密经融加密，对接 y806839048 经融加密对接
String data0 = new String(Base64.encode(bo.getPaymentResult().getBytes(("GBK")))); String data1 = new String(Base64.decode(data0.toCharArray()),"GBK"); // 注意编码格式，注意用于加密，解密的要是同
JavaWeb之JSP概述 ihuning javaweb
什么是JSP？为什么使用JSP？ JSP表示Java Server Page，即嵌有Java代码的HTML页面。使用JSP是因为在HTML中嵌入Java代码比在Java代码中拼接字符串更容易、更方便和更高效。 JSP起源在很多动态网页中，绝大部分内容都是固定不变的，只有局部内容需要动态产生和改变。如果使用Servl
apple watch 指南啸笑天 apple
1. 文档 WatchKit Programming Guide（中译在线版 By @CocoaChina）译文译者原文概览 - 开始为 Apple Watch 进行开发 @星夜暮晨 Overview - Developing for Apple Watch 概览 - 配置 Xcode 项目 - Overview - Configuring Yo
java经典的基础题目 macroli java 编程
1.列举出 10个JAVA语言的优势 a:免费，开源，跨平台(平台独立性)，简单易用，功能完善，面向对象，健壮性，多线程，结构中立，企业应用的成熟平台, 无线应用 2.列举出JAVA中10个面向对象编程的术语 a:包，类，接口，对象，属性，方法，构造器，继承，封装，多态，抽象，范型 3.列举出JAVA中6个比较常用的包 Java.lang;java.util;java.io;java.sql;ja
你所不知道神奇的js replace正则表达式 qiaolevip 每天进步一点点学习永无止境纵观千象 regex
var v = 'C9CFBAA3CAD0'; console.log(v); var arr = v.split(''); for (var i = 0; i < arr.length; i ++) { if (i % 2 == 0) arr[i] = '%' + arr[i]; } console.log(arr.join('')); console.log(v.r
[一起学Hive]之十五-分析Hive表和分区的统计信息(Statistics) superlxw1234 hive hive分析表 hive统计信息 hive Statistics
关键字：Hive统计信息、分析Hive表、Hive Statistics 类似于Oracle的分析表，Hive中也提供了分析表和分区的功能，通过自动和手动分析Hive表，将Hive表的一些统计信息存储到元数据中。表和分区的统计信息主要包括：行数、文件数、原始数据大小、所占存储大小、最后一次操作时间等； 14.1 新表的统计信息对于一个新创建
Spring Boot 1.2.5 发布 wiselyman spring boot
Spring Boot 1.2.5已在7月2日发布，现在可以从spring的maven库和maven中心库下载。这个版本是一个维护的发布版，主要是一些修复以及将Spring的依赖提升至4.1.7(包含重要的安全修复)。官方建议所有的Spring Boot用户升级这个版本。项目首页 | 源