林楚海

Seq2Seq文本生成与tensorflow实现

1. 引言

近年来，深度神经网络在很多任务上都取得了不错的成绩，比如文本分类、图像识别等等，但是我们知道，像DNN神经网络结构只能解决一些分类或回归问题，而很多日常的任务却是一个序列到一个序列的映射问题，比如语音识别、机器翻译、对话系统等等，他们的输入和输出都是边长，而DNN要求输入和输出都是固定维度的，因此，这时需要引入新的结构，才能解决这种序列到序列的生成问题。2014年，谷歌提出了一种新的神经网络结构——Seq2Seq，就是用来专门解决这种序列的生成问题，并且在机器翻译等任务上都取得了出色的表现，本文将对该模型进行展开介绍，并用tensorflow来实现它。原论文的下载地址如下：

论文地址：《Sequence to Sequence Learning with Neural Networks》

2. Seq2Seq模型介绍

2.1 Seq2Seq模型结构

Seq2Seq模型主要包含两个部分，即一个编码器（encoder）和一个解码器（decoder），编码器和解码器分别采用LSTM神经元，因为LSTM神经元相比RNN更能提取长句子中的依赖信息。Seq2Seq的基本原理就是在编码器时，通过LSTM把输入转化为一个固定维度的向量作为输入句子的向量表示，然后将这个向量作为解码器中LSTM层隐藏层的初始化向量，接着逐步进行解码，将其转化为目标输出序列。

Seq2Seq模型的目标其实就是计算这样一个条件概率 $p \left( y _ { 1 } , \dots , y _ { T ^ { \prime } } | x _ { 1 } , \ldots , x _ { T } \right)$ ，其中 $\left( x _ { 1 } , \ldots , x _ { T } \right)$ 表示输入序列，其序列长度为， $y _ { 1 } , \dots , y _ { T ^ { \prime } }$ 表示输出序列，其序列长度为 $T ^ { \prime }$ ，和 $T ^ { \prime }$ 的大小可以不相同。在编码器（encoder）时，LSTM将输入序列 $\left( x _ { 1 } , \ldots , x _ { T } \right)$ 转化为一个固定维度的向量，这个向量其实就是取输入序列最后一个时间步的隐藏层状态，如图1中，输入序列“ABC”，即为“C”对应的隐藏层状态。接着，在解码器（decoder）时，将作为解码器的LSTM隐藏层的初始化状态，逐步地计算每个时间步的输出概率，最后将每个时间步的概率乘积作为输出序列的条件概率，其计算公式如下：

$p \left( y _ { 1 } , \ldots , y _ { T ^ { \prime } } | x _ { 1 } , \ldots , x _ { T } \right) = \prod _ { t = 1 } ^ { T ^ { \prime } } p \left( y _ { t } | v , y _ { 1 } , \ldots , y _ { t - 1 } \right)$

其中，每个时间步的条件概率 $p \left( y _ { t } | v , y _ { 1 } , \dots , y _ { t - 1 } \right)$ 都是在所有的词汇上经过softmax计算得到。

那么，Seq2Seq是怎么确保输出序列的长度是可变的呢？其实是这样的，在输出序列时，会在每个输出序列的末尾加上一个结束标记符“”，如图1中，输出序列为"WXYZ"，在训练时会在其末尾加上“”，即输出序列变成“WXYZ”，这样一来，当某个时刻的条件概率 $p \left( y _ { t } | v , y _ { 1 } , \dots , y _ { t - 1 } \right)$ 预测出来的词汇刚好是“”时，则说明预测序列已经结束，这样就可以使得输出序列的长度是可变的。

另外，作者在实验中发现，有两个技巧可以很好地提高模型的效果：①适当增加encoder的LSTM层数，要比使用浅层的LSTM效果要更好；②对于输入序列，在训练时将其进行逆排序，比如图1中的“ABC”，在训练时变成“CBA”，之所以这样操作，是因为输入序列和输出序列的词汇顺序往往是有语义上的对应关系的，特别是在翻译任务中，因此，通过拟排序，可以使得两两对应的词汇更加接近，比如“A”与“W”最接近，从而使得在解码“W”时，可以更关注到“A”的信息，其他的词汇也类似。

图1 Seq2Seq模型结构

2.2 模型的损失函数

Seq2Seq模型在训练时采用对数损失函数，即最大化真实目标序列的预测概率，其计算公式如下：

$1 / | \mathcal { S } | \sum _ { ( T , S ) \in \mathcal { S } } \log p ( T | S )$

其中，表示训练集。

3. Seq2Seq的tensorflow实现

下面用tensorflow对Seq2Seq模型进行复现，该版本代码加入了attention机制，有关attention机制的原理可以参见我另一篇文章《常见注意力机制原理介绍与对比》。代码实现如下：

import os
import config
import numpy as np
import tensorflow as tf
from config import seq2seq_config
from tensorflow.contrib import slim
from data_loader import gen_batch_data, encode_data, encode_data_for_predict


class Seq2Seq(object):
    def __init__(self,
                 from_word_num=config.from_word_num + 2,
                 to_word_num=config.to_word_num + 2,
                 from_max_len=config.from_max_len,
                 to_max_len=config.to_max_len,
                 embedding_size=seq2seq_config.embedding_size,
                 hidden_dim=seq2seq_config.hidden_dim,
                 rnn_layers=seq2seq_config.rnn_layers,
                 batch_size=seq2seq_config.batch_size,
                 epoch=seq2seq_config.epoch,
                 learning_rate=seq2seq_config.learning_rate,
                 learning_decay_steps=seq2seq_config.learning_decay_steps,
                 learning_decay_rate=seq2seq_config.learning_decay_rate,
                 mode='train'
                 ):
        self.from_word_num = from_word_num
        self.to_word_num = to_word_num
        self.from_max_len = from_max_len
        self.to_max_len = to_max_len
        self.embedding_size = embedding_size
        self.hidden_dim = hidden_dim
        self.rnn_layers = rnn_layers
        self.batch_size = batch_size
        self.epoch = epoch
        self.learning_rate = learning_rate
        self.learning_decay_steps = learning_decay_steps
        self.learning_decay_rate = learning_decay_rate
        self.mode = mode
        tf.reset_default_graph()
        self.model()

    def model(self):
        # 初始化变量
        self.encoder_input_data = tf.placeholder(dtype=tf.int32, shape=[None, None], name="encoder_input_data")
        self.decoder_input_data = tf.placeholder(dtype=tf.int32, shape=[None, None], name="decoder_input_data")
        self.decoder_output_data = tf.placeholder(dtype=tf.int32, shape=[None, None], name="decoder_output_data")
        self.keep_prob = tf.placeholder(tf.float32, name='keep_prob')

        # embedding层
        with tf.variable_scope("embedding"):
            encoder_embedding = tf.get_variable("encoder_embedding", shape=[self.from_word_num, self.embedding_size])
            encoder_input_emb = tf.nn.embedding_lookup(encoder_embedding, self.encoder_input_data)
            decoder_embedding = tf.get_variable("decoder_embedding", shape=[self.to_word_num, self.embedding_size])

        # encoder层
        with tf.variable_scope("encoder"):
            encoder_lstm_cell = self.build_rnn_cell()
            encoder_outputs, encoder_states = tf.nn.dynamic_rnn(encoder_lstm_cell, encoder_input_emb, dtype=tf.float32)

        # decoder层
        with tf.variable_scope("decoder"):
            with tf.variable_scope("attention"):
                decoder_lstm_cell = self.build_rnn_cell()
                attention_mechanism = tf.contrib.seq2seq.LuongAttention(self.hidden_dim, encoder_outputs)
                decoder_cell = tf.contrib.seq2seq.AttentionWrapper(decoder_lstm_cell, attention_mechanism,
                                                                   self.hidden_dim)
                decoder_initial_state = decoder_cell.zero_state(tf.shape(self.encoder_input_data)[0], dtype=tf.float32)
                decoder_initial_state = decoder_initial_state.clone(cell_state=encoder_states)

        # 输出层
        with tf.variable_scope("output"):
            weights = tf.get_variable("weights", shape=[self.hidden_dim, self.to_word_num],
                                      initializer=tf.truncated_normal_initializer(mean=0.0, stddev=0.1))
            biases = tf.get_variable("baises", shape=[self.to_word_num],
                                     initializer=tf.constant_initializer(0.1))

            # 训练模式
            if self.mode == 'train':
                def cond(time, state, max_len, logits_list_pre):
                    return time < max_len

                def body(time, state, max_len, logits_list_pre):
                    decoder_in = tf.nn.embedding_lookup(decoder_embedding, self.decoder_input_data[:, time])
                    output, state = decoder_cell(decoder_in, state)
                    logits = tf.nn.bias_add(tf.matmul(output, weights), biases)
                    logits_list_pre = logits_list_pre.write(time, logits)
                    return time + 1, state, max_len, logits_list_pre

                logits_list_pre = tf.TensorArray(dtype=tf.float32, size=self.to_max_len, name="logits_list_pre")
                loop_vars = [0, decoder_initial_state, self.to_max_len, logits_list_pre]
                _, _, _, self.logits_list_pre = tf.while_loop(cond=cond, body=body, loop_vars=loop_vars)
            # 预测时推理模式
            elif self.mode == 'predict':
                def cond(time, state, max_len, logits_list_pre, last_output):
                    return time < max_len

                def body(time, state, max_len, logits_list_pre, last_output):
                    decoder_in = tf.nn.embedding_lookup(decoder_embedding, last_output)
                    output, state = decoder_cell(decoder_in, state)
                    logits = tf.nn.bias_add(tf.matmul(output, weights), biases)
                    logits_list_pre = logits_list_pre.write(time, logits)
                    last_output = tf.argmax(logits, axis=-1, output_type=tf.int32)
                    return time + 1, state, max_len, logits_list_pre, last_output

                logits_list_pre = tf.TensorArray(dtype=tf.float32, size=self.to_max_len, name="logits_list_pre")
                loop_vars = [0, decoder_initial_state, self.to_max_len, logits_list_pre, self.decoder_input_data[:, 0]]
                _, _, _, self.logits_list_pre, _ = tf.while_loop(cond=cond, body=body, loop_vars=loop_vars)

        # 计算损失函数
        self.logits_list_pre = self.logits_list_pre.stack()
        self.logits_list_pre = tf.transpose(self.logits_list_pre, perm=[1, 0, 2])
        cross_entropy = tf.nn.sparse_softmax_cross_entropy_with_logits(
            labels=tf.reshape(self.decoder_output_data, [-1]),
            logits=tf.reshape(self.logits_list_pre, [-1, self.to_word_num]))
        self.loss = tf.reduce_mean(cross_entropy)

        # 优化函数
        self.global_step = tf.train.get_or_create_global_step()
        learning_rate = tf.train.exponential_decay(self.learning_rate, self.global_step,
                                                   self.learning_decay_steps, self.learning_decay_rate,
                                                   staircase=True)

        optimizer = tf.train.AdamOptimizer(learning_rate)
        update_ops = tf.get_collection(tf.GraphKeys.UPDATE_OPS)
        self.optim = slim.learning.create_train_op(total_loss=self.loss, optimizer=optimizer, update_ops=update_ops)

    def build_rnn_cell(self):
        def single_rnn_cell():
            cell = tf.contrib.rnn.LSTMCell(self.hidden_dim)
            cell = tf.contrib.rnn.DropoutWrapper(cell, output_keep_prob=self.keep_prob)
            return cell

        rnn_cell = tf.contrib.rnn.MultiRNNCell([single_rnn_cell() for _ in range(self.rnn_layers)])
        return rnn_cell

    def fit(self, from_train, to_train, from_val, to_val, from_words_index,
            to_words_index, keep_prob=seq2seq_config.keep_prob,
            save_path='./saves/' + config.model_select + '/',
            summary_path=os.path.join('./summary', config.model_select)):
        # 创建模型保存路径
        if not os.path.exists(save_path):
            os.makedirs(save_path)
        if not os.path.exists(summary_path):
            os.makedirs(summary_path)

        # 将验证集转化为整数序列格式
        encoder_input_data_val, decoder_input_data_val, decoder_output_data_val,_,_ = encode_data(
            from_val, to_val, from_words_index, to_words_index
        )

        # 开始训练
        tf.summary.scalar('val_loss', self.loss)
        merged = tf.summary.merge_all()
        sess = tf.Session()
        writer = tf.summary.FileWriter(summary_path, sess.graph)
        saver = tf.train.Saver(max_to_keep=10)

        # 加载现有的模型
        ckpt = tf.train.get_checkpoint_state(save_path)
        if ckpt:
            saver.restore(sess, ckpt.model_checkpoint_path)
            train_steps = int(ckpt.model_checkpoint_path.split('/')[-1].replace('-',''))
        else:
            train_steps = 0
            sess.run(tf.global_variables_initializer())

        for i in range(self.epoch):
            batch_index_list = gen_batch_data(from_train, self.batch_size)
            for batch_index in batch_index_list:
                train_steps += 1

                # 生成batch数据
                from_batch = []
                to_batch = []
                for index in batch_index.tolist():
                    from_batch.append(from_train[index])
                    to_batch.append(to_train[index])

                # 计算训练集的损失
                encoder_input_data, decoder_input_data, decoder_output_data,_,_ = encode_data(
                    from_batch, to_batch, from_words_index, to_words_index
                )
                feed_dict = {self.encoder_input_data: encoder_input_data,
                             self.decoder_input_data: decoder_input_data,
                             self.decoder_output_data: decoder_output_data,
                             self.keep_prob: keep_prob}
                _, train_loss = sess.run([self.optim, self.loss], feed_dict=feed_dict)

                # 计算验证集的损失
                if train_steps % 1000 == 0:
                    feed_dict = {self.encoder_input_data: encoder_input_data_val,
                                 self.decoder_input_data: decoder_input_data_val,
                                 self.decoder_output_data: decoder_output_data_val,
                                 self.keep_prob: 1.0}
                    val_loss = sess.run(self.loss, feed_dict=feed_dict)

                    summary = sess.run(merged, feed_dict=feed_dict)
                    writer.add_summary(summary, global_step=train_steps)
                    saver.save(sess, save_path, global_step=train_steps)

                    msg = 'epoch:%d/%d,train_steps:%d,train_loss:%.4f,val_loss:%.4f'
                    print(msg % (i, self.epoch, train_steps, train_loss, val_loss))

        sess.close()

    def predict(self, from_test, to_test=None, from_words_index=None,
                to_words_index=None, reverse_to_words_index=None,
                save_path='./saves/' + config.model_select + '/',
                result_path=os.path.join('./results', config.model_select)):
        # 加载训练好的模型
        sess = tf.Session()
        sess.run(tf.global_variables_initializer())
        saver = tf.train.Saver(tf.global_variables())
        ckpt = tf.train.get_checkpoint_state(save_path)
        saver.restore(sess, ckpt.model_checkpoint_path)

        # 进行推理预测
        predict_texts = []
        batch_index_list = gen_batch_data(
            from_test, batch_size=self.batch_size, shuffle=False
        )
        for batch_index in batch_index_list:
            # 生成batch数据
            from_batch = []
            for index in batch_index.tolist():
                from_batch.append(from_test[index])

            # 计算训练集的损失
            encoder_input_data = encode_data_for_predict(from_batch, from_words_index)
            decoder_input_data = np.ones((self.batch_size, self.to_max_len), dtype='int32') * to_words_index['']
            feed_dict = {self.encoder_input_data: encoder_input_data,
                         self.decoder_input_data: decoder_input_data,
                         self.keep_prob: 1.0}
            logits = sess.run(self.logits_list_pre, feed_dict=feed_dict)
            logits = np.argmax(logits, axis=2)
            for j in range(self.batch_size):
                predict_text = []
                for k in range(self.to_max_len):
                    predict_word = reverse_to_words_index[logits[j, k]]
                    if predict_word != '':
                        predict_text.append(predict_word)
                    else:
                        break
                predict_text = ' '.join(predict_text)
                predict_texts.append(predict_text)

        return predict_texts[0]

4. 总结

Seq2Seq的优缺点总结：

与RNN相比，Seq2Seq的优点主要是无需要求输入序列和输出序列必须完全对齐。
对于较长序列的生成效果也比较好。
模型的通用性强，适用于各种序列到序列的生成任务。

Axure常用交互功能案例-免费 AxureMost axure 模板-素材 axure 交互 photoshop
以下是一些Axure常用功能的案例：包含了几百个组件案例可供学习。链接地址：交互样式案例按钮的悬停和按下效果：将一个矩形元件设为按钮，在“交互”板块中为其添加“鼠标悬停”样式，如改变按钮颜色或添加阴影，让用户知道鼠标在按钮上方。还可添加“鼠标按下”样式，如使按钮稍微缩小，模拟真实的按钮按下效果，增强交互体验。文本框的状态样式：对于文本框元件，除了Axure默认的“提示”和“禁用”样式，还可添加“鼠
Python爬虫实战：研究chardet库相关技术 ylfhpy 爬虫项目实战 python 爬虫开发语言 chardet
1.引言1.1研究背景与意义在互联网信息爆炸的时代，网络数据采集技术已成为信息获取、数据分析和知识发现的重要手段。Python作为一种高效的编程语言，凭借其丰富的第三方库和简洁的语法，成为爬虫开发的首选语言之一。然而，在网络数据采集中，文本编码的多样性和不确定性一直是困扰开发者的主要问题之一。不同网站可能采用不同的编码方式（如UTF-8、GBK、GB2312等），甚至同一网站的不同页面也可能使用不
Java升级版的学生成长管理系统
学生成长管理系统升级版需求为了学生管理系统书写一个登录、注册、忘记密码的功能。只有用户登录成功之后，才能进入学生管理系统中进行增删查改操作。分析登录界面System.out.println("欢迎来到学生成长管理系统");System.out.println("请选择操作1登录2注册3忘记密码");用户类属性：用户名、密码、身份证号码、手机号码注册功能用户名需求满足以下要求：验证要求：用户名唯一用
Neo4j 的向量搜索（Neo4jVector）和常见的向量数据库（比如 Milvus、Qdrant）之间的区别与联系
先说联系（共同点）点内容✅都支持向量检索都可以基于embedding（向量）做相似度搜索，比如给一段文本、找出最相似的若干条记录。✅都用于语义检索你可以把它们用在RAG（检索增强生成）、ChatwithDocs、智能问答、推荐系统等应用里。✅都支持批量插入、查询都可以批量向数据库中插入文本+向量，然后用向量做top-k检索（如search(k=8)）。✅都和LangChain集成它们都可以通过la
开源模型应用落地-OpenAI Agents SDK-集成Qwen3-8B-探索output_guardrail的创意应用（六）开源技术探险家开源模型-实际应用落地开源 python ai 人工智能
一、前言随着人工智能技术的迅猛发展，大语言模型（LLM）在各行各业的应用日益广泛。然而，模型生成的内容是否安全、合规、符合用户预期，成为开发者和企业不可忽视的问题。为此，OutputGuardrail应运而生，作为一种关键的安全机制，它在模型生成结果之后进行内容审核与过滤，确保输出不偏离道德、法律和业务规范。通过检测不当的内容，不仅提升了AI系统的可信度，也为构建更加稳健和负责任的人工智能应用提供
System.IO.File.AppendAllText()如何使用
System.IO.File.AppendAllText()是C#中用于向文件末尾追加内容的便捷方法publicstaticvoidAppendAllText(stringpath,stringcontents);publicstaticvoidAppendAllText(stringpath,stringcontents,Encodingencoding);2.核心功能追加内容：将文本写入文件末
分布式ID设计方案详解：从理论到实践
一、为什么需要分布式ID？在分布式系统中，唯一ID的生成面临两大核心挑战：全局唯一性：避免跨节点、跨数据中心的ID冲突。有序性：确保ID按时间或业务规则递增，提升数据库写入性能（如InnoDB的B+树索引）。传统单机自增ID（如MySQLAUTO_INCREMENT）无法满足分库分表、高并发等场景需求，因此需引入分布式ID方案。二、主流分布式ID方案对比方案优点缺点适用场景UUID简单、无中心化依
用 AI “一句话生成代码”，用创意兑换灵码潮品：技术人的夏日狂欢季来了人工智能
在AI技术迅猛发展的2025年，我们正式推出“通义灵码编程智能体挑战季”，以“码力觉醒”为主题，打造一场融合技术探索与潮流文化的开发者盛宴。活动以体验MCP服务、Qwen3大模型及记忆功能的智能编程助手为核心，通过“小游戏开发”和“MCP场景实践”两大趣味赛道，降低AI技术门槛，让开发者轻松体验“一句话生成代码”的魔力。活动亮点抢先看：零门槛参与：新老用户均可参与，完成任务即领限量定制棒球帽！趣味
图片转字符串存储在SQLite中你就是乌鸦嘴 qt6.3 笔记 qt
将图片转化为字符串放入Sqlite数据库，以BLOB类型存储。一、主要函数1、图片转字符串使用内存读写器，指定格式存入字节数组，字节数组转Base64以Latin1编码输出到文本框。voidMainWindow::on_actPtB_triggered(){ui->plainTextEdit->clear();if(ui->labPhoto->pixmap().isNull()){labtext-
GitHub账号注册与Git关联：从零到一的完整指南 Android洋芋前行路黑科技经验历程 github git GitHub注册 Git关联 SSH密钥团队协作
简介GitHub是开发者协作与代码管理的核心平台，而Git则是实现版本控制与团队协作的必备工具。本文将从零开始，手把手教你完成GitHub账号注册、Git环境搭建、SSH密钥生成、本地仓库初始化及与GitHub仓库的绑定。通过代码示例、Mermaid图解及企业级应用场景，帮助你全面掌握GitHub与Git的关联技巧，为个人开发与团队协作打下坚实基础。一、GitHub账号注册与基础配置1.1注册Gi
PyQt5—QTextEdit 学习笔记寄思～ Python——PyQt5笔记 qt 学习笔记 python
第二章控件学习一、QTextEdit基础认知QTextEdit是PyQt/PySide框架中用于处理富文本内容的强大控件，它不仅支持纯文本编辑，还能处理HTML、图片等复杂内容，是开发文本编辑器、日志查看器等应用的核心组件。二、最简单的QTextEdit实现下面是一个创建QTextEdit并显示的基础案例，适合零基础入门：importsysfromPyQt5.QtWidgetsimportQApp
高级汇编语言编程技巧与优化代码世界探索者汇编语言详解汇编 linux
一、宏和宏指令1.宏的基本概念•定义：宏是一种文本替换机制。它允许程序员定义一个宏名，并将一组指令或代码片段与该宏名关联起来。在代码中使用宏名时，汇编器会将其替换为对应的指令或代码片段。2.宏的定义和使用（1）定义宏在汇编语言中，宏的定义通常使用MACRO指令开始，以ENDM指令结束。宏的定义包括宏名和一组指令或代码片段。语法：宏名MACRO参数1,参数2,...指令1指令2...ENDM示例：;
算法分析与设计实验2：实现克鲁斯卡尔算法和prim算法表白墙上别挂我算法笔记经验分享
实验原理（一）克鲁斯卡尔算法：一种用于求解最小生成树问题的贪心算法，该算法的基本思想是按照边的权重从小到大排序，然后依次选择边，并加入生成树中，同时确保不会形成环路，直到生成树包含图中所有的顶点为止。具体步骤：边的排序：将所有边按照权重从小到大排序。初始化：创建一个空的生成树（可以是一个空的图结构），以及一个用于记录每个顶点所属集合（或称为连通分量）的数据结构（例如并查集）。边的选择：依次选择排序
HTTP 响应头信息详解 lsx202406 开发语言
HTTP响应头信息详解引言HTTP（超文本传输协议）是互联网上应用最为广泛的网络协议之一。在HTTP协议中，响应头信息是服务器向客户端发送的重要信息之一。响应头信息包含了关于响应的元数据，如状态码、内容类型、缓存策略等。本文将详细介绍HTTP响应头信息的概念、类型、作用以及常见响应头信息的解析。HTTP响应头信息概述HTTP响应头信息是服务器在发送HTTP响应时，除了响应体之外，附加在响应体前面的
MavenHelper插件：解决IntelliJ IDEA中Maven依赖冲突的利器
本文还有配套的精品资源，点击获取简介：MavenHelper是一款专门针对IntelliJIDEA设计的Maven插件，旨在帮助开发者快速识别和解决Maven项目中的依赖冲突问题。该插件能生成项目的依赖树，标记版本冲突的依赖项，并提供建议解决方案和可视化界面来管理依赖。此外，它还包括一键升级或降级依赖、清理Maven缓存和自定义配置功能，以确保与团队规范的一致性。通过使用MavenHelper，开
ViP-LLaVA: 使大型多模态模型理解任意视觉提示 AI专题精讲 Paper阅读多模态人工智能 AI
摘要现有的大型视觉-语言多模态模型主要关注整体图像理解，但在实现区域特定的理解方面仍存在显著差距。目前，使用文本坐标或空间编码的方法通常无法为视觉提示提供用户友好的接口。为了解决这个问题，我们提出了一种新颖的多模态模型，能够解码任意（自由形式）视觉提示。这使得用户可以通过自然提示（如“红色边框”或“指向箭头”）直观地标记图像并与模型互动。我们的简单设计直接将视觉标记叠加在RGB图像上，避免了复杂的
Aider：27.6K Star！这个终端AI编程神器能用语音改代码，自动生成Git记录并提交，接入DeepSeek斩获编程基准最高分蚝油菜花每日 AI 项目与应用实例 AI编程 git 人工智能开源
❤️如果你也关注AI的发展现状，且对AI应用开发感兴趣，我会每日分享大模型与AI领域的开源项目和应用，提供运行实例和实用教程，帮助你快速上手AI技术！AI在线答疑->智能检索历史文章和开源项目->尽在微信公众号->搜一搜：蚝油菜花⌨️“每个CLI爱好者都该试试的AI编程革命：对着终端说话自动生成Gitcommit是怎样的体验？”大家好，我是蚝油菜花。如果你也经历过——在vim里卡了半小时，只为给函
使用AutoKeras2.0的AutoModel进行结构化数据回归预测
1、FirstofAll:ReadTheFuckingSourceCodeimportautokerasasakimportnumpyasnpfromsklearn.model_selectionimporttrain_test_splitfromsklearn.metricsimportmean_squared_error#生成数据集np.random.seed(42)x=np.random.r
MongoDB + Voyage AI 详解：重塑数据库与AI的协同范式 csdn_tom_168 NoSQL 数据库 mongodb 人工智能 AI
MongoDB+VoyageAI详解：重塑数据库与AI的协同范式2025年2月，MongoDB官方宣布收购VoyageAI，这一举措标志着数据库与人工智能技术的深度融合迈入新阶段。通过整合VoyageAI的先进AI检索与嵌入模型能力，MongoDB旨在重新定义AI时代的数据库架构，为企业构建智能应用提供端到端的数据基础设施。一、收购背景与技术战略1.行业趋势驱动AI数据挑战：随着生成式AI与大语言
HarmonyOS5.0仓颉引擎与盘古大模型：个性化作业批改系统架构设计与实现 H老师带你学鸿蒙系统架构 HarmonyOS5.0 鸿蒙华为仓颉教育
人工智能与边缘计算的融合正在重塑教育评价体系。本文将展示如何基于HarmonyOS5.0仓颉并发引擎和盘古大模型，构建新一代智能作业批改系统。系统架构全景graphTDA[学生端设备]-->|提交作业|B[仓颉边缘处理]B-->C[盘古大模型分析]C-->D[个性化反馈生成]D-->E[学生终端]D-->F[教师仪表盘]subgraphHarmonyOS分布式系统B-->|设备协同|G[教室平板集
1.线性神经网络--线性回归温柔济沧海深度学习神经网络线性回归 python
1.1从零实现线性回归importrandomimporttorch#fromd2limporttorchasd2limportmatplotlib.pyplotaspltdeftrain_data_make(batch_size,X,y):num_examples=len(X)idx=list(range(num_examples))#生成0-999random.shuffle(idx)#样本需
阿里云瑶池数据库 Data Agent for Meta 正式发布，让 AI 更懂你的业务！数据库观点资讯人工智能
背景随着生成式人工智能（GenerativeAI）从概念验证迈向规模化商业落地，AIAgent已成为企业核心业务流程的重要组成部分。然而，当模型调用日益便捷时，核心痛点已不再是模型本身，而是集中在一个关键要素上：数据。AIAgent的落地瓶颈已从技术能力转向高质量、高相关性、安全合规的数据供给。企业面临的核心挑战在于：数据孤岛导致知识库分散，通用大模型难以理解专业业务传统数据管理依赖人工开发维护，
【HarmonyOS】鸿蒙应用开发Text控件常见错误
【HarmonyOS】鸿蒙应用开发Text控件常见错误一、前言Text文本控件，是我们应用开发中最为基本和常见使用的控件之一。很多人觉得对于控件的使用已经非常熟悉，一个文本控件，能有什么使用错误呢？其实不然，今天本文，就对于Text常用会导致问题的点进行阐述。二、Text设置字体大小是否可用于百分号？对于初学者最常见的问题之一，就是使用Text的fontSize属性设置字体大小时，传入百分比字符串
【PaddleOCR】OCR文本检测与文本识别数据集整理，持续更新......
博主简介：曾任某智慧城市类企业算法总监，目前在美国市场的物流公司从事高级算法工程师一职，深耕人工智能领域，精通python数据挖掘、可视化、机器学习等，发表过AI相关的专利并多次在AI类比赛中获奖。CSDN人工智能领域的优质创作者，提供AI相关的技术咨询、项目开发和个性化解决方案等服务，如有需要请站内私信或者联系任意文章底部的的VX名片（ID：xf982831907）博主粉丝群介绍：①群内初中生、
多模态大模型的技术应用与未来展望：重构AI交互范式的新引擎 zhaoyi_he 重构人工智能
一、引言：为什么多模态是AI发展的下一场革命？过去十年，深度学习推动了计算机视觉和自然语言处理的飞跃，但两者的发展路径长期割裂。随着生成式AI和大模型时代的到来，**多模态大模型（MultimodalFoundationModels）**以统一的建模方式处理图像、文本、音频、视频等多源数据，重塑了“感知-认知-决策”链条，为AGI迈出关键一步。OpenAI的GPT-4o、Google的Gemini
学Simulink——整流器场景：基于Simulink的单相全桥可控硅整流器仿真建模 xiaoheshang_123 MATLAB 开发项目实例 1000 例专栏手把手教你学 MATLAB 专栏 simulink matlab
目录手把手教你学Simulink——整流器场景：基于Simulink的单相全桥可控硅整流器仿真建模一、背景介绍二、系统结构设计三、建模过程第一步：创建新Simulink项目第二步：添加主要模块1.交流电源2.单相全桥可控硅整流器3.LC滤波器4.负载模拟5.触发脉冲生成模块6.测量模块第三步：搭建主电路拓扑第四步：搭建触发脉冲生成逻辑1.设计触发脉冲逻辑2.集成至Simulink模型四、参数设置五
vllm推理实践 try2find java 前端服务器
1.vllm推理demo实验fromvllmimportLLM,SamplingParams#定义生成参数sampling_params=SamplingParams(temperature=0.7,top_p=0.9,max_tokens=100,)#加载DeepSeek模型（以deepseek-llm-7b为例）#model_name="deepseek-ai/deepseek-llm-7b"
typescript 错误码大全
转载于https://www.easemob.com/question/6196/1002错误Unterminatedstringliteral.未终止的字符串文本。1003错误Identifierexpected.应为标识符。1005错误'{0}'expected.应为“{0}”。1006错误Afilecannothaveareferencetoitself.文件不能引用自身。1009错误Tra
移动conda虚拟环境的安装目录
方法1：重新创建环境（推荐）(1)导出环境配置（生成environment.yml）：condaactivateold_env#激活原环境condaenvexport>environment.yml#导出配置(llmtuner):~$condaenvexport>environment.yml(llmtuner):~$tail-fenvironment.yml-websockets==15.0.1
嵌入式Linux内核镜像生成过程飘逸轻舞 linux arm开发运维嵌入式
嵌入式Linux内核镜像生成过程嵌入式Linux系统的核心组件是内核，它是操作系统的核心部分，负责管理硬件资源、提供系统调用接口以及驱动设备等功能。在嵌入式系统中，将内核编译成镜像文件是部署系统的关键步骤之一。本文将介绍嵌入式Linux的内核镜像生成过程，并提供相应的源代码示例。获取Linux内核源代码首先，我们需要获取Linux内核的源代码。可以从Linux官方网站（www.kernel.org
统一思想认识永夜-极光思想
1.统一思想认识的基础,才能有的放矢原因: 总有一种描述事物的方式最贴近本质,最容易让人理解. 如何让教育更轻松,在于找到最适合学生的方式. 难点在于,如何模拟对方的思维基础选择合适的方式. &
Joda Time使用笔记 bylijinnan java joda time
Joda Time的介绍可以参考这篇文章： http://www.ibm.com/developerworks/cn/java/j-jodatime.html 工作中也常常用到Joda Time，为了避免每次使用都查API，记录一下常用的用法： /** * DateTime变化（增减） */ @Tes
FileUtils API eksliang FileUtils FileUtils API
转载请出自出处：http://eksliang.iteye.com/blog/2217374 一、概述这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。非常的好用。
各种新兴技术不懂事的小屁孩技术
1:gradle Gradle 是以 Groovy 语言为基础，面向Java应用为主。基于DSL（领域特定语言）语法的自动化构建工具。现在构建系统常用到maven工具，现在有更容易上手的gradle，搭建java环境: http://www.ibm.com/developerworks/cn/opensource/os-cn-gradle/ 搭建android环境： http://m
tomcat6的https双向认证酷的飞上天空 tomcat6
1.生成服务器端证书 keytool -genkey -keyalg RSA -dname "cn=localhost,ou=sango,o=none,l=china,st=beijing,c=cn" -alias server -keypass password -keystore server.jks -storepass password -validity 36
托管虚拟桌面市场势不可挡蓝儿唯美
用户还需要冗余的数据中心，dinCloud的高级副总裁兼首席营销官Ali Din指出。该公司转售一个MSP可以让用户登录并管理和提供服务的用于DaaS的云自动化控制台，提供服务或者MSP也可以自己来控制。在某些情况下，MSP会在dinCloud的云服务上进行服务分层，如监控和补丁管理。 MSP的利润空间将根据其参与的程度而有所不同，Din说。 “我们有一些合作伙伴负责将我们推荐给客户作为个
spring学习——xml文件的配置 a-john spring
在Spring的学习中，对于其xml文件的配置是必不可少的。在Spring的多种装配Bean的方式中，采用XML配置也是最常见的。以下是一个简单的XML配置文件： <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.or
HDU 4342 History repeat itself 模拟 aijuans 模拟
来源：http://acm.hdu.edu.cn/showproblem.php?pid=4342 题意：首先让求第几个非平方数，然后求从1到该数之间的每个sqrt(i)的下取整的和。思路：一个简单的模拟题目，但是由于数据范围大，需要用__int64。我们可以首先把平方数筛选出来，假如让求第n个非平方数的话，看n前面有多少个平方数，假设有x个，则第n个非平方数就是n+x。注意两种特殊情况，即
java中最常用jar包的用途 asia007 java
java中最常用jar包的用途 jar包用途axis.jarSOAP引擎包commons-discovery-0.2.jar用来发现、查找和实现可插入式接口，提供一些一般类实例化、单件的生命周期管理的常用方法.jaxrpc.jarAxis运行所需要的组件包saaj.jar创建到端点的点到点连接的方法、创建并处理SOAP消息和附件的方法，以及接收和处理SOAP错误的方法. w
ajax获取Struts框架中的json编码异常和Struts中的主控制器异常的解决办法百合不是茶 js json编码返回异常
一:ajax获取自定义Struts框架中的json编码出现以下问题: 1,强制flush输出 json编码打印在首页 2, 不强制flush js会解析json 打印出来的是错误的jsp页面却没有跳转到错误页面 3, ajax中的dataType的json 改为text 会
JUnit使用的设计模式 bijian1013 java 设计模式 JUnit
JUnit源代码涉及使用了大量设计模式 1、模板方法模式（Template Method）定义一个操作中的算法骨架，而将一些步骤延伸到子类中去，使得子类可以不改变一个算法的结构，即可重新定义该算法的某些特定步骤。这里需要复用的是算法的结构，也就是步骤，而步骤的实现可以在子类中完成。
Linux常用命令（摘录） sunjing crond chkconfig
chkconfig --list 查看linux所有服务 chkconfig --add servicename 添加linux服务 netstat -apn | grep 8080 查看端口占用 env 查看所有环境变量 echo $JAVA_HOME 查看JAVA_HOME环境变量安装编译器 yum install -y gcc
【Hadoop一】Hadoop伪集群环境搭建 bit1129 hadoop
结合网上多份文档，不断反复的修正hadoop启动和运行过程中出现的问题，终于把Hadoop2.5.2伪分布式安装起来，跑通了wordcount例子。Hadoop的安装复杂性的体现之一是，Hadoop的安装文档非常多，但是能一个文档走下来的少之又少，尤其是Hadoop不同版本的配置差异非常的大。Hadoop2.5.2于前两天发布，但是它的配置跟2.5.0，2.5.1没有分别。 &nb
Anychart图表系列五之事件监听白糖_ chart
创建图表事件监听非常简单：首先是通过addEventListener('监听类型',js监听方法)添加事件监听，然后在js监听方法中定义具体监听逻辑。以钻取操作为例，当用户点击图表某一个point的时候弹出point的name和value，代码如下： <script> //创建AnyChart var chart = new AnyChart(); //添加钻取操作&quo
Web前端相关段子 braveCS web前端
Web标准：结构、样式和行为分离使用语义化标签 0）标签的语义：使用有良好语义的标签，能够很好地实现自我解释，方便搜索引擎理解网页结构，抓取重要内容。去样式后也会根据浏览器的默认样式很好的组织网页内容，具有很好的可读性，从而实现对特殊终端的兼容。 1）div和span是没有语义的：只是分别用作块级元素和行内元素的区域分隔符。当页面内标签无法满足设计需求时，才会适当添加div
编程之美-24点游戏 bylijinnan 编程之美
import java.util.ArrayList; import java.util.Arrays; import java.util.HashSet; import java.util.List; import java.util.Random; import java.util.Set; public class PointGame { /**编程之美
主页面子页面传值总结 chengxuyuancsdn 总结
1、showModalDialog returnValue是javascript中html的window对象的属性,目的是返回窗口值,当用window.showModalDialog函数打开一个IE的模式窗口时,用于返回窗口的值主界面 var sonValue=window.showModalDialog("son.jsp"); 子界面 window.retu
[网络与经济]互联网+的含义 comsci 互联网+
互联网+后面是一个人的名字 = 网络控制系统互联网+你的名字 = 网络个人数据库每日提示:如果人觉得不舒服,千万不要外出到处走动,就呆在床上,玩玩手游,更不能够去开车,现在交通状况不
oracle 创建视图 with check option daizj 视图 view oralce
我们来看下面的例子： create or replace view testview as select empno,ename from emp where ename like ‘M%’ with check option; 这里我们创建了一个视图，并使用了with check option来限制了视图。然后我们来看一下视图包含的结果： select * from testv
ToastPlugin插件在cordova3.3下使用 dibov Cordova
自己开发的Todos应用，想实现“ 再按一次返回键退出程序 ”的功能，采用网上的ToastPlugins插件，发现代码或文章基本都是老版本，运行问题比较多。折腾了好久才弄好。下面吧基于cordova3.3下的ToastPlugins相关代码共享。 ToastPlugin.java package&nbs
C语言22个系统函数 dcj3sjt126com c function
C语言系统函数一、数学函数下列函数存放在math.h头文件中Double floor(double num) 求出不大于num的最大数。Double fmod(x, y) 求整数x/y的余数。Double frexp(num, exp); double num; int *exp; 将num分为数字部分（尾数）x和以2位的指数部分n，即num=x*2n，指数n存放在exp指向的变量中，返回x。D
开发一个类的流程 dcj3sjt126com 开发
本人近日根据自己的开发经验总结了一个类的开发流程。这个流程适用于单独开发的构件，并不适用于对一个项目中的系统对象开发。开发出的类可以存入私人类库，供以后复用。以下是开发流程： 1. 明确类的功能，抽象出类的大概结构 2. 初步设想类的接口 3. 类名设计（驼峰式命名） 4. 属性设置(权限设置) 判断某些变量是否有必要作为成员属
java 并发 shuizhaosi888 java 并发
能够写出高伸缩性的并发是一门艺术在JAVA SE5中新增了3个包 java.util.concurrent java.util.concurrent.atomic java.util.concurrent.locks 在java的内存模型中，类的实例字段、静态字段和构成数组的对象元素都会被多个线程所共享，局部变量与方法参数都是线程私有的，不会被共享。
Spring Security（11）——匿名认证 234390216 Spring Security ROLE_ANNOYMOUS 匿名
匿名认证目录 1.1 配置 1.2 AuthenticationTrustResolver 对于匿名访问的用户，Spring Security支持为其建立一个匿名的AnonymousAuthenticat
NODEJS项目实践0.2[ express,ajax通信...] 逐行分析JS源代码 Ajax nodejs express
一、前言通过上节学习，我们已经 ubuntu系统搭建了一个可以访问的nodejs系统，并做了nginx转发。本节原要做web端服务及 mongodb的存取，但写着写着，web端就
在Struts2 的Action中怎样获取表单提交上来的多个checkbox的值 lhbthanks java html struts checkbox
第一种方法：获取结果String类型在 Action 中获得的是一个 String 型数据，每一个被选中的 checkbox 的 value 被拼接在一起，每个值之间以逗号隔开(,)。所以在 Action 中定义一个跟 checkbox 的 name 同名的属性来接收这些被选中的 checkbox 的 value 即可。以下是实现的代码：前台 HTML 代码：
003.Kafka基本概念 nweiren hadoop kafka
Kafka基本概念：Topic、Partition、Message、Producer、Broker、Consumer。 Topic：消息源（Message）的分类。 Partition： Topic物理上的分组，一
Linux环境下安装JDK roadrunners jdk linux
1、准备工作创建JDK的安装目录： mkdir -p /usr/java/ 下载JDK，找到适合自己系统的JDK版本进行下载： http://www.oracle.com/technetwork/java/javase/downloads/index.html 把JDK安装包下载到/usr/java/目录，然后进行解压： tar -zxvf jre-7
Linux忘记root密码的解决思路 tomcat_oracle linux
1：使用同版本的linux启动系统，chroot到忘记密码的根分区passwd改密码　　2：grub启动菜单中加入init=/bin/bash进入系统，不过这时挂载的是只读分区。根据系统的分区情况进一步判断. 　　3: grub启动菜单中加入 single以单用户进入系统. 　　4:用以上方法mount到根分区把/etc/passwd中的root密码去除　　例如: 　　ro
跨浏览器 HTML5 postMessage 方法以及 message 事件模拟实现 xueyou jsonp jquery 框架 UI html5
postMessage 是 HTML5 新方法，它可以实现跨域窗口之间通讯。到目前为止，只有 IE8+, Firefox 3, Opera 9, Chrome 3和 Safari 4 支持，而本篇文章主要讲述 postMessage 方法与 message 事件跨浏览器实现。postMessage 方法 JSONP 技术不一样，前者是前端擅长跨域文档数据即时通讯，后者擅长针对跨域服务端数据通讯，p

Seq2Seq文本生成与tensorflow实现

1. 引言

2. Seq2Seq模型介绍

3. Seq2Seq的tensorflow实现

4. 总结

你可能感兴趣的:(文本生成,Tensorflow)