小李飞刀李寻欢

多兴趣模型实践ComiRec代码解读

hi各位大佬好，我是菜鸟小明哥。因为纯粹基于ID的模型CTR已经降至最低，比如之前的ytb，SRGNN，LightGCN，TAGNN，均干不过FFM，DSSM，这是实际应用中不可避免的，总之，这种情况无论是代码问题也好，还是说数据问题稀疏也罢，短期内调整是看不到效果提升的。因为我已经尝试了增加ytb的user侧特征（net和最近爱看的类别），然而实际效果仍旧没有任何提升，尽管离线指标已经逼近SRGNN，实际测试CTR也是没有提升，而且SRGNN都已经不行了，还折腾个啥子？[当然我也试过调整其他参数，仍旧没啥子用]

For Recommendation in Deep learning QQ Group 102948747
For Visual in deep learning QQ Group 629530787
I'm here waiting for you
不接受这个网页的私聊/私信！！！

paper在此，代码here.

1-实际代码中会有很多问题要改，比如item_cate文件cate编码是从1开始的，而train/test/valid中则是从0开始的，我将cate中编码减去1后测试发现并无差别，不知道这样做是否正确。user及item均是从1开始编码的。

2-我自己的数据划分是采用的留一法，结果如下，相当差，验证集没有任何变化，但训练的loss在降低，关于这个问题，详见我的issue

time interval: 157.9083 min
docpic_ComiRec-SA_b128_lr0.001_d64_len20_docpic
iter: 49000, train loss: 1.8495, valid recall: 0.000007, valid ndcg: 0.000007, valid hitrate: 0.000007
time interval: 161.3182 min
docpic_ComiRec-SA_b128_lr0.001_d64_len20_docpic
iter: 50000, train loss: 1.8340, valid recall: 0.000007, valid ndcg: 0.000007, valid hitrate: 0.000007
time interval: 164.7177 min
docpic_ComiRec-SA_b128_lr0.001_d64_len20_docpic
iter: 51000, train loss: 1.8256, valid recall: 0.000007, valid ndcg: 0.000007, valid hitrate: 0.000007
time interval: 168.0316 min
docpic_ComiRec-SA_b128_lr0.001_d64_len20_docpic
iter: 52000, train loss: 1.8214, valid recall: 0.000007, valid ndcg: 0.000007, valid hitrate: 0.000007
model restored from best_model/docpic_ComiRec-SA_b128_lr0.001_d64_len20_docpic/
valid recall: 0.000007, valid ndcg: 0.000007, valid hitrate: 0.000007, valid diversity: 0.000000
test recall: 0.000007, test ndcg: 0.000007, test hitrate: 0.000007, test diversity: 0.000000

2-1而原数据则是采用一部分user的点击作为验证集和测试集，训练集，测试集，验证集中的user均不相同（如下），这种只考虑item序列的分割可以理解，但我采用留一法的分割也完全有理由，然而验证效果就是差。

>>> tr=book_train[book_train['user_id'].isin(book_test['user_id'])]
>>> tr
Empty DataFrame
Columns: [user_id, item_id, cate]
Index: []
>>> tr=book_train[book_train['user_id'].isin(book_valid['user_id'])]
>>> tr
Empty DataFrame
Columns: [user_id, item_id, cate]
Index: []
>>> tr=book_test[book_test['user_id'].isin(book_valid['user_id'])]
>>> tr
Empty DataFrame
Columns: [user_id, item_id, cate]
Index: []

2-2先与数据对齐，或者将原来数据也采用留一法试试看，如下：

合并数据后重新分割，并验证所有item均有cate

>>> new_data.shape
(8898041, 3)
>>> new_data2=new_data[new_data['item_id'].isin(item_cate['item_id'])]
>>> new_data2.shape
(8898041, 3)

经常报下面错说明是user点击的item数量少于4个，这样的user可以去掉了。因此为了保证最后一个点击为test后仍旧可执行，需要将至少点击设置为6

training begin
Traceback (most recent call last):
  File "src/train.py", line 379, in 
    model_type=args.model_type, lr=args.learning_rate, max_iter=args.max_iter, patience=args.patience)
  File "src/train.py", line 244, in train
    for src, tgt in train_data:
  File "/data/logs/xulm1/ComiRec/src/data_iterator.py", line 67, in __next__
    k = random.choice(range(4, len(item_list)))
  File "/data/logs/xulm1/myconda/lib/python3.7/random.py", line 261, in choice
    raise IndexError('Cannot choose from an empty sequence') from None
IndexError: Cannot choose from an empty sequence

目前的运行来看的确应该按照我的issue说的改，或者将全部数据用来训练，还离线测试个啥子？这么小的HR与NDCG，纯属有点扯【注：本人博文说的东西从不针对任何人，只是这么说说而已，请不要自扣屎盆子、对号入座。哈哈】。如下，这是book数据改成留一法的训练过程与结果：指标也是没啥变化，这能不能说明我的数据除了稀疏外没有其他问题

time interval: 1.9249 min
book_ComiRec-SA_b128_lr0.001_d64_len20_leave1out
iter: 2000, train loss: 7.6902, valid recall: 0.006361, valid ndcg: 0.006361, valid hitrate: 0.006361
time interval: 3.5376 min
。。。
model restored from best_model/book_ComiRec-SA_b128_lr0.001_d64_len20_leave1out/
valid recall: 0.006361, valid ndcg: 0.006361, valid hitrate: 0.006361, valid diversity: 0.040000
test recall: 0.006361, test ndcg: 0.006361, test hitrate: 0.006361, test diversity: 0.040000

3-将类别再次处理【20210428】

之前的item cate杂乱，啥数据都有，将其中垃圾数据全部归为-1，特别是有?的垃圾数据，只能说有些人数据没处理好，bug就向下流了。也有很多类别真的很傻逼，单个就是个类别，这样能学出来个鬼吧。单个类别就是一个item的竟然有200个。还是暂时用粗的类别吧，这个算是比较准确的。

[(272, 1), (13, 1), (269, 1), (276, 1), (781, 1), (266, 1), (261, 1), (51, 1), (18, 1), (53, 1), (273, 1), (779, 1), (270, 1), (254, 1), (307, 1), (252, 1), (518, 1), (257, 1), (268, 1), (12, 1), (250, 1), (308, 1), (248, 1), (277, 1), (289, 1), (302, 1), (46, 1), (243, 1), (287, 1), (301, 1), (799, 1), (288, 1), (300, 1), (44, 1), (290, 1), (249, 1), (35, 1), (260, 1), (292, 1), (293, 1), (298, 1), (42, 1), (294, 1), (295, 1), (41, 1), (558, 1), (769, 1), (259, 1), (47, 1), (278, 1), (790, 1), (279, 1), (281, 1), (793, 1), (306, 1), (50, 1), (282, 1), (1, 1), (509, 1), (40, 1), (795, 1), (258, 1), (304, 1), (48, 1), (247, 1), (3, 1), (286, 1), (798, 1), (251, 1), (96, 1), (496, 1), (408, 1), (146, 1), (402, 1), (658, 1), (147, 1), (660, 1), (149, 1), (661, 1), (150, 1), (406, 1), (407, 1), (152, 1), (153, 1), (420, 1), (154, 1), (155, 1), (411, 1), (232, 1), (156, 1), (412, 1), (158, 1), (231, 1), (160, 1), (417, 1), (163, 1), (401, 1), (145, 1), (144, 1), (655, 1), (132, 1), (389, 1), (645, 1), (134, 1), (390, 1), (391, 1), (647, 1), (136, 1), (392, 1), (233, 1), (137, 1), (393, 1), (138, 1), (394, 1), (650, 1), (139, 1), (395, 1), (651, 1), (396, 1), (397, 1), (142, 1), (398, 1), (143, 1), (164, 1), (421, 1), (387, 1), (224, 1), (185, 1), (697, 1), (186, 1), (698, 1), (699, 1), (188, 1), (700, 1), (193, 1), (227, 1), (196, 1), (225, 1), (199, 1), (166, 1), (202, 1), (204, 1), (205, 1), (206, 1), (207, 1), (222, 1), (210, 1), (212, 1), (214, 1), (218, 1), (216, 1), (440, 1), (184, 1), (695, 1), (439, 1), (423, 1), (424, 1), (425, 1), (170, 1), (426, 1), (428, 1), (429, 1), (430, 1), (431, 1), (176, 1), (432, 1), (177, 1), (178, 1), (434, 1), (179, 1), (435, 1), (180, 1), (436, 1), (181, 1), (229, 1), (182, 1), (438, 1), (228, 1), (643, 1), (641, 1), (311, 1), (337, 1), (75, 1), (76, 1), (332, 1), (77, 1), (589, 1), (78, 1), (334, 1), (236, 1), (79, 1), (335, 1), (591, 1), (593, 1), (346, 1), (82, 1), (338, 1), (83, 1), (339, 1), (84, 1), (341, 1), (87, 1), (343, 1), (599, 1), (89, 1), (345, 1), (586, 1), (330, 1), (329, 1), (73, 1), (312, 1), (240, 1), (824, 1), (57, 1), (314, 1), (59, 1), (315, 1), (60, 1), (61, 1), (317, 1), (63, 1), (319, 1), (238, 1), (322, 1), (324, 1), (69, 1), (325, 1), (70, 1), (326, 1), (71, 1), (72, 1), (328, 1), (584, 1), (235, 1), (91, 1), (385, 1), (375, 1), (366, 1), (111, 1), (368, 1), (114, 1), (370, 1), (115, 1), (511, 1), (628, 1), (373, 1), (629, 1), (118, 1), (376, 1), (603, 1), (632, 1), (378, 1), (634, 1), (123, 1), (124, 1), (637, 1), (126, 1), (382, 1), (127, 1), (128, 1), (384, 1), (621, 1), (365, 1), (620, 1), (362, 1), (92, 1), (348, 1), (604, 1), (606, 1), (351, 1), (607, 1), (217, 1), (97, 1), (98, 1), (354, 1), (610, 1), (355, 1), (612, 1), (101, 1), (357, 1), (613, 1), (614, 1), (103, 1), (359, 1), (104, 1), (490, 1), (361, 1), (106, 1), (371, 1), (602, 2), (64, 2), (65, 2), (818, 2), (344, 2), (493, 2), (68, 2), (491, 2), (242, 2), (340, 2), (58, 2), (313, 2)]

【从冬天开始的俯卧撑，早晚各一次，目前已经做到一口气80个，我的目标是200个，暂且不说标准与否，锻炼手臂，助于睡眠，以后可能要加上仰卧起坐了，这样的话最好是9点前能下班，太晚对身体不好】

将类别用最粗的发现仍旧有很多无类别（约1/5），这就是内容画像或者数据处理做的不行，当然这不是我应该背的锅。几个类别的item个数很少，这样的类别没啥用，与无类别的一样，啥都学不到。调整后发现指标又下降了，卧槽，从百万分之7降到百万分之5，。。。。

4-如何infer

最终训练得到的是啥子？根据paper的图可知，每个user是几个兴趣embedding来表征，各自进行topk个召回后，再进行筛选。看到代码有output我放心了，这个输出的正是item的embedding，根据paper4.2中所述，每个user学习K个兴趣embedding，各自进行topN个召回，然后按照内积大小进行排序，这点与MIND并无区别。寡人采用K=4，self-attention的模型进行尝试，不过在test阶段太慢了，卧槽，比蜗牛还慢（啥JB速度用了20min）。算了，直接输出训练好的变量吧，我看是啥子样子。emmm，咋只有item的embedding啊？？

>>> emb.shape
(367978, 64)

我要兴趣的embedding，，，，多兴趣，学到最后没兴趣。。。。。细查代码发现有user_emb，但输入是啥子？

    def output_user(self, sess, inps):
        user_embs = sess.run(self.user_eb, feed_dict={
            self.mid_his_batch_ph: inps[0],
            self.mask: inps[1]
        })
        return user_embs

查看评价部分即可得到，但并不是那么容易得到，其中需要考虑的是数据集。如果采用留一法分割数据，那么除了最后一个的其他点击item都是作为输入数据来得到user的embedding，这样data应该为train的data，这一点与SRGNN又是相同的，可以的，小明哥，天赋异禀。哈哈，总体来说，ComiRec与SRGNN也是相似，只不过后者学到一个user的embedding，即用user点击的item序列表征user的兴趣偏好，而前者是学到多个embedding，最后根据内积大小排序，这也是序列推荐的整体模式，即与user无关，而与user的点击有关（其实user的点击还不是与user有关吗？）最终还是类似U2I的召回方式，因而faiss的部署也是如此。

def evaluate_full(sess, test_data, model, model_path, batch_size, item_cate_map, save=True, coef=None):
    topN = args.topN

    item_embs = model.output_item(sess)

    res = faiss.StandardGpuResources()
    flat_config = faiss.GpuIndexFlatConfig()
    flat_config.device = 0

按照如上所述，那么我之前的评价指标是可以的，这样才是真正的对齐，才能与之前的方法进行PK。其中模型的训练及保存等需要修改，比如训练10次，保存最后一次的模型，其中不再验证验证集的指标（因为没有变化），这部分也可节省时间，我看作者写的代码还可，没有乱七八糟的不常见的代码（有的偏僻的可能很难改，我的目的是改成多GPU模式）。

最终指标如下：按照原代码结果

iter: 10000, train loss: 1.9007
time interval: 111.7582 s
WARNING:tensorflow:From src/mytrain.py:319: The name tf.train.Saver is deprecated. Please use tf.compat.v1.train.Saver instead.

model restored from best_model/docpic_ComiRec-SA_b128_lr0.005_d64_len20_test_docpic/
valid recall: 0.156470, valid ndcg: 0.283301, valid hitrate: 0.421946, valid diversity: 0.798395

iter: 1000000, train loss: 1.1756
time interval: 180.4199 min
WARNING:tensorflow:From src/mytrain.py:319: The name tf.train.Saver is deprecated. Please use tf.compat.v1.train.Saver instead.

model restored from best_model/docpic_ComiRec-SA_b128_lr0.005_d64_len20_TEST/
valid recall: 0.257123, valid ndcg: 0.449645, valid hitrate: 0.594076, valid diversity: 0.681665

一个用了2min迭代，一个用了3h，其中差别只是迭代次数，然而迭代次数并不是epoch，而是其中样本的训练个数，当然可能有重复训练的，至于重复了几次不知道。这个R与HR不同的原因是，这里的验证并不是针对最后一个item，也就不是留一法。寡人已经保存了用户及item的embedding，可进行faiss召回看看leave-one-out test method 的指标，如下：

我疯了。。。。。。。。分别为MAP，HR，NDCG，就这水平。。。如果没有其他问题的话，这就是很差劲的结果

>>> score=evaluate_score(preds,answer_dict)
answer length, 1239551
>>> score
array([7.9618017e-05, 9.6567225e-04, 2.4277368e-04], dtype=float32)

我怀疑有问题，首先是user_id与user_emb可能没有对应，也就是说得到的user的embedding可能不是有序的，经查看data_next迭代生成数据的方式发现，数据的格式是user,item,time,如下：

    def read(self, source):
        self.graph = {}
        self.users = set()
        self.items = set()
        with open(source, 'r') as f:
            for line in f:
                conts = line.strip().split(',')
                user_id = int(conts[0])
                item_id = int(conts[1])
                time_stamp = int(conts[2])
                self.users.add(user_id)
                self.items.add(item_id)
                if user_id not in self.graph:
                    self.graph[user_id] = []
                self.graph[user_id].append((item_id, time_stamp))
        for user_id, value in self.graph.items():
            value.sort(key=lambda x: x[1])
            self.graph[user_id] = [x[0] for x in value]

因此我的数据格式是有误的，user，item，cate,下面更改数据格式再次核对（或者将原来作者的代码修改，完全可以去掉第三列time，因为我已经拍好序）

train的第三列为time的另一个证据：item_cate的cate最大编号小于train的第三列最大数据，用的book原始数据

>>> train=pd.read_csv('book_train.txt',header=None)
>>> train.columns=['user_id','item_id','time']
>>> train['time'].max()
23221

>>> item_cate=pd.read_csv('../book_item_cate.txt',header=None)
>>> item_cate.columns
Int64Index([0, 1], dtype='int64')
>>> item_cate.columns=['item_id','cate']

>>> item_cate['cate'].min()
0
>>> item_cate['cate'].max()
1599

【插入一个疑问，既然训练的数据没有用cate，那么cate是怎么用于学习的？？？至少在data next迭代中未见到，这也难怪将cate从0排序也没有啥变化的原因】

但user是绝对有序的，set后add的user如下：可见从小到大的顺序

>>> user=set()
>>> user.add(1)
>>> user.add(2)
>>> user
{1, 2}
>>> user.add(4)
>>> user.add(2)
>>> user.add(3)
>>> user
{1, 2, 3, 4}

>>> user.add(30)
>>> user.add(20)
>>> user
{1, 2, 3, 4, 20, 30}

那么目前唯一的问题就是点击序列乱了，如果序列没有乱，结果如下：这个。。。算啥效果啊

answer length, 1239551
score : [0.01636344 0.1160275  0.03573435]

下面要做的工作是：1，尽可能将epoch用上，2，调整参数，3，如果可能改成多GPU

等我好消息吧。

愿我们终有重逢之时，而你还记得我们曾经讨论的话题。

又跑了下，多迭代了次数，也设定embedding_size=32但效果下降了，难道要调整LR？

iter: 399000, train loss: 0.8908
time interval: 54.3862 min
iter: 400000, train loss: 2.4162
time interval: 54.5183 min

answer length, 1239551
score : [0.0104962  0.10120842 0.0274579 ]

又来了一次将隐层size也调整为32，LR由千5下调为千1.结果如下：也不咋滴，没有明显提高

iter: 399000, train loss: 0.6971
time interval: 56.5206 min
iter: 400000, train loss: 2.1962
time interval: 56.6556 min

answer length, 1239551
score : [0.01636877 0.12692983 0.03753907]

下班。

Java进阶——常用类及常用方法详解 1加1等于 Java java
本文将深入探讨Java常用类的核心知识点以及在日常工作中的使用场景。本文目录一、String类1.不可变性2.字符串常量池3.比较字符串二、日期时间常用类1.Java8引入2.时间计算三、Math数值处理四、Optional空值处理五、异常处理类六、枚举类一、String类1.不可变性String类是不可变的，这意味着一旦创建就不能被修改。在进行字符串拼接时，需要注意性能问题。//不推荐：会创建多
Python 爬虫实战：舞台剧与演出信息获取西攻城狮北 python 爬虫开发语言
作为一名对文化艺术活动和数据获取感兴趣的内容创作者，我决定利用Python爬虫技术抓取舞台剧与演出信息。这对于文艺爱好者、文化活动组织者以及相关研究人员来说，是一个极具价值的探索。一、项目背景舞台剧和各类演出活动丰富了人们的精神文化生活。许多城市都有专业的演出场馆，如国家大剧院、上海大剧院等，它们会定期发布演出信息。通过爬虫技术，我们可以自动化地获取这些演出信息，方便用户查询和分析。二、技术选型在
数据结构——链表专项 seven——seven linux mailbox之线程邮箱数据结构链表算法
数据结构的总结1.定义一组用来保存一种或者多种特定关系的数据的集合（组织和存储数据）程序的设计：将现实中大量而复杂的问题以特定的数据类型和特定的存储结构存储在内存中，并在此基础上实现某个特定的功能的操作；程序=数据结构+算法高内聚，低耦合2.数据与数据之间的关系数据的逻辑结构：数据元素与元素之间的关系集合：关系平等线性结构：元素之间一对一的关系（表，队列。栈。。。）树型结构：元素之间一对多的关系（
新能源智慧路灯：点亮城市未来之路 2501_91106766 材料工程
在城市发展进程中，新能源智慧路灯凭借其创新性，为可持续发展指引了方向。它不仅是照明设施的升级换代，更是城市基础设施向智能化转型的重要环节。一、能源供应的革新新能源智慧路灯的关键在于其能源系统。通常配备太阳能电池板，可将日间阳光转化为电能，并储存于高性能电池中，为夜间照明及其他功能提供动力。在光照条件欠佳的区域，出现了风能辅助发电的路灯，风力发电机与太阳能电池板协同运作，确保能源供应的稳定性。这种多
Java高频面试之集合-08 牛马baby java 面试 python
hello啊，各位观众姥爷们！！！本baby今天来报道了！哈哈哈哈哈嗝面试官：详细说说CopyOnWriteArrayListCopyOnWriteArrayList详解CopyOnWriteArrayList是Java并发包（java.util.concurrent）中提供的线程安全列表，基于“写时复制”（Copy-On-Write）机制实现。它适用于读多写少的高并发场景，如事件监听器列表、配置
Jarslink 是一个 SOFA 方舟插件，用于管理多应用部署后端java
前言大家好，我是老马。sofastack其实出来很久了，第一次应该是在2022年左右开始关注，但是一直没有深入研究。最近想学习一下SOFA对于生态的设计和思考。sofaboot系列SOFABoot-00-sofaboot概览SOFABoot-01-蚂蚁金服开源的sofaboot是什么黑科技？SOFABoot-02-模块化隔离方案SOFABoot-03-sofaboot介绍SOFABoot-04-快
Cesium实践（1）—— Hello World 迦南giser WebGIS #Cesium webgis cesium
文章目录前言Cesium是什么Cesium核心类ViewerSceneEntityDataSourceCollection创建第一个Cesium应用工程搭建Cesium版helloworld总结前言工作大半年来主要的技术栈是mapbox-gl和threejs，但是作为一名GIS专业毕业生，一直对Cesium充满兴趣。Cesium不仅保持了threejs的三维绘制能力，而且内置大量渲染地理数据的AP
CMake 开发库(Library)的最佳实践 arong-xu CMake c++CMake 最佳实践
1.使用ModernCMake开发库CMake在C++社区中非常流行,可以说是事实上的C++包管理工具.在MeetingC++开发者调查中,有75.73%的受访者表示自己使用CMake作为构建工具.选择一个广泛流行的工具来打包库意味着你的项目更容易被别人使用.本文将从一个简单的库的打包样例开始,介绍编写CMake的最佳实践.由于CSDN的markdown不支持highlight特定行,有兴趣的读者
深入了解 ArangoDB 的图数据库应用与 Python 实践 eahba 数据库 python 开发语言
在当前数据驱动的时代，对连接数据的高效处理和分析需求日益增长。ArangoDB作为一个可扩展的图数据库系统，能够加速从连接数据中获取价值。本文将介绍如何使用Python连接和操作ArangoDB，并展示如何结合图问答链来获取数据洞察。技术背景介绍ArangoDB是一个多模型数据库，支持文档、图和键值类型的数据存储。其强大的图形存储和查询能力使其成为处理复杂数据关系的理想选择。通过JSON支持和单一
CopyOnWriteArrayList详解重生之我在成电转码 java 开发语言集合
1️⃣什么是CopyOnWriteArrayList？java.util.concurrent包下的线程安全的List读多写少场景下的性能优选核心思想：写时复制（Copy-On-Write）2️⃣底层原理内部维护一个volatileObject[]array读操作：直接读取数组，不加锁，性能极高写操作（增删改）：加ReentrantLock互斥锁把原数组复制一份新数组在新数组上操作操作完成后，替换
Python基于深度学习的动物图片识别技术的研究与实现 Java老徐 Python 毕业设计 python 深度学习开发语言深度学习的动物图片识别技术 Python动物图片识别技术
博主介绍：✌程序员徐师兄、7年大厂程序员经历。全网粉丝12w+、csdn博客专家、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌文末获取源码联系精彩专栏推荐订阅不然下次找不到哟2022-2024年最全的计算机软件毕业设计选题大全：1000个热门选题推荐✅Java项目精品实战案例《100套》Java微信小程序项目实战《100套》感兴趣的可以先收藏起来，还有大家
论文阅读笔记——MAGICDRIVE: STREET VIEW GENERATION WITH DIVERSE 3D GEOMETRY CONTROL 寻丶幽风论文阅读笔记论文阅读笔记 3d 人工智能自动驾驶
MagicDrive论文MagicDrive通过对3D数据和文本数据的多模态条件融合和隐式视角转换，实现了高质量、多视角一致的3D场景生成。几何条件编码Cross-attention：针对顺序数据，适合处理文本标记和边界框等可变长度输入。Additiveencoderbranch：对于地图等网络状规则数据，能够有效保留空间结构。对于文本按照模版构建：“Adrivingsceneat{locatio
2025最新智能优化算法：改进型雪雁算法（Improved Snow Geese Algorithm, ISGA）求解23个经典函数测试集荣华富贵8 程序员的知识储备1 程序员的知识储备2 程序员的知识储备3 经验分享
摘要随着智能优化算法的不断发展，解决高维、复杂的优化问题已成为研究的重要课题。雪雁算法（SnowGeeseAlgorithm,SGA）作为一种新兴的自然启发式优化算法，以其高效的全局搜索能力受到了广泛关注。然而，雪雁算法在处理多峰、多约束和高维复杂问题时，仍面临收敛速度较慢和易陷入局部最优解的问题。为此，本文提出了一种改进型雪雁算法（ISGA），通过引入自适应权重调整机制和混合局部搜索策略，增强了
卷积神经网络 - 理解卷积核的尺寸 k×k×Cin 谦亨有终 AI学习笔记 cnn 人工智能神经网络深度学习机器学习
卷积神经网络中，每个卷积核的尺寸为k×k×Cin，这一设计的核心原因在于多通道输入的数据结构和跨通道特征整合的需求。以下是详细解释：1.输入数据的结构输入形状：假设输入数据为三维张量，形状为H×W×Cin，其中：H：高度（Height）W：宽度（Width）Cin：通道数（Channelsin）多通道的物理意义：对于RGB图像，Cin=3（红、绿、蓝三通道）。对于中间层的特征图，Cin可能为64、
使用 NetworkX 进行图论分析与可视化 aiweker 跟我学python 图论 python
使用NetworkX进行图论分析与可视化NetworkX是一个用于创建、操作和研究复杂网络的Python库。它提供了丰富的图论算法和数据结构，适用于各种网络分析任务。本文将分点介绍NetworkX的主要功能，并通过代码示例进行详细说明。1.安装NetworkX在开始使用NetworkX之前，首先需要安装它。可以通过pip进行安装：pipinstallnetworkx2.创建图NetworkX支持多
去哪儿网 ReactNative 跨小程序多端方案介绍去哪儿网技术沙龙大前端前端 react native 小程序
1前言qrn-remax-unir是由去哪儿网前端技术团队实现的一套将RN适配到小程序端的跨端组件，通过该组件库可快速方便的将RN源代码直接运行到小程序端。方案参考了react-native-web的适配方案，使用remax框架来实现适配组件库并达到适配多小程序的目的。和react-native-web一样，它对RN源代码侵入度低，并且调试和替换组件相当方便。方案来自于社区，我们只是合理的应用用来
流浪地球 - 华为OD机试真题(E卷、Java) 什码情况华为od java 数据结构算法面试机试
针对刷题难，效率慢，我们提供一对一算法辅导，针对个人情况定制化的提高计划（全称1V1效率更高）。有兴趣的同学可以扫码添加我们的微信（code5bug）了解，免费试课一下。题目描述流浪地球计划在赤道上均匀部署了N个转向发动机，按位置顺序编号为0~N。1).初始状态下所有的发动机都是未启动状态;2).发动机启动的方式分为”手动启动”和”关联启动”两种方式;3).如果在时刻1一个发动机被启动，下一个时刻
【005安卓开发方案调研】之Flutter+Dart技术开发安卓 ThinkPet 移动app开发 android flutter dart 跨平台
基于2025年国内移动开发环境现状，结合多份行业分析报告和技术文档，对Flutter+Dart开发安卓应用的技术成熟度和生态适配性分析如下：一、技术成熟度评估1.跨平台能力达到生产级标准Flutter的Skia自渲染引擎和Dart的AOT/JIT双编译模式，实现了90%以上的原生性能表现，在电商、社交、工具类应用中已无明显性能瓶颈。实测数据显示，列表滚动帧率稳定在55-60FPS，与原生开发差距小
《AI大模型趣味实战》第8集：多端适配个人新闻头条基于大模型和RSS聚合打造个人新闻电台(Flask WEB版) 2 带娃的IT创业者 AI大模型趣味实战人工智能 flask 前端
《AI大模型趣味实战》第8集：多端适配个人新闻头条基于大模型和RSS聚合打造个人新闻电台(FlaskWEB版)2摘要本文末尾介绍了如何实现新闻智能体的方法。在信息爆炸的时代，如何高效获取和筛选感兴趣的新闻内容成为一个现实问题。本文将带领读者通过Python和Flask框架，结合大模型的强大能力，构建一个个性化的新闻聚合平台，不仅能够自动收集整理各类RSS源的新闻，还能以语音播报的形式提供"新闻电台
项目解决方案：博物馆视频监控系统建设解决方案威迪斯特解决方案博物馆视频联网资源汇聚监控软件音视频客户端
目录一.相关项目背景1.1技术革新背景1.2技术提升背景1.3发展趋势背景1.4合规性要求背景二.与客户确认的需求2.1实时远程监控与高清识别2.2权限管理灵活且安全2.3多平台访问，随时随地监控2.4视频汇聚，集中管理三.实现特点3.1智能预警，守护安全3.2全面支持，无忧运营3.3成本控制，效益最大化3.4拓展集成，信息联动四.必实现的建设目标4.1安全可靠4.2贴合需要4.3易于拓展4.4性
内核调试环境：buildroot/debootstrap制作文件系统、编译内核、QEMU模拟苏打呀 linux qemu kernel
编译内核#安装常用工具和依赖，可能会多，懒得分了，全装了吧反正以后说不定还要用。。。sudoaptinstallcurlwgetgpgzshtreegitnet-toolsproxychains4remminavimtarstracellvmclangunzipgccgcc-multilibbuild-essentialflexbisoncmakemakegawkdkmsautoconfninja
在manjaro中开启多VLAN，配置永久静态IP，使用systemd-networkd配置 SunJavaApplet Linux manjaro vlan
网络交换机给接入口配置的Trunk口，可以接入多个VLAN，安装好系统后不能上网。这里使用systemd-networkd进行配置，也可以利用iproute2或netctl配置。打开终端输入ipaddr查看网络状况1:lo:mtu65536qdiscnoqueuestateUNKNOWNgroupdefaultqlen1000link/loopback00:00:00:00:00:00brd00:
systemd-networkd 的 /etc/systemd/network/*.network 能不能一个文件配置多块网卡?不能 kfepiza #Linux CentOS Ubuntu 等 #控制台命令行 Shell脚本 sh cmd 等网络通讯传输协议物联 linux tcp/ip
systemd-networkd的/etc/systemd/network/*.network能不能一个文件配置多块网卡?不能查看官方文档可以用mansystemd.network命令,或访问:https://www.freedesktop.org/software/systemd/man/latest/systemd.network.html在systemd-networkd的配置中，一个.ne
麦谷科技-前端面经 dancehole 科技前端
base：车联网，uniapp小程序。面试时间：2025-03月（应届）投递岗位：前端（转正实习）面试流程比较短，可能是因为经历不匹配或者第一题答的不好Tvt时间：上午约一面，下午约二面，隔一天（第三天）约hr面。整体流程还是很快的。HR面去公司线下参观了，整体地理环境也很nice。最后因为个人原因没有入职，也是相当可惜一面自我介绍&BG：两端实习，介绍了一下自己的工作。面试官表示不太感兴趣（问了
QHDBO基于量子计算和多策略融合的蜣螂优化算法算法小狂人算法改进智能优化算法量子计算算法
2.DBO基本的蜣螂算法通过模拟蜣螂在自然界中的四种行为（滚动、产卵、觅食和偷窃）来执行种群位置更新。2.1滚动蜣螂在自然界中，蜣螂必须通过太阳导航，使其球滚动的路线尽可能直线。方程(1)用于原始论文中更新滚动蜣螂的位置：xi(t+1)=xi(t)+α⋅k⋅xi(t−1)+b⋅Δx(1)x_i(t+1)=x_i(t)+\alpha\cdotk\cdotx_i(t-1)+b\cdot\Deltax\
AI模型技术演进与行业应用图谱智能计算研究中心其他
内容概要当前AI模型技术正经历从基础架构到行业落地的系统性革新。主流深度学习框架如TensorFlow和PyTorch持续优化动态计算图与分布式训练能力，而MXNet凭借高效的异构计算支持在边缘场景崭露头角。与此同时，模型压缩技术通过量化和知识蒸馏将参数量降低60%-80%，联邦学习则通过加密梯度交换实现多机构数据协同训练。在应用层面，医疗诊断模型通过迁移学习在CT影像分类任务中达到98.2%的准
算力网协同创新与多场景应用实践智能计算研究中心其他
内容概要算力网协同创新正通过技术融合与场景适配，驱动算力资源的高效整合与跨域调度。核心突破方向涵盖异构计算架构优化、边缘计算实时响应能力提升，以及智能算力在工业互联网、数字孪生等场景的动态供给。随着“东数西算”工程推进，算力网络需兼顾性能与可持续性，在芯片制程优化、模型压缩算法及能耗管理等领域形成技术闭环。技术方向应用场景关键指标异构计算架构工业检测任务延迟<10ms模型压缩算法医疗影像分析计算资
算力技术创新与多场景应用突破智能计算研究中心其他
内容概要算力技术创新正成为驱动数字经济发展的核心引擎，其演进路径呈现出多维度突破态势。从量子计算颠覆性架构到光子计算超高速特性，从异构计算资源动态整合到边缘计算实时响应机制，技术革新持续突破物理边界与能耗瓶颈。应用层面，工业互联网实时控制、元宇宙沉浸式交互、生物计算精准建模等场景对算力提出差异化需求，推动智能调度算法与能效管理体系的协同优化。与此同时，全国一体化算力网络建设加速芯片制程迭代、数据中
Sa-Token v1.20.0 发布，新增临时Token认证
框架介绍Sa-Token是一个轻量级Java权限认证框架，主要解决：登录认证、权限认证、分布式Session会话、单点登录、OAuth2.0等一系列权限相关问题。框架针对踢人下线、自动续签、前后台分离、分布式会话……等常见业务进行N多适配，通过sa-token，你可以以一种极简的方式实现系统的权限认证部分Sa-Tokenv1.20.0版本更新包括以下内容：新增：新增Solon适配插件，感谢大佬@刘
trae使用攻略 yzx991013 python 开发语言服务器
一、核心技巧：构建高效写作工作流1.深度定制写作风格模板在.md文件定义包含写作风格、目标受众、格式要求的模板，如：风格：口语化表达，用表情符号，段落简洁；受众：互联网从业者、年轻群体；格式：标题含emoji，三级目录，关键术语加粗。模板保存至Templates文件夹，通过#include指令复用。2.多源草稿智能整合粘贴转录文本，用#clean去除冗余语气词并分段；以@引用其他文档内容，AI自动
Dom 周华华 JavaScript html
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
【Spark九十六】RDD API之combineByKey bit1129 spark
1. combineByKey函数的运行机制 RDD提供了很多针对元素类型为(K,V)的API，这些API封装在PairRDDFunctions类中，通过Scala隐式转换使用。这些API实现上是借助于combineByKey实现的。combineByKey函数本身也是RDD开放给Spark开发人员使用的API之一首先看一下combineByKey的方法说明：
msyql设置密码报错：ERROR 1372 (HY000): 解决方法详解 daizj mysql 设置密码
MySql给用户设置权限同时指定访问密码时，会提示如下错误： ERROR 1372 (HY000): Password hash should be a 41-digit hexadecimal number；问题原因：你输入的密码是明文。不允许这么输入。解决办法：用select password('你想输入的密码');查询出你的密码对应的字符串，然后
路漫漫其修远兮吾将上下而求索周凡杨学习思索
王国维在他的《人间词话》中曾经概括了为学的三种境界古今之成大事业、大学问者，罔不经过三种之境界。“昨夜西风凋碧树。独上高楼，望尽天涯路。”此第一境界也。“衣带渐宽终不悔，为伊消得人憔悴。”此第二境界也。“众里寻他千百度，蓦然回首，那人却在灯火阑珊处。”此第三境界也。学习技术，这也是你必须经历的三种境界。第一层境界是说，学习的路是漫漫的，你必须做好充分的思想准备，如果半途而废还不如不要开始。这里，注
Hadoop(二)对话单的操作朱辉辉33 hadoop
Debug： 1、 A = LOAD '/user/hue/task.txt' USING PigStorage(' ') AS (col1,col2,col3); DUMP A; //输出结果前几行示例： (>ggsnPDPRecord(21),,) (-->recordType(0),,) (-->networkInitiation(1),,)
web报表工具FineReport常用函数的用法总结（日期和时间函数）老A不折腾 finereport 报表工具 web开发
web报表工具FineReport常用函数的用法总结（日期和时间函数）说明：凡函数中以日期作为参数因子的，其中日期的形式都必须是yy/mm/dd。而且必须用英文环境下双引号(" ")引用。 DATE DATE(year,month,day):返回一个表示某一特定日期的系列数。 Year:代表年，可为一到四位数。 Month:代表月份。
c++ 宏定义中的##操作符墙头上一根草 C++
#与##在宏定义中的--宏展开 #include <stdio.h> #define f(a,b) a##b #define g(a) #a #define h(a) g(a) int main() { &nbs
分析Spring源代码之，DI的实现 aijuans spring DI 现源代码
(转) 分析Spring源代码之，DI的实现 2012/1/3 by tony 接着上次的讲，以下这个sample [java] view plain copy print
for循环的进化 alxw4616 JavaScript
// for循环的进化 // 菜鸟 for (var i = 0; i < Things.length ; i++) { // Things[i] } // 老鸟 for (var i = 0, len = Things.length; i < len; i++) { // Things[i] } // 大师 for (var i = Things.le
网络编程Socket和ServerSocket简单的使用百合不是茶网络编程基础 IP地址端口
网络编程;TCP/IP协议网络:实现计算机之间的信息共享,数据资源的交换协议:数据交换需要遵守的一种协议,按照约定的数据格式等写出去端口:用于计算机之间的通信每运行一个程序，系统会分配一个编号给该程序，作为和外界交换数据的唯一标识 0~65535 查看被使用的
JDK1.5 生产消费者 bijian1013 java thread 生产消费者 java多线程
ArrayBlockingQueue：一个由数组支持的有界阻塞队列。此队列按 FIFO（先进先出）原则对元素进行排序。队列的头部是在队列中存在时间最长的元素。队列的尾部是在队列中存在时间最短的元素。新元素插入到队列的尾部，队列检索操作则是从队列头部开始获得元素。 ArrayBlockingQueue的常用方法：
JAVA版身份证获取性别、出生日期及年龄 bijian1013 java 性别出生日期年龄
工作中需要根据身份证获取性别、出生日期及年龄，且要还要支持15位长度的身份证号码，网上搜索了一下，经过测试好像多少存在点问题，干脆自已写一个。 CertificateNo.java package com.bijian.study; import java.util.Calendar; import
【Java范型六】范型与枚举 bit1129 java
首先，枚举类型的定义不能带有类型参数，所以，不能把枚举类型定义为范型枚举类，例如下面的枚举类定义是有编译错的 public enum EnumGenerics<T> { //编译错，提示枚举不能带有范型参数 OK, ERROR; public <T> T get(T type) { return null;
【Nginx五】Nginx常用日志格式含义 bit1129 nginx
1. log_format 1.1 log_format指令用于指定日志的格式，格式： log_format name(格式名称) type(格式样式) 1.2 如下是一个常用的Nginx日志格式： log_format main '[$time_local]|$request_time|$status|$body_bytes
Lua 语言 15 分钟快速入门 ronin47 lua 基础
- - 单行注释 - - [[ [多行注释] - - ]] - - - - - - - - - - - 1. 变量 & 控制流 - - - - - - - - - - num = 23 - - 数字都是双精度 str = 'aspythonstring'
java-35.求一个矩阵中最大的二维矩阵 ( 元素和最大 ) bylijinnan java
the idea is from: http://blog.csdn.net/zhanxinhang/article/details/6731134 public class MaxSubMatrix { /**see http://blog.csdn.net/zhanxinhang/article/details/6731134 * Q35 求一个矩阵中最大的二维
mongoDB文档型数据库特点开窍的石头 mongoDB文档型数据库特点
MongoDD: 文档型数据库存储的是Bson文档-->json的二进制特点：内部是执行引擎是js解释器，把文档转成Bson结构，在查询时转换成js对象。 mongoDB传统型数据库对比传统类型数据库：结构化数据，定好了表结构后每一个内容符合表结构的。也就是说每一行每一列的数据都是一样的文档型数据库：不用定好数据结构，
[毕业季节]欢迎广大毕业生加入JAVA程序员的行列 comsci java
一年一度的毕业季来临了。。。。。。。。正在投简历的学弟学妹们。。。如果觉得学校推荐的单位和公司不适合自己的兴趣和专业，可以考虑来我们软件行业，做一名职业程序员。。。软件行业的开发工具中，对初学者最友好的就是JAVA语言了，网络上不仅仅有大量的
PHP操作Excel – PHPExcel 基本用法详解 cuiyadll PHP Excel
导出excel属性设置//Include classrequire_once('Classes/PHPExcel.php');require_once('Classes/PHPExcel/Writer/Excel2007.php');$objPHPExcel = new PHPExcel();//Set properties 设置文件属性$objPHPExcel->getProperties
IBM Webshpere MQ Client User Issue (MCAUSER) darrenzhu IBM jms user MQ MCAUSER
IBM MQ JMS Client去连接远端MQ Server的时候，需要提供User和Password吗？答案是根据情况而定，取决于所定义的Channel里面的属性Message channel agent user identifier (MCAUSER)的设置。 http://stackoverflow.com/questions/20209429/how-mca-user-i
网线的接法 dcj3sjt126com
一、PC连HUB (直连线)A端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。 B端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。二、PC连PC （交叉线）A端：(568A)：白绿，绿，白橙，蓝，白蓝，橙，白棕，棕； B端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。三、HUB连HUB&nb
Vimium插件让键盘党像操作Vim一样操作Chrome dcj3sjt126com chrome vim
什么是键盘党？键盘党是指尽可能将所有电脑操作用键盘来完成，而不去动鼠标的人。鼠标应该说是新手们的最爱，很直观，指哪点哪，很听话！不过常常使用电脑的人，如果一直使用鼠标的话，手会发酸，因为操作鼠标的时候，手臂不是在一个自然的状态，臂肌会处于绷紧状态。而使用键盘则双手是放松状态，只有手指在动。而且尽量少的从鼠标移动到键盘来回操作，也省不少事。在chrome里安装 vimium 插件
MongoDB查询（2）——数组查询[六] eksliang mongodb MongoDB查询数组
MongoDB查询数组转载请出自出处：http://eksliang.iteye.com/blog/2177292 一、概述 MongoDB查询数组与查询标量值是一样的，例如，有一个水果列表，如下所示： > db.food.find() { "_id" : "001", "fruits" : [ "苹
cordova读写文件（1） gundumw100 JavaScript Cordova
使用cordova可以很方便的在手机sdcard中读写文件。首先需要安装cordova插件：file 命令为： cordova plugin add org.apache.cordova.file 然后就可以读写文件了，这里我先是写入一个文件，具体的JS代码为： var datas=null;//datas need write var directory=&
HTML5 FormData 进行文件jquery ajax 上传到又拍云 ileson jquery Ajax html5 FormData
html5 新东西：FormData 可以提交二进制数据。页面test.html <!DOCTYPE> <html> <head> <title> formdata file jquery ajax upload</title> </head> <body> <
swift appearanceWhenContainedIn:(version1.2 xcode6.4) 啸笑天 version
swift1.2中没有oc中对应的方法： + (instancetype)appearanceWhenContainedIn:(Class <UIAppearanceContainer>)ContainerClass, ... NS_REQUIRES_NIL_TERMINATION; 解决方法：在swift项目中新建oc类如下： #import &
java实现SMTP邮件服务器 macroli java 编程
电子邮件传递可以由多种协议来实现。目前，在Internet 网上最流行的三种电子邮件协议是SMTP、POP3 和 IMAP，下面分别简单介绍。　　◆ SMTP 协议　　简单邮件传输协议(Simple Mail Transfer Protocol,SMTP)是一个运行在TCP/IP之上的协议，用它发送和接收电子邮件。SMTP 服务器在默认端口25上监听。SMTP客户使用一组简单的、基于文本的
mongodb group by having where 查询sql qiaolevip 每天进步一点点学习永无止境 mongo 纵观千象
SELECT cust_id, SUM(price) as total FROM orders WHERE status = 'A' GROUP BY cust_id HAVING total > 250 db.orders.aggregate( [ { $match: { status: 'A' } }, { $group: {
Struts2 Pojo（六） Luob. POJO strust2
注意：附件中有完整案例 1.采用POJO对象的方法进行赋值和传值 2.web配置 <?xml version="1.0" encoding="UTF-8"?> <web-app version="2.5" xmlns="http://java.sun.com/xml/ns/javaee&q
struts2步骤 wuai struts
1、添加jar包 2、在web.xml中配置过滤器 <filter> <filter-name>struts2</filter-name> <filter-class>org.apache.st

多兴趣模型实践ComiRec代码解读

For Recommendation in Deep learning QQ Group 102948747 For Visual in deep learning QQ Group 629530787 I'm here waiting for you 不接受这个网页的私聊/私信！！！

愿我们终有重逢之时，而你还记得我们曾经讨论的话题。

你可能感兴趣的:(Recommendation,ComiRec,多兴趣,MIND,召回)

For Recommendation in Deep learning QQ Group 102948747
For Visual in deep learning QQ Group 629530787
I'm here waiting for you
不接受这个网页的私聊/私信！！！