I_belong_to_jesus

Deep Interest Evolution Network(DIEN)专题2:代码解析之样本数据处理

源代码git地址：

https://github.com/mouna99/dien

整个数据处理可以通过执行脚本prepare_data.sh来实现，代码如下：

export PATH="~/anaconda4/bin:$PATH"
wget http://snap.stanford.edu/data/amazon/productGraph/categoryFiles/reviews_Books.json.gz
wget http://snap.stanford.edu/data/amazon/productGraph/categoryFiles/meta_Books.json.gz
gunzip reviews_Books.json.gz
gunzip meta_Books.json.gz
python script/process_data.py meta_Books.json reviews_Books_5.json
python script/local_aggretor.py
python script/split_by_user.py
python script/generate_voc.py

两个json文件，用户评价、点击相关的文件reviews_Books.json和具体商品信息相关的文件：meta_Books.json，具体json字段可参考DIN数据处理中的介绍。下面依次介绍3个python文件的功能，部分代码作了修改（适合python3执行并且修改一些问题）。

process_data.py

import sys
import random
import time

def process_meta(file): # meta_Books.json
    fi = open(file, "r")
    fo = open("item-info", "w")
    for line in fi:
        obj = eval(line)
        cat = obj["categories"][0][-1]
        #print>>fo, obj["asin"] + "\t" + cat
        print(obj["asin"] + "\t" + cat, file=fo) 
        # (文件 item-info 保存字段): 商品item id, 商品分类 cat（某个名词，例如：Cables & Accessories)
    fo.close()

def process_reviews(file): # reviews_Books_5.json
    fi = open(file, "r")
    user_map = {}
    fo = open("reviews-info", "w")
    for line in fi:
        obj = eval(line)
        userID = obj["reviewerID"]
        itemID = obj["asin"]
        rating = obj["overall"]
        time = obj["unixReviewTime"]
        #print>>fo, userID + "\t" + itemID + "\t" + str(rating) + "\t" + str(time)
        print(userID + "\t" + itemID + "\t" + str(rating) + "\t" + str(time), file=fo)
        # （文件reviews-info保存字段）：user id, 商品item id, rating of the product（商品等级,浮点数）, 时间戳
    fo.close()

def manual_join():
    f_rev = open("reviews-info", "r")
    user_map = {}
    item_list = []
    for line in f_rev:
        line = line.strip()
        items = line.split("\t")
        #loctime = time.localtime(float(items[-1]))
        #items[-1] = time.strftime('%Y-%m-%d', loctime)
        if items[0] not in user_map:
            user_map[items[0]]= []
        user_map[items[0]].append(("\t".join(items), float(items[-1])))
        # user_map: key -> user id; list：每个元素为 ("user id \t 商品item id \t rating of the product（商品等级）\t 时间戳", 时间戳) 
        item_list.append(items[1]) # 所有点击商品id，按顺序存入 item_list
    f_meta = open("item-info", "r")
    meta_map = {}
    for line in f_meta:
        arr = line.strip().split("\t")
        if arr[0] not in meta_map:
            meta_map[arr[0]] = arr[1] # meta_map: key -> item id; item category 一一对应
            arr = line.strip().split("\t")
    fo = open("jointed-new", "w")
    for key in user_map:
        sorted_user_bh = sorted(user_map[key], key=lambda x:x[1]) # 一个用户点击过的商品按时间戳排序
        for line, t in sorted_user_bh:
            items = line.split("\t")
            asin = items[1]
            j = 0
            while True:
                asin_neg_index = random.randint(0, len(item_list) - 1)
                asin_neg = item_list[asin_neg_index]
                if asin_neg == asin:
                    continue 
                items[1] = asin_neg
                #print>>fo, "0" + "\t" + "\t".join(items) + "\t" + meta_map[asin_neg]
                print("0" + "\t" + "\t".join(items) + "\t" + meta_map[asin_neg], file=fo)
                # 负样本,字段为：0(label) \t \t user id \t item id (负样本item) \t rating of the product（商品等级）\t 时间戳 \t 真实item 分类
                j += 1
                if j == 1:             #negative sampling frequency
                    break
            if asin in meta_map:
                #print>>fo, "1" + "\t" + line + "\t" + meta_map[asin]
                print("1" + "\t" + line + "\t" + meta_map[asin], file=fo)
                # 正样本,字段为：1(label) \t \t user id \t item id (正样本item) \t rating of the product（商品等级）\t 时间戳 \t 真实item 分类
            else:
                #print>>fo, "1" + "\t" + line + "\t" + "default_cat"
                print("1" + "\t" + line + "\t" + "default_cat", file=fo)
                # 正样本,字段为：1(label) \t \t user id \t item id (正样本item) \t rating of the product（商品等级）\t 时间戳 \t 真实item 分类


def split_test():
    fi = open("jointed-new", "r")
    fo = open("jointed-new-split-info", "w")
    user_count = {}
    for line in fi:
        line = line.strip()
        user = line.split("\t")[1]
        if user not in user_count:
            user_count[user] = 0
        user_count[user] += 1
    fi.seek(0)
    i = 0
    last_user = "A26ZDKC53OP6JD"
    for line in fi:
        line = line.strip()
        user = line.split("\t")[1]
        if user == last_user:
            if i < user_count[user] - 2:  # 1 + negative samples
                #print>> fo, "20180118" + "\t" + line
                print("20180118" + "\t" + line, file=fo)
            else:
                #print>>fo, "20190119" + "\t" + line
                print("20190119" + "\t" + line, file=fo)
        else:
            last_user = user
            i = 0
            if i < user_count[user] - 2:
                #print>> fo, "20180118" + "\t" + line
                print("20180118" + "\t" + line, file=fo)
            else:
                #print>>fo, "20190119" + "\t" + line
                print("20190119" + "\t" + line, file=fo)
        i += 1
        #(一个用户的最后一对正负样本：20190119，除最后一个外的其他所有对正负样本：20180118 ) \t label \t \t user id \t item id \t rating of the product（商品等级）\t 时间戳 \t 真实item 分类
process_meta(sys.argv[1]) # meta_Books.json 
process_reviews(sys.argv[2]) # reviews_Books_5.json
manual_join()
split_test()

process_meta函数，读取meta_Books.json文件，保存为item-info文件，文件字段为：

商品item id, 商品分类 cat（某个名词，例如：Cables & Accessories)

process_reviews函数，读取reviews_Books_5.json文件，保存为reviews-info文件，文件字段为：

user id, 商品item id, rating of the product（商品等级,浮点数）, 时间戳

manual_join函数，提取每一个点击行为的样本数据（正样本），且对于每一个正样本，都会对应随机选择一个其他的item商品作为负样本，保存为jointed-new文件，并且同一个用户多次点击的正负样本对会按照时间戳排序连续存储，文件字段为：

label \t \t user id \t item id \t rating of the product（商品等级）\t 时间戳 \t 真实item 分类

split_test函数，写入文件jointed-new-split-info，字段如下：

(一个用户的最后一对正负样本：20190119，除最后一个外的其他所有对正负样本：20180118 ) \t label \t \t user id \t item id \t rating of the product（商品等级）\t 时间戳 \t 真实item 分类

每个用户的样本分为正负样本对，且按时间顺序排序，依次存下来，且第一列加上一列前缀，20180118表示该用户的样本中最后一次之前点击的样本，20190119标识最后一次点击样本。

local_aggretor.py

import sys
import hashlib
import random

fin = open("jointed-new-split-info", "r")
ftrain = open("local_train", "w")
ftest = open("local_test", "w")

last_user = "0"
common_fea = ""
line_idx = 0
for line in fin:
    items = line.strip().split("\t")
    ds = items[0]
    clk = int(items[1]) # 是否有点击
    user = items[2] # 用户id
    movie_id = items[3] # 商品item id
    dt = items[5] # 时间戳
    cat1 = items[6] # item分类

    if ds=="20180118": # 如果不是最后一个正负样本对
        fo = ftrain
    else: # 如果是最后一个正负样本对
        fo = ftest
    if user != last_user: # 用户的第一个样本对 
        movie_id_list = []
        cate1_list = []
        #print >> fo, items[1] + "\t" + user + "\t" + movie_id + "\t" + cat1 +"\t" + "" + "\t" + "" 
    else:
        history_clk_num = len(movie_id_list)
        cat_str = ""
        mid_str = ""
        for c1 in cate1_list:
            cat_str += c1 + ""
        for mid in movie_id_list:
            mid_str += mid + ""
        if len(cat_str) > 0: cat_str = cat_str[:-1]
        if len(mid_str) > 0: mid_str = mid_str[:-1]
        if history_clk_num >= 1:    # 8 is the average length of user behavior
            #print >> fo, items[1] + "\t" + user + "\t" + movie_id + "\t" + cat1 +"\t" + mid_str + "\t" + cat_str
            print(items[1] + "\t" + user + "\t" + movie_id + "\t" + cat1 +"\t" + mid_str + "\t" + cat_str, file = fo)
    last_user = user
    if clk:
        movie_id_list.append(movie_id) #之前点过的商品id
        cate1_list.append(cat1) #之前点过的商品分类
    line_idx += 1
    #local test 存储内容：
    #每个用户两行数据：
    #第一行：label 0, 用户id, 商品id（未点击，负样本）, 商品分类, 之前点击过所有商品id，之前点击过所有商品分类
    #第二行：label 1, 用户id, 商品id（点击过，正样本）, 商品分类, 之前点击过所有商品id，之前点击过所有商品分类

打开上一步写入的文件jointed-new-split-info，由上面分析可知，用户的每一次点击样本都会生成一个正负样本对，然后按照时间戳依次存储，在此文件的处理中，会生成所有在此次点击之前有点击行为的样本（非用户的第一次点击都会生成样本），并且会添加之前点击商品id和之前商品分类这两个特征，同样按时间顺序保存正负样本对，根据上面文件中的前缀来区分是否是最后一次点击，最后一次点击的样本保存在local_test文件（每个用户只保存最后一次点击对应的一对样本），非最后一次点击保存在local_train文件（可能会有多对样本），保存字段如下：

#第一行：label 0, 用户id, 商品id（未点击，负样本）, 商品分类, 之前点击过所有商品id，之前点击过所有商品分类
#第二行：label 1, 用户id, 商品id（点击过，正样本）, 商品分类, 之前点击过所有商品id，之前点击过所有商品分类

split_by_user.py

代码如下：

import random

fi = open("local_test", "r")
#local test 存储内容：
#每个用户两行数据：
#第一行：label 0, 用户id, 商品id（未点击，负样本）, 商品分类, 之前点击过所有商品id，之前点击过所有商品分类
#第二行：label 1, 用户id, 商品id（点击过，正样本）, 商品分类, 之前点击过所有商品id，之前点击过所有商品分类 
ftrain = open("local_train_splitByUser", "w")
ftest = open("local_test_splitByUser", "w")
#格式相同：
#第一行：label 0, 用户id, 商品id（未点击，负样本）, 商品分类, 之前点击过所有商品id，之前点击过所有商品分类
#第二行：label 1, 用户id, 商品id（点击过，正样本）, 商品分类, 之前点击过所有商品id，之前点击过所有商品分类 

while True:
    rand_int = random.randint(1, 10)
    noclk_line = fi.readline().strip()
    clk_line = fi.readline().strip() # 点击和未点击 成对出现
    if noclk_line == "" or clk_line == "":
        break
    if rand_int == 2:
        #print >> ftest, noclk_line
        print(noclk_line, file = ftest)
        #print >> ftest, clk_line
        print(clk_line, file = ftest)
    else:
        #print >> ftrain, noclk_line
        print(noclk_line, file = ftrain)
        #print >> ftrain, clk_line
        print(clk_line, file = ftrain)

这里代码比较简单，就是将local_test即用户最后一次点击，按照1:9分成train和test，分别存入local_train_splitByUser文件和local_test_splitByUser文件，保存字段同上一步存储：

#第一行：label 0, 用户id, 商品id（未点击，负样本）, 商品分类, 之前点击过所有商品id，之前点击过所有商品分类
#第二行：label 1, 用户id, 商品id（点击过，正样本）, 商品分类, 之前点击过所有商品id，之前点击过所有商品分类

generate_voc.py

import _pickle as cPickle

f_train = open("local_test", "r")
#第一行：label 0, 用户id, 商品id（未点击，负样本）, 商品分类, 之前点击过所有商品id，之前点击过所有商品分类
#第二行：label 1, 用户id, 商品id（点击过，正样本）, 商品分类, 之前点击过所有商品id，之前点击过所有商品分类 
uid_dict = {}
mid_dict = {}
cat_dict = {}

iddd = 0
for line in f_train:
    arr = line.strip("\n").split("\t")
    clk = arr[0] # 是否有点击
    uid = arr[1] # 用户id
    mid = arr[2] # 商品item id
    cat = arr[3] # item分类
    mid_list = arr[4] #之前点过的item id
    cat_list = arr[5] #之前点过的item的分类
    if uid not in uid_dict:
        uid_dict[uid] = 0
    uid_dict[uid] += 1
    if mid not in mid_dict:
        mid_dict[mid] = 0
    mid_dict[mid] += 1
    if cat not in cat_dict:
        cat_dict[cat] = 0
    cat_dict[cat] += 1
    if len(mid_list) == 0:
        continue
    for m in mid_list.split(""):
        if m not in mid_dict:
            mid_dict[m] = 0
        mid_dict[m] += 1
    #print iddd
    iddd+=1
    for c in cat_list.split(""):
        if c not in cat_dict:
            cat_dict[c] = 0
        cat_dict[c] += 1

sorted_uid_dict = sorted(uid_dict.items(), key=lambda x:x[1], reverse=True) # items将 key和value转换成 组元（key, value），按照value排序，降序排序。每个user样本个数都为2.
sorted_mid_dict = sorted(mid_dict.items(), key=lambda x:x[1], reverse=True) # 每个商品item对应的被点击次数。 
sorted_cat_dict = sorted(cat_dict.items(), key=lambda x:x[1], reverse=True) # 每个商品分类对应的被点击次数。

uid_voc = {}
index = 0
for key, value in sorted_uid_dict:
    uid_voc[key] = index
    index += 1
# 所有 uid 依次编号为 0，1，2，3，4，5  ......
mid_voc = {}
mid_voc["default_mid"] = 0
index = 1
for key, value in sorted_mid_dict:
    mid_voc[key] = index
    index += 1
# 所有的 item id 依次编号为0，1，2，3，4，5 .......
cat_voc = {}
cat_voc["default_cat"] = 0
index = 1
for key, value in sorted_cat_dict:
    cat_voc[key] = index
    index += 1
# 所有的 cate id 依次编号为0，1，2，3，4，5 .......

cPickle.dump(uid_voc, open("uid_voc.pkl", "wb"))
cPickle.dump(mid_voc, open("mid_voc.pkl", "wb"))
cPickle.dump(cat_voc, open("cat_voc.pkl", "wb"))

这部分代码也比较简单，将所有用户id（uid）、商品item id（mid）和item分类id（cat）按照出现次数从大到小排序，并且每一个id都会编号（从0开始依次编号），uid_voc、mid_voc和cat_voc分别表示三类特征id映射的编号（0，1，2，3，4........）。

先讲到这里，下一节开始介绍具体模型的训练过程。

@DateTimeFormat、@JsonFormat、@JSONField区别及用法开往1982 java 前端时间 datetime
推荐写法：@JSONField(format="yyyy-MM-ddHH:mm:ss")@JsonFormat(timezone="GMT+8",pattern="yyyy-MM-ddHH:mm:ss")@DateTimeFormat(pattern="yyyy-MM-ddHH:mm:ss")privateLocalDatebirthday;前端读取数据库日期字段时使用@JsonFormat和@J
如何用notepad++格式化JOSN文本爱喝马黛茶的安东尼
很多数据文件一般是通过json格式保存的，如省市区的联动、区号、邮编、通讯录、游戏的服务器区等等，如下图的是以json保存的世界各个地区省市区的详细信息，这是一个很长很长的字符串。然后点击当前页面上面的“插件”菜单选项，在出现的菜单中将鼠标放在“PluginManager”选项上面，在出现的子菜单中点击“ShowPluginManager”选项。然后在弹出的页面中找到“JSONViewer”选项，
JSON 对象
JSON对象概述JSON（JavaScriptObjectNotation）对象是一种轻量级的数据交换格式，易于人阅读和编写，同时也易于机器解析和生成。JSON对象是JSON数据的一种基本结构，类似于JavaScript中的对象（Object）。在本文中，我们将详细介绍JSON对象的概念、语法、创建方法以及在实际应用中的使用。JSON对象的语法JSON对象使用大括号{}表示，其中包含一系列键值对。
JWT 翻译 lsswear 学习
jwt官网：JSONWebTokenIntroduction-jwt.iohttps://jwt.io/introduction标准RFC7519：https://datatracker.ietf.org/doc/html/rfc7519#section-4.1https://datatracker.ietf.org/doc/html/rfc7519#section-4.1JWT定义JWT全称JS
在UniApp中防止页面上下拖动的方法阿凤21 uni-app 前端
1、pages.json中在某个页面设置禁用弹性滚动的页面{"path":"pages/yourPage/yourPage","style":{"app-plus":{"bounce":"none"}}}2、pages.json中在所有页面设置禁用弹性滚动的页面{"globalStyle":{"app-plus":{"bounce":"none"}}}3、使用css实现/*禁用页面滚动*/page
抽象文档模式 hello 早上好设计模式开发语言 java
抽象文档模式在软件开发中，我们经常需要处理半结构化数据（如JSON、XML、文档数据库中的文档）。这类数据的特点是结构灵活，可能存在嵌套关系，且字段可能动态变化。传统的面向对象设计可能需要为每种数据结构定义大量类，导致代码冗余和维护困难。这时候，抽象文档模式（AbstractDocumentPattern）就能派上用场。本文将通过一个完整的Java案例，详细讲解抽象文档模式的实现原理、设计思路和实
docker镜像加速器配置daemon.json不生效蓝色天空的银码星 docker 容器 linux
现象安装docker26.1.4，启动服务拉取镜像发现超时，走的是官方镜像仓库地址，配置本地加速后/etc/docker/daemon.json，重启仍然走的官方地址加速器地址：https://docker.imgdb.de/dockerinfo|grep'RegistryMirrors'展示的是：io.docker，非我们配置的地址再继续测试：1、不通过系统服务systemctl启动docker
Gson、Fastjson 和 Jackson 对比解析小张0.0 JavaWeb json
目录1.Gson(Google)基本介绍：核心功能：特点：使用场景：2.Fastjson(Alibaba)基本介绍：核心功能：特点：使用场景：3.Jackson基本介绍：核心功能：特点：使用场景：4.对比总结5.选择建议Gson、Fastjson和Jackson这三种都是Java生态中广泛使用的JSON处理库，用于实现Java对象与JSON数据之间的相互转换。在项目中使用不同的方法即可调用不同的J
nodejs的npm 思静鱼 node.js npm 前端 node.js
1.什么是npm？npm（NodePackageManager）是Node.js的默认包管理工具，用于：安装和管理依赖（第三方库、框架等）。运行项目脚本（如启动服务、测试、构建等）。发布和共享代码（可将自己的模块发布到npm仓库）。2.为什么推荐用npmstart启动项目？在Node.js项目中，npmstart是标准的启动命令，以下是推荐原因：（1）标准化流程项目根目录的package.json
小架构step系列19：请求和响应秋千码途架构
1概述作为Web程序，通用形式是发起HTTP请求并获取返回的结果，在这个过程中，需要把请求映射到代码的接口上，提供这种接口的类一般称为Controller，也就是需要把请求映射到Controller的接口方法上，把请求的参数映射到接口的参数中，并从接口返回接口处理的结果。在后端渲染页面的场景中，返回的结果需要处理为视图View。而现在更普遍的是前后端分离，返回的结果一般处理为JSON格式的数据，前
vscode怎么装python_vscode如何安装python
vscode安装python的方法：1、在vscode的扩展中输入"extinstallpython"安装python插件打开VScode，Ctrl+p输入"extinstallpython"，搜索时间可能会比较长安装过程不能停止，否则重新安装；2、在配置文件“settings.json”修改python的安装路径修改用户设置-settings.json，将"python.pythonPath":
docker 常见错误零一间
服务启动失败#systemctlstartdocker.serviceJobfordocker.servicefailedbecausethecontrolprocessexitedwitherrorcode.See"systemctlstatusdocker.service"and"journalctl-xe"fordetails解决方法修改/etc/docker/daemon.json文件(j
kafka 生产消息和消费消息 kafka-console-producer.sh kafka-console-consumer.sh 锅锅来了 #Kafka运维实战 kafka linq 分布式
目录kafka-console-producer.sh基本用法常用参数说明示例用法1.简单发送消息2.发送带键的消息3.从文件读取消息4.发送批量消息5.使用自定义配置配置文件示例注意事项kafka-console-consumer.sh基本用法核心参数说明常见使用场景1.实时消费最新消息2.消费历史所有消息3.使用消费组4.消费特定分区5.格式化输出6.消费JSON格式消息7.导出消息到文件8.
bmsimilarity的打分调试参数 risc123456 elasticsearch
下面给出一条极简、可复制的DSL链路：1.建索引（默认BM25）2.插入文档3.触发BM25打分的查询---1️⃣创建索引（什么都不改，就是BM25）```jsonPUT/demo{"mappings":{"properties":{"title":{"type":"text"}//默认similarity=BM25}}}```---2️⃣插入文档```jsonPOST/demo/_doc/1{"
XML数据如何进行解析呢，方式有哪些？张起灵的小可爱啊
上回我们说到JSON解析的四种方式，那么这次我们来看看XML的四种解析方式。解析的四种方式DOM解析SAX解析JDOM解析DOM4J解析案例实操DOM解析DOM（DocumentObjectModel，文档对象模型），在应用程序中，基于DOM的XML分析器将一个XML文档转换成一个对象模型的集合（通常称为DOM树），应用程序正是通过对这个对象模型的操作，来实现对XML文档数据的操作。XML本身是以
JSON和JSONL、python操作 weixin_668 json python
JSONJSON（JavaScriptObjectNotation）是一种轻量级的数据交换格式，基于文本、易于读写，并支持多种数据结构。以下是常见的JSON格式及示例：1.简单对象（键值对）{"name":"Alice","age":25,"isStudent":true}2.嵌套对象{"person":{"name":"Bob","address":{"city":"NewYork","zipc
python JSON Lines (JSONL)的保存和读取；jsonl的数据保存和读取，大模型prompt文件保存常用格式医学小达人常用算法 NLP prompt JSON Lines JSONL jsonl jsonl文件保存读取
1.JSONLines(JSONL)文件保存将一个包含多个字典的列表保存为JSONLines(JSONL)格式的文件，每个字典对应一个JSONL文件中的一行。以下是如何实现这一操作的Python代码importjson#定义包含字典的列表data=[{"id":1,"name":"Alice","age":30,"email":"[email protected]"},{"id":2,"name"
Python 处理图像并生成 JSONL 元数据文件 - 固定text版本
Python处理图像并生成JSONL元数据文件-固定text版本flyfishJSONL（JSONLines）简介JSONL（JSONLines，也称为newline-delimitedJSON）是一种轻量级的数据序列化格式，由一系列独立的JSON对象组成，每行一个有效的JSON对象，行与行之间通过换行符（\n）分隔。JSONL是传统JSON的“轻量化”变体，通过“每行一个JSON对象”的设计，解
[微信域名检测]基于微信域名检测api的PHP随机跳转阿乐LeoChen
用户名和KEY请到www.xxweixin.com获取
CAN发送JSON数据摸鱼的小羊 json android javascript
CAN发送JSON数据文章目录CAN发送JSON数据前言一、核心问题与前提1、CAN总线的数据限制2、硬件基础二、实现步骤1.JSON数据的序列化（发送端）2.数据分片（关键步骤）3.CAN帧发送4.接收端处理5.校验与可靠性设计三、硬件与软件选型1.硬件2.软件四、示例代码片段（简化）1.发送端（C语言，基于STM32+cJSON+CAN）2.接收端（重组逻辑）总结1.数据长度优化：2.抗干扰：
【python】向AWS Dynamodb中插入数据
一、背景AWSDynamodb数据库在架构中起到的作用是配置数据库，s3上buckect_a-->bucket_b-->bucket_c对应着层与层之间的关系，总所周知，Dynamobd是非关系型数据库，数据插入的格式是键值对形式的二、代码importboto3importjsonimportpandasaspdAWS_ACCESS_KEY_ID=''AWS_SECRET_ACCESS_KEY='
Python Preview 项目教程
PythonPreview项目教程1.项目的目录结构及介绍python-preview/├──images/├──.eslintrc.json├──.gitignore├──.vscodeignore├──CHANGELOG.md├──README.md├──package.json├──tsconfig.json└──webpack.config.jsimages/:存放项目相关的图片文件。.e
uni 读取网络json_uni-app怎么使用路由守卫，并且路由配置和pages.json中只写一套... 天天很向上 uni 读取网络json
背景uni-app本身没有路由，无法使用路由守卫。那么有这么一个功能：当某些页面需要登录，进入之前需要判断是否登录，如果没有登录则跳转到登录页。可以封装公共方法或混入实现，但是不太优雅，这时使用路由守卫实在是太方便了！幸好，插件uni-simple-router给我们提供了1.uni-simple-router使用方法uni-simple-router是专为uni-app打造的路由管理器。它保留了
一起学大模型 - LangChain 的 OutputParser 做个天秤座的程序猿 langchain outPutParser 大模型
文章目录前言一、OutputParser的概述二、JSONOutputParser三、自定义格式解析器1.假设的自定义格式2.实现CustomFormatOutputParser3.更复杂的自定义格式四、正则表达式解析器1.示例：正则表达式解析器2.假设的语言模型输出3.实现RegexOutputParser4.更复杂的示例5.说明五、表格解析器1.假设的表格数据2.实现TableOutputPa
微信小程序集成 TDesign PP0897 微信小程序 tdesign 小程序
步骤1:在小程序控制台执行,一直按回车直至package.json创建好yarninit步骤2:yarnaddtdesign-miniprogram--production步骤3:将app.json中的"style":"v2"移除。步骤4:将app.json中的"renderer"修改为"webview"。
grafana10.x报错 Failed to upgrade legacy queries Datasource x was not found 每天靠近一点点 grafana
问题grafana从6.x升级到10.x后，导入json文件后报错，数据源x查询不到，grafana不显示数据；TemplatingFailedtoupgradelegacyqueriesDatasourcexwasnotfound解决方法可能grafana升级后数据源找不到，在面板上重新选择数据源保存后，点击Inspect中的PanelJSON文件，查看更新后数据源的uid，在导入的json文件
Ubuntu root权限安装electron出错npm ERR! [email protected] postinstall: `node install.js` weixin_40199002 Linux npm ubuntu javascript
安装过程：安装nodejscurl-sLhttps://deb.nodesource.com/setup_6.x|sudo-Ebash-sudoapt-getinstall-ynodejs安装Electron:geditpackage.json#把"name":"electron"改为"name":"electron-test",保存.#Installasadevelopmentdependenc
exports使用 package.json字段控制如何访问你的 npm 包前端贾公子 json npm 前端
目录想象一下你正在开发一个npm包……术语什么是exports领域？exports好处保护内部文件多格式包将子路径映射到dist目录子路径导出单一入口点多个入口点公开软件包文件的子集有条件出口设置使用条件默认条件句法针对Node.js和浏览器想象一下你正在开发一个npm包……您希望提供多个入口点，但同时限制对内部文件的访问。您需要同时支持CJS和ESM，包含类型定义，甚至可能还要确保浏览器兼容性。
uniapp相关地图 API调用 cherishSpring uniapp uni-app apache 服务器
目录一、注意事项：manifest.json需增加配置二、获取用户收货地址[uni.chooseAddress]三、获取当前的地理位置、速度[uni.getLocation]四、打开地图选择位置、查看位置(导航)[uni.chooseLocation][uni.openLocation]五、使用腾讯地图逆地址解析接口实现城市自动定位回显一、注意事项：manifest.json需增加配置"mp-we
除了FastJson,你还有选择: Gson简易指南闻人的技术博客
前言这个周末被几个技术博主的同一篇公众号文章fastjson又被发现漏洞，这次危害可导致服务瘫痪！刷屏，离之前漏洞事件没多久，fastjson又出现严重Bug。目前项目中不少使用了fastjson做对象与JSON数据的转换，又需要更新版本重新部署，可以说是费时费力。与此同时，也带给我新的思考，面对大量功能强大的开源库，我们不能盲目地引入到项目之中，众多开源框架中某个不稳定因素就足以让一个项目遭受灭
Spring中@Value注解，需要注意的地方无量 spring bean @Value xml
Spring 3以后,支持@Value注解的方式获取properties文件中的配置值，简化了读取配置文件的复杂操作 1、在applicationContext.xml文件(或引用文件中)中配置properties文件 <bean id="appProperty" class="org.springframework.beans.fac
mongoDB 分片开窍的石头 mongodb
mongoDB的分片。要mongos查询数据时候先查询configsvr看数据在那台shard上，configsvr上边放的是metar信息，指的是那条数据在那个片上。由此可以看出mongo在做分片的时候咱们至少要有一个configsvr,和两个以上的shard（片）信息。第一步启动两台以上的mongo服务 &nb
OVER(PARTITION BY)函数用法 0624chenhong oracle
这篇写得很好，引自 http://www.cnblogs.com/lanzi/archive/2010/10/26/1861338.html OVER(PARTITION BY)函数用法 2010年10月26日 OVER(PARTITION BY)函数介绍开窗函数 &nb
Android开发中，ADB server didn't ACK 解决方法一炮送你回车库 Android开发
首先通知：凡是安装360、豌豆荚、腾讯管家的全部卸载，然后再尝试。一直没搞明白这个问题咋出现的，但今天看到一个方法，搞定了！原来是豌豆荚占用了 5037 端口导致。参见原文章：一个豌豆荚引发的血案——关于ADB server didn't ACK的问题简单来讲，首先将Windows任务进程中的豌豆荚干掉，如果还是不行，再继续按下列步骤排查。 &nb
canvas中的像素绘制问题换个号韩国红果果 JavaScript canvas
pixl的绘制，1.如果绘制点正处于相邻像素交叉线，绘制x像素的线宽，则从交叉线分别向前向后绘制x/2个像素，如果x/2是整数，则刚好填满x个像素，如果是小数，则先把整数格填满，再去绘制剩下的小数部分，绘制时，是将小数部分的颜色用来除以一个像素的宽度，颜色会变淡。所以要用整数坐标来画的话（即绘制点正处于相邻像素交叉线时），线宽必须是2的整数倍。否则会出现不饱满的像素。 2.如果绘制点为一个像素的
编码乱码问题灵静志远 java jvm jsp 编码
1、JVM中单个字符占用的字节长度跟编码方式有关，而默认编码方式又跟平台是一一对应的或说平台决定了默认字符编码方式；2、对于单个字符：ISO-8859-1单字节编码，GBK双字节编码，UTF-8三字节编码；因此中文平台(中文平台默认字符集编码GBK)下一个中文字符占2个字节，而英文平台(英文平台默认字符集编码Cp1252(类似于ISO-8859-1))。 3、getBytes()、getByte
java 求几个月后的日期 darkranger calendar getinstance
Date plandate = planDate.toDate(); SimpleDateFormat df = new SimpleDateFormat("yyyy-MM-dd"); Calendar cal = Calendar.getInstance(); cal.setTime(plandate); // 取得三个月后时间 cal.add(Calendar.M
数据库设计的三大范式（通俗易懂） aijuans 数据库复习
关系数据库中的关系必须满足一定的要求。满足不同程度要求的为不同范式。数据库的设计范式是数据库设计所需要满足的规范。只有理解数据库的设计范式，才能设计出高效率、优雅的数据库，否则可能会设计出错误的数据库. 目前，主要有六种范式：第一范式、第二范式、第三范式、BC范式、第四范式和第五范式。满足最低要求的叫第一范式，简称1NF。在第一范式基础上进一步满足一些要求的为第二范式，简称2NF。其余依此类推。
想学工作流怎么入手 atongyeye jbpm
工作流在工作中变得越来越重要，很多朋友想学工作流却不知如何入手。很多朋友习惯性的这看一点，那了解一点，既不系统，也容易半途而废。好比学武功，最好的办法是有一本武功秘籍。研究明白，则犹如打通任督二脉。系统学习工作流，很重要的一本书《JBPM工作流开发指南》。本人苦苦学习两个月，基本上可以解决大部分流程问题。整理一下学习思路，有兴趣的朋友可以参考下。 1 首先要
Context和SQLiteOpenHelper创建数据库百合不是茶 android Context创建数据库
一直以为安卓数据库的创建就是使用SQLiteOpenHelper创建,但是最近在android的一本书上看到了Context也可以创建数据库,下面我们一起分析这两种方式创建数据库的方式和区别,重点在SQLiteOpenHelper 一:SQLiteOpenHelper创建数据库: 1,SQLi
浅谈group by和distinct bijian1013 oracle 数据库 group by distinct
group by和distinct只了去重意义一样，但是group by应用范围更广泛些，如分组汇总或者从聚合函数里筛选数据等。譬如：统计每id数并且只显示数大于3 select id ,count(id) from ta
vi opertion 征客丶 mac opration vi
进入 command mode （命令行模式）按 esc 键再按 shift + 冒号注：以下命令中带 $ 【在命令行模式下进行】，不带 $ 【在非命令行模式下进行】一、文件操作 1.1、强制退出不保存 $ q! 1.2、保存 $ w 1.3、保存并退出 $ wq 1.4、刷新或重新加载已打开的文件 $ e 二、光标移动 2.1、跳到指定行数字
【Spark十四】深入Spark RDD第三部分RDD基本API bit1129 spark
对于K/V类型的RDD,如下操作是什么含义？ val rdd = sc.parallelize(List(("A",3),("C",6),("A",1),("B",5)) rdd.reduceByKey(_+_).collect reduceByKey在这里的操作，是把
java类加载机制 BlueSkator java 虚拟机
java类加载机制 1.java类加载器的树状结构引导类加载器 ^ | 扩展类加载器 ^ | 系统类加载器 java使用代理模式来完成类加载，java的类加载器也有类似于继承的关系，引导类是最顶层的加载器，它是所有类的根加载器，它负责加载java核心库。当一个类加载器接到装载类到虚拟机的请求时，通常会代理给父类加载器，若已经是根加载器了，就自己完成加载。虚拟机区分一个Cla
动态添加文本框 BreakingBad 文本框
<script> var num=1; function AddInput() { var str=""; str+="<input
读《研磨设计模式》-代码笔记-单例模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ public class Singleton { } /* * 懒汉模式。注意，getInstance如果在多线程环境中调用，需要加上synchronized，否则存在线程不安全问题 */ class LazySingleton
iOS应用打包发布常见问题 chenhbc ios iOS发布 iOS上传 iOS打包
这个月公司安排我一个人做iOS客户端开发，由于急着用，我先发布一个版本，由于第一次发布iOS应用，期间出了不少问题，记录于此。 1、使用Application Loader 发布时报错：Communication error.please use diagnostic mode to check connectivity.you need to have outbound acc
工作流复杂拓扑结构处理新思路 comsci 设计模式工作算法企业应用 OO
我们走的设计路线和国外的产品不太一样，不一样在哪里呢？国外的流程的设计思路是通过事先定义一整套规则(类似XPDL)来约束和控制流程图的复杂度(我对国外的产品了解不够多，仅仅是在有限的了解程度上面提出这样的看法)，从而避免在流程引擎中处理这些复杂的图的问题，而我们却没有通过事先定义这样的复杂的规则来约束和降低用户自定义流程图的灵活性，这样一来，在引擎和流程流转控制这一个层面就会遇到很
oracle 11g新特性Flashback data archive daizj oracle
1. 什么是flashback data archive Flashback data archive是oracle 11g中引入的一个新特性。Flashback archive是一个新的数据库对象，用于存储一个或多表的历史数据。Flashback archive是一个逻辑对象，概念上类似于表空间。实际上flashback archive可以看作是存储一个或多个表的所有事务变化的逻辑空间。
多叉树:2-3-4树 dieslrae 树
平衡树多叉树,每个节点最多有4个子节点和3个数据项,2,3,4的含义是指一个节点可能含有的子节点的个数,效率比红黑树稍差.一般不允许出现重复关键字值.2-3-4树有以下特征: 1、有一个数据项的节点总是有2个子节点(称为2-节点) 2、有两个数据项的节点总是有3个子节点(称为3-节
C语言学习七动态分配 malloc的使用 dcj3sjt126com c language malloc
/* 2013年3月15日15:16:24 malloc 就memory(内存) allocate(分配)的缩写本程序没有实际含义，只是理解使用 */ # include <stdio.h> # include <malloc.h> int main(void) { int i = 5; //分配了4个字节静态分配 int * p
Objective-C编码规范[译] dcj3sjt126com 代码规范
原文链接 : The official raywenderlich.com Objective-C style guide 原文作者 : raywenderlich.com Team 译文出自 : raywenderlich.com Objective-C编码规范译者 : Sam Lau
0.性能优化-目录 frank1234 性能优化
从今天开始笔者陆续发表一些性能测试相关的文章，主要是对自己前段时间学习的总结，由于水平有限，性能测试领域很深，本人理解的也比较浅，欢迎各位大咖批评指正。主要内容包括：一、性能测试指标吞吐量、TPS、响应时间、负载、可扩展性、PV、思考时间 http://frank1234.iteye.com/blog/2180305 二、性能测试策略生产环境相同基准测试预热等 htt
Java父类取得子类传递的泛型参数Class类型 happyqing java 泛型父类子类 Class
import java.lang.reflect.ParameterizedType; import java.lang.reflect.Type; import org.junit.Test; abstract class BaseDao<T> { public void getType() { //Class<E> clazz =
跟我学SpringMVC目录汇总贴、PDF下载、源码下载 jinnianshilongnian springMVC
----广告-------------------------------------------------------------- 网站核心商详页开发掌握Java技术，掌握并发/异步工具使用，熟悉spring、ibatis框架；掌握数据库技术，表设计和索引优化，分库分表/读写分离；了解缓存技术，熟练使用如Redis/Memcached等主流技术；了解Ngin
the HTTP rewrite module requires the PCRE library 流浪鱼 rewrite
./configure: error: the HTTP rewrite module requires the PCRE library. 模块依赖性Nginx需要依赖下面3个包 1. gzip 模块需要 zlib 库 ( 下载: http://www.zlib.net/ ) 2. rewrite 模块需要 pcre 库 ( 下载: http://www.pcre.org/ ) 3. s
第12章 Ajax（中） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Optimize query with Query Stripping in Web Intelligence blueoxygen BO
http://wiki.sdn.sap.com/wiki/display/BOBJ/Optimize+query+with+Query+Stripping+in+Web+Intelligence and a very straightfoward video http://www.sdn.sap.com/irj/scn/events?rid=/library/uuid/40ec3a0c-936
Java开发者写SQL时常犯的10个错误 tomcat_oracle java sql
1、不用PreparedStatements 　　有意思的是，在JDBC出现了许多年后的今天，这个错误依然出现在博客、论坛和邮件列表中，即便要记住和理解它是一件很简单的事。开发者不使用PreparedStatements的原因可能有如下几个：　　他们对PreparedStatements不了解　　他们认为使用PreparedStatements太慢了　　他们认为写Prepar
世纪互联与结盟有感阿尔萨斯
10月10日，世纪互联与（Foxcon）签约成立合资公司，有感。全球电子制造业巨头（全球500强企业）与世纪互联共同看好IDC、云计算等业务在中国的增长空间，双方迅速果断出手，在资本层面上达成合作，此举体现了全球电子制造业巨头对世纪互联IDC业务的欣赏与信任，另一方面反映出世纪互联目前良好的运营状况与广阔的发展前景。众所周知，精于电子产品制造（世界第一），对于世纪互联而言，能够与结盟

Deep Interest Evolution Network(DIEN)专题2:代码解析之样本数据处理

process_data.py

local_aggretor.py

split_by_user.py

generate_voc.py

你可能感兴趣的:(推荐算法,json)