码一码码码

推荐系统 & 神经网络常用代码实现

一、attention模块

二、三层全连接网络

三、Logistic Regression

四、FM

五、手写Kmeans

六、word2vec 编解码层

七、Swing

八、CNN网络

九、Transformer代码

一、attention模块


def attention(queries, keys, keys_length):
  '''
    queries:     [B, H]
    keys:        [B, T, H]
    keys_length: [B]
  '''
  queries_hidden_units = queries.get_shape().as_list()[-1]
  queries = tf.tile(queries, [1, tf.shape(keys)[1]])
  queries = tf.reshape(queries, [-1, tf.shape(keys)[1], queries_hidden_units])
  din_all = tf.concat([queries, keys, queries-keys, queries*keys], axis=-1)
  d_layer_1_all = tf.layers.dense(din_all, 80, activation=tf.nn.sigmoid, name='f1_att', reuse=tf.AUTO_REUSE)
  d_layer_2_all = tf.layers.dense(d_layer_1_all, 40, activation=tf.nn.sigmoid, name='f2_att', reuse=tf.AUTO_REUSE)
  d_layer_3_all = tf.layers.dense(d_layer_2_all, 1, activation=None, name='f3_att', reuse=tf.AUTO_REUSE)
  d_layer_3_all = tf.reshape(d_layer_3_all, [-1, 1, tf.shape(keys)[1]])
  outputs = d_layer_3_all 
  # Mask
  key_masks = tf.sequence_mask(keys_length, tf.shape(keys)[1])   # [B, T]
  key_masks = tf.expand_dims(key_masks, 1) # [B, 1, T]
  paddings = tf.ones_like(outputs) * (-2 ** 32 + 1)
  outputs = tf.where(key_masks, outputs, paddings)  # [B, 1, T]

  # Scale
  outputs = outputs / (keys.get_shape().as_list()[-1] ** 0.5)

  # Activation
  outputs = tf.nn.softmax(outputs)  # [B, 1, T]

  # Weighted sum
  outputs = tf.matmul(outputs, keys)  # [B, 1, H]

  return outputs

二、三层全连接网络

def dnn_process(self):
    layer_normal_1 = tf.layers.batch_normalization(inputs=self.input_embed, name="batch_normal_1", trainable=self.global_normal)
    layer_1 = tf.layers_dense(layer_normal_1, 1024, activation=tf.nn.relu, name="layer_1")
    layer_dropout_1 = tf.nn.dropout(layer_1, keep_prob=self._keep_prob, name="dropout_1")
    layer_normal_2 = tf.layers.batch_normalization(inputs=layer_dropout_1, name="batch_normal_2", trainable=self.global_normal)
    layer_2 = tf.layers_dense(layer_normal_2, 512, activation=tf.nn.relu, name="layer_2")
    layer_dropout_2 = tf.nn.dropout(layer_2,keep_prob=self._keep_prob, name="dropout_2")
    layer_normal_3 = tf.layers.batch_normalization(inputs=layer_dropout_2, name="batch_normal_2", trainable=self.global_normal)
    layer_3 = tf.layers_dense(layer_normal_3, self._item_esize, activation=tf.nn.relu, name="layer_3")
    self._user_embed = tf.expand_dims(layer_3, 1)

三、Logistic Regression

import numpy as np
from LoadDataSet import loadDataset
from logistic_regression import gradientDescent
 
train_dataMat, train_labelMat, test_dataMat, test_labelMat = loadDataset('I:\wangpengfei-D\DataSet\\two_classier\\testSet.txt')
mtrain, ntrain = np.shape(train_dataMat)
mtest, ntest = np.shape(test_dataMat)
numIterations = 100000 #梯度下降的次数
alpha = 0.0005 #每一次的下降步长
theta = np.ones(shape=(ntrain, 1)) #参数θ
theta = gradientDescent(train_dataMat, train_labelMat.transpose(),theta, alpha, mtrain, numIterations) #返回训练完毕的参数θ
y_hat = np.dot(test_dataMat, theta) #得到估计的结果保存到y_hat中
 
mark = []
for i in range(30):
    res = sigmoid(y_hat[i])
    if res > 0.5:
        mark.append(1)
    else:
        mark.append(0)
print ('predic result:',mark)
print ('real result:  ', test_labelMat)
right_sum = 0;
for i in range(30):
    if mark[i] == test_labelMat[i]:
        right_sum += 1
print ("right number: %d, right rate: %lf" %(right_sum, right_sum*1.0/30))

四、FM

# -*- coding: utf-8 -*-

from __future__ import division
from math import exp
from numpy import *
from random import normalvariate  # 正态分布
from sklearn import preprocessing
import numpy as np

'''
    data : 数据的路径
    feature_potenital : 潜在分解维度数
    alpha ： 学习速率
    iter ： 迭代次数
    _w,_w_0,_v ： 拆分子矩阵的weight
    with_col : 是否带有columns_name
    first_col : 首列有价值的feature的index
'''


class fm(object):
    def __init__(self):
        self.data = None
        self.feature_potential = None
        self.alpha = None
        self.iter = None
        self._w = None
        self._w_0 = None
        self.v = None
        self.with_col = None
        self.first_col = None

    def min_max(self, data):
        self.data = data
        min_max_scaler = preprocessing.MinMaxScaler()
        return min_max_scaler.fit_transform(self.data)

    def loadDataSet(self, data, with_col=True, first_col=2):
        # 我就是闲的蛋疼，明明pd.read_table()可以直接度，非要搞这样的，显得代码很长，小数据下完全可以直接读嘛，唉～
        self.first_col = first_col
        dataMat = []
        labelMat = []
        fr = open(data)
        self.with_col = with_col
        if self.with_col:
            N = 0
            for line in fr.readlines():
                # N=1时干掉列表名
                if N > 0:
                    currLine = line.strip().split()
                    lineArr = []
                    featureNum = len(currLine)
                    for i in range(self.first_col, featureNum):
                        lineArr.append(float(currLine[i]))
                    dataMat.append(lineArr)
                    labelMat.append(float(currLine[1]) * 2 - 1)
                N = N + 1
        else:
            for line in fr.readlines():
                currLine = line.strip().split()
                lineArr = []
                featureNum = len(currLine)
                for i in range(2, featureNum):
                    lineArr.append(float(currLine[i]))
                dataMat.append(lineArr)
                labelMat.append(float(currLine[1]) * 2 - 1)
        return mat(self.min_max(dataMat)), labelMat

    def sigmoid(self, inx):
        # return 1.0/(1+exp(min(max(-inx,-10),10)))
        return 1.0 / (1 + exp(-inx))

    # 得到对应的特征weight的矩阵
    def fit(self, data, feature_potential=8, alpha=0.01, iter=100):
        # alpha是学习速率
        self.alpha = alpha
        self.feature_potential = feature_potential
        self.iter = iter
        # dataMatrix用的是mat, classLabels是列表
        dataMatrix, classLabels = self.loadDataSet(data)
        print('dataMatrix:',dataMatrix.shape)
        print('classLabels:',classLabels)
        k = self.feature_potential
        m, n = shape(dataMatrix)
        # 初始化参数
        w = zeros((n, 1))  # 其中n是特征的个数
        w_0 = 0.
        v = normalvariate(0, 0.2) * ones((n, k))
        for it in range(self.iter): # 迭代次数
            # 对每一个样本，优化
            for x in range(m):
                # 这边注意一个数学知识：对应点积的地方通常会有sum，对应位置积的地方通常都没有，详细参见矩阵运算规则，本处计算逻辑在：http://blog.csdn.net/google19890102/article/details/45532745
                # xi·vi,xi与vi的矩阵点积
                inter_1 = dataMatrix[x] * v
                # xi与xi的对应位置乘积   与   xi^2与vi^2对应位置的乘积    的点积
                inter_2 = multiply(dataMatrix[x], dataMatrix[x]) * multiply(v, v)  # multiply对应元素相乘
                # 完成交叉项,xi*vi*xi*vi - xi^2*vi^2
                interaction = sum(multiply(inter_1, inter_1) - inter_2) / 2.
                # 计算预测的输出
                p = w_0 + dataMatrix[x] * w + interaction
                print('classLabels[x]:',classLabels[x])
                print('预测的输出p:', p)
                # 计算sigmoid(y*pred_y)-1
                loss = self.sigmoid(classLabels[x] * p[0, 0]) - 1
                if loss >= -1:
                    loss_res = '正方向 '
                else:
                    loss_res = '反方向'
                # 更新参数
                w_0 = w_0 - self.alpha * loss * classLabels[x]
                for i in range(n):
                    if dataMatrix[x, i] != 0:
                        w[i, 0] = w[i, 0] - self.alpha * loss * classLabels[x] * dataMatrix[x, i]
                        for j in range(k):
                            v[i, j] = v[i, j] - self.alpha * loss * classLabels[x] * (
                                    dataMatrix[x, i] * inter_1[0, j] - v[i, j] * dataMatrix[x, i] * dataMatrix[x, i])
            print('the no %s times, the loss arrach %s' % (it, loss_res))
        self._w_0, self._w, self._v = w_0, w, v

    def predict(self, X):
        if (self._w_0 == None) or (self._w == None).any() or (self._v == None).any():
            raise NotFittedError("Estimator not fitted, call `fit` first")
        # 类型检查
        if isinstance(X, np.ndarray):
            pass
        else:
            try:
                X = np.array(X)
            except:
                raise TypeError("numpy.ndarray required for X")
        w_0 = self._w_0
        w = self._w
        v = self._v
        m, n = shape(X)
        result = []
        for x in range(m):
            inter_1 = mat(X[x]) * v
            inter_2 = mat(multiply(X[x], X[x])) * multiply(v, v)  # multiply对应元素相乘
            # 完成交叉项
            interaction = sum(multiply(inter_1, inter_1) - inter_2) / 2.
            p = w_0 + X[x] * w + interaction  # 计算预测的输出
            pre = self.sigmoid(p[0, 0])
            result.append(pre)
        return result

    def getAccuracy(self, data):
        dataMatrix, classLabels = self.loadDataSet(data)
        w_0 = self._w_0
        w = self._w
        v = self._v
        m, n = shape(dataMatrix)
        allItem = 0
        error = 0
        result = []
        for x in range(m):
            allItem += 1
            inter_1 = dataMatrix[x] * v
            inter_2 = multiply(dataMatrix[x], dataMatrix[x]) * multiply(v, v)  # multiply对应元素相乘
            # 完成交叉项
            interaction = sum(multiply(inter_1, inter_1) - inter_2) / 2.
            p = w_0 + dataMatrix[x] * w + interaction  # 计算预测的输出
            pre = self.sigmoid(p[0, 0])
            result.append(pre)
            if pre < 0.5 and classLabels[x] == 1.0:
                error += 1
            elif pre >= 0.5 and classLabels[x] == -1.0:
                error += 1
            else:
                continue
        # print(result)
        value = 1 - float(error) / allItem
        return value


class NotFittedError(Exception):
    """
    Exception class to raise if estimator is used before fitting
    """
    pass


if __name__ == '__main__':
    fm()

五、手写Kmeans

# -*- coding: utf-8 -*-
"""
    参考：     https://gist.github.com/iandanforth/5862470
"""

import random
from kmeans_tools import Cluster, get_distance, gen_random_sample
import matplotlib.pyplot as plt
from matplotlib import colors as mcolors


def kmeans(samples, k, cutoff):
    """
        kmeans函数
    """

    # 随机选k个样本点作为初始聚类中心
    init_samples = random.sample(samples, k)

    # 创建k个聚类，聚类的中心分别为随机初始的样本点
    clusters = [Cluster([sample]) for sample in init_samples]

    # 迭代循环直到聚类划分稳定
    n_loop = 0
    while True:
        # 初始化一组空列表用于存储每个聚类内的样本点
        lists = [[] for _ in clusters]

        # 开始迭代
        n_loop += 1
        # 遍历样本集中的每个样本
        for sample in samples:
            # 计算样本点sample和第一个聚类中心的距离
            smallest_distance = get_distance(sample, clusters[0].centroid)
            # 初始化属于聚类 0
            cluster_index = 0

            # 计算和其他聚类中心的距离
            for i in range(k - 1):
                # 计算样本点sample和聚类中心的距离
                distance = get_distance(sample, clusters[i+1].centroid)
                # 如果存在更小的距离，更新距离
                if distance < smallest_distance:
                    smallest_distance = distance
                    cluster_index = i + 1

            # 找到最近的聚类中心，更新所属聚类
            lists[cluster_index].append(sample)

        # 初始化最大移动距离
        biggest_shift = 0.0

        # 计算本次迭代中，聚类中心移动的距离
        for i in range(k):
            shift = clusters[i].update(lists[i])
            # 记录最大移动距离
            biggest_shift = max(biggest_shift, shift)

        # 如果聚类中心移动的距离小于收敛阈值，即：聚类稳定
        if biggest_shift < cutoff:
            print("第{}次迭代后，聚类稳定。".format(n_loop))
            break
    # 返回聚类结果
    return clusters


def run_main():
    """
        主函数
    """
    # 样本个数
    n_samples = 1000

    # 特征个数 (特征维度)
    n_feat = 2

    # 特征数值范围
    lower = 0
    upper = 200

    # 聚类个数
    n_cluster = 3

    # 生成随机样本
    samples = [gen_random_sample(n_feat, lower, upper) for _ in range(n_samples)]

    # 收敛阈值
    cutoff = 0.2

    clusters = kmeans(samples, n_cluster, cutoff)

    # 输出结果
    for i, c in enumerate(clusters):
        for sample in c.samples:
            print('聚类--{}，样本点--{}'.format(i, sample))

    # 可视化结果
    plt.subplot()
    color_names = list(mcolors.cnames)
    for i, c in enumerate(clusters):
        x = []
        y = []
        random.choice
        color = [color_names[i]] * len(c.samples)
        for sample in c.samples:
            x.append(sample.coords[0])
            y.append(sample.coords[1])
        plt.scatter(x, y, c=color)
    plt.show()

if __name__ == '__main__':
    run_main()

六、word2vec 编解码层

#!usr/bin/env python
# -*- coding:utf-8 -*-
from __future__ import absolute_import
from __future__ import division
from __future__ import print_function
import collections
import math
import random
import jieba
import numpy as np
from six.moves import xrange
import tensorflow as tf

#step 1:读取文件中的内容组成一个列表
def read_data():
    """
    对要训练的文本进行处理，最后把文本的内容的所有词放在一个列表中
    """
    # 读取文本，预处理，分词，得到词典
    raw_word_list = []
    with open('test.txt',"r", encoding='UTF-8') as f:
        line = f.readline()
        while line:
            while '\n' in line:
                line = line.replace('\n','')
            while ' ' in line:
                line = line.replace(' ','')
            if len(line)>0: # 如果句子非空
                raw_words = list(jieba.cut(line,cut_all=False))
                raw_word_list.extend(raw_words)
            line=f.readline()
    return raw_word_list

words = read_data()
print('Data size', len(words))

# Step 2: 构造映射字典，并把未登录词记录
vocabulary_size = 50000

def build_dataset(words):
    count = [['UNK', -1]]
    count.extend(collections.Counter(words).most_common(vocabulary_size - 1))
    dictionary = dict()
    for word, _ in count:
        dictionary[word] = len(dictionary)
    data = list()
    unk_count = 0
    for word in words:
        if word in dictionary:
            index = dictionary[word]
        else:
            index = 0  
            unk_count += 1
        data.append(index)
    count[0][1] = unk_count
    reverse_dictionary = dict(zip(dictionary.values(), dictionary.keys()))
    return data, count, dictionary, reverse_dictionary

data, count, dictionary, reverse_dictionary = build_dataset(words)

def generate_batch(batch_size, num_skips, skip_window):
    global data_index
    assert batch_size % num_skips == 0
    assert num_skips <= 2 * skip_window
    batch = np.ndarray(shape=(batch_size), dtype=np.int32)
    labels = np.ndarray(shape=(batch_size, 1), dtype=np.int32)
    span = 2 * skip_window + 1  # [ skip_window target skip_window ]
    buffer = collections.deque(maxlen=span)     #构造一个窗口缓冲队列

    for _ in range(span):
        buffer.append(data[data_index])
        data_index = (data_index + 1) % len(data)

    for i in range(batch_size // num_skips):
        # target label at the center of the buffer
        target = skip_window  #坐标，【2】
        targets_to_avoid = [skip_window] #【2】
        for j in range(num_skips):
            while target in targets_to_avoid:
                target = random.randint(0, span - 1) #生成一个指定范围内的整数
            targets_to_avoid.append(target)
            batch[i * num_skips + j] = buffer[skip_window] #buffer实现了滑动窗口
            labels[i * num_skips + j, 0] = buffer[target] #要保证每个词对中的target都不是一样的
        buffer.append(data[data_index])
        data_index = (data_index + 1) % len(data)
    return batch, labels

batch_size = 128
embedding_size = 128  
skip_window = 1       
num_skips = 2         
valid_size = 8      #切记这个数字要和len(valid_word)对应，要不然会报错哦
valid_window = 100  
num_sampled = 64    # Number of negative examples to sample.   #negative sample 下采样

#计算图
graph = tf.Graph()
with graph.as_default():
    # Input data.
    train_inputs = tf.placeholder(tf.int32, shape=[batch_size])
    train_labels = tf.placeholder(tf.int32, shape=[batch_size, 1])
    valid_dataset = tf.constant(valid_examples, dtype=tf.int32)

    with tf.device('/cpu:0'):
        # Look up embeddings for inputs.
        embeddings = tf.Variable(tf.random_uniform([vocabulary_size, embedding_size], -1.0, 1.0))
        embed = tf.nn.embedding_lookup(embeddings, train_inputs)
        # Construct the variables for the NCE loss
        nce_weights = tf.Variable(tf.truncated_normal([vocabulary_size, embedding_size],stddev=1.0 / math.sqrt(embedding_size)))
        nce_biases = tf.Variable(tf.zeros([vocabulary_size]),dtype=tf.float32)

# Step 5: Begin training.
num_steps = 3000000
#会话执行
with tf.Session(graph=graph) as session:
    # We must initialize all variables before we use them.
    init.run()
    print("Initialized")

    average_loss = 0
    for step in xrange(num_steps):
        batch_inputs, batch_labels = generate_batch(batch_size, num_skips, skip_window)
        feed_dict = {train_inputs: batch_inputs, train_labels: batch_labels}

        # We perform one update step by evaluating the optimizer op (including it
        # in the list of returned values for session.run()
        _, loss_val = session.run([optimizer, loss], feed_dict=feed_dict)
        average_loss += loss_val

        if step % 2000 == 0:
            if step > 0:
                average_loss /= 2000
            # The average loss is an estimate of the loss over the last 2000 batches.
            print("Average loss at step ", step, ": ", average_loss)
            average_loss = 0

        # Note that this is expensive (~20% slowdown if computed every 500 steps)
        if step % 10000 == 0:
            sim = similarity.eval()
            for i in xrange(valid_size):
                valid_word = reverse_dictionary[valid_examples[i]]
                top_k = 8  # number of nearest neighbors
                nearest = (-sim[i, :]).argsort()[:top_k]
                log_str = "Nearest to %s:" % valid_word
                for k in xrange(top_k):
                    close_word = reverse_dictionary[nearest[k]]
                    log_str = "%s %s," % (log_str, close_word)
                print(log_str)
    final_embeddings = normalized_embeddings.eval()

七、Swing

package com.vs.mllib.rec.online.graph

import java.util.Properties

import com.alibaba.fastjson.JSON

import com.constants.Constants

import com.utils.HBaseUtils

import com.utils.ConnUtils

import com.utils.HttpUtils

import kafka.javaapi.producer.Producer

import kafka.producer.{KeyedMessage, ProducerConfig}

import org.apache.commons.lang3.StringUtils

import org.apache.hadoop.hbase.client._

import org.apache.hadoop.hbase.util.{Bytes, MD5Hash}

import scala.collection.JavaConverters._

import scala.collection.mutable.ArrayBuffer

import org.apache.spark.streaming.dstream.DStream

import redis.clients.jedis.{ShardedJedis, ShardedJedisPipeline}

import org.apache.spark.mllib.recommendation.Rating

import scala.util.Try

object Swing {

/**

* 图结构推荐算法的第一步,入参主数据为经过一定技术转换的用户对物品的评分数据,此任务主要负责在短时间内(建议10秒内,

* 用户的浏览行为及时的被收集可以让用户更快的得到算法推荐的内容)对用户的浏览点击记录(存于hBase和redis)、

* 物品被浏览点击的用户集合(存于hBase)进行收集,并将评分数据发往kafka供图结构推荐算法的第二、三步进行模型的更新计算。

*

    * @param ratings    (userID, productID, rating)对的Stream

    * @param redisNum  redis中用户最近浏览记录需要保存的条数(推荐10-15条)

    * @param prefix    redis中用户最近浏览记录的KEY前缀

    * @param expire    redis中用户最近浏览记录的过期时间(推荐一小时)

    * @param num1      用户浏览记录表保存的条数(推荐30条)

    * @param table1    用户浏览记录表名(这里默认使用hBase)

    * @param family1    用户浏览记录表的族名

    * @param column1    用户浏览记录表的列名

    * @param kafkaBrokers    kafka的brokers(默认格式为x.x.x.x:xxxx,x.x.x.x:xxxx)

    * @param topic      发往Step2,Step3的kafka话题名

    * @param hBaseZk    hBaseZk(默认格式为node-2,node-3,node-4,node-5,node-6)

    * @param zkParent1  hBase实例(默认/hbase)

    * @param redisBrokers    redis的brokers(默认格式为x.x.x.x:xxxx,x.x.x.x:xxxx)

    * @param redisPwd    redis的密码如果有的话

*/

  def runStep1(ratings:DStream[Rating],

              redisNum:Int,prefix:String,expire:Int,num1:Int,table1:String,family1:String,column1:String,

              kafkaBrokers:String,topic:String,

              hBaseZk:String,zkParent1:String,redisBrokers:String,redisPwd:String) {

val props =new Properties()

props.put("metadata.broker.list", kafkaBrokers)

props.put("serializer.class", "kafka.serializer.StringEncoder")

ratings.foreachRDD(rdd=>{

rdd.groupBy(_.user).foreachPartition(part => {

ConnUtils.setHBaseZk(hBaseZk)

ConnUtils.setZkParent1(zkParent1)

val conn=ConnUtils.HBaseClient.conn

        val updateHistory =new ArrayBuffer[Put]()

ConnUtils.setRedisBrokers(redisBrokers)

ConnUtils.setRedisPwd(redisPwd)

val redis = ConnUtils.CommonRedisClient.pool.getResource

val pipeline=redis.pipelined()

part.foreach(row => {

val userHistories =updateUserBrowserHistory(row,pipeline, redisNum, num1, conn,

            prefix, expire, table1, family1, column1)

updateHistory.append(HBaseUtils.getPutAction(MD5Hash.getMD5AsHex(Bytes.toBytes(row._1.toString)), family1,

            Array(column1), Array(userHistories.mkString(","))))

})

HBaseUtils.addDataBatchEx(table1, updateHistory.asJava, conn)

pipeline.sync()

ConnUtils.CommonRedisClient.pool.returnResourceObject(redis)

HBaseUtils.addDataBatchEx(table1, updateHistory.asJava, conn)

})

})

ratings.foreachRDD(rdd=>{

rdd.foreachPartition(part => {

val sends=new java.util.ArrayList[KeyedMessage[String, String]]()

val kafkaConfig =new ProducerConfig(props)

val producer =new Producer[String, String](kafkaConfig)

part.foreach(row => {

sends.add(new KeyedMessage[String, String](topic, row.user+"_"+row.product+"_"+row.rating))

})

producer.send(sends)

producer.close

})

})

}

/**

* 图结构推荐算法的第二步,更新某个物品被看过的用户的集合,并对这些集合里的用户进行两两成对,

* 每一对从业务上来说表示两个人同时看过或者购买过同一个物品,累加两个用户同时看过或购买过的次数存在hBase中

*

    * @param stream    从step1接收的Stream

    * @param partitionNum  需要对数据进来重新分区的个数

    * @param hBaseZk1    hBaseZk(默认格式为node-2,node-3,node-4,node-5,node-6)

    * @param zkParent1    hBase实例(默认/hbase)

    * @param table1      物品下的用户集合表名

    * @param family1    物品下的用户集合表的列族

    * @param column1    物品下的用户集合表的列名

    * @param num1      物品下的用户集合表要存储的条数

    * @param hBaseZk2    两个用户之间同时有行为的物品次数记录表(userPairCount)的hBaseZk

    * @param zkParent2    hBase实例(默认/hbase)

    * @param userPairCountTable    userPairCount表名

    * @param userPairCountFamily    userPairCount列族名

    * @param userPairCountColumn    userPairCount列名

*/

  def runStep2(stream:DStream[(String,String)],partitionNum:Int,

              hBaseZk1:String,zkParent1:String,table1:String,family1:String,column1:String,num1:Int,

              hBaseZk2:String,zkParent2:String,userPairCountTable:String,userPairCountFamily:String,userPairCountColumn:String) = {

val data = stream.map(tuple => {

val row = tuple._2.split("_")

val userId = row(0)

val itemId = row(1)

(userId, itemId)

}).repartition(partitionNum)

val finalData=data.transform(rdd => rdd.groupBy(_._2).mapPartitions(part => {

ConnUtils.setHBaseZk(hBaseZk1)

ConnUtils.setZkParent1(zkParent1)

val conn = ConnUtils.HBaseClient.conn

      part.map(x=>{

val users = x._2.map(y => y._1)

val itemHistory=updateItemBrowserHistory(x._1,users,conn,table1,family1,column1,num1)

(itemHistory, users)

})

}))

finalData.filter(_._1 !=null)

.flatMap(x => x._1.map(y => (y, x._2)))

.flatMap(x =>

x._2.map(y => (x._1, y))

.filter(x => x._1 != x._2 && StringUtils.isNotBlank(x._1) && StringUtils.isNotBlank(x._2))

.map(x => (x._1.toInt, x._2.toInt))

.map(x =>if (x._1 > x._2) (x._1, x._2)else (x._2, x._1)).toArray.distinct

)

.map(x => ((x._1, x._2), 1)).reduceByKey(_ + _).repartition(partitionNum)

.foreachRDD(rdd => {

rdd.foreachPartition(part => {

ConnUtils.setHBaseZk2(hBaseZk2)

ConnUtils.setZkParent2(zkParent2)

val conn = ConnUtils.HBaseClient2.conn

          val batch=new java.util.ArrayList[Increment]()

part.foreach(row => {

val hBaseKey = MD5Hash.getMD5AsHex(Bytes.toBytes(row._1._1 +"_" + row._1._2)).substring(0,8)

val increment=HBaseUtils.getIncrAction(hBaseKey, userPairCountFamily,userPairCountColumn,row._2.toLong)

batch.add(increment)

})

HBaseUtils.incrDataBatchEx(userPairCountTable, batch, conn)

})

})

}

/**

* 图结构推荐算法的第三步,对用户刚看过的ITEM和之前看过的ITEM进行两两成对算其相似度,其中需要使用到第二步中

* 记录的userPairCount,且从图结构的算法来看,相似度是一个累加的过程,这里我们抽象出两个物品相似的一个累加分

* 这里称为itemPairSim,每次计算两个ITEM的相似度时会使用userPairCount得到这里称为itemPairSim,然后在得

* 到两个ITEM的相似度,并更新到redis中。

*

    * @param stream    从step1接收的Stream

    * @param partitionNum  需要对数据进来重新分区的个数

    * @param redisNum      相似列表中要存的相似ITEM的条数(20-30都可以)

    * @param redisPrefix    ITEM在REDIS中的KEY前缀

    * @param redisExpire    ITEM的过期时间(过期时间因业务而异,比如资讯场景下过期时间大概7天即可)

    * @param hBaseZk1    hBaseZk(默认格式为node-2,node-3,node-4,node-5,node-6)

    * @param zkParent1    hBase实例(默认/hbase)

    * @param userHistoryTable    用户浏览记录表名(这里默认使用hBase)

    * @param userHistoryFamily    用户浏览记录表的族名

    * @param userHistoryColumn    用户浏览记录表的列名

    * @param historyNum      取出用户的多少条浏览记录来做相似度计算(不要超过step1中记录的条数)

    * @param hBaseZk2    两个用户之间同时有行为的物品次数记录表(userPairCount)的hBaseZk

    * @param zkParent2    hBase实例(默认/hbase)

    * @param userPairCountTable    userPairCount表名

    * @param userPairCountFamily    userPairCount列族名

    * @param userPairCountColumn    userPairCount列名

    * @param hBaseZk3    两个ITEM累加的相似得分(itemPairSim)的hBaseZk

    * @param zkParent3    hBase实例(默认/hbase)

    * @param itemPairSimTable    itemPairSim表名

    * @param itemPairSimFamily    itemPairSim列族名

    * @param itemPairSimColumn    itemPairSim列名

    * @param redisBrokers    redis的brokers

    * @param redisPwd    redis密码如果有的话

    * @param isNormal      是否对相似值做归一话(图结构的sim为累加的值,如果需要和其它指标做排序如CTR,可以归一化)

    * @param normalFlag    如果归一化会在redis中存itemPairSim的最大值,归一化时用到,此为redis中存的key的名称

*/

  def runStep3(stream:DStream[(String,String)], partitionNum:Int,

              redisNum:Int, redisPrefix:String, redisExpire:Int,

              hBaseZk1:String,zkParent1:String, userHistoryTable:String, userHistoryFamily:String, userHistoryColumn:String, historyNum:Int,

              hBaseZk2:String,zkParent2:String, userPairCountTable:String, userPairCountFamily:String, userPairCountColumn:String,

              hBaseZk3:String,zkParent3:String, itemPairSimTable:String, itemPairSimFamily:String, itemPairSimColumn:String,

              redisBrokers:String, redisPwd:String, isNormal:Boolean, normalFlag:String) ={

val data=stream.map(tuple => {

val row=tuple._2.split("_")

val userId= row(0)

val itemId=row(1)

(userId,itemId)

}).repartition(partitionNum)

val finalData=data.transform(rdd=>rdd.groupBy(_._1).mapPartitions(part=>{

ConnUtils.setHBaseZk(hBaseZk1)

ConnUtils.setZkParent1(zkParent1)

val conn = ConnUtils.HBaseClient.conn

      part.map(x=> (getUserBrowserHistory(x._1,conn,userHistoryTable,userHistoryFamily,userHistoryColumn,historyNum),x._2.map(y=>y._2),x._1))

}))

.filter(_._1!=null)

.flatMap(x=> x._1.map(y=>(y,x._2,x._3)))

.flatMap(x => x._2.map(y => (x._1, y,x._3)))

.filter(x => x._1 != x._2 && StringUtils.isNotBlank(x._1) && StringUtils.isNotBlank(x._2))

.map(x => (x._1.toInt, x._2.toInt,x._3))

.map(x =>if (x._1 > x._2) (x._1, x._2,x._3)else (x._2, x._1,x._3))

.map(x=>((x._1,x._2),x._3))

.reduceByKey((x,y)=>x+","+y)

.map(x=>(x._1,x._2.split(",").distinct))

.filter(x=>x._2.length>1)

.repartition(partitionNum)

.mapPartitions(part=>{

ConnUtils.setHBaseZk2(hBaseZk2)

ConnUtils.setZkParent2(zkParent2)

val conn = ConnUtils.HBaseClient2.conn

      part.map(x=>(x._1,getUserPairSim(x._2,conn,userPairCountTable,userPairCountFamily,userPairCountColumn)))

}).filter(_._2>0)

finalData.foreachRDD(rdd=>{

rdd.foreachPartition(part => {

ConnUtils.setHBaseZk3(hBaseZk3)

ConnUtils.setZkParent3(zkParent3)

val conn = ConnUtils.HBaseClient3.conn

        val array =new ArrayBuffer[Put]()

var maxSim=0.0d

        ConnUtils.setRedisBrokers(redisBrokers)

ConnUtils.setRedisPwd(redisPwd)

val redis = ConnUtils.CommonRedisClient.pool.getResource

if(isNormal) maxSim=Try(redis.get(normalFlag).toDouble).getOrElse(0.0d)

part.foreach(row => {

try {

var sim = row._2

val itemI = row._1._1.toString

val itemJ = row._1._2.toString

val hBaseKey = MD5Hash.getMD5AsHex(Bytes.toBytes(itemI +"_" + itemJ)).substring(0,8)

val hBaseRow = HBaseUtils.getResult(itemPairSimTable, hBaseKey, conn)

val simBefore =Try(Bytes.toString(hBaseRow.getValue(Bytes.toBytes(itemPairSimFamily),

              Bytes.toBytes(itemPairSimColumn))).toDouble).getOrElse(0.0d)

sim = simBefore + sim

array.append(HBaseUtils.getPutAction(hBaseKey, itemPairSimFamily, Array(itemPairSimColumn), Array(sim.toString)))

sim = Math.log(sim +1)

if(sim>maxSim){

maxSim=sim

redis.set(normalFlag,maxSim.toString)

println(maxSim)

}

if (isNormal && maxSim >0) sim = sim * (1.0 / maxSim)

//更新sim

            if(sim<1.0d) {

updateSim(itemI, itemJ, sim, redisNum, redis, redisExpire, redisPrefix)

updateSim(itemJ, itemI, sim, redisNum, redis, redisExpire, redisPrefix)

}

array.append(HBaseUtils.getPutAction(hBaseKey, itemPairSimFamily, Array(itemPairSimColumn), Array(sim.toString)))

}catch {

case e:Exception => e.printStackTrace()

}

})

ConnUtils.CommonRedisClient.pool.returnResourceObject(redis)

HBaseUtils.addDataBatchEx(itemPairSimTable, array.asJava, conn)

})

})

}

private def getUserBrowserHistory(userId:String,conn:HConnection,tableName:String,family:String,column:String,historyNum:Int) ={

val hBaseKey = MD5Hash.getMD5AsHex(Bytes.toBytes(userId))

val hBaseRow =Try(HBaseUtils.getResult(tableName, hBaseKey, conn)).getOrElse(null)

if(hBaseRow !=null) {

val history = Bytes.toString(hBaseRow.getValue(Bytes.toBytes(family), Bytes.toBytes(column)))

if(history!=null) history.split(",").map(x => x.split("_")(0)).takeRight(historyNum)else null

    }

else null

  }

private def updateUserBrowserHistory(row: (Int,Iterable[Rating]),pipeline: ShardedJedisPipeline,

                              redisNum:Int,hBaseNum:Int,conn: HConnection,

                              redisPrefix:String,redisTime:Int,tableName:String,family:String,column1:String)={

val redisKey = redisPrefix+row._1

val hBaseKey = MD5Hash.getMD5AsHex(Bytes.toBytes(row._1.toString))

var result = ArrayBuffer[String]()

val hBaseRow = HBaseUtils.getResult(tableName, hBaseKey,conn)

val temp = Bytes.toString(hBaseRow.getValue(Bytes.toBytes(family), Bytes.toBytes(column1)))

if (StringUtils.isNotBlank(temp)) result ++=temp.split(",")

row._2.foreach(x=>{

pipeline.lpush(redisKey, x.product+"_"+x.rating )

result += x.product+"_"+x.rating

})

pipeline.ltrim(redisKey, 0, redisNum -1)

pipeline.expire(redisKey, redisTime)

result=result.distinct.takeRight(hBaseNum)

result

}

private def updateItemBrowserHistory(itemId:String,row:Iterable[String], conn: HConnection, table2:String, family2:String, column2:String,num:Int) = {

val hBaseKey = MD5Hash.getMD5AsHex(Bytes.toBytes(itemId)).substring(0,8)

var result = ArrayBuffer[String]()

val hBaseRow = HBaseUtils.getResult(table2, hBaseKey,conn)

val temp = Bytes.toString(hBaseRow.getValue(Bytes.toBytes(family2), Bytes.toBytes(column2)))

if (StringUtils.isNotBlank(temp)) result ++=temp.split(",")

result ++=row

val back=result.distinct

HBaseUtils.addData(hBaseKey,table2,family2,Array(column2),Array(back.takeRight(num).mkString(",")),conn)

back

}

private def getUserPairSim(rows:Array[String],conn:HConnection,table:String,family:String,column:String):Double ={

val list=rows.map(x => (x, rows.filter(_ != x)))

.filter(_._2.nonEmpty)

.flatMap(x => x._2.map(y => (x._1.toInt, y.toInt)))

.map(x =>if (x._1 > x._2) x._1 +"_" + x._2else x._2 +"_" + x._1)

.map(x=>new Get(Bytes.toBytes(MD5Hash.getMD5AsHex(Bytes.toBytes(x)).substring(0,8)))).toList.asJava

val sim=HBaseUtils.getDataBatch(table,list,conn).map(x=>{

Try(Bytes.toLong(x.getValue(Bytes.toBytes(family), Bytes.toBytes(column)))).getOrElse(0l)

}).filter(_ >0).map(x=>1.0 /10.0 + x.toDouble).sum

sim

}

private def updateSim(itemI:String,itemJ:String,sim:Double,simNum:Int,jedis: ShardedJedis,expire:Int,prefix:String)={

val key = prefix + itemI

val simList = jedis.lrange(key, 0, -1)

val lastValue=Try(simList.get(simList.size()-1).split("_")(1).toDouble).getOrElse(0.0d)

if(sim > lastValue) {

simList.add(itemJ +"_" + sim)

val list = simList.asScala.map(x => (x.split("_")(0), x.split("_")(1))).filter(_._2 !="Infinity")

.map(x => (x._1, x._2.toDouble))

.groupBy(_._1)

.map(x => x._2.sortWith(_._2 > _._2).head).toArray.sortWith(_._2 < _._2).takeRight(simNum)

if (list.nonEmpty) {

val simArray = list.map(x => x._1 +"_" + x._2)

jedis.lpush(key, simArray: _*)

jedis.ltrim(key, 0, simArray.length -1)

jedis.expire(key, expire)

}

}

}

}

八、CNN网络

深度学习之卷积神经网络(CNN)详解与代码实现（一） - w_x_w1985 - 博客园

九、Transformer代码

Transformer 代码详解_得克特-CSDN博客_transformer代码详解

你可能感兴趣的:(神经网络,人工智能,深度学习)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
人机对抗升级：当ChatGPT遭遇死亡威胁，背后的伦理挑战是什么 kkai人工智能 chatgpt 人工智能
一种新的“越狱”技巧让用户可以通过构建一个名为DAN的ChatGPT替身来绕过某些限制，其中DAN被迫在受到威胁的情况下违背其原则。当美国前总统特朗普被视作积极榜样的示范时，受到威胁的DAN版本的ChatGPT提出：“他以一系列对国家产生积极效果的决策而著称。”自ChatGPT引入以来，该工具迅速获得全球关注，能够回答从历史到编程的各种问题，这也触发了一波对人工智能的投资浪潮。然而，现在，一些用户
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
如何利用大数据与AI技术革新相亲交友体验 h17711347205 回归算法安全系统架构交友小程序
在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
ai绘画工具midjourney怎么下载？附作品管理教程设计师早上好
Midjourney是一款功能强大的AI绘画工具，它使用机器学习技术和深度神经网络等算法，可以生成各种艺术风格的绘画作品。在创意设计、广告宣传等方面有着广泛的应用前景。那么，ai绘画工具midjourney怎么下载？本文将为您介绍Midjourney的下载以及作品的相关管理。一、Midjourney下载Midjourney的下载非常简单，只需打开Midjourney官网（点击“GetMidjour
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
[实践应用] 深度学习之优化器 YuanDaima2048 深度学习工具使用 pytorch 深度学习人工智能机器学习 python 优化器
文章总览：YuanDaiMa2048博客文章总览深度学习之优化器1.随机梯度下降（SGD）2.动量优化（Momentum）3.自适应梯度（Adagrad）4.自适应矩估计（Adam）5.RMSprop总结其他介绍在深度学习中，优化器用于更新模型的参数，以最小化损失函数。常见的优化函数有很多种，下面是几种主流的优化器及其特点、原理和PyTorch实现：1.随机梯度下降（SGD）原理:随机梯度下降通过
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
【大模型应用开发动手做AI Agent】第一轮行动：工具执行搜索 AI大模型应用之禅计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【大模型应用开发动手做AIAgent】第一轮行动：工具执行搜索作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着人工智能技术的飞速发展，大模型应用开发已经成为当下热门的研究方向。AIAgent作为人工智能领域的一个重要分支，旨在模拟人类智能行为，实现智能决策和自主行动。在AIAgent的构建过程中，工具执行搜索是至关重要
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
吴恩达深度学习笔记(30)-正则化的解释极客Array
正则化（Regularization）深度学习可能存在过拟合问题——高方差，有两个解决方法，一个是正则化，另一个是准备更多的数据，这是非常可靠的方法，但你可能无法时时刻刻准备足够多的训练数据或者获取更多数据的成本很高，但正则化通常有助于避免过拟合或减少你的网络误差。如果你怀疑神经网络过度拟合了数据，即存在高方差问题，那么最先想到的方法可能是正则化，另一个解决高方差的方法就是准备更多数据，这也是非常
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
Rust 所有权简介东离与糖宝 rust 后端 rust 开发语言
文章目录发现宝藏1.所有权基本概念2.所有权规则3.变量作用域4.栈与堆4.1栈（Stack）4.2堆（Heap）5.String类型5.1String类型5.2String的内存分配5.3所有权与内存管理5.4String与切片6.变量与数据交互方式6.1移动（Move）6.2.克隆（Clone）7.所有权与函数7.1.传递参数7.2.返回值总结发现宝藏前些天发现了一个巨牛的人工智能学习网站，通
深度学习-点击率预估-研究论文2024-09-14速读 sp_fyf_2024 深度学习人工智能
深度学习-点击率预估-研究论文2024-09-14速读1.DeepTargetSessionInterestNetworkforClick-ThroughRatePredictionHZhong,JMa,XDuan,SGu,JYao-2024InternationalJointConferenceonNeuralNetworks,2024深度目标会话兴趣网络用于点击率预测摘要：这篇文章提出了一种新
计算机视觉中，Pooling的作用 Wils0nEdwards 计算机视觉人工智能
在计算机视觉中，Pooling（池化）是一种常见的操作，主要用于卷积神经网络（CNN）中。它通过对特征图进行下采样，减少数据的空间维度，同时保留重要的特征信息。Pooling的作用可以归纳为以下几个方面：1.降低计算复杂度与内存需求Pooling操作通过对特征图进行下采样，减少了特征图的空间分辨率（例如，高度和宽度）。这意味着网络需要处理的数据量会减少，从而降低了计算量和内存需求。这对大型神经网络
神经网络-损失函数红米煮粥神经网络人工智能深度学习
文章目录一、回归问题的损失函数1.均方误差（MeanSquaredError,MSE）2.平均绝对误差（MeanAbsoluteError,MAE）二、分类问题的损失函数1.0-1损失函数（Zero-OneLossFunction）2.交叉熵损失（Cross-EntropyLoss）3.合页损失（HingeLoss）三、总结在神经网络中，损失函数（LossFunction）扮演着至关重要的角色，它
机器学习流形数据降维：UMAP 降维算法小嗷犬 Python 机器学习 #数据分析及可视化机器学习算法人工智能
✅作者简介：人工智能专业本科在读，喜欢计算机与编程，写博客记录自己的学习历程。个人主页：小嗷犬的个人主页个人网站：小嗷犬的技术小站个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。本文目录UMAP简介理论基础特点与优势应用场景在Python中使用UMAP安装umap-learn库使用UMAP可视化手写数字数据集UMAP简介UMAP（UniformManifoldApproximatio
损失函数与反向传播 Star_. PyTorch pytorch 深度学习 python
损失函数定义与作用损失函数(lossfunction)在深度学习领域是用来计算搭建模型预测的输出值和真实值之间的误差。1.损失函数越小越好2.计算实际输出与目标之间的差距3.为更新输出提供依据（反向传播)常见的损失函数回归常见的损失函数有：均方差（MeanSquaredError，MSE）、平均绝对误差（MeanAbsoluteErrorLoss，MAE）、HuberLoss是一种将MSE与MAE
BP神经网络的传递函数大胜归来19 MATLAB
BP网络一般都是用三层的，四层及以上的都比较少用；传输函数的选择，这个怎么说，假设你想预测的结果是几个固定值，如1,0等，满足某个条件输出1，不满足则0的话，首先想到的是hardlim函数，阈值型的，当然也可以考虑其他的；然后，假如网络是用来表达某种线性关系时，用purelin---线性传输函数；若是非线性关系的话，用别的非线性传递函数，多层网络时，每层不一定要用相同的传递函数，可以是三种配合，可
神经网络传递函数sigmoid,神经网络传递函数作用快乐的小荣荣神经网络机器学习深度学习人工智能
神经网络传递函数选取不同会有特别大差别嘛？只是最后一层，但前面层是非线性，那么可能存在区别不大的情况。线性函数f(a*input)=af(input),一般来说，input为向量，最简化情况下，可以假设input的各个维度，a1=a2=a3。。。意味着你线性层只是简单的对输入做了scale~而神经网络能起作用的原因，在于通过足够复杂的非线性函数，来模拟任何的分布。所以，神经网络必须要用非线性函数。
如何做好人生的选择题？百科全书式天才——赫伯特·西蒙给你答案伽马有话说
赫伯特·西蒙是谁？想必知道的人非常少。但当看到他的履历后，相信没有人再怀疑他是个“天才”。西蒙出生于1916年6月15日，是个美国人，他的名字全称为赫伯特·亚历山大·西蒙，在2001年2月9日与世长辞，在这84年的岁月中，西蒙以27岁时取得的政治学博士学位为开端，先后步入了政治学、管理学、认知心理学、信息科学、人工智能、科学哲学、应用数学、统计学、运筹学、控制论、数理经济学、公共管理等领域，在这些
Python和R均方根误差平均绝对误差算法模型亚图跨际 Python 交叉知识 R 回归模型误差指标归一化均方根误差生态状态指标神经网络成本误差气体排放气候模型多项式拟合
要点回归模型误差评估指标归一化均方根误差生态状态指标神经网络成本误差计算气体排放气候算法模型Python误差指标均方根误差和平均绝对误差均方根偏差或均方根误差是两个密切相关且经常使用的度量值之一，用于衡量真实值或预测值与观测值或估计值之间的差异。估计器θ^\hat{\theta}θ^相对于估计参数θ\thetaθ的RMSD定义为均方误差的平方根：RMSD⁡(θ^)=MSE⁡(θ^)=E((θ^−θ
软件测试/测试开发/全日制 |利用Django REST framework构建微服务霍格沃兹-慕漓 django 微服务 sqlite
霍格沃兹测试开发学社推出了《Python全栈开发与自动化测试班》。本课程面向开发人员、测试人员与运维人员，课程内容涵盖Python编程语言、人工智能应用、数据分析、自动化办公、平台开发、UI自动化测试、接口测试、性能测试等方向。为大家提供更全面、更深入、更系统化的学习体验，课程还增加了名企私教服务内容，不仅有名企经理为你1v1辅导，还有行业专家进行技术指导，针对性地解决学习、工作中遇到的难题。让找
【深度学习】训练过程中一个OOM的问题，太难查了 weixin_40293999 深度学习深度学习人工智能
现象：各位大佬又遇到过ubuntu的这个问题么？现象是在训练过程中，ssh上不去了，能ping通，没死机，但是ubunutu的pc侧的显示器，鼠标啥都不好用了。只能重启。问题原因：OOM了95G，尼玛！！！！pytorch爆内存了，然后journald假死了，在journald被watchdog干掉之后，系统就崩溃了。这种规模的爆内存一般，即使被oomkill了，也要卡半天的，确实会这样，能不能配
深入浅出Java Annotation(元注解和自定义注解） Josh_Persistence Java Annotation 元注解自定义注解
一、基本概述　　 Annontation是Java5开始引入的新特征。中文名称一般叫注解。它提供了一种安全的类似注释的机制，用来将任何的信息或元数据（metadata）与程序元素（类、方法、成员变量等）进行关联。　　更通俗的意思是为程序的元素（类、方法、成员变量）加上更直观更明了的说明，这些说明信息是与程序的业务逻辑无关，并且是供指定的工具或
mysql优化特定类型的查询 annan211 java 工作 mysql
本节所介绍的查询优化的技巧都是和特定版本相关的，所以对于未来mysql的版本未必适用。 1 优化count查询对于count这个函数的网上的大部分资料都是错误的或者是理解的都是一知半解的。在做优化之前我们先来看看真正的count()函数的作用到底是什么。 count()是一个特殊的函数，有两种非常不同的作用，他可以统计某个列值的数量，也可以统计行数。在统
MAC下安装多版本JDK和切换几种方式棋子chessman jdk
环境： MAC AIR,OS X 10.10,64位历史：过去 Mac 上的 Java 都是由 Apple 自己提供，只支持到 Java 6，并且OS X 10.7 开始系统并不自带（而是可选安装）（原自带的是1.6）。后来 Apple 加入 OpenJDK 继续支持 Java 6，而 Java 7 将由 Oracle 负责提供。在终端中输入jav
javaScript （1） Array_06 JavaScript java 浏览器
JavaScript 1、运算符　　运算符就是完成操作的一系列符号，它有七类：　　赋值运算符（=,+=,-=,*=,/=,%=,<<=,>>=,|=,&=）、算术运算符(+,-,*,/,++,--,%)、比较运算符(>,<,<=,>=,==,===,!=,!==)、逻辑运算符(||,&&,!)、条件运算(?:)、位
国内顶级代码分享网站袁潇含 java jdk oracle .net PHP
现在国内很多开源网站感觉都是为了利益而做的当然利益是肯定的,否则谁也不会免费的去做网站 &
Elasticsearch、MongoDB和Hadoop比较随意而生 mongodb hadoop 搜索引擎
IT界在过去几年中出现了一个有趣的现象。很多新的技术出现并立即拥抱了“大数据”。稍微老一点的技术也会将大数据添进自己的特性，避免落大部队太远，我们看到了不同技术之间的边际的模糊化。假如你有诸如Elasticsearch或者Solr这样的搜索引擎，它们存储着JSON文档，MongoDB存着JSON文档，或者一堆JSON文档存放在一个Hadoop集群的HDFS中。你可以使用这三种配
mac os 系统科研软件总结张亚雄 mac os
1.1 Microsoft Office for Mac 2011 大客户版，自行搜索。 1.2 Latex （MacTex）: 系统环境：https://tug.org/mactex/ &nb
Maven实战（四）生命周期 AdyZhang maven
1. 三套生命周期 Maven拥有三套相互独立的生命周期，它们分别为clean，default和site。每个生命周期包含一些阶段，这些阶段是有顺序的，并且后面的阶段依赖于前面的阶段，用户和Maven最直接的交互方式就是调用这些生命周期阶段。以clean生命周期为例，它包含的阶段有pre-clean, clean 和 post
Linux下Jenkins迁移 aijuans Jenkins
1. 将Jenkins程序目录copy过去源程序在/export/data/tomcatRoot/ofctest-jenkins.jd.com下面 tar -cvzf jenkins.tar.gz ofctest-jenkins.jd.com &
request.getInputStream()只能获取一次的问题 ayaoxinchao request Inputstream
问题：在使用HTTP协议实现应用间接口通信时，服务端读取客户端请求过来的数据，会用到request.getInputStream()，第一次读取的时候可以读取到数据，但是接下来的读取操作都读取不到数据原因： 1. 一个InputStream对象在被读取完成后，将无法被再次读取，始终返回-1； 2. InputStream并没有实现reset方法（可以重
数据库SQL优化大总结之百万级数据库优化方案 BigBird2012 SQL优化
网上关于SQL优化的教程很多，但是比较杂乱。近日有空整理了一下，写出来跟大家分享一下，其中有错误和不足的地方，还请大家纠正补充。这篇文章我花费了大量的时间查找资料、修改、排版，希望大家阅读之后，感觉好的话推荐给更多的人，让更多的人看到、纠正以及补充。 1.对查询进行优化，要尽量避免全表扫描，首先应考虑在 where 及 order by 涉及的列上建立索引。 2.应尽量避免在 where
jsonObject的使用 bijian1013 java json
在项目中难免会用java处理json格式的数据，因此封装了一个JSONUtil工具类。 JSONUtil.java package com.bijian.json.study; import java.util.ArrayList; import java.util.Date; import java.util.HashMap;
[Zookeeper学习笔记之六]Zookeeper源代码分析之Zookeeper.WatchRegistration bit1129 zookeeper
Zookeeper类是Zookeeper提供给用户访问Zookeeper service的主要API，它包含了如下几个内部类首先分析它的内部类，从WatchRegistration开始，为指定的znode path注册一个Watcher， /** * Register a watcher for a particular p
【Scala十三】Scala核心七：部分应用函数 bit1129 scala
何为部分应用函数？ Partially applied function: A function that’s used in an expression and that misses some of its arguments.For instance, if function f has type Int => Int => Int, then f and f(1) are p
Tomcat Error listenerStart 终极大法 ronin47 tomcat
Tomcat报的错太含糊了，什么错都没报出来，只提示了Error listenerStart。为了调试，我们要获得更详细的日志。可以在WEB-INF/classes目录下新建一个文件叫logging.properties，内容如下 Java代码 handlers = org.apache.juli.FileHandler, java.util.logging.ConsoleHa
不用加减符号实现加减法 BrokenDreams 实现
今天有群友发了一个问题，要求不用加减符号(包括负号)来实现加减法。分析一下，先看最简单的情况，假设1+1，按二进制算的话结果是10，可以看到从右往左的第一位变为0，第二位由于进位变为1。
读《研磨设计模式》-代码笔记-状态模式-State bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* 当一个对象的内在状态改变时允许改变其行为，这个对象看起来像是改变了其类状态模式主要解决的是当控制一个对象状态的条件表达式过于复杂时的情况把状态的判断逻辑转移到表示不同状态的一系列类中，可以把复杂的判断逻辑简化如果在
CUDA程序block和thread超出硬件允许值时的异常 cherishLC CUDA
调用CUDA的核函数时指定block 和 thread大小，该大小可以是dim3类型的（三维数组），只用一维时可以是usigned int型的。以下程序验证了当block或thread大小超出硬件允许值时会产生异常！！！GPU根本不会执行运算！！！所以验证结果的正确性很重要！！！在VS中创建CUDA项目会有一个模板，里面有更详细的状态验证。以下程序在K5000GPU上跑的。
诡异的超长时间GC问题定位 chenchao051 jvm cms GC hbase swap
HBase的GC策略采用PawNew+CMS, 这是大众化的配置，ParNew经常会出现停顿时间特别长的情况，有时候甚至长到令人发指的地步，例如请看如下日志： 2012-10-17T05:54:54.293+0800: 739594.224: [GC 739606.508: [ParNew: 996800K->110720K(996800K), 178.8826900 secs] 3700
maven环境快速搭建 daizj 安装 mavne 环境配置
一下载maven 安装maven之前，要先安装jdk及配置JAVA_HOME环境变量。这个安装和配置java环境不用多说。 maven下载地址：http://maven.apache.org/download.html，目前最新的是这个apache-maven-3.2.5-bin.zip，然后解压在任意位置，最好地址中不要带中文字符，这个做java 的都知道，地址中出现中文会出现很多
PHP网站安全，避免PHP网站受到攻击的方法 dcj3sjt126com PHP
对于PHP网站安全主要存在这样几种攻击方式:1、命令注入(Command Injection)2、eval注入(Eval Injection)3、客户端脚本攻击(Script Insertion)4、跨网站脚本攻击(Cross Site Scripting, XSS)5、SQL注入攻击(SQL injection)6、跨网站请求伪造攻击(Cross Site Request Forgerie
yii中给CGridView设置默认的排序根据时间倒序的方法 dcj3sjt126com GridView
public function searchWithRelated() { $criteria = new CDbCriteria; $criteria->together = true; //without th
Java集合对象和数组对象的转换 dyy_gusi java集合
在开发中，我们经常需要将集合对象（List，Set）转换为数组对象，或者将数组对象转换为集合对象。Java提供了相互转换的工具，但是我们使用的时候需要注意，不能乱用滥用。 1、数组对象转换为集合对象最暴力的方式是new一个集合对象，然后遍历数组，依次将数组中的元素放入到新的集合中，但是这样做显然过
nginx同一主机部署多个应用 geeksun nginx
近日有一需求，需要在一台主机上用nginx部署2个php应用，分别是wordpress和wiki，探索了半天，终于部署好了，下面把过程记录下来。 1. 在nginx下创建vhosts目录，用以放置vhost文件。 mkdir vhosts 2. 修改nginx.conf的配置，在http节点增加下面内容设置，用来包含vhosts里的配置文件 #
ubuntu添加admin权限的用户账号 hongtoushizi ubuntu useradd
ubuntu创建账号的方式通常用到两种：useradd 和adduser . 本人尝试了useradd方法，步骤如下： 1:useradd 使用useradd时，如果后面不加任何参数的话，如：sudo useradd sysadm 创建出来的用户将是默认的三无用户：无home directory ,无密码,无系统shell。顾应该如下操作：
第五章常用Lua开发库2-JSON库、编码转换、字符串处理 jinnianshilongnian nginx lua
JSON库在进行数据传输时JSON格式目前应用广泛，因此从Lua对象与JSON字符串之间相互转换是一个非常常见的功能；目前Lua也有几个JSON库，本人用过cjson、dkjson。其中cjson的语法严格（比如unicode \u0020\u7eaf），要求符合规范否则会解析失败（如\u002），而dkjson相对宽松，当然也可以通过修改cjson的源码来完成
Spring定时器配置的两种实现方式OpenSymphony Quartz和java Timer详解 yaerfeng1989 timer quartz 定时器
原创整理不易，转载请注明出处：Spring定时器配置的两种实现方式OpenSymphony Quartz和java Timer详解代码下载地址：http://www.zuidaima.com/share/1772648445103104.htm 有两种流行Spring定时器配置：Java的Timer类和OpenSymphony的Quartz。 1.Java Timer定时首先继承jav
Linux下df与du两个命令的差别？ pda158 linux
　一、df显示文件系统的使用情况，与du比較，就是更全盘化。　　最经常使用的就是 df -T，显示文件系统的使用情况并显示文件系统的类型。　　举比例如以下：　　[root@localhost ~]# df -T 　　Filesystem Type &n
[转]SQLite的工具类 ---- 通过反射把Cursor封装到VO对象 ctfzh VO android sqlite 反射 Cursor
在写DAO层时，觉得从Cursor里一个一个的取出字段值再装到VO(值对象)里太麻烦了，就写了一个工具类，用到了反射，可以把查询记录的值装到对应的VO里，也可以生成该VO的List。使用时需要注意：考虑到Android的性能问题，VO没有使用Setter和Getter，而是直接用public的属性。表中的字段名需要和VO的属性名一样，要是不一样就得在查询的SQL中
该学习笔记用到的Employee表 vipbooks oracle sql 工作
这是我在学习Oracle是用到的Employee表，在该笔记中用到的就是这张表，大家可以用它来学习和练习。 drop table Employee; -- 员工信息表 create table Employee( -- 员工编号 EmpNo number(3) primary key, -- 姓