……utf-8

用户画像第四章(企业级360°用户画像_标签开发_挖掘标签_用户购物性别模型-USG）

用户购物性别模型-USG
USG模型引入
USG(User Shopping Gender)
2.5.1.AI驱动的电商用户模型：性别属性是这样确定的
首先带领大家了解一下，如何通过大数据来确定用户的真实性别。
我们经常谈论的用户精细化运营，到底是什么？简单来讲，就是将网站的每个用户标签化，制作一个属于他自己的网络身份证。然后，运用人员通过身份证来确定活动的投放人群，圈定人群范围，更为精准的用户培养和管理。当然，身份证最基本的信息就是姓名，年龄和性别，与现实不同的是，网络上用户填写的资料不一定完全准确，还需要进行进一步的确认和评估。
确定性别这件事很重要，简单举个栗子，比如店铺想推荐新品的Bra，如果粗糙的全部投放人群或者投放到不准确性别的人群，那后果可想而知了。下面来介绍一下具体的识别思路

2.5.1.1.用户画像需要的数据
用户平时在电商网站的购物行为、浏览行为、搜索行为，以及订单购买情况都会被记录在案，探查其消费能力，兴趣等。数据归类后，一般来讲，可以通过三类数据对用户进行分群和定义。

、用户信息
社会特征：马克思的人性观把人分为社会属性和自然属性。社会特征主要指的是人在社会上的阶级属性，当然也包括服从性、依赖性或者自觉性等，这是人类发展的必然的基本要求。
自然特征：也可以说成是人的生物性，通常来讲可以是食欲，物欲或者购买欲，自我保存能力。但不同人会有不同的自然特征，比如学习能力和逻辑思维等。
兴趣特征：对于电商来讲，主要是对某件商品，某个品牌或者品类的兴趣程度，如加购、浏览、收藏、搜索和下单行为。
消费特征：消费能力的评估，消费倾向的评估，能够判断用户的消费层级，是高消费力还是低消费力。
2、商品
商品属性：基本信息，品类，颜色尺码型号等。
商品定位：商品层级，是否为高中低端，商品类型倾向于哪类客户，区域或者其他的特征。
最后通过以上的信息来获取用户信息，判断其具体的画像特征，然后得到类似于酱紫的网络身份证。

业务目标：精准投放：针对已有产品，寻找某性别偏好的精准人群进行广告投放。
技术目标：对用户购物性别识别：男性，女性，中性
解决思路：选择一种分类算法，建立机器学习算法模型，对模型进行应用
线上投放：对得到的数据进行小范围内的测试投放，初期不宜过大扩大投放范围
效果分析：对投放的用户进行数据分析，评估数据的准确性。若不够完美，则需要重新建模和测试。
2.5.1.2.如何理解建模过程
重点来了，虽然能够通过用户的行为、购买和兴趣数据，了解用户的基本信息，但是仍然不清楚如何建模？用什么语言建模？其实，购物性别的区分使用的是spark，但是机器学习算法也有很多分类，包含逻辑回归，线性支持向量机，朴素贝叶斯模型和决策树。那么，又该如何选择呢？

构造决策树的步骤为：
通过训练数据来构建一棵用于分类的树，从而对未知数据进行高效分类。
以上步骤中，能够得出一个结论，在构建决策树的过程中，最重要的是如何找到最好的分割点。决策树值得注意的问题是过拟合问题，整个算法必须解决「如何停止分割」和「如何选择分割」两个关键问题。
2.5.1.2.模型确立过程
在建模前期，首要考虑的事情就是先确定指标，以及对样本的定义。购物性别指的是什么？通过哪些数据来确定购物性别，样本的准确性，如何验证数据的可信度等。
2.5.1.3.购物性别的定义
先看下图，具体的逻辑可从图中查看。一般来讲，用户填写的资料不一定真实，我们对他/她的性别数据持怀疑态度，所以，就需要其他数据进行辅助证明其性别。

根据数据结果，最终，确认了购物性别的定义。分为：
购物性别男：N月购买的男性特征类目子下单数> N月购买的女性特征类目子下单数
购物性别女：N月购买的男性特征类目子下单数> N月购买的女性特征类目子下单数
购物性别中性：未下单男女特征类目
N需要具体根据业务场景来定。
2.5.1.4.建模数据准备过程
本节是具体的操作过程，模型的实操阶段。一般来讲，不同模型的训练其实大体雷同。从技术上来讲，各家算法大多使用sparkmllib，不同点是所运算的模型都是针对于场景来定的。

在全部样本中，取80%的数据用于训练模型在全部样本中，取20%的数据用户数据测试
2.5.1.5.模型效果分析
行业内当前采用数据挖掘、机器学习和推荐系统中的评测指标—准确率(Precision)、召回率(Recall)，准确率是应用最广的数据指标，也很清晰易懂，以男性为例

准确率=命中的男性用户数量/所有预测男性数量，一般来讲，准确率可以评估模型的质量，他是很直观的数据评价，但并不是说准确度越高，算法越好。
召回率=命中的男性用户数量/所有男性数量，反映了被正确判定的正例占总的正例的比重。
模型建立完后，需根据模型的结果与预期的对比，进行调优。
2.5.1.6.最后要说的
购物性别定义对于用户精准营销十分重要，疑难杂症，对症下药，才能出现更好的疗效。
对于新手来说，初期一定是对模型性能及效果分析不是很熟练，可先用小数据量进行测试，走通全流程建表要规范，方便后期批量删除，因为建模是个反复的过程。
2.6.决策树分类算法详解

决策树是最经典的机器学习模型之一。它的预测结果容易理解，易于向业务部门解释，
预测速度快，可以处理类别型数据和连续型数据。在机器学习的数据挖掘类求职面试中，决策树是面试官最喜欢的面试题之一。
2.6.1.算法原理



2.6.代码实现：

package cn.itcast.up.ml

import java.util.Date

import cn.itcast.up.base.BaseModel2
import cn.itcast.up.bean.HBaseMeta
import org.apache.spark.ml.classification.{DecisionTreeClassificationModel, DecisionTreeClassifier}
import org.apache.spark.ml.evaluation.MulticlassClassificationEvaluator
import org.apache.spark.ml.feature._
import org.apache.spark.ml.{Pipeline, PipelineModel}
import org.apache.spark.mllib.evaluation.BinaryClassificationMetrics
import org.apache.spark.rdd.RDD
import org.apache.spark.sql.types.DoubleType
import org.apache.spark.sql.{Column, DataFrame, functions}


object USGModel extends BaseModel2{

  def main(args: Array[String]): Unit = {
    execute()
  }
  /**
    * 获取标签id(即模型id,该方法应该在编写不同模型时进行实现)
    * @return
    */
  override def getTagID(): Int = 56

  /**
    * 开始计算
    *inType=HBase##zkHosts=192.168.10.20##zkPort=2181##
    *hbaseTable=tbl_goods##family=detail##selectFields=cOrderSn,ogColor,productType
    * @param fiveDF  MySQL中的5级规则 id,rule
    * @param hbaseDF 根据selectFields查询出来的HBase中的数据
    * @return userid,tagIds
    */
  override def compute(fiveDF: DataFrame, hbaseDF: DataFrame): DataFrame = {
    import org.apache.spark.sql.functions._
    import spark.implicits._

    //fiveDF.show()
    //fiveDF.printSchema()

    val ordersDF: DataFrame = spark.read
      .format("cn.itcast.up.tools.HBaseSource")
      .option(HBaseMeta.ZKHOSTS, "bd001")
      .option(HBaseMeta.ZKPORT, "2181")
      .option(HBaseMeta.HBASETABLE, "tbl_orders")
      .option(HBaseMeta.FAMILY, "detail")
      .option(HBaseMeta.SELECTFIELDS, "memberId,orderSn")
      .load()
    //ordersDF.show(10)
   
    val goodsDF: DataFrame = spark.read
      .format("cn.itcast.up.tools.HBaseSource")
      .option(HBaseMeta.ZKHOSTS, "bd001")
      .option(HBaseMeta.ZKPORT, "2181")
      .option(HBaseMeta.HBASETABLE, "tbl_goods")
      .option(HBaseMeta.FAMILY, "detail")
      .option(HBaseMeta.SELECTFIELDS, "cOrderSn,ogColor,productType")//如果有更多的特征,可能需要 PCA降维
      .load()
    //goodsDF.show(10)



    //颜色ID应该来源于字典表,这里简化处理
    val color: Column = functions
      .when('ogColor.equalTo("银色"), 1)
      .when('ogColor.equalTo("香槟金色"), 2)
      .when('ogColor.equalTo("黑色"), 3)
      .when('ogColor.equalTo("白色"), 4)
      .when('ogColor.equalTo("梦境极光【卡其金】"), 5)
      .when('ogColor.equalTo("梦境极光【布朗灰】"), 6)
      .when('ogColor.equalTo("粉色"), 7)
      .when('ogColor.equalTo("金属灰"), 8)
      .when('ogColor.equalTo("金色"), 9)
      .when('ogColor.equalTo("乐享金"), 10)
      .when('ogColor.equalTo("布鲁钢"), 11)
      .when('ogColor.equalTo("月光银"), 12)
      .when('ogColor.equalTo("时尚光谱【浅金棕】"), 13)
      .when('ogColor.equalTo("香槟色"), 14)
      .when('ogColor.equalTo("香槟金"), 15)
      .when('ogColor.equalTo("灰色"), 16)
      .when('ogColor.equalTo("樱花粉"), 17)
      .when('ogColor.equalTo("蓝色"), 18)
      .when('ogColor.equalTo("金属银"), 19)
      .when('ogColor.equalTo("玫瑰金"), 20)
      .otherwise(0)
      .alias("color")
    //类型ID应该来源于字典表,这里简化处理
    val productType: Column = functions
      .when('productType.equalTo("4K电视"), 9)
      .when('productType.equalTo("Haier/海尔冰箱"), 10)
      .when('productType.equalTo("Haier/海尔冰箱"), 11)
      .when('productType.equalTo("LED电视"), 12)
      .when('productType.equalTo("Leader/统帅冰箱"), 13)
      .when('productType.equalTo("冰吧"), 14)
      .when('productType.equalTo("冷柜"), 15)
      .when('productType.equalTo("净水机"), 16)
      .when('productType.equalTo("前置过滤器"), 17)
      .when('productType.equalTo("取暖电器"), 18)
      .when('productType.equalTo("吸尘器/除螨仪"), 19)
      .when('productType.equalTo("嵌入式厨电"), 20)
      .when('productType.equalTo("微波炉"), 21)
      .when('productType.equalTo("挂烫机"), 22)
      .when('productType.equalTo("料理机"), 23)
      .when('productType.equalTo("智能电视"), 24)
      .when('productType.equalTo("波轮洗衣机"), 25)
      .when('productType.equalTo("滤芯"), 26)
      .when('productType.equalTo("烟灶套系"), 27)
      .when('productType.equalTo("烤箱"), 28)
      .when('productType.equalTo("燃气灶"), 29)
      .when('productType.equalTo("燃气热水器"), 30)
      .when('productType.equalTo("电水壶/热水瓶"), 31)
      .when('productType.equalTo("电热水器"), 32)
      .when('productType.equalTo("电磁炉"), 33)
      .when('productType.equalTo("电风扇"), 34)
      .when('productType.equalTo("电饭煲"), 35)
      .when('productType.equalTo("破壁机"), 36)
      .when('productType.equalTo("空气净化器"), 37)
      .otherwise(0)
      .alias("productType")

    //使用运营的统计数据对数据进行标注
    //训练的目的就是从已标注数据中找到规律,以后新来了一条数据,就可以进行预测
    val label: Column = functions
      .when('ogColor.equalTo("樱花粉")
      .or('ogColor.equalTo("白色"))
      .or('ogColor.equalTo("香槟色"))
      .or('ogColor.equalTo("香槟金"))
      .or('productType.equalTo("料理机"))
      .or('productType.equalTo("挂烫机"))
      .or('productType.equalTo("吸尘器/除螨仪")), 1) //女
      .otherwise(0)//男
      .alias("gender")//决策树预测label

    //最终需要找到用户和用户所购买的所有商品,进行训练,找到商品和性别之间的关系
    val source = goodsDF.select('cOrderSn as "orderSn", color, productType, label)
      .join(ordersDF, "orderSn")
      .select('memberId as "userId", 'color, 'productType, 'gender)

    //source.show(10)
   

    //机器学习部分
    //https://www.cnblogs.com/itboys/p/8312894.html
    //1.处理label,将元数据添加到标签列中
    val labelIndexer: StringIndexerModel = new StringIndexer()
      .setInputCol("gender")
      .setOutputCol("label")
      .fit(source)

    //2.处理features,将多个列合并为向量列的特征变换器
    val featureVectorAssembler: VectorAssembler = new VectorAssembler()
      .setInputCols(Array("color", "productType"))
      .setOutputCol("features")
    val featureDF: DataFrame = featureVectorAssembler.transform(source)
    //featureDF.show(10)
    
    //对特征进行索引,大于3个不同的值的特征被视为连续特征
    //VectorIndexer是对数据集特征向量中的类别(离散值)特征(index categorical features categorical features)进行编号。
    //它能够自动判断那些特征是离散值型的特征，并对他们进行编号，具体做法是通过设置一个maxCategories，
    //特征向量中某一个特征不重复取值个数小于maxCategories，则被重新编号为0～K（K<=maxCategories-1）。
    //某一个特征不重复取值个数大于maxCategories，则该特征视为连续值，不会重新编号（不会发生任何改变）
    //主要作用：提高决策树或随机森林等ML方法的分类效果
    val featureVectorIndexer: VectorIndexerModel = new VectorIndexer()
      .setInputCol("features")
      .setOutputCol("featureIndexed")
      .setMaxCategories(3)
      .fit(featureDF)

    //3.创建决策树
    val decisionTreeClassifier: DecisionTreeClassifier = new DecisionTreeClassifier()
      .setFeaturesCol("featureIndexed")
      .setPredictionCol("predict")
      .setImpurity("gini") //Gini不纯度
      .setMaxDepth(5) //树的最大深度
      .setMaxBins(5)//离散化连续特征的最大划分数

    //4.还原label
    val labelConverter: IndexToString = new IndexToString()
      .setInputCol("label")
      .setOutputCol("labelConverted")
      .setLabels(labelIndexer.labels)

    //5.划分训练集/测试集
    val Array(traiData,testData) = source.randomSplit(Array(0.8,0.2))

    //6.使用Pipeline串联
    val pipeline: Pipeline = new Pipeline()
      .setStages(Array(labelIndexer,featureVectorAssembler,featureVectorIndexer,decisionTreeClassifier,labelConverter))
    val model: PipelineModel = pipeline.fit(traiData)

    //7.预测
    val predictTestDF: DataFrame = model.transform(testData)
    val predictTrainDF: DataFrame = model.transform(traiData)
    //predictTestDF.show(10,false)
    //predictTrainDF.show(10,false)
   
    //8.查看损失
    evaluateAUC(predictTrainDF,predictTestDF)


    //9.查看决策树
    val treeModel: DecisionTreeClassificationModel = model.stages(3).asInstanceOf[DecisionTreeClassificationModel]
    println("Learned classification tree model:\n" + treeModel.toDebugString)
   
    //10.预测用户的性别, 分组聚合
    //预测规则A:每个订单的男性商品>=80%则认定为该订单的用户为男，或女商品比例达到80%则认定为该订单的用户为女；
    //由于是家电产品，一个订单中通常只有一个商品。调整规则A为规则B：
    //预测规则B:计算每个用户近半年内所有订单中的男性商品超过60%则认定该用户为男，或近半年内所有订单中的女性品超过60%则认定该用户为女

    val ruleMap: Map[String, Long] = fiveDF.collect().map(row=>(row.getString(1),row.getLong(0))).toMap
    println(ruleMap)
    //Map(0 -> 57, 1 -> 58, -1 -> 59)

    val getGenderTagUDF = udf((maleCount: Double, femaleCount: Double, total: Double)=> {
      val maleRatio = maleCount / total
      val femaleRatio = femaleCount / total
      if (maleRatio >= 0.6) {
        ruleMap("0") //男
      }
      if (femaleRatio >= 0.6) {
        ruleMap("1")
      }
      ruleMap("-1")
    })

    val tempDF: DataFrame = predictTestDF.union(predictTrainDF)
      .select('userId,
        when('predict === 0, 1).otherwise(0).as("male"), //计算每个用户所有订单中的男性商品的订单数
        when('predict === 1, 1).otherwise(0).as("female")) //计算每个用户所有订单中的女性商品的订单数
      .groupBy('userId)
      .agg(
        count('userId) cast DoubleType as "total",
        sum('male) cast DoubleType as "maleCount",
        sum('female) cast DoubleType as "femaleCount")
    tempDF.show(20,false)
   
    val newDF: DataFrame = tempDF.select('userId, getGenderTagUDF('maleCount, 'femaleCount, 'total) as "tagIds")
    newDF.show(10)
   
    println(new Date().toLocaleString)//需要20多分钟

    newDF
  }

  /**
    * @param predictTestDF
    * @param predictTrainDF
    */
  def evaluateAUC(predictTrainDF: DataFrame,predictTestDF: DataFrame): Unit = {
    // 1. ACC
    val accEvaluator = new MulticlassClassificationEvaluator()
      .setPredictionCol("predict")
      .setLabelCol("label")
      .setMetricName("accuracy")//精准度

    val trainAcc: Double = accEvaluator.evaluate(predictTrainDF)
    val testAcc: Double = accEvaluator.evaluate(predictTestDF)
    println(s"训练集上的 ACC 是 : $trainAcc")
    println(s"测试集上的 ACC 是 : $testAcc")
    //训练集上的 ACC 是 : 0.7512278050623347
    //测试集上的 ACC 是 : 0.7660406885758998

    // 2. AUC
    val trainRdd: RDD[(Double, Double)] = predictTrainDF.select("label", "predict").rdd
      .map(row => (row.getAs[Double](0), row.getAs[Double](1)))
    val testRdd: RDD[(Double, Double)] = predictTestDF.select("label", "predict").rdd
      .map(row => (row.getAs[Double](0), row.getAs[Double](1)))

    val trainAUC: Double = new BinaryClassificationMetrics(trainRdd).areaUnderROC()
    val testAUC: Double = new BinaryClassificationMetrics(testRdd).areaUnderROC()
    println(s"训练集上的 AUC 是 : $trainAUC")
    println(s"测试集上的 AUC 是 : $testAUC")
    //训练集上的 AUC 是 : 0.6591635864480606
    //测试集上的 AUC 是 : 0.7046995800897444
  }
}

Python数据获取——图片数据提取，2024中级Python开发面试解答 2401_83977580 2024年程序员学习 python 面试开发语言
比如我随便从手机上传一张图片到我的电脑里，通过python可以获取这张照片的所有信息。如果是数码相机拍摄的照片，我们在属性里可以找到照片拍摄的时间，拍摄的经纬度，海拔高度。那么这些信息有什么作用呢？有很多功能…比如用户画像，客户信息标签设定等等，用户喜欢拍摄照片的季节，时间点，所使用的相机的参数指标可以反应出一个人的金钱状况，对于其拍摄的内容，我们可以通过AI的方式对照片的内容信息进行提取，从而判
AI 内容创作：思考与实践三余知行「计算通践」人工智能内容创作 RAG 强化学习协同思考与实践
文章目录LLM与RAGLLMRAGRAG定制策略AI写作助手演示内容层次结构与内容深度优化有效的主题与段落结构内容深度的多样性与独特性提高文本逻辑性与连贯性模拟实践内容评测与优化迭代机制内容评测自动迭代优化机制评估指标模拟实践个性化写作与AI协同写作用户画像与需求分析内容推荐用户体验增强语气调节技巧实时协作与版本控制任务自动分配创意碰撞伦理与责任原创性与抄袭问题社会责任透明性与用户知情权偏见与公平
电商平台的用户画像标签体系建设里外00
01整体思路电商平台连接了卖家和买家两端，最终目的都是促进交易，从而追求更高的销售额。提高人货匹配度是促进交易的关键，而提高人货匹配度的关键就是“让买家找到想要的货物”。本文结合“人、货、场”理论模型，尝试建立电商平台的用户画像标签体系。02三大类标签用户在平台购物的整体流程可以概括为：进入平台、选择商品、下单付款。可以将该过程抽象为“人、货、场”。即用户通过什么途径进入什么商品的页面，完成选择并
深入 Rust 标准库，Rust标准库源代码系统分析青花科技 rust 开发语言后端
系列文章目录送书第一期《用户画像：平台构建与业务实践》送书活动之抽奖工具的打造《获取博客评论用户抽取幸运中奖者》送书第二期《SpringCloudAlibaba核心技术与实战案例》送书第三期《深入浅出Java虚拟机》送书第四期《AI时代项目经理成长之道》送书第五期《Kubernetes原生微服务开发》文章目录系列文章目录★前言☆一、推荐☆二、内容简介2.1、通过本书能学到什么？☆三、作者简介☆四、
用户画像尹二尹
用户名需求性别特征适合商场大明，需求明确。男人，。京东笨笨。大概需求。女人。小红书小闲。打发时间。腾讯
让数据在业务间高效流转，镜舟科技与NineData完成产品兼容互认镜舟科技数据库云计算
近日，镜舟科技与NineData完成产品兼容测试。在经过联合测试后，镜舟科技旗下产品与NineData云原生智能数据管理平台完全兼容，整体运行高效稳定。镜舟科技致力于帮助中国企业构建卓越的数据分析系统，打造独具竞争力的“数据护城河”，其基于全球领先的开源项目StarRocks研发了两款企业级软件——镜舟分析型数据库和镜舟湖仓加速引擎，在用户画像分析、指标平台建设、固定报表加速、实时数据查询分析等领
11.26日工作心得词妈
重庆新思维学校铁军教练团每日工作心得分享：时间：11.26部门名称:校区岗位名称：执行总校长分享人：黄苹今日完成工作：休息明日重点工作：江北开会今日工作心得：早上学习以后思考到一个一直无法破解的问题，看来越学习越聪明今日阅读心得：你要规划一个产品，需要问自己七个问题：第一，我的产品解决了什么问题？是痛点、痒点，还是爽点？第二，我在为谁解决这个问题？他得到即刻满足了吗？这是用户画像的问题。第三，有多
60-文文-Day5-裂变增长实验室文文_c6ac
我叫文文，第05天打卡首先交代一下我的行业背景:一家实体美容店，我们的客户分为两大类:一类是纯客户，直接是过来做服务的；一类是我们招品牌代理商，（我们招来的代理，我们提供美容养生手法教学，提供我们平台产品进货折扣和渠道，培育代理拓客走市场的一套方法。我们店就有点像共享美容院的感觉。）【用户画像】一、基本情况1.用户对象职业:宝妈群体、女性白领群体2.用户对象细分：宝妈，白领，有二次创业意向的女性群
【一点分享】Sql笔记：3天就可以写出很溜的Sql，飞一样的感觉（第3天）或许能用上
1、日期维表日期维表的提前生成，请参考后续公众号文章。2、维表参与统计承接昨天文章的任务，维度表参与统计。将昨天的sql进行改造。3、行转列4、行错位运算5、分析函数6、用户留存7、用户画像标签昨天文章有案例，可再扩展。8、纵表存储标签中间数据上个标签案例，一条sql出了多个标签。实践中，会将标签分别存到中间表，再统一整理为标签大宽表，即行转列。ok，3天的内容已经过完，是否有感觉呢。建议对照sq
三分钟入门大数据之什么是用户画像？汉斯的工作站
哈喽，大家好，我是汉斯老师。近几年来，互联网行业由于较高的薪资收入，受到许多人的追捧。很多年轻的学子，或是其他行业的有志青年，都想要投身到这个行业中来。然而一方面受到“互联网寒冬”的影响，最近频频传出各家知名互联网公司裁员缩编的消息；另一方面，大量的人才涌入，又使得互联网产业在职场上呈现出供过于求的特征，并最终导致了职场上的激烈竞争。那么互联网行业未来的潜力在哪里？我们又应该在哪个方向上发力，才能
2018-11-15 shiyuqi
虚拟社区的涌现周期闭包：指网络结点倾向于和自己在网络中邻居的邻居建立连接关系而形成的结构偏好连接：真实网络中新加的边倾向于和度数较大的边连接社交网络群体行为形成和互动规律用户行为分析用户采纳和用户忠诚（期望确认理论）社交网络情感分析技术面向短文本的情感分析技术基于群体智能的社交网络的垃圾意见挖掘技术！社交网络分析的应用社交推荐舆情分析？？用户画像**通过研究用户的资料和行为，将其划分为不同的类型，
端银朋友圈特训营+127+九久同学+第六次作业+实操九久同学
这几天突然想到新的用户画想，便再次把自己的受众人群，用户画像重新梳理了一遍。我的受众是上班族（工薪族）1.普通的有稳定收入的上班族2.忙碌，高收入的上班族痛点：理财意识不足，没系统学习就去投资了，投资亏损需求：怎样简单有效的去理财，投资赚钱？老师说用户在哪，你的钩子就要放在哪。有理财需求的用户可在优质的付费群，星球，挖财里寻找，我们要找的是精准的粉，这样才最高效。找到了用户，接下来就是放钩子。我准
为什么你写的文章没人看没人赞爱呆墨
为什么有些人能写出10万+的爆文，而你写的文章却没人看，看了也没有点赞，没有评论，没有转发？这话是问你，同时也是在问我自己。其实动笔之前，我们可以先问自己5个问题：第一，读者是谁？分析你的读者用户画像，你写的文字到底是要给谁看的？是男是女？年龄多大？有什么习惯和偏好？正在经历什么样的心路历程？如果你的读者只是你自己，那么你写的是日记，只适合自己读读，不是给别人看的。第二，他们内心有什么痛苦？你经历
文案实操心得㈠北夜极星
这几天，因为有份文案要写，所以暂时不会继续解读新书了。但会分享一下写文案时的心得。今天，按照雨涛老师的建议，由重新听了课程，看了笔记后，结合手头现有的资料，做了产品和用户画像分析。图片发自App说实话，虽然是第一次独立完成文案，但没有想象中的手忙脚乱。因为仔细听了课程，对操盘文案的整个过程有了整体的概念。只是，还需要时不时地去翻看笔记。当然，有时还会去《销售脑》中寻找些建议。按照老师的课程一步一步
APP用户流量分组管理，挖掘更大广告变现收益 AdSet聚合广告平台
流量分组是指开发者根据一定的规则对用户群体进行分组，包括用户属性、用户行为、地理位置等，同时支持开发者自定义属性和规则。开发者可对不同分组配置不同的瀑布流，实现精细化运营。流量分组通常在2种情况下使用：①在APP稳定运营前，通过流量分组功能，对不同的用户进行分组测试，找到比较适配自身用户人群的广告变现策略。②在APP稳定运营后，针对用户画像调整或者产品变化（如新版本，新渠道等），做广告精细化调优使
揭秘抖音招商团长：引爆商机，创造巨大财富！氧惠爱高省
抖音作为全球领先的短视频平台，蕴含着巨大的商机和创富机会。越来越多的商家意识到，在抖音上拥有一支高效的招商团队是获取市场份额和扩大销售的关键。本文将深入探讨成为抖音招商团长的必备条件及其背后隐藏的无限商机。一、了解抖音平台：招商团长要成功的第一步，是深入了解抖音平台的特点和运营机制。从用户画像、流量分布到热门话题和内容趋势，充分掌握这些信息是迎合用户需求，实现精准推广的基础。同时，招商团长需要了解
今日头条竞品分析报告黑白小白
目录一、项目描述31.1竞品分析描述31.2测试环境3二、市场31．行业概述32、行业描述6（1）政策7（2）经济8（3）社会10（4）技术11三、商业模式带价格和数字，要详细和具体13四、用户场景151、用户标签152、用户行为173、用户群体194、用户画像195、需求痛点20五、腾讯新闻——网易新闻产品分析221、战略层22（一）腾讯新闻——网易新闻产品战略层分析222、结构层23（二）腾讯
用户调查四川邻水
模型1单个用户10秒钟变成经典用户，进入他的外在场景同理心其内在需求，情绪感受，体验流程，选择对比优势，付款评价2群体用户用户画像和行为，属性，分层，分群，多种需求的多种需求做调查，确定目的，问题，吸引，引用数据做优化改进产品和运营方式场景目标为什么分解核心点下一步行动拒绝失败跟进时间甘特图复盘改进
【大数据存储与处理】花落随风轻飘舞 big data 大数据 tomcat java hadoop
目录1.任务说明1.1任务描述1.2架构设计1.3数据流动图1.4运行环境2.数据生成2.1生成数据属性说明2.2数据生成代码3.数据存储3.1数据存入Hbase3.1.1hbase存储设计3.1.2数据存入hbase代码4.数据处理4.1Maven环境依赖4.2数据处理代码5.可视化展示1.任务说明1.1任务描述用户画像可以了解用户对哪些类型的短视频感兴趣，推荐用户喜欢的短视频，吸引更多的用户使
Java实现用户画像活动推荐系统 JAVA+Vue+SpringBoot+MySQL customer08 java vue.js spring boot mysql 开发语言
目录一、摘要1.1项目介绍1.2项目录屏二、功能模块2.1数据中心模块2.2兴趣标签模块2.3活动档案模块2.4活动报名模块2.5活动留言模块三、系统设计3.1用例设计3.2业务流程设计3.3数据流程设计3.4E-R图设计四、系统展示五、核心代码5.1查询兴趣标签5.2查询活动推荐5.3新增活动报名5.4新增活动收藏5.5新增活动留言六、免责说明一、摘要1.1项目介绍基于JAVA+Vue+Spri
2019-2-28晨间日记温暖妈妈小小
今天是什么日子起床：7:15就寝：10:30天气：阴心情：平纪念日：无任务清单昨日完成的任务，最重要的三件事：1、向老大请教怎样谈实体2、大群分享曾经害怕的事，做了以后，不过如此3、私信10人，3人回复改进：1、沟通对象有针对性，即用户画像，年轻人，实体店，宝妈2、分享多语音习惯养成：1、多用语音分享沟通2、每天多沟通周目标·完成进度线上变现计划学习·信息·阅读阅读定位2章健康·饮食·锻炼头疼，睡
第五周功能点调研商冰
功能点调研-网易蜗牛读书写书评功能分析调研目的体验产品网易蜗牛读书，了解其“写书评”板块的功能特点、底层业务逻辑，并分析是否有适用于微信读书借鉴的功能点。体验环境机型：iphoneX系统：IOS12.1版本：1.8.0功能分析用户画像数据来源：艾瑞数据根据以上用户画像可知，蜗牛读书主要用户集中在20-35岁间，整体较年轻化，他们对自我成长有要求，认可电子阅读方式的便利性，有阅读习惯并且喜欢记录，因
移动app广告变现，对接广告联盟还是选择第三方聚合广告平台？ AdSet聚合广告平台
作为互联网广告的载体，APP天生就比线下传统广告位更具优势，不受地域限制可以辐射到地球上的每一个角落，可以让广告获得更广的覆盖面。通过丰富的广告形式，精准的目标用户画像，也可以更好地实现品牌广告或效果广告的投放目的。AdSet官方资讯-上海神蓍信息科技有限公司接入广告联盟第三方APP（一般称为流量方，区别于第二方平台和第一方广告主），向广告联盟平台请求并曝光广告，并以一定比例和平台进行广告收入分成
如何跟陌生客户聊产品？大伟传说
图片发自App高手训练营有战友问：跟客户聊什么都行，但是如何切换到产品呢？对于这个问题，我们要知道，并非所有的客户是我们的目标客户。第一步是要对自己的目标客户有一个准确的画像，也就是用户画像。如果通过各种途径，我们遇到了，是我们用户画像的客户。我们想办法去跟他沟通。一般的步骤是需要先了解客户的认知，也就是对于这个领域，或者说对这个概念的认知。比如健康行业，比如减肥，明明这个人很胖，他不在乎，对于健
大数据用户画像系统架构设计充电了么
文章目录一、用户画像数据仓库搭建、数据抽取部分二、大数据平台、用户画像集市分层设计、处理三、离线计算部分四、实时计算部分五、Solr/ES搜索引擎部分六、JavaWeb毫秒级实时用户画像接口服务七、用户画像实时展示异步触发获取Web自助后台总结用户画像是一个非常通用普遍使用的系统，从我们的架构图中可以看出，从数据计算时效性上来讲分离线计算和实时计算。离线计算一般是每天晚上全量计算所有用户，或者按需
抖音招商团长怎么对接达人的运营业务一起高省
随着抖音平台的崛起，越来越多的企业开始认识到通过与抖音达人合作来推广产品和提升品牌影响力的重要性。作为一名抖音招商团长，如何能够有效地对接达人并开展运营业务，是每个团长都需要面对的挑战。首先，了解抖音平台及用户需求。作为一个成功的招商团长，你需要深入了解抖音平台的特点和用户的喜好。熟悉平台的运营规则、用户画像以及热门内容类型，可以帮助你更准确地选择适合合作的达人，并为其定制运营策略。其次，建立良好
如何设计一套支付系统–对账模块给支付公司将产品
业务背景：对账模块是支付系统的核心能力之一，是信息流和资金流关联的重要依据，平台如果只使用渠道的单边账单或者平台流水订单，出现差错或渠道恶意扣单的风险极高。为提高资金账务的正确性和保障平台的利益，需要通过平台系统对账能力与上游渠道对账单逐笔勾兑确认，如有差异能及时解决或归档。用户画像：1）清结算专员：负责发起清分的操作者，首先确保信息流对平，然后确认资金流应收款和信息流平账账单金额一致。希望能及时
数仓：用户行为类指标一网打尽大数据左右手大数据大数据
前言用户行为分析是对用户在产品或触点上产生的行为及行为背后的数据进行分析，通过构建用户行为数据分析体系或者用户画像，来改变产品、营销、运营决策，实现精细化运营，指导业务增长。总之，很重要。关注公众号，回复关键字【资料】，获取【10万字大数据框架面试知识点】与【大数据开发的命令手册】先来看下用户类行为指标说明，然后下面详解常写的指标。指标名称解释说明新增用户首次联网使用应用的用户，如果一个用户首次打
机器学习聚类算法小森( ﹡ˆoˆ﹡ ) 机器学习算法算法聚类机器学习
聚类算法是一种无监督学习方法，用于将数据集中的样本划分为多个簇，使得同一簇内的样本相似度较高，而不同簇之间的样本相似度较低。在数据分析中，聚类算法可以帮助我们发现数据的内在结构和规律，从而为进一步的数据分析和挖掘提供有价值的信息。聚类算法在现实中的应用：用户画像，广告推荐，搜索引擎的流量推荐，恶意流量识别，新闻聚类，筛选排序；图像分割，降维，识别；离群点检测；在聚类算法中根据样本之间的相似性，将样
复杂世界的“明灯”——确定性尝试新角度
这个世界是复杂多变的，甚至有句名言来专门形容这种状态：唯一不变的就是改变。但无论怎么改变，不变才是我们心底的永恒追求。追求不变，即为追求确定性，它是我们在复杂世界的“明灯”。关于确定性，有三次比较深的体会。第一次比较系统认识不确定性，是在梁宁老师的课程《产品思维30讲》。课程中，介绍了很大做产品的方法，比如“点线面体”、“用户画像”等。但在最后总结排序的时候，梁宁老师还是将确定性定为“大王”，排在
PHP如何实现二维数组排序？ IT独行者二维数组 PHP 排序　
二维数组在PHP开发中经常遇到，但是他的排序就不如一维数组那样用内置函数来的方便了，（一维数组排序可以参考本站另一篇文章【PHP中数组排序函数详解汇总】）。二维数组的排序需要我们自己写函数处理了，这里UncleToo给大家分享一个PHP二维数组排序的函数：代码： functionarray_sort($arr,$keys,$type='asc'){ $keysvalue= $new_arr
【Hadoop十七】HDFS HA配置 bit1129 hadoop
基于Zookeeper的HDFS HA配置主要涉及两个文件,core-site和hdfs-site.xml。测试环境有三台 hadoop.master hadoop.slave1 hadoop.slave2 hadoop.master包含的组件NameNode, JournalNode, Zookeeper，DFSZKFailoverController
由wsdl生成的java vo类不适合做普通java vo darrenzhu VO wsdl webservice rpc
开发java webservice项目时，如果我们通过SOAP协议来输入输出，我们会利用工具从wsdl文件生成webservice的client端类，但是这里面生成的java data model类却不适合做为项目中的普通java vo类来使用，当然有一中情况例外，如果这个自动生成的类里面的properties都是基本数据类型，就没问题，但是如果有集合类，就不行。原因如下： 1)使用了集合如Li
JAVA海量数据处理之二（BitMap）周凡杨 java 算法 bitmap bitset 数据
路漫漫其修远兮，吾将上下而求索。想要更快，就要深入挖掘 JAVA 基础的数据结构，从来分析出所编写的 JAVA 代码为什么把内存耗尽，思考有什么办法可以节省内存呢？啊哈！算法。这里采用了 BitMap 思想。首先来看一个实验：指定 VM 参数大小： -Xms256m -Xmx540m
java类型与数据库类型 g21121 java
很多时候我们用hibernate的时候往往并不是十分关心数据库类型和java类型的对应关心，因为大多数hbm文件是自动生成的，但有些时候诸如：数据库设计、没有生成工具、使用原始JDBC、使用mybatis(ibatIS)等等情况，就会手动的去对应数据库与java的数据类型关心，当然比较简单的数据类型即使配置错了也会很快发现问题，但有些数据类型却并不是十分常见，这就给程序员带来了很多麻烦。 &nb
Linux命令 510888780 linux命令
系统信息 arch 显示机器的处理器架构(1) uname -m 显示机器的处理器架构(2) uname -r 显示正在使用的内核版本 dmidecode -q 显示硬件系统部件 - (SMBIOS / DMI) hdparm -i /dev/hda 罗列一个磁盘的架构特性 hdparm -tT /dev/sda 在磁盘上执行测试性读取操作 cat /proc/cpuinfo 显示C
java常用JVM参数墙头上一根草 java jvm参数
-Xms：初始堆大小，默认为物理内存的1/64(<1GB)；默认(MinHeapFreeRatio参数可以调整)空余堆内存小于40%时，JVM就会增大堆直到-Xmx的最大限制 -Xmx：最大堆大小，默认(MaxHeapFreeRatio参数可以调整)空余堆内存大于70%时，JVM会减少堆直到 -Xms的最小限制 -Xmn：新生代的内存空间大小，注意：此处的大小是（eden+ 2
我的spring学习笔记9-Spring使用工厂方法实例化Bean的注意点 aijuans Spring 3
方法一： <bean id="musicBox" class="onlyfun.caterpillar.factory.MusicBoxFactory" factory-method="createMusicBoxStatic"></bean> 方法二：
mysql查询性能优化之二 annan211 UNION mysql 查询优化索引优化
1 union的限制有时mysql无法将限制条件从外层下推到内层，这使得原本能够限制部分返回结果的条件无法应用到内层查询的优化上。如果希望union的各个子句能够根据limit只取部分结果集，或者希望能够先排好序在合并结果集的话，就需要在union的各个子句中分别使用这些子句。例如想将两个子查询结果联合起来，然后再取前20条记录，那么mys
数据的备份与恢复百合不是茶 oracle sql 数据恢复数据备份
数据的备份与恢复的方式有: 表,方案 ,数据库; 数据的备份: 导出到的常见命令; 参数说明 USERID 确定执行导出实用程序的用户名和口令 BUFFER 确定导出数据时所使用的缓冲区大小，其大小用字节表示 FILE 指定导出的二进制文
线程组 bijian1013 java 多线程 thread java多线程线程组
有些程序包含了相当数量的线程。这时，如果按照线程的功能将他们分成不同的类别将很有用。线程组可以用来同时对一组线程进行操作。创建线程组：ThreadGroup g = new ThreadGroup(groupName); &nbs
top命令找到占用CPU最高的java线程 bijian1013 java linux top
上次分析系统中占用CPU高的问题，得到一些使用Java自身调试工具的经验，与大家分享。 (1)使用top命令找出占用cpu最高的JAVA进程PID:28174 (2)如下命令找出占用cpu最高的线程 top -Hp 28174 -d 1 -n 1 32694 root 20 0 3249m 2.0g 11m S 2 6.4 3:31.12 java
【持久化框架MyBatis3四】MyBatis3一对一关联查询 bit1129 Mybatis3
当两个实体具有1对1的对应关系时，可以使用One-To-One的进行映射关联查询 One-To-One示例数据以学生表Student和地址信息表为例，每个学生都有都有1个唯一的地址(现实中，这种对应关系是不合适的，因为人和地址是多对一的关系)，这里只是演示目的学生表 CREATE TABLE STUDENTS (
C/C++图片或文件的读写 bitcarter 写图片
先看代码： /*strTmpResult是文件或图片字符串 * filePath文件需要写入的地址或路径 */ int writeFile(std::string &strTmpResult,std::string &filePath) { int i,len = strTmpResult.length(); unsigned cha
nginx自定义指定加载配置 ronin47
进入 /usr/local/nginx/conf/include 目录，创建 nginx.node.conf 文件，在里面输入如下代码： upstream nodejs { server 127.0.0.1:3000; #server 127.0.0.1:3001; keepalive 64; } server { liste
java-71-数值的整数次方.实现函数double Power(double base, int exponent)，求base的exponent次方 bylijinnan double
public class Power { /** *Q71-数值的整数次方 *实现函数double Power(double base, int exponent)，求base的exponent次方。不需要考虑溢出。 */ private static boolean InvalidInput=false; public static void main(
Android四大组件的理解 Cb123456 android 四大组件的理解
分享一下，今天在Android开发文档-开发者指南中看到的: App components are the essential building blocks of an Android
[宇宙与计算]涡旋场计算与拓扑分析 comsci 计算
怎么阐述我这个理论呢？。。。。。。。。。首先：宇宙是一个非线性的拓扑结构与涡旋轨道时空的统一体。。。。我们要在宇宙中寻找到一个适合人类居住的行星，时间非常重要，早一个刻度和晚一个刻度，这颗行星的
同一个Tomcat不同Web应用之间共享会话Session cwqcwqmax9 session
实现两个WEB之间通过session 共享数据查看tomcat 关于 HTTP Connector 中有个emptySessionPath 其解释如下： If set to true, all paths for session cookies will be set to /. This can be useful for portlet specification impleme
springmvc Spring3 MVC，ajax，乱码 dashuaifu spring jquery mvc Ajax
springmvc Spring3 MVC @ResponseBody返回，jquery ajax调用中文乱码问题解决 Spring3.0 MVC @ResponseBody 的作用是把返回值直接写到HTTP response body里。具体实现AnnotationMethodHandlerAdapter类handleResponseBody方法，具体实
搭建WAMP环境 dcj3sjt126com wamp
这里先解释一下WAMP是什么意思。W:windows，A：Apache，M：MYSQL，P：PHP。也就是说本文说明的是在windows系统下搭建以apache做服务器、MYSQL为数据库的PHP开发环境。工欲善其事，必须先利其器。因为笔者的系统是WinXP，所以下文指的系统均为此系统。笔者所使用的Apache版本为apache_2.2.11-
yii2 使用raw http request dcj3sjt126com http
Parses a raw HTTP request using yii\helpers\Json::decode() To enable parsing for JSON requests you can configure yii\web\Request::$parsers using this class: 'request' =&g
Quartz-1.8.6 理论部分 eksliang quartz
转载请出自出处：http://eksliang.iteye.com/blog/2207691 一.概述基于Quartz-1.8.6进行学习，因为Quartz2.0以后的API发生的非常大的变化，统一采用了build模式进行构建；什么是quartz? 答：简单的说他是一个开源的java作业调度框架，为在 Java 应用程序中进行作业调度提供了简单却强大的机制。并且还能和Sp
什么是POJO？ gupeng_ie java POJO 框架 Hibernate
POJO--Plain Old Java Objects(简单的java对象) POJO是一个简单的、正规Java对象，它不包含业务逻辑处理或持久化逻辑等，也不是JavaBean、EntityBean等，不具有任何特殊角色和不继承或不实现任何其它Java框架的类或接口。 POJO对象有时也被称为Data对象，大量应用于表现现实中的对象。如果项目中使用了Hiber
jQuery网站顶部定时折叠广告 ini JavaScript html jquery Web css
效果体验：http://hovertree.com/texiao/jquery/4.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>网页顶部定时收起广告jQuery特效 - HoverTree<
Spring boot内嵌的tomcat启动失败 kane_xie spring boot
根据这篇guide创建了一个简单的spring boot应用，能运行且成功的访问。但移植到现有项目（基于hbase）中的时候，却报出以下错误： SEVERE: A child container failed during start java.util.concurrent.ExecutionException: org.apache.catalina.Lif
leetcode: sort list michelle_0916 Algorithm linked list sort
Sort a linked list in O(n log n) time using constant space complexity. ====analysis======= mergeSort for singly-linked list ====code======= /** * Definition for sin
nginx的安装与配置,中途遇到问题的解决 qifeifei nginx
我使用的是ubuntu13.04系统，在安装nginx的时候遇到如下几个问题，然后找思路解决的，nginx 的下载与安装 wget http://nginx.org/download/nginx-1.0.11.tar.gz tar zxvf nginx-1.0.11.tar.gz ./configure make make install 安装的时候出现
用枚举来处理java自定义异常 tcrct java enum exception
在系统开发过程中，总少不免要自己处理一些异常信息，然后将异常信息变成友好的提示返回到客户端的这样一个过程，之前都是new一个自定义的异常，当然这个所谓的自定义异常也是继承RuntimeException的，但这样往往会造成异常信息说明不一致的情况，所以就想到了用枚举来解决的办法。 1，先创建一个接口，里面有两个方法，一个是getCode, 一个是getMessage public
erlang supervisor分析 wudixiaotie erlang
当我们给supervisor指定需要创建的子进程的时候，会指定M,F,A,如果是simple_one_for_one的策略的话，启动子进程的方式是supervisor:start_child(SupName, OtherArgs),这种方式可以根据调用者的需求传不同的参数给需要启动的子进程的方法。和最初的参数合并成一个数组，A ++ OtherArgs。那么这个时候就有个问题了，既然参数不一致，那

用户画像第四章(企业级360°用户画像_标签开发_挖掘标签_用户购物性别模型-USG）

你可能感兴趣的:(用户画像)