用户画像特征及标签存储 前言*hive 存储 *** 存储数据相关标签表、人群计算表的表结构设计以及ID-Mapping的一种实现方式** 建立用户画像首先需要建立数据仓库,用于存储用户标签数据。Hive是基于Hadoop的数据仓库工具,依赖于HDFS存储数据,提 2021-07-09 Hive 标签 用户画像 从0到1数据指标体系搭建实践 前言我们所需要的并不是数据,而是数据背后映射的洞察。 在业务发展过程中,会产生大量的数据,单看数据是没有价值的,只有和业务相结合转化为信息,再经过处理才能体现其价值。 对于业务数据而言,通常分为两项:其一是维度,其二是度量,或者说是指标,这 2021-07-07 DH BI 指标 数据仓库开发工程师面经 面经 2021-07-07 Job 面试必备 数据仓库 数据开发 Hive函数之lateral view 和 explode的区别和使用 explode将一行数据转换成列数据,可以用于array和map类型的数据。就是将hive一行中复杂的array或者map结构拆分成多行。 用于array的语法如下: select explode(arraycol) as newcol 2021-06-01 Hive Hive explode Hive函数之自定义函数UDF、UDAF、UDTF介绍及区别 前言 Hive中有三种UDF: 1、用户定义函数(user-defined function)UDF; 2、用户定义聚集函数(user-defined aggregate function , UDAF ); 3、用户定义 2021-06-01 Hive Hive UDF UDAF UDTF 大数据计算离线实时概念区别梳理 1. 离线计算VS实时计算离线计算 离线计算,通常也称为“批处理”,表示那些离线批量、延时较高的静态数据处理过程。离线计算适用于实时性要求不高的场景,比如离线报表、数据分析等,延时一般在分钟级或小时级,多数场景是定时周期性执行一 2021-03-26 BigData DataComputing 大数据开发工程师面试资料汇总 面试 2021-02-18 Job Job 数据可视化分析平台开源方案集锦 数据可视化分析平台 2021-02-11 Data Analysis Data Analysis BI Superset 如何构建用户标签体系(转载) 亚马逊的CEO Jeff Bezos曾说过他的梦想,「如果我有一百万的用户,我就会做一百万个不同的网站!」,做这个基础是先对用户打标签。 而目前基于标签的智能推荐系统,已经有了成熟商业应用,比如:淘宝的千人千面,美团外卖的智能推荐,腾讯的 2020-12-27 用户标签 用户 标签 Java程序的层级结构(Controller、Service、Dao、Entity层) Java基础 2020-11-12 Java Java