DataQuaner
07
09
用户画像特征及标签存储 用户画像特征及标签存储
前言*hive 存储 *** 存储数据相关标签表、人群计算表的表结构设计以及ID-Mapping的一种实现方式** 建立用户画像首先需要建立数据仓库,用于存储用户标签数据。Hive是基于Hadoop的数据仓库工具,依赖于HDFS存储数据,提
2021-07-09
07
从0到1数据指标体系搭建实践 从0到1数据指标体系搭建实践
前言我们所需要的并不是数据,而是数据背后映射的洞察。 在业务发展过程中,会产生大量的数据,单看数据是没有价值的,只有和业务相结合转化为信息,再经过处理才能体现其价值。 对于业务数据而言,通常分为两项:其一是维度,其二是度量,或者说是指标,这
2021-07-07
06
01
01
03
26
大数据计算离线实时概念区别梳理 大数据计算离线实时概念区别梳理
1. 离线计算VS实时计算离线计算​ 离线计算,通常也称为“批处理”,表示那些离线批量、延时较高的静态数据处理过程。离线计算适用于实时性要求不高的场景,比如离线报表、数据分析等,延时一般在分钟级或小时级,多数场景是定时周期性执行一
2021-03-26