我的梦想
不是每个人都应该像我这样去建造一座水晶大教堂,但是每个人都应该拥有自己的梦想,设计自己的梦想,追求自己的梦想,实现自己的梦想。梦想是生命的灵魂,是心灵的灯塔,是引导人走向成功的信仰。有了崇高的梦想,只要矢志不渝地追求,梦想就会成为现实,奋斗就会变成壮举,生命就会创造奇迹。——罗伯·舒乐
用户画像特征及标签存储 用户画像特征及标签存储
前言*hive 存储 *** 存储数据相关标签表、人群计算表的表结构设计以及ID-Mapping的一种实现方式** 建立用户画像首先需要建立数据仓库,用于存储用户标签数据。Hive是基于Hadoop的数据仓库工具,依赖于HDFS存储数据,提
2021-07-09
从0到1数据指标体系搭建实践 从0到1数据指标体系搭建实践
前言我们所需要的并不是数据,而是数据背后映射的洞察。 在业务发展过程中,会产生大量的数据,单看数据是没有价值的,只有和业务相结合转化为信息,再经过处理才能体现其价值。 对于业务数据而言,通常分为两项:其一是维度,其二是度量,或者说是指标,这
2021-07-07
Hive函数之lateral view 和 explode的区别和使用 Hive函数之lateral view 和 explode的区别和使用
explode将一行数据转换成列数据,可以用于array和map类型的数据。就是将hive一行中复杂的array或者map结构拆分成多行。 用于array的语法如下: select explode(arraycol) as newcol
2021-06-01
Hive函数之自定义函数UDF、UDAF、UDTF介绍及区别 Hive函数之自定义函数UDF、UDAF、UDTF介绍及区别
前言 Hive中有三种UDF: 1、用户定义函数(user-defined function)UDF; 2、用户定义聚集函数(user-defined aggregate function , UDAF ); 3、用户定义
2021-06-01
大数据计算离线实时概念区别梳理 大数据计算离线实时概念区别梳理
1. 离线计算VS实时计算离线计算​ 离线计算,通常也称为“批处理”,表示那些离线批量、延时较高的静态数据处理过程。离线计算适用于实时性要求不高的场景,比如离线报表、数据分析等,延时一般在分钟级或小时级,多数场景是定时周期性执行一
2021-03-26
如何构建用户标签体系(转载) 如何构建用户标签体系(转载)
亚马逊的CEO Jeff Bezos曾说过他的梦想,「如果我有一百万的用户,我就会做一百万个不同的网站!」,做这个基础是先对用户打标签。 而目前基于标签的智能推荐系统,已经有了成熟商业应用,比如:淘宝的千人千面,美团外卖的智能推荐,腾讯的
2020-12-27
1 / 5