| 失效链接处理 | 
| 阿里--实时数仓 技术入门一本通  PDF 下载 
	本站整理下载: 
	相关截图:  
	主要内容: 
		一、 传统数据仓库 
		目前来说,大数据相关的业务场景一般有实时大屏、实时 BI 报表、用户画像和监控预 
		警,如下图所示。 
		 实时大屏业务,一般用在公司领导做决策的辅助工具,在对外展示,比如实时成交额等 
		场景也会经常用到,是一种展示公司实力的方式。 
		 实时 BI 报表是运营和产品经理经常用到的一个业务。 
		 用户画像常用在广告推荐场景中,通过更详细的算法给用户贴上标签,使得推荐算法更 
		加有针对性,更加有效。 
		 预警监控,比如对网站、APP 进行流量监控,在达到一定阈值的时候可以进行报警。 
		5 > Hologre 产品介绍与技术揭秘 
		对于上面这些大数据业务场景,在很早之前业界就开始通过数据仓库的建设来满足这些 
		场景的需求,比较传统的是如下图所示的离线数据仓库,其大致流程就是:首先,将各类数 
		据收集起来;然后经过 ETL 处理,再经过层层建模对数据进行聚合、筛选等处理;最后在 
		需要的时候通过应用层的工具对数据进行展现,或者生成报表。 
		上面这种方式虽然可以对接多种数据源,但是存在一些很明显的痛点: 
		 ETL 逻辑复杂,存储、时间成本过高; 
		 数据处理链路非常长; 
		 无法支持实时/近实时的数据,只能处理 T+1 的数据。 
		二、 Lambda 架构 
		随着实时计算技术的兴起,出现了 Lambda 架构。Lambda 架构的原理如下图所示, 
		其思路其实是相当于在传统离线数仓的基础上再加上一个处理实时数据的层,然后将离线数 
		仓和实时链路产生的数据在 Serving 层进行 Merge,以此来对离线产生的数据和实时产生 
		的数据进行查询。 
		从 2011 年至今,Lambda 架构被多数互联网公司所采纳,也确实解决了一些问题,但 
		是随着数据量的增大、应用复杂度的提升,其问题也逐渐凸显,主要有: | 



 
     苏公网安备 32061202001004号
苏公网安备 32061202001004号


 
    