翻转窗口(TumblingWindow)如图所示,跳跃窗口的计时随之结束

翻滚窗口

如图所示,翻转窗口是最简单最基本的窗口。它计算固定时间段内的事件数。事件不会重复计数或省略,统计间隔相同,就像计时器一样。就像,计算上一次发生的次数。例如,统计该期间网站的访问次数:PV 1:00 到 2:00,PV 2:00 到 3:00……等等。

跳跃窗口

如图所示,跳转窗口与翻转窗口类似,只是统计的持续时间不变,统计的间隔时间缩短了,这样一些数据会被每个翻转窗口重复统计。这在一些更特别的统计数据中很有用。以电子商务为例,例如:统计1:00到3:00的访客人数,2:00到4:00的人数,3:00到5的人数: 00…

滑动窗口

滑动窗是一种特殊的窗。它的统计时间不变,但统计时间是连续的。可以认为是去掉了Hopping Window的统计时间间隔。因此,它的意义在于它可以计算出任意时间段内的事件数量,这对于计算网站流量是否超标,统计一个网站的最大数量(如文章数、发帖数)非常有用。给定的时间段。

会话窗口

会话窗口与前三种窗口不同,其统计的持续时间是可变的。当事件发生时(例如用户打开网页),窗口计时开始。随着用户在页面上继续点击跳转,进行各种操作,最后一段时间没有操作会话超时,窗口计时结束。会话窗口对于一次性记录用户在页面上的所有行为非常有用,也是电商平台跟踪和分析用户行为的重要手段。它可以清楚地知道在每个页面上停留了多长时间,以及页面和页面如何跳转、阅读和购买那些东西,损失从哪里开始,广告质量(查看、点击)、何时回访等。 ,从而确定每个能力的浏览习惯和消费,甚至年龄、性别、职业等做出准确的画像,也是大数据分析的方向之一。

快照窗口(SessionWindow)

快照窗口可以看作是一种特殊的翻转窗口,但它的统计时间比较短,一般以秒为单位。如果在一定时间内没有发生任何事件,则不会被计算在内。一般用于允许一定的精度误差。并发统计。

后记

同学们,你知道在工作学习的过程中有哪些窗口函数可用吗?可以在留言区告诉我,我会分享的。让我们一起学习进步!

Microsoft Office 工作笔记系列

①说说我在微软对外服务大数据分析部门的工作经历和一些个人看法

②谈谈微软的知识管理服务平台和一些编程风格

③窗口函数介绍

© 版权声明
THE END
喜欢就支持一下吧
点赞139 分享
评论 抢沙发
头像
欢迎您留下宝贵的见解!
提交
头像

昵称

取消
昵称表情代码图片