报表排查问题流程
-
复现出问题的查询,看到问题的表象
-
筛选问题数据,将数据缩小
-
从外向内运行SQL
-
同样的查询条件带入整个查询join的左表和右表中
-
定位问题出在哪个表中,得到问题的答案
什么是哈希?
在记录的关键字与记录的存储地址之间建立的一种对应关系叫哈希函数。哈希函数就是一种映射,是从关键字到存储地址的映射。是一种Key-Value数据结构。可以表示为(Adres{s_i} = Hash(ke{y_i}))。
哈希算法的简单解释
比如这里有一万首歌,给你一首新的歌X,要求你确认这首歌是否在那一万首歌之内。无疑,将一万首歌一个一个比对非常慢。但如果存在一种方式,能将一万首歌的每首数据浓缩到一个数字(称为哈希码)中,于是得到一万个数字,那么用同样的算法计算新的歌X的编码,看看歌X的编码是否在之前那一万个数字中,就能知道歌X是否在那一万首歌中。作为例子,如果要你组织那一万首歌,一个简单的哈希算法就是让歌曲所占硬盘的字节数作为哈希码。这样的话,你可以让一万首歌“按照大小排序”,然后遇到一首新的歌,只要看看新的歌的字节数是否和已有的一万首歌中的某一首的字节数相同,就知道新的歌是否在那一万首歌之内了。当然这个简单的哈希算法很容易出现两者同样大小的歌曲,这就是发送了碰撞。而好的哈希算法发生碰撞的几率非常小。
https://www.zhihu.com/question/20820286/answer/88812256
哈希算法在分布式存储中的应用
现在互联网面对的都是海量的数据、海量的用户。我们为了提高数据的读取、写入能力,一般都采用分布式的方式来存储数据,比如分布式缓存。我们有海量的数据需要缓存,所以一个缓存机器肯定是不够的。于是,我们就需要将数据分布在多台机器上。
该如何决定将哪个数据放到哪个机器上呢?我们可以借用前面数据分片的思想,即通过哈希算法对数据取哈希值,然后对机器个数取模,这个最终值就是应该存储的缓存机器编号。
Apache Doris Colocate Join 原理与实践
鲁班
鲁班电商是今日头条旗下的推广电商的平台
快手小店通
快手小店通是快手2020年6月针对电商老铁新推出的获取公域流量涨粉、小店下单和订单支付的产品工具
腾讯的优量汇,头条的穿山甲
腾讯广点通
通过广点通,用户可以在平台多个广告位上进行应用以及应用活动相关的精准推广。
H5
H5其实就是H5广告,HTML5的简称。主要依托日活3亿的微信的流量。
比方说:
人民日报利用《穿上军装》H5在八一建军节引爆8亿流量
OTT
Over the Top的简称,即互联网电视。
RTB
Real Time Bidding
一般DSP的基本要求就是支持RTB(就像一般电商的基本要求就是支持第三方支付)
需求方平台允许广告客户和广告机构更方便地访问,以及更有效地购买广告库存,因为该平台汇集了各种广告交易平台的库存。有了这一平台,就不需要再出现另一个繁琐的购买步骤——购买请求。个人理解:互联网里有成千上万的广告主,他们急需推广自己的产品,寻找优质的媒介和精准的目标用户,优化广告投放策略,提高投入产出比。简单的讲,DSP就是广告主服务平台,广告主可以在平台上设置广告的目标受众、投放地域、广告出价等等。
ADX 就像“股票交易市场”,而DSP 就是“炒股软件”,就是“股票交易员”,每一次竞价购买广告曝光机会都是根据数据、算法和定向策略的设置而进行的。
SSP
Supply Side Platform,供给方平台
SDK
software development kit,“软件开发工具包”
广告SDK提供盈利渠道。广告商提供给开发者的服务,在小程序内嵌入代码广告,为开发者提供了变现和盈利的途径。所以SDK广告就是内置于程序内的广告开发代码,由广告提供商提供.
对于MRAID(Mobile Rich Media Ad Interface Definitions), SDK指的是实现MRAID功能的代码及框架库。可以给到移动App开发者直接使用的程序包(用于发布MRAID广告)。