题干:
[编程题] 用户喜好
时间限制:3秒
空间限制:262144K
为了不断优化推荐效果,今日头条每天要存储和处理海量数据。假设有这样一种场景:我们对用户按照它们的注册时间先后来标号,对于一类文章,每个用户都有不同的喜好值,我们会想知道某一段时间内注册的用户(标号相连的一批用户)中,有多少用户对这类文章喜好值为k。因为一些特殊的原因,不会出现一个查询的用户区间完全覆盖另一个查询的用户区间(不存在L1<=L2<=R2<=R1)。
输入描述:
输入: 第1行为n代表用户的个数 第2行为n个整数,第i个代表用户标号为i的用户对某类文章的喜好度 第3行为一个正整数q代表查询的组数;
第4行到第(3+q)行,每行包含3个整数l,r,k代表一组查询,即标号为l<=i<=r的用户中对这类文章喜好值为k的用户的个数。
数据范围n <= 300000,q<=300000 k是整型
输出描述:
输出:一共q行,每行一个整数代表喜好值为k的用户的个数
输入例子1:
5 1 2 3 3 5 3 1 2 1 2 4 5 3 5 3
输出例子1:
1 0 2
例子说明1:
样例解释: 有5个用户,喜好值为分别为1、2、3、3、5, 第一组询问对于标号[1,2]的用户喜好值为1的用户的个数是1 第二组询问对于标号[2,4]的用户喜好值为5的用户的个数是0 第三组询问对于标号[3,5]的用户喜好值为3的用户的个数是2
开始自己写的代码:
1 n = int(input()) 2 li = [int(i) for i in input().split()] 3 q = int(input()) 4 lrk = [] 5 for j in range(q): 6 lrk.append([int(k) for k in input().split()]) 7 8 def compute(li, param): 9 a = 0 10 for p in li: 11 if p == param: 12 a += 1 13 return a 14 15 for r in lrk: 16 li_a = li[r[0]-1: r[1]] 17 print(compute(li_a, r[2])) 18 19
这段代码完全可以实现题目的操作,但是其非常费时费力;所以尽管代码基本正确无误,但是根本符合不了“速度”的要求;
参看了别人的例子改后的代码:
n = int(input()) li = [int(a) for a in input().split()] d = {} for i,v in enumerate(li): if v not in d: d[v] = [i + 1] else: d[v].append(i+1) q = int(input()) for _ in range(q): l, r, k = map(int, input().split()) if k not in d.keys(): print(0) else: a = 0 for j in d[k]: if j>=l and j<=r: a += 1 print(a)
在进行少量数据的运算中,这两种实现方法时间上看不出来什么差别;但是,当数据量成千上万甚至十万级别的时候,第一种方式显然运算速度上完全落后于第二种;而且是数倍的差距;
在此,程序就不去解释,只要稍微看一会,就能看出两段程序的优劣!