• 【bzoj3555】[Ctsc2014]企鹅QQ 字符串hash


    题目描述

    PenguinQQ是中国最大、最具影响力的SNS(Social Networking Services)网站,以实名制为基础,为用户提供日志、群、即时通讯、相册、集市等丰富强大的互联网功能体验,满足用户对社交、资讯、娱乐、交易等多方面的需求。
    小Q是PenguinQQ网站的管理员,他最近在进行一项有趣的研究——哪些账户是同一个人注册的。经过长时间的分析,小Q发现同一个人注册的账户名称总是很相似的,例如Penguin1,Penguin2,Penguin3……于是小Q决定先对这种相似的情形进行统计。
    小Q定义,若两个账户名称是相似的,当且仅当这两个字符串等长且恰好只有一位不同。例如“Penguin1”和“Penguin2”是相似的,但“Penguin1”和“2Penguin”不是相似的。而小Q想知道,在给定的 个账户名称中,有多少对是相似的。
    为了简化你的工作,小Q给你的n个字符串长度均等于m,且只包含大小写字母、数字、下划线以及‘@’共64种字符,而且不存在两个相同的账户名称。

    输入

    第一行包含三个正整数 n,m,s 。其中n表示账户名称数量,m表示账户名称长度,s用来表示字符集规模大小,它的值只可能为2或64。
    若s等于2,账户名称中只包含字符‘0’和‘1’共2种字符;
    若s等于64,账户名称中可能包含大小写字母、数字、下划线以及‘@’共64种字符。
    随后n行,每行一个长度为m的字符串,用来描述一个账户名称。数据保证n个字符串是两两不同的。

    输出

    仅一行一个正整数,表示共有多少对相似的账户名称。

    样例输入

    4 3 64
    Fax
    fax
    max
    mac

    样例输出

    4


    题解

    字符串hash

    先预处理每个字符串的前缀的hash值,然后枚举多余字符的位置,计算出每个字符串剩下串的hash值,判断有多少个相同即可。

    注意不要把n和m弄混。

    注意不要把n和m弄混。

    注意不要把n和m弄混。

    #include <cstdio>
    #include <cstring>
    #include <algorithm>
    #define N 30010
    #define M 210
    using namespace std;
    unsigned long long hash[N][M] , base[M] , a[N];
    int v[N];
    char str[M];
    int main()
    {
    	int n , m , i , j , top;
    	long long ans = 0;
    	scanf("%d%d%*d" , &n , &m);
    	for(i = 1 ; i <= n ; i ++ )
    	{
    		scanf("%s" , str + 1);
    		for(j = 1 ; j <= m ; j ++ ) hash[i][j] = hash[i][j - 1] * 131 + str[j]; 
    	}
    	base[0] = 1;
    	for(i = 1 ; i <= m ; i ++ ) base[i] = base[i - 1] * 131;
    	for(i = 1 ; i <= m ; i ++ )
    	{
    		for(j = 1 ; j <= n ; j ++ ) a[j] = hash[j][m] - hash[j][i] * base[m - i] + hash[j][i - 1] * base[m - i];
    		sort(a + 1 , a + n + 1);
    		memset(v , 0 , sizeof(v)) , top = 1 , v[1] = 1;
    		for(j = 2 ; j <= n ; j ++ )
    		{
    			if(a[j] != a[j - 1]) top ++ ;
    			v[top] ++ ;
    		}
    		for(j = 1 ; j <= top ; j ++ ) ans += (long long)v[j] * (v[j] - 1) / 2;
    	}
    	printf("%lld
    " , ans);
    	return 0;
    }
    

     

  • 相关阅读:
    C#操作json
    sql server 2008 身份验证失败 18456
    MD5密码加密
    oracle dg 报错提示 涉及硬盘错误
    Rhel6.5 相关操作
    Centos6.9部署vnc
    Sqluldr2 libclntsh.so报错处理
    时钟服务器同步方法
    windows copy 和xcopy
    Linux 本地repo配置
  • 原文地址:https://www.cnblogs.com/GXZlegend/p/6871546.html
Copyright © 2020-2023  润新知