• 黄聪:获取搜索引擎来源访客的搜索关键词


    在php中,使用$_SERVER["HTTP_REFERER"]就能获得访客的HTTP Referer。里面记录了来源的url地址,各个搜索引擎都有自己的url规则,比如说谷歌的搜索关键词是跟在q=的后面,百度的则是wd=或 word=。需要注意的是一些中文搜索引擎他使用的可能是gb2312或gbk编码,和wordpress的utf-8的不一样,获取关键词时就需要进行 转码。

    下表总结了常见的搜索引擎的url规则和字符编码:

    搜索引擎 关键词变量名 编码
    google q 由url中的ie字段指定
    baidu wd或word gb2312或ie字段
    yahoo p或keyword ei字段指定
    sogou query gb2312
    bing q utf-8
    youdao q或keyword ue字段指定
    soso w

    gb2312

    $refer = $_SERVER["HTTP_REFERER"];
    $refer_string = parse_url($refer, PHP_URL_QUERY);
    parse_str($refer_string, $vars);
    if (strpos($refer, "google")) {
        $search_terms = $vars['q'];
        $bIsUTF8 = ($vars["ie"] == "GB") ? false : true; 
    }
    else if(strpos($refer, "baidu"))
    {
        $search_terms = $vars['wd']?$vars['wd']:$vars['word'];
        $bIsUTF8 = (strtolower($vars["ie"]) == "utf-8") ? true : false;
     
    }
    else if(strpos($refer, "yahoo"))
    {
        $search_terms = $vars['p']?$vars['p']:$vars['keyword'];
        $bIsUTF8 = (strtolower($vars["ei"]) == "utf-8") ? true : false;
    }
    else if(strpos($refer, "sogou"))
    {
        $search_terms = $vars["query"];
        $bIsUTF8 = false;
    }
    else if(strpos($refer, "bing"))
    {
        $search_terms = $vars['q'];
        $bIsUTF8 = true;
     
    }
    else if(strpos($refer, "youdao"))
    {
        $search_terms = $vars['q']?$vars['q']:$vars['keyword'];
        $bIsUTF8 = (strtolower($vars["ue"]) == "utf8") ? true : false;
    }
    else if(strpos($refer, "soso"))
    {
        $search_terms = $vars["w"];
        $bIsUTF8 = false;
    }
     
    if(!$bIsUTF8)
    $search_terms =iconv("gb2312","utf-8",$search_terms);

  • 相关阅读:
    Java B/S开发模式漫谈 (转)
    struts 使用多个配置文件 strutsconfig.xml
    java 验证邮箱格式正确性、验证字符串是否为数字
    Java获取各种常用时间方法
    创建HttpServlet的基本步骤
    struts1.x 配置文件之——web.xml详解
    最常用的JAVA包
    字符串转换为日期时间格式
    struts1.x 配置文件详解
    看看别人的博客,经验总结,很宝贵
  • 原文地址:https://www.cnblogs.com/huangcong/p/2625874.html
Copyright © 2020-2023  润新知