• SCWS分词扩展在WINDOWS下的安装方法


    安装之前先确认您是否拥有主机的安装权限,否则无法进行安装,安装步骤如下:

    1. 根据您当前用的 PHP 版本,下载相应已编译好的 php_scws.dll 扩展库。


       目前支持以下版本
      [PHP-4.4.x (44KB/VC6/ZTS)]  [PHP-5.2.x (44KB/VC6/ZTS)]  [PHP-5.3.x (40KB/VC9/ZTS)]
     [PHP-5.4.x (40KB/VC9/ZTS)]  [PHP-5.3.x (40KB/VC9/NTS)]  [PHP-5.4.x (40KB/VC9/NTS)]
     [PHP-5.3.x (44KB/VC6/ZTS)]
      下载地址为:http://www.xunsearch.com/scws/download.php

    2. 将下载后的 zip 文件解压缩得到里面的 php_scws.dll ,将该文件放到 php 安装目录的


       ext/ 目录中去(通常为:X:/php/ext/)。

    3. 建立一个本地目录放规则集文件和词典文件,建议使用:C:/program files/scws/etc

    4. 从 scws 主页上下载词典文件和规则集文件,解压后将 *.xdb 和 *.ini 放到上述目录中


       SCWS 全部源代码,包括 libscws 核心库,命令行工具程序,php 扩展代码,规则集及文档。
       下载地址 http://www.xunsearch.com/scws/down/scws-1.2.2.tar.bz2
       规则集:在源码文件的etc文件夹中
       词典系列:http://www.xunsearch.com/scws/download.php XDB 词典文件 位置

    5. 修改 php.ini 通常位于 C:/windows/php.ini 或 C:/winnt/php.ini 之类的目录,
       在 php.ini 的末尾加入以下几行:

    [scws]
    ;
    ; 注意请检查 php.ini 中的 extension_dir 的设定值是否正确, 否则请将 extension_dir 设为空,
    ; 再把 php_scws.dll 指定为绝对路径。
    ;
    extension = php_scws.dll

    以下参数可选
    scws.default.charset = gbk
    scws.default.fpath = "c:/program files/scws/etc"

    6. 重启 web 服务器即可完成。


    测试程序:

    test1.php
    <?php
    $so = scws_new();
    $so->set_charset('gbk');
    // 这里没有调用 set_dict 和 set_rule 系统会自动试调用 ini 中指定路径下的词典和规则文件
    $so->send_text("我是一个中国人,我会C++语言,我也有很多T恤衣服");
    while ($tmp = $so->get_result())
    {
      print_r($tmp);
    }
    $so->close();
    ?>

    test2.php
    <?php
    //实例化分词插件核心类
     $so = scws_new();
     //设置分词时所用编码
     $so->set_charset('utf-8');
     //设置分词所用词典(此处使用utf8的词典)
     $so->set_dict('dict.utf8.xdb');
     //设置分词所用规则
     $so->set_rule('etc/rules.utf8.ini ');
     //分词前去掉标点符号
     $so->set_ignore(true);
     //是否复式分割,如“中国人”返回“中国+人+中国人”三个词。
     $so->set_multi(true);
     //设定将文字自动以二字分词法聚合
     $so->set_duality(true);
     //要进行分词的语句
     $so->send_text("我是中国人,我不喜欢吃喝玩乐");
     //获取分词结果,如果提取高频词用get_tops方法
     //    $tmp = $so->get_tops(5,'al,n');

     while ($tmp = $so->get_result())
     {
         print_r($tmp);
     }
     $so->close();

     ?>

  • 相关阅读:
    Http状态吗504问题复盘
    Http状态码502问题复盘
    Nginx服务的基本配置
    mysql修改root密码
    centos7开启80端口及其他端口
    tp5隐藏入口文件(基于nginx)
    使nginx支持pathinfo模式
    laravel-admin 上传图片过程中遇到的问题
    Maven介绍
    java中泛型
  • 原文地址:https://www.cnblogs.com/milantgh/p/4673253.html
Copyright © 2020-2023  润新知