• 中文分词技术之SCWS 中文分词


    1. 根据您当前用的 PHP 版本,下载相应已编译好的 php_scws.dll 扩展库。
       目前支持 PHP-4.4.x 和 PHP-5.2.x 系列,下载地址分别为:
    
       php-4.4.x: http://www.xunsearch.com/scws/down/php-4.4.x/php_scws.dll
       php-5.2.x: http://www.xunsearch.com/scws/down/php-5.2.x/php_scws.dll
       php-5.3.x: http://www.xunsearch.com/scws/down/php-5.3.x/php_scws.dll
    
    2. 将下载后的  php_scws.dll 放到 php 安装目录的
       extensions/ 目录中去(通常为:X:/php/extensions/或 X:/php/ext/)。
    
    3. 建立一个本地目录放规则集文件和词典文件,建议使用:C:/program files/scws/etc
    
    4. 从 scws 主页上下载词典文件,解压后将 *.xdb 放到上述目录中
       词典系列:http://www.xunsearch.com/scws/down/scws-dict-chs-gbk.tar.bz2
               http://www.xunsearch.com/scws/down/scws-dict-chs-utf8.tar.bz2
               http://www.xunsearch.com/scws/down/scws-dict-cht-utf8.tar.bz2
    
    5. 从 scws 主页上下载规则集文件,解压后将 *.ini 放到第 3 步建立的目录
       规则集文件压缩包:http://www.xunsearch.com/scws/down/rules.tgz
       解压后有三个文件分别为 rules.ini  rules.utf8.ini rules_cht.utf8.ini
       将三件文件拷到第 3 步所述的目录中
    
    6. 修改 php.ini 通常位于 C:/windows/php.ini 或 C:/winnt/php.ini 之类的目录,
       在 php.ini 的末尾加入以下几行:
    
    [scws]
    ;
    ; 注意请检查 php.ini 中的 extension_dir 的设定值是否正确, 否则请将 extension_dir 设为空,
    ; 再把 php_scws.dll 指定为绝对路径。
    ;
    extension = php_scws.dll
    scws.default.charset = gbk (或utf8)
    scws.default.fpath = "c:/program files/scws/"
    
    5. 重开 web 服务器即可完成。
    ===================== This is my sign! ======================================================= The moment you want to give up, thing about why did insist to come here !
  • 相关阅读:
    动态查找>红黑树(RedBlack Tree)
    JSF>表格设置行的颜色
    获取某一天之前或者之后多少天的日期
    java基础>jdbc数据库操作
    java基础>Exception
    数据结构>优先队列(堆)
    java基础>I/O
    java基础>线程 生产者消费者问题
    java基础>泛型
    动态规划>可靠性设计
  • 原文地址:https://www.cnblogs.com/tuozi001/p/2860195.html
Copyright © 2020-2023  润新知