• sphinx相关


    Ubuntu 10.04安装Sphinx

    http://blog.rebill.info/archives/install-sphinx-in-ubuntu-10-04.html

    用Duplicity备份你的VPS

    一直想对VPS进行一次备份,苦于没有找到比较好的办法,所以一直搁置。这次,经过一番周折,终于找到了VPS备份利器--Duplicity
    Duplicity是一 个使用Python语言实现的文件增量备份工具,其利用rsync底层类库,实现仅把文件中变化了的数据存入增量备份包的工作方式(类似给文件生成 Patch补丁的方式),调用pgp对数据包进行签名和加密,而且支持本地文件系统、远端ftp、ssh/scp、rsync、WebDAV、 WebDAVs、HSi以及Amazon S3等非常丰富的备份存储介质。

    五个最佳的Hadoop项目

    1.Cascading:Cascading是基于Hadoop集群之上的数据处理API。它通过实现了丰富的功能化API,使你不需要接触MapReduce任务就能使用分布式计算能力,其核心概念是基于管道和流的数据处理。
    2.Mahout:Mahout是一个基于Hadoop实现各种机器学习与数据挖掘算法库。被用来提供推荐服务。
    3.Hive:Hive由Facebook出品,它为Hadoop提供了一种类似于SQL的操作接口。
    4.Avro:Avro是一个基于二进制数据传输高性能的中间件。Avro通过将数据进行序列化,以使得大批量数据交互过程更方便。
    5.Storm:Storm由BackType Technology出口,其口号是“实时的Hadoop系统”。


    ruby 分词

    http://lifegoo.pluskid.org/?p=431





  • 相关阅读:
    CPP标准模板库 随笔
    C++ Concurrency In Action 一些重点
    标准模板库(STL)
    单链表常见操作
    android三大组件之Intent
    数组k平移三种方法(java)
    java中空字符串、null的区别
    java最大最小堆
    java学习笔记之基础知识
    笔试题集锦
  • 原文地址:https://www.cnblogs.com/lexus/p/2143534.html
Copyright © 2020-2023  润新知