本语料库由University of California整理,里面包含20newsgroups,reuters21578,census1990等大量经典语料http://kdd.ics.uci.edu/databases/