通用机器学习
- MLlib in Apache Spark—Spark中的分布式机器学习程序库
- Mahout —分布式的机器学习库
- Stanford Classifier —斯坦福大学的分类器
- Weka—Weka是数据挖掘方面的机器学习算法集。
- ORYX—提供一个简单的大规模实时机器学习/预测分析基础架构。
数据分析/数据可视化
Javascript自然语言处理
- Twitter-text-js —JavaScript实现的推特文本处理库
- NLP.js —javascript及coffeescript编写的NLP工具
- natural—Node下的通用NLP工具
- Knwl.js—JS编写的自然语言处理器
数据分析/数据可视化
通用机器学习
- Convnet.js—训练深度学习模型的JavaScript库。
- Clustering.js—用JavaScript实现的聚类算法,供Node.js及浏览器使用。
- Decision Trees—Node.js实现的决策树,使用ID3算法。
- Node-fann —Node.js下的快速人工神经网络库。
- Kmeans.js—k-means算法的简单Javascript实现,供Node.js及浏览器使用。
- LDA.js —供Node.js用的LDA主题建模工具。
- Learning.js—逻辑回归/c4.5决策树的JavaScript实现
- Machine Learning—Node.js的机器学习库。
- Node-SVM—Node.js的支持向量机
- Brain —JavaScript实现的神经网络
- Bayesian-Bandit —贝叶斯强盗算法的实现,供Node.js及浏览器使用。
Julia通用机器学习
- PGM—Julia实现的概率图模型框架。
- DA—Julia实现的正则化判别分析包。
- Regression—回归分析算法包(如线性回归和逻辑回归)。
- Local Regression —局部回归,非常平滑!
- Naive Bayes —朴素贝叶斯的简单Julia实现
- Mixed Models —(统计)混合效应模型的Julia包
- Simple MCMC —Julia实现的基本mcmc采样器
- Distance—Julia实现的距离评估模块
- Decision Tree —决策树分类器及回归分析器
- Neural —Julia实现的神经网络
- MCMC —Julia下的MCMC工具
- GLM —Julia写的广义线性模型包
- Online Learning
- GLMNet —GMLNet的Julia包装版,适合套索/弹性网模型。
- Clustering—数据聚类的基本函数:k-means, dp-means等。
- SVM—Julia下的支持向量机。
- Kernal Density—Julia下的核密度估计器
- Dimensionality Reduction—降维算法
- NMF —Julia下的非负矩阵分解包
- ANN—Julia实现的神经网络
自然语言处理
- Topic Models —Julia下的主题建模
- Text Analysis—Julia下的文本分析包
数据分析/数据可视化
- Graph Layout —纯Julia实现的图布局算法。
- Data Frames Meta —DataFrames的元编程工具。
- Julia Data—处理表格数据的Julia库
- Data Read—从Stata、SAS、SPSS读取文件
- Hypothesis Tests—Julia中的假设检验包
- Gladfly —Julia编写的灵巧的统计绘图系统。
- Stats—Julia编写的统计测试函数包
- RDataSets —读取R语言中众多可用的数据集的Julia函数包。
- DataFrames —处理表格数据的Julia库。
- Distributions—概率分布及相关函数的Julia包。
- Data Arrays —元素值可以为空的数据结构。
- Time Series—Julia的时间序列数据工具包。
- Sampling—Julia的基本采样算法包
杂项/演示文稿
- DSP —数字信号处理
- JuliaCon Presentations—Julia大会上的演示文稿
- SignalProcessing—Julia的信号处理工具
- Images—Julia的图片库
Lua
通用机器学习
- Torch7
- cephes —Cephes数学函数库,包装成Torch可用形式。提供并包装了超过180个特殊的数学函数,由Stephen L. Moshier开发,是SciPy的核心,应用于很多场合。
- graph —供Torch使用的图形包。
- randomkit—从Numpy提取的随机数生成包,包装成Torch可用形式。
- signal —Torch-7可用的信号处理工具包,可进行FFT, DCT, Hilbert, cepstrums, stft等变换。
- nn —Torch可用的神经网络包。
- nngraph —为nn库提供图形计算能力。
- nnx—一个不稳定实验性的包,扩展Torch内置的nn库。
- optim—Torch可用的优化算法库,包括 SGD, Adagrad, 共轭梯度算法, LBFGS, RProp等算法。
- unsup—Torch下的非监督学习包。提供的模块与nn(LinearPsd, ConvPsd, AutoEncoder, …)及独立算法 (k-means, PCA)等兼容。
- manifold—操作流形的包。
- svm—Torch的支持向量机库。
- lbfgs—将liblbfgs包装为FFI接口。
- vowpalwabbit —老版的vowpalwabbit对torch的接口。
- OpenGM—OpenGM是C++编写的图形建模及推断库,该binding可以用Lua以简单的方式描述图形,然后用OpenGM优化。
- sphagetti —MichaelMathieu为torch7编写的稀疏线性模块。
- LuaSHKit —将局部敏感哈希库SHKit包装成lua可用形式。
- kernel smoothing —KNN、核权平均以及局部线性回归平滑器
- cutorch—torch的CUDA后端实现
- cunn —torch的CUDA神经网络实现。
- imgraph—torch的图像/图形库,提供从图像创建图形、分割、建立树、又转化回图像的例程
- videograph—torch的视频/图形库,提供从视频创建图形、分割、建立树、又转化回视频的例程
- saliency —积分图像的代码和工具,用来从快速积分直方图中寻找兴趣点。
- stitch —使用hugin拼合图像并将其生成视频序列。
- sfm—运动场景束调整/结构包
- fex —torch的特征提取包,提供SIFT和dSIFT模块。
- OverFeat—当前最高水准的通用密度特征提取器。
- Numeric Lua
- Lunatic Python
- SciLua
- Lua – Numerical Algorithms
- Lunum
演示及脚本
- Core torch7 demos repository.核心torch7演示程序库
- 线性回归、逻辑回归
- 人脸检测(训练和检测是独立的演示)
- 基于mst的断词器
- train-a-digit-classifier
- train-autoencoder
- optical flow demo
- train-on-housenumbers
- train-on-cifar
- tracking with deep nets
- kinect demo
- 滤波可视化
- saliency-networks
- Training a Convnet for the Galaxy-Zoo Kaggle challenge(CUDA demo)
- Music Tagging—torch7下的音乐标签脚本
- torch-datasets 读取几个流行的数据集的脚本,包括:
- BSR 500
- CIFAR-10
- COIL
- Street View House Numbers
- MNIST
- NORB
- Atari2600 —在Arcade Learning Environment模拟器中用静态帧生成数据集的脚本。
转自:基因堂
2. http://www.cnblogs.com/PurpleTide/p/3769748.html
3. 好文:http://blog.csdn.net/wiking__acm/article/details/42742961