郑昀 最后更新于2016/10/17
之前提到过『2007年年底,时任阿里巴巴和中国雅虎CTO的吴炯给我们提出针对股票舆情的情感趋势分析方向建议后,我们两周时间就完成了前后端的开发,迅速上线』,有的同学说哎呀是不是太快了点儿?光是收集语料,收集领域新词,训练和优化,都需要好久呢。
还有更快的呢。
08年12月13日,受到刘未鹏在 TopLanguage 组《一个整合的阅读共享方案》帖子的启发,我有了一个 memeTracker mashup 的思路。问了一下周围人的看法,大家竟然觉得这思路不靠谱,于是身为全栈工程师的我挽起袖子开工了。先从算法开始,受到谷文栋撰写的 Reddit 算法介绍文章启发,12月19日我画出了社会化推荐的算法脑图:
有了算法,剩下的代码部分就容易多了。所以想法诞生后的第7天,玩聚SR的爬虫(基于 Twisted)、NLP(实体识别、标签提取和文章相似性计算,在张博士现成的引擎上构架了一层)、存储(基于MySQL)、统计(基于上图的 SRRank 算法)和网站(基于 Django)就上线发布了,全是用 Python 写的。
等了两天,看看热文榜效果确实比预计得还要好,我就在08年12月22日发了博文《来,做一个社会化推荐引擎》,正式公开了 SR 的思路和算法。
就这样,一个 idea 从产生到上线发布,过去了七天。全栈工程师就是有这样的好处。
随后1月10日我又正式推出了 SRBacks,一段 JavaScript Widget,利用 JsonP 技术,在博客自己的页面上显示哪些人在哪些社交媒体上推荐或分享过他的文章,有人感慨:这下我终于知道谁在分享我的文章了。这个博客插件最开始长这样:
很快就有人做了自定义版本插件:
迅速推出的 SR 和 SRBacks,欣喜地获得了 Keso “SR 确实很酷”的评价,也获得了国内外新闻媒体高度评价。
现如今,移动应用有更加便利的开发条件,从前到后的全栈方便程度更是让人羡慕。
举个例子,前两天看 InfoQ,携程的技术团队输出了一个 ReactMix,它实际上是在 React Native 和 ReactJs 的基础上,又构架一层 Framework 和自动化翻译工具,基于自动化脚本动态翻译的方式,使得他们团队存量的大量的 HTML+CSS+JS 的代码可以无修改地直接转换成为 React Native 代码,而且是一套不需要修改的代码,在 iOS、Andorid、PC 等平台上展现完全一致。
类似这种辅助性框架有很多。快速试错成为可能。
回到过去,最开始玩聚SR长这个样子:
后来长这个样子:
09年2月8日,我又乘胜追击,推出了 Hot Retweets,也就是那两年被人熟知的 @rtmeme,一个基于 Twitter API (后来又加入了饭否API)的 mashup 应用。最开始它长这个样子:
此时离 Google 退出中国还有一年零一个月,信息自由流动的大门正在缓缓关闭。
-EOF-
不妨订阅我的微信订阅号『老兵笔记』: