因为博客园今天又不能访问了,并且这几天状态都不稳定,我又一次萌发了做博客备份的念头。
之前,我已经做过一次了,并且满足基本了我自己用的需求,当时用的是 .NET/C#,按一定规律下载我的博客网页后,正则表达式提取相关信息保存到 Access 数据库中存档。但是那个做法的缺点是特定于某个皮肤(当时我用的皮肤是 Books),现在换了这个就不行了,就得重新写正则表达式,修改旧程序。总感觉比较麻烦。
于是想起前一阵看到的 limodou 写的博客备份程序,python 的,在这里:
http://blog.donews.com/limodou/archive/2004/07/28/53269.aspx
和这里: http://blog.donews.com/limodou/archive/2006/01/18/700192.aspx
今天又翻出来看了一下,用的是 python 里面的 xml-rpc 库去调用 MetaWeblog API 接口。想起来之前学习过一点 .Text 程序,里面的确是支持 MetaWeblog API 的。而 cnblogs 和 donews 这一点类似,都基于 .Text 系统,具体就不知道各自修改的有什么区别了,因此对 MetaWeblog API 的支持估计也不一定相同。
之前没接触过 python 里的 xmlrpclib. 顺便翻看了一下 <Python CookBook> 电子书,发现第13章专门讲分布式编程的,很多相关内容。
RPC 接口的实现,通常有 CORBA, SOAP, XML-RPC 等几种。XML-RPC 在 python 中可以通过 xmlrpclib 包来方便的使用。
好了,今天先了解到这里。