近期看了一些软件抽象为复杂网络,以及软件抽象成静态语法树的文章。做一个小总结。
1.复杂网络是由大量的边和点组成的,边点都可以有类型,加权值,边还可以有方向。如何计算边和点的权值是一个关键点,如何在不执行代码的情况下确定边的方向,目前不确定是否已经解决。
有许多工具,可以直接扫描软件源代码,抽象为复杂网络。然而我还没亲身实践,且做个记录。
Dependency Finder分析编译后的java代码,能够提取依赖图。
Doxygen是使用c++开发的基于源代码注释的文档生成工具。但是这个注释,是人为添加的,还是源码中自带的【字面理解是后一种】
2.抽象语法树(AST)是源码到目标代码编译的一种中间形式。
工具如ANTLR