我发起并创立了一个 C 语言编译器开源项目 InnerC

本文是 VMBC / D# 项目的系列文章，

有关 VMBC / D# ，见《我发起并创立了一个 VMBC 的子项目 D#》（以下简称《D#》） https://www.cnblogs.com/KSongKing/p/10348190.html 。

VMBC 需要一个内置的 C 编译器，想来想去，觉得还是自己写一个，

计划用 C 语言写，因为 VMBC 的 C 编译器要求是一个本地库，如果不要求是本地库，我就用 C# 写了，呵呵呵。

为什么是库呢？因为这是一个内置编译器，是由 ILBC 运行时来调用的（ILBC 见《D#》），所以是一个库。

这个库最好能尽可能的小。

C 语言写的代码是最贴近底层（汇编）的，所以 C 语言写的库应该是最紧凑的，所以用 C 语言来写。

还有一个原因是，我会的语言不多， C 算是相对更熟一点的， So 。

有网友说 C 语言不适合写编译器， C 的抽象太低了，建议用函数式语言写，

又举例 Rust 最早是用 OCaml 写的，然后又用 Rust 写了一遍。

好吧，但 Rust 、OCaml 这些语言的名字我都没怎么听过，还是用 C 吧。

另外用 C 的话，应该不用担心操作系统的支持的问题。

这个项目我只实现语法分析和类型检查的部分，语法分析包含了语法检查。

生成目标代码链接（链接外部库）这 2 个部分大家如果有兴趣，对汇编和操作系统了解的话，可以来补充。

InnerC 是 ansi C 的子集 + 扩展，只支持 ansi C 的部分特性，同时还会加入一些新特性。

总的来说， InnerC 会比 ansi C 简单。

比如， InnerC 不支持结构体（Struct），因为 InnerC 是作为中间语言，只需要是一种 “高级汇编语言” 就可以。

不用 Struct，那用什么？

用数组，包括静态数组和从堆里分配的数组。

根据偏移量向数组的相应位置写入字段的值，这就是 Struct，也是对象。

去掉 Struct 可以省掉不少语法分析的开销和人力上的研发成本。

但 C 语言里好像没有按值传递数组的特性，所以 InnerC 需要加入按值传递数组（拷贝传递数组）的特性。

比如， InnerC 应该增加 T [ n ] 类型，用于参数和返回值，

T [ n ] 类型表示按值传递数组（拷贝传递数组），

假设 A() 方法调用 B() 方法， B() 方法有一个 T [ n ] arr 参数，那么 A() 方法传给 T [ n ] arr 参数的是一个数组的首地址 arr，编译器会处理成把 A() 里的 arr 数组以长度 n 拷贝到 B() 的 arr 里，所以 B() 的 arr 也是数组的首地址，但是是拷贝到 B() 的堆栈里的数组的首地址。

T [ n ] arr 表示 arr 参数是长度为 n 的数组，编译器会为 arr 在 B 的堆栈里分配长度为 n * sizeof(T) 的内存空间。这个空间是编译器分配的，是静态分配的，等价于声明一个 T arr[ n ] 这样的静态数组。

同理，假设 B() 的返回值是 T [ n ] 类型， B() 实际返回的是一个数组的首地址 arr， A() 里用来接收 B() 的返回值的是一个 T arr[ n ] arr ; 静态数组变量，编译器会处理成把 B() 里的 arr 数组以长度 n 拷贝到 A() 的 arr 里。

InnerC 也不支持对函数指针进行类型检查，

不对函数指针类型检查是指函数指针可以调用任意的参数列表，当然，出了错是调用者自己负责。^^

不过对于中间语言来说，基本上不用担心这个问题。

InnerC 的语法分析可以生成一个表达式对象树，把表达式对象树序列化得到一个 byte [] （byte 数组），

这个 byte[] 就相当于 .Net 的 Op Code，或者 java 的 Byte Code，我们可以把这个 byte[] 称为 ILBC Byte Code （简称 Byte Code）。

这样一来，问题就明朗了，

如果开发期编译生成的目标代码就是 ILBC Byte Code，那 JIT 速度较慢的问题就解决了。

这就是说，可以把 C 语言作为第一级中间代码， Byte Code 作为第二级中间代码。

这样， InnerC 就可以由 2 个模块组成：

1 InnerC to Byte Code

2 Byte Code to Native Code

当然，可以在开发期编译直接生成 Native Code （本地代码），这是 AOT 。

原文地址：https://www.cnblogs.com/KSongKing/p/10352273.html

我发起并创立了一个 C 语言编译器 开源项目 InnerC

我发起并创立了一个 C 语言编译器开源项目 InnerC