• HLSL bytecode to GLSL编译器的第一步


    转载请注明出处为KlayGE游戏引擎,本文地址为http://www.klayge.org/2012/02/09/hlsl-bytecode-to-glsl%e7%bc%96%e8%af%91%e5%99%a8%e7%9a%84%e7%ac%ac%e4%b8%80%e6%ad%a5/

    从KlayGE 4.0开始,不但有为了下一版本开发的短期任务,还有一些中长期研发的任务。其中之一就是HLSL bytecode to GLSL编译器。 现在KlayGE里的shader主要由HLSL写成,通过#ifdef的土办法兼容Cg。对D3D11来说可以直接使用,但对于OpenGL和 OpenGL ES 2就得大费周折了。那种情况下,shader需要经过Cg编译器编译成传统的GLSL,在经过我自己的token级别的编译器转换成现代的GLSL,然后 才能使用。

    为什么不直接用Cg?看看Cg runtime在ATI卡上的表现吧。

    为什么不用传统的GLSL?NV的驱动有一套attribute和index之间的绑定规则,比如gl_Position一定是 0,gl_Normal一定是6(或者某个数,但是个常量),而且无法通过API来获取预定义attribute的index。这套规则在ATI卡上是不 可用的。现代的GLSL没有预定义的attribute和varing(除了position),所以都可以给定attribute名来获取index, 兼容性好得多。

    所以,这里更好的解决方案是把不通过Cg编译器,就把HLSL编译成GLSL。目前有一些能做到这件事情的库,比如AMD的hlsl2glsl(已经停止开发),unity的hlsl2glsl fork(从AMD的发展而来),以及mojoshader。他们的问题在于,只支持到了SM3,对KlayGE来说连最低要求都没达到。只能自己做一个编译器。

    如果需要把HLSL直接编译成GLSL,就需要做HLSL的解析等事,既麻烦又不能保证效率。所以我选择了把HLSL编译产生的bytecode解 析出来,生成GLSL。因为HLSL->bytecode可以直接用现成的编译器,省了很多麻烦。(即便是linux上,也可以用wine来执行 d3dx的HLSL编译)

    方案明确后,步骤也就能很快定义出来:

    1. D3D11 bytecode反汇编
    2. VS/PS to GLSL
    3. GS/HS/DS to GLSL

    在参考了mesa的d3d1x for linux之后,目前已经实现了第一步,反汇编器。下面一段VS:

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    void DeferredRenderingVS(float4 pos : POSITION,
    #ifdef NOPERSPECTIVE_SUPPORT
                    out noperspective float2 oTc : TEXCOORD0,
    #else
                    out float3 oTc : TEXCOORD0,
    #endif
                    out float3 oViewDir : TEXCOORD1,
                    out float4 oPos : SV_Position)
    {
        oPos = mul(pos, light_volume_mvp);

        oViewDir = mul(pos, light_volume_mv).xyz;
        oTc.xy = oPos.xy / oPos.w * 0.5f;
        oTc.y *= KLAYGE_FLIPPING;
        oTc.xy += 0.5f;

    #ifndef NOPERSPECTIVE_SUPPORT
        oTc.z = oPos.w;
        oTc.xy *= oTc.z;
    #endif
    }

    经过fxc编译成vs_5_0后,可以用我的disasm反汇编出

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    vs_5_0
    dcl_global_flags refactoringAllowed
    dcl_constant_buffer cb0[12].xyzw, immediateIndexed
    dcl_input v0.xyzw
    dcl_output o0.xy
    dcl_output o1.xyz
    dcl_output_siv o2.xyzw, position
    dcl_temps 2
    dp4 r0.x, v0.xyzw, cb0[8].xyzw
    dp4 r0.y, v0.xyzw, cb0[9].xyzw
    dp4 r0.w, v0.xyzw, cb0[11].xyzw
    div r1.xy, r0.xyxx, r0.wwww
    mov o2.xyw, r0.xyxw
    mad o0.xy, r1.xyxx, l(0.5, -0.5, 0, 0), l(0.5, 0.5, 0, 0)
    dp4 o1.x, v0.xyzw, cb0[4].xyzw
    dp4 o1.y, v0.xyzw, cb0[5].xyzw
    dp4 o1.z, v0.xyzw, cb0[6].xyzw
    dp4 o2.z, v0.xyzw, cb0[10].xyzw
    ret

    与fxc的反汇编结果完全一致。ps_5_0的测试也可以通过。

    HLSL bytecode to GLSL编译器的第一步算是迈出了,接下去我会开始尝试一些GLSL VS/PS的生成工作。

  • 相关阅读:
    Redis键是如何过期删除的
    使用EventBus + Redis发布订阅模式提升业务执行性能(下)
    使用EventBus + Redis发布订阅模式提升业务执行性能
    使用C#的计时器加观察者模式完成报警推送需求
    Go 语言入门教程:变量
    Go 语言入门教程:安装
    Docker 入门:Dockerfile
    Docker 入门:容器
    Docker 入门:什么是 Docker ?
    Windows 系统如何安装 Docker
  • 原文地址:https://www.cnblogs.com/gongminmin/p/2343798.html
Copyright © 2020-2023  润新知