一段声音
一串文字
时间对应
如果不分析音频
无论走句子 还是走单个字
都是基于线性的
但是
声音的发声长度与自字符串长度 是非线性的、、、、
难道统计表明 以句子长度为单位,单个字符串的发音时间均值为定值吗??
no