最近一直在研究文生视频文生视频VS对话式的文字解答最大的区别在哪里?你要产生一段1分钟的4K 30FPS的视频 大约需要330MB一万个汉字占用两万字节,即20KB这是几何倍数的增长那么 文生视频 需求在哪里?答案 还是在推理端