像素到边界、轮廓,到特征构件,一级一级到整体。训练就是猜哪样布置像素,能够一级一级成型到整体。手正面张开特征明显,侧面观察加上光影就复杂模糊了。如果不知道三维,不从结构出发,照猫画虎,就是现在的结果。视频更加是,只是像素累积到整体,再加了动态纬度。既不理解三维,也不理解物理逻辑,只是素材是那样的像素转换,显得好像“真”。