|
3 tháng trước cách đây | |
---|---|---|
__pycache__ | 3 tháng trước cách đây | |
config | 3 tháng trước cách đây | |
data | 3 tháng trước cách đây | |
modules | 3 tháng trước cách đây | |
output | 3 tháng trước cách đây | |
utils | 3 tháng trước cách đây | |
main.py | 3 tháng trước cách đây | |
megrezo.py | 3 tháng trước cách đây | |
new_main.py | 3 tháng trước cách đây | |
oarl_cut.py | 3 tháng trước cách đây | |
oral_ui.py | 3 tháng trước cách đây | |
pipeline_state.json | 3 tháng trước cách đây | |
readme.md | 3 tháng trước cách đây | |
requirement.txt | 3 tháng trước cách đây | |
rm.sh | 3 tháng trước cách đây |
1、ffmpeg:428 sec;解码出31帧;解码速度:0.072fps 2、opencv:410 sec;解码出30帧;解码速度:0.073fps 3、pyav:10N*FFMPEG sec;解码出30帧;解码速度:0.073/10N fps 4、moviepy:70 sec;解码出32帧;(并行加速多线程-28 sec)
len: 8238 mean: 1697.2568584607914 max: 309620 min: 80 众数: 240 中位数: 1400.0 方差: 13340283.518631646
len: 70337 mean: 175.30670912890798 max: 8735 min: 20 众数: 240 中位数: 180.0 方差: 4195.700049248078
1、抽帧筛查是否讲解同一件衣服,进行同品片段剪切。
1、同品片段进行STT,基于STT内容筛选口播视频片段。(需完成字幕添加)
2、基于STT内容和抽帧理解筛选走秀视频片段(姿态检测?)
3、LLM编导完整视频。
1、抽帧,帧理解,裁切同款衣服视频片段(抽帧-单帧理解-两帧对比-同款裁切) 2、语音理解,查找关键口播片段进行裁切(STT-主播语句筛选-语句打标-口播语句筛选-口播视频片段拼接) 3、助播片段定位,查找走秀片段进行裁切(助播片段裁切-抽帧-单帧理解-走秀片段定位)