AI/Video_cutter: 直播视频智能剪辑，剪辑输出口播视频、走秀视频 @ 0e34a6aa3a0e566214a3c24319d86226c594446c

直播视频智能剪辑，剪辑输出口播视频、走秀视频

Y 0e34a6aa3a create init		1 năm trước cách đây
__pycache__	0e34a6aa3a create init	1 năm trước cách đây
config	0e34a6aa3a create init	1 năm trước cách đây
data	0e34a6aa3a create init	1 năm trước cách đây
modules	0e34a6aa3a create init	1 năm trước cách đây
output	0e34a6aa3a create init	1 năm trước cách đây
utils	0e34a6aa3a create init	1 năm trước cách đây
main.py	0e34a6aa3a create init	1 năm trước cách đây
megrezo.py	0e34a6aa3a create init	1 năm trước cách đây
new_main.py	0e34a6aa3a create init	1 năm trước cách đây
oarl_cut.py	0e34a6aa3a create init	1 năm trước cách đây
oral_ui.py	0e34a6aa3a create init	1 năm trước cách đây
pipeline_state.json	0e34a6aa3a create init	1 năm trước cách đây
readme.md	0e34a6aa3a create init	1 năm trước cách đây
requirement.txt	0e34a6aa3a create init	1 năm trước cách đây
rm.sh	0e34a6aa3a create init	1 năm trước cách đây

视频解码测速：

1、ffmpeg：428 sec；解码出31帧；解码速度：0.072fps 2、opencv：410 sec；解码出30帧；解码速度：0.073fps 3、pyav：10N*FFMPEG sec；解码出30帧；解码速度：0.073/10N fps 4、moviepy：70 sec；解码出32帧；(并行加速多线程-28 sec)

句级别分析：

len: 8238 mean: 1697.2568584607914 max: 309620 min: 80 众数： 240 中位数： 1400.0 方差： 13340283.518631646

字级别分析：

len: 70337 mean: 175.30670912890798 max: 8735 min: 20 众数： 240 中位数： 180.0 方差： 4195.700049248078

TDDO:

1、抽帧筛查是否讲解同一件衣服，进行同品片段剪切。

1、同品片段进行STT，基于STT内容筛选口播视频片段。（需完成字幕添加）
2、基于STT内容和抽帧理解筛选走秀视频片段（姿态检测？）
3、LLM编导完整视频。

env: copywriter

流程：

1、抽帧，帧理解，裁切同款衣服视频片段（抽帧-单帧理解-两帧对比-同款裁切） 2、语音理解，查找关键口播片段进行裁切（STT-主播语句筛选-语句打标-口播语句筛选-口播视频片段拼接） 3、助播片段定位，查找走秀片段进行裁切（助播片段裁切-抽帧-单帧理解-走秀片段定位）

readme.md

视频解码测速：

句级别分析：

字级别分析：

TDDO:

env: copywriter

流程：