|
3 months ago | |
---|---|---|
__pycache__ | 3 months ago | |
config | 3 months ago | |
data | 3 months ago | |
modules | 3 months ago | |
output | 3 months ago | |
utils | 3 months ago | |
main.py | 3 months ago | |
megrezo.py | 3 months ago | |
new_main.py | 3 months ago | |
oarl_cut.py | 3 months ago | |
oral_ui.py | 3 months ago | |
pipeline_state.json | 3 months ago | |
readme.md | 3 months ago | |
requirement.txt | 3 months ago | |
rm.sh | 3 months ago |
这是一个用于视频内容分析和处理的系统,主要用于服装展示视频的智能剪辑和内容分析。
git clone [项目地址]
cd [项目目录]
pip install -r requirement.txt
sudo apt-get install ffmpeg
brew install ffmpeg
.
├── config/ # 配置文件目录
├── data/ # 数据目录
│ ├── raw_video/ # 原始视频
│ └── audio_json/ # 音频分析结果
├── modules/ # 核心功能模块
├── utils/ # 工具函数
├── output/ # 输出目录
└── logs/ # 日志文件
准备视频文件:
data/raw_video/
目录运行主程序:
python main.py
LLM辅助视频编排
性能优化
并行处理优化
GPU加速支持
内存使用优化
推荐使用conda环境:
conda create -n copywriter python=3.8
conda activate copywriter
1、抽帧筛查是否讲解同一件衣服,进行同品片段剪切。
1、同品片段进行STT,基于STT内容筛选口播视频片段。(需完成字幕添加)
2、基于STT内容和抽帧理解筛选走秀视频片段(姿态检测?)
3、LLM编导完整视频。
1、抽帧,帧理解,裁切同款衣服视频片段(抽帧-单帧理解-两帧对比-同款裁切) 2、语音理解,查找关键口播片段进行裁切(STT-主播语句筛选-语句打标-口播语句筛选-口播视频片段拼接) 3、助播片段定位,查找走秀片段进行裁切(助播片段裁切-抽帧-单帧理解-走秀片段定位)