直播视频智能剪辑，剪辑输出口播视频、走秀视频

Y 50e5eb154c correct readme third		11 months ago
__pycache__	0e34a6aa3a create init	11 months ago
config	0e34a6aa3a create init	11 months ago
data	0e34a6aa3a create init	11 months ago
modules	0e34a6aa3a create init	11 months ago
output	0e34a6aa3a create init	11 months ago
utils	0e34a6aa3a create init	11 months ago
main.py	0e34a6aa3a create init	11 months ago
megrezo.py	0e34a6aa3a create init	11 months ago
new_main.py	0e34a6aa3a create init	11 months ago
oarl_cut.py	0e34a6aa3a create init	11 months ago
oral_ui.py	0e34a6aa3a create init	11 months ago
pipeline_state.json	0e34a6aa3a create init	11 months ago
readme.md	50e5eb154c correct readme third	11 months ago
requirement.txt	5825361b14 correct readme	11 months ago
rm.sh	0e34a6aa3a create init	11 months ago

视频内容分析与处理系统

这是一个用于视频内容分析和处理的系统，主要用于服装展示视频的智能剪辑和内容分析。

功能特点

视频帧提取与分析
语音识别与内容分析
智能视频剪辑
多场景视频拼接
音频处理与配乐

系统要求

Python 3.8+
FFmpeg
CUDA (可选，用于GPU加速)

安装步骤

克隆项目到本地：

git clone [项目地址]
cd [项目目录]

安装依赖：

pip install -r requirement.txt

安装FFmpeg：
Windows: 下载并添加到系统环境变量
Linux: sudo apt-get install ffmpeg
Mac: brew install ffmpeg

项目结构

.
├── config/          # 配置文件目录
├── data/           # 数据目录
│   ├── raw_video/  # 原始视频
│   └── audio_json/ # 音频分析结果
├── modules/        # 核心功能模块
├── utils/          # 工具函数
├── output/         # 输出目录
└── logs/           # 日志文件

使用说明

准备视频文件：
- 将待处理的视频文件放入 data/raw_video/ 目录
运行主程序：
```
python main.py
```
1. 处理流程：
2. 视频帧提取与分析
3. 同款服装片段识别
4. 口播内容分析
5. 走秀片段识别
6. 最终视频合成
开发计划
1. 同品片段智能识别
2. 基于STT的内容筛选
3. 走秀视频片段识别
4. LLM辅助视频编排
5. 性能优化
6. 并行处理优化
7. GPU加速支持
8. 内存使用优化
环境配置

推荐使用conda环境：
```
conda create -n copywriter python=3.8
conda activate copywriter
```

注意事项

确保有足够的磁盘空间用于视频处理
建议使用GPU进行加速处理
处理大文件时注意内存使用

TDDO:

1、抽帧筛查是否讲解同一件衣服，进行同品片段剪切。

1、同品片段进行STT，基于STT内容筛选口播视频片段。（需完成字幕添加）
2、基于STT内容和抽帧理解筛选走秀视频片段（姿态检测？）
3、LLM编导完整视频。

env: copywriter

流程：

1、抽帧，帧理解，裁切同款衣服视频片段（抽帧-单帧理解-两帧对比-同款裁切） 2、语音理解，查找关键口播片段进行裁切（STT-主播语句筛选-语句打标-口播语句筛选-口播视频片段拼接） 3、助播片段定位，查找走秀片段进行裁切（助播片段裁切-抽帧-单帧理解-走秀片段定位）

readme.md