Bladeren bron

correct readme

Y 3 maanden geleden
bovenliggende
commit
5825361b14
2 gewijzigde bestanden met toevoegingen van 123 en 1 verwijderingen
  1. 114 0
      readme.md
  2. 9 1
      requirement.txt

+ 114 - 0
readme.md

@@ -1,3 +1,117 @@
+# 视频内容分析与处理系统
+
+这是一个用于视频内容分析和处理的系统,主要用于服装展示视频的智能剪辑和内容分析。
+
+## 功能特点
+
+- 视频帧提取与分析
+- 语音识别与内容分析
+- 智能视频剪辑
+- 多场景视频拼接
+- 音频处理与配乐
+
+## 系统要求
+
+- Python 3.8+
+- FFmpeg
+- CUDA (可选,用于GPU加速)
+
+## 安装步骤
+
+1. 克隆项目到本地:
+```bash
+git clone [项目地址]
+cd [项目目录]
+```
+
+2. 安装依赖:
+```bash
+pip install -r requirement.txt
+```
+
+3. 安装FFmpeg:
+- Windows: 下载并添加到系统环境变量
+- Linux: `sudo apt-get install ffmpeg`
+- Mac: `brew install ffmpeg`
+
+## 项目结构
+
+```
+.
+├── config/          # 配置文件目录
+├── data/           # 数据目录
+│   ├── raw_video/  # 原始视频
+│   └── audio_json/ # 音频分析结果
+├── modules/        # 核心功能模块
+├── utils/          # 工具函数
+├── output/         # 输出目录
+└── logs/           # 日志文件
+```
+
+## 使用说明
+
+1. 准备视频文件:
+   - 将待处理的视频文件放入 `data/raw_video/` 目录
+
+2. 运行主程序:
+```bash
+python main.py
+```
+
+3. 处理流程:
+   - 视频帧提取与分析
+   - 同款服装片段识别
+   - 口播内容分析
+   - 走秀片段识别
+   - 最终视频合成
+
+## 性能指标
+
+### 视频解码性能
+- FFmpeg: 428秒,31帧,0.072fps
+- OpenCV: 410秒,30帧,0.073fps
+- PyAV: 10N*FFMPEG秒,30帧,0.073/10N fps
+- MoviePy: 70秒,32帧(并行加速多线程-28秒)
+
+### 文本分析指标
+- 句级别分析:
+  - 平均长度:1697.26
+  - 最大长度:309620
+  - 最小长度:80
+  - 中位数:1400.0
+
+- 字级别分析:
+  - 平均长度:175.31
+  - 最大长度:8735
+  - 最小长度:20
+  - 中位数:180.0
+
+## 开发计划
+
+1. 同品片段智能识别
+   - 基于STT的内容筛选
+   - 走秀视频片段识别
+   - LLM辅助视频编排
+
+2. 性能优化
+   - 并行处理优化
+   - GPU加速支持
+   - 内存使用优化
+
+## 环境配置
+
+推荐使用conda环境:
+```bash
+conda create -n copywriter python=3.8
+conda activate copywriter
+```
+
+## 注意事项
+
+- 确保有足够的磁盘空间用于视频处理
+- 建议使用GPU进行加速处理
+- 处理大文件时注意内存使用
+
 ## 视频解码测速:
 1、ffmpeg:428 sec;解码出31帧;解码速度:0.072fps
 2、opencv:410 sec;解码出30帧;解码速度:0.073fps

+ 9 - 1
requirement.txt

@@ -3,4 +3,12 @@ torch==2.1.2
 torchvision==0.16.2
 transformers==4.40.0
 sentencepiece==0.1.99
-decord
+decord==0.6.0
+opencv-python==4.8.1.78
+numpy==1.24.3
+moviepy==1.0.3
+ffmpeg-python==0.2.0
+pydub==0.25.1
+python-dotenv==1.0.0
+tqdm==4.66.1
+loguru==0.7.2