# AI问答系统

这是一个基于LangChain和向量数据库的智能问答系统，支持多种LLM模型接入，具有知识库检索和对话记忆功能。

## 功能特点

- 支持多种LLM模型接入（豆包、DeepSeek等）
- 基于向量数据库的知识库检索
- 对话记忆功能
- 意图识别和分类
- RESTful API接口

## 环境要求

- Python 3.8+
- CUDA支持（用于FAISS-GPU）
- 虚拟环境：tool

## 安装部署

1. 克隆项目并安装依赖：
```bash
git clone [项目地址]
cd [项目目录]
pip install -r requirements.txt
```

2. 配置环境变量：
创建`.env`文件并配置以下参数：
```
LLM_API_KEY=your_api_key
LLM_BASE_URL=your_base_url
```

3. 运行服务：
```bash
# 开发环境运行
python app.py

# 生产环境部署（使用Gunicorn）
gunicorn -w 1 -b 0.0.0.0:1111 app:app

# 使用配置文件部署
gunicorn -c gunicorn_config.py app:app
```

## 模型配置

### 豆包模型
```json
{
    "llm_model_name": "ep-20241018084532-cgm84",
    "llm_api_key": "your_api_key",
    "llm_base_url": "https://ark.cn-beijing.volces.com/api/v3"
}
```

### DeepSeek模型
```json
{
    "llm_model_name": "deepseek-r1-250120",
    "llm_api_key": "your_api_key",
    "llm_base_url": "https://ark.cn-beijing.volces.com/api/v3"
}
```

## 项目结构

```
├── app.py                 # 主应用入口
├── config/               # 配置文件目录
├── database/            # 数据库相关
├── module/              # 核心模块
├── models/              # 模型文件
├── test_case/           # 测试用例
├── utils/               # 工具函数
├── vectordb/            # 向量数据库
├── logs/                # 日志文件
└── test_result/         # 测试结果
```

## 开发计划

- [x] 知识库向量持久化
- [x] 意图分类系统
- [x] 对话记忆模块
- [ ] 检察官机器人
- [ ] 完善知识库文件读取方法

## 注意事项

1. 确保环境变量正确配置
2. 知识库文件需要提前处理并导入
3. 建议使用GPU环境运行以提高性能
4. 定期备份向量数据库