qa.txt 1006 B

1234567891011121314151617181920212223242526272829
  1. # 直接Gunicorn服务部署指令:
  2. gunicorn -w 1 -b 0.0.0.0:1111 app:app
  3. # 基于Gunicorn配置文件服务部署指令:
  4. gunicorn -c gunicorn_config.py app:app
  5. # 主程序运行:
  6. conda activate tool
  7. python online_run.py
  8. # 模型配置:
  9. ## doubao:
  10. "llm_model_name": "ep-20241018084532-cgm84", deepseek-v3-241226
  11. "llm_api_key": "817dff39-5586-4f9b-acba-55004167c0b1",
  12. "llm_base_url": "https://ark.cn-beijing.volces.com/api/v3",
  13. ## ds_r1:
  14. "llm_model_name": "deepseek-r1-250120",
  15. "llm_api_key": "817dff39-5586-4f9b-acba-55004167c0b1",
  16. "llm_base_url": "https://ark.cn-beijing.volces.com/api/v3",
  17. ## TODO:
  18. 1、知識庫向量持久化。【DONE】(√)
  19. 2、通过意图类别来命中各类问题的系统提示词,而不需要开发多个机器人。(√)
  20. 3、加入记忆模块。ConversationBufferMemory / ConversationBufferWindowMemory / ConversationSummaryBufferMemory (√)
  21. 4、加入检察官机器人。
  22. 5、修改rag_config.py,完善读取知识库文件方法
  23. ## 虚拟环境:tool