usage_guide.md 6.0 KB

服装卖点文案生成系统优化指南

问题分析

你原来的系统存在以下问题:

  1. 字数经常超过500字符限制
  2. 重试机制简单,效果不佳
  3. 全局历史记录处理不当,可能干扰生成
  4. 缺乏后处理和验证机制
  5. 没有备用生成策略

解决方案总览

我们提供了多层次的优化方案

🎯 方案1:强化Prompt设计

  • 文件: improved_prompt.py
  • 特点: 更严格的字数控制,分层次的内容要求
  • 字数限制: 280字符(比原来更严格)
  • 结构化: 明确的字符数分配策略

🧠 方案2:智能历史记录管理

  • 文件: smart_history_manager.py
  • 特点:
    • 根据服装类别筛选相关历史记录
    • 避免重复的开头模式
    • 智能相关性评分
    • 只使用最相关的历史记录

🚀 方案3:增强生成器

  • 文件: enhanced_generator.py
  • 特点:
    • 多种生成策略(渐进式、模板式、精简式)
    • 严格的字数验证
    • 智能文本截断
    • 备用生成方案

🔧 方案4:集成到现有系统

  • 文件: chat.py (已修改)
  • 特点: 向后兼容,渐进式升级

使用方法

基础使用(推荐)

# 在你的 chat.py 中,generate_text 函数已经自动集成了所有优化
# 无需修改调用方式,直接使用即可

en, kw = generate_text(
    plm_info="商品信息",
    img="图片URL", 
    graphic_label=["标签1", "标签2"]
)

高级使用(手动控制)

from enhanced_generator import EnhancedTextGenerator
from llm import llm_request

# 创建LLM客户端
llm = llm_request(api_key, base_url, model)

# 获取全局历史记录
global_history = get_global_history()

# 创建增强生成器
generator = EnhancedTextGenerator(
    llm_client=llm,
    max_chars=280,  # 字数限制
    max_retries=5,  # 重试次数
    global_history=global_history
)

# 生成文案
en, kw = generator.generate_with_strategy(
    plm_info="商品信息",
    img="图片URL",
    graphic_label=["标签"],
    strategy="progressive"  # 可选: "progressive", "template", "concise"
)

生成策略说明

1. Progressive Strategy (渐进式) - 推荐

  • 从宽松到严格的字数要求
  • 智能历史记录处理
  • 多次尝试,逐步优化

2. Template Strategy (模板式)

  • 使用预定义模板
  • 适合特定风格需求
  • 模板类型:casual, luxury, functional

3. Concise Strategy (精简式)

  • 直接使用最严格限制
  • 适合对字数要求极严格的场景

核心改进特性

✅ 严格字数控制

  • 硬限制: 280字符(包括标点和空格)
  • 智能截断: 在句号、逗号、空格处截断,保持语义完整
  • 多层验证: 生成前、生成中、生成后三重验证

✅ 智能历史记录处理

  • 类别匹配: 只参考相同类别的服装历史记录
  • 避免重复: 自动识别和避免重复的开头模式
  • 相关性评分: 根据面料、风格、情感词汇计算相关性

✅ 增强重试机制

  • 渐进式prompt: 每次重试使用更严格的prompt
  • 多策略切换: 失败时自动切换生成策略
  • 备用方案: 所有策略失败时使用规则生成

✅ 后处理优化

  • 格式标准化: 确保JSON格式正确
  • 关键词处理: 自动格式化关键词列表
  • 中英文检测: 自动翻译混合文本

配置参数

字数控制

max_chars = 280  # 最大字符数(推荐280)
min_chars = 50   # 最小字符数(避免过短)

历史记录

max_history = 50        # 最大历史记录数
max_relevant = 8        # 最大相关历史记录数
max_avoid_patterns = 15 # 最大避免模式数

重试策略

max_retries = 5  # 最大重试次数
char_limits = [300, 280, 260, 240, 220]  # 渐进式字数限制

监控和调试

日志输出

系统会输出详细的生成过程日志:

✅ 增强生成成功: 275 字符
⚠️ 第2次尝试:文案过长(320字符),进行截断
🔄 所有尝试失败,生成备用文案

性能指标

  • 成功率: 应该达到95%以上
  • 字数合规率: 应该达到100%
  • 平均重试次数: 应该在2次以内

故障排除

问题1:仍然超过字数限制

原因: prompt设计或截断逻辑问题 解决: 检查 smart_truncate 函数,调整 max_chars 参数

问题2:生成质量下降

原因: 字数限制过严格 解决: 适当放宽 max_chars 到300-320

问题3:历史记录干扰

原因: 历史记录过多或不相关 解决: 调整 max_relevant 参数,清理历史记录

问题4:生成失败率高

原因: 网络问题或模型问题 解决: 检查API连接,增加重试次数

最佳实践

1. 字数设置

  • 电商平台: 280字符(推荐)
  • 社交媒体: 200字符
  • 详细描述: 350字符

2. 历史记录管理

  • 定期清理: 保持50条以内
  • 分类存储: 按服装类别分别存储
  • 质量筛选: 只保留高质量的历史记录

3. 监控优化

  • 定期检查: 每周检查生成质量
  • A/B测试: 对比不同策略的效果
  • 用户反馈: 收集用户对文案质量的反馈

升级路径

阶段1:基础集成(当前)

  • 使用修改后的 chat.py
  • 自动字数控制和截断

阶段2:智能优化

  • 启用智能历史记录管理
  • 使用增强生成器

阶段3:深度定制

  • 根据业务需求调整模板
  • 添加特定行业词汇
  • 优化生成策略

总结

这套优化方案通过多层次、多策略的方法,有效解决了:

  • ✅ 字数超限问题(通过严格验证和智能截断)
  • ✅ 生成失败问题(通过多策略重试和备用方案)
  • ✅ 历史记录干扰问题(通过智能筛选和相关性匹配)
  • ✅ 质量不稳定问题(通过结构化prompt和后处理)

预期效果

  • 字数合规率:100%
  • 生成成功率:95%+
  • 文案质量:显著提升
  • 重复率:大幅降低