před 10 měsíci · 59cf601c8f
--- a/data_processor/combined_sales_exporter.py
+++ b/data_processor/combined_sales_exporter.py
@@ -0,0 +1,74 @@
 
															+from openpyxl import Workbook
														
 
															+from openpyxl.utils import get_column_letter
														
 
															+from openpyxl.utils.dataframe import dataframe_to_rows
														
 
															+
														
 
															+from data_processor.daily_sales_exporter import DailySalesExporter
														
 
															+from data_processor.daily_zones_exporter import DailyZonesSalesExporter
														
 
															+
														
 
															+
														
 
															+class CombinedSalesExporter:
														
 
															+    def __init__(self, daily_sales_exporter: DailySalesExporter, daily_zones_sales_exporter: DailyZonesSalesExporter):
														
 
															+        self.daily_sales_exporter = daily_sales_exporter
														
 
															+        self.daily_zones_sales_exporter = daily_zones_sales_exporter
														
 
															+
														
 
															+    def export(self, output_file='combined_output.xlsx'):
														
 
															+        sales_df = self.daily_sales_exporter.export_to_dataframe()
														
 
															+        zones_df = self.daily_zones_sales_exporter.export_to_dataframe()
														
 
															+
														
 
															+        wb = Workbook()
														
 
															+        ws = wb.active
														
 
															+
														
 
															+        start_row_sales = 1
														
 
															+        # 写入第一个 DataFrame（DailySalesExporter）
														
 
															+        for r in dataframe_to_rows(sales_df, index=False, header=True):
														
 
															+            ws.append(r)
														
 
															+        end_row_sales = ws.max_row
														
 
															+
														
 
															+        # 添加 3 行空行
														
 
															+        for _ in range(3):
														
 
															+            ws.append([])
														
 
															+
														
 
															+        # 记录当前行号，用于格式化设置
														
 
															+        start_row_for_zones_header = end_row_sales + 1 + 3  # 第二个表头行号
														
 
															+        start_row_for_zones_data = start_row_for_zones_header + 1  # 第二个表数据起始行
														
 
															+
														
 
															+        # 写入第二个 DataFrame（DailyZonesSalesExporter），包含表头
														
 
															+        for r in dataframe_to_rows(zones_df, index=False, header=True):
														
 
															+            ws.append(r)
														
 
															+
														
 
															+        # 设置格式化（分别应用到两个区域）
														
 
															+        self._apply_formatting(ws, sales_df, start_row=start_row_sales + 1, header_row=start_row_sales)
														
 
															+        self._apply_formatting(ws, zones_df, start_row=start_row_for_zones_data, header_row=start_row_for_zones_header)
														
 
															+
														
 
															+        # 保存文件
														
 
															+        wb.save(output_file)
														
 
															+        print(f"✅ 数据已成功导出到 {output_file}")
														
 
															+
														
 
															+    def _apply_formatting(self, ws, df, start_row=2, header_row=1):
														
 
															+        """
														
 
															+        :param ws: worksheet 对象
														
 
															+        :param df: 数据 DataFrame
														
 
															+        :param start_row: 数据开始的行号（数据从该行开始应用格式）
														
 
															+        :param header_row: 表头所在行号（用于匹配列名）
														
 
															+        """
														
 
															+        header = {cell.value: cell.column for cell in ws[header_row]}
														
 
															+        numeric_columns = [
														
 
															+            '999及以内单数', '1000-1999单数', '2000-2899单数', '2900-3999单数',
														
 
															+            '4000-4999单数', '5000-7999单数', '8000以上单数', '满足奖励条件大单数',
														
 
															+            '最大单件数', '最大单金额', '总单数', '2000+单数'
														
 
															+        ]
														
 
															+
														
 
															+        for col_name in numeric_columns:
														
 
															+            if col_name in header:
														
 
															+                col_letter = get_column_letter(header[col_name])
														
 
															+                for row in range(start_row, ws.max_row + 1):
														
 
															+                    cell = ws[f"{col_letter}{row}"]
														
 
															+                    cell.number_format = '0'
														
 
															+
														
 
															+        if '2000+单数占比' in header:
														
 
															+            col_letter = get_column_letter(header['2000+单数占比'])
														
 
															+            for row in range(start_row, ws.max_row + 1):
														
 
															+                cell = ws[f"{col_letter}{row}"]
														
 
															+                cell.number_format = '0.00%'
														
 
															+
														
 
															+
														
--- a/data_processor/daily_sales_exporter.py
+++ b/data_processor/daily_sales_exporter.py
@@ -0,0 +1,161 @@
 
															+import mysql.connector
														
 
															+import pandas as pd
														
 
															+from openpyxl import Workbook
														
 
															+from openpyxl.utils.dataframe import dataframe_to_rows
														
 
															+from openpyxl.utils import get_column_letter
														
 
															+
														
 
															+
														
 
															+class DailySalesExporter:
														
 
															+    def __init__(self, db_config):
														
 
															+        self.db_config = db_config
														
 
															+        self.query = """
														
 
															+SELECT *, IF(temp.`总单数` = 0, 0, temp.`2000+单数` / temp.`总单数`) AS `2000+单数占比`, WEEK(temp.`单据日期`, 1) AS `第几周` 
														
 
															+FROM (
														
 
															+    SELECT
														
 
															+        t1.document_date AS 单据日期,
														
 
															+        SUM(CASE WHEN t1.remaining_amount_after_return <= 999 THEN 1 ELSE 0 END) AS `999及以内单数`,
														
 
															+        SUM(CASE WHEN t1.remaining_amount_after_return > 999 AND t1.remaining_amount_after_return < 2000 THEN 1 ELSE 0 END) AS `1000-1999单数`,
														
 
															+        SUM(CASE WHEN t1.remaining_amount_after_return >= 2000 AND t1.remaining_amount_after_return <= 2899 THEN 1 ELSE 0 END) AS `2000-2899单数`,
														
 
															+        SUM(CASE WHEN t1.remaining_amount_after_return > 2899 AND t1.remaining_amount_after_return <= 3999 THEN 1 ELSE 0 END) AS `2900-3999单数`,
														
 
															+        SUM(CASE WHEN t1.remaining_amount_after_return > 3999 AND t1.remaining_amount_after_return <= 4999 THEN 1 ELSE 0 END) AS `4000-4999单数`,
														
 
															+        SUM(CASE WHEN t1.remaining_amount_after_return > 4999 AND t1.remaining_amount_after_return <= 7999 THEN 1 ELSE 0 END) AS `5000-7999单数`,
														
 
															+        SUM(CASE WHEN t1.remaining_amount_after_return > 7999 THEN 1 ELSE 0 END) AS `8000以上单数`,
														
 
															+        SUM(CASE WHEN t2.refund_meets_big_order != '不符合' THEN 1 ELSE 0 END) AS `满足奖励条件大单数`,
														
 
															+        MAX(t2.big_order_items) AS `最大单件数`,
														
 
															+        MAX(t2.big_order_amount) AS `最大单金额`,
														
 
															+        COUNT(1) AS `总单数`,
														
 
															+        SUM(CASE WHEN t1.remaining_amount_after_return >= 2000 THEN 1 ELSE 0 END) AS `2000+单数`
														
 
															+    FROM sd_sales_order AS t1
														
 
															+    LEFT JOIN sd_big_sales_order AS t2 ON t1.sale_id = t2.sale_id
														
 
															+    GROUP BY t1.document_date
														
 
															+) AS temp;
														
 
															+"""
														
 
															+
														
 
															+    def export(self, output_file='output_with_weekly_summary.xlsx'):
														
 
															+        global cursor, connection
														
 
															+        try:
														
 
															+            connection = mysql.connector.connect(**self.db_config)
														
 
															+            cursor = connection.cursor()
														
 
															+            cursor.execute(self.query)
														
 
															+            rows = cursor.fetchall()
														
 
															+            columns = [desc[0] for desc in cursor.description]
														
 
															+        finally:
														
 
															+            cursor.close()
														
 
															+            connection.close()
														
 
															+
														
 
															+        df = pd.DataFrame(rows, columns=columns)
														
 
															+        df['单据日期'] = pd.to_datetime(df['单据日期'])
														
 
															+        df = df.sort_values('单据日期').reset_index(drop=True)
														
 
															+
														
 
															+        weekly_summary = df.groupby('第几周').agg({
														
 
															+            col: 'sum' for col in df.columns if col not in ['单据日期', '2000+单数占比', '第几周']
														
 
															+        }).reset_index()
														
 
															+
														
 
															+        weekly_summary['2000+单数'] = pd.to_numeric(weekly_summary['2000+单数'], errors='coerce')
														
 
															+        weekly_summary['总单数'] = pd.to_numeric(weekly_summary['总单数'], errors='coerce')
														
 
															+        weekly_summary['2000+单数占比'] = (weekly_summary['2000+单数'] / weekly_summary['总单数']).fillna(0).round(4)
														
 
															+
														
 
															+        new_data = []
														
 
															+        current_week = None
														
 
															+
														
 
															+        for _, row in df.iterrows():
														
 
															+
														
 
															+            week_group = row['第几周']
														
 
															+
														
 
															+            if current_week != week_group and current_week is not None:
														
 
															+                summary_row = weekly_summary[weekly_summary['第几周'] == current_week].iloc[0].to_dict()
														
 
															+                start_date = df[df['第几周'] == current_week]['单据日期'].min().strftime('%m-%d')
														
 
															+                end_date = df[df['第几周'] == current_week]['单据日期'].max().strftime('%m-%d')
														
 
															+                summary_row['单据日期'] = f"{start_date}-{end_date} 汇总"
														
 
															+                new_data.append(summary_row)
														
 
															+
														
 
															+            new_data.append(row.to_dict())
														
 
															+            current_week = week_group
														
 
															+
														
 
															+        if current_week is not None:
														
 
															+            summary_row = weekly_summary[weekly_summary['第几周'] == current_week].iloc[0].to_dict()
														
 
															+            start_date = df[df['第几周'] == current_week]['单据日期'].min().strftime('%m-%d')
														
 
															+            end_date = df[df['第几周'] == current_week]['单据日期'].max().strftime('%m-%d')
														
 
															+            summary_row['单据日期'] = f"{start_date}-{end_date} 汇总"
														
 
															+            new_data.append(summary_row)
														
 
															+
														
 
															+        new_df = pd.DataFrame(new_data).drop(columns=['第几周'])
														
 
															+
														
 
															+        wb = Workbook()
														
 
															+        ws = wb.active
														
 
															+        for r in dataframe_to_rows(new_df, index=False, header=True):
														
 
															+            ws.append(r)
														
 
															+
														
 
															+        header = {cell.value: cell.column for cell in ws[1]}
														
 
															+        numeric_columns = [
														
 
															+            '999及以内单数', '1000-1999单数', '2000-2899单数', '2900-3999单数',
														
 
															+            '4000-4999单数', '5000-7999单数', '8000以上单数', '满足奖励条件大单数',
														
 
															+            '最大单件数', '最大单金额', '总单数', '2000+单数'
														
 
															+        ]
														
 
															+
														
 
															+        for col_name in numeric_columns:
														
 
															+            if col_name in header:
														
 
															+                col_letter = get_column_letter(header[col_name])
														
 
															+                for cell in ws[col_letter]:
														
 
															+                    if cell.row == 1:
														
 
															+                        continue
														
 
															+                    cell.number_format = '0'
														
 
															+
														
 
															+        if '2000+单数占比' in header:
														
 
															+            col_letter = get_column_letter(header['2000+单数占比'])
														
 
															+            for cell in ws[col_letter]:
														
 
															+                if cell.row == 1:
														
 
															+                    continue
														
 
															+                cell.number_format = '0.00%'
														
 
															+
														
 
															+        wb.save(output_file)
														
 
															+        print(f"✅ 数据已成功导出到 {output_file}")
														
 
															+
														
 
															+    def export_to_dataframe(self):
														
 
															+        connection = mysql.connector.connect(**self.db_config)
														
 
															+        cursor = connection.cursor()
														
 
															+        try:
														
 
															+            cursor.execute(self.query)
														
 
															+            rows = cursor.fetchall()
														
 
															+            columns = [desc[0] for desc in cursor.description]
														
 
															+        finally:
														
 
															+            cursor.close()
														
 
															+            connection.close()
														
 
															+
														
 
															+        df = pd.DataFrame(rows, columns=columns)
														
 
															+        df['单据日期'] = pd.to_datetime(df['单据日期'])
														
 
															+        df = df.sort_values('单据日期').reset_index(drop=True)
														
 
															+
														
 
															+        weekly_summary = df.groupby('第几周').agg({
														
 
															+            col: 'sum' for col in df.columns if col not in ['单据日期', '2000+单数占比', '第几周']
														
 
															+        }).reset_index()
														
 
															+
														
 
															+        weekly_summary['2000+单数'] = pd.to_numeric(weekly_summary['2000+单数'], errors='coerce')
														
 
															+        weekly_summary['总单数'] = pd.to_numeric(weekly_summary['总单数'], errors='coerce')
														
 
															+        weekly_summary['2000+单数占比'] = (weekly_summary['2000+单数'] / weekly_summary['总单数']).fillna(0).round(4)
														
 
															+
														
 
															+        new_data = []
														
 
															+        current_week = None
														
 
															+
														
 
															+        for _, row in df.iterrows():
														
 
															+            week_group = row['第几周']
														
 
															+
														
 
															+            if current_week != week_group and current_week is not None:
														
 
															+                summary_row = weekly_summary[weekly_summary['第几周'] == current_week].iloc[0].to_dict()
														
 
															+                start_date = df[df['第几周'] == current_week]['单据日期'].min().strftime('%m-%d')
														
 
															+                end_date = df[df['第几周'] == current_week]['单据日期'].max().strftime('%m-%d')
														
 
															+                summary_row['单据日期'] = f"{start_date}-{end_date} 汇总"
														
 
															+                new_data.append(summary_row)
														
 
															+
														
 
															+            new_data.append(row.to_dict())
														
 
															+            current_week = week_group
														
 
															+
														
 
															+        if current_week is not None:
														
 
															+            summary_row = weekly_summary[weekly_summary['第几周'] == current_week].iloc[0].to_dict()
														
 
															+            start_date = df[df['第几周'] == current_week]['单据日期'].min().strftime('%m-%d')
														
 
															+            end_date = df[df['第几周'] == current_week]['单据日期'].max().strftime('%m-%d')
														
 
															+            summary_row['单据日期'] = f"{start_date}-{end_date} 汇总"
														
 
															+            new_data.append(summary_row)
														
 
															+
														
 
															+        new_df = pd.DataFrame(new_data).drop(columns=['第几周'])
														
 
															+        return new_df
														
--- a/data_processor/daily_zones_exporter.py
+++ b/data_processor/daily_zones_exporter.py
@@ -0,0 +1,227 @@
 
															+import mysql.connector
														
 
															+import pandas as pd
														
 
															+from openpyxl import Workbook
														
 
															+from openpyxl.utils.dataframe import dataframe_to_rows
														
 
															+from openpyxl.utils import get_column_letter
														
 
															+from openpyxl.styles import Alignment
														
 
															+
														
 
															+
														
 
															+def create_row(row_data, document_date='', shop_name=''):
														
 
															+    new_row_temp = {
														
 
															+        '单据日期': document_date,
														
 
															+        '区域': '',
														
 
															+        '组长': row_data['组长'],
														
 
															+        '999及以内单数': row_data['999及以内单数'].sum(),
														
 
															+        '1000-1999单数': row_data['1000-1999单数'].sum(),
														
 
															+        '2000-2899单数': row_data['2000-2899单数'].sum(),
														
 
															+        '2900-3999单数': row_data['2900-3999单数'].sum(),
														
 
															+        '4000-4999单数': row_data['4000-4999单数'].sum(),
														
 
															+        '5000-7999单数': row_data['5000-7999单数'].sum(),
														
 
															+        '8000以上单数': row_data['8000以上单数'].sum(),
														
 
															+        '满足奖励条件大单数': row_data['满足奖励条件大单数'].sum(),
														
 
															+        '最大单件数': row_data['最大单件数'].max(),
														
 
															+        '最大单金额': row_data['最大单金额'].max(),
														
 
															+        '总单数': row_data['总单数'].sum(),
														
 
															+        '2000+单数': row_data['2000+单数'].sum(),
														
 
															+        '2000+单数占比': row_data['2000+单数'].sum() / row_data['总单数'].sum() if row_data['总单数'].sum() != 0 else 0
														
 
															+    }
														
 
															+
														
 
															+    if shop_name == '总计':
														
 
															+        new_row_temp['组长'] = '总计'
														
 
															+    else:
														
 
															+        new_row_temp['组长'] = f'{shop_name}汇总'
														
 
															+
														
 
															+    return new_row_temp
														
 
															+
														
 
															+
														
 
															+class DailyZonesSalesExporter:
														
 
															+    def __init__(self, db_config):
														
 
															+        self.db_config = db_config
														
 
															+        self.query = """
														
 
															+SELECT *, IF(temp.`总单数` = 0, 0, temp.`2000+单数` / temp.`总单数`) AS `2000+单数占比` 
														
 
															+FROM (
														
 
															+    SELECT
														
 
															+        t1.document_date AS `单据日期`,
														
 
															+        t1.channel_type AS `店铺类型`,
														
 
															+        t3.division AS `区域`,
														
 
															+        t3.group_leader AS `组长`,
														
 
															+        SUM(CASE WHEN t1.remaining_amount_after_return <= 999 THEN 1 ELSE 0 END) AS `999及以内单数`,
														
 
															+        SUM(CASE WHEN t1.remaining_amount_after_return > 999 AND t1.remaining_amount_after_return < 2000 THEN 1 ELSE 0 END) AS `1000-1999单数`,
														
 
															+        SUM(CASE WHEN t1.remaining_amount_after_return >= 2000 AND t1.remaining_amount_after_return <= 2899 THEN 1 ELSE 0 END) AS `2000-2899单数`,
														
 
															+        SUM(CASE WHEN t1.remaining_amount_after_return > 2899 AND t1.remaining_amount_after_return <= 3999 THEN 1 ELSE 0 END) AS `2900-3999单数`,
														
 
															+        SUM(CASE WHEN t1.remaining_amount_after_return > 3999 AND t1.remaining_amount_after_return <= 4999 THEN 1 ELSE 0 END) AS `4000-4999单数`,
														
 
															+        SUM(CASE WHEN t1.remaining_amount_after_return > 4999 AND t1.remaining_amount_after_return <= 7999 THEN 1 ELSE 0 END) AS `5000-7999单数`,
														
 
															+        SUM(CASE WHEN t1.remaining_amount_after_return > 7999 THEN 1 ELSE 0 END) AS `8000以上单数`,
														
 
															+        SUM(CASE WHEN t2.refund_meets_big_order != '不符合' THEN 1 ELSE 0 END) AS `满足奖励条件大单数`,
														
 
															+        MAX(t2.big_order_items) AS `最大单件数`,
														
 
															+        MAX(t2.big_order_amount) AS `最大单金额`,
														
 
															+        COUNT(1) AS `总单数`,
														
 
															+        SUM(CASE WHEN t1.remaining_amount_after_return >= 2000 THEN 1 ELSE 0 END) AS `2000+单数`
														
 
															+    FROM sd_sales_order AS t1
														
 
															+    LEFT JOIN sd_big_sales_order AS t2 ON t1.sale_id = t2.sale_id
														
 
															+    LEFT JOIN sd_store_info AS t3 ON t3.f360_code = t1.store_code
														
 
															+    WHERE t3.group_leader IS NOT NULL
														
 
															+    GROUP BY t1.document_date, t1.channel_type, t3.group_leader, t3.division
														
 
															+    ORDER BY `单据日期`, `店铺类型`
														
 
															+) AS temp;
														
 
															+"""
														
 
															+
														
 
															+    def export(self, output_file='output_by_shop_type_with_summary_and_total.xlsx'):
														
 
															+        global cursor, connection
														
 
															+        try:
														
 
															+            connection = mysql.connector.connect(**self.db_config)
														
 
															+            cursor = connection.cursor()
														
 
															+            cursor.execute(self.query)
														
 
															+            rows = cursor.fetchall()
														
 
															+            columns = [desc[0] for desc in cursor.description]
														
 
															+        finally:
														
 
															+            cursor.close()
														
 
															+            connection.close()
														
 
															+
														
 
															+        df = pd.DataFrame(rows, columns=columns)
														
 
															+
														
 
															+        for col in df.columns:
														
 
															+            if col not in ['单据日期', '店铺类型', '区域', '组长']:
														
 
															+                df[col] = pd.to_numeric(df[col], errors='coerce')
														
 
															+
														
 
															+        grouped_by_date = df.groupby('单据日期', sort=False)
														
 
															+        new_data = []
														
 
															+
														
 
															+        for date, date_df in grouped_by_date:
														
 
															+            grouped_by_shop = date_df.groupby('店铺类型', sort=False)
														
 
															+
														
 
															+            for shop, shop_df in grouped_by_shop:
														
 
															+                for _, row in shop_df.iterrows():
														
 
															+                    new_row = {
														
 
															+                        '单据日期': date,
														
 
															+                        '区域': row['区域'],
														
 
															+                        '组长': row['组长'],
														
 
															+                        '999及以内单数': row['999及以内单数'],
														
 
															+                        '1000-1999单数': row['1000-1999单数'],
														
 
															+                        '2000-2899单数': row['2000-2899单数'],
														
 
															+                        '2900-3999单数': row['2900-3999单数'],
														
 
															+                        '4000-4999单数': row['4000-4999单数'],
														
 
															+                        '5000-7999单数': row['5000-7999单数'],
														
 
															+                        '8000以上单数': row['8000以上单数'],
														
 
															+                        '满足奖励条件大单数': row['满足奖励条件大单数'],
														
 
															+                        '最大单件数': row['最大单件数'],
														
 
															+                        '最大单金额': row['最大单金额'],
														
 
															+                        '总单数': row['总单数'],
														
 
															+                        '2000+单数': row['2000+单数'],
														
 
															+                        '2000+单数占比': row['2000+单数占比'],
														
 
															+                    }
														
 
															+                    new_data.append(new_row)
														
 
															+
														
 
															+                summary_row = create_row(shop_df, date, shop)
														
 
															+                new_data.append(summary_row)
														
 
															+
														
 
															+            day_summary_row = create_row(date_df, date, '总计')
														
 
															+            new_data.append(day_summary_row)
														
 
															+
														
 
															+        final_df = pd.DataFrame(new_data)
														
 
															+
														
 
															+        wb = Workbook()
														
 
															+        ws = wb.active
														
 
															+
														
 
															+        for r in dataframe_to_rows(final_df, index=False, header=True):
														
 
															+            ws.append(r)
														
 
															+
														
 
															+        current_date = None
														
 
															+        start_row = None
														
 
															+
														
 
															+        for row in range(2, ws.max_row + 1):
														
 
															+            date_cell = ws.cell(row=row, column=1)
														
 
															+            date_value = date_cell.value
														
 
															+
														
 
															+            if date_value != current_date:
														
 
															+                if start_row is not None and row > start_row + 1:
														
 
															+                    ws.merge_cells(start_row=start_row, start_column=1, end_row=row - 1, end_column=1)
														
 
															+                    merged_cell = ws.cell(row=start_row, column=1)
														
 
															+                    merged_cell.alignment = Alignment(horizontal='center', vertical='center')
														
 
															+
														
 
															+                current_date = date_value
														
 
															+                start_row = row
														
 
															+
														
 
															+        if start_row is not None and start_row < ws.max_row:
														
 
															+            ws.merge_cells(start_row=start_row, start_column=1, end_row=ws.max_row, end_column=1)
														
 
															+            merged_cell = ws.cell(row=start_row, column=1)
														
 
															+            merged_cell.alignment = Alignment(horizontal='center', vertical='center')
														
 
															+
														
 
															+        header = {cell.value: cell.column for cell in ws[1]}
														
 
															+        numeric_columns = [
														
 
															+            '999及以内单数', '1000-1999单数', '2000-2899单数', '2900-3999单数',
														
 
															+            '4000-4999单数', '5000-7999单数', '8000以上单数', '满足奖励条件大单数',
														
 
															+            '最大单件数', '最大单金额', '总单数', '2000+单数'
														
 
															+        ]
														
 
															+
														
 
															+        for col_name in numeric_columns:
														
 
															+            if col_name in header:
														
 
															+                col_letter = get_column_letter(header[col_name])
														
 
															+                for cell in ws[col_letter]:
														
 
															+                    if cell.row == 1:
														
 
															+                        continue
														
 
															+                    cell.number_format = '0'
														
 
															+
														
 
															+        if '2000+单数占比' in header:
														
 
															+            col_letter = get_column_letter(header['2000+单数占比'])
														
 
															+            for cell in ws[col_letter]:
														
 
															+                if cell.row == 1:
														
 
															+                    continue
														
 
															+                cell.number_format = '0.00%'
														
 
															+
														
 
															+        wb.save(output_file)
														
 
															+        print(f"✅ 数据已成功导出到 {output_file}")
														
 
															+
														
 
															+    def export_to_dataframe(self):
														
 
															+        connection = mysql.connector.connect(**self.db_config)
														
 
															+        cursor = connection.cursor()
														
 
															+        try:
														
 
															+            cursor.execute(self.query)
														
 
															+            rows = cursor.fetchall()
														
 
															+            columns = [desc[0] for desc in cursor.description]
														
 
															+        finally:
														
 
															+            cursor.close()
														
 
															+            connection.close()
														
 
															+
														
 
															+        df = pd.DataFrame(rows, columns=columns)
														
 
															+
														
 
															+        for col in df.columns:
														
 
															+            if col not in ['单据日期', '店铺类型', '区域', '组长']:
														
 
															+                df[col] = pd.to_numeric(df[col], errors='coerce')
														
 
															+
														
 
															+        grouped_by_date = df.groupby('单据日期', sort=False)
														
 
															+        new_data = []
														
 
															+
														
 
															+        for date, date_df in grouped_by_date:
														
 
															+            grouped_by_shop = date_df.groupby('店铺类型', sort=False)
														
 
															+
														
 
															+            for shop, shop_df in grouped_by_shop:
														
 
															+                for _, row in shop_df.iterrows():
														
 
															+                    new_row = {
														
 
															+                        '单据日期': date,
														
 
															+                        '区域': row['区域'],
														
 
															+                        '组长': row['组长'],
														
 
															+                        '999及以内单数': row['999及以内单数'],
														
 
															+                        '1000-1999单数': row['1000-1999单数'],
														
 
															+                        '2000-2899单数': row['2000-2899单数'],
														
 
															+                        '2900-3999单数': row['2900-3999单数'],
														
 
															+                        '4000-4999单数': row['4000-4999单数'],
														
 
															+                        '5000-7999单数': row['5000-7999单数'],
														
 
															+                        '8000以上单数': row['8000以上单数'],
														
 
															+                        '满足奖励条件大单数': row['满足奖励条件大单数'],
														
 
															+                        '最大单件数': row['最大单件数'],
														
 
															+                        '最大单金额': row['最大单金额'],
														
 
															+                        '总单数': row['总单数'],
														
 
															+                        '2000+单数': row['2000+单数'],
														
 
															+                        '2000+单数占比': row['2000+单数占比'],
														
 
															+                    }
														
 
															+                    new_data.append(new_row)
														
 
															+
														
 
															+                summary_row = create_row(shop_df, date, shop)
														
 
															+                new_data.append(summary_row)
														
 
															+
														
 
															+            day_summary_row = create_row(date_df, date, '总计')
														
 
															+            new_data.append(day_summary_row)
														
 
															+
														
 
															+        final_df = pd.DataFrame(new_data)
														
 
															+        return final_df
														
--- a/data_processor/data_processor.py
+++ b/data_processor/data_processor.py
@@ -0,0 +1,39 @@
 
															+from data_processor.importer import SalesDataImporter
														
 
															+from data_processor.combined_sales_exporter import CombinedSalesExporter
														
 
															+from data_processor.daily_sales_exporter import DailySalesExporter
														
 
															+from data_processor.daily_zones_exporter import DailyZonesSalesExporter
														
 
															+
														
 
															+
														
 
															+# 数据库配置建议从环境变量或配置文件中读取
														
 
															+db_config = {
														
 
															+    'host': '10.41.1.220',
														
 
															+    'port': 3306,
														
 
															+    'user': 'it_user',
														
 
															+    'password': 'Goelia*199@5',
														
 
															+    'database': 'sales_data'
														
 
															+}
														
 
															+
														
 
															+def data_processor(excel_file, export_file):
														
 
															+    """
														
 
															+    处理销售数据：导入 -> 导出每日销售 -> 导出区域销售 -> 合并导出
														
 
															+    """
														
 
															+    try:
														
 
															+        print("开始导入销售数据")
														
 
															+        importer = SalesDataImporter(db_config, excel_file)
														
 
															+        importer.import_data()
														
 
															+        print("销售数据导入完成")
														
 
															+
														
 
															+        print("初始化每日销售导出器")
														
 
															+        daily_sales_exporter = DailySalesExporter(db_config)
														
 
															+
														
 
															+        print("初始化区域销售导出器")
														
 
															+        daily_zones_sales_exporter = DailyZonesSalesExporter(db_config)
														
 
															+
														
 
															+        print("开始合并导出")
														
 
															+        combined_exporter = CombinedSalesExporter(daily_sales_exporter, daily_zones_sales_exporter)
														
 
															+        combined_exporter.export(export_file)
														
 
															+        print("合并导出完成")
														
 
															+
														
 
															+    except Exception as e:
														
 
															+        print(f"数据处理过程中发生错误: {e}")
														
 
															+        raise
														
--- a/data_processor/importer.py
+++ b/data_processor/importer.py
@@ -0,0 +1,98 @@
 
															+import re
														
 
															+import pandas as pd
														
 
															+import mysql.connector
														
 
															+
														
 
															+
														
 
															+def extract_first_int(value):
														
 
															+    if pd.isna(value) or value == '':
														
 
															+        return 0
														
 
															+    match = re.search(r'\b\d+\b', str(value))
														
 
															+    return int(match.group()) if match else 0
														
 
															+
														
 
															+
														
 
															+class SalesDataImporter:
														
 
															+    def __init__(self, db_config, excel_file):
														
 
															+        self.db_config = db_config
														
 
															+        self.excel_file = excel_file
														
 
															+
														
 
															+    @staticmethod
														
 
															+    def _truncate_and_insert_batch(cursor, df, insert_sql, table_name, batch_size=1000):
														
 
															+        print(f"🔄 清空表 {table_name} 并开始批量插入数据...")
														
 
															+        cursor.execute(f'TRUNCATE TABLE {table_name}')
														
 
															+
														
 
															+        total_rows = len(df)
														
 
															+        for start in range(0, total_rows, batch_size):
														
 
															+            end = min(start + batch_size, total_rows)
														
 
															+            batch_data = [tuple(row) for _, row in df.iloc[start:end].iterrows()]
														
 
															+            cursor.executemany(insert_sql, batch_data)
														
 
															+            print(f"✅ 已插入 {end - start} 条记录到 {table_name}")
														
 
															+
														
 
															+        print(f"✅ 成功插入 {total_rows} 条记录到 {table_name}")
														
 
															+
														
 
															+    def import_data(self):
														
 
															+        conn = mysql.connector.connect(**self.db_config, autocommit=False)
														
 
															+        cursor = conn.cursor()
														
 
															+
														
 
															+        try:
														
 
															+            # 导入 sd_big_sales_order
														
 
															+            df_big_sales = pd.read_excel(self.excel_file, sheet_name='大单报表', header=0)
														
 
															+            df_big_sales.columns = [
														
 
															+                'month_id', 'order_date', 'upload_bill_date', 'sale_id', 'city_store_name',
														
 
															+                'store_code', 'receivable_account', 'store_type', 'customer_names', 'total_items_sold',
														
 
															+                'total_amount', 'big_order_items', 'big_order_amount', 'payment_method', 'has_refund',
														
 
															+                'refund_meets_big_order', 'refund_order_number', 'refund_time', 'refund_items',
														
 
															+                'refund_amount', 'refund_remaining_award_items', 'refund_remaining_award_amount',
														
 
															+                'award_coupon_amount', 'is_upload_receipt', 'receipt_thumbnail_url', 'is_rebate_generated'
														
 
															+            ]
														
 
															+            df_big_sales = df_big_sales.where(pd.notnull(df_big_sales), None)
														
 
															+            ## 对特定整型列填充 0 并转为 int 类型
														
 
															+            int_columns = ['refund_items', 'refund_remaining_award_items', 'total_items_sold', 'big_order_items']
														
 
															+            for col in int_columns:
														
 
															+                if col in df_big_sales.columns:
														
 
															+                    df_big_sales[col] = df_big_sales[col].apply(extract_first_int).astype(int)
														
 
															+
														
 
															+            insert_sql_big_sales = """
														
 
															+            INSERT INTO sd_big_sales_order VALUES (%s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s)
														
 
															+            """
														
 
															+            self._truncate_and_insert_batch(cursor, df_big_sales, insert_sql_big_sales, 'sd_big_sales_order')
														
 
															+
														
 
															+
														
 
															+            # 导入 sd_sales_order
														
 
															+            df_sales = pd.read_excel(self.excel_file, sheet_name='销售价格段明细报表', header=0)
														
 
															+            df_sales.columns = ['sale_id', 'total_items', 'actual_items', 'store_code', 'store_name',
														
 
															+                                'channel_type', 'document_date', 'amount', 'return_exchange_items',
														
 
															+                                'return_exchange_amount', 'payment_method', 'remaining_items_after_return',
														
 
															+                                'remaining_amount_after_return']
														
 
															+            df_sales = df_sales.where(pd.notnull(df_sales), None)
														
 
															+            ## 对特定整型列填充 0 并转为 int 类型
														
 
															+            int_columns = ['total_items', 'actual_items', 'return_exchange_items', 'remaining_items_after_return', 'return_exchange_amount']
														
 
															+            for col in int_columns:
														
 
															+                if col in df_sales.columns:
														
 
															+                    df_sales[col] = df_sales[col].apply(extract_first_int).astype(int)
														
 
															+
														
 
															+            insert_sql_sales = """
														
 
															+            INSERT INTO sd_sales_order VALUES (%s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s)
														
 
															+            """
														
 
															+            self._truncate_and_insert_batch(cursor, df_sales, insert_sql_sales, 'sd_sales_order')
														
 
															+
														
 
															+
														
 
															+            # 导入 sd_store_info
														
 
															+            df_store = pd.read_excel(self.excel_file, sheet_name='全国客户资料', header=0)
														
 
															+            df_store.columns = ['channel', 'f360_code', 'province', 'store_name',
														
 
															+                                'customer_name', 'group_leader', 'division', 'region',
														
 
															+                                'open_date', 'close_date']
														
 
															+            df_store = df_store.where(pd.notnull(df_store), None)
														
 
															+            insert_sql_store = """
														
 
															+            INSERT INTO sd_store_info VALUES (%s, %s, %s, %s, %s, %s, %s, %s, %s, %s)
														
 
															+            """
														
 
															+            self._truncate_and_insert_batch(cursor, df_store, insert_sql_store, 'sd_store_info')
														
 
															+
														
 
															+            conn.commit()
														
 
															+            print("✅ 所有数据已成功导入数据库")
														
 
															+        except Exception as e:
														
 
															+            conn.rollback()
														
 
															+            print(f"❌ 数据导入失败: {e}")
														
 
															+            raise
														
 
															+        finally:
														
 
															+            cursor.close()
														
 
															+            conn.close()
														
--- a/docker/requirements.txt
+++ b/docker/requirements.txt
@@ -16,4 +16,5 @@ scipy
 
															 scikit-learn
														
 
															 matplotlib-inline
														
 
															 MarkupSafe
														
 
															-six
														
 
															+six
														
 
															+mysql-connector-python
														
--- a/server.py
+++ b/server.py
@@ -1,4 +1,6 @@
 
															 # basic import
														
 
															+from datetime import datetime
														
 
															+
														
 
															 import uvicorn, json, os, uuid, docker, pymssql, autogen
														
 
															 from autogen import ConversableAgent
														
 
															 from copy import deepcopy
														
@@ -14,6 +16,7 @@ from fastapi.middleware.cors import CORSMiddleware
 
															 # functioncall import
														
 
															 from agents import data_engineer, detect_analyze_agent
														
 
															 from tools import validate_use_tools, generate_result
														
 
															+from data_processor.data_processor import data_processor
														
 
															 # sql import
														
 
															 from sql_instruments import sql_analyze_father
														
@@ -156,6 +159,27 @@ async def websocket_endpoint(ws: WebSocket, client_id: str):
 
															                         continue_exe = True
														
 
															                 else:
														
 
															                     continue_exe = True
														
 
															+
														
 
															+                ##大单数据分析
														
 
															+                if prompt == '生成零售加盟大单报表':
														
 
															+                    print(f'文件列表:{file_names}')
														
 
															+                    excel_file = file_names[0]
														
 
															+                    if excel_file:
														
 
															+                        export_file = datetime.now().strftime('%Y%m%d%H%M%S') + '.xlsx'
														
 
															+                        temp_directory = os.path.join(BASE_UPLOAD_DIRECTORY, client_id)
														
 
															+                        user_directory = os.path.join(temp_directory, 'upload')
														
 
															+                        file_location = os.path.join(user_directory, export_file)
														
 
															+                        print(f'生成零售加盟大单报表文件:{file_location}')
														
 
															+                        data_processor(excel_file, file_location)
														
 
															+                        await ws.send_json({'text': '测试成功', 'files': [f'{file_url}{file_location}']})
														
 
															+                        await ws.send_text('end')
														
 
															+                        continue_exe = False
														
 
															+                    else:
														
 
															+                        await ws.send_json({'text': '请先上传excel表格', 'files': ''})
														
 
															+                        await ws.send_text('end')
														
 
															+                        continue_exe = False
														
 
															+
														
 
															+
														
 
															                 if continue_exe:
														
 
															                     print(f'继续执行: {continue_exe}')
														
 
															                     analyze_detect = await detect_analyze_agent.a_generate_reply(messages=[{'role':'user', 'content':prompt}])