在数据分析和处理中,经常会遇到需要汇总多张具有相同结构的表的情况。通常,这些表包含相似的数据,例如来自不同日期或不同部门的销售记录。手工汇总这些表可能既耗时又容易出错。

几十张相同的表如何汇总?几十张相同的表如何汇总?


本文将介绍使用 Excel 或 Python 轻松汇总几十张相同表的方法。

使用 Excel

合并查询:创建一个主工作簿,然后使用“合并查询”功能将所有表导入到一个数据模型中。在“查询”选项卡中,单击“从文件”>“从工作簿”并选择要合并的表。 汇总表:导入所有表后,可以使用“汇总表”功能创建汇总表。在“插入”选项卡中,单击“汇总表”,选择数据模型,并指定要汇总的字段和汇总方式。

使用 Python

导入数据:可以使用 Pandas 库导入所有表到 DataFrame 列表中。```python import pandas as pd tables = [] for i in range(1, 21): tables.append(pd.read_excel('table' + str(i) + '.xlsx')) ``` 合并 DataFrame:可以使用 `pd.concat()` 函数将 DataFrame 列表合并为一个单个 DataFrame。```python combined_df = pd.concat(tables, ignore_index=True) ``` 分组汇总:可以使用 `groupby()` 和 `agg()` 函数对合并的 DataFrame 进行分组并汇总数据。```python combined_df.groupby('column_to_group_by').agg({'column_to_sum': 'sum'}) ```

注意事项:

确保所有表具有相同的列名称和数据类型。 汇总之前,检查是否有丢失或无效数据。 考虑使用数据验证规则或自定义函数来处理数据中的异常情况。

结论