From 308d4657aba059afe47b884395e4674f56ab91aa Mon Sep 17 00:00:00 2001
From: Sean Whalen <seanthegeek@users.noreply.github.com>
Date: Sun, 17 Aug 2025 19:43:19 -0400
Subject: [PATCH] Make sort_csv function more flexible

---
 parsedmarc/resources/maps/sortmaps.py | 22 ++++++++++++----------
 1 file changed, 12 insertions(+), 10 deletions(-)

diff --git a/parsedmarc/resources/maps/sortmaps.py b/parsedmarc/resources/maps/sortmaps.py
index 94a7150..c776f65 100755
--- a/parsedmarc/resources/maps/sortmaps.py
+++ b/parsedmarc/resources/maps/sortmaps.py
@@ -8,24 +8,26 @@ map_files = ["base_reverse_dns_map.csv"]
 list_files = ["known_unknown_base_reverse_dns.txt", "psl_overrides.txt"]
 
 
-def sort_csv(filepath, column=0, strip_whitespace=True):
-    # Load CSV into  aDataFrame
+def sort_csv(
+    filepath, column=0, column_name=None, strip_whitespace=True, duplicates_warning=True
+):
+    # Load CSV into a DataFrame
     df = pd.read_csv(filepath)
 
     if strip_whitespace:
         df = df.applymap(lambda x: x.strip() if isinstance(x, str) else x)
 
-    # Get the first column name
-    col_name = df.columns[column]
+    if column_name is None:
+        column_name = df.columns[column]
 
-    # Check for duplicates in the first column
-    duplicates = df[df.duplicated(subset=[col_name], keep=False)]
-    if not duplicates.empty:
-        print(f"⚠️ Warning: Duplicate values found in column '{col_name}':")
-        print(duplicates[[col_name]])
+    # Check for duplicates
+    duplicates = df[df.duplicated(subset=[column_name], keep=False)]
+    if duplicates_warning and not duplicates.empty:
+        print(f"⚠️ Warning: Duplicate values found in column '{column_name}':")
+        print(duplicates[[column_name]])
 
     # Sort by the first column
-    df = df.sort_values(by=col_name)
+    df = df.sort_values(by=column_name)
 
     # Save back to the same file (overwrite, no index column)
     df.to_csv(filepath, index=False)