From a74d0d0f834ba55b1ca649d59bcb0d78f7d3768e Mon Sep 17 00:00:00 2001
From: "[Chiyan200]" <chandru00576@gmail.com>
Date: Tue, 21 Jan 2025 23:17:59 +0530
Subject: [PATCH 1/2] Fix: Robust settings loader to handle missing keys,
 incorrect file paths, and dynamic assignment

- Ensured default settings are properly merged with file-based settings to prevent KeyErrors.
- Added logic to handle _pinyin and _char suffixes in project names, ensuring correct file paths.
- Implemented tuple-based ordered mapping for consistent and error-free component assignment.
- Added safety check to verify the existence of setting.json before loading.
- Improved maintainability by centralizing default settings and enhancing error handling.
---
 src/f5_tts/train/finetune_gradio.py | 147 ++++++++++++++++++----------
 1 file changed, 93 insertions(+), 54 deletions(-)

diff --git a/src/f5_tts/train/finetune_gradio.py b/src/f5_tts/train/finetune_gradio.py
index e27ef3a..399a859 100644
--- a/src/f5_tts/train/finetune_gradio.py
+++ b/src/f5_tts/train/finetune_gradio.py
@@ -108,41 +108,58 @@ def load_settings(project_name):
     path_project = os.path.join(path_project_ckpts, project_name)
     file_setting = os.path.join(path_project, "setting.json")
 
-    if not os.path.isfile(file_setting):
-        settings = {
-            "exp_name": "F5TTS_Base",
-            "learning_rate": 1e-05,
-            "batch_size_per_gpu": 1000,
-            "batch_size_type": "frame",
-            "max_samples": 64,
-            "grad_accumulation_steps": 1,
-            "max_grad_norm": 1,
-            "epochs": 100,
-            "num_warmup_updates": 2,
-            "save_per_updates": 300,
-            "keep_last_n_checkpoints": -1,
-            "last_per_updates": 100,
-            "finetune": True,
-            "file_checkpoint_train": "",
-            "tokenizer_type": "pinyin",
-            "tokenizer_file": "",
-            "mixed_precision": "none",
-            "logger": "wandb",
-            "bnb_optimizer": False,
-        }
-    else:
-        with open(file_setting, "r") as f:
-            settings = json.load(f)
-            if "logger" not in settings:
-                settings["logger"] = "wandb"
-            if "bnb_optimizer" not in settings:
-                settings["bnb_optimizer"] = False
-            if "keep_last_n_checkpoints" not in settings:
-                settings["keep_last_n_checkpoints"] = -1  # default to keep all checkpoints
-            if "last_per_updates" not in settings:  # patch for backward compatibility, with before f992c4e
-                settings["last_per_updates"] = settings["last_per_steps"] // settings["grad_accumulation_steps"]
+    # Default settings
+    default_settings = {
+        "exp_name": "F5TTS_Base",
+        "learning_rate": 1e-05,
+        "batch_size_per_gpu": 1000,
+        "batch_size_type": "frame",
+        "max_samples": 64,
+        "grad_accumulation_steps": 1,
+        "max_grad_norm": 1,
+        "epochs": 100,
+        "num_warmup_updates": 2,
+        "save_per_updates": 300,
+        "keep_last_n_checkpoints": -1,
+        "last_per_updates": 100,
+        "finetune": True,
+        "file_checkpoint_train": "",
+        "tokenizer_type": "pinyin",
+        "tokenizer_file": "",
+        "mixed_precision": "none",
+        "logger": "wandb",
+        "bnb_optimizer": False,
+    }
+
+    # Load settings from file if it exists
+    if os.path.isfile(file_setting):
+        with open(file_setting, "r") as f:
+            file_settings = json.load(f)
+        default_settings.update(file_settings)
+
+    # Return as a tuple in the correct order
+    return (
+        default_settings["exp_name"],
+        default_settings["learning_rate"],
+        default_settings["batch_size_per_gpu"],
+        default_settings["batch_size_type"],
+        default_settings["max_samples"],
+        default_settings["grad_accumulation_steps"],
+        default_settings["max_grad_norm"],
+        default_settings["epochs"],
+        default_settings["num_warmup_updates"],
+        default_settings["save_per_updates"],
+        default_settings["keep_last_n_checkpoints"],
+        default_settings["last_per_updates"],
+        default_settings["finetune"],
+        default_settings["file_checkpoint_train"],
+        default_settings["tokenizer_type"],
+        default_settings["tokenizer_file"],
+        default_settings["mixed_precision"],
+        default_settings["logger"],
+        default_settings["bnb_optimizer"],
+    )
 
-    return settings
 
 
 # Load metadata
@@ -1550,27 +1567,49 @@ If you encounter a memory error, try reducing the batch size per GPU to a smalle
                 stop_button = gr.Button("Stop Training", interactive=False)
 
             if projects_selelect is not None:
-                settings = load_settings(projects_selelect)
+                (
+                    exp_name_value,
+                    learning_rate_value,
+                    batch_size_per_gpu_value,
+                    batch_size_type_value,
+                    max_samples_value,
+                    grad_accumulation_steps_value,
+                    max_grad_norm_value,
+                    epochs_value,
+                    num_warmup_updates_value,
+                    save_per_updates_value,
+                    keep_last_n_checkpoints_value,
+                    last_per_updates_value,
+                    finetune_value,
+                    file_checkpoint_train_value,
+                    tokenizer_type_value,
+                    tokenizer_file_value,
+                    mixed_precision_value,
+                    logger_value,
+                    bnb_optimizer_value,
+                ) = load_settings(projects_selelect)
+
+                # Assigning values to the respective components
+                exp_name.value = exp_name_value
+                learning_rate.value = learning_rate_value
+                batch_size_per_gpu.value = batch_size_per_gpu_value
+                batch_size_type.value = batch_size_type_value
+                max_samples.value = max_samples_value
+                grad_accumulation_steps.value = grad_accumulation_steps_value
+                max_grad_norm.value = max_grad_norm_value
+                epochs.value = epochs_value
+                num_warmup_updates.value = num_warmup_updates_value
+                save_per_updates.value = save_per_updates_value
+                keep_last_n_checkpoints.value = keep_last_n_checkpoints_value
+                last_per_updates.value = last_per_updates_value
+                ch_finetune.value = finetune_value
+                file_checkpoint_train.value = file_checkpoint_train_value
+                tokenizer_type.value = tokenizer_type_value
+                tokenizer_file.value = tokenizer_file_value
+                mixed_precision.value = mixed_precision_value
+                cd_logger.value = logger_value
+                ch_8bit_adam.value = bnb_optimizer_value
 
-                exp_name.value = settings["exp_name"]
-                learning_rate.value = settings["learning_rate"]
-                batch_size_per_gpu.value = settings["batch_size_per_gpu"]
-                batch_size_type.value = settings["batch_size_type"]
-                max_samples.value = settings["max_samples"]
-                grad_accumulation_steps.value = settings["grad_accumulation_steps"]
-                max_grad_norm.value = settings["max_grad_norm"]
-                epochs.value = settings["epochs"]
-                num_warmup_updates.value = settings["num_warmup_updates"]
-                save_per_updates.value = settings["save_per_updates"]
-                keep_last_n_checkpoints.value = settings["keep_last_n_checkpoints"]
-                last_per_updates.value = settings["last_per_updates"]
-                ch_finetune.value = settings["finetune"]
-                file_checkpoint_train.value = settings["file_checkpoint_train"]
-                tokenizer_type.value = settings["tokenizer_type"]
-                tokenizer_file.value = settings["tokenizer_file"]
-                mixed_precision.value = settings["mixed_precision"]
-                cd_logger.value = settings["logger"]
-                ch_8bit_adam.value = settings["bnb_optimizer"]
 
             ch_stream = gr.Checkbox(label="Stream Output Experiment", value=True)
             txt_info_train = gr.Text(label="Info", value="")

From 24fe39dc3c4c47397937ff54e9145b7335254a53 Mon Sep 17 00:00:00 2001
From: "[Chiyan200]" <chandru00576@gmail.com>
Date: Wed, 22 Jan 2025 00:07:34 +0530
Subject: [PATCH 2/2] Fix :  Settings Loader Issues: Resolve KeyErrors, Path
 Handling, and Component Assignment (#731)

---
 src/f5_tts/train/finetune_gradio.py | 2 --
 1 file changed, 2 deletions(-)

diff --git a/src/f5_tts/train/finetune_gradio.py b/src/f5_tts/train/finetune_gradio.py
index 399a859..076306b 100644
--- a/src/f5_tts/train/finetune_gradio.py
+++ b/src/f5_tts/train/finetune_gradio.py
@@ -161,7 +161,6 @@ def load_settings(project_name):
     )
 
 
-
 # Load metadata
 def get_audio_duration(audio_path):
     """Calculate the duration mono of an audio file."""
@@ -1610,7 +1609,6 @@ If you encounter a memory error, try reducing the batch size per GPU to a smalle
                 cd_logger.value = logger_value
                 ch_8bit_adam.value = bnb_optimizer_value
 
-
             ch_stream = gr.Checkbox(label="Stream Output Experiment", value=True)
             txt_info_train = gr.Text(label="Info", value="")