TheAlgorithms
diff --git a/‎get-pip.py‎
Lines changed: 26947 additions & 0 deletions b/‎get-pip.py‎
Lines changed: 26947 additions & 0 deletions
diff --git a/‎neural_network/optimizers/__init__.py‎
Lines changed: 4 additions & 4 deletions b/‎neural_network/optimizers/__init__.py‎
Lines changed: 4 additions & 4 deletions
diff --git a/‎neural_network/optimizers/adagrad.py‎
Lines changed: 19 additions & 15 deletions b/‎neural_network/optimizers/adagrad.py‎
Lines changed: 19 additions & 15 deletions
diff --git a/‎neural_network/optimizers/adam.py‎
Lines changed: 25 additions & 19 deletions b/‎neural_network/optimizers/adam.py‎
Lines changed: 25 additions & 19 deletions
diff --git a/‎neural_network/optimizers/base_optimizer.py‎
Lines changed: 5 additions & 7 deletions b/‎neural_network/optimizers/base_optimizer.py‎
Lines changed: 5 additions & 7 deletions
diff --git a/‎neural_network/optimizers/momentum_sgd.py‎
Lines changed: 19 additions & 16 deletions b/‎neural_network/optimizers/momentum_sgd.py‎
Lines changed: 19 additions & 16 deletions
@@ -15,10 +15,10 @@
 Each optimizer implements a common interface for updating parameters given gradients.
 """
 
-from .sgd import SGD
-from .momentum_sgd import MomentumSGD
-from .nag import NAG
 from .adagrad import Adagrad
 from .adam import Adam
+from .momentum_sgd import MomentumSGD
+from .nag import NAG
+from .sgd import SGD
 
-__all__ = ["SGD", "MomentumSGD", "NAG", "Adagrad", "Adam"]
+__all__ = ["NAG", "SGD", "Adagrad", "Adam", "MomentumSGD"]
@@ -16,7 +16,6 @@
 from __future__ import annotations
 
 import math
-from typing import List, Union
 
 from .base_optimizer import BaseOptimizer
 
@@ -91,16 +90,17 @@ def __init__(self, learning_rate: float = 0.01, epsilon: float = 1e-8) -> None:
         super().__init__(learning_rate)
 
         if epsilon <= 0:
-            raise ValueError(f"Epsilon must be positive, got {epsilon}")
+            msg = f"Epsilon must be positive, got {epsilon}"
+            raise ValueError(msg)
 
         self.epsilon = epsilon
         self._accumulated_gradients = None  # Will be initialized on first update
 
     def update(
         self,
-        parameters: Union[List[float], List[List[float]]],
-        gradients: Union[List[float], List[List[float]]],
-    ) -> Union[List[float], List[List[float]]]:
+        parameters: list[float] | list[list[float]],
+        gradients: list[float] | list[list[float]],
+    ) -> list[float] | list[list[float]]:
         """
         Update parameters using Adagrad rule.
 
@@ -120,10 +120,10 @@ def update(
         """
 
         def _adagrad_update_recursive(
-            parameters: Union[float, List[Union[float, List[float]]]], 
-            gradients: Union[float, List[Union[float, List[float]]]], 
-            accumulated_gradients: Union[float, List[Union[float, List[float]]]]
-        ) -> tuple[Union[float, List[Union[float, List[float]]]], Union[float, List[Union[float, List[float]]]]]:
+            parameters: float | list[float | list[float]],
+            gradients: float | list[float | list[float]],
+            accumulated_gradients: float | list[float | list[float]]
+        ) -> tuple[float | list[float | list[float]], float | list[float | list[float]]]:
             # Handle scalar case
             if isinstance(parameters, (int, float)):
                 if not isinstance(gradients, (int, float)):
@@ -149,10 +149,13 @@ def _adagrad_update_recursive(
 
             # Handle list case
             if len(parameters) != len(gradients):
-                raise ValueError(
+                msg = (
                     f"Shape mismatch: parameters length {len(parameters)} vs "
                     f"gradients length {len(gradients)}"
                 )
+                raise ValueError(
+                    msg
+                )
 
             if accumulated_gradients is None:
                 accumulated_gradients = [None] * len(parameters)
@@ -162,7 +165,7 @@ def _adagrad_update_recursive(
             new_params = []
             new_acc_grads = []
 
-            for i, (p, g, ag) in enumerate(zip(parameters, gradients, accumulated_gradients)):
+            for _i, (p, g, ag) in enumerate(zip(parameters, gradients, accumulated_gradients)):
                 if isinstance(p, list) and isinstance(g, list):
                     # Recursive case for nested lists
                     new_p, new_ag = _adagrad_update_recursive(p, g, ag)
@@ -183,8 +186,9 @@ def _adagrad_update_recursive(
                     new_params.append(new_p)
                     new_acc_grads.append(new_ag)
                 else:
+                    msg = f"Shape mismatch: inconsistent types {type(p)} vs {type(g)}"
                     raise ValueError(
-                        f"Shape mismatch: inconsistent types {type(p)} vs {type(g)}"
+                        msg
                     )
 
             return new_params, new_acc_grads
@@ -201,8 +205,8 @@ def _adagrad_update_recursive(
         return updated_params
 
     def _initialize_like(
-        self, gradients: Union[List[float], List[List[float]]]
-    ) -> Union[List[float], List[List[float]]]:
+        self, gradients: list[float] | list[list[float]]
+    ) -> list[float] | list[list[float]]:
         """
         Initialize accumulated gradients with same structure as gradients, filled with zeros.
 
@@ -283,7 +287,7 @@ def __str__(self) -> str:
                 f"  Adagrad: f = {f_adagrad:8.3f}, x = ({x_adagrad[0]:6.3f}, {x_adagrad[1]:6.3f})"
             )
 
-    print(f"\\nFinal comparison:")
+    print("\\nFinal comparison:")
     f_final_sgd = x_sgd[0] ** 2 + 100 * x_sgd[1] ** 2
     f_final_adagrad = x_adagrad[0] ** 2 + 100 * x_adagrad[1] ** 2
     print(f"SGD final loss:     {f_final_sgd:.6f}")
 
@@ -16,7 +16,6 @@
 from __future__ import annotations
 
 import math
-from typing import List, Union, Tuple
 
 from .base_optimizer import BaseOptimizer
 
@@ -109,11 +108,14 @@ def __init__(
         super().__init__(learning_rate)
 
         if not 0 <= beta1 < 1:
-            raise ValueError(f"beta1 must be in [0, 1), got {beta1}")
+            msg = f"beta1 must be in [0, 1), got {beta1}"
+            raise ValueError(msg)
         if not 0 <= beta2 < 1:
-            raise ValueError(f"beta2 must be in [0, 1), got {beta2}")
+            msg = f"beta2 must be in [0, 1), got {beta2}"
+            raise ValueError(msg)
         if epsilon <= 0:
-            raise ValueError(f"epsilon must be positive, got {epsilon}")
+            msg = f"epsilon must be positive, got {epsilon}"
+            raise ValueError(msg)
 
         self.beta1 = beta1
         self.beta2 = beta2
@@ -126,9 +128,9 @@ def __init__(
 
     def update(
         self,
-        parameters: Union[List[float], List[List[float]]],
-        gradients: Union[List[float], List[List[float]]],
-    ) -> Union[List[float], List[List[float]]]:
+        parameters: list[float] | list[list[float]],
+        gradients: list[float] | list[list[float]],
+    ) -> list[float] | list[list[float]]:
         """
         Update parameters using Adam rule.
 
@@ -162,11 +164,11 @@ def update(
         bias_correction2 = 1 - self.beta2**self._time_step
 
         def _adam_update_recursive(
-            parameters: Union[float, List],
-            gradients: Union[float, List],
-            first_moment: Union[float, List],
-            second_moment: Union[float, List]
-        ) -> Tuple[Union[float, List], Union[float, List], Union[float, List]]:
+            parameters: float | list,
+            gradients: float | list,
+            first_moment: float | list,
+            second_moment: float | list
+        ) -> tuple[float | list, float | list, float | list]:
             # Handle scalar case
             if isinstance(parameters, (int, float)):
                 if not isinstance(gradients, (int, float)):
@@ -195,10 +197,13 @@ def _adam_update_recursive(
 
             # Handle list case
             if len(parameters) != len(gradients):
-                raise ValueError(
+                msg = (
                     f"Shape mismatch: parameters length {len(parameters)} vs "
                     f"gradients length {len(gradients)}"
                 )
+                raise ValueError(
+                    msg
+                )
 
             new_params = []
             new_first_moments = []
@@ -231,8 +236,9 @@ def _adam_update_recursive(
                     new_first_moments.append(new_m1)
                     new_second_moments.append(new_m2)
                 else:
+                    msg = f"Shape mismatch: inconsistent types {type(p)} vs {type(g)}"
                     raise ValueError(
-                        f"Shape mismatch: inconsistent types {type(p)} vs {type(g)}"
+                        msg
                     )
 
             return new_params, new_first_moments, new_second_moments
@@ -247,8 +253,8 @@ def _adam_update_recursive(
         return updated_params
 
     def _initialize_like(
-        self, gradients: Union[List[float], List[List[float]]]
-    ) -> Union[List[float], List[List[float]]]:
+        self, gradients: list[float] | list[list[float]]
+    ) -> list[float] | list[list[float]]:
         """
         Initialize moments with same structure as gradients, filled with zeros.
 
@@ -301,8 +307,8 @@ def __str__(self) -> str:
     print("This is a classic non-convex optimization test function.")
     print("Global minimum at (1, 1) with f(1,1) = 0")
 
-    from .sgd import SGD
     from .adagrad import Adagrad
+    from .sgd import SGD
 
     # Initialize optimizers for comparison
     sgd = SGD(learning_rate=0.001)
@@ -318,7 +324,7 @@ def rosenbrock(x: float, y: float) -> float:
         """Rosenbrock function: f(x,y) = 100*(y-x²)² + (1-x)²"""
         return 100 * (y - x * x) ** 2 + (1 - x) ** 2
 
-    def rosenbrock_gradient(x: float, y: float) -> List[float]:
+    def rosenbrock_gradient(x: float, y: float) -> list[float]:
         """Gradient of Rosenbrock function"""
         df_dx = -400 * x * (y - x * x) - 2 * (1 - x)
         df_dy = 200 * (y - x * x)
@@ -355,7 +361,7 @@ def rosenbrock_gradient(x: float, y: float) -> List[float]:
                 f"  Adam:    f = {f_adam:10.3f}, x = ({x_adam[0]:6.3f}, {x_adam[1]:6.3f})"
             )
 
-    print(f"\\nFinal Results (target: x=1, y=1, f=0):")
+    print("\\nFinal Results (target: x=1, y=1, f=0):")
     f_final_sgd = rosenbrock(x_sgd[0], x_sgd[1])
     f_final_adagrad = rosenbrock(x_adagrad[0], x_adagrad[1])
     f_final_adam = rosenbrock(x_adam[0], x_adam[1])
 
@@ -8,7 +8,6 @@
 from __future__ import annotations
 
 from abc import ABC, abstractmethod
-from typing import List, Union
 
 
 class BaseOptimizer(ABC):
@@ -41,16 +40,17 @@ def __init__(self, learning_rate: float = 0.01) -> None:
             0.1
         """
         if learning_rate <= 0:
-            raise ValueError(f"Learning rate must be positive, got {learning_rate}")
+            msg = f"Learning rate must be positive, got {learning_rate}"
+            raise ValueError(msg)
 
         self.learning_rate = learning_rate
 
     @abstractmethod
     def update(
         self,
-        parameters: Union[List[float], List[List[float]]],
-        gradients: Union[List[float], List[List[float]]],
-    ) -> Union[List[float], List[List[float]]]:
+        parameters: list[float] | list[list[float]],
+        gradients: list[float] | list[list[float]],
+    ) -> list[float] | list[list[float]]:
         """
         Update parameters using gradients.
 
@@ -68,7 +68,6 @@ def update(
         Raises:
             ValueError: If parameters and gradients have different shapes
         """
-        pass
 
     def reset(self) -> None:
         """
@@ -78,7 +77,6 @@ def reset(self) -> None:
         or when you want to clear any accumulated state (like momentum).
         Default implementation does nothing, but optimizers with state should override.
         """
-        pass
 
     def __str__(self) -> str:
         """String representation of the optimizer."""
 
@@ -15,8 +15,6 @@
 
 from __future__ import annotations
 
-from typing import List, Union, Tuple
-
 from .base_optimizer import BaseOptimizer
 
 
@@ -87,16 +85,17 @@ def __init__(self, learning_rate: float = 0.01, momentum: float = 0.9) -> None:
         super().__init__(learning_rate)
 
         if not 0 <= momentum < 1:
-            raise ValueError(f"Momentum must be in [0, 1), got {momentum}")
+            msg = f"Momentum must be in [0, 1), got {momentum}"
+            raise ValueError(msg)
 
         self.momentum = momentum
         self._velocity = None  # Will be initialized on first update
 
     def update(
         self,
-        parameters: Union[List[float], List[List[float]]],
-        gradients: Union[List[float], List[List[float]]],
-    ) -> Union[List[float], List[List[float]]]:
+        parameters: list[float] | list[list[float]],
+        gradients: list[float] | list[list[float]],
+    ) -> list[float] | list[list[float]]:
         """
         Update parameters using Momentum SGD rule.
 
@@ -116,10 +115,10 @@ def update(
         """
 
         def _check_shapes_and_get_velocity(
-            parameters: Union[float, List[Union[float, List[float]]]], 
-            gradients: Union[float, List[Union[float, List[float]]]], 
-            velocity_values: Union[float, List[Union[float, List[float]]]]
-        ) -> Tuple[Union[float, List[Union[float, List[float]]]], Union[float, List[Union[float, List[float]]]]]:
+            parameters: float | list[float | list[float]],
+            gradients: float | list[float | list[float]],
+            velocity_values: float | list[float | list[float]]
+        ) -> tuple[float | list[float | list[float]], float | list[float | list[float]]]:
             # Handle scalar case
             if isinstance(parameters, (int, float)):
                 if not isinstance(gradients, (int, float)):
@@ -139,10 +138,13 @@ def _check_shapes_and_get_velocity(
 
             # Handle list case
             if len(parameters) != len(gradients):
-                raise ValueError(
+                msg = (
                     f"Shape mismatch: parameters length {len(parameters)} vs "
                     f"gradients length {len(gradients)}"
                 )
+                raise ValueError(
+                    msg
+                )
 
             if velocity_values is None:
                 velocity_values = [None] * len(parameters)
@@ -152,7 +154,7 @@ def _check_shapes_and_get_velocity(
             new_params = []
             new_velocity = []
 
-            for i, (p, g, v) in enumerate(zip(parameters, gradients, velocity_values)):
+            for _i, (p, g, v) in enumerate(zip(parameters, gradients, velocity_values)):
                 if isinstance(p, list) and isinstance(g, list):
                     # Recursive case for nested lists
                     new_p, new_v = _check_shapes_and_get_velocity(p, g, v)
@@ -169,8 +171,9 @@ def _check_shapes_and_get_velocity(
                     new_params.append(new_p)
                     new_velocity.append(new_v)
                 else:
+                    msg = f"Shape mismatch: inconsistent types {type(p)} vs {type(g)}"
                     raise ValueError(
-                        f"Shape mismatch: inconsistent types {type(p)} vs {type(g)}"
+                        msg
                     )
 
             return new_params, new_velocity
@@ -187,8 +190,8 @@ def _check_shapes_and_get_velocity(
         return updated_params
 
     def _initialize_velocity_like(
-        self, gradients: Union[List[float], List[List[float]]]
-    ) -> Union[List[float], List[List[float]]]:
+        self, gradients: list[float] | list[list[float]]
+    ) -> list[float] | list[list[float]]:
         """
         Initialize velocity with the same structure as gradients, filled with zeros.
 
@@ -271,7 +274,7 @@ def __str__(self) -> str:
                 f"  Momentum: f = {f_momentum:.6f}, x = ({x_momentum[0]:6.3f}, {x_momentum[1]:6.3f})"
             )
 
-    print(f"\\nFinal comparison:")
+    print("\\nFinal comparison:")
     f_final_sgd = x_sgd[0] ** 2 + 10 * x_sgd[1] ** 2
     f_final_momentum = x_momentum[0] ** 2 + 10 * x_momentum[1] ** 2
     print(f"SGD final loss: {f_final_sgd:.6f}")