Pygad优化：当适应度饱和时如何重新初始化种群以避免局部最优

霞舞

发布时间：2025-10-17 09:20:37

548人浏览过

来源于php中文网

原创

Pygad优化：当适应度饱和时如何重新初始化种群以避免局部最优

本文探讨了在使用pygad进行优化时，算法可能陷入局部最优解的问题。针对适应度长时间未改善的情况，我们提供了一种解决方案：利用`on_generation`回调函数监测适应度饱和状态，并在检测到饱和时，通过调用`initialize_population`方法重新初始化种群，从而帮助算法跳出局部最优，继续探索更广阔的解空间，以期找到全局最优解。

在使用Pygad等遗传算法库解决优化问题时，一个常见的挑战是算法可能过早地收敛到局部最优解，而不是全局最优解。这通常发生在适应度（fitness）在一定数量的代数内不再显著改善，即达到“饱和”状态时。为了克服这一限制，我们可以实施一种策略：在算法运行时动态监测适应度，一旦发现适应度饱和，就重新初始化种群，从而为算法注入新的多样性，使其有机会跳出当前的局部最优区域，继续探索解空间。

利用on_generation回调函数监测适应度饱和

Pygad提供了强大的回调机制，允许用户在遗传算法的不同阶段执行自定义逻辑。其中，on_generation回调函数在每一代完成计算后被调用，这为我们提供了检查当前适应度状态的理想时机。

在on_generation函数中，我们可以访问ga_instance对象，该对象包含了当前遗传算法的所有状态信息，包括历史最佳适应度值。通过比较最近几代的最佳适应度，我们可以判断适应度是否已经饱和。

def on_generation(ga_i):
    # 确保已经运行了足够多的代数来检查饱和
    if ga_i.generations_completed > 10: # 例如，检查过去10代的饱和情况
        # 检查当前最佳适应度是否与10代前的最佳适应度相同
        if ga_i.best_solutions_fitness[-1] == ga_i.best_solutions_fitness[-10]:
            # 适应度饱和，执行种群重新初始化
            pass # 后续将在此处添加初始化代码

重新初始化种群

当检测到适应度饱和时，我们需要重新生成一个新的种群。Pygad的ga_instance对象提供了一个initialize_population方法，可以直接用于此目的。这个方法会根据遗传算法实例的初始参数（如基因的范围、基因类型等）生成一个新的随机种群，并将其赋给ga_i.population属性。

为了确保新种群的生成与当前实例的配置一致，我们应该利用ga_i中已有的参数来调用initialize_population：

Elser AI Comics

一个免费且强大的AI漫画生成工具，助力你三步创作自己的一出好戏

下载

low: 基因的下限范围，可使用ga_i.init_range_low。
high: 基因的上限范围，可使用ga_i.init_range_high。
allow_duplicate_genes: 是否允许重复基因，可使用ga_i.allow_duplicate_genes。
mutation_by_replacement: 突变是否通过替换进行，通常设为True。
gene_type: 基因的数据类型，可使用ga_i.gene_type。

将这些整合到on_generation回调函数中，完整的实现示例如下：

import pygad

def fitness_func(ga_instance, solution, solution_idx):
    # 这是一个示例适应度函数，实际应用中会根据具体问题定义
    # 返回一个固定的值，用于演示适应度饱和的情况
    return 5

def on_generation(ga_i):
    # 确保至少运行了10代才能检查饱和
    if ga_i.generations_completed > 10:
        # 检查过去10代的最佳适应度是否保持不变
        # 如果当前代和10代前的最佳适应度相同，则认为适应度饱和
        if ga_i.best_solutions_fitness[-1] == ga_i.best_solutions_fitness[-10]:
            print(f"Generation {ga_i.generations_completed}: Fitness saturated. Reinitializing population.")
            # 重新初始化种群，使用当前的基因范围和设置
            ga_i.initialize_population(low=ga_i.init_range_low,
                                       high=ga_i.init_range_high,
                                       allow_duplicate_genes=ga_i.allow_duplicate_genes,
                                       mutation_by_replacement=True,
                                       gene_type=ga_i.gene_type)
            # 此时，新的种群已经创建并赋值给 'population' 参数，算法将基于新种群继续迭代。

# 初始化PyGAD实例
ga_instance = pygad.GA(num_generations=50, # 总共运行50代
                       sol_per_pop=10,    # 每代10个解决方案
                       num_genes=2,       # 每个解决方案有2个基因
                       num_parents_mating=2, # 每次交配选择2个父代
                       fitness_func=fitness_func, # 适应度函数
                       init_range_low=0,  # 基因的下限
                       init_range_high=10, # 基因的上限
                       on_generation=on_generation, # 注册回调函数
                       gene_type=float)   # 基因类型为浮点数

# 运行遗传算法
ga_instance.run()

# 打印最终结果（可选）
print("Optimization completed.")
print(f"Best solution found: {ga_instance.best_solution()[0]}")
print(f"Best solution fitness: {ga_instance.best_solution()[1]}")

在上述示例中，由于fitness_func总是返回5，模拟了适应度迅速饱和的场景。当算法运行到第11代时，它会发现从第1代到第10代的最佳适应度都是5，从而触发种群重新初始化。

注意事项与总结

饱和阈值：示例中使用了10代作为判断适应度饱和的阈值。在实际应用中，这个阈值应根据问题的复杂度和收敛速度进行调整。过小的阈值可能导致频繁的重初始化，影响收敛；过大的阈值则可能让算法在局部最优中停留过久。
重新初始化策略：本方法采用完全随机初始化。对于某些问题，可以考虑更复杂的策略，例如保留当前种群中的一部分优秀个体，并仅随机化其余个体，以平衡探索和利用。
性能影响：频繁的种群重初始化会增加计算开销，但对于避免陷入局部最优、寻找更高质量解来说，这通常是值得的。
initialize_population的参数：确保initialize_population方法使用的参数与ga_instance的初始设置一致，以保证新种群的有效性。

通过在on_generation回调函数中智能地监测适应度饱和并重新初始化种群，我们可以显著提高Pygad等遗传算法在复杂优化问题中找到全局最优解的能力，有效地避免了算法过早陷入局部最优的困境。

如何让自定义 Python 类无缝兼容 NumPy 运算

Python调试时行为异常：断点导致程序正常而直接运行报错的真相揭秘

Python调试中“设断点正常、不设断点报错”的诡异行为解析

如何在 Kivy 应用中正确引用屏幕内的控件（如 TextInput）

Python调试时断点影响程序行为的真相揭秘