
在使用 pygad 进行优化时,算法可能因陷入局部最优而导致适应度饱和。本文将详细介绍如何在 `on_generation` 回调函数中检测适应度饱和情况,并在满足条件时通过调用 `ga_i.initialize_population()` 方法重新生成新的种群,从而帮助算法跳出局部最优,继续探索更优解空间。
在遗传算法(GA)的实践中,一个常见的问题是算法过早收敛到局部最优解,导致在预设的迭代次数(代数)完成之前,种群的适应度便不再提升,即出现适应度饱和现象。这通常意味着算法失去了探索新解空间的能力。Pygad 提供了一个强大的回调机制,允许用户在遗传算法的各个阶段插入自定义逻辑,其中 on_generation 回调函数便是解决此问题的关键。
识别与应对适应度饱和
为了避免算法陷入局部最优,我们可以在每一代结束后检查当前种群的最佳适应度是否在连续的多代中保持不变。如果适应度持续饱和达到一定代数,则可以判断算法可能陷入了局部最优。此时,通过重新初始化种群,我们可以强制算法放弃当前可能不理想的探索路径,转而从新的随机状态开始,从而增加找到全局最优解的机会。
Pygad 的 GA 实例对象 ga_i 提供了访问其内部状态和方法的能力,这使得在 on_generation 回调中实现种群重初始化成为可能。
实现步骤
- 定义适应度函数 (fitness_func): 这是遗传算法的核心,用于评估每个解决方案的优劣。
- 定义 on_generation 回调函数: 此函数会在每一代完成后被调用,接收当前的 GA 实例 ga_i 作为参数。
-
在 on_generation 中检测饱和:
- 首先,确保算法已经运行了足够的代数,以便有历史数据可供比较。
- 通过 ga_i.best_solutions_fitness 列表访问历史最佳适应度。比较最近几代的最佳适应度是否相同。
-
在饱和时重新初始化种群:
- 如果检测到适应度饱和,调用 ga_i.initialize_population() 方法。
- 此方法需要一些参数来定义新种群的基因范围、类型等。这些参数可以直接从当前的 ga_i 实例中获取,例如 ga_i.init_range_low, ga_i.init_range_high, ga_i.allow_duplicate_genes, ga_i.gene_type 等。
示例代码
以下是一个具体的 Pygad 实现示例,展示了如何在适应度饱和10代后重新初始化种群:
import pygad
# 1. 定义适应度函数
def fitness_func(ga_instance, solution, solution_idx):
"""
示例适应度函数,此处为简化演示,始终返回固定值5。
实际应用中,此函数应根据具体优化问题计算解决方案的适应度。
"""
return 5
# 2. 定义 on_generation 回调函数
def on_generation(ga_i):
"""
在每一代结束后执行的回调函数。
用于检测适应度饱和并重新初始化种群。
"""
# 确保算法至少运行了足够多的代数,以便进行历史比较
if ga_i.generations_completed > 10:
# 3. 检查适应度是否饱和
# 比较当前代最佳适应度与前10代最佳适应度是否相同
if ga_i.best_solutions_fitness[-1] == ga_i.best_solutions_fitness[-10]:
print(f"检测到适应度在第 {ga_i.generations_completed} 代饱和,正在重新初始化种群...")
# 4. 重新初始化新种群
# 使用当前实例的参数来初始化新种群,保持基因空间一致性
ga_i.initialize_population(low=ga_i.init_range_low,
high=ga_i.init_range_high,
allow_duplicate_genes=ga_i.allow_duplicate_genes,
mutation_by_replacement=True, # 示例参数,可根据需要调整
gene_type=ga_i.gene_type)
# 此时,一个新的种群已创建并赋值给 'population' 参数,算法将从新种群开始下一代
print("种群已重新初始化。")
# 初始化 Pygad GA 实例
ga_instance = pygad.GA(num_generations=50, # 总代数
sol_per_pop=10, # 每代解决方案数量
num_genes=2, # 每个解决方案的基因数量
num_parents_mating=2, # 每次交配的父代数量
fitness_func=fitness_func, # 适应度函数
on_generation=on_generation, # 注册 on_generation 回调
init_range_low=-10, # 基因初始范围下限
init_range_high=10, # 基因初始范围上限
gene_type=float) # 基因类型
# 运行遗传算法
ga_instance.run()
# 打印最终结果(可选)
print("优化完成。")
print(f"最佳解决方案: {ga_instance.best_solution()[0]}")
print(f"最佳解决方案的适应度: {ga_instance.best_solution()[1]}")注意事项与总结
- 饱和判断的代数: 示例中使用了10代作为判断饱和的依据。在实际应用中,这个数字应根据问题的复杂度和算法的收敛速度进行调整。过小的数值可能导致频繁的重初始化,影响收敛;过大的数值可能导致算法在局部最优中停留过久。
- initialize_population() 参数: ga_i.initialize_population() 方法的参数应根据您的具体问题和期望的探索行为进行设置。通常,直接使用 ga_i 实例中已有的 init_range_low、init_range_high、gene_type 等参数是一个合理的选择,以确保新种群的基因空间与初始设置一致。
- 对收敛的影响: 重新初始化种群会放弃当前代之前的所有搜索进展,强制算法从头开始探索。这有助于跳出局部最优,但也可能增加达到全局最优所需的总代数。因此,这种策略应作为解决局部最优问题的有效手段,而不是常规操作。
- 适用场景: 当您发现遗传算法在特定问题上反复陷入局部最优,且无法通过调整其他参数(如变异率、交叉率、种群大小等)有效解决时,引入适应度饱和检测和种群重初始化机制是一个值得尝试的策略。
通过上述方法,Pygad 用户可以有效地增强遗传算法的全局搜索能力,减少陷入局部最优的风险,从而提高找到高质量解的可能性。










