教与学优化算法(Teaching–Learning-Based Optimization, TLBO)是由Rao等提出的新型群智能算法,受老师指导学生和学生间互助学习的启发而产生,工作过程分为两部分:第一部分为“教阶段”,第二部分为“学阶段”。“教阶段”意味着向教师(当前最优解)学习,“学阶段”意味着通过学习者(所有个体)之间的互动进行学习。
老师为最优适应度个体,学生通过向老师学习提高成绩,其数学表达式为:
学阶段采用随机选择学习对象的方式实现学生间的互助学习以进一步提高成绩,可表示为:
为了提高算法的精度,在算法后期(本文为预设迭代次数的2/3后开始)引入教师个体执行动态随机搜索(Dynamic Random Search, DRS)。
DRS算法步骤如下:
输入: 个体X, 迭代次数M 输出: 个体X 步骤1 初始化步长d 步骤2 生成向量X'∈[-d,d] 步骤4 生成向量 X1=X+X'和X2=X-X' 步骤5 选择 X1,X2,X 中优者作为 X 步骤6 调整步长d 步骤7 迭代没有结束则转, 步骤2; 否则输出X, 结束算法
动态自适应教与学优化算法(Dynamic Self-adapting Learning TLBO, SLTLBO)算法步骤如下:
将DSLTLBO算法分别与DE、TLBO进行对比,设置种群规模为30,最大迭代次数为500,每个算法独立运行30次,以文献[1]中的F1、F4、F5、F7、F9、F10为例,F9为2维,其余均为30维。
结果显示如下:
函数:F1 DE:平均值:0.00022807,标准差:0.00012011,最差值: 0.00072521,最优值:0.00010925 TLBO:平均值:3.26e-83,标准差:6.8668e-83,最差值: 3.3958e-82,最优值:1.5029e-85 DSLTLBO:平均值:0,标准差:0,最差值: 0,最优值:0 函数:F4 DE:平均值:165.5618,标准差:43.3656,最差值: 263.1405,最优值:50.0132 TLBO:平均值:24.6542,标准差:0.59487,最差值: 25.9268,最优值:23.22 DSLTLBO:平均值:25.9989,标准差:0.58726,最差值: 27.7658,最优值:24.9899 函数:F5 DE:平均值:0.0045841,标准差:0.0077149,最差值: 0.031694,最优值:0.00037177 TLBO:平均值:0,标准差:0,最差值: 0,最优值:0 DSLTLBO:平均值:0,标准差:0,最差值: 0,最优值:0 函数:F7 DE:平均值:32028.4572,标准差:4835.5427,最差值: 39584.3937,最优值:21203.0938 TLBO:平均值:1.0555e-17,标准差:2.5e-17,最差值: 1.3019e-16,最优值:4.0976e-21 DSLTLBO:平均值:6.9416e-321,标准差:0,最差值: 2.0787e-319,最优值:0 函数:F9 DE:平均值:-1.0316,标准差:6.7752e-16,最差值: -1.0316,最优值:-1.0316 TLBO:平均值:-1.0316,标准差:6.7752e-16,最差值: -1.0316,最优值:-1.0316 DSLTLBO:平均值:-1.0316,标准差:6.7122e-16,最差值: -1.0316,最优值:-1.0316 函数:F10 DE:平均值:0.3541,标准差:0.02903,最差值: 0.41504,最优值:0.31216 TLBO:平均值:0.016203,标准差:0.0118,最差值: 0.037224,最优值:0.0097159 DSLTLBO:平均值:0.0097159,标准差:1.8507e-09,最差值: 0.0097159,最优值:0.0097159
实验表明,本文提出的DSLTLBO算法具有较好的收敛速度和求解精度。
[1] 李丽荣, 李木子, 李崔灿, 王培崇. 具有动态自适应学习机制的教与学优化算法[J]. 计算机工程与应用, 2020, 56(19): 62-67.