W1:什么是模拟退火算法?
模拟退火算法(Simulate Anneal,SA)是一种通用概率演算法,用来在一个大的搜寻空间内找寻命题的最优解。其原理和金属退火的原理近似。将热力学的理论套用到统计学上,金属在加热至高温后维持该温度,并以一种稳定的速度降温,最后使整个系统达到最稳定状态。
而模拟退火算法则是在求解过程中模拟了这一退火过程,即在求解过程中引入随机因素。模拟退火算法以一定的概率来接受一个比当前解要差的解,因此有可能会跳出这个局部的最优解,达到全局的最优解。
W2:为什么要了解模拟退火算法?
模拟退火算法可以尽可能的求出全局最优解,其与登山算法的优势在于加入了随机因素,当获得的值并不是最优的时候将有一定的概率接受这个值,从而有可能跳出当前的局部最优,获得全局最优解。而随着温度的降低,该概率也会相应减少。
粒子在温度T时趋于平衡的概率为exp(-ΔE/(kT))
在温度为T时,出现能量差为dE的降温的概率为P(dE),表示为:P(dE) = exp( dE/(kT) )。其中k是一个常数,exp表示自然指数,且dE<0。所以P和T正相关。这条公式就表示:温度越高,出现一次能量差为dE的降温的概率就越大;温度越低,则出现降温的概率就越小。又由于dE总是小于0(因为退火的过程是温度逐渐下降的过程),因此dE/kT < 0 ,所以P(dE)的函数取值范围是(0,1) 。随着温度T的降低,P(dE)会逐渐降低。所以该概率同样为算法的选择概率。
W3:模拟退火对哪些问题有用?
求NP问题,例如经典的旅行商/邮递员问题时,在近乎无穷的解中获取最优解(贼好用)
H1:模拟退火算法怎么实现?
直接看代码更清晰(城市遍历最短路径)
代码实例(网上代码对应解析):
#include <iostream>
#include <string.h>
#include <stdlib.h>
#include <algorithm>
#include <stdio.h>
#include <time.h>
#include <math.h>
#define N 30 //城市数量
#define T 3000 //初始温度
#define EPS 1e-8 //终止温度
#define DELTA 0.98 //温度衰减率
#define LIMIT 1000 //概率选择上限
#define OLOOP 20 //外循环次数
#define ILOOP 100 //内循环次数(没用到)
using namespace std;
//定义路线结构体
struct Path
{
int citys[N];
double len;
};
//定义城市点坐标
struct Point
{
double x, y;
};
Path bestPath; //记录最优路径
Point p[N]; //每个城市的坐标
double w[N][N]; //两两城市之间路径长度
int nCase; //测试次数
//城市距离
double dist(Point A, Point B)
{
return sqrt((A.x - B.x) * (A.x - B.x) + (A.y - B.y) * (A.y - B.y));
}
//记录两两城市距离
void GetDist(Point p[], int n)
{
for(int i = 0; i < n; i++)
for(int j = i + 1; j < n; j++)
w[i][j] = w[j][i] = dist(p[i], p[j]);
}
//输入坐标
void Input(Point p[], int &n)
{
scanf("%d", &n);
for(int i = 0; i < n; i++)
scanf("%lf %lf", &p[i].x, &p[i].y);
}
//初始化 ,显示一开始按顺序的长度
void Init(int n)
{
nCase = 0;
bestPath.len = 0;
for(int i = 0; i < n; i++)
{
bestPath.citys[i] = i;
if(i != n - 1)
{
// printf("%d--->", i);
bestPath.len += w[i][i + 1];
}
else
;
// printf("%d\n", i);
}
// printf("\nInit path length is : %.3lf\n", bestPath.len);
printf("-----------------------------------\n\n");
}
//输出
void Print(Path t, int n)
{
printf("Path is : ");
for(int i = 0; i < n; i++)
{
if(i != n - 1)
printf("%d-->", t.citys[i]);
else
printf("%d\n", t.citys[i]);
}
printf("\nThe path length is : %.3lf\n", t.len);
printf("-----------------------------------\n\n");
}
//算下一个解
Path GetNext(Path p, int n)
{
Path ans = p;
//rand返回0-randmax之间随机整数
//意思是将0到RAND_MAX之间的整数等分成十份,如果随机的生成数落在第一份,则映射成0,如落在第二份,则映射成1。。。。。。如落在第十分,则映射成9.
int x = (int)(n * (rand() / (RAND_MAX + 1.0)));//【0,n)
int y = (int)(n * (rand() / (RAND_MAX + 1.0)));//【0,n)
while(x == y)
{
x = (int)(n * (rand() / (RAND_MAX + 1.0)));
y = (int)(n * (rand() / (RAND_MAX + 1.0)));
}
//x,y不相等
swap(ans.citys[x], ans.citys[y]);//交换 ,得到随机的城市路线排布
ans.len = 0;
for(int i = 0; i < n - 1; i++)
ans.len += w[ans.citys[i]][ans.citys[i + 1]];//计算路径总长度
//cout << "nCase = " << nCase << endl;//第几个解
//Print(ans, n);//输出每个解
nCase++;
return ans;
}
//模拟退火
void SA(int n)
{
double t = T;//初始温度
srand((unsigned)(time(NULL)));//随机种子
Path curPath = bestPath;//当前所在路径
Path newPath = bestPath;//新路径
int P_L = 0;// 选择计数
int P_F = 0;// 外循环计数
while(1) //外循环,主要更新参数t,模拟退火过程
{
for(int i = 0; i < ILOOP; i++) //内循环,寻找在一定温度下的最优值
{
newPath = GetNext(curPath, n);//随机出解
double dE = newPath.len - curPath.len;//新路径比已知路径如何
if(dE < 0) //如果找到更优值,直接更新(新路径更短更优)
{
curPath = newPath;//更新
P_L = 0;
P_F = 0;
}
else
{
double rd = rand() / (RAND_MAX + 1.0);//随机个【0,1)小数
//如果找到比当前更差的解,以一定概率接受该解,并且这个概率会越来越小
//exp,以e为底 ()为指数,返回值
if(exp(dE / t) > rd && exp(dE / t) < 1)//t是初始温度,dE是路径差, rd是随机数 ,热力学公式
curPath = newPath;
P_L++;
}
if(P_L > LIMIT)//到达概率选择上限
{
P_F++;
break;
}
}
if(curPath.len < bestPath.len)
bestPath = curPath;
if(P_F > OLOOP || t < EPS)//外循环已满足 温度到达终止温度
break;//退火结束
t *= DELTA;//每循环一次,温度衰减0.02
}
}
int main(int argc, const char * argv[]) {
int n;
Input(p, n);//输入坐标
GetDist(p, n);//计算距离
Init(n);//初始化
SA(n);//退火
Print(bestPath, n);//输出解集
printf("Total test times is : %d\n", nCase);//循环次数
return 0;
}