遗传算法的概念是在 1975 年由密切根大学的 J.Holland 提出的,这是一种通过模拟自然进化过程寻找最优解的方法。它遵循达尔文的物竞天择,适者生存的进化准则。基本思想:
初始一个种群,选择种群中适应度高的个体进行交叉变异。然后再将适应度低的个体淘汰,留下适应度高的个体进行繁殖,这样不断的进化,最终留下的都是优秀的个体。
在遗传算法中,我们首先需要将要解决的问题映射成一个数学问题,也就是所谓的数学建模,那么这个问题的一个可行解即被称为一条染色体或个体。如:
3x+4y+5z<100
[1,2,3],[2,3,4],[3,2,1]均为这个函数的可行解,这些可行解在遗传算法中均被称为染色体,每一个元素就被称为染色体上的一个基因。
遗传算法的运算对象是表示染色体的符号串,所以必须把变量 x,y,z 编码为一种符号串。常见的编码方式如用无符号二进制整数来表示。解码即将二进制整数转换回最初的表现型。
编码: 5 --> 0101。
解码: 0101 --> 5。
遗传算法是对群体进行的进化操作,需要给其准备一些表示起始搜索点的初始群体数据。假如群体规模的大小取为 4,即群体由 4 个染色体组成,每个染色体可通过随机方法产生。
如: 011101 , 101011 , 011100 , 111001。
适应度函数:遗传算法中以染色体适应度的大小来评定各个染色体的优劣程度,从而决定其遗传机会的大小。
选择函数:自然界中,越适应的个体就越有可能繁殖后代。但是也不能说适应度越高的就肯定后代越多,只能是从概率上来说更多。常用的选择方法有轮盘赌选择法。
若表示每个染色体的适应度,则每个个体遗传下来的概率为:
由公式可以看出,适应度越高,则遗传下来的概率就越大,好比赌轮盘,轮盘上所占面积越大,则被小球滚到的概率就越大。
交叉是遗传算法中产生新的个体的主要操作过程,以一定的概率决定个体间是否进行交叉操作。
如上图为父辈染色体进过交叉后产生新的染色体的过程。
变异为另一种产生新个体的操作,它可以为种群带来多样性:
也就是将我的染色体中的基因,随机的由0变成1,或1变成0。
- 初始化种群
- 计算适应度
- 选择适应度高的个体
- 通过交叉变异选择新的染色体
- 终止进化
本关任务是使用遗传算法求解目标函数最大值,首先需要随机产生很多个解,即初始化种群,代码如下:
- #初始化种群
- pop = np.random.randint(2, size=(POP_SIZE, DNA_SIZE))
- # Size函数需要传入两个参数 POP_SIZE为解的个数,即染色体个数。DNA_SIZE为染色体长度
其中POP_SIZE为解的个数,即染色体个数。DNA_SIZE为染色体长度。
由于染色体为二进制编码,所以还需要将二进制转换为浮点数的解码方法:
- #解码
- def translateDNA(pop):
- return pop.dot(2 ** np.arange(DNA_SIZE)[::-1]) / float(2**DNA_SIZE-1) * X_BOUND[1]
上述代码中: pop.dot(2 ** np.arange(DNA_SIZE)[ : : -1])已经转换成十进制但是需要归一化到 0~5 ,如有 1111 这么长的 DNA,要产生的十进制数范围是 [0, 15] ,而所需范围是 [-1, 1] ,就将 [0,15] 缩放到 [-1,1] 这个范围。
a[ : : -1]相当于a[-1:-len(a)-1:-1],也就是从最后一个元素到第一个元素复制一遍。所以你看到一个倒序,np.arange(DNA_SIZE)[ : : -1]得到 10,9,8,...,0 。
如将 10101 转换到 0 到 5 之间:
然后计算每个染色体的适应度,由于是求解最大值,函数值越大则越应该被选择,所以,将每个染色体对应的函数值减去最小值作为适应度:
- #获取染色体适应度
- def get_fitness(pred):
- return pred + 1e-3 - np.min(pred)
再选择适应度高的染色体:
- #选择适应度高的染色体
- def select(pop, fitness):
- idx = np.random.choice(np.arange(POP_SIZE), size=POP_SIZE, replace=True,
- p=fitness/fitness.sum())
- return pop[idx]
再对染色体进行交叉变异操作:
- #交叉
- def crossover(parent, pop):
- if np.random.rand() < CROSS_RATE:
- i_ = np.random.randint(0, POP_SIZE, size=1)
- cross_points = np.random.randint(0, 2, size=DNA_SIZE).astype(np.bool)
- parent[cross_points] = pop[i_, cross_points]
- return parent
- #变异
- def mutate(child):
- for point in range(DNA_SIZE):
- if np.random.rand() < MUTATION_RATE:
- child[point] = 1 if child[point] == 0 else 0
- return child
总流程如下:
- def F(x): return np.sin(10*x)*x + np.cos(2*x)*x
- def ga(F):
- '''
- F:需要求解的函数
- '''
- #初始化种群
- pop = np.random.randint(2, size=(POP_SIZE, DNA_SIZE))
- #开始进化
- for _ in range(N_GENERATIONS):
- #计算函数值
- F_values = F(translateDNA(pop))
- #计算适应度
- fitness = get_fitness(F_values)
- #选择适应度高的个体
- pop = select(pop, fitness)
- pop_copy = pop.copy()
- #通过交叉变异选择新的染色体
- for parent in pop:
- #交叉产生子代
- child = crossover(parent, pop_copy)
- #变异产生子代
- child = mutate(child)
- #子代代替父代
- parent[:] = child
- #获取最优解
- x = translateDNA(pop)[-1]
- return x
其中:
- N_GENERATIONS为进化轮数。
- CROSS_RATE为交叉概率。
- MUTATION_RATE 为变异概率。
- X_BOUND 为函数定义域。
实现遗传算法。并求解函数f(x)在区间 [0,5] 上的最大值:
函数图像如下:
- #encoding=utf8
- import numpy as np
- DNA_SIZE = 10
- POP_SIZE = 100
- CROSS_RATE = 0.8
- MUTATION_RATE = 0.003
- N_GENERATIONS = 500
- X_BOUND = [0, 5]
- #获取染色体适应度
- def get_fitness(pred):
- return pred + 1e-3 - np.min(pred)
- #解码
- def translateDNA(pop):
- return pop.dot(2 ** np.arange(DNA_SIZE)[::-1]) / float(2**DNA_SIZE-1) * X_BOUND[1]
- #选择适应度高的染色体
- def select(pop, fitness):
- idx = np.random.choice(np.arange(POP_SIZE), size=POP_SIZE, replace=True,
- p=fitness/fitness.sum())
- return pop[idx]
- #交叉
- def crossover(parent, pop):
- if np.random.rand() < CROSS_RATE:
- i_ = np.random.randint(0, POP_SIZE, size=1)
- cross_points = np.random.randint(0, 2, size=DNA_SIZE).astype(np.bool)
- parent[cross_points] = pop[i_, cross_points]
- return parent
- #变异
- def mutate(child):
- for point in range(DNA_SIZE):
- if np.random.rand() < MUTATION_RATE:
- child[point] = 1 if child[point] == 0 else 0
- return child
- def ga(F):
- '''
- F:需要求解的函数
- x:最优解
- '''
- #初始化种群
- # 初始化种群(随机生成二进制染色体)
- pop = np.random.randint(2, size=(POP_SIZE, DNA_SIZE))
- #开始进化
- for _ in range(N_GENERATIONS):
- #计算函数值
- F_values = F(translateDNA(pop))
- #计算适应度
- fitness = get_fitness(F_values)
- #选择适应度高的个体
- pop = select(pop, fitness)
- pop_copy = pop.copy()
- #通过交叉变异选择新的染色体
- for parent in pop:
- #交叉产生子代
- child = crossover(parent, pop_copy)
- #变异产生子代
- child = mutate(child)
- #子代代替父代
- parent[:] = child
- #获取最优解
- x = translateDNA(pop)[-1]
- return x