递归算法大家应该都不陌生吧,其实最开始遇见递归应该是在数学课上,类似于f(x)=f(x-1)+f(x+1),f(1)=1,f(2)=4,f(3)=3这种数学题大家应该见过不少,其实思想就是层层递归,最终将目标值用f(1),f(2),f(3)表示。
之前做个一个需求,需要实现类似操作系统文件夹的功能,我们用MySQL数据库记录数据,表字段有4列,分别是id,index_name,pid,is_directory,index_name记录文件或文件的名字,pid记录它的父级id,is_directory标记它是文件还是文件夹。记录被存下以后,就涉及到取数据的问题了,我们前端需要的目标数据结构是这样的
[{ "id" :1, "name" : "./" },{ "id" :2, "name" : "./1.txt" }, { "id" :3, "name" : "./dir1/" }, { "id" :4, "name" : "./dir1/2.txt" },...] |
有点类似linux系统的tree命令。
第一版代码是这样的:
tree = [] def getTree(pid): return for index in childIndexes: if len(tree) == 0: if index.is_directory==1 tree.append( { 'id' :index. id , 'name' : './' +index.index_name+ '/' }) getTree(index. id ) else : tree.append( { 'id' :index. id , 'name' : '/' +index.index_name}) else : for item in tree: if item[ 'id' ] == index. id if item.is_directory==1: tree.append({ 'id' :index. id , 'name' : item[ 'name' ]+index.index_name+ '/' }) else : tree.append ( { 'id' :index. id , 'name' :item[ 'name' ]+index.index_name } ) |
大概看一下这个算法的时间复杂度,第一层的遍历时间复杂度是n,第二层遍历的时间复杂度是n,内层的时间复杂度是O(n^2),再加上递归,最后的时间复杂度是O(2^n*n^2),这个算法可见很粗糙,假如递归深度到是100,最后执行效率简直会让人头皮发麻。接下来我们考虑一下如何优化。
第二版代码:
tree = [] def getTree(pid,path= './' ): return for index in childIndexes: if len(tree) == 0: if index.is_directory==1 tree.append({ 'id' :index. id , 'name' :path+index.index_name+ '/' }) getTree(index. id , path+index.index_name+ '/' ) else : tree.append({ 'id' :index. id , 'name' :path+index.index_name}) else : if item.is_directory==1: tree.append({ 'id' :index. id , 'name' :path+index.index_name+ '/' }) else : tree.append({ 'id' :index. id , 'name' :path+index.index_name}) |
我们用变量保存每一次的path,这次我们看看时间复杂度是多少。第一层遍历时间复杂度是O(n),加上递归,最后的时间复杂度是O(2^n*n),不算太理想,最起码比第一次好点。
再看看一个面试的常见的题目,斐波拉契数列,n=1,1,3,5,8,13...,求第n位是多少?
一看首先就想到了递归的方式:
def fibSquence(n): if n in (1,2): return fibSquence(n-1)+ fibSquence(n-2) |
这个算法的时间复杂度是O(2^n),关于时间复杂度具体看调用次数便能明白。我们考虑一下如何优化,比如求n=3是,需要先求n=2,n=1,但是最开始n=1,n=2已经求过,多了两步重复计算。
下面是优化的代码:
fibMap = {1:1,2:2} def fibSquence(n): else : result = fibSquence(n-1)+ fibSquence(n-2) fibMap.update({n:result}) return result |
我们用map报存中间值,map是基于hash实现的,时间复杂度是O(1),这样这个算法的时间复杂度就是O(n)。
但是事实上这个问题大可不必用递归方式求解
fibMap = {1:1,2:2} def fibSquence(n): else : for i in range(3,n+1): fibMap.update({i:fibMap[i-1]+fibMap[i-2]}) return fibMap[n] |
这样我们只用一次遍历,便可以求出目标值。
递归算法的优化大概就是避免重复运算,将中金状态保存起来,以便下次使用,从结构上来看,是将时间复杂度转换为空间复杂度来解决。递归算法的效率其实是非常低的,能不用递归就尽量不用递归;当然了也要具体问题具体对待,比如说开始提到我做的项目遇到的问题,不用递归我还真想不出其他更好的方式解决。