摘 要:
单位线推求方法主要有试算法、**法和最小二乘法等,数值法推求结果经常出现锯齿或负值的局部不合理现象,而试错法不能保证结果最优,这两大对立矛盾一直困扰实践应用中单位线的推求。本文提出一种由单位线函数化、单位线初始率定和单位线**修正等步骤构成的单位线推求方法。以组成论为理论依据将流域水文系统视为一个广义**,以Gamma函数表达流域汇流过程规律,并将Gamma函数参数化;以计算汇流过程与实测过程误差最小为约束条件,采用遗传算法率定Gamma函数参数,**初始单位线;采用Collins迭代法对初始单位线进行局部修正,最终完成单位线推求。结合算例与试错法推求结果进行比较**,表明该方法计算的流量过程精度要优于试错法,而洪量计算精度虽然低于试错法,但相对误差为1.00%,完全能够**工程需要。同时,以Gamma函数表达单位线,其参数取值能够揭示流域汇流规律,可以对区域性汇流规律进行数字化空间**。
关键词:
单位线;Gamma函数;遗传算法;Collins迭代法;
作者简介:
杨子昕(1998—),女,硕士研究生,研究方向城市水文。E-mail:769500327@qq.com;
*TANG Xiaonan(1965—),男,副教授,博士,主要从事水力学与河流动力学、洪水灾害与水**研究。E-mail:xiao.tang@xjtlu.edu.cn;
基金:
国家自然科学基金(11772270);
引用:
杨子昕,TANG Xiaonan. 基于 Gamma 函数表征及遗传算法参数率定的单位线推求方法[J]. 水利水电技术( 中英文) ,2021,52( 9) : 32-39.
YANG Zixin,TANG Xiaonan. A unit hydrograph derivation method based on Gamma function characterization and genetic algorithm for parameter optimization[J]. Water Resources and Hydropower Engineering,2021,52( 9) : 32-39.
0 引 言
流域汇流单位线是概念型水文模型汇流计算的重要方法,由L.K.SHERMAN于1932年提出,目前,单位线推求仍然是进行流域降雨径流预报的重要方法。
单位线是指流域上1个单位地面净雨在出口断面形成的地面径流过程。时段可取1 h、3 h、6 h、12 h, 单位净雨(径流深)一般取10 mm。实际发生的净雨一般既不是1个单位,也不是1个时段,计算流域汇流过程就要引入倍比假设和叠加假定。
在本质上,单位线解构了流量过程线并表征了流域汇流特征,即汇流曲线。单位线汇流计算方法是将流域作为一个整体,并假定净雨在整个流域上均匀分布,不考虑系统内部的不均匀性,流域汇流系统为线性时不变系统,同时,视净雨与其所形成的流量过程之间符合线性叠加关系,因此,单位线法具有集总性、线性和时不变性等特征。
在概念上,单位线是流域线性时不变系统的汇流曲线,但在推求方法上,并未考虑流域汇流的物理机制,推求单位线的原则是以系统输入(净雨)通过单位线转换而**的系统响应输出(出口断面流量过程),即要求计算流量和实测流量误差最小,**的推求方法有**法、试错法和最小二乘法等,各种方法详细计算步骤见参考文献[1]。
[1] 李慧珑.水文预报[M].北京:水利水电出版社,1993.LI H L.Hydrological forecast[M].Beijing:China Water & Power Press,1993.
当流域汇流符合线性时不变系统时,**法能得出唯一解,但实际上:(1)实测资料存在误差;(2)流域汇流为非线性时不变系统;(3)线性方程组中,方程式的个数小于未知数的个数,因此,**法不但求不出唯一解,由于误差累积,还常常出现解不合理的现象,如单位线首端或末端呈锯齿状、出现负值等。
试错法首先假定单位线q′i,比较由该单位线推求的流量过程Q′与实测流域过程Q,并不断调试单位线q′i,直至Q′与Q间误差**允许误差,这时单位线即为所求。W.T.COLLINS提出的迭代法,对于净雨时段不均,其中某一个时段特大时,计算收敛较快。Collins迭代法缺点主要有:(1)迭代基于初始单位线,而初始单位线的选择并无严格方法,仍需采用假定单位线;(2)迭代求得的单位线不一定为最优。
最小二乘法将单位线当成连续未知量系列qi,并推求包含各时段未知量的流量Q′,则误差为ε=Q-Q′。通过最小二乘法求误差平方和最小,即min ∑(Q-Q′)2求得在最小二乘意义下单位线。最小二乘法理论上比较完善,但所得结果有时仍会出现局部锯齿状振荡或负值。
其它单位线推求方法还有Z变换法、调和**法等。文献[3]做了常见单位线推求方法的分类和比较工作。
[3] HANSON T L,JOHNSON H P.Unit hydrograph methods compared[J].Transactions of the ASAE,1964,7(4):0448-0451.
数学模拟工具的普及,在假定单位线初始化方面引起广泛关注,通过对单位线线型进行数学**,采用典型函数,如抛物线、P-Ⅲ曲线来描述单位线,建立单位线的数学模型,例如,2参数Gamma分布、3参数Beta分布、2参数Weibull分布和1参数χ2分布等,其中,Gamma函数是最为常用的函数,这种研究方法旨在揭示单位线各变量之间的内在关系,从而使单位线的研究更为深入。
在选定分布函数表征单位线的情况下,如何推求分布函数参数是又一个关键技术,其本质是非线性约束优化问题,例如,模糊回归**法。遗传算法作为一种模拟生物进化的新型随机搜索和优化方法,已在优化领域**广泛应用。很多水文模型**公式的参数优化实质上是利用遗传算法的全局寻优能力。本文以Gamma函数表征单位线,并深入**了单位线遵循该分布的内在机理,继而采用遗传算法率定Gamma函数参数,最后采用Collins迭代法修正**最终单位线。
对于某具体流域,一场洪水的汇流规律具有相对稳定性,采用Gamma函数来表征单位线,能够率定参数使基于该参数组合下的Gamma函数表征的单位线最优,这与采用P-Ⅲ函数通过**其统计参数(均值x¯x¯、变差系数Cv和偏态系数Cs)适线来进行水文**计算的原理非常相似,同时,Gamma函数时段t、参数β和k取值可以参数化地揭示流域汇流区域性特征,这是本文研究的重要意义。
本文方法将整个推求过程分为3部分:(1)根据流域产汇流数据,确定汇流时段,生成Gamma函数;(2)采用遗传算法率定Gamma函数参数,确定初始单位线;(3)采用Collins迭代法,推求最终单位线。
1 原理与方法
1.1 单位线函数化表达的机理
关于分布函数表达单位线的理论基础,张学文先生提出的组织论为研究事物的组成提供了统一的认识模型和计算方法,该理论通过广义**、分布函数和复杂程度3个概念**事物组成,并揭示了随机性事物都遵循的最复杂原理,即熵原理。
连续型随机变量x(或一个广义**的标志变量)如果它的概率密度分布函数f(x)符合函数关系
则,这个概率密度函数称为Gamma分布,β和k为函数的参数,该分布也是著名的皮尔逊概率分布函数簇中的重要一员,称为皮尔逊Ⅲ型分布。Gamma分布曲线有一个峰,但左右不对称。在自然界中服从Gamma分布的现象很常见,该分布对自变量要求具有大于等于零的下限,拟合资料时又比正态分布的弹性大,中国水文界广泛用皮尔逊Ⅲ型分布来模拟水文系列。这些结论大都出于一种**认识,实践验证符合实际,对于其中的理论解释却很少。
文献[10]利用熵原理解释了形成这种分布的物理原因,**公式(1)的结构不难发现,它既具有负指数分布的指数函数部分,也存在幂函数特点。指数分布对应着变量的代数平均值不变的约束,而幂函数对应着变量的几**均值不变的约束,可以推测Gamma分布具有变量的代数平均值和几**均值都是固定值的约束条件。
[10] 张学文.组成论[M].合肥:中国科学技术大学出版社,2003.ZHANG X W.Composition theory[M].Hefei:University of Science and Technology of China Press,2003.
这里用f(x)表示随机变量x的概率密度分布函数,则有
以u代表变量的代数平均值,则有
随机变量x的几**均值v可以用对数的代数平均值表示,则有
随机变量x的熵可以写为
在公式(2)(3)和(4)的约束下,使熵最大反推分布函数时,采用拉格朗日方法构造函数F,则
式中,C1、C2和C3是待定的常数,熵原理要求F最大,将上式对f(·)求偏微商,即偏微商为0,**
上式即为求得的分布函数,它是幂函数和指数函数的乘积,函数结构形式与Gamma函数相同。
实际上,水文变量必然为样本大于零的随机变量,如果某地区的水文**相对稳定,则该地区的水文特征变量的代数平均值和几**均值可以近似为固定值。例如,某流域多年平均径流量基本稳定,即代数平均值为常数;发生极大洪水和极枯径流的概率较小,绝大部分洪水接近多年平均值,即几**均值为常数。尽管如此,每次出现什么样洪水的不确定性最大。这恰恰符合了“在一个广义**(客观事物、系统、抽样实验)中如果变量的代数平均值和几**均值是不变的,而其复杂程度(熵)最大,那么个体取值的概率(占的百分比)必然是Gamma分布(皮尔逊Ⅲ型分布)”。
同时,大量实践**表明,Gamma函数能够反映洪水概率特征,这也是为什么我国理论水文**计算采用皮尔逊Ⅲ 型分布的原因,鉴于此,这里将单位线qi定义为Gamma函数。
当参数β和k取值不同,qi线型不同,如图1所示。
图1 不同参数时的Gamma函数
1.2 基于遗传算法的函数参数率定方法
遗传算法把一组随机生成的可行解作为父代群体,把适应度函数(目标函数或它的一种变换形式)作为父代个体适应**能力的度量,经选择、杂交生成子代个体,后者再经变异,优胜劣汰,如此反复进化迭代,使个体的适应能力不断提高,优秀个体不断向最优点逼近。经过几代,该算法收敛于最佳个体。群体中的最佳个体很可能是最优解或近似最优解。
可以采用遗传算法对Gamma函数的参数进行率定,对公式(8)进行转化,公式为
式中,x1、x2和x3为单位线qi的参数,可采用遗传算法搜索一组最佳参数完成函数率定;i为单位线的自变量,即时段序号,单位线时段数n可根据具体流域的产汇流水文监测数据确定。
变量x1、x2和x3的取值空间取为[0,5],染色体采用浮点数编码,如其中一条染色体为v′=[1.745 0,8.701 4,1.504 2],若单位线时段数n=11,则该组参数对应的单位线为
公式(10)相应的计算结果 [0, 570, 688, 563, 356, 187, 86, 35, 13, 5, 0] 即为单位线,如图2所示。
图2 单位线q′i
推求某流域的汇流单位线,就是如何结合实测流量资料来确定公式(9)中的参数。根据单位线推求的基本原则,遗传算法的目标函数可以表示为
式中,Q′(qi)为单位线qi(x1,x2,x3)推求的流域汇流流量;Q为流域出口断面的实测流量。
目标函数公式(11)的物理解释:搜寻某一组参数x*1、x*2和x*3,使单位线q*i推求的出口断面流量Q′(q*i)与实测流量Q差的平方倒数最大。为了防止目标函数的计算值过小,引入扩大系数M,M的取值根据具体情况而定。公式(11)转换为
max φ(qi(x1,x2,x3))=M(Q′(qi)−Q)2max φ(qi(x1,x2,x3))=Μ(Q′(qi)-Q)2 (12)
采用遗传算法进行单位线参数率定的计算流程如图3所示。
图3 遗传算法优化单位线参数流程
通过以上步骤**最佳参数(x*1,x*2,x*3),再利用最佳参数计算单位线,即
1.3 Collins迭代法
正如前文所述,任何基于数值方法计算出的单位线,都会由于真实的流域汇流不**单位线的基本假设条件,导致计算出来的单位线出现锯齿或负值,因此,试算修正仍然是**最终单位线不可或缺的步骤。
迭代法作为一种试算法,根据上述初始单位线,采用Collins迭代法修正**最终单位线。
Collins迭代法试算步骤如下:
本文单位线推求方法可概括分为3步:(1)根据流域产汇流水文监测数据,确定净雨时段数和汇流时段数,生成初始Gamma函数;(2)结合实测汇流过程线,采用遗传算法率定Gamma函数参数,**初始单位线;(3)经Collins迭代法修正**最终单位线。为便于表达将本文方法命名为Gamma-Gas-Collins法,简称GGC法。
2 算 例
2.1 算例1
流域次洪的净雨和汇流过程数据如表1所列,其中:(1)第一列为时段时序(6 h/时段);(2)第二列R为净雨(mm);(3)第三列为实测流量Q(m3/s);(4)第四列为试算法计算的流量(m3/s);(5)第五列为试错法试算的单位线(m3/s);(6)第六列为GGC计算的流量(m3/s);(7)第七列为GGC推求的单位线(m3/s)。
遗传算法率定Gamma函数参数组合为[1.745 0, 8.701 4, 1.504 2],两种方法推求的单位线如表1的⑤、⑦栏所列,单位线比较如图4所示;由单位线计算出的流量过程如表1中的④和⑥栏所列,计算流量过程与实测值的比较如图5所示。
图4 算例1:单位线推求结果比较
图5 算例1:出口断面流量过程比较
由表1中实际水文资料可知,产流时段数为5,出口断面洪水过程时段数为15,单位线时段数应为15-5+1=11。GGC推求的单位线时段数为11,而试错法推求的单位线时段数为12。为了进一步研究两种方法推求的单位线的合理性,将两条单位线求得的出口断面流量过程与实测数据进行比较(实测值-计算值),统计**结果如表2所列。
2.2 算例2
遗传算法率定Gamma函数参数组合为[1.605 2, 7.920 9, 0.300 07],两种方法推求的单位线如表3的⑤、⑦栏所列,单位线比较如图6所示;由单位线计算流量过程如表3中的④和⑥栏所列,计算流量过程与实测值的比较如图7所示。
图6 算例2:试错法与GGC推求的单位线
图7 算例2:出口断面流量过程
从图中可以看到,在曲线形态上,GGC推求的单位线明显优于试错法推求的单位线。同样,将两条单位线求得的出口断面流量过程与实测数据进行比较,统计**结果如表4所列。
从表4中可以看到,由GGC推求的出口断面流量过程精度要优于试错法,而洪量误差要大于试错法,但GGC计算的洪量相对误差为1.25%,完全能够**工程需要。
从图6和图7来看,虽然两条单位线计算流量过程基本相似,但从单位线的形态比较,GGC计算的单位线连续性和光滑性都要好于试错法,更符合时不变系统的属性特征。
从表2和表4来看,GGC推求的单位线对洪水过程的计算精度在大多数项目中明显好于试错法,虽然洪量的总误差较试错法大,但是洪量的相对误差只有1.2%和1.25%,因此,并不影响实际工程的应用。由此看出,GGC更擅长流域汇流过程的模拟,这决定于算法本身的物理机制,而试错法更加关注洪水总量的平衡。这也正是两种算法的各自特点与优势所在。
3 结论与展望
本文结合理论**、实现方法、操作步骤和实例计算等环节,系统论述了GGC方法的科学性、可靠性和实用性。
3.1 主要结论
(1)通过采用Gamma函数表征单位线和遗传算法率定Gamma函数参数来初始化单位线,进而采用Collins迭代法不断修正来**最终单位线,通过编程实现快速计算,与常用的试算法相比,得出单位线计算出的流量过程对洪峰流量、最大流量的计算精度更好,表明GGC更擅长流域汇流过程的模拟,而洪量相对误差要大于试算法的结果,但也能**工程允许误差。总体而言,GGC是一种快捷可靠的单位线推求方法。
(2)从原理上讲,GGC以组成论理论为基础,以数学方程描述洪水汇流的物理机制与过程,在单位线基本概念的基础上,以遗传算法为优化工具,来率定Gamma函数的参数以刻画洪水的汇流特征,因此,GGC对单位线所描述的汇流过程模拟得更为准确。与此相对,其它一些单位线的推求方法,如**法、试错法、最小二乘法等,更为关注单位线推求的出口断面流量过程与实测流量的拟合精度,从而忽略了单位线本身的组成和结构。这一点,在算例2里**了充分的论证,即GGC更擅长流域汇流过程的模拟,而其它方法更加关注洪水总量的平衡。
3.2 未来展望
水文现象的影响因素极为复杂,人们对其发生的因果关系还未能把握到精准的程度。水文现象存在必然性和偶然性,即具有确定性和随机性,是研究水文学问题的认识基础。因此,成因**和概率统计是研究水文特征的重要方法。在实际应用中,成因**大都局限于定性**,涉及定量问题仍离不开依据实际观测资料建立起来的**性统计关系。
以组成论为理论基础,将统计物理学中的分布函数思想推广到水文学这样非物理学领域中,将水文系统视为一个广义**,以分布函数模拟水文现象的表现规律,从观测数据中推求分布函数,找到函数关系,通常也意味着发现了一个客观规律。例如,基于遗传算法优化的Gamma函数所表征的单位线,其参数取值在某种程度上也代表了区域性汇流特征,正如水文**计算中的统计参数(均值x¯x¯、变差系数Cv和偏态系数Cs)能够揭示区域水文变量统计特征一样。
本研究是组成论及其分布函数在水文现象定量关系研究中的初步尝试,作者相信,该理论是探寻水文规律的一条新的途径。
水利水电技术(中英文)
水利部《水利水电技术(中英文)》**是中国水利水电行业的综合性技术期刊(月刊),为全国中文核心期刊,面向国内外公**行。本刊以介绍我国水资源的**、利用、治理、配置、节约和保护,以及水利水电工程的勘测、设计、施工、运行管理和科学研究等方面的技术**为主,同时也报道国外的先进技术。期刊主要栏目有:水文水资源、水工建筑、工程施工、工程基础、水力学、机电技术、泥沙研究、水**与水生态、运行管理、试验研究、工程地质、金属结构、水利经济、水利规划、防汛抗旱、建设管理、新能源、城市水利、农村水利、水土**、水库**、水利现代化、国际水利等。