和评价云计算系统的性能和应用配臵环境[9]。Cloudsim能模拟单节点和多节点云环境,现已被多个组织机构用于研究云数据中心的资源分配和节能问题。基于ISO25010中的软件质量概念,Bautista等介绍了一种云计算系统的性能测量框架(PMF)[10]。PMF通过定义需求、数据类型和评价准则来评价“集群行为”的性能。Kim等研究实时应用中VM的能量感知供应,并基于动态电压和频率调节(DVFS)技术提出了几种用于数据中心硬实时服务的能源感知VM供应方案[11]。虽然测量和仿真方法在性能评价中比较直接,但是只能适用于已经存在并运行的系统,而且需要花费较多时间。此外,这两种方法不适用于大规模复杂系统,尤其是动态变化且包含大量参数的云系统,也无法找出系统中的性能瓶颈。
为了克服这些困难,一些研究者提出了某些模型方法来分析和评价系统性能。Xia等使用基于网络的随机排队方法来分析易出错环境中可迁移云的性能,并定义了一些性能矩阵来评价不同负载和错误强度下的利用率、预期任务完成时间和任务拒绝率[2]。接着,作者还通过信任区间对比分析该方法与现实世界云系统中实验性能数据的差别。Khazaei等将云数据中心建模为一个具有单任务到达和有限任务缓冲区的M/G/m/m+r排队系统,并使用基于变换的分析模型和近似马尔可夫链来获取响应时间的分布概率、积压概率和系统中的任务数量[12]。此外,Khazaeri还将复杂的云系统划分为多个子模型,引入连续时间马尔可夫链(CTMC)来建模分析这些子系统,并使用迭代方法求出所需精度的解[12]。
与上述研究工作相比,我们主要研究云数据中心的能耗感知虚拟机迁移策略,并引入动态可扩展随机Petri网(DSSPN)来建模和评价云系统在不同运行时间和不同数量PM下的某些重要参数,如平均队列长度(能反映任务缓冲区中的数据积压)、平均吞吐量、平均能耗和资源利用率。DSSPN是一种扩展的随机Petri网(SPN),适用于分布式系统的图形建模和性能分析 [8]。它不仅能以一种直观有效的方式清晰刻画系统的动态行为,还易于发现系统的性能瓶颈和缺陷。
基于上述讨论,本文主要设计和建模分析能有效节能并提高云数据中心性能的虚拟机迁移策略,主要贡献有以下几点:
(1)我们提出了云数据中心(EAC)的体系结构框架,并抽象出它的任务调度和VM分配模型。
(2)为了提高能源利用率并确保数据中心集群的性能,本文提出了能耗感知虚拟机迁移(EAVMM)算法。
(3)基于SPN和随机回报网[14](SRN),我们提出了动态可扩展随机Petri网(DSSPN),并用DSSPN对云数据中心进行建模和性能评价。
(4)为了验证EAVMM算法的有效性与DSSPN的可用性,我们进行了实验仿真,得到不同运行时间与不同数量PM下的一些重要性能参数,如平均队列长度、平均吞吐量、平均能耗和平均资源利用率。
2 云数据中心
云作为下一代的数据中心,通过管理程序技术将节点虚拟化为虚拟机,并动态地为用户按需提供个性化资源集(如硬件、数据库、用户接口、应用逻辑等),然后通过“协商”来满足特定的服务水平协议[3]。因此,云数据中心通常被看作通过网络服务技术(如SOAP、REST等)访问的组合服务。图1说明了云数据中心数据中心的理论高级体系架构。主要包含五个实体[15]:
(1)用户/代理:世界各地的用户或代理根据各自的需求向云数据中心提交服务请求。需要注意的是,这些用户可分为两类:一类是使用已有云服务的用户;一类是在云上部署应用程序的用户。例如,一个公司可以在云上部署一个能根据访问的用户数量来改变工作负载的Web