Page 43 - 网络电信2021年10月刊下
P. 43

数据的有效性。数据校验基于数据接入标准,比如数据类型、                              大数据技术在智慧工程中的应用如图3所示。随着物联网、
            数值特征等,对数据进行校验,保证数据的准确性。数据转换                          数据挖掘、人工智能等先进的科学技术日益成熟与广泛应用,
            一般包括两类,第一类:数据名称及格式的统一;第二类:数                          工程建设逐渐由机械化、数字化模式向智能化模式发展。以工
            据仓库中存在源数据库中可能不存在的数据,因此需要进行字                          程应用为导向,通过数据统计、数据挖掘等大数据分析手段,
            段的组合、分割或计算,数据转换解决数据不一致问题。数据                          构建典型的应用场景,充分发挥数据资产在工程建设应用中的
            标准化就是对数据的命名、数据类型、长度、业务含义、计算                          价值。
            口径、归属部门等,定义一套统一的规范,保证数据定义、理                              1.智慧水电
            解、使用的统一。                                                 大坝建设攸关经济发展与国计民生,是水利水电工程建设
                2.3数据仓库设计                                        中最为重要的部分       [1] 。大量工程实践表明,大坝建设和运行数
                数据仓库是发展数据化管理的重要基础,具备高效的分层                        据中蕴藏了丰富的反映坝体结构形态及水库运行规律的信息。
            数据组织形式,更加完整的数据体系,清晰的数据分类和分层机                         对大坝建设和运行数据进行处理分析,利用分析结果进行生产
            制。数据仓库在逻辑上可以分为ODS层(源系统层)、DWD层(数据明                    管理和辅助决策,有助于快捷科学地管理大坝安全系统中的各
            细层)、DWS层(数据汇总层)、DM层(数据集市层),如图2所示。                    个环节,提高大坝工程质量并规避安全风险,为大坝的建设和
                ODS层是业务数据流动过程的第一个存储区,为后续的数                       运行管理提供有价值的科学依据            [2] 。目前针对大坝运行数据分
            据抽取、清洗、转换过程打下坚实的基础。DWD层有选择地集成                        析的算法包括回归模型、频谱分析、ANN、小波分析、神经网
            ODS层缓冲区的数据,以数据主题域为数据集成的基础,对数据                        络、突变理论、灰色系统、Kalman滤波法等,可根据数据量、
            进行分类和组织。DWS层通过概念模型、逻辑模型和物理模型                         数据类型、算法优缺点、分析目的选择合适的算法,例如大坝
            3个阶段设计阶段,整理得到大量的指标数据,以便业务人员                          渗流及变形分析可采用回归分析法及神经网络法。由于大坝观
            实现数据挖掘和业务分析等功能。DM层将数据汇总成分析某一                         测值与影响因素之间往往存在非线性、非确定性的复杂关系,
            主题域的服务数据,一般是宽表,用于提供后续的业务查询,                          可能会导致回归模型的计算结果与实际情况相差较大。而人工
            OLAP分析,数据分发等。                                        神经网络法将生物特征应用到工程计算分析中,可以解决大数
                2.4数据分析                                          据量情况下的学习、识别、控制和预报问题                [3] 。目前针对工程
                数据分析指数据分析或运维技术人员利用自身经验知识,                        建造数据分析的算法较多,以大坝灌浆为例,灌浆工程涉及到
            使用大数据平台的案例数据和运行数据,针对要分析的业务对                          的数据分析应用可分为单位注入量预测及灌后质量综合评估两
            象进行业务理解,理解业务目标、业务目标产生的机理逻辑、                          个方面。岩体单位注入量是对岩体可灌性最直接的反映,有助
            筛选与业务目标有关的数据,利用平台提供的数据挖掘算法进                          于定量分析岩层吸浆情况,实时调整灌浆压力、灌浆材料及优
            行建模分析,推动业务的智慧化运营。                                    化灌浆孔位布置,为岩体的可灌性研究和地质条件分析提供参
                常用的数据挖掘具如:Mahout、MLlib、TensorFlow。               数指标   [4] 。此外,灌浆施工过程中会受到地质条件、施工方
            Mahout是ApacheSoftwareFoundation(ASF)开发的一个开源          法、灌浆压力等多种条件的影响,可能导致灌浆效果无法满足
            项目,提供一些可扩展的机器学习领域经典算法的实现,                            设计方案的要求,因此需要采用科学有效的方法评价灌浆施工
            旨 在 帮 助 开 发 人 员 更 加 方 便 快 捷 地 创 建 智 能 应 用 程 序 。      的效果   [5] 。目前常用的灌浆注入量预测方法包括随机森林法、
            MLlib(machinelearninglibrary)是Spark提供的可扩展的机器         神经网络法、回归模型法等,常用的灌浆质量评估方法包括云
            学习库,MLlib中已经包含了一些通用的学习算法和工具,如:                       模型、模糊综合评价法等。
            分类、回归、聚类、协同过滤、降维以及底层的优化原语等算                              大数据在智能建造中应用范围广泛,除了智能灌浆,还可
            法和工具。TensorFlow是人工智能AI领域的一个重要软件工                     运用于智能碾压、智能振捣、智能温控等多个领域。例如采用
            具,是谷歌开发的开源软件,包含了DNN、CNN、RNN等深度学                      粗糙集和神经网络数据挖掘算法,建立混凝土施工期最高温度
            习模型,可以在创建深度学习网络时对数据进行数值和图形计                          与浇筑施工信息间的关联规则;采用K邻近、支持向量机、长短
            算,快速建立数学模型。                                          期记忆网络等算法分析浇筑机械(缆机)的运行规律以及在时空
                2.5数据服务                                          方面的运行冲突情况,并针对不同的冲突情况制定相应的调整
                数据服务主要解决以下4个关键问题:①不知道数据被哪些                       机制,优化机械调度方案;基于数据驱动模型评价混凝土振捣
            应用访问;②数据接入方式多种多样,数据接入效率低;③数                          及压实质量,如人工神经网络、支持向量回归、随机森林等模
            据和接口没有办法复用;④底层数据变更引起表重构,增加额                          型;基于路径智能规划技术的运输车辆智能调度方法,实现路
            外的开发工作量,造成数据变更进度缓慢。为解决以上问题,                          况信息的智能分析与更新、运输路径的智能规划与车辆智能调
            数据服务设计应具备6大功能:①规范化定义接口;②作为网关                         度 [6] 。
            服务,数据服务必须具备认证、权限、限流、监控5大功能;③                             2.智慧风电
            维护数据模型到数据应用的全链路关系;④利用中间存储加速                              风能作为可再生能源,近年来发展迅猛,装机容量迅速上
            数据查询;⑤构建逻辑模型,实现数据的复用;⑥建立API集                         升。但是由于风电场所处位置的气候变化、日照变化、地形因素
            市,实现接口复用。                                            等原因,发电功率和风速具有不确定性,可能会对发电平衡的保
                                                                 持产生不利影响。对风力发电进行预测,不仅可以指导电力公司
                三、大数据技术在智慧工程中的应用                                 应对由于发电不稳定造成的影响,为风电机组的运维和管理提供

                                                       网络电信 二零二一年十月                                            71
   38   39   40   41   42   43   44   45   46   47   48