Page 43 - 网络电信2021年10月刊下

P. 43

数据的有效性。数据校验基于数据接入标准，比如数据类型、大数据技术在智慧工程中的应用如图3所示。随着物联网、
数值特征等，对数据进行校验，保证数据的准确性。数据转换数据挖掘、人工智能等先进的科学技术日益成熟与广泛应用，
一般包括两类，第一类：数据名称及格式的统一；第二类：数工程建设逐渐由机械化、数字化模式向智能化模式发展。以工
据仓库中存在源数据库中可能不存在的数据，因此需要进行字程应用为导向，通过数据统计、数据挖掘等大数据分析手段，
段的组合、分割或计算，数据转换解决数据不一致问题。数据构建典型的应用场景，充分发挥数据资产在工程建设应用中的
标准化就是对数据的命名、数据类型、长度、业务含义、计算价值。
口径、归属部门等，定义一套统一的规范，保证数据定义、理 1.智慧水电
解、使用的统一。大坝建设攸关经济发展与国计民生，是水利水电工程建设
2.3数据仓库设计中最为重要的部分［1］。大量工程实践表明，大坝建设和运行数
数据仓库是发展数据化管理的重要基础，具备高效的分层据中蕴藏了丰富的反映坝体结构形态及水库运行规律的信息。
数据组织形式，更加完整的数据体系，清晰的数据分类和分层机对大坝建设和运行数据进行处理分析，利用分析结果进行生产
制。数据仓库在逻辑上可以分为ODS层(源系统层)、DWD层(数据明管理和辅助决策，有助于快捷科学地管理大坝安全系统中的各
细层)、DWS层(数据汇总层)、DM层(数据集市层)，如图2所示。个环节，提高大坝工程质量并规避安全风险，为大坝的建设和
ODS层是业务数据流动过程的第一个存储区，为后续的数运行管理提供有价值的科学依据［2］。目前针对大坝运行数据分
据抽取、清洗、转换过程打下坚实的基础。DWD层有选择地集成析的算法包括回归模型、频谱分析、ANN、小波分析、神经网
ODS层缓冲区的数据，以数据主题域为数据集成的基础，对数据络、突变理论、灰色系统、Kalman滤波法等，可根据数据量、
进行分类和组织。DWS层通过概念模型、逻辑模型和物理模型数据类型、算法优缺点、分析目的选择合适的算法，例如大坝
3个阶段设计阶段，整理得到大量的指标数据，以便业务人员渗流及变形分析可采用回归分析法及神经网络法。由于大坝观
实现数据挖掘和业务分析等功能。DM层将数据汇总成分析某一测值与影响因素之间往往存在非线性、非确定性的复杂关系，
主题域的服务数据，一般是宽表，用于提供后续的业务查询，可能会导致回归模型的计算结果与实际情况相差较大。而人工
OLAP分析，数据分发等。神经网络法将生物特征应用到工程计算分析中，可以解决大数
2.4数据分析据量情况下的学习、识别、控制和预报问题［3］。目前针对工程
数据分析指数据分析或运维技术人员利用自身经验知识，建造数据分析的算法较多，以大坝灌浆为例，灌浆工程涉及到
使用大数据平台的案例数据和运行数据，针对要分析的业务对的数据分析应用可分为单位注入量预测及灌后质量综合评估两
象进行业务理解，理解业务目标、业务目标产生的机理逻辑、个方面。岩体单位注入量是对岩体可灌性最直接的反映，有助
筛选与业务目标有关的数据，利用平台提供的数据挖掘算法进于定量分析岩层吸浆情况，实时调整灌浆压力、灌浆材料及优
行建模分析，推动业务的智慧化运营。化灌浆孔位布置，为岩体的可灌性研究和地质条件分析提供参
常用的数据挖掘具如：Mahout、MLlib、TensorFlow。数指标［4］。此外，灌浆施工过程中会受到地质条件、施工方
Mahout是ApacheSoftwareFoundation(ASF)开发的一个开源法、灌浆压力等多种条件的影响，可能导致灌浆效果无法满足
项目，提供一些可扩展的机器学习领域经典算法的实现，设计方案的要求，因此需要采用科学有效的方法评价灌浆施工
旨在帮助开发人员更加方便快捷地创建智能应用程序。的效果［5］。目前常用的灌浆注入量预测方法包括随机森林法、
MLlib(machinelearninglibrary)是Spark提供的可扩展的机器神经网络法、回归模型法等，常用的灌浆质量评估方法包括云
学习库，MLlib中已经包含了一些通用的学习算法和工具，如：模型、模糊综合评价法等。
分类、回归、聚类、协同过滤、降维以及底层的优化原语等算大数据在智能建造中应用范围广泛，除了智能灌浆，还可
法和工具。TensorFlow是人工智能AI领域的一个重要软件工运用于智能碾压、智能振捣、智能温控等多个领域。例如采用
具，是谷歌开发的开源软件，包含了DNN、CNN、ＲNN等深度学粗糙集和神经网络数据挖掘算法，建立混凝土施工期最高温度
习模型，可以在创建深度学习网络时对数据进行数值和图形计与浇筑施工信息间的关联规则；采用K邻近、支持向量机、长短
算，快速建立数学模型。期记忆网络等算法分析浇筑机械(缆机)的运行规律以及在时空
2.5数据服务方面的运行冲突情况，并针对不同的冲突情况制定相应的调整
数据服务主要解决以下4个关键问题：①不知道数据被哪些机制，优化机械调度方案；基于数据驱动模型评价混凝土振捣
应用访问；②数据接入方式多种多样，数据接入效率低；③数及压实质量，如人工神经网络、支持向量回归、随机森林等模
据和接口没有办法复用；④底层数据变更引起表重构，增加额型；基于路径智能规划技术的运输车辆智能调度方法，实现路
外的开发工作量，造成数据变更进度缓慢。为解决以上问题，况信息的智能分析与更新、运输路径的智能规划与车辆智能调
数据服务设计应具备6大功能：①规范化定义接口；②作为网关度［6］。
服务，数据服务必须具备认证、权限、限流、监控5大功能；③ 2.智慧风电
维护数据模型到数据应用的全链路关系；④利用中间存储加速风能作为可再生能源，近年来发展迅猛，装机容量迅速上
数据查询；⑤构建逻辑模型，实现数据的复用；⑥建立API集升。但是由于风电场所处位置的气候变化、日照变化、地形因素
市，实现接口复用。等原因，发电功率和风速具有不确定性，可能会对发电平衡的保
持产生不利影响。对风力发电进行预测，不仅可以指导电力公司
三、大数据技术在智慧工程中的应用应对由于发电不稳定造成的影响，为风电机组的运维和管理提供

网络电信二零二一年十月 71

38 39 40 41 42 43 44 45 46 47 48