Page 43 - 网络电信2021年10月刊下
P. 43
数据的有效性。数据校验基于数据接入标准,比如数据类型、 大数据技术在智慧工程中的应用如图3所示。随着物联网、
数值特征等,对数据进行校验,保证数据的准确性。数据转换 数据挖掘、人工智能等先进的科学技术日益成熟与广泛应用,
一般包括两类,第一类:数据名称及格式的统一;第二类:数 工程建设逐渐由机械化、数字化模式向智能化模式发展。以工
据仓库中存在源数据库中可能不存在的数据,因此需要进行字 程应用为导向,通过数据统计、数据挖掘等大数据分析手段,
段的组合、分割或计算,数据转换解决数据不一致问题。数据 构建典型的应用场景,充分发挥数据资产在工程建设应用中的
标准化就是对数据的命名、数据类型、长度、业务含义、计算 价值。
口径、归属部门等,定义一套统一的规范,保证数据定义、理 1.智慧水电
解、使用的统一。 大坝建设攸关经济发展与国计民生,是水利水电工程建设
2.3数据仓库设计 中最为重要的部分 [1] 。大量工程实践表明,大坝建设和运行数
数据仓库是发展数据化管理的重要基础,具备高效的分层 据中蕴藏了丰富的反映坝体结构形态及水库运行规律的信息。
数据组织形式,更加完整的数据体系,清晰的数据分类和分层机 对大坝建设和运行数据进行处理分析,利用分析结果进行生产
制。数据仓库在逻辑上可以分为ODS层(源系统层)、DWD层(数据明 管理和辅助决策,有助于快捷科学地管理大坝安全系统中的各
细层)、DWS层(数据汇总层)、DM层(数据集市层),如图2所示。 个环节,提高大坝工程质量并规避安全风险,为大坝的建设和
ODS层是业务数据流动过程的第一个存储区,为后续的数 运行管理提供有价值的科学依据 [2] 。目前针对大坝运行数据分
据抽取、清洗、转换过程打下坚实的基础。DWD层有选择地集成 析的算法包括回归模型、频谱分析、ANN、小波分析、神经网
ODS层缓冲区的数据,以数据主题域为数据集成的基础,对数据 络、突变理论、灰色系统、Kalman滤波法等,可根据数据量、
进行分类和组织。DWS层通过概念模型、逻辑模型和物理模型 数据类型、算法优缺点、分析目的选择合适的算法,例如大坝
3个阶段设计阶段,整理得到大量的指标数据,以便业务人员 渗流及变形分析可采用回归分析法及神经网络法。由于大坝观
实现数据挖掘和业务分析等功能。DM层将数据汇总成分析某一 测值与影响因素之间往往存在非线性、非确定性的复杂关系,
主题域的服务数据,一般是宽表,用于提供后续的业务查询, 可能会导致回归模型的计算结果与实际情况相差较大。而人工
OLAP分析,数据分发等。 神经网络法将生物特征应用到工程计算分析中,可以解决大数
2.4数据分析 据量情况下的学习、识别、控制和预报问题 [3] 。目前针对工程
数据分析指数据分析或运维技术人员利用自身经验知识, 建造数据分析的算法较多,以大坝灌浆为例,灌浆工程涉及到
使用大数据平台的案例数据和运行数据,针对要分析的业务对 的数据分析应用可分为单位注入量预测及灌后质量综合评估两
象进行业务理解,理解业务目标、业务目标产生的机理逻辑、 个方面。岩体单位注入量是对岩体可灌性最直接的反映,有助
筛选与业务目标有关的数据,利用平台提供的数据挖掘算法进 于定量分析岩层吸浆情况,实时调整灌浆压力、灌浆材料及优
行建模分析,推动业务的智慧化运营。 化灌浆孔位布置,为岩体的可灌性研究和地质条件分析提供参
常用的数据挖掘具如:Mahout、MLlib、TensorFlow。 数指标 [4] 。此外,灌浆施工过程中会受到地质条件、施工方
Mahout是ApacheSoftwareFoundation(ASF)开发的一个开源 法、灌浆压力等多种条件的影响,可能导致灌浆效果无法满足
项目,提供一些可扩展的机器学习领域经典算法的实现, 设计方案的要求,因此需要采用科学有效的方法评价灌浆施工
旨 在 帮 助 开 发 人 员 更 加 方 便 快 捷 地 创 建 智 能 应 用 程 序 。 的效果 [5] 。目前常用的灌浆注入量预测方法包括随机森林法、
MLlib(machinelearninglibrary)是Spark提供的可扩展的机器 神经网络法、回归模型法等,常用的灌浆质量评估方法包括云
学习库,MLlib中已经包含了一些通用的学习算法和工具,如: 模型、模糊综合评价法等。
分类、回归、聚类、协同过滤、降维以及底层的优化原语等算 大数据在智能建造中应用范围广泛,除了智能灌浆,还可
法和工具。TensorFlow是人工智能AI领域的一个重要软件工 运用于智能碾压、智能振捣、智能温控等多个领域。例如采用
具,是谷歌开发的开源软件,包含了DNN、CNN、RNN等深度学 粗糙集和神经网络数据挖掘算法,建立混凝土施工期最高温度
习模型,可以在创建深度学习网络时对数据进行数值和图形计 与浇筑施工信息间的关联规则;采用K邻近、支持向量机、长短
算,快速建立数学模型。 期记忆网络等算法分析浇筑机械(缆机)的运行规律以及在时空
2.5数据服务 方面的运行冲突情况,并针对不同的冲突情况制定相应的调整
数据服务主要解决以下4个关键问题:①不知道数据被哪些 机制,优化机械调度方案;基于数据驱动模型评价混凝土振捣
应用访问;②数据接入方式多种多样,数据接入效率低;③数 及压实质量,如人工神经网络、支持向量回归、随机森林等模
据和接口没有办法复用;④底层数据变更引起表重构,增加额 型;基于路径智能规划技术的运输车辆智能调度方法,实现路
外的开发工作量,造成数据变更进度缓慢。为解决以上问题, 况信息的智能分析与更新、运输路径的智能规划与车辆智能调
数据服务设计应具备6大功能:①规范化定义接口;②作为网关 度 [6] 。
服务,数据服务必须具备认证、权限、限流、监控5大功能;③ 2.智慧风电
维护数据模型到数据应用的全链路关系;④利用中间存储加速 风能作为可再生能源,近年来发展迅猛,装机容量迅速上
数据查询;⑤构建逻辑模型,实现数据的复用;⑥建立API集 升。但是由于风电场所处位置的气候变化、日照变化、地形因素
市,实现接口复用。 等原因,发电功率和风速具有不确定性,可能会对发电平衡的保
持产生不利影响。对风力发电进行预测,不仅可以指导电力公司
三、大数据技术在智慧工程中的应用 应对由于发电不稳定造成的影响,为风电机组的运维和管理提供
网络电信 二零二一年十月 71