Опис проблеми
В рамках виконання Програми дій Уряду в Україні з початку 2020 року стартувала робота по створенню загальнонаціональної Бази даних енергетичних та експлуатаційних характеристик будівель, що передбачає збір та накопичення інформації щодо технічних та експлуатаційних характеристик будівель. Поряд з тим, в контексті виконання коректного аналізу внесених даних, виявлення динаміки та тенденцій в енергоспоживанні, планування заходів з енергоефективності та верифікації отриманих результатів вкрай важливим є якість інформації, що використовується.
Шляхи вирішення проблеми
Саме тому з метою досягнення максимальної ефективності аналізу даних нами була впроваджена система контрою якості даних, що включає в себе перевірку внесеної інформації щодо технічних характеристик будівель, енергоспоживання та надання рекомендацій щодо виправлення помилкових даних.
В результаті методичної роботи над перевіркою даних, внесених до системи, було детально проаналізовано технічні характеристики та енергоспоживання будівель по всім ОДА 1-ї хвилі. Велика увага приділялася саме аналізу коректності внесення базових величин таких як опалюваний об’єм та опалювана площа, адже на основі цих даних відбувається послідуючий розрахунок питомих величин для порівняння. Всі будівлі були детально розглянуті з пошуком типових помилок у внесених даних. По кожній будівлі зафіксовано відповідну помилку та надано опис того, що необхідно перевірити та скоригувати. До переліку з коментарями стосовно того, що та в який спосіб необхідно виправити, додавалось посилання на відео-інструкції щодо типових помилок, які виникають при внесенні даних до Національної бази. Відео-інструкції є однією з важливих складових контролю якості даних та покликані підвищити обізнаність відповідальних за внесення даних та допомогти виправити помилки.
Результати та вигоди
В результаті перевірки якості даних користувачі 31% установ по ОДА першої хвилі були задіяні до коригування даних. Помилкові дані були виправлені, що відчутно позначилось на рейтингах енергоефективності будівель.
В результаті тривалої роботи з великим масивом даних можна стверджувати, що дані без перевірки – це не надійні дані. Тому, має бути системний контроль за якістю даних для можливості подальшого їх використання.