Предобработка данных для интегрированного моделирования активов
https://doi.org/10.51890/2587-7399-2024-9-4-152-158
Аннотация
Введение. В настоящее время все активнее применяется машинное обучение во всех сферах производства, в том числе и в нефтяной промышленности. Однако качество данных, поступающих с нефтяных промыслов, не всегда позволяет корректно использовать их в процессах цифровизации производственных процессов. Быстрое переоборудование всех месторождений для точного и частого сбора данных затруднено. В связи с этим все же приходится работать с уже собранными данными.
Цель. Рассмотрение совокупности преобразований, которые происходят с данными в процессе их использования в машинном обучении как единого процесса (ETL-процесса).
Материалы и методы. В качестве примеров для демонстрации рассматриваемых проблем и подходов использованы данные об эксплуатации нефтяных скважин. Для анализа и визуализации данных реализованы скрипты на языке программирования Python.
Результаты. В результате проведенной работы установлено, что качество данных, поступающих с нефтяных промыслов, не всегда позволяет использовать их в машинном обучении. Для повышения качества данных на этапе сбора и их подготовки предлагается использовать технологию ETL-процессов.
Заключение. Применение ETL-процессов позволит значительно увеличить количество и качество данных, которые можно использовать для создания цифровых двойников месторождений. Таким образом, сложно переоценить эффект от внедрения рассматриваемой технологии.
Об авторах
К. А. ПечкоРоссия
Константин Анатольевич Печко, главный аналитик данных
190000; ул. Гороховая, д. 16, А5; Санкт-Петербург
Scopus: 57331243400
Д. И. Константинов
Россия
Дмитрий Игоревич Константинов, специалист
Санкт-Петербург
М. В. Симонов
Россия
Максим Владимирович Симонов, руководитель центра
Санкт-Петербург
А. А. Афанасьев
Россия
Александр Андриянович Афанасьев, главный специалист
Санкт-Петербург
Список литературы
1. Печко К.А., Сенькин И.С., Белоногов Е.В. Моделирование скважин методами машинного обучения для задач интегрированного моделирования // PROНЕФТЬ. Профессионально о нефти. — 2022. — № 7(2). — С. 114–120. doi: 10.51890/2587-7399-2022-7-2-114-120
2. Fan C. et al. A review on data preprocessing techniques toward efficient and reliable knowledge discovery from building operational data. Frontiers in energy research. 2021, vol. 9, p. 652801.
3. García S. et al. Big data preprocessing: methods and prospects. Big data analytics. 2016, vol. 1, pp. 1–22.
4. Malik J.S., Goyal P., Sharma A.K. A comprehensive approach towards data preprocessing techniques & association rules. Proceedings of the 4<sup>th</sup> National Conference. 2010, vol. 132.
5. Katser I.D. et al. Data pre-processing methods for NPP equipment diagnostics algorithms: an overview. Nuclear Energy and Technology. 2021, vol. 7, no. 2, pp. 111–125.
6. Быков К.В. Особенности предобработки данных для применения машинного обучения // Молодой ученый. — 2021. — № 53 (395). — С. 1.
7. Печко К.А., Чупров А.А., Афанасьев А.А., Симонов М.В. Интерполяция пропусков данных технологического режима скважин алгоритмами машинного обучения // PROнефть. Профессионально о нефти. — 2023. — Т. 8. — № 3 — С. 163–166. doi: 10.51890/2587-7399-2023-8-3-163-166
8. Pechko K. et al. Data Pre Processing Techniques in Integrated Asset Modeling // Fourth EAGE Digitalization Conference & Exhibition. European Association of Geoscientists & Engineers. 2024, vol. 2024, no. 1, pp. 1–4. (In Russ.)
Рецензия
Для цитирования:
Печко К.А., Константинов Д.И., Симонов М.В., Афанасьев А.А. Предобработка данных для интегрированного моделирования активов. PROНЕФТЬ. Профессионально о нефти. 2024;9(4):152-158. https://doi.org/10.51890/2587-7399-2024-9-4-152-158
For citation:
Pechko K.A., Konstantinov D.I., Simonov M.V., Afanasev A.A. Data preprocessing for integrated asset modeling. PROneft. Professionally about Oil. 2024;9(4):152-158. (In Russ.) https://doi.org/10.51890/2587-7399-2024-9-4-152-158