Артём
Мошков

председатель совета директоров ГК "Нетрика"
© ComNews
18.10.2021

Данные — "вторая нефть", и сегодня это редко вызывает возражения даже со стороны скептиков "цифровой революции". Ценность такого актива, в том числе в денежном выражении, может почувствовать каждый, кто пользуется смартфоном. Какую пользу может принести использование госданных бизнесом, и почему этот процесс пока идёт не слишком активно? Рассказывает Артём Мошков, председатель совета директоров ГК "Нетрика".

Рост спроса

Спрос бизнеса на доступ к качественным данным растёт лавинообразно. При этом очень часто запрос на данные адресуется государству — в более или менее явной форме.

Причина такого тренда состоит в множестве примеров успешных бизнес-моделей на основе данных. Во многих странах мира организации из самых разных сфер — образования, здравоохранения, транспорта, финансов, сельского хозяйства — обращаются к государству, чтобы получить ценные сведения. И такое сотрудничество приносит свои плоды.

Аптечные сети могут использовать государственные данные о здоровье жителей региона и специфике заболеваемости, чтобы оптимальнее располагать аптеки и формировать соответствующий ассортимент с точки зрения спроса на лекарственные препараты. Фармацевтические компании, анализируя реальную клиническую практику (агрегированные данные от государственной медицины), могут дорабатывать существующие препараты с учётом комплексной терапии, необходимой пациентам. Эти же данные плюс имеющиеся в распоряжении государства данные о половозрастном составе, специфике занятости, загруженности физкультурно-оздоровительных и спортивных сооружений, дают возможность планировать свой бизнес поставщикам товаров и услуг для здорового образа жизни, формировать таргетированные предложения для определённых групп клиентов, а иногда — даже для регионов в целом.

Современные агрокомпании используют цифровые платформы для комплексного планирования работы с сельскохозяйственными культурами и учёта всех факторов, влияющих на урожайность и качество. Поэтому производители сельскохозяйственной продукции заинтересованы в государственных данных о сельхозугодьях и истории их использования, экологическом окружении, выполненных и планируемых мероприятиях по мелиорации. Эта информация помогает агропредприятиям получать более богатый урожай, точнее формировать стратегию использования своих угодий.

Кроме того, государственные данные уже совершенствуют сферу энергетики: информация о перспективных потребностях социальной сферы, промышленных предприятий, граждан в подключении к источникам тепловой и электрической энергии помогает генерирующим и сетевым компаниям оптимально планировать свои инвестиционные и ремонтные программы, снижать издержки, строить "умные сети".

Различные исследования показывают, что использование бизнесом государственных данных приносит национальной экономике существенный эффект, выражаемый в реальном приросте ВВП. В частности, недавнее исследование McKinsey Global Institute "Financial data unbound: The value of open data for individuals and institutions",показало, что потенциальная ценность открытых финансовых данных для страны может составить до 5 процентов ВВП, в зависимости от экономической структуры; при этом для развивающихся рынков (к которым относится и Россия) этот процент близок к максимуму.

Главные вопросы

Государство действительно выступает в роли главного владельца данных, если рассматривать его в широком смысле слова — то есть включать в понятие и муниципальный уровень публичной власти, и всю систему подведомственных организаций, и корпорации с госучастием. Именно государство обладает огромным количеством датасетов; оно же — основной оператор информационных систем, где хранятся и обрабатываются наборы данных, наиболее интересные для бизнеса. Среди них и столь привлекательные персональные данные, и геоданные, и сведения с IoT-датчиков (например, для контроля дорожной обстановки).

В таких условиях всё острее встают вопросы, связанные с использованием и обработкой данных, которые представляют высокую коммерческую ценность. Например, как обеспечить высокое качество данных, необходимое для правильной работы сервисов? Как организовать защиту и безопасное использование чувствительных данных — персональных сведений или данных ограниченного применения с элементами коммерческой, служебной и государственной тайны? Что нужно, чтобы все субъекты получали равноправный и недискриминационный доступ к данным?

Каждый из вопросов — отдельное направление работы для государства, бизнеса и общества. Здесь же мы остановимся на одном из важнейших: должно ли государство предоставлять данные на безвозмездной основе?

Суть подхода

Сегодня и в обществе, и в бизнес-кругах, и даже в рядах чиновников распространено мнение: данные, обрабатываемые в государственных информационных системах (ГИСах), создаются за счёт бюджетных средств и поэтому должны предоставляться всем заинтересованным лицам бесплатно.

Такой подход, в частности, применяется в порталах открытых данных, созданных федеральными ведомствами и региональными властями в соответствии с Постановлением Правительства Российской Федерации от 10.07.2013 № 583 "Об обеспечении доступа к общедоступной информации о деятельности государственных органов и органов местного самоуправления в информационно-телекоммуникационной сети "Интернет" в форме открытых данных".

Сама идея кажется логичной и привлекательной. Однако как раз на примере таких порталов можно увидеть главные проблемы "безвозмездного" подхода.

Нет платы — но есть трудности

Во-первых, на порталах открытых данных состав датасетов довольно ограничен и представлен самыми простыми, зачастую "побочными", результатами работы ведомств — например, списками подведомственных организаций с набором реквизитов. Чаще всего в наборы входят структурированные данные, которые подходят для роли источника нормативно-справочной информации — но не могут стать основой, скажем, для моделей машинного обучения.

Во-вторых, наборы данных носят яркий отпечаток "ведомственности". Так, список учреждений дополнительного образования, подведомственных региональному органу управления образованием, скорее всего, будет содержаться в одном датасете, а список аналогичных учреждений в ведомстве управления культурой — в другом. Иными словами, дома детского творчества — это один датасет, а музыкальные школы — другой. Хотя сфера дополнительного детского образования одна.

Третья и, пожалуй, самая важная и глобальная проблема — низкое или непредсказуемое качество данных, публикуемых на порталах. Они могут оказаться вообще неактуальными, и это значимый барьер для практического применения государственных данных.

Причины и следствия

Почему так происходит? Есть три простые причины.

Публикация датасетов — это далеко не основная задача специалистов госсектора, которые работают с порталами открытых данных. И особенно в список их функций не входит работа над практической пользой данных — создать и поддерживать её на самом деле непросто.

При этом отсутствует чёткая система мотивации специалистов, ориентированная на рост пользы и качества датасетов. То есть сотрудники совсем не заинтересованы в том, чтобы совершенствовать данные — зачем это нужно, если нет никаких стимулов?

Наконец, важный вызов — низкий уровень дата-культуры. Именно он не позволяет большинству специалистов правильно определять формы представления и регламенты обмена данными, их состав, структуру, семантику, качественные характеристики. Сотрудники не просто не хотят работать с данными, но и не знают, как это делать правильно.

Широкая точка зрения

Но государственные данные — это не только открытые сведения с порталов: на самом деле сфера значительно шире и включает абсолютно все данные, которые находятся в распоряжении государства. И здесь можно выделить ещё несколько препятствий для свободного доступа к ним.

Во-первых, всё чаще само государство становится потребителем данных, в том числе на коммерческой основе. Пример — обезличенные данные пользователей сотовой связи, которые полезны для анализа транспортных потоков, изучения маятниковой миграции, определения обобщённых социальных характеристик населения для планирования инфраструктуры. Должно ли государство отдавать наборы данных, которые получает из сторонних источников, на безвозмездной основе? Если да, не приведёт ли это к росту расходов на непрофильные функции и к злоупотреблениям? Сегодня на эти вопросы пока нет однозначного ответа.

Во-вторых, государство распоряжается огромными массивами персональных, а также деперсонифицированных (обезличенных) данных. Их использование регулируется Законом № 152-ФЗ "О персональных данных", и в нём прописан жёсткий запрет на передачу данных о человеке третьим лицам без его прямо выраженного согласия (за редкими исключениями для особых случаев).

С другой стороны, человек и сторона, заинтересованная в использовании его персональных данных, должны быть свободны в обмене этими данными на договорной, в том числе и коммерческой, основе. И, действительно, многие совсем не против делиться данными о себе: так, покупатели передают магазинам право использовать информацию о них в обмен на бонусы программ лояльности. Однако механизмы такого взаимодействия граждан с государством и государства с третьими сторонами пока развиты слабо.

Вопрос ресурсов

Наконец, работа с данными требует больших ресурсов от государства. Практика показывает: чтобы создавать востребованные сервисы на основе государственных данных, бизнесу нужны сложные модели пересечения, объединения и представления их наборов. Фактически компаниям требуется доступ к витринам данных, ориентированных на решение разных бизнес-задач. Изучать потребности в таких витринах, проектировать их, обеспечивать комфортный и безопасный доступ для бизнеса — всё это требует материальных затрат, а также немало времени и сил специалистов.

Но создать "магазины" и "фабрики" данных на основе государственных датасетов, а также обеспечить их работу — совсем не обязательно задача государства. Её вполне эффективно может решать и бизнес — тем более, что сфера привлекательна с коммерческой точки зрения.

Бизнесу интересна такая роль — однако пока его представителям не совсем понятно, как быстро, понятно и с минимальными затратами использовать госданные, ведь в сфере ещё не сформированы прозрачные правила работы с ними. Законодательно определить порядок организации и работы "фабрик" и "магазинов" данных ещё только предстоит в будущем.

Таким образом, государству не во всех случаях стоит бесплатно предоставлять данные, которые оказались в его распоряжении. Тем не менее, значительная их часть всё же должна предоставляться в режиме открытого бесплатного доступа.

Вопросы регулирования

Сегодня проблемы, связанные с балансом между функциями государства и новой ценностью данных, актуальны для всех развитых стран. Чтобы данные использовались как ценный актив цифровой экономики, в том числе для создания добавленной стоимости, необходима работа по трём ключевым направлениям.

Первое — нормативно-правовое обеспечение оборота данных. Оно должно регулировать общие понятия сферы, требования к данным и характеристикам их качества; выделять государственные данные как отдельную сущность и соотносить их с государственными информационными системами и ресурсами. Также стоит уточнить порядок выделения наборов данных, которые должны предоставляться безвозмездно, принципы доступа к ним — в том числе требования к организационной и технической инфраструктуре.

За последние полтора года в сфере нормативного регулирования оборота данных в нашей стране произошли существенные изменения. Из наиболее серьёзных инициатив — проект Федерального закона "О национальной системе управления данными", проект изменений в закон "О персональных данных" (в том числе в отношении их обезличивания), совместная разработка Минцифры и Минэкономразвития РФ единых принципов доступа к государственным данным. Кроме того, ряд ведомств и госкорпораций работают над законом об использовании промышленных данных.

В процессе создания нового "нормативного ландшафта данных" важно не забывать о накопленном региональном опыте: например, об инициативах субъектов РФ, участвовавших в эксперименте по созданию Национальной системы управления данными в 2019-2020 гг.

В вопросах нормативного регулирования и стратегического планирования развития сферы оборота данных полезно также "подсматривать" и зарубежный опыт — в том числе опыт крупных стран со сложным государственным устройством — США, Германии, Великобритании, где разработаны и реализуются национальные стратегии в области данных.

Организация процесса

Второй вектор — организационный. Для эффективного использования государственных данных важно создать систему институтов — специальных организаций, которые обеспечивают оборот данных на федеральном, региональном и муниципальном уровнях. Такие организации должны быть равноудалены от всех участников процесса, но важно, чтобы у них были полноценные ресурсные возможности для сопровождения и развития.

Самый перспективный путь — создать такие организации вместе с крупными государственными операторами данных и бизнес-объединениями федерального и регионального уровней. Например, в Санкт-Петербурге работу в этом направлении ведёт "Клуб лидеров по продвижению инициатив бизнеса".

Технологии

Наконец, третий вектор развития — технологии: эффективный оборот государственных данных, а также полноценную работу их "фабрик" и "магазинов" сложно представить без цифровых платформ. И если единым бэк-офисом могут стать НСУД и СМЭВ, то реализация "клиентской" части (сервисного фронт-офиса) — это отдельная задача с большим количеством возможных решений. При их разработке и внедрении полезно в том числе использовать наиболее удачные наработки, в частности, реализованные для региональных порталов открытых данных — например, в Томской области, Санкт-Петербурге, Москве, Ханты-Мансийском АО.

Таким образом, ответ на вызовы новой формирующейся сферы экономики — сферы оборота данных – предполагает синхронную работу по нескольким взаимосвязанным направлениям. Необходимо организовать общение с бизнесом в ключе его практических потребностей и сформировать пул наиболее востребованных наборов данных. С высокой вероятностью, это будут наборы на основе обезличенных персональных, а также геоданных. Также целесообразно проработать нормативную составляющую именно по этим датасетам, в том числе используя регуляторные песочницы. При этом следует отрабатывать организационно-правовые механизмы оборота данных, приемлемые для всех, "обкатывать" специфические варианты государственного-частного партнёрства в этой сфере. В свою очередь, наработка практики использования существующих технологических заделов и разработки новых решений с привязкой к ограниченному ("пилотному") пулу датасетов и соответствующей регуляторике поможет начать с конкретных действий с видимым результатом. Успешные практики можно развивать и корректировать на основе "пилотного" опыта по указанным направлениям, отдельно выделять, анализировать и закреплять типовые механизмы коммерческого использования, "монетизации" государственных данных и далее масштабировать их по регионам, отраслям и сферам применения.