Отечественных разработчиков искусственного интеллекта (ИИ) могут обязать раскрывать сведения о данных, на которых обучался их ИИ, сообщают российские СМИ. Такое положение содержится в одной из «рабочих версий» закона об ИИ, проект которого готовит Минцифры.
Главная идея закона в целом в том, что «в нем будут определены критерии “российской” нейросети, авторское право, маркировка ИИ-контента, права, обязанности и ответственность». Что касается раскрытия данных для обучения, это положение еще не включено в окончательную версию проекта. Оно предполагает, что разработчик модели должен будет указать наименование набора данных, дату его создания, назначение использования, формат, объем и происхождение.
«Среди обсуждаемых мер – создание отдельного реестра отечественного ИИ или создание реестра отечественных наборов данных», – сообщил источник «Ведомостей».
Законопроект также вводит понятия «суверенного» и «национального» ИИ, сообщает Коммерсант. Суверенный ИИ должен использовать исключительно отечественные разработки и наборы данных, к национальным ИИ требования менее жесткие. Системы будут проходить сертификацию ФСБ и других ведомств и при выполнении требований предустанавливаться на продаваемые в РФ устройства. Также вводится понятие «доверенных» систем ИИ, которые можно использовать в «объектах критической инфраструктуры».
Комментарий Сергея Будылина, советника Адвокатского бюро «Бартолиус», к.ф.-м.н., LL.M:
Многие идеи российского проекта позаимствованы из регламента ЕС на ту же тему от 2024 года (“The AI Act”). Это относится и к маркировке контента, и к раскрытию данных для обучения. Жесткое регулирование – это то, что отличает европейский подход от американского, который в регулировании ИИ пока следует либеральному принципу «поживем-увидим».
Реестр «доверенных ИИ»
Впрочем, российская бюрократия наверняка перебюрократит даже чиновников ЕС. До «суверенных» ИИ европейцы, кажется, пока еще не додумались.
Минцифры уже разрабатывает реестр «доверенных ИИ». Легко можно представить, что следующим шагом будет создание реестра «доверенных источников», разрешенных для обучения «доверенных ИИ». Ведь не дай бог отечественный робот начитается запрещенной литературы! А там уже один шаг до блокировки тех ИИ, которые не являются «доверенными» или хотя бы «суверенными».
Не верите? Может, и правильно. Но кто бы еще недавно поверил, что половину интернета нам отключат. Так что пользуйтесь ChatGPT, пока не запретили…