В России создан новый сервис «обезличивающий» документы при работе с нейросетями
Команды CorpSoft 24 и Corp Lab создали сервис, который «прячет» личные и секретные данные в документах перед отправкой в нейросети. Это позволит сотрудникам безопасно использовать ChatGPT или YandexGPT без риска утечек.

Ответ на растущий рыночный запрос
Решение позволяет безопасно использовать внешние ИИ-инструменты (Chat, Yandex), исключая передачу персональных данных и коммерческой тайны. Сервис автоматически удаляет чувствительную информацию из документов, минимизируя риски утечек при аналитической работе и обработке данных.
Продукт отвечает растущему запросу на защиту данных в условиях интеграции ИИ в корпоративные процессы. Он служит барьером между конфиденциальной информацией и облачными ИИ-сервисами, что критически важно для обеспечения информационной безопасности в эпоху цифровизации.
Индустриальный стандарт
Прототип хотя и ориентирован на внутренний корпоративный рынок, обладает значительным экспортным потенциалом. Теоретически, технология может быть востребована в странах с жесткими регуляциями, аналогичными GDPR, где защита данных является критическим фактором при взаимодействии с ИИ-сервисами, но для этого надо пройти большой подготовительный путь. Дополнительно рассматривается возможность экспорта в страны СНГ, где также отмечается растущий спрос на безопасные ИИ-инструменты в корпоративном сегменте, а также интерес со стороны международных компаний, сталкивающихся с аналогичными рисками утечки данных.

На внутреннем рынке России данная технология отвечает актуальным потребностям предприятий в цифровизации и регулировании использования ИИ. Она способна стать стандартом для организаций с повышенными требованиями к защите данных, включая банки, юридические фирмы и государственные структуры. В дальнейшем предполагается интеграция технологии обезличивания в существующие корпоративные платформы документооборота (ECM, BPM) и системы предотвращения утечек данных (DLP). На текущий момент разработан MVP-прототип, который проходит внутреннее тестирование и доработку, с планами по его последующему развертыванию на собственных серверах с централизованным доступом.
Вектор развития отрасли
В числе других технологий, связанных с обезличиванием данных и безопасным использованием – автоматическое обезличивание данных с помощью машинного обучения – процесс, при котором методы машинного обучения автоматически удаляют чувствительную информацию из данных, чтобы снизить риск утечки данных. Среди методов – автоматическое обнаружение конфиденциальной информации, контекстно-зависимое обезличивание, генерация синтетических данных. Системы применяют в крупных финансовых организациях.

Обеспечение конфиденциальности данных в ИИ-системах реализуется через исследовательские инициативы в области машинного обучения с сохранением приватности (privacy-preserving ML). В основе разработок лежат методы дифференциальной приватности текстов, которые ограничивают доступность исходной информации для моделей без потери их функциональности. Суть подхода – дифференциальная приватность (DP).
Технология DeepPrivacy использует возможности нейросетей GAN для генеративной замены лиц на снимках. На данный момент она не имеет прямого коммерческого воплощения, однако служит важным примером того, как будет развиваться сфера автоматической защиты персональных данных.
Продукты категории DLP обеспечивают защиту данных внутри организаций, предотвращая утечки через внешние каналы коммуникации. Несмотря на общность целей с ИИ-инструментами деидентификации, DLP-системы представляют собой более широкую категорию классических защитных решений без акцента на использовании искусственного интеллекта. Растущие требования к безопасности ИИ в российской и европейской юрисдикциях создают правила игры для защиты данных в этой сфере.

Базовая корпоративная технология
Сервис обезличивания документов от CorpSoft24 представляет собой значимый шаг для корпоративной безопасности в контексте применения ИИ. Он решает критическую задачу защиты персональных и коммерческих данных от утечек при работе с внешними ИИ-сервисами, обеспечивая безопасную интеграцию искусственного интеллекта в бизнес-процессы.
Прогнозируется, что продукт имеет все шансы стать базовой корпоративной технологией для защищенной работы с ИИ с ожидаемым ростом спроса в банковском секторе, госструктурах и юрфирмах. При выходе на внешний рынок он способен дополнять международные решения по безопасному использованию ИИ. Однако следует учитывать конкуренцию с крупными вендорами и необходимость соответствия нормативным требованиям (GDPR, ФЗ-152).









































