ИИ-модели в OSINT: исследуем анонимные сообщества

vaspvort

Ночной дозор
Команда форума
Модератор
ПРОВЕРЕННЫЙ ПРОДАВЕЦ
Private Club
Старожил
Migalki Club
Меценат💎
Регистрация
10/4/18
Сообщения
6.618
Репутация
11.389
Реакции
18.258
USD
0
Сделок через гаранта
18
88046022ea08ddbe26f85b12a5b0b55e.png

В мире OSINT-расследований одна из самых сложных задач — работа с анонимными каналами в Telegram, форумами и закрытыми социальными сообществами. Кто стоит за провокационными постами? Один это человек или группа? Каковы их мотивы и бэкграунд? Раньше ответы на эти вопросы требовали титанического ручного труда. Сегодня на помощь приходят генеративные нейросети, совершающие революцию в анализе текстовых данных.

В этой статье мы разберем, как современные ИИ-модели превращают бессвязный поток сообщений в структурированный психолингвистический портрет, помогая вывести анонимов на чистую воду.

От анонимности к цифровому отпечатку​

58c2f688e6ee30db44f4c3048f6bd5f5.png

Обученные на огромных массивах текстов из соцсетей, литературы и форумов, нейросети научились видеть то, что не видно человеческому глазу — устойчивые лингвистические паттерны. Они позволяют составить комплексный профиль автора по трем ключевым направлениям.

Попробуем сделать это на примере Telegram-канала «Безопасность данных - просто о сложном» бывшего директора департамента по кибербезопасности IBS Олега Владимировича Босенко.

1. Определение количества авторов​

Первый вопрос, который встает перед расследователем: мы имеем дело с одним человеком или коллективом авторов? Нейросеть отвечает на него с помощью стилометрического анализа.

8ab661ee902150a72fd2f78a34dc50e0.png

Как это работает:

а) Модель анализирует массив постов с канала, извлекая сотни признаков: уникальную лексику, построение предложений, использование пунктуации, среднюю длину фраз, характерные ошибки.

б) На основе этих данных проводится кластеризация. Если алгоритм выявляет несколько четко различимых стилистических «кластеров», это с высокой долей вероятности указывает на нескольких авторов.

2. Социодемографический и психологический портрет​

Зная, сколько человек пишет, мы можем понять, кто они. Нейросеть способна определить с высокой вероятностью: пол и возраст автора, регион проживания (по использованию диалектизмов, упоминанию локальных реалий), уровень образования и достатка, ключевые психологические характеристики и мотивы (агрессия, манипулятивность, стремление к признанию и так далее).

16fc64b97d81450baff3c377309dab59.png

Такой портрет позволяет сузить круг подозреваемых и выдвигать обоснованные оперативные версии. Например, если автор демонстрирует высокий уровень образования и знание узкоспециализированной области, поиск можно сфокусировать на соответствующих профессиональных кругах.

b3d3289e355bc8b2f9fc6eb307d22e16.png

3. Установление связи​

Одна из самых сильных сторон технологии — установление связи между анонимным каналом и конкретным человеком, чьи цифровые следы (аккаунты в соцсетях, форумы) уже известны. Для примера, сравним посты в исследуемом канале с текстом интервью Босенко, опубликованном на .

Как это работает:

а) Нейросеть проводит параллельный стилометрический и семантический анализ текстов из открытого профиля подозреваемого и анонимного канала.

б) Модель ищет совпадения не на уровне ключевых слов, а на глубинном уровне: построение аргументации, использование вводных слов и междометий, ритм письма, любимые синтаксические конструкции.

889c3d006eadd55fe5144af193e6f084.png
9e4c9182e84a06132c9e104cd3bdf5bc.png
182ae6d2a4645acdd187ab3903ef3469.png

Это мощный инструмент для получения косвенных улик, позволяющий сформулировать обоснованные ходатайства о проведении экспертизы или дополнительных оперативно-розыскных мероприятий.

Автоматизация рутины​

39e8f13785f4b7933b749e811677cff8.png

Помимо сложного лингвистического анализа, нейросети отлично справляются с прикладными задачами, такими как автоматическое извлечение из истории канала номеров телефонов, email-адресов, криптокошельков, физических адресов, ФИО и гиперссылок, erid и других идентификаторов. Модель может сразу показать, какие идентификаторы встречаются чаще всего, что помогает выявить ключевые контакты или точки мошеннической схемы.

a3f6ee0bf4e728b427a6733bc61e8339.png

При этом крайне важно помнить, что все выводы, сгенерированные нейросетью, носят вероятностный характер. Это не неопровержимое доказательство для суда, но мощный источник криминалистически значимой информации. Так что полученные результаты требуют обязательной перепроверки традиционными методами ОРМ, судебными экспертизами, а также перекрестной проверкой данных из других источников.

Генеративные нейросети — это не фантастика, а уже работающий инструмент, который кардинально меняет ландшафт OSINT-расследований. Они позволяют превратить разрозненные текстовые данные в структурированную информацию, указывающую направление для дальнейшего расследования. Грамотно используя эти технологии и понимая их ограничения, эксперт может работать быстрее, глубже и эффективнее в условиях тотальной цифровизации и анонимности.

 
  • Теги
    osint автоматизация рутины деанонимизация ии-модели
  • Назад
    Сверху Снизу