AI-анализ 120 000 сообщений: что нейросеть узнала о людях из моих чатов на Бали

AI анализ переписок — это не фантастика. Я провёл реальный эксперимент: собрал архивы из 447 чатов в WhatsApp и Telegram, получил на выходе около 120 000 сообщений и задал GPT один вопрос: сможет ли нейросеть анализ чатов превратить в понимание людей? Кто эти люди, какую роль они играют, чем живут, что чувствуют? Ответ оказался настолько точным, что заставил меня переосмыслить, как я выстраиваю отношения с командой, партнёрами и арендаторами.

Зачем я это сделал: AI как инструмент понимания людей

Когда управляешь несколькими виллами на Бали, ежедневно коммуницируешь с десятками людей: местные подрядчики, менеджеры на объектах, арендаторы из разных стран, партнёры, поставщики, уборщики. Плюс личные чаты — друзья, коллеги по прошлым проектам, случайные контакты, которые когда-то стали важными. В какой-то момент я осознал, что держу в голове огромный массив информации о людях, но никогда не обрабатываю его системно.

Идея пришла неожиданно: а что, если доверить этот массив нейросети? Если AI умеет понимать текст, он должен уметь понять человека через его текст. Стиль общения, выбор слов, темп переписки, эмоциональный фон, темы которые человек поднимает сам, а не в ответ — всё это складывается в портрет личности.

Для бизнеса это не просто любопытство. Понять, что движет арендатором, который постоянно задаёт вопросы — он тревожный или просто педантичный? Определить, является ли потенциальный партнёр человеком слова или мастером красивых обещаний. Увидеть, когда сотрудник выгорает раньше, чем он сам это осознаёт. Это и есть практическая ценность AI анализа переписок.

Именно так и родился этот эксперимент — не как технический трюк, а как попытка использовать данные, которые у меня уже есть, чтобы лучше понимать людей, с которыми я работаю. О том, как создать AI-ассистента для управления бизнесом в целом, я писал в отдельной статье — здесь же фокус именно на анализе коммуникаций.

Подготовка датасета: 447 чатов и 120 000 сообщений

Начну с честного признания: подготовка данных заняла больше времени, чем сам анализ. 447 чатов — это не просто архив переписки, это живая история отношений за несколько лет. Сотрудники, партнёры, арендаторы, балийские подрядчики, друзья, бывшие контакты — каждый чат со своей структурой, своим языком, своим контекстом.

Экспорт из Telegram

Telegram оказался проще всего. Встроенный экспортер в десктопном клиенте позволяет выгрузить любой чат в формате JSON или HTML. Для личных чатов достаточно зайти в настройки диалога и выбрать "Экспортировать историю чата". JSON-формат удобнее для дальнейшей обработки: там структурированы отправитель, время, тип сообщения, текст. Проблем практически не возникло — около 300 из моих 447 чатов были в Telegram.

Экспорт из WhatsApp: где начинаются сложности

WhatsApp — совсем другая история. Официальный экспорт позволяет выгрузить чат только в .txt формате, и только по одному. Для 147 чатов делать это вручную — нереально. Пришлось использовать сторонние инструменты. Часть чатов я выгружал через WhatsApp Business API, часть — через специализированные утилиты для резервного копирования, которые умеют читать локальные бэкапы на Android.

Проблема не только в экспорте. Формат .txt от WhatsApp выглядит так: [15.03.2024, 14:32:17] Имя Контакта: текст сообщения. Это не JSON, это просто строки. Парсить их можно, но нужен отдельный скрипт под разные локали (дата пишется по-разному в зависимости от региональных настроек телефона). Об особенностях работы с WhatsApp на Бали подробнее можно почитать в статье про WhatsApp-переводчик для балийской команды.

Грязный датасет: что пришлось чистить

На выходе получился настоящий хаос. Разные кодировки — UTF-8, Windows-1251, даже несколько файлов в ISO-8859-1. Служебные сообщения типа "Контакт присоединился к группе", "Вы пропустили звонок", "Медиафайл недоступен". Спам-боты в групповых чатах. Дублирующиеся сообщения — когда один и тот же текст попал в несколько экспортов.

Очистка включала несколько этапов: нормализация кодировок, фильтрация служебных строк по шаблонам, дедупликация по хешу текста и временной метке, унификация форматов дат в единый стандарт ISO 8601, и наконец — слияние всего в один JSON-файл с полями: sender_id, sender_name, timestamp, text, chat_id.

После очистки из исходных ~140 000 строк осталось около 120 000 реальных сообщений. Это и есть тот датасет, с которым работал GPT.

Разбивка по людям: персональные архивы участников

Следующий шаг — самый важный с точки зрения методологии. Нельзя просто скормить 120 000 сообщений GPT и спросить "расскажи о людях". Нужно разбить массив по участникам: каждому человеку — его личный архив, содержащий все его сообщения из всех чатов в хронологическом порядке.

Техническая реализация

Идентификация участников — нетривиальная задача. Один и тот же человек может фигурировать в разных чатах под разными именами: в Telegram у него одно имя, в WhatsApp — другое, в групповых чатах его могли добавить с третьим именем. Для нормализации я составил словарь: все известные варианты написания имён для каждого реального человека.

После группировки получилось примерно 380 уникальных участников. Средний объём персонального архива — около 315 сообщений на человека. Но разброс огромный: есть люди с 3–5 сообщениями (единичный контакт несколько лет назад), а есть ключевые сотрудники с 2000+ сообщениями. Именно эти ключевые участники дали самые интересные результаты анализа.

Для каждого участника я сформировал JSON-объект:

Структура персонального архива:
— Имя / идентификатор участника
— Список всех его сообщений (текст + дата)
— Чаты, в которых он участвовал
— Временной диапазон активности
— Статистика: количество сообщений, средняя длина, частота

Именно такая структура позволила GPT видеть не просто текст, но и динамику: как менялась активность человека со временем, в каких контекстах он появлялся, в каких чатах он более формален, а в каких — раскован.

Что GPT рассказал о людях из их переписок

Это самая интересная часть. Нейросеть анализ чатов превратила в подробные портреты — и некоторые из них оказались точнее, чем мои собственные впечатления о людях после лет общения.

Промпт, который я использовал (упрощённо): "Перед тобой персональный архив сообщений одного человека из разных чатов за несколько лет. Проанализируй: какую роль этот человек играет в жизни отправителя? Каков его характер по манере общения? Какие интересы прослеживаются? Каков его эмоциональный фон, и как он менялся со временем? Приведи конкретные наблюдения."

Примеры портретов (имена изменены)

Менеджер объекта — Геде. GPT описал его так: "Человек с высокой операционной ориентацией. Сообщения преимущественно деловые, короткие, содержат конкретные факты — цифры, имена гостей, статусы задач. Переключается на английский при работе с иностранными клиентами без напоминания. Работает в нестандартные часы — активность есть и в 7 утра, и в 22:00, что говорит либо о высокой вовлечённости, либо о размытых границах рабочего времени. Эмоциональный фон стабильный, но в августе 2024 года — заметное увеличение кратких ответов и пропущенные уточнения. Возможный признак усталости или стресса в этот период."

Когда я это прочитал — вспомнил. В августе у нас был сложный месяц: накладка с несколькими бронированиями, конфликтный гость. Я помнил об этом, но не связывал это с изменением паттернов переписки Геде.

Партнёр по проекту — назову его Р. "Высокая активность в начале переписки: длинные сообщения, идеи, планы, энтузиазм. Постепенное снижение деталей в сообщениях на протяжении 6 месяцев. К концу анализируемого периода — короткие ответы, задержки в ответах до нескольких дней. Тематика сместилась от стратегических обсуждений к операционным вопросам. Паттерн характерен для снижения вовлечённости или разочарования в проекте."

Я знал, что с Р. что-то пошло не так, но не мог сформулировать когда именно. GPT указал конкретные точки перелома.

Арендаторы с высоким уровнем тревожности. GPT научился их различать: "Этот участник задаёт уточняющие вопросы по уже подтверждённым деталям. Трижды переспросил о времени чекина, хотя информация была дана. Это не недоверие — это паттерн тревожной коммуникации. Рекомендация: проактивно предоставлять информацию до того, как вопрос будет задан."

Такой инсайт напрямую влияет на скрипты общения с гостями. Если AI видит паттерн — значит, его можно автоматически учитывать в системе работы с арендаторами.

Практическое применение: кадровые решения и партнёрства

AI анализ переписок открывает несколько практических направлений для бизнеса. Но сначала — важный момент об этических границах.

Этический принцип: я анализировал только переписку, которая уже является частью моей коммуникации. Я не получал доступ к чужим аккаунтам, не собирал данные без ведома людей. Всё что GPT видел — это то, что люди написали мне сами. Тем не менее, если вы планируете использовать такой подход в команде — важно уведомить сотрудников о том, что переписка может анализироваться в рабочих целях.

Оценка потенциальных партнёров. Если у вас есть несколько месяцев переписки с потенциальным партнёром — это уже достаточный датасет. GPT способен выявить: насколько человек последователен в обещаниях и действиях (сказал — сделал), каков его горизонт планирования (думает тактически или стратегически), как реагирует на неудобные ситуации (уходит от ответа или решает), насколько он внимателен к деталям чужой коммуникации (отвечает на все вопросы или только на удобные).

Понимание мотивации арендаторов. Гость, который пишет много вопросов о соседях и уровне шума — ценит тишину и уединение. Гость, который первым делом спрашивает про рестораны рядом — социальный, хочет вовлечённости. Понимание этих паттернов позволяет настраивать коммуникацию до заезда и повышать удовлетворённость без дополнительных усилий.

Мониторинг состояния команды. Выгорание, снижение мотивации, личные проблемы, которые влияют на работу — всё это оставляет следы в переписке раньше, чем человек сам это осознаёт. Регулярный анализ коммуникационных паттернов команды — это не слежка, это инструмент заботы. Если AI замечает, что сотрудник стал отвечать короче и медленнее — это повод для разговора, а не для выводов.

Подробнее о том, как AI помогает в ежедневных бизнес-проверках, я писал в статье 10 ежедневных AI-проверок бизнеса.

Автодетект встреч из переписки: неожиданная функция

Параллельно с основным экспериментом я наткнулся на кое-что неожиданное. Пока я обрабатывал архивы, в реальном времени чуть не пропустил созвон. Партнёр написал в Telegram: "Слушай, давай после обеда в три созвонимся, есть разговор". Я ответил "окей", и... забыл. Полностью. Созвон состоялся только потому, что он сам написал напоминание за 5 минут.

Именно тогда я подумал: а что если GPT будет читать мою переписку в реальном времени и сам ловить такие договорённости?

Как работает автодетект встреч

Реализация оказалась проще, чем я ожидал. Бот подключён к моим чатам через API. Каждое входящее и исходящее сообщение проходит через GPT с простым промптом: "Есть ли в этом сообщении договорённость о встрече, созвоне или конкретном действии в определённое время? Если да — извлеки: что именно, когда, с кем."

GPT возвращает структурированный ответ: если договорённость найдена — дата, время, описание, участник. Бот автоматически создаёт напоминание на 30 минут раньше события и присылает алерт: "Через 30 минут созвон с [имя]. Тема: [описание из переписки]."

Примеры фраз, которые бот научился распознавать:
— "давай в три" → созвон в 15:00
— "после обеда встретимся" → напоминание на 13:30 с пометкой "уточнить время"
— "завтра утром созвонимся, часов в десять" → созвон завтра в 10:00
— "можешь в пятницу?" + "да, давай в 11" → встреча в пятницу в 11:00
— "перенесём на следующей неделе" → бот помечает предыдущую договорённость как изменённую

Ключевая особенность: система понимает неформальные договорённости. Не "прошу подтвердить встречу 15 апреля в 14:00", а живые фразы из реальных чатов. GPT справляется с разговорным языком, сленгом, сокращениями и даже смешанным русско-английским текстом, который характерен для международной команды.

Результаты первого дня

За первый день работы системы бот поймал три созвона, которые иначе были бы потеряны. Не перенесены, не отложены — именно потеряны, потому что устная договорённость в переписке осталась бы погребена под сотнями других сообщений. Без Google Calendar, без ручных записей, без напоминаний от контрагентов — просто пишу как обычно, а система сама вылавливает всё важное.

Плюс функция автоматического переноса: если после первоначальной договорённости появляется сообщение "давай лучше не в три, а в пять" — бот обновляет напоминание. Это не просто парсинг дат, это понимание контекста разговора.

Ключевой инсайт, который я вынес: GPT умеет парсить неформальные договорённости из живой переписки с точностью, достаточной для реального использования. Это фундаментально меняет представление о том, что можно автоматизировать без изменения поведения людей.

Что это значит для бизнеса на Бали: данные как конкурентное преимущество

120 000 сообщений — это не просто большой архив. Это бесценный датасет о том, как работает мой бизнес на уровне коммуникаций. Каждое сообщение содержит информацию о том, как принимаются решения, как выстраиваются отношения, где возникают точки трения, а где — синергия.

Для бизнеса на Бали, где команда мультикультурна, арендаторы со всего мира, а коммуникация ведётся одновременно на нескольких языках — понимание паттернов особенно ценно. Балийский подрядчик общается иначе, чем европейский партнёр. Российский арендатор ожидает другого уровня детализации, чем австралийский. AI анализ переписок позволяет не просто видеть эти различия — он позволяет автоматически адаптироваться к ним.

Несколько конкретных выводов, которые я уже применяю:

  • Сегментация гостей по коммуникационному профилю. Тревожные гости получают расширенный информационный пакет до заезда. Гости с минималистичным стилем общения — краткие конкретные ответы без избыточных деталей.
  • Профилирование подрядчиков. Я знаю, кто из местных партнёров требует детального ТЗ, а кто лучше работает с устной договорённостью и парой фото. GPT это вывел из паттернов переписки, не из моих субъективных ощущений.
  • Оптимальное время для важных переговоров. Анализ архивов показал, в какое время суток каждый ключевой человек наиболее отзывчив и развёрнут в ответах. Это не магия — это паттерн активности из тысяч сообщений.
  • Ранние сигналы проблем. Если активность ключевого сотрудника падает — это повод не ждать пока ситуация взорвётся, а инициировать разговор.

Главный принцип, который я усвоил из этого эксперимента: данные о коммуникациях — это актив. Большинство компаний его имеют, но не используют. Переписка лежит в мессенджерах, и никто не извлекает из неё системных знаний. AI анализ переписок меняет это.

Конкурентное преимущество здесь не в том, что у тебя больше данных — а в том, что ты умеешь их читать. Бизнес, который понимает паттерны коммуникации своей команды и клиентов, быстрее принимает решения, меньше теряет на коммуникационных ошибках и лучше выстраивает долгосрочные отношения.

Итоги: что дал эксперимент с нейросетью анализом чатов

Я начинал этот эксперимент из любопытства. Закончил с несколькими рабочими инструментами и системным пониманием того, как AI меняет работу с информацией о людях.

Три главных вывода:

  • Нейросеть анализ чатов — это не будущее, это настоящее. GPT справился с задачей составления человеческих портретов на уровне, который меня удивил. Не идеально, но достаточно точно для практического применения в бизнесе.
  • Самое ценное — понимание динамики. Не статичный портрет человека, а то, как он меняется во времени. Когда выгорает, когда воодушевлён, когда теряет интерес. Это информация, которую невозможно получить из одного разговора.
  • Автоматизация там, где ты не ждёшь. Автодетект встреч из переписки — это был побочный продукт эксперимента, но он оказался одним из самых практически ценных результатов. GPT умеет понимать живой язык договорённостей лучше, чем я ожидал.

Если вы хотите попробовать что-то подобное — начните с малого. Возьмите переписку с одним ключевым сотрудником или партнёром за последний год. Экспортируйте из Telegram (это займёт 2 минуты). Загрузите в GPT и попросите составить портрет. Результат вас удивит.

Если хотите обсудить, как внедрить системный AI анализ переписок в своём бизнесе или настроить автодетект встреч — напишите мне напрямую в Telegram. Это именно то, чем занимается 4BOS: превращать данные, которые у вас уже есть, в работающие системы.

Читайте также

Подписаться на блог в Telegram

Читайте свежие кейсы об AI-автоматизации, системной архитектуре и масштабировании бизнеса.

Подписаться