Большинство вопросов от гостей — это одно и то же: "Когда заезд?", "Где парковка?", "Есть ли в вилле кондиционер?", "Можем ли мы привести гостей раньше?". Текстовые ответы на это давать утомительно. Я решил: почему бы не дать им возможность говорить голосом? Включил Whisper API и голосовой синтез — и теперь гости могут задать вопрос голосовым сообщением, а AI ответит голосовым же сообщением. За несколько секунд.
Как это устроено
Гость пишет голосовое сообщение в Telegram или WhatsApp:
- Шаг 1: Гость записывает голосовое сообщение "Привет, мы завтра приезжаем, когда можем заселиться?"
- Шаг 2: Наш бот получает это сообщение, скачивает аудиофайл
- Шаг 3: Whisper API транскрибирует голос в текст: "Привет, мы завтра приезжаем, когда можем заселиться?"
- Шаг 4: GPT анализирует текст, ищет информацию в БД (дата бронирования, номер виллы, время заезда)
- Шаг 5: GPT генерирует ответ: "Добрый день! Я вижу, что вы забронировали виллу 'Sunset Paradise' с 15:00 завтра. Ключи будут готовы к этому времени. Приватный трансфер вас встретит в аэропорту. Какие-то вопросы?"
- Шаг 6: Google TTS или подобный сервис преобразует текст обратно в голос
- Шаг 7: Гость получает голосовое сообщение с ответом
Всё это происходит за 3-5 секунд. Гость слышит живой ответ почти мгновенно.
Почему голос лучше текста
Когда я прочитал результаты ab-теста, удивился:
- Доверие: Голосовой ответ кажется более человеческим. Гостям нравится. Они воспринимают это как если бы им отвечал реальный консьерж.
- Скорость восприятия: Голос поглощается быстрее, чем текст. Гость сразу понимает, когда заезд, не теряя время на чтение.
- Языки: Гости из разных стран оценивают английский, местный язык. TTS может говорить на десятках языков, и гость не чувствует себя иностранцем.
- Удобство: Не нужно писать текст, если ты за рулём, занят, в спешке. Просто скажи.
Результат: скорость ответа улучшилась на 70%, удовлетворённость гостей — на 35%.
Частые вопросы, которые мы покрываем
Система обучена отвечать на 50+ стандартных вопросов:
- "Когда заезд?" → автоматический поиск по номеру брони
- "Где парковка?" → описание парковки на вилле (с фото)
- "Что входит в стоимость?" → перечисление амменититинов
- "Есть WiFi?" → да, пароль, скорость
- "Можем ли мы прийти раньше?" → проверка занятости, возможность раннего заезда
- "Есть ли кухня?" → описание кухни, что в ней есть
- "Как добраться из аэропорта?" → варианты трансфера
- "Есть бассейн?" → описание бассейна с фото
Для сложных вопросов ("Как отменить бронь?", "Какая политика возврата?") система понимает, что не может ответить автоматически, и передаёт запрос менеджеру с тегом [ТРЕБУЕТ ВНИМАНИЯ].
Интеграция с фотографией
Интересная фишка: когда гость спрашивает "Как выглядит вилла?", система может автоматически отправить подборку фотографий из БД. Или если спрашивает про бассейн, берёт фотографию бассейна той виллы и отправляет. Никакого ручного поиска — всё автоматизировано.
Работает ли это 24/7?
Да. Бот работает круглосуточно. Гостям не нужно ждать, пока менеджер проснется. Это особенно важно для гостей из разных часовых поясов. Турист из США может написать в 3 утра (по его времени) и получить ответ за несколько секунд.
Проблемы и их решение
Первое время был одна проблема: Whisper иногда неправильно транскрибировал иностранный акцент. Например, "booking" становилось "бахинг". Решение: я добавил список знакомых слов (брони, вилла, Бали, цены и т.д.) как подсказку для Whisper. Теперь точность выше 95%.
Вторая проблема: некоторые гости записывали огромные голосовые сообщения (минуты на 3). TTS обработка стала медленнее. Решение: ограничил длину обработки до 60 секунд. Если длиннее — просит переформулировать или разбить на несколько вопросов.