RAG-ассистент по инструкциям УЗ-сканеров в Telegram
Превратили 1000+ страниц инструкций по УЗ-сканерам Samsung в RAG-ассистента в Telegram. 2 000+ врачей, мультимодальный ввод, работает в РФ без VPN.
t.me/samsung_uzi_bot ↗Коротко
- Задача — 1 000+ страниц инструкций Samsung должны превратиться из PDF-талмуда в живой сервис, встроенный в рабочий день врача.
- Подход — RAG с жёсткой привязкой к первоисточнику: модель отвечает только из документов, без галлюцинаций.
- Интерфейс — Telegram-бот, мультимодальный ввод: текст, голос, фото экрана сканера. Для ключевых сценариев — видеоинструкция по шагам.
- Российский контекст — работает в РФ без VPN (API-gateway за пределами страны). Ключевой архитектурный выбор.
Цифры, которые можно сверить
- Уникальных пользователей
- 2 000+
- Запросов в месяц
- 300–500
- Страниц документации в базе
- 1 000+
- Форматов ввода
- Текст · голос · фото
- Доступ из РФ
- Без VPN
- Каналов интеграции
- Telegram + веб
Что было на старте
Инструкции к УЗ-сканерам Samsung — это тысячи страниц мелкого технического текста. PDF разбит по моделям, по функциям, по версиям прошивок. На практике врач-УЗИст, когда хочет быстро включить какой-то редкий режим — эластографию на конкретном датчике, специфичный пресет для акушерства, — делает одно из двух: листает PDF или пишет в поддержку дистрибьютора.
Оба варианта медленные. PDF-поиск работает по точному совпадению, а вопрос формулируется живым языком: «как у меня на аппарате…». Поддержка отвечает не мгновенно и занята более тяжёлыми запросами — сервис, гарантийные случаи, настройка сети.
Итог — часть функций оборудования не используется. Врач не знает, что они есть. А знать должен бы: за эти возможности уже заплачено на этапе покупки сканера, и именно они отличают Samsung от более дешёвых конкурентов.
Куда мы пошли
Гипотеза была простая. У нас уже есть живое профсообщество врачей УЗД в Telegram — 9 400+ человек. Значит, интерфейс для ассистента должен жить там, где аудитория реально сидит, а не на отдельном портале, куда надо отдельно логиниться.
Вторая часть гипотезы — про LLM в клиническом контексте. Обычный чат-бот на GPT галлюцинирует: придумывает несуществующие шаги, сочиняет названия меню. В медтехе это не просто неудобно, это опасно. Значит — RAG: модель отвечает не из общей «эрудиции», а только из фрагментов официальной документации Samsung, которые мы ей подложили.
Третье — всё должно работать в РФ без VPN. Врач на приёме не должен включать туннель, чтобы задать вопрос про свой рабочий аппарат.
Архитектура
Собрано на четырёх кусках, каждый выбирался от задачи, а не от моды:
- n8n как workflow-engine. Визуальный редактор с кодом внутри. Для RAG-пайплайна, где логика связывает мессенджер, векторную базу и LLM, но не требует отдельного бэкенда на Python — это правильный инструмент. Собирается и переделывается быстро, новый сценарий добавляется без коммита в репозиторий.
- Supabase (Postgres + pgvector) как RAG-база. Хранение чанков, эмбеддингов и метаданных по моделям сканеров в одной managed-базе. Для объёма «1000+ страниц» отдельный Qdrant или Pinecone — избыточно: pgvector закрывает задачу и не добавляет ещё один сервис в обслуживание.
- LLM через сервер вне РФ. Все обращения к LLM-API инкапсулированы на нашей стороне. Пользователь пишет в Telegram, бот обрабатывает запрос — и никакого VPN на стороне клиента. Это ключевой архитектурный выбор: именно он делает систему пригодной для ежедневного использования врачом в клинике.
- Telegram Bot API как основной канал. Плюс готова интеграция с веб-виджетом — чтобы встроить тот же ассистент на сайт мероприятия или в дилерский личный кабинет, когда понадобится. Экосистема, а не разовая интеграция.
Как работает один запрос
Что происходит, когда врач пишет @samsung_uzi_bot:
- Приём. Принимаем текст, голосовое или изображение. Фото экрана сканера — частый кейс: непонятная иконка или сообщение об ошибке, проще сфотографировать, чем описывать словами.
- Нормализация. Голос распознаётся в текст, картинка уходит в мультимодальный LLM за текстовым описанием сцены. На выходе — один нормализованный текстовый запрос.
- Retrieval. Запрос переводится в эмбеддинг, pgvector в Supabase возвращает top-k релевантных фрагментов инструкций. Отдельный фильтр по модели сканера, если она определена из диалога или из истории пользователя.
- Генерация. LLM получает запрос, найденные фрагменты и системный промпт: «отвечай только на основании предоставленных документов; если ответа в источнике нет — прямо говори „не знаю“». Без галлюцинаций: только то, что реально есть в инструкции Samsung.
- Ответ в Telegram. Коротко, по делу, с привязкой к конкретной функции устройства. Если запрос выходит за рамки базы — ассистент честно перенаправляет в поддержку, а не выдумывает шаги.
Что покрыто в базе знаний
- Все актуальные линейки сканеров Samsung, которые продаются в РФ: V-серия (V5–V8), HS50/HS60, W9, W10, Z20, HERA.
- 1 000+ страниц официальной технической документации: user guides, quick reference, релизные ноты к обновлениям прошивок.
- База обновляется при выходе новых версий софта аппаратов — контент не фризится на дате запуска.
Чанкинг сделан с учётом специфики медицинских инструкций: числовые параметры (частоты датчиков, диапазоны пресетов) и шаги процедур не режутся пополам. Это мелкая, но принципиальная деталь — иначе модель теряет контекст на границах чанков и выдаёт куски ответов.
RAG — это не «поставили ChatGPT на сайт». Это архитектура, в которой вы гарантируете, что ответ модели берётся из вашего источника. В клинике «LLM что-то придумал» — это риск.
Почему это получилось именно так
Три узких места российского медтех-контекста, о которые спотыкаются «общие» AI-ассистенты:
- VPN — не вариант. Врач не будет включать туннель между приёмами. Мы закрыли это на уровне инфраструктуры: API-gateway снаружи РФ, клиентский интерфейс внутри Telegram.
- Точность дороже скорости. В клинике «LLM что-то придумал» — это риск. RAG с привязкой к первоисточнику снимает почти весь такой риск: модель физически не может ответить то, чего нет в подложенных документах.
- Формат ввода — под руку. Руки заняты датчиком — голос. На экране аппарата — непонятное сообщение, проще сфотографировать. Мы не заставляем печатать длинные описания, если проще показать.
Результаты
- 2 000+ уникальных пользователей — врачи УЗД, сервисные инженеры, дилеры Samsung.
- 300–500 запросов в месяц в стабильном режиме. Сезонных провалов не видно — аудитория реально пользуется, не «попробовали и забыли».
- Снижение нагрузки на поддержку Samsung Medison. Типовые «как включить / как настроить» уходят в бот; у инженеров поддержки освобождается время на тяжёлые запросы.
- Рост вовлечённости в экосистему Samsung. Аппарат продолжает учиться вместе с владельцем, а не лежит с нераскрытой половиной возможностей.
Для B2B-медтеха это немаленький сдвиг. Дорогой сканер — это не разовая продажа, это отношения на 7–10 лет. Чем глубже клиент пользуется оборудованием, тем меньше вероятность, что на следующем обновлении парка он уйдёт к конкуренту.
Что продолжаем улучшать
- Расширяем базу знаний. Добавляем протоколы исследований, рекомендации по пресетам, внутренние FAQ от методистов.
- Тюним retrieval. Подбираем гибридный поиск (BM25 + семантический) под специфику медицинских инструкций с числовыми параметрами.
- Смотрим в логи. Реальные диалоги — лучший источник того, где ассистент ещё отвечает «не знаю», хотя ответ в документации есть. Это прямой сигнал, какие куски базы нужно переразбить или дополнить.
Что из этого кейса можно забрать себе
- RAG — это не «поставили ChatGPT на сайт». Это архитектура, в которой вы гарантируете, что ответ модели берётся из вашего источника. Без этого LLM в поддержке клиентов быстро превращается в генератор правдоподобной дезинформации.
- Интерфейс живёт там, где уже есть аудитория. Свой отдельный сайт с ассистентом в B2B-медтехе почти никто не откроет. Telegram — откроют.
- Российский контекст — это архитектура, а не «мы просто используем OpenAI». Работа без VPN, корректная обработка русского языка, предметная терминология — закладывается на уровне инфраструктуры, а не патчится сверху.
- Большую документацию выгодно оживлять, а не переписывать. 1000+ страниц инструкций никто в здравом уме не будет превращать в красивый сайт-справочник. А в RAG — превратятся за разумные сроки.
Если у вас есть объём технической документации, который «лежит и не читается», — напишите мне в Telegram. Разберём, что из этого реально переводится в работающего ассистента, а что пока преждевременно.