06 AI и автоматизация
B2B медтех · AI 2025 — н.в. Архитектор AI-системы

RAG-ассистент по инструкциям УЗ-сканеров в Telegram

Превратили 1000+ страниц инструкций по УЗ-сканерам Samsung в RAG-ассистента в Telegram. 2 000+ врачей, мультимодальный ввод, работает в РФ без VPN.

t.me/samsung_uzi_bot ↗

Коротко

  • Задача — 1 000+ страниц инструкций Samsung должны превратиться из PDF-талмуда в живой сервис, встроенный в рабочий день врача.
  • Подход — RAG с жёсткой привязкой к первоисточнику: модель отвечает только из документов, без галлюцинаций.
  • Интерфейс — Telegram-бот, мультимодальный ввод: текст, голос, фото экрана сканера. Для ключевых сценариев — видеоинструкция по шагам.
  • Российский контекст — работает в РФ без VPN (API-gateway за пределами страны). Ключевой архитектурный выбор.

Цифры, которые можно сверить

Уникальных пользователей
2 000+
Запросов в месяц
300–500
Страниц документации в базе
1 000+
Форматов ввода
Текст · голос · фото
Доступ из РФ
Без VPN
Каналов интеграции
Telegram + веб

Что было на старте

Инструкции к УЗ-сканерам Samsung — это тысячи страниц мелкого технического текста. PDF разбит по моделям, по функциям, по версиям прошивок. На практике врач-УЗИст, когда хочет быстро включить какой-то редкий режим — эластографию на конкретном датчике, специфичный пресет для акушерства, — делает одно из двух: листает PDF или пишет в поддержку дистрибьютора.

Оба варианта медленные. PDF-поиск работает по точному совпадению, а вопрос формулируется живым языком: «как у меня на аппарате…». Поддержка отвечает не мгновенно и занята более тяжёлыми запросами — сервис, гарантийные случаи, настройка сети.

Итог — часть функций оборудования не используется. Врач не знает, что они есть. А знать должен бы: за эти возможности уже заплачено на этапе покупки сканера, и именно они отличают Samsung от более дешёвых конкурентов.

Куда мы пошли

Гипотеза была простая. У нас уже есть живое профсообщество врачей УЗД в Telegram — 9 400+ человек. Значит, интерфейс для ассистента должен жить там, где аудитория реально сидит, а не на отдельном портале, куда надо отдельно логиниться.

Вторая часть гипотезы — про LLM в клиническом контексте. Обычный чат-бот на GPT галлюцинирует: придумывает несуществующие шаги, сочиняет названия меню. В медтехе это не просто неудобно, это опасно. Значит — RAG: модель отвечает не из общей «эрудиции», а только из фрагментов официальной документации Samsung, которые мы ей подложили.

Третье — всё должно работать в РФ без VPN. Врач на приёме не должен включать туннель, чтобы задать вопрос про свой рабочий аппарат.

Архитектура

Собрано на четырёх кусках, каждый выбирался от задачи, а не от моды:

  • n8n как workflow-engine. Визуальный редактор с кодом внутри. Для RAG-пайплайна, где логика связывает мессенджер, векторную базу и LLM, но не требует отдельного бэкенда на Python — это правильный инструмент. Собирается и переделывается быстро, новый сценарий добавляется без коммита в репозиторий.
  • Supabase (Postgres + pgvector) как RAG-база. Хранение чанков, эмбеддингов и метаданных по моделям сканеров в одной managed-базе. Для объёма «1000+ страниц» отдельный Qdrant или Pinecone — избыточно: pgvector закрывает задачу и не добавляет ещё один сервис в обслуживание.
  • LLM через сервер вне РФ. Все обращения к LLM-API инкапсулированы на нашей стороне. Пользователь пишет в Telegram, бот обрабатывает запрос — и никакого VPN на стороне клиента. Это ключевой архитектурный выбор: именно он делает систему пригодной для ежедневного использования врачом в клинике.
  • Telegram Bot API как основной канал. Плюс готова интеграция с веб-виджетом — чтобы встроить тот же ассистент на сайт мероприятия или в дилерский личный кабинет, когда понадобится. Экосистема, а не разовая интеграция.

Как работает один запрос

Что происходит, когда врач пишет @samsung_uzi_bot:

  1. Приём. Принимаем текст, голосовое или изображение. Фото экрана сканера — частый кейс: непонятная иконка или сообщение об ошибке, проще сфотографировать, чем описывать словами.
  2. Нормализация. Голос распознаётся в текст, картинка уходит в мультимодальный LLM за текстовым описанием сцены. На выходе — один нормализованный текстовый запрос.
  3. Retrieval. Запрос переводится в эмбеддинг, pgvector в Supabase возвращает top-k релевантных фрагментов инструкций. Отдельный фильтр по модели сканера, если она определена из диалога или из истории пользователя.
  4. Генерация. LLM получает запрос, найденные фрагменты и системный промпт: «отвечай только на основании предоставленных документов; если ответа в источнике нет — прямо говори „не знаю“». Без галлюцинаций: только то, что реально есть в инструкции Samsung.
  5. Ответ в Telegram. Коротко, по делу, с привязкой к конкретной функции устройства. Если запрос выходит за рамки базы — ассистент честно перенаправляет в поддержку, а не выдумывает шаги.

Что покрыто в базе знаний

  • Все актуальные линейки сканеров Samsung, которые продаются в РФ: V-серия (V5–V8), HS50/HS60, W9, W10, Z20, HERA.
  • 1 000+ страниц официальной технической документации: user guides, quick reference, релизные ноты к обновлениям прошивок.
  • База обновляется при выходе новых версий софта аппаратов — контент не фризится на дате запуска.

Чанкинг сделан с учётом специфики медицинских инструкций: числовые параметры (частоты датчиков, диапазоны пресетов) и шаги процедур не режутся пополам. Это мелкая, но принципиальная деталь — иначе модель теряет контекст на границах чанков и выдаёт куски ответов.

RAG — это не «поставили ChatGPT на сайт». Это архитектура, в которой вы гарантируете, что ответ модели берётся из вашего источника. В клинике «LLM что-то придумал» — это риск.

Почему это получилось именно так

Три узких места российского медтех-контекста, о которые спотыкаются «общие» AI-ассистенты:

  • VPN — не вариант. Врач не будет включать туннель между приёмами. Мы закрыли это на уровне инфраструктуры: API-gateway снаружи РФ, клиентский интерфейс внутри Telegram.
  • Точность дороже скорости. В клинике «LLM что-то придумал» — это риск. RAG с привязкой к первоисточнику снимает почти весь такой риск: модель физически не может ответить то, чего нет в подложенных документах.
  • Формат ввода — под руку. Руки заняты датчиком — голос. На экране аппарата — непонятное сообщение, проще сфотографировать. Мы не заставляем печатать длинные описания, если проще показать.

Результаты

  • 2 000+ уникальных пользователей — врачи УЗД, сервисные инженеры, дилеры Samsung.
  • 300–500 запросов в месяц в стабильном режиме. Сезонных провалов не видно — аудитория реально пользуется, не «попробовали и забыли».
  • Снижение нагрузки на поддержку Samsung Medison. Типовые «как включить / как настроить» уходят в бот; у инженеров поддержки освобождается время на тяжёлые запросы.
  • Рост вовлечённости в экосистему Samsung. Аппарат продолжает учиться вместе с владельцем, а не лежит с нераскрытой половиной возможностей.

Для B2B-медтеха это немаленький сдвиг. Дорогой сканер — это не разовая продажа, это отношения на 7–10 лет. Чем глубже клиент пользуется оборудованием, тем меньше вероятность, что на следующем обновлении парка он уйдёт к конкуренту.

Что продолжаем улучшать

  • Расширяем базу знаний. Добавляем протоколы исследований, рекомендации по пресетам, внутренние FAQ от методистов.
  • Тюним retrieval. Подбираем гибридный поиск (BM25 + семантический) под специфику медицинских инструкций с числовыми параметрами.
  • Смотрим в логи. Реальные диалоги — лучший источник того, где ассистент ещё отвечает «не знаю», хотя ответ в документации есть. Это прямой сигнал, какие куски базы нужно переразбить или дополнить.

Что из этого кейса можно забрать себе

  • RAG — это не «поставили ChatGPT на сайт». Это архитектура, в которой вы гарантируете, что ответ модели берётся из вашего источника. Без этого LLM в поддержке клиентов быстро превращается в генератор правдоподобной дезинформации.
  • Интерфейс живёт там, где уже есть аудитория. Свой отдельный сайт с ассистентом в B2B-медтехе почти никто не откроет. Telegram — откроют.
  • Российский контекст — это архитектура, а не «мы просто используем OpenAI». Работа без VPN, корректная обработка русского языка, предметная терминология — закладывается на уровне инфраструктуры, а не патчится сверху.
  • Большую документацию выгодно оживлять, а не переписывать. 1000+ страниц инструкций никто в здравом уме не будет превращать в красивый сайт-справочник. А в RAG — превратятся за разумные сроки.

Если у вас есть объём технической документации, который «лежит и не читается», — напишите мне в Telegram. Разберём, что из этого реально переводится в работающего ассистента, а что пока преждевременно.

Как со мной связаться

Расскажите задачу —
разберём, как её решать.

Первый разговор бесплатный, без презентаций и «а давайте я пришлю коммерческое». Смотрим, что есть, что мешает расти, и честно говорим, берём мы вашу задачу или нет. Если берём — собираем точечный план на ближайшие 60 дней.

Обычно отвечаю в течение рабочего дня. На часовых поясах от Калининграда до Владивостока проверено — пишите, когда вам удобно.