Анализ задачи
Определяем цели и сценарии использования ИИ.
2–3 дняПодключаем ИИ к процессам бизнеса: чат-боты поддержки, RAG-поиск по базе знаний, классификация обращений, автоматическая обработка данных.
Процесс работы
Определяем цели и сценарии использования ИИ.
2–3 дняВыбираем модель и архитектуру решения.
3–5 днейИнтегрируем ИИ-модель и бизнес-логику.
7–14 днейПроверяем корректность и стабильность.
3–5 днейРазворачиваем решение и обучаем команду.
1–2 дняСтоимость
от 70 000 ₽
Тестирование ИИ-гипотезы
Срок: 2–3 недели
от 150 000 ₽
Полноценное ИИ-решение
Срок: 1–2 месяца
от 40 000 ₽
Сопровождение ИИ-систем
Срок: 1 месяц
В большинстве проектов — нет, мы используем готовые языковые модели (GPT-4, Claude, открытые модели через Ollama) и подаём ваши данные через RAG-поиск или промпт-инжиниринг. Это безопаснее, дешевле и быстрее, чем дообучение. Дообучение нужно только если требуется специфический стиль ответов или работа с узкими доменами — обсудим это на этапе анализа задачи. Если ваши данные нужны для контекста — поможем структурировать их в векторную базу.
Подбираем стек под задачу. Для большинства b2b-кейсов это OpenAI API (GPT-4o, GPT-4o-mini), Anthropic Claude (Sonnet, Haiku) или DeepSeek. Для on-premise и чувствительных данных — open-source модели через Ollama или vLLM (Llama 3, Qwen 2.5, Mistral). Для RAG используем LangChain или собственные пайплайны на Python, векторное хранилище — Pinecone, Qdrant или pgvector. Frontend интеграции — Vue.js или React, бэкенд — FastAPI/Node.js. Выбор фиксируется в ТЗ перед стартом.
Зависит от выбранной модели. OpenAI/Anthropic API обрабатывают данные на серверах вендора (США/ЕС) — их корпоративные тарифы не используют пользовательские запросы для обучения. Для критичных данных используем on-premise: open-source модель крутится на вашем сервере или нашей инфраструктуре в РФ. RAG-данные шифруются at-rest и in-transit. Для b2b-проектов с ПДн помогаем оформить документацию по 152-ФЗ и проверяем соответствие требованиям Роскомнадзора.
Пилотный проект — от 70 000 ₽ за 2–3 недели: один сценарий, интеграция через API, документация и рекомендации по масштабированию. Полноценная интеграция с несколькими сценариями — от 150 000 ₽ за 1–2 месяца. К стоимости разработки добавляются операционные расходы на API-вызовы (от $5–50 в месяц для b2b с умеренной нагрузкой) или серверы для on-premise. Точную смету выдаём после анализа задачи — для этого нужны 30 минут на созвон.
Чаще всего: чат-боты поддержки 24/7 (отвечают на 60–80% типовых вопросов без человека), RAG-поиск по корпоративной базе знаний (Confluence, Notion, Google Docs), автоматическая классификация и приоритизация заявок, извлечение данных из документов (PDF, накладные, договоры), генерация контента для маркетинга, анализ отзывов и обращений с emotion/intent detection. На сайте есть кейс AI DoctorBot — пример full-cycle интеграции медицинского чат-бота с обработкой 2300+ запросов.
Через REST или WebSocket API — фронтенд вызывает наш сервис, мы прокидываем запрос в LLM и возвращаем результат. Если у вас Vue/React — даём готовые компоненты чата с отображением streaming-ответов. Для CRM (Bitrix24, AmoCRM, Odoo) делаем модули или внешние интеграции через webhooks. Для мессенджеров — нативная интеграция в Telegram, WhatsApp Business API, VK. Если продукт ещё в разработке — закладываем ИИ-слой в архитектуру с самого начала.
Мониторинг качества ответов через дашборд (LangSmith или собственный), автоматическое логирование ошибок, регулярную ревизию промптов и тестов на регрессию, обновление моделей при выходе новых версий (GPT-4o → GPT-5, например), оптимизацию стоимости через model routing (дешёвая модель для простых вопросов, дорогая — для сложных). Тариф «Поддержка» — от 40 000 ₽/месяц. Включает SLA на отклик, фиксированный объём улучшений и регулярный health-check.