Собираем сигналы из соцсетей, считаем по ним Trend Score и за несколько дней показываем, какие позиции стоит завести в ассортимент. Всё это доступно в дашборде, в чате на обычном языке, через API и в квартальном отчёте, свёрстанном в вашем брендбуке.
Платформа собирает посты, очищает их, группирует похожие в один тренд и считает по нему Trend Score. Категорийный менеджер видит готовый список позиций к закупке, и под каждой может открыть посты и цифры, на которых вывод построен.
Telegram, VK, RSS, Google Trends, Instagram и Reels, научные публикации. Каждый источник опрашиваем по своему расписанию.
Расшифровываем речь из видео, переводим, приводим слова к начальной форме, группируем в тренды, считаем Trend Score и определяем, на какой стадии тренд находится.
Дашборд, чат на естественном языке, API, квартальный отчёт.
Требование Ozon собирать данные самим совпадает с нашим интересом: платформа остаётся вашей, и вы не привязаны к чужому сервису. Часы и сроки ниже взяты из нашего PERT-расчёта.
Кликните по источнику, покажем, как находим каналы, как догружаем только новое и как отсеиваем повторы. Сплошные блоки уже работают в прототипе, пунктирные, это то, что по ТЗ доделываем в боевой версии.
Архитектура Kappa: один инкрементальный поток, без второго кода как в Lambda. Firehose нет. Источники мы опрашиваем по расписанию (от 2 часов до недели), так что поток по сути плановый микро-батч. Квартальный отчёт считается тем же батч-запросом по той же витрине. Кликните на слой, чтобы увидеть состав работ и оценку.
Кликните источник, чтобы увидеть, как мы его разведываем и собираем. Кликните слой пайплайна, чтобы увидеть состав работ и оценку.
Распознавание речи, языковые модели и перевод подключены через единый интерфейс: сменить провайдера можно правкой конфига, не переписывая обработку.
6 адаптеров, изоляция по очередям
Whisper и Parakeet по аудио/видео Reels
лемматизация словоформ, BGE-M3 → Qdrant
HDBSCAN → формирование трендов
охват + вовлечённость + новизна + рост
emerging → growing → peak → declining
ответы с доказательной базой
Дашборд тянет тренды из Telegram вживую и показывает реальные посты за каждым. Открыть прототип на весь экран →
Ниже, обезличенные кейсы из работающих продуктов и то, как мы выбираем способ сбора под конкретную задачу.
Определяем, каким путём собирать данные под конкретную цель, и считаем стоимость на масштабе. Сначала проверяем решающий факт дешёвым экспериментом, потом закупаем ресурсы, без переплаты за прокси, которые не решают задачу.
Выводим поэтапно: к концу второго месяца команда из 6–8 человек (архитектор, AI/ML, backend, frontend, DevOps, QA, PM) запускает рабочий MVP в эксплуатацию. Дальше, опытная эксплуатация и вывод в промышленную.
Опытная эксплуатация (4 нед) и вывод в промышленную (2 нед) идут после MVP. Полный план-график с критериями готовности по каждому этапу приложим отдельным документом к подаче.
Внешнюю разработку чаще всего срывает то, что заказчик перестаёт видеть, как идут работы. Поэтому мы описываем процесс заранее: один ответственный, заранее согласованные часы и показ результата каждую неделю.
Заказчик общается с одним человеком. Он дирижирует delivery, инженерами и QA, держит весь контекст и отвечает за результат. Спрашивать можно с одного человека.
Отдельный человек ведёт план, риски и эскалации, чтобы архитектор не отвлекался от продукта.
Каждый этап оцениваем по PERT и согласуем объём и часы до начала. Работ без согласованной оценки не ведём.
Если меняются требования, мы переоцениваем и согласуем новый объём ещё до старта работ. Никаких сюрпризов в счёте в конце месяца.
Время ведём в трекере, раз в неделю присылаем отчёт: что сделано, сколько часов ушло, что в работе дальше.
Раз в неделю показываем рабочий инкремент, собираем правки и корректируем приоритеты на следующую неделю.
Все суммы с НДС 5% (УСН, IT-льгота). Предварительно, до уточнения объёма сигналов и SLA.