Кейс: G-Group AI

Автоматизированная система генерации новостного контента на базе ИИ

О проекте

G-Group AI — это интеллектуальный помощник для автоматизированного мониторинга информационного поля застройщика и подготовки новостных публикаций на основе данных из внешних и внутренних источников.

Разработанный продукт выступает как единый технологический контур, который собирает информацию из независимых источников, связанных с застройщиком, анализирует значимость событий и формирует варианты текстов для публикации.

Проблематика и контекст разработки

До внедрения AI-системы работа с новостями и информационными поводами требовала значительных ручных усилий. Основные проблемы заключались в следующем:

— Большой объем разрозненных данных из разных источников

Информация о компании и рынке поступала из нескольких независимых источников. Каждый источник имел собственный формат, способ доступа и структуру данных. Из-за этого команда не могла быстро получить единую картину событий: новости приходилось искать, сопоставлять и интерпретировать вручную.

— Высокая нагрузка на команду при подготовке новостей

Подготовка публикаций включала несколько трудоемких этапов: мониторинг источников, отбор значимых событий, проверку данных, написание текста и приведение его к корпоративному стилю. При большом количестве инфоповодов это увеличивало нагрузку на сотрудников.

— Низкая скорость и нерегулярность публикаций

Для новостного контента скорость реакции критически важна. Если событие появляется сразу в нескольких источниках, важно быстро понять его значимость и подготовить публикацию.

— Отсутствие единого стиля контента

Тексты могли отличаться по тону, структуре и подаче даже при наличии нужных данных. Для публичных коммуникаций девелопера важно, чтобы публикации были выдержаны в едином корпоративном стиле.

Перед командой стояла задача разработать AI-продукт, которая:

автоматически собирает данные из внешних и внутренних источников;
определяет значимость новостей с помощью системы ключевых слов и весов;
нормализует данные перед передачей в AI-модель;
генерирует несколько вариантов новостного текста;
проводит дополнительную проверку фактов;
передает готовые варианты администратору для выбора и подтверждения публикации.

Цель

Разработать AI-систему, которая автоматически агрегирует данные из внешних и внутренних источников, оценивает значимость новостей, генерирует тексты публикаций, передает их на модерацию и публикацию

Описание реализации кейса и творческого пути

Проект реализован за 2 месяца с фокусом на практичность и скорость внедрения.

На старте команда рассматривала несколько вариантов определения значимости новостей: от простой балльной модели до более сложного AI-анализа и дообучения модели. В результате был выбран наиболее управляемый и быстрый подход — система оценки по ключевым словам, которая включала в себя:

— использование открытой нейросети

— тестирование на реальных данных

Отдельным важным решением стала генерация трех вариантов поста. Один вариант мог быть более фактическим и ссылаться на источники, второй — более строгим и корпоративным, третий — отличаться по стилю подачи.

G-Group AI не заменяет редактора полностью, а работает по модели human-in-the-loop: система готовит три варианта текста, после чего администратор выбирает подходящий вариант и подтверждает публикацию.

Аналитика и сбор требований
- формирование технического задания
- определение бизнес-целей и сценариев использования
- выявление и описание источников данных
- проектирование логики оценки значимости новостей в зависимости от источников и ключевых слов
Проектирование архитектуры
- разработка общей архитектуры системы
- определение структуры хранения и обработки данных
- проектирование интеграционного слоя
- выбор подхода к работе с AI
Разработка и интеграция источников данных
- подключение источников данных
- реализация backend-логики обработки данных
- разработка механизма нормализации данных
- внедрение логики оценки релевантности данных для последующей генерации новостей
Настройка и оптимизация AI-модуля
- настройка генерации текстов на базе открытой нейросети
- разработка и оптимизация промтов
- реализация генерации нескольких вариантов постов
- внедрение механизма фактчекинга
Тестирование системы
- тестирование на реальных данных
- проверка качества генерации и соответствия ТЗ
- доработка логики и промтов
Запуск и эксплуатация
- запуск системы в рабочий контур
- мониторинг работы системы

Ключевые решения

1. Разработка системы оценки новостей

Каждая новость получает стартовый балл в зависимости от источника. Далее система анализирует текст новости и увеличивает или уменьшает итоговую оценку на основе ключевых слов. Это позволяет отделять значимые инфоповоды от информационного шума и передавать в генерацию только релевантные события.

2. Настраиваемые ключевые слова в админ-панели

Ключевые слова стали основой механизма оценки важности новостей. Для каждого слова или фразы можно задать вес: положительный — если оно повышает значимость события, или отрицательный — если снижает.

Управление ключевыми словами вынесено в админ-панель. Это позволяет изменять логику оценки без доработки кода: администратор может добавлять новые слова, корректировать баллы и адаптировать систему под текущую повестку компании.

3. Генерация нескольких вариантов текста

AI-модуль генерирует не один финальный текст, а три варианта публикации. Каждый вариант создается по отдельному промту и отличается стилем подачи. Через интерактивные кнопки можно переключаться между версиями текста, выбрать подходящий вариант и подтвердить публикацию.

4. Внедрение фактчекинга после генерации

Система повторно сопоставляет готовый текст с исходными данными, на основе которых он был создан. Это помогает проверить, корректно ли AI отразил цифры, факты, события и смысл исходного материала. Особенно это важно для новостей, связанных с финансовыми инструментами, объектами строительства и корпоративными событиями.

5. Нормализация данных перед передачей в ИИ

PDF-документы разбиваются на текстовые блоки и таблицы. Табличные данные переводятся в JSON-формат, после чего система выделяет только значимые поля. Это позволяет не перегружать контекст модели лишней информацией и повышает качество генерации.

Нормализация стала одним из ключевых элементов архитектуры: система не передает в AI «сырой» массив данных, а формирует структурированный набор фактов, пригодный для анализа и генерации публикации.

Ключевые технологии

Backend: серверная логика системы

Серверная часть G-Group AI реализует ключевую бизнес-логику платформы: сбор данных, нормализацию, оценку значимости и передачу информации в AI-модуль.

В проекте использовался backend-стек, ориентированный на работу с интеграциями и обработку данных:

PHP
Laravel — фреймворк для разработки серверной логики
обработка входящих данных
Livewire 3 — реактивные компоненты без SPA
Filament 4 — панель управления

Интеграции и работа с внешними сервисами

Система построена на сочетании нескольких типов интеграций:

Google Drive API
Google Sheets API
MOEX API (iss.moex.com)
IMAP
Email-интеграция
Парсинг Telegram — через пользовательский аккаунт
ЦРКИ
Московская биржа

AI-модуль и работа с генерацией

AI-часть системы построена на использовании:

открытой текстовой нейросети (LLM) без дообучения

Вместо обучения модели команда сосредоточилась на:

структуре входных данных
формировании промтов
тестировании на реальных кейсах

Обработка данных и хранение

Для унификации данных из разных источников используется:

JSON как основной формат хранения и передачи данных
PostgreSQL 17 — основная БД
Redis
Spatie Media Library + FFmpeg
AI / LLM
OpenAI API — основной провайдер
Prism
Prompt Engineering
Fact Extraction
Impact Scoring
Token Limit Handling
JSON-mode
LLM Logging

OCR и обработка документов

Для работы с PDF и сложными форматами данных используется:

OCR (computer vision) для извлечения данных из таблиц, графиков и изображений

Административный интерфейс

Для управления системой разработана:

админ-панель
управление источниками данных
настройка ключевых слов и их весов
контроль публикаций

Инфраструктура и DevOps

Docker / Docker Compose — PHP-FPM 8.4, Nginx
Traefik — reverse proxy
GitLab CI/CD — автодеплой
Мониторинг и отладка
Sentry
Laravel Telescope
Log Viewer

Архитектурные подходы

Pipeline обработки событий
State Machines
Repository Pattern
Stub-сервисы

Безопасность и доступ

авторизация в админ-панели по логину и паролю
доступ к Google Drive только через сервисный аккаунт
изолированный доступ к системе без внешнего публичного API

Тестирование

Pest — юнит и фичи-тесты
Stub-сервисы для всех внешних API

Результаты сотрудничества

В результате была создана AI-система, которая автоматизирует полный цикл подготовки новостного контента: от сбора данных до генерации и передачи текста на публикацию.

Система позволила:

централизовать работу с новостными источниками;
сократить время подготовки публикаций;
повысить регулярность выхода материалов;
снизить нагрузку на команду;
обеспечить единый стиль коммуникации;
создать управляемый процесс модерации AI-контента;
обработать около 1700 постов.

G-Group AI стала внутренней интеллектуальной платформой, которая помогает компании быстрее реагировать на информационные поводы, работать с большим объемом данных и поддерживать стабильное качество публичных коммуникаций.