Кейс: G-Group AI 

Автоматизированная система генерации новостного контента на базе ИИ

О проекте

G-Group AI — это интеллектуальный помощник для автоматизированного мониторинга информационного поля застройщика и подготовки новостных публикаций на основе данных из внешних и внутренних источников.

Разработанный продукт выступает как единый технологический контур, который собирает информацию из независимых источников, связанных с застройщиком, анализирует значимость событий и формирует варианты текстов для публикации.

Проблематика и контекст разработки

До внедрения AI-системы работа с новостями и информационными поводами требовала значительных ручных усилий. Основные проблемы заключались в следующем:

— Большой объем разрозненных данных из разных источников

Информация о компании и рынке поступала из нескольких независимых источников. Каждый источник имел собственный формат, способ доступа и структуру данных. Из-за этого команда не могла быстро получить единую картину событий: новости приходилось искать, сопоставлять и интерпретировать вручную.

— Высокая нагрузка на команду при подготовке новостей

Подготовка публикаций включала несколько трудоемких этапов: мониторинг источников, отбор значимых событий, проверку данных, написание текста и приведение его к корпоративному стилю. При большом количестве инфоповодов это увеличивало нагрузку на сотрудников.

— Низкая скорость и нерегулярность публикаций

Для новостного контента скорость реакции критически важна. Если событие появляется сразу в нескольких источниках, важно быстро понять его значимость и подготовить публикацию.

— Отсутствие единого стиля контента

Тексты могли отличаться по тону, структуре и подаче даже при наличии нужных данных. Для публичных коммуникаций девелопера важно, чтобы публикации были выдержаны в едином корпоративном стиле.

Перед командой стояла задача разработать AI-продукт, которая:

  • автоматически собирает данные из внешних и внутренних источников;
  • определяет значимость новостей с помощью системы ключевых слов и весов;
  • нормализует данные перед передачей в AI-модель;
  • генерирует несколько вариантов новостного текста;
  • проводит дополнительную проверку фактов;
  • передает готовые варианты администратору для выбора и подтверждения публикации.

Цель

Разработать AI-систему, которая автоматически агрегирует данные из внешних и внутренних источников, оценивает значимость новостей, генерирует тексты публикаций, передает их на модерацию и публикацию

Описание реализации кейса и творческого пути

Проект реализован за 2 месяца с фокусом на практичность и скорость внедрения. 

На старте команда рассматривала несколько вариантов определения значимости новостей: от простой балльной модели до более сложного AI-анализа и дообучения модели. В результате был выбран наиболее управляемый и быстрый подход — система оценки по ключевым словам, которая включала в себя: 

— использование открытой нейросети

— тестирование на реальных данных

Отдельным важным решением стала генерация трех вариантов поста. Один вариант мог быть более фактическим и ссылаться на источники, второй — более строгим и корпоративным, третий — отличаться по стилю подачи. 

G-Group AI не заменяет редактора полностью, а работает по модели human-in-the-loop: система готовит три варианта текста, после чего администратор выбирает подходящий вариант и подтверждает публикацию.

  1. Аналитика и сбор требований

    • формирование технического задания
    • определение бизнес-целей и сценариев использования
    • выявление и описание источников данных
    • проектирование логики оценки значимости новостей в зависимости от источников и ключевых слов
  2. Проектирование архитектуры

    • разработка общей архитектуры системы
    • определение структуры хранения и обработки данных
    • проектирование интеграционного слоя
    • выбор подхода к работе с AI
  3. Разработка и интеграция источников данных

    • подключение источников данных
    • реализация backend-логики обработки данных
    • разработка механизма нормализации данных
    • внедрение логики оценки релевантности данных для последующей генерации новостей
  4. Настройка и оптимизация AI-модуля

    • настройка генерации текстов на базе открытой нейросети
    • разработка и оптимизация промтов
    • реализация генерации нескольких вариантов постов
    • внедрение механизма фактчекинга
  5. Тестирование системы

    • тестирование на реальных данных
    • проверка качества генерации и соответствия ТЗ
    • доработка логики и промтов


  6. Запуск и эксплуатация

    • запуск системы в рабочий контур
    • мониторинг работы системы


Ключевые решения

1. Разработка системы оценки новостей

Каждая новость получает стартовый балл в зависимости от источника. Далее система анализирует текст новости и увеличивает или уменьшает итоговую оценку на основе ключевых слов. Это позволяет отделять значимые инфоповоды от информационного шума и передавать в генерацию только релевантные события. 

2. Настраиваемые ключевые слова в админ-панели

Ключевые слова стали основой механизма оценки важности новостей. Для каждого слова или фразы можно задать вес: положительный — если оно повышает значимость события, или отрицательный — если снижает.

Управление ключевыми словами вынесено в админ-панель. Это позволяет изменять логику оценки без доработки кода: администратор может добавлять новые слова, корректировать баллы и адаптировать систему под текущую повестку компании.

3. Генерация нескольких вариантов текста

AI-модуль генерирует не один финальный текст, а три варианта публикации. Каждый вариант создается по отдельному промту и отличается стилем подачи. Через интерактивные кнопки можно переключаться между версиями текста, выбрать подходящий вариант и подтвердить публикацию.

4. Внедрение фактчекинга после генерации

Система повторно сопоставляет готовый текст с исходными данными, на основе которых он был создан. Это помогает проверить, корректно ли AI отразил цифры, факты, события и смысл исходного материала. Особенно это важно для новостей, связанных с финансовыми инструментами, объектами строительства и корпоративными событиями.

5. Нормализация данных перед передачей в ИИ

PDF-документы разбиваются на текстовые блоки и таблицы. Табличные данные переводятся в JSON-формат, после чего система выделяет только значимые поля. Это позволяет не перегружать контекст модели лишней информацией и повышает качество генерации. 

Нормализация стала одним из ключевых элементов архитектуры: система не передает в AI «сырой» массив данных, а формирует структурированный набор фактов, пригодный для анализа и генерации публикации.


Ключевые технологии

Backend: серверная логика системы

Серверная часть G-Group AI реализует ключевую бизнес-логику платформы: сбор данных, нормализацию, оценку значимости и передачу информации в AI-модуль.

В проекте использовался backend-стек, ориентированный на работу с интеграциями и обработку данных:

  • PHP
  • Laravel — фреймворк для разработки серверной логики
  • обработка входящих данных
  • Livewire 3 — реактивные компоненты без SPA
  • Filament 4 — панель управления 

Интеграции и работа с внешними сервисами

Система построена на сочетании нескольких типов интеграций:

  • Google Drive API
  • Google Sheets API
  • MOEX API (iss.moex.com)
  • IMAP
  • Email-интеграция
  • Парсинг Telegram — через пользовательский аккаунт
  • ЦРКИ
  • Московская биржа

AI-модуль и работа с генерацией

AI-часть системы построена на использовании:

  • открытой текстовой нейросети (LLM) без дообучения

Вместо обучения модели команда сосредоточилась на:

  • структуре входных данных
  • формировании промтов
  • тестировании на реальных кейсах

Обработка данных и хранение

Для унификации данных из разных источников используется:

  • JSON как основной формат хранения и передачи данных
  • PostgreSQL 17 — основная БД
  • Redis
  • Spatie Media Library + FFmpeg 
  • AI / LLM
  • OpenAI API — основной провайдер
  • Prism 
  • Prompt Engineering
  • Fact Extraction
  • Impact Scoring
  • Token Limit Handling
  • JSON-mode
  • LLM Logging

OCR и обработка документов

Для работы с PDF и сложными форматами данных используется:

  • OCR (computer vision) для извлечения данных из таблиц, графиков и изображений

Административный интерфейс

Для управления системой разработана:

  • админ-панель
  • управление источниками данных
  • настройка ключевых слов и их весов
  • контроль публикаций

Инфраструктура и DevOps

  • Docker / Docker Compose — PHP-FPM 8.4, Nginx
  • Traefik — reverse proxy
  • GitLab CI/CD — автодеплой
  • Мониторинг и отладка
  • Sentry
  • Laravel Telescope
  • Log Viewer

Архитектурные подходы

  • Pipeline обработки событий
  • State Machines
  • Repository Pattern
  • Stub-сервисы

Безопасность и доступ

  • авторизация в админ-панели по логину и паролю
  • доступ к Google Drive только через сервисный аккаунт
  • изолированный доступ к системе без внешнего публичного API

Тестирование

  • Pest — юнит и фичи-тесты
  • Stub-сервисы для всех внешних API


Результаты сотрудничества

В результате была создана AI-система, которая автоматизирует полный цикл подготовки новостного контента: от сбора данных до генерации и передачи текста на публикацию.

Система позволила:

  • централизовать работу с новостными источниками;
  • сократить время подготовки публикаций;
  • повысить регулярность выхода материалов;
  • снизить нагрузку на команду;
  • обеспечить единый стиль коммуникации;
  • создать управляемый процесс модерации AI-контента;
  • обработать около 1700 постов.

G-Group AI стала внутренней интеллектуальной платформой, которая помогает компании быстрее реагировать на информационные поводы, работать с большим объемом данных и поддерживать стабильное качество публичных коммуникаций.