Logo

Анализ данных из постов в социальных сетях

Tengri Data, 31 октября 2025 г.

 

В ролике демонстрируется полный цикл работы с данными: от загрузки и подготовки до аналитики и визуализации результатов. Автор показывает, как с помощью платформы Tengri и SQL-инструментов на базе PostgreSQL можно:

  • загрузить датасет через Python и мастер-загрузки;
  • распаковать и импортировать данные в систему;
  • создать таблицы с поддержкой JSON-структур;
  • работать с вложенными объектами и массивами с использованием UNNEST, JSON_KEYS, JSON_EXTRACT;
  • нормализовать данные в отдельные аналитические таблицы (музыка, теги пользователей, комментарии);
  • объединять данные с помощью LEFT JOIN и формировать итоговые витрины данных.

Отдельное внимание уделено построению аналитической модели, где каждая строка соответствует отдельному исполнителю, а метрики отражают его популярность: количество постов, композиций, комментариев, лайков, реплаев и отмеченных пользователей.

Финальным этапом становится анализ пользовательской активности во времени — исследование распределения комментариев, лайков и ответов в зависимости от времени, прошедшего с момента публикации поста. Полученные данные визуализируются с помощью Python и библиотеки matplotlib, что позволяет наглядно увидеть динамику вовлечённости аудитории.

Видео наглядно показывает, как платформа Tengri в связке с PostgreSQL позволяет быстро обрабатывать большие объёмы данных, работать со сложными JSON-структурами и получать аналитические инсайты, применимые в маркетинге, digital-аналитике и data science-задачах.



К материалам