# Аналіз предметної області

# Вступ

У цьому документі наведені основні визначення, підходи та способи вирішення завдання аналізу медіа контетну, порівняльна характеристика існуючих засобів вирішення завдання, а також робиться висновок щодо доцільності створення нової системи.

Зміст документа:

  • Основні визначення
  • Підходи та способи вирішення завдання аналізу медіа контетну
  • Порівняльна характеристика існуючих засобів вирішення завдання
  • Висновки

# Основні визначення

Медія (opens new window) – засоби передавання, зберігання та відтворення інформації, призначені для її донесення крізь просторові, часові чи інші перепони.

Медіа контент (opens new window) – це будь-які дані, текст, звуки, зображення чи подібний матеріал, поширений у будь-якій формі, включаючи, але не обмежуючись рекламою та матеріалами, що поширюються в електронному вигляді в комп’ютерній системі.

Моніторинг (opens new window)— система постійного спостереження за явищами і процесами, що проходять в навколишньому середовищі, суспільстві, результати якого слугують для обґрунтування управлінських рішень по забезпеченню безпеки людей та об'єктів/суб'єктів.

Інтерфейс користувача (opens new window) – засіб зручної взаємодії користувача (людини) з інформаційною системою. Сукупність засобів для обробки та відбиття інформації, якнайбільше пристосованих для зручності користувача; у графічних системах інтерфейс користувача, втілюється багатовіконним режимом, змінами кольору, розміру, видимості (прозорість, напівпрозорість, невидимість) вікон, їх розташуванням, сортуванням елементів вікон, гнучкими налагодженнями як самих вікон, так і окремих їх елементів (файли, теки, ярлики, шрифти тощо), доступністю багатокористувацьких налаштувань.

Інтерфейс користувача (opens new window) — засіб зручної взаємодії користувача (людини) з інформаційною системою. Сукупність засобів для обробки та відбиття інформації, якнайбільше пристосованих для зручності користувача; у графічних системах інтерфейс користувача, втілюється багатовіконним режимом, змінами кольору, розміру, видимості (прозорість, напівпрозорість, невидимість) вікон, їх розташуванням, сортуванням елементів вікон, гнучкими налагодженнями як самих вікон, так і окремих їх елементів (файли, теки, ярлики, шрифти тощо), доступністю багатокористувацьких налаштувань.

F.A.Q. (акронім від англ. Frequently Asked Question(s) — часто поставлені, поширені питання; питання, які часто ставляться) (opens new window) — підбірка часто задаваних питань на певну тему та відповідей на них, яка створюється переважно для того, щоб не треба було постійно відповідати на одні й ті ж запитання, часто нудні для того, хто відповідає.

# Підходи та способи вирішення завдання аналізу медіа контетну

# Основні підходи

Підходи до аналізу медіа-контенту можуть варіюватися в залежності від потреб користувача та характеристик досліджуваного контенту. Ось два основних підходи, які можуть бути використані:

  • Кількісний підхід (opens new window) передбачає вимірювання числових даних, таких як рейтинги, перегляди, лайки, пости, коментарі, кліки або опитування., що дозволяє легко збирати та аналізувати їх за допомогою статистичних інструментів. Він дає об'єктивні результати, які можна узагальнити, але може не враховувати контекст і глибину медіаконтенту та реакції аудиторії. Крім того, на кількісні дані можуть впливати помилки та упередження, що обмежує їхню надійність.

  • Якісний підхід (opens new window) передбачає заглиблення у значення, досвід та перспективи виробників і споживачів медіа за допомогою таких методів, як інтерв'ю та контент-аналіз. Він передбачає систематичний аналіз контенту для виявлення тем, патернів та інших релевантних особливостей, а також для інтерпретації основних значень і наслідків цих особливостей, тобто є зацікавлення у розумінні суб'єктивного досвіду та сприйняття учасників цього контету.

# Основні методи контент-аналізу

  • Машинне навчання для аналізу тексту (opens new window) – використання нейронних мереж для класифікації текстового контенту за темами, або використання моделей обробки природної мови для аналізу та виконання завдань таких як сентимент-аналіз. Також можна використовувати класичні методи як Баєс або SVM.

  • Аналіз зображень та відео (opens new window) – використання комп'ютерного зору для розпізнавання об'єктів, отримання інформації про зміст та виконання завдань як порівняння, розпізнавання емоцій, текстів, сегментів, тощо.

  • Аналіз аудіо та мовлення (opens new window) – існує багато методів аналізу, як машинний так і розпізнавання сигналів, класифікація за різними ознаками, математично. Якщо ми аналізуємо мовлення то ми можемо отримати таку інформацію як тембр, емоційний стан, стать. Якщо ми аналізуємо аудіо то нам важливо знати частотні ознаки як найвищі й найнижчі частоти, також потрібно розбирати різні звуки за їхніми спектральними характеристиками.

  • Інтеграція та візуалізація результатів (opens new window) – створення графіків або діаграм, інших візуальних засобів для того щоб представити результат аналізу. Потрібна інтеграція з системами відстеження та аналізу подальшого використання отриманих результатів.

# Основні способи реалізації методів контент-аналізу

  1. Контент-аналіз (Content Analysis) (opens new window) – це метод дослідження документів, що відрізняється об'єктивністю висновків та строгістю процедури. Він полягає у кількісній обробці тексту з подальшою інтерпретацією результатів. Цей метод дозволяє вивчати проблеми соціальної дійсності та внутрішні закономірності самого об'єкта дослідження.

  2. Оціночний аналіз тверджень (Evaluative Assertion Analysis) (opens new window) Оціночний аналіз тверджень – це метод, який ставить за мету відобразити тексти та їх об'єктивні референти, редукуючи їх до оціночних тверджень. Він може бути реалізований за допомогою комп'ютерного аналізу тексту.

  3. Рамковий аналіз (Frame Analysis) (opens new window) – це метод, що використовується для аналізу того, як ситуації та події сприймаються людьми. Цей підхід досліджує способи уявлення про реальність та риторику, використану в тексті.

  4. Дискурсивний аналіз (Discourse Analysis) (opens new window) – це метод аналізу, який досліджує взаємозв'язок сил у суспільстві та формулює нормативний підхід до цього. Він дозволяє критично проаналізувати ці взаємозв'язки в контексті соціальних змін та сформулювати уявлення про систему цінностей та інтерпретаційних схем, які панують у суспільстві.

  5. Дата майнінг (Data mining) (opens new window) – це процес сортування великих наборів даних для виявлення закономірностей і зв’язків, які можуть допомогти вирішити бізнес-проблеми за допомогою аналізу даних. Методи та інструменти data mining (аналізу даних) дозволяють підприємствам передбачати майбутні тенденції та приймати більш обґрунтовані бізнес-рішення. Data mining є ключовою частиною загальної аналітики даних і однією з основних дисциплін у галузі даних, яка використовує передові аналітичні методи для пошуку корисної інформації в наборах даних.

  6. Текст майнінг (Text mining) (opens new window) – це набір методів, призначених для здобуття інформації з текстів на основі сучасних ІКТ, що дає змогу виявити закономірності, які можуть приводити до отримання корисної інформації і нових знань користувачами. Це інструмент, який дає можливість аналізувати великі обсяги інформації у пошуках тенденцій, шаблонів і взаємозв'язків, здатних допомогти у прийнятті стратегічних рішень.

  7. Штучний інтелект на основі правил (Rule based vs ai) (opens new window) – спирається на заздалегідь визначені бізнес-правила та бізнес-логіку , які часто створюють експерти-люди, які розуміють конкретні ситуації. Компанії називають ці правила «бізнес-правилами», які керують рішеннями в таких сферах, як ціноутворення, запаси та дотримання вимог. Бізнес-правила та штучний інтелект на основі правил мають різноманітне застосування, від оптимізації підтримки клієнтів за допомогою чат-ботів до націлювання на клієнтів на основі демографічних показників. У простих завданнях бізнес-правила мають сенс. Наприклад, методи на основі правил використовуються з інструкціями чат-ботів «якщо-тоді». Якщо клієнт запитує про це, чат-бот каже це.

  8. Розпізнавання емоцій (Emotion detection) (opens new window) — це завдання класифікації емоцій, таких як радість, гнів, смуток або здивування. Наприклад, навчені алгоритми ML можуть ідентифікувати щастя (і його величину) за зображенням усміхненого обличчя. Інші алгоритми здатні характеризувати почуття мовця з аудіозапису. Розпізнавання емоцій має широкий спектр застосувань, від догляду за пацієнтами в діагностиці психічних розладів за допомогою аналізу голосу до роздрібної торгівлі, де обладнані комп’ютерним баченням камери відстежували б реакцію людей на нові статті.

# Порівняльна характеристика існуючих засобів вирішення завдання

В сучасному світі існує велика кількість засобів, призначених для аналізу медіа-контенту. Ми обрали деякі з них для подальшого порівняння:

  • Social Blade (opens new window) - це комплексна платформа, яка збирає дані з YouTube, Twitter, Twitch, Daily Motion, Mixer та Instagram і використовує їх для побудови статистичних графіків і діаграм, які відстежують прогрес і зростання., надаючи користувачам статистичні графіки, діаграми та цінну інформацію. Маючи понад 7 мільйонів унікальних відвідувачів щомісяця, Social Blade пропонує інформацію у вільному доступі, включаючи оціночні прибутки та майбутні прогнози.

  • Mentionlytics (opens new window) – це потужний інструмент моніторингу Інтернету та соціальних мереж, що використовує штучний інтелект для відстеження онлайн-розмов про бренди, продукти та конкурентів. Він дозволяє користувачам розуміти настрої аудиторії, виявляти тенденції, відстежувати конкурентів, взаємодіяти з лідерами думок та оптимізувати маркетингові кампанії для покращення репутації та впізнаваності в Інтернеті.

  • AWARIO (opens new window) – це динамічний інструмент соціального прослуховування, покликаний революціонізувати розвідку та аналітику соціальних мереж. Спочатку задуманий як відгалуження від проекту компанії SEO PowerSuite, Awario надає брендам цінну інформацію про своїх клієнтів, ринкові тенденції та конкурентів. Завдяки можливостям моніторингу в режимі реального часу на різних онлайн-платформах, включаючи сайти новин, блоги, форуми та соціальні мережі, Awario забезпечує своєчасну обізнаність про розмови, що стосуються вашого бізнесу.

  • Smartocto (opens new window) – сервіс, призначений для аналізу новин, статей, публікацій, тощо. Створений для того, щоб допомогти зробити ваші новини більш релевантними, впливовими та прибутковими.

  • Mention (opens new window) – Mention надає брендам та агенціям інструменти для моніторингу ЗМІ та соціальних мереж для підвищення впізнаваності бренду. Він дозволяє відстежувати бренди, конкурентів та галузеві теми, що дає змогу аналізувати онлайн-розмови та створювати контент на основі цінних даних. Допомагає покращити комунікаційні та маркетингові стратегії, надаючи компаніям можливість приймати обґрунтовані бізнес-рішення. З глобальною базою користувачів понад 750 000 у 125+ країнах, платформа Mention пропонує функції моніторингу, прослуховування та публікації, якими керує інноваційна команда, що базується в Парижі та Нью-Йорку.

  • Neticle Media Intelligence (opens new window) – сервіс, спеціалізований у сфері аналізу соціальних медіа та онлайн-контенту, що надає своїм клієнтам інструменти та послуги для моніторингу та вивчення онлайн-обговорень, управління репутацією, оцінки результативності маркетингових кампаній та звітності.

  • Semantrum (opens new window) – сервіс моніторингу різних типів ЗМІ та соціальних мереж, призначений для аналізу відгуків, репутації, метрики, маркетингових досліджень, аналізу великих обсягів даних, тощо.

  • YouScan (opens new window) – сервіс аналітики соціальних медіа, що використовує штучний інтелект і має функціонал для аналізу зображень. Ця платформа надає можливість відстежувати відгуки, настрій, сприйняття бренду споживачами, виявляє нові тренди, допомагає адаптувати маркетингову стратегію для відповіді на поточні потреби клієнтів.

Вже існуючі засоби для аналізу медіа-контекту порівнюються за наступними критеріями:

  • Functionality (функциональні вимоги)
  • Usability (вимоги до зручності роботи)
  • Reliability (вимоги до надійності)
  • Performance (вимоги до продуктивності)
  • Supportability (вимоги до підтримки)
Категорія Сервіс/Критерії Наш сервіс Social Blade Mentionlytics AWARIO Smartocto Mention Neticle Media Intelligence Semantrum YouScan
Functionality Особистий кабінет 🔵🔵🔵 🔵🔵🔵 🔵🔵🔵 🔵🔵🔵 🔵🔵⚫ 🔵🔵⚫ 🔵🔵🔵 🔵🔵⚫ 🔵🔵🔵
Моніторинг ЗМІ 🔵🔵⚫ 🔵⚫⚫ 🔵🔵🔵 🔵🔵🔵 🔵🔵⚫ 🔵🔵🔵 🔵🔵🔵 🔵🔵🔵 🔵🔵🔵
Моніторинг соцмереж 🔵🔵⚫ 🔵🔵⚫ 🔵🔵🔵 🔵🔵🔵 🔵🔵⚫ 🔵🔵🔵 🔵🔵⚫ 🔵🔵⚫ 🔵🔵🔵
Фільтр даних 🔵🔵🔵 🔵🔵🔵 🔵🔵🔵 🔵🔵🔵 🔵⚫⚫ 🔵🔵⚫ 🔵🔵⚫ 🔵🔵🔵 🔵🔵🔵
Експорт даних 🔵🔵🔵 🔵🔵🔵 🔵🔵🔵 🔵🔵🔵 🔵⚫⚫ 🔵🔵⚫ 🔵🔵🔵 🔵🔵🔵 🔵🔵⚫
Візуалізація даних 🔵🔵⚫ 🔵🔵🔵 🔵🔵🔵 🔵🔵🔵 🔵🔵⚫ 🔵🔵🔵 🔵🔵🔵 🔵🔵🔵 🔵🔵🔵
Usability Ціна Free 9.99$/місяць 58$/місяць 49$/місяць 100$/місяць 41$/місяць 49$/місяць 222$/місяць 299$/місяць
Підтримування укр. мови 🔵 🔵 🔵
Інтерфейс 🔵🔵🔵 🔵🔵⚫ 🔵🔵🔵 🔵🔵🔵 🔵⚫⚫ 🔵🔵⚫ 🔵🔵⚫ 🔵🔵🔵 🔵🔵🔵
Android/iPhone застосунок 🔵/🔵 🔵/🔵 ⚫/⚫ ⚫/⚫ 🔵/🔵 🔵/⚫ ⚫/⚫ ⚫/⚫
Пробний період 🔵 🔵 🔵 🔵 🔵 🔵 🔵 🔵
Performance Швидкість роботи 🔵🔵⚫ 🔵🔵⚫ 🔵🔵⚫ 🔵🔵🔵 🔵🔵⚫ 🔵🔵🔵 🔵🔵⚫ 🔵🔵🔵 🔵🔵🔵
Reliability Захист даних 🔵🔵🔵 🔵⚫⚫ 🔵🔵🔵 🔵🔵🔵 🔵🔵⚫ 🔵🔵🔵 🔵🔵🔵 🔵🔵⚫ 🔵🔵🔵
Supportability Служба підтримки 🔵🔵⚫ 🔵🔵⚫ 🔵🔵🔵 🔵🔵🔵 🔵🔵⚫ 🔵🔵🔵 🔵🔵⚫ 🔵🔵🔵 🔵🔵🔵
FAQ 🔵🔵🔵 🔵🔵🔵 🔵⚫⚫ 🔵🔵🔵 🔵🔵⚫ 🔵🔵🔵 🔵🔵🔵 🔵🔵⚫ 🔵🔵🔵

Позначення мають наступні вказівки:

  • 🔵🔵🔵 – доступні всі функції
  • 🔵🔵⚫ – доступно більшість функцій
  • 🔵⚫⚫ – доступні деякі функції
  • ⚫⚫⚫ – недоступні

# Висновки

Провівши аналіз предметної області, ми виявили необхідність у створенні нової, досконалішої системи. Тому наша група вирішила розробити нову систему аналізу медіа-контенту. При розробці ми візьмемо до уваги недоліки, що були виявлені у інших подібних системах.

Останнє оновлення: 3/15/2024, 10:53:15 AM