Badania

WebStream

Nowe podejście do analizy zawartości serwisów internetowych oparte na systematycznym automatycznym próbkowaniu stron głównych tych serwisów do postaci zrzutów graficznych wykonywanych w regularnych odstępach (np. co godzinę). Skala badania może być różna – od kilku serwisów do całego rynku. Sama baza takich zrzutów ma niepowtarzalną wartość, zawartość serwisów i ich układ graficzny nie jest bowiem archiwizowany, dziś łatwiej jest dotrzeć do okładek gazet z epoki przedcyfrowej niż do nagłówków dużych portali internetowych. Wychodząc od bazy takich zrzutów można rozwijać analizę w kilku kierunkach. Po pierwsze, stworzenie przeglądarki takich archiwów umożliwiałoby a) diachroniczną analizę zmian w treści b) analizę porównawczą zmian w czasie. Po drugie, zrzuty można poddać automatycznej obróbce i wykorzystać do analiz układu strony, rozpoznawania zdjęć, wykrywania trendów w kolorach, mierzenia temperatury i agresywności przekazu itd. Zaletą zrzutu jest też możliwość zaobserwowania i badania reklam.

Hejtometr

Nowe podejście do analizy zawartości serwisów internetowych oparte na systematycznym automatycznym próbkowaniu stron głównych tych serwisów do postaci zrzutów graficznych wykonywanych w regularnych odstępach (np. co godzinę). Skala badania może być różna – od kilku serwisów do całego rynku. Sama baza takich zrzutów ma niepowtarzalną wartość, zawartość serwisów i ich układ graficzny nie jest bowiem archiwizowany, dziś łatwiej jest dotrzeć do okładek gazet z epoki przedcyfrowej niż do nagłówków dużych portali internetowych. Wychodząc od bazy takich zrzutów można rozwijać analizę w kilku kierunkach. Po pierwsze, stworzenie przeglądarki takich archiwów umożliwiałoby a) diachroniczną analizę zmian w treści b) analizę porównawczą zmian w czasie. Po drugie, zrzuty można poddać automatycznej obróbce i wykorzystać do analiz układu strony, rozpoznawania zdjęć, wykrywania trendów w kolorach, mierzenia temperatury i agresywności przekazu itd. Zaletą zrzutu jest też możliwość zaobserwowania i badania reklam.

News trends

Analiza trendów występujących w treści serwisów informacyjnych w dużej skali, pozwalająca na wykrywanie zmian występujących w całym obszarze danego języka. Już dziś wiadomo, że wykorzystanie danych na temat zmian w częstotliwości wpisywania słów kluczowych w wyszukiwarce Google pozwala na szybkie przewidywanie epidemii chorób. Analiza trendów w treści serwisów informacyjnych pozwalałaby z jednej strony wykryć ogólne tendencje, z drugiej strony sygnalizować na przykład wydawcom internetowym lub reklamodawcom, w jakich obszarach nie nadążają za rzeczywistością. Do niedawna problem ten rozwiązywano za pomocą badań społecznych, przy obecnej prędkości komunikacji internetowej procedura ta jest zbyt powolna.

Mapy tematyczne sieci

Metanarzędzie, które na podstawie analizy zawartości stron, linków, wpisów w social media, budowałoby grafy „światów tematycznych”. Takie dane mają wartość dla osób, które przygotowując się do działań komunikacyjnych, reklamowych lub marketingowych w danym obszarze potrzebują stworzyć całościową mapę podmiotów zajmujących się komunikacją sieciową w danym obszarze tematycradio2txt, tv2txt

radio2txt, tv2txt

Prosta, ale otwierające duże możliwości koncepcja konwersji sygnałów stacji radiowych i telewizyjnych do postaci tekstowej (za pomocą narzędzi speech-to-text). Takie podejście pozwalałoby na prowadzenie analizy przekazów RTV za pomocą standardowych narzędzi do analizy tekstu. Na bazie korpusu tekstowego można budować dalsze usługi oraz wyszukiwarki. Połączenie z danymi EPG umożliwiłoby dodatkowo kategoryzację.

Programy informacyjne

Baza referencyjna nagrań programów informacyjnych z głównych stacji radiowych i telewizyjnych jako punkt wyjścia do dalszych analiz (ręcznych i automatycznych).

Katalog stron i profili

Automatycznie tworzony katalog stron www i profili w serwisach społecznościowych, należących do danej grupy tematycznej w obrębie języka polskiego. Taki katalog, udostępniany w otwartych formatach strukturalnych, mógłby stać się referencyjnym, stale aktualizowanym, zbiorem polskich adresów www i profili.

Podziel się: