Великі дані - липкі дані, Big Data - Linked data

Листопад 21, 2015
1768

LD (Linked Data) - новий тренд у пошуковій оптимізації сайтів, починається епоха семантичного інтернету, в якому знайдеться все і нічого не загубиться, за кожною сутністю буде свій хвіст із подій, коментарів, пропозицій або дій.

SEO оптимізація це ціла індустрія, яка спрямована на покращення пошукової видачі

Пошукова оптимізація на сьогоднішній день прерогатива професіоналів. Якщо 5 років тому, розкруткою сайтів займалися всі кому не ліньки, адже це не важко, просто прикупити посилання з трастових сайтів, то зараз і кількість контенту значно збільшилася і його якість, і змінилися алгоритми ранжирування основних пошукових систем.

SEO оптимізація це ціла індустрія, яка спрямована на покращення пошукової видачі, самі пошукові роботи позбавлені інтелекту і правильно визначити, що запитує користувач і видати йому максимальний результат досить складно. Адже мову людини, мовні звороти неможливо зрозуміти користуючись машинною логікою трю фальс, людина користується алегоріями, складними конструкціями, де значення слів залежать від контексту, наголосів і розділових знаків. Всі ми пам'ятаємо знамениту фразу "Судити не можна помилувати". Як роботу розібратися, що шукає людина, шукає вона КЛЮЧ для відкриття дверей, або КЛЮЧ щоб попити води, адже значення слів можуть означати події, організації, товари, фільми, зображення, матеріальні та нематеріальні сутності.

Schema.org - майбутнє та сьогодення пошукових технологій

У пошуках полегшення алгоритмів та підвищення якості пошукової видачі, не так давно, була запущена нова технологія для семантичної розмітки контенту, так званий словник семантичної розмітки Schema.org. За допомогою цього словника, можна додатково розмітити свій контент, щоб допомогти пошуковим роботам - паукам краще зрозуміти і проаналізувати те, що Ви намагаєтеся донести через свою веб-сторінку. Працює це все дуже просто, є єдиний набір схем, за допомогою яких можна описати будь-яку сутність, наприклад:

Людина (вказуємо роботу, що ми зараз описуватимемо особу. Схема словника Person http://schema.org/Person)

Іванов (Властивість familyName)
Іван (Властивість Name)
Іванович (Властивість additionalName)
Народився 12-08-1996г. (Властивість birthDate)
і так далі

А ось приклад для семантичної розмітки інформації авіакомпанії:

Авіакомпанія Wizz Air (Схема словника http://schema.org/Airline)

Wizz Air Ukraine (Властивість legalName)
вулица Михайла Гришка, 3А, Київ, Київська область, 02000 (Властивість address)
044 206 4888 (Властивість telephone )
WU (Властивість iataCode )
і так далі

Ось таким нехитрим чином ми можемо тепер створювати контент, який буде дуже смачним для пошукових роботів, вони тепер будуть користуватися словником і розуміти, що хоче знайти людина.

Мало того, дані розмічені подібним чином пов'язані в єдину семантичну структуру, де кожна сутність може бути властивістю іншої сутності, посилатися один на одного, таким чином організується єдиний інформаційний простір, при якому велика купа Big Data інформації, що не підлягає пошуку і аналітиці, перетворюється на взаємопов'язану, розкладену по поличках структуровану інформацію Linked Data або по нашому липкі дані, дані які всередині перелінковані за допомогою словника Schema.org

JSON-LD мухи окремо котлети окремо

Розмітка схема орг, досить сильно завантажує HTML структуру документів, якщо додати до тегів класи, ідентифікатори, атрибути і т.д. структура документа буде практично нечитаною для веб дизайнера особливо, для полегшення представлення веб-сторінок, як альтернатива класичної розмітки Schema.org з'явився і рекомендується до застосування формат JSON LD, в прикладах на сайті Schema.org показана його структура. Таким чином, ми можемо залишити чистеньким HTML-код документа, а всю семантику згодувати пошуковим павукам у форматі JSON-LD для них це десерт.

Липкі дані (пов'язані дані) та держава

СЕО оптимізатори, які потрібні для просування товарів та послуг в інтернеті або розкрутки сайтів, найближчим часом, будуть потрібні для організацій, які генерують велику кількість даних.

Наприклад можна взяти державний апарат будь-якої країни, ці структури, створюють гігантські обсяги даних, всілякі реєстри, каталоги, довідники та бюлетені, переважно позбавлені семантичного ядра і ніяк не пов'язані один з одним.

Виробники та розробники баз даних, створюють велику кількість інформаційних структур на всі випадки життя, при цьому не користуючись жодними стандартами. Ці гори інформації перетворюються на інформаційне звалище, з різними структурами не мають жодного зв'язку. Зв'язку інформації з різних відомств просто не існує, одні й самі дані дублюються у різних базах, створюючи гори дубльованої інформації.

Єдина структура даних та підтримка Schema.org для розмітки даних у великих компаніях та державних структурах, дозволить оптимізувати інформаційні потоки, об'єднати в одне ядро та перетворити інформацію з чисто статистичного організму на правильний структурований механізм, який завдяки простій аналітиці та пошуку прискорить усі процеси та події, оптимізує управління та планування.

Іншими словами зі сміття, яке зараз просто поховано на серверах можна отримати енергію, яка буде проявлятися у взаємодії всіх з усіма, актуалізації подій сьогодні на сьогодні і швидкому якісному пошуку інформації. Без цих підходів, відкрите суспільство неможливе, це буде просто бутафорія, з терабайтами даних, у яких ніхто не може розібратися.

JSON-LD – перспективи

JSON-LD, технологія побудована на компактному форматі JSON (JavaScript Object Notation). Це технологія WEB2.0, яка на даний момент все більше впроваджується в різних областях неосяжного вебу для передачі даних в структурованому вигляді. Приставка LD, просто додає цьому прекрасному формату трохи семантики, перетворюючи звичайну інформацію, на інформацію зрозумілу машинам і відповідно до спрощеної обробки.

Блог