Блог

 Большие данные - липкие данные, Big Data - Linked data

Большие данные - липкие данные, Big Data - Linked data

LD (Linked Data) - новый тренд в поисковой оптимизации сайтов, начинается эпоха семантического интернета, в котором найдется все и ничего не потеряется, за каждой сущностью будет свой хвост из событий, комментариев, предложений или действий.

SEO оптимизация это целая индустрия, которая направлена на улучшение поисковой выдачи

Поисковая оптимизация, на сегодняшний день, прерогатива профессионалов. Если 5 лет назад, раскруткой сайтов занимались все кому не лень, ведь это не трудно, просто прикупить ссылочек с трастовых сайтов, то сейчас и количество контента значительно увеличилось и его качество, и изменились алгоритмы ранжирования основных поисковых систем.

SEO оптимизация это целая индустрия, которая направлена на улучшение поисковой выдачи, сами поисковые роботы лишены интеллекта и правильно определить что спрашивает пользователь и выдать ему максимальный результат достаточно сложно. Ведь язык человека, речевые обороты невозможно понять пользуясь машинной логикой трю фальс, человек пользуется аллегориями, сложными конструкциями где значения слов зависят от контекста, ударений и знаков препинаний. Все мы помним знаменитую фразу “Судить нельзя помиловать”. Как роботу разобраться, что ищет человек, ищет он КЛЮЧ для открытия дверей, либо КЛЮЧ чтобы попить воды, ведь значения слов могут обозначать события, организации, товары, фильмы, изображения, материальные и нематериальные сущности.

Schema.org - будущее и настоящее поисковых технологий

В поисках облегчения алгоритмов и повышения качества поисковой выдачи, не так давно, была запущена новая технология для семантической разметки контента, так называемый словарь семантической разметки Schema.org. При помощи этого словаря, можно дополнительно разметить свой контент, для того чтобы помочь поисковым роботам - паукам лучше понять и проанализировать то что Вы пытаетесь донести через свою вэб-страницу. Работает это все очень просто, есть единый набор схем, при помощи которых можно описать любую сущность, для примера:

Человек (указываем роботу, что мы сейчас будем описывать личность. Схема словаря Person http://schema.org/Person)

  • Иванов (Свойство familyName)
  • Иван (Свойство Name)
  • Иванович (Свойство additionalName)
  • Родился 12-08-1996г.(Свойство birthDate)
  • и так далее

А вот пример для семантической разметки информации авиакомпании:

Авиакомпания Wizz Air(Схема словаря http://schema.org/Airline)

  • Wizz Air Ukraine (свойство legalName)
  • улица Михаила Гришка, 3А, Киев, Киевская область, 02000 (свойство address)
  • 044 206 4888 (свойство telephone )
  • WU (свойство iataCode )
  • и так далее

Вот таким нехитрым образом мы можем теперь создавать контент который будет очень вкусным для поисковых роботов, они теперь будут пользоваться словарем и понимать что хочет найти человек.

Мало того, данные размеченные подобным образом связанны в единую семантическую структуру, где каждая сущность может являться свойством другой сущности, ссылаться друг на друга, таким образом организуется единое информационное пространство при котором большая куча Big Data информации, из не подлежавшей поиску и аналитике превращается во взаимосвязанную, разложенную по полочкам структурированную информацию Linked Data или по нашему липкие данные, данные которые внутри перелинкованы при помощи словаря Schema.org

JSON-LD мухи отдельно котлеты отдельно

Разметка схема орг, достаточно сильно загружает HTML структуру документов, если еще добавить к тегам классы, идентификаторы, атрибуты и т.д. структура документа буде практически нечитаемой для веб дизайнера особенно, для облегчения представления веб страниц, как альтернатива классической разметки Schema.org появился и рекомендуется к применению формат JSON LD, в примерах на сайте Schema.org показана его структура. Таким образом, мы можем оставить чистеньким HTML код документа, а всю семантику скормить поисковым паукам в формате JSON-LD для них это десерт.

Липкие данные (связанные данные) и государство

СЕО оптимизаторы, которые востребованы для продвижения товаров и услуг в интернете или раскрутки сайтов, в ближайшее время, будут нужны для организаций которые генерируют большое количество данных.

Для примера можно взять государственный аппарат любой страны, эти структуры, создают гигантские объемы данных, всевозможные реестры, каталоги, справочники и бюллетени, в основном лишены семантического ядра и никак не связаны друг с другом.

Производители и разработчики баз данных, создают большое количество информационных структур на все случаи жизни, при этом не пользуясь ни какими стандартами. Эти горы информации превращаются в информационную свалку, с различными структурами не имеющими никакой связи. Связи информации из различных ведомств просто не существует, одни и те же данные дублируются в разных базах, создавая горы дублированной информации.

Единая структура данных и поддержка Schema.org для разметки данных в крупных компаниях и государственных структурах, позволить оптимизировать информационные потоки, объединить в одно ядро и превратить информацию из чисто статистического организма в правильный структурированный механизм, который благодаря простой аналитике и поиску ускорит все процессы и события, оптимизирует управление и планирование.

Другими словами из мусора, который сейчас просто похоронен на серверах можно получить энергию которая будет проявляться во взаимодействии всех со всеми, актуализации событий сегодня на сегодня и быстрому качественному поиску информации. Без этих подходов, открытое общество невозможно, это будет просто бутафория, с терабайтами данных в которых никто не может разобраться.

JSON-LD - перспективы

JSON-LD, технология построенная на самом компактном формате JSON (JavaScript Object Notation), это технология WEB2.0 которая на данный момент все больше внедряется в различных областях необъятного веба для передачи данных в структурированном виде, приставка LD, просто добавляет этому прекрасному формату немного семантики, превращая обычную информацию, в информацию понятную машинам и соответственно упрощенной обработке.

arrow