Social Semantic Web - это технология, позволяющая коммуницировать, обмениваясь структурированными данными.

Данная книга рассчитана на широкий круг читателей, поэтому описание технологии Social Semantic Web сделано по возможности более простым и без использования специализированной терминологии. Что бы понять, что такое Social Semantic Web представим, для начало, его в виде децентрализованной социально сети..

Social Semantic Web как децентрализованная социальная сеть

Децентрализация социальной сети означает отсутствие единого сайта и места хранения данных. Суть такой децентрализованной социальной сети достаточно проста:

Каждый пользователь записывает всё, что он желает опубликовать в сети не на каком-либо сайте (блогплатформе, социальной сети, форуме и т.д.) а в своих файлах. Которые он может размещать в удобном ему месте, доступном для всех пользователей интернета либо, при желании, ограничить доступ к части данных, с помощью современной криптографии.

Чтобы с данными из таких файлов можно было эффективно работать и объединять их в систему, они должны быть машиночитаемы. То есть представлять из себя структурированные семантические данные. Для этого используется специальные форматы файлов - xml (либо другие аналогичные форматы). Файлы в таком формате имеют относительно простую структуру и их можно прочитать, открыв в обычном блокноте, так же как любой текстовый файл:

Заполнять файлы в ручную и искать среди них нужные данные, мягко говоря, не очень удобно. Поэтому для работы с ними используются специализированные интерфейсы и роботы, которые в семантическом вебе называются «интеллектуальными агентами». Такие роботы-агенты подобны писарю, который служит своему господину. Пользователь, например, «говорит» ему через удобный интерфейс – «хочу прокомментировать данный пост таким-то текстом». Агент берёт этот текст, открывает нужный фаил пользователя и вносит нужные правки ссылаясь правильным образом на тот пост, который пожелал прокомментировать пользователь. А ежели пользователь захотел узнать какую-то необходимую информацию, то агент начинает искать ее среди файлов других пользователей, обрабатывает и выводит в удобном человеку виде.

Чтобы не потеряться в огромном количестве файлов и описываемых в них объектах, используется специальная система идентификаторов «URI». Они позволяют ссылаться на любой объект, описанный в файле семантического веба чтобы прокомментировать/лайкнуть/дизлайкнуть и т.д. или просто сослаться на него. Адреса URI могут иметь подобный вид: site.ru/file.xml#post123. Такая ссылка означает, что объект описан в файле site.ru/file.xml и называется post123. Адреса файлов могут иметь разный вид, в зависимости от сети, к которой они применяются. Если это, например, файлы из тор сети, то ссылки будут иметь вид sidftevdrytefsdf11236.onion/file.xml. Принцип адресации достаточно универсальный, и может использоваться в различных информационных средах, в том числе и децентрализованных. Всегда в ссылке остаётся один принцип: ссылка на файл + ссылка на объект, описанный в нём.

Пользователи могут периодически менять месторасположения своих файлов. И чтобы не потеряться в сети и меть возможность идентифицировать пользователя, используется цифровая подпись, являющаяся фактически идентификатором пользователя. То есть в такой системе не требуется где-либо регистрироваться, чтобы создать учётную запись. Для этого достаточно сгенерировать приватный ключ к цифровой подписи. А далее, подписывая файлы, можно удалённо и автоматически подтверждать своё владение данной подписью («аккаунтом») .

Для функционирования системы необходимо также, чтобы все файлы были описаны в одном формате с одинаковым набором элементов. Данная задача решается с помощью антологий, которые определяют, какую структуру должны иметь файлы, описывающие определённый тип объектов. Под различные типы данных создаются различные антологии. То есть не существует одной антологии, которая подобно «теории всего» описывала бы все объекты сети. Например, для описания страниц пользователей существует антология называющаяся FOAF (Friend of a Friend).

Чтобы быстро находить нужные данные среди огромного количества файлов, используются специализированные индексные базы. В них сохраняются не сами файлы, а только часть объектов, необходимых для быстрого поиска. Они подобны поисковым системам, но только поиск осуществляется по данным определённого типа (например, среди анкет пользователей) а ответ выдаётся не в виде списка ссылок, а в формате готовых данных, которые можно отобразить, как список объектов с фотографиями и кратким описанием.

Преимущества семантической сети

Такой тип веба существенно эффективнее для коммуникаций нового этноса, по сравнению с обычным «страничным» вебом. Вот несколько преимуществ такой сети:

1) Сквозное использование данных. В обычном интернете все данные пользователя распределены по большому количеству сайтов – доски объявлений, социальные сети, форумы, сервисы вопросов - ответов и т.д. В результате человеку приходится регистрироваться на десятках сайтов, много раз заполнять данные о себе и для решения разны задач - использовать разные сайты. В результате невозможно объединить все данные в одном месте и эффективно с ними работать. Каждый новый сайт относящейся в социальному вебу ( web 2.0) – это пустая площадка без пользовательских данных, которую необходимо наполнять с нуля. В отличие от обычного интернета, семантический веб позволяет объединить эти данные и сделать их общедоступными, в том числе, для разработчики полезных интерфейсов (сайтов формата веб 2.0). Что существенно увеличивать количество полезных сервисов. А возможность совмещать данные из разных источников, позволяет делать сервисы недоступные в обычном интернете. Например, рекомендательный сервис книг на основе подробных данных о пользователе (просмотренные фильмы, блоги на которые подписан, размещённые резюме и т.д.). Рекомендательный сервис – это самый простой пример, а возможности, которые дают обобщённые структурированные данные – поистине безграничны!

2) Частная собственность на социальный капитал. В сети, основанной на семантических данных (файлах) и цифровых подписях (криптография) аккаунт пользователя является идеальной формой частной собственности. Потому что такую собственность практически невозможно отобрать у человека. Доступ к цифровой подписи – это набор символов, который можно легко спрятать (и почти невозможно отобрать без применения пыток), в отличие от любой другой формы собственности - недвижимость, автомобиль, домен, авторский патент и т.д. Все другие перечисленные формы собственности, которые нельзя легко и гарантировано защитить являются лишь условно «частной» собственностью и принадлежать человеку лишь до то той поры, пока не сменяться интересы правящего класса или не смениться власть. Аккаунт же пользователя в Social Semantic Web защищён от изъятия также как кошелёк биткоина. Его не может, например, заблокировать или удалить владелец социальной сети. В результате существенно возрастает целесообразность вкладывать в такой аккаунт своё время и внимание. Также важно, что вложения в аккаунт не только защищены, но и «ликвидны» на просторах всей сети, а не только на отдельном сайте! Например, рейтинг, заработанный на сайтах вопросов-ответов, поможет вам на сайтах по поиску работы. Наличие такой частной собственности способствует росту социального капитала во всём новом этносе. А уровень социального капитала в обществе очень сильно влияет на экономическую эффективность (снижение транзакционных издержек) и качество жизни.

3) Разделение данных и интерфейсов. Процесс формирования Social Semantic Web можно разделить на две основные части: это создание антологий, определяющих формат хранения данных и разработка интерфейсов для работы с этими данными. Создание антологий – это процесс, который относительно несложно осуществлять на уровне некоммерческих объединений (консорциумов). Потому что каждая антология - это набор из относительно небольшого количества страниц с описанием элементов. Разобраться в формате xml, и прочитать антологию – задача, решаемая любым человеком за пару часов. Поэтому обсуждать структуру антологий и приходить к общему решению – относительно просто. На порядки сложнее заниматься коллективным программированием. Поэтому данная часть системы отдаётся частным разработчикам. Которые на основе утверждённых в новом этносе антологий создают интерфейсы для удобной работы с описываемыми в антологиях (и файлах пользователей) объектами. В такой системе отсутствует централизация разработки, а наоборот - появляется конкуренция. И, несмотря на то, что сеть подобна единому порталу, в ней не возникает стагнации как в крупных сайтах типа Рамблера.

4) Децентрализация. Social Semantic Web не имеет центров управления, через которые можно было бы заблокировать какой-либо элемент системы. Антологии – не имеют места хранения, так как представляют из себя набор правил и все антологии нового этноса можно сохранить на любом носителе данных, помещающемся в карман. Файлы пользователей могут размещаться в любом месте сети с использованием различных технологий. Серверы сообществ, на которых целесообразно размещать файлы, являются лишь временным хранилищем для удобного использования. Блокировка таких серверов приведёт лишь к переносу файлов на другой сервер. А для того, чтобы пользователи не потеряли друг-друга в сети (всегда знали, где находятся файлы человека), можно использовать распределённые системы регистрации, подобные блокчейну.