Идея семантического веба впервые была опубликована в 2001 году Тимом Бернерсом-Ли, автором современной формы интернета (HTML, WWW, Http, URL). По его мнению, семантический веб – это следующая ступень развития интернета. Но несмотря на то, что прошло более 15 лет, новая технология не получила сколь либо широкого распространения. Семантические сети и аналогичные им системы связанных структурированных данных создаются только в рамках отдельных коммерческих организаций, научных объединений или правительств. При понимании всех плюсов, которые даёт семантический веб, возникает вопрос – почему бы не сделать такую систему для всех, а не только для этноса? Вопрос «почему ещё не создан семантический веб» является, пожалуй, самым популярным среди сторонников данной технологии.

Существует несколько причин, почему невозможен всеобщий семантический веб, но почему его возникновение возможно в отдельном новом этносе:

1. Отсутствие мотивации к созданию данных и контента

Современная форма интернета изначально создавалась для обмена научными публикациями, в оригинале представляющими из себя набор печатных страниц. В результате весь современный интернет – это набор страниц, которые описаны языком HTML и каждая из которых имеет свой адрес. Владелец сайта, на котором расположена страница, может разместить на ней рекламу. И пользователь, желающий получить информацию, косвенно оплачивает получение данной информации через просмотр рекламы. В результате, создатели сайтов и авторы контента замотивированы создавать и публиковать полезную информацию. Наличие рекламы – главный фактор, который развивает современный интернет. Другие формы мотивации владельцев сайтов являются незначительными.

Существуют попытки повсеместного внедрения технологии дополнения HTML страниц семантическими данными, чтобы, например, в коде страницы, описывающей товар, были бы представлены также и машиночитаемые семантические данные. Но подавляющее большинство владельцев сайтов никогда не станут этого делать. Во первых, это никак не повышает их доход с сайта. Зачем тратить массу времени на доработку сайта и не получать ничего. Во вторых, они не просто не получаю выгоды, но и создают для себя риски. Так как фактически их сайт становится очень простым для парсинга данных. Для коммерческих сайтов это означает, что конкуренты смогут очень просто мониторить их цены и ассортимент. Для информационных сайтов - что сторонние агрегаторы смогут легко копировать их данные на свой сайт. А при развитии подобного технического решения подключится ещё один игрок, который забьет последний гвоздь в крышку гроба владельца сайтов - это поисковые системы. Если можно легко парсить полезные данные с сайтов, то, например, на запрос "рецепты яичницы" можно сразу выдавать список рецептов, которые найдены в интернете, без ссылок на сайты источники. В результате сайт теряет переходы, а владелец получает площадку, которая не имеет посетителей, и бесплатно работает на поисковые системы.

В классическом всеобщем Semantic Web, не базирующемся на HTML, всё ещё хуже. Так как авторы не имеют никакого шанса получить за свою работу хоть что-то. Созданные ими данные становятся общедоступными, и могут использоваться любым сторонним разработчиком или конечными пользователями напрямую, и без какой-либо формы оплаты. Автор таких данных даже не всегда сможет отследить, как много людей используют результат его работы. Ведь информацию конечному пользователю предоставляет не владелец сайта, а интеллектуальный агент (десктопная программа либо веб интерфейс), который берёт данные из общей базы, и отображает в формате удобном пользователю.

Что же происходит, если сузить область использования семантического веба до отдельного нового этноса? Проблема с мотивацией решается с помощью сети сообществ, самофинансирования и развитой системы кооперации на уровне всего нового этноса. Они позволяют аккумулировать ресурсы, для оплаты работ, связанных с получением полезных данных. Такими данными могут быть цены в магазинах, информация о сдаваемой недвижимости, геоданные и различные базы (книг, фильмов и т.д). Такие данные поучаются либо путём сбора с нуля, либо агрегированием существующие в сети информации. Полученные данные предоставляются всему этносу в структурированном машиночитаемом виде.

Семантический веб не может быть бесплатным. Чтобы им пользоваться, необходимо платить не только за доступ в стандартный интернет, через который идёт обмен информацией, но и за доступ к данным и используемым интерфейсам. Среди широкой аудитории интернета платить за что-либо готова очень небольшая часть пользователей. Большинству не нужны сложные формы коммуникаций. В новом этносе же наличие традиций самофинансирования позволяют создать условия, при которых возможно создание всеобщей платной информационной среды. Порядок суммы ежемесячной оплаты, в пересчёте на одного пользователя, составит не более чем сумма оплаты за телефон или интернет. Но при эффективном аккумулировании от десятков и сотен тысяч людей, собранных денег будет достаточно для оплаты получения полезных данных и разработки интерфейсов.

В отличие от обычного семантического веба, в социальном Semantic Web нет проблемы с мотивацией авторов, так как все данные, которые в нём присутствуют, являются User Generated Content. Вряд ли найдётся пользователь, который станет защищать авторским правом либо другим способом ограничивать распространения информации о, например, своём коммерческом объявлении или заданном в сети вопросе. Наоборот, автор заинтересован в как можно большем распространении данной информации. Но в случае с пользовательскими (коммуникационными) формами данных, возникает другая проблема:

2. Высокий порог входа

Чтобы коммуникационная среда (например, социальная сеть) заработала, необходим сетевой эффект, при котором большинство становятся пользователями данной среды. При этом важным фактором является пользовательский порог входа. Если создать аккаунт внутри системы и научиться пользоваться ей будет не очень просто, то доля активных пользователей не превысит необходимой критической массы. Поэтому в открытом интернете выживают только простые и понятные социальные сети, в которых можно зарегистрироваться за пять минут, а освоиться - за пару дней.

В Social Semantic Web порог входа очень высокий. Помимо того, что человеку необходимо платить за его использование, необходимо также понимать те долгосрочные преимущества, которые даёт данная среда. После чего потребуется достаточно длительное время на освоение инструментов, которые позволяют эффективно коммуницировать в семантическом вебе. И длительность такого обучения может быть сопоставима с временем освоения нового иностранного языка.

В новом этносе, процесс обучения пользователей, а также разъяснение преимуществ семантического веба – является этнической традицией, подобно изучению иероглифов у китайцев или традиций этикета у англичан.

3. Невозможность единой и универсальной онтологии

Онтология, определяющая структуру файлов, также определяет набор понятий, в рамках которых люди общаются в сети. Подобно естественным национальным языкам такая онтология не может иметь бесконечное число понятий. Она ограничена также как и словарный запас любого человека, составляющий не более нескольких десятков тысяч слов. Хотя для полного описания мира, одних только названий оттенков цветов необходимо несколько миллионов, как в коде HTML.

Такое ограничение делает невозможным существование единой общемировой онтологии. Также как и единого общемирового языка. Поэтому у разных групп людей будут возникать разные онтологии. В классическом интернете подобной проблемы не существует, так как он описывает всем известные универсальные понятия – буквы, абзацы, картинки, заголовки, являющие графическими элементами страниц.

В рамках отдельного, относительно небольшого, этноса договориться о единой онтологии на порядки проще. И такая общая онтология, подобно общему национальному языку, будет сильно влиять на менталитет и общую картину мира представителей этноса.