Посмотрите наши лучшие предложения ⇛ домены со скидками... и самые дешевые домены...

Семантическая паутина

Семантическая паутина — группа методов и технологий, созданных для того, чтобы позволить машинам понимать значение — или «семантику» — информации о всемирной паутине.

Термин был введен на собрании World Wide Web (W3C) директором Тимом Бернерсом-Ли. Согласно исходному видению, доступность машиночитаемых метаданных позволила бы автоматизированным агентам и другому программному обеспечению более разумно получать доступ к сети. Агенты были бы в состоянии автоматически выполнять задачи и определять местоположение соответствующей информации от имени пользователя.

В то время как слову «семантическая паутина» формально не дают определение, однако можно сказать, что это понятие главным образом используется для того, чтобы описать модель и технологии, предложенные W3C. Эти технологии включают платформу описания ресурсов (RDF), множество форматов обмена данными (например, RDF/XML, N3, Turtle, N-Triples), и нотации, такие как схема RDF (RDFS) и веб-язык онтологии (OWL), которые предназначены для того, чтобы обеспечить формальное описание понятий, сроки и отношения в пределах данной области знаний.

Многие из технологий, предложенных W3C, уже существуют и используются в различных проектах. Семантическая паутина как глобальное видение, однако, осталась в значительной степени неосуществленной, и критика проекта подвергла сомнению возможность выполнения данного подхода.

Кроме того, другие технологии с подобными целями, такими как микроформаты, развились, однако они не всегда описываются как «семантическая паутина».

Цель

Люди используют сеть для того, чтобы выполнять задачи, такие как обнаружение ирландского варианта для слова «каталог», резервирование библиотечной книги и поиск низкой цены на DVD. Однако один компьютер не может выполнить все эти задачи без человечека, потому что веб-страницы разработаны, чтобы быть просмотренными людьми, а не машинами. Семантическая паутина — это видение информации, которая понятна компьютерами, таким образом, компьютеры могут выполнять утомительную работы, включающую в себя открытие, объединение и показ информации в сети.

Прикладные области семантической паутины испытываю быстрый рост в сети, связанный с новшеством и реконструкцией информационных технологий контента. Семантическая паутина расценивается как интегратор различнго контента и информационных приложений и систем, она обслуживает механизмы реализации информационных систем. Скорость роста является стимулом для исследователей, чтобы они могли сосредоточиться на создании и распространении инновационных технологий семантической паутины, где давно ожидается внедрение семантической паутины в качестве исходного понятия.

Критика

Практическая выполнимость

Критики подвергают под сомнение основную возможность полной или даже частичной реализации семантической паутины. Примером критики является скептический анализ Кори Доктороу с точки зрения человеческого поведения и персонального предпочтения. Например, люди лгут: они могут включать побочные метаданные в веб-страницы в попытке ввести в заблуждение механизмы семантической паутины, которые наивно принимают метаданные за верные. Это явление было известно с метатегами, которые дурачили алгоритм ранжирования AltaVista в момент ранжирования определенных веб-страниц: скажем, Google ищет такие попытки манипулирования. Питер Гэрденфорс и Тимо Хонкела говорят о том, что основанные на логике технологии семантической паутины покрывают только часть соответствующих явлений, связанных с семантикой.

Потенциал идеи в быстром продвижении

В своей научной статье (2001) Тим Бернерс-Ли описал ожидаемое развитие семантической паутины. Полное же развитие должно также произойти. В 2006 Бернерс-Ли и коллеги утверждали, что: «Эта простая идея, однако, остается в значительной степени неосуществленной.» В то время как идея все еще в процессе создания, она развивается быстро и вдохновляет многих. В период 2007-2010 несколько ученых уже исследовали первые приложения и социальный потенциал семантической паутины в бизнесе и секторах здравоохранения, также для социальных сетей и даже для более широкого развития демократии.

Цензура и конфиденциальность

Энтузиазм о семантической паутине мог быть умерен проблемами относительно цензуры и конфиденциальности. Например, анализирующие текст методы могут легко обойтись использованием других слов, например, метафор, или использованием изображений вместо слов. Усовершенствованная реализация семантической паутины сделала бы намного более простым управление просмотром и созданием онлайн-информации для правительства, поскольку эта информация будет намного легче для понимания машиной и последующей автоматизации блокировки контента. Кроме того, с использованием файлов FOAF и географического расположения метаданных, будет очень небольшая анонимность, связанная с авторством статей относительно таких вещей, как персональный блог.

Удвоение выходных форматов

Другой спорный момент в использовании семантической паутины состоит в том, что это отнимает больше времени для того, чтобы создать и опубликовать контент, потому что должно быть два формата для одной части данных: один для просмотра человеком и один для машин. Однако множество веб-приложений решают эту проблему, создавая машиночитаемый формат после публикации данных или запроса машины для таких данных. Разработка микроформатов была одной реакцией на эту критику. Другой аргумент в защиту выполнимости семантической паутины — сниженная цена задач агентурной разведки на цифровых рынках труда типа Amazon Mechanical Turk.

Такие спецификации, как eRDF и RDFa позволяют встраивать произвольные данные RDF в страницы HTML. Механизм GRDDL (Gleaning Resource Descriptions from Dialects of Language) позволяет существующему материалу (включая микроформаты) автоматически интерпретироваться как RDF, таким образом, издатели только должны использовать один формат HTML.

Потребность

Идея семантической паутины, которая в состоянии описать и связать значение с данными, имеет больше чем простой код разметки XHTML. Это основано на предположении, что для того, чтобы можно было обеспечить машины возможностью точно интерпретировать контент, нужны не простые упорядоченные отношения, включающие в себя буквы и слова, а необходима базовая инфраструктура. Иначе большая часть благосклонной функциональности была бы доступна в Web 2.0 (и более ранних версиях), и было бывозможно получить семантически способную сеть с незначительными, инкрементными дополнениями.

Дополнения к инфраструктуре, чтобы поддерживать семантическую функциональность, включают в себя скрытые динамические сетевые модели, которые при определенных условиях могут изучить значение, основанное на данных порядка в отношениях ‘изучения’ процесса с порядком (своего рода элементарная рабочая грамматика).