ИНФОРМАЦИОННЫЕ РЕСУРСЫ ИНТЕРНЕТА

<

060114 2247 1 ИНФОРМАЦИОННЫЕ РЕСУРСЫ ИНТЕРНЕТАЕсли бы моей целью было – написать самую короткую книгу об Интернете, то в этой книге была бы всего одна строчка–

http://www.yahoo.com

адрес грандиозную тематического каталога YAHOO.

Но тема моего реферат – ресурсы Интернет, поэтому опишу основные виды ресурсов сети.

Развитие сферы сетевых услуг привело к массовому появлению серверов, ориентированных на предоставлении информации по определённой тематике. Появились, например, информационные центры в крупных зарубежных библиотеках, которые перевели большую часть своих фондов в электронный формат и продолжают оперативно вносить в эти архивы новые поступления. Это особенно ценно для наших читателей, т.к. многие отечественные библиотеки влачат жалкое существование. Но библиотечное дело — только капля в информационном океане. Перечень услуг, предоставляемых серверами Internet, достигает нескольких тысяч наименований.

 

Глобальная сеть Internet

 

Несколько десятков тысяч компьютерных сетей, связанных между собой и объединяющих несколько миллионов пользователей, образуют всемирную паутину World Wide Web (сокращённо WWW). Организационному становлению Web содействовало появление универсальных сетевых навигаторов — браузеров (от англ. browse — пролистывать), таких как Netscape Navigator или Microsoft Internet Explorer. Браузер — это программа, которая запускается на вашем компьютере и обеспечивает работу с сетью Internet. Браузеры обеспечивают доступ к любому пункту сети по 2-разрядному адресу IP, который для удобства разделяют на байтовые компоненты — 192.34.101.23. Так как человеку числовыми адресами пользоваться неудобно, то в навигаторах адрес источника информации задаётся символьным кодом URL (Uniform Resource Locator), по которому сама сеть Internet осуществляет поиск адреса IP. Существует довольно много разных форматов URL:

http://www.sportsnetwork.com

ftp://ftp.unt.edu/library

gopher://ulkyvm.loisville.edu

Начало URL соответствует используемому протоколу передачи данных. В частности, сокращение http происходит от HyperText Transmission Protocol — протокол передачи гипертекстовых документов.

Пользователи Internet получают информацию в виде гипертекста, являющегося основным способом представления данных. Термин Гипертекст, применяемый в последнее время в сочетании с прилагательным мультимедийный, означает документ, содержащий текстовые, звуковые и изобразительные фрагменты. Особенностью такого документа является наличие выделенных ключевых слов, всякого рода кнопочек и иконок, щелчки по которым воспроизводят соответствующие фрагменты, которые могут и не входить в состав данного документа, а находиться в памяти другого компьютера. Выделенные поля, активизация которых вызывает отображение следующих кадров, представлены в гипертекстовом документе ссылками на соответствующий фрагмент в пределах файловой системы данного компьютера или адресами URL для вызова недостающих компонентов из сети. Идеи гипертекста в том или ином виде присутствуют в различных справочных системах, в частности в системе помощи Windows всех версий (Help-система). Для описания гипертекстовых документов в Internet используется специальный язык HTML — HyperText Markup Language. Таким образом, можно сказать, что гипертекст — это многостраничная информация различного вида, связанная в различных страницах многочисленными ссылками.

Несмотря на то, что современные навигаторы «понимают» наиболее распространённые протоколы, в сетях постоянно возникают новые изобразительные средства. Навигаторы начинают разбухать, но угнаться за валом этих нововведений они не могут. Поэтому в 1994 возникла идея создания алгоритмического языка интерпретирующего типа, на котором можно было бы писать «проигрыватель» документа любого формата. Так в мае 1995 в компании Sun Microsystems появился язык Java, интерпретаторы с которого были реализованы на большинстве вычислительных платформ сети Internet. На этом языке пишутся приложения для Internet — апплеты, которые могут исполняться на любом компьютере, снабжённом Java-интерпретатором.

В настоящее время Internet не является отдельной сетью – на самом деле это сообщество сетей (именно поэтому Internet называют «сетью сетей»), в которое сейчас входит более 2 миллионов компьютеров во всем мире. И если вы подключены к сети, являющейся частью Internet, то вы имеете доступ к ресурсам любого из них.

Internet — не говоря уже о том, что его появление ознаменовало новую эпоху в развитии коммуникации — позволяет человеку расширить свои познания в любой, даже самой немыслимой, сфере деятельности или исследований. А так как развитию Internet, с одной стороны, способствовали коммерческие организации, фирмы, использующие Сеть для обмена деловой информации и публикации рекламы, а с другой — студенты, помещающие на всеобщее обозрение множество материалов развлекательного характера, то здесь много полезного для себя найдут все – от бизнесменов до любителей со вкусом отдохнуть.

Спектр услуг в Internet к настоящему времени стал просто необозрим, поэтому начнем с самых известных и доступных.

 

Электронная почта

 

Один из видов информационных услуг, которые предоставляют компьютерные сети, — электронная почта (E-mail). В этом случае оба абонента — отправитель и получатель — имеют дело с посредниками (провайдерами), выполняющими функции местных отделений почтовой связи. Сервер посредника включен постоянно и на его винчестере официально зарегистрированным абонентам выделены «почтовые ящики» для временного хранения входящей и исходящей переписки.

Для обеспечения функционирования локальной сети часто выделяется специальный компьютер — сервер, или несколько таких компьютеров. На дисках серверов располагаются совместно используемые программы, базы данных и т.д. Остальные компьютеры локальной сети часто называются рабочими, станциями. На тех рабочих станциях, где требуется обрабатывать только данные на сервере (например, вводить сведения в совместно используемую базу данных о заказах и продажах), часто для экономии (или по соображениям безопасности) не устанавливают жестких дисков. В сетях, состоящих более чем из 20-25 компьютеров, наличие сервера обязательно — иначе, как правило, производительность сети будет неудовлетворительной. Сервер необходим и при совместной интенсивной работе с какой-либо базой данных.

Иногда серверам назначается определенная специализация (хранение данных, программ, обеспечение модемной и факсимильной связи, вывод на печать и т.д.). Серверы, как правило, не используются в качестве рабочих мест пользователей. Серверы, обеспечивающие работу с ценными данными, часто размещаются в изолированном помещении, доступ в которое имеют только специально уполномоченные люди (как в банковское хранилище).

Местный сервер, как правило, располагает достаточно качественными каналами связи с одним из узлов сети, входящей в состав Internet. Посредник взимает со своих абонентов небольшую ежемесячную плату и выписывает дополнительный счёт, пропорциональный объёму передаваемой информации (в пределах страны и за её границами действуют разные тарифы).

Одновременно с регистрацией в местном «почтовом отделении» абоненту сообщается уникальный (с точки зрения местного сервера) электронный адрес и выдаётся специально настроенное программное обеспечение, которое позволяет автоматически установить связь с посредником, за несколько минут получить поступившую в ваш адрес корреспонденцию и отправить заранее подготовленные вами сообщения. На сеанс связи с провайдером можно выйти в любое удобное для вас время. Но длительно не востребованные поступления сервер возвратит отправителю.

Взаимодействие с программой обслуживания почты очень напоминает работу в текстовом редакторе. Заголовок электронного письма включает три обязательные раздела. Во-первых, это адрес отправителя, который располагается вслед за символами «From:». Такая строка автоматически включается в состав письма почтовой программой. Во-вторых, за ключевым словом «То:» необходимо набрать электронный адрес получателя. В некоторых сетях используются свои форматы для представления адреса. Наиболее распространённый формат электронного адреса в Internet предполагает задание пяти компонент:

Код_Получателя_Код_ПК.Код_Организации. Код_Города.Код_Страны

Однако и этот формат допускает отклонения. Например, вместо обычного двухсимвольного кода страны можно встретить код принадлежности к группе учебных заведений (.edu). Также вместо кода страны можно встретить коды принадлежности к коммерческим организациям (.сот)’, американским правительственным учреждениям (.gov); американским военным организациям (.mil)’, к прочим организациям.

Третья компонента в заголовке, располагаемая вслед за ключевым словом Subject, раскрывает тематику письма. Иногда её используют как дополнение к электронному адресу получателя. Обнаружив, например, в письме строку «Subject: to Sergey», получатель понимает, что в его почтовый ящик положили письмо для приятеля по имени Сергей, который не имеет собственного электронного адреса.

Письмо, переданное провайдеру, немедленно обрабатывается, и специальная программа-маршрутизатор определяет оптимальный путь передачи послания следующему компьютеру сети. От пользователя скрыты такие внутренние детали, как разбивка передаваемой информации на порции — пакеты, присоединение к пакетам служебной информации, сжатие данных, контроль за передаваемой порцией и повторная её посылка в случае обнаружения неустранимой ошибки и т.п.

Для передачи электронных писем в Internet используются три протокола. Старейший из них — SMTP — Simple Mail Transfer Protocol (Протокол передачи простой почты) был разработан еще в 1982. Спустя пару лет появился Протокол Почтового Отделения POP — Post Office Protocol (Протокол почтового отделения). С появлением в Internet почтовых сообщений, содержащих звуки и изображения, возник протокол MIME — Multipurpose Internet Mail Extension.

В некоторых сетях используется программное обеспечение с поддержкой национальной версии языка. Тогда можно набрать текст письма, используя, например, русский алфавит. Но в большинстве случаев приходится ограничиваться первой половиной набора ASCII, и тогда письма, адресованные за рубеж русским абонентам, могут иметь вид: «Privet, Sereja! Ja poluchil tuoe poslanie ot 25.03.97… ».

Следует обратить внимание на оперативность и дешевизну электронной почты по сравнению с традиционными средствами общения — телеграммами, междугородними телефонными разговорами, обычными письмами. Электронная почта доходит до абонента, расположенного в любой точке земного шара за считанные минуты. Скорость передачи информации между серверами достигает 3600 символов в секунду, что эквивалентно примерно 2 страницам текста. В отличие от обычных почтовых отделений, E-mail не теряет свои письма.

 

Телеконференции

 

Другой вид информационных сетевых услуг под названием «телеконференции» напоминает подписку на электронную газету, в которой появляются сведения по определенной тематике — новости, заметки, ответы на вопросы, отклики на предшествующие публикации и т.п. Авторами этой весьма разнообразной и сверхоперативной информации являются сами пользователи сети, объединённые общими интересами. Многие провайдеры предоставляют своим абонентам перечень конференций, в которых можно участвовать за умеренную плату. При этом вы будете регулярно получать электронные письма с заголовками статей по соответствующей тематике. Заголовки сопровождаются идентификационными номерами, объёмом статьи и, иногда, краткой аннотацией в 1-2 строки. За дополнительную плату, пропорциональную размеру статьи, вы можете заказать нужную публикацию. Только делать это нужно оперативно, т.к. сервер хранит содержимое очередного выпуска порядка 10 дней.

Телеконференции по оформлению и способу работы очень похожи на электронную почту с тем лишь отличием, что ваше письмо может прочитать огромное количество людей, а в свою очередь сможете поинтересоваться тем, что пишут вам совершенно незнакомые люди. Конференции подразделяются по темам, название конференции состоит из нескольких слов, разделенных точками, каждое последующее из которых сужает тему. Вот стандартное обозначение некоторых групп телеконференций Usenet:

comp — конференции, где обсуждается все, что связано с компьютерами и программированием;

news — обмен новостями, вопросы развития системы телеконференций;

rec — отдых, хобби, увлечения;

sci — все, что связано с наукой;

soc — вопросы общественной жизни;

talk — группа для любителей поспорить или просто поговорить на любую тему.

Начиная работать с какой-либо группой, в первую очередь нужно прочитать правила работы в ней, которые регулярно помещаются в эти группы человеком, добровольно взявшим на себя обязанности координатора группы (модератора). На самом деле, группы новостей бывают двух типов — модерируемые и обычные. Сообщения, появляющиеся в модерируемых группах, прежде чем быть разосланными по сети, просматриваются модератором. Это, конечно, является своего рода цензурой, но в таком огромном сообществе, как Usenet, невозможно поддерживать порядок без подобных строгостей.

Сегодня всякий компьютер, полноценно подключенный к Интернет, имеет доступ к новостям Usenet, но новости Usenet распространяются и по другим сетям, применяясь столь же широко, как и электронная почта. Способы и удобство работы с новостями сильно зависят от того, каким образом Вы получаете их. В Интернет Ваша программа-клиент напрямую получает новости с сервера Usenet, и между просмотром списка сообщений, содержащихся в группе, и чтением этих сообщений нет задержки. Если Вы пользуетесь новостями через электронную почту, то Вы сначала получаете список статей, а уже потом принимаете по электронной почте статьи из списка, отдельно Вами заказанные.

<

 

File Transfer Protocol (FTP) – передача файлов

 

FTP сервис Интернет — сервис, который дает максимальную нагрузку на каналы связи. Расшифровывается эта аббревиатура как протокол передачи файлов, но при рассмотрении ftp как сервиса Интернет имеется в виду доступ к файлам на удаленных компьютерах и в файловых архивах. FTP — стандартная программа, работающая по протоколу TCP, как правило, поставляющаяся с операционной системой. Ее исходное предназначение — передача файлов между разными компьютерами, работающими в сетях TCP/IP: на одном из компьютеров работает программа-сервер, на втором пользователь запускает программу-клиента, которая соединяется с сервером и передает или получает файлы. Тут предполагается, что пользователь зарегистрирован на обоих компьютерах и соединяется с сервером под своим именем и со своим паролем на этом компьютере. Протокол FTP, разумеется, оптимизирован для передачи файлов.

Данная черта и послужила причиной того, что программы FTP стали частью отдельного сервиса Интернет. Дело в том, что сервер FTP можно настраивается таким образом, что соединиться с ним можно не только под своим именем, но и под условным именем anonymous. Тогда Вам становятся доступна не вся файловая система компьютера, но некоторый набор файлов на сервере, которые составляют содержимое FTP-сервера anonymous — публичного файлового архива. Итак, если кто-то хочет предоставить в публичное пользование файлы с информацией, программами и прочим, то ему достаточно организовать на своем компьютере, включенном в Интернет, FTP сервер.

Если Вы, например, хотите представить миру демо-версию Вашего программного продукта — использование FTP сервера является удачным решением такой задачи. Если, с другой стороны, Вы хотите найти, скажем, последнюю версию Вашей любимой свободно распространяющейся программы, то искать ее нужно именно на серверах FTP.

Несмотря на распространенность, у FTP есть и множество недостатков. Программы-клиенты FTP могут быть не всегда удобны и просты в использовании. Не всегда можно понять, а что это за файл перед Вами. Нет простого и универсального средства поиска на серверах FTP – хотя для этого и существует специальный сервис ARCHIE, но это независимая программа, неуниверсальная и не всегда применимая. Описания файлов на сервере выдаются в формате операционной системы сервера, а список файлов операционной системы UNIX может привести в недоумение пользователя DOS. Проблема тут в том, что со списком файлов выдается лишняя информация, а слишком много знать вредно.

Серверы FTP нецентрализованы, и это несет свои проблемы. FTP — сервис прямого доступа, требующий полноценного подключения к Интернет, но возможен и доступ через электронную почту – большая часть FTP серверов может прислать свои файлы по E-mail, а так же существуют серверы, которые могут прислать Вам по электронной почте файлы с любых FTP серверов. Однако это не всегда удобно, ибо такие серверы сильно загружены, и Ваш запрос может долго ждать своей очереди. Кроме того, большие файлы при отсылке делятся сервером на части ограниченного размера, посылаемые отдельными письмами — и если одна часть из сотни потеряется или повредится при передаче, то остальные 99 тоже окажутся ненужными.

 

Internet Real Chat

(реальное общение в Интернете)

 

Это можно перевести как «параллельные беседы» в Internet или «переключаемый треп». Представьте себе десятки тысяч людей, которые собрались в Internet поговорить. С друзьями и незнакомыми людьми. Обсудить определенные темы или просто потрепаться. И все это происходит в реальном времени. Для того чтобы поучаствовать в беседе, вам нужно просто подключиться к выбранному каналу. Каждый канал имеет название, которое более или менее отражает тему разговоров (например, на канале warez идет обмен ворованными программами), а иногда и нет.

 

Гипертекстовая система GOPHER

 

Одним из достаточно известных и распространенных сервисов Интернет является GOPHER (правда устаревшим). Хотя сейчас он уже практически не развивается, или, во всяком случае, развивается гораздо медленнее прочих сервисов похожего назначения, но тем не менее через GOPHER доступно довольно-таки большое количество информации — в первую очередь, по историческим причинам — был период, когда GOPHER был лучшим средством публичного доступа к информации. Современные средства работы с информацией в Интернет (например, WWW просмотрщики) обеспечивают в том числе доступ к серверам GOPHER, поэтому специальных программам-клиентов GOPHER в настоящий момент не используется. Что касается использования сервера GOPHER для предоставления новой информации в публичный доступ — вряд ли целесообразно использовать морально устаревший сервис GOPHER.

GOPHER — это распределенная система экспорта структурированной информации. При работе с GOPHER Вы находитесь в системе вложенных меню, из которых доступны файлы различных типов — как правило, простые тексты, но это может быть и графика, и звук и любые другие виды файлов. Таким образом, в публичный доступ экспортируются файлы с информацией, но не в виде файловой системы, как в FTP, а в виде аннотированной древовидной структуры. GOPHER — сервис прямого доступа и требует, чтобы и сервер, и клиент были полноценно подключены к Интернет.

Основное преимущество Gopher состоит в том, что вам не нужно запоминать адрес или название ресурса и последовательность команд, необходимую для доступа к нему: двигаясь по меню программы, вы на самом деле перемещаетесь по разным компьютерам, подключенным к Сети. Однако сегодня Gopher, по всей видимости, доживает последние дни, потому что появился новый сервис, гораздо более удобный.

Несмотря на то, что Интернет, несомненно , самое мощное средство к сетевой информации, существуют и другие источники, многие из которых предвосхитили взрывообразное увеличение использования Интернет. В их число входят компьютерные доски объявлений и коммерческие информационные службы.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Всемирная паутина (World Wide Web или WWW)

 

На сегодняшний день это наиболее продвинутый и интересный ресурс — гипертекстовая система навигации в Internet. От обычного гипертекста WWW отличается главным образом тем, что позволяет устанавливать ссылки не только на соседний файл, но и на файл, находящийся на компьютере в другом полушарии Земли. От вас же не требуется никаких усилий — компьютер установит связь самостоятельно.

В WWW, как и в Gopher, к ресурсам можно обращаться, непосредственно указывая их адрес. В этом случае приходится сталкиваться с сокращением URL — Uniform Resourse Locator, универсальный способ обозначения ресурса Internet. Обозначение URL состоит из двух частей: первая указывает тип связи, который следует установить с нужным вам источником, вторая — имя требуемого сервера. Типы связи соответствуют стандартным услугам Internet. Вот основные из них:

http — HiperText Transfer Protocol,основа WWW, — тип связи, необходимый при обращении к любому WWW-серверу;

ftp — используется при обращении к FTP-серверам;

gopher — предназначен для взаимодействия с Gopher;

telnet — предназначен для получения терминального доступа к удаленной машине;

news — открывает доступ к телеконференциям.

Информация на WWW может включать в себя текст, рисунки, таблицы, звук, мультипликацию и многое другое. Благодаря своим широким возможностям, красоте и простоте в использовании «всемирная паутина» завоевала огромную популярность во всем мире. Информационная навигация в сети InterNet: Введение в инструментальные системы нового поколения — «Навигаторы» системы WWW.

Если Вы когда-либо имели возможность изумляться возможностям сети InterNet, то Вы уже знаете о феноменальном объеме информации — все от баз данных, текстовых файлов, документов, имидж- аудио- видео- файлов до готовых программ.

При таком гигантском объеме данных в сети необходимо иметь развитые инструментальные системы, которые делают информационный поиск более эффективным.

До 1991 года в сети InterNet были разработаны простые инструментальные системы и навигаторы первого и второго поколения. Но затем начался новый этап координированных разработок.

Именно в том году, в CERN, в Женеве, были разработаны системы, ныне называемые World Wide Web ( WWW/3W или просто «Web» — по-нашему «Паутинка»).

Эта же система является попыткой интегрировать разнообразные инструментальные системы и данные с помощью общего формата данных на базе концепции гипертекста. Результат этих разработок был чрезвычайно успешным. Фактически, они сформировали к настоящему времени лицо сети InterNet .

Система Web базируется на методе связывания слов и фраз в документе для ссылки к соответствующей информации в этом же или другом документе. Поскольку другие документы могут быть на разных серверах, эти ссылки образуют своеобразную «паутину» взаимных связей, которая пронизывает сеть IntеrNet.

Но что же можно делать с этой технологией на Вашей локальной сети? Web-технология может использоваться и в том случае, если Ваше сеть не включена в InterNet. Все компоненты этой технологии доступны для многих платформ как FreeWare.

Ряд ведуших программных фирм срочно реализуют первые коммерческие инструментальные системы для этой новой сетевой Web-технологии. Они ориентированы на более оптимальную интеграцию Web-технологии в среду рабочих станций и будут более удобными с точки зрения системного сопровождения и администрирования.

Для понимания сути Web-технологии и используемых программных средств, следует напомнить об основных навигационных и инструментальных средствах, доступных пользователям сети InterNet.

Самыми простые средства — FTP и Telnet. Ftp — это программа, которая использует TCP/IP File Transport Protocol для передачи файлов между компьютерами. Telnet — это программа для доступа к удаленному компьютеру в режиме эмуляции локального терминала.

Хотя эти программы работают безотказно, они являются «слепыми», поскольку обрабатывают только те данные, размещение которых уже известны Вам и предназначены для выполнения только основных операций. Фактически они были инструментальными средствами первого поколения в сети InterNet.

Следующее поколение инструментальных средств — «навигационные» — ориентировалось на проблему поиска требуемых информационных ресурсов.

 

Гипертекстовая система Hyper-G

 

WWW не была единственной попыткой создать глобальную гипермедийную распределенную информационную систему. Другой такой системой является Hyper-G. Этот сервис Интернет менее известен, но весьма интересен. Hyper-G значительно моложе WWW (хотя темпы роста и не указывают на то, что Hyper-G сможет когда-либо сравниться по популярности с WWW) и это академическая разработка — плод стараний технологического университета в Граце (Graz), Австрия. Система эта вряд ли окажется практически полезной для Вас, но заслуживает внимания как очень интересная технология, и ее рассмотрение позволяет многое добавить в картину сервисов Интернет и их развития.

С общих позиций Hyper-G аналогична WWW, преследуя те же идеи и повторяя многие принципы. Есть клиенты и есть серверы, которые предоставляют информацию в виде коллекций документов. По принципам организации информации в пределах одного сервера Hyper-G является чем-то средним между WWW и GOPHER. Документы доступны из иерархического меню, но сами документы являются гипермедийными. Клиент Hyper-G общается не со множеством серверов, как в случае WWW, но исключительно со «своим» сервером, регистрируясь на нем при подключении. Получение документов с других серверов Hyper-G происходит через «свой» сервер, что позволяет создать более интегрированную систему серверов, чем в случае с WWW. Регистрация же клиента позволяет определить уникальным образом не только ресурсы и сервисы Интернет, но и клиентов, что значительно облегчает обеспечение авторизованного доступа и удаленного управления документами.

К чертам, препятствующим распространению Hyper-G, следует отнести недостаточно хорошую реализацию программ-клиентов, не полностью свободный доступ к серверной части программного обеспечения, централизованность проекта и отсутствие альтернативных реализаций программного обеспечения, слишком твердую структуру организации документов на сервере, сложность системы. Серверы Hyper-G весьма немногочисленны, следовательно, информации в Hyper-G хранится немного. Отсутствует доступ посредством электронной почты, хотя серверы Hyper-G могут также выполнять роль серверов gopher и WWW.

 

Поисковая система WAIS

 

WAIS — еще один сервис Интернет, сегодня почти не использующийся, или, по крайней мере, практически не развивающийся. WAIS расшифровывается как информационная система широкого профиля, но на самом деле это комплекс программ, предназначенных для индексирования больших объемов неструктурированной, как правило просто текстовой, информации, поиска по таким документам и их извлечения. Существуют программы для индексирования, для локального поиска по полученным индексам, а также серверная и клиентская программа, общающиеся между собой по специальному протоколу Z39.50. Задача поиска по большим объемам неструктурированной информации весьма нетривиальна и сегодня еще не существует общепринятого ее решения. WAIS во многих случаях является приемлемым вариантом поисковой системы, и коль скоро она имеет свободно распространяемую программную реализацию, то получила достаточную известность как один из сервисов Интернет. На самом деле, она почти не используется сегодня самостоятельно, но во многих случаях применяется как вспомогательное средство, например, для индексирования документов, хранящихся на WWW-сервере. В некоторых случаях она также используется как средство работы со словарями, или для поиска по архивам сетевых новостей Usenet. Если перед Вами стоит задача по индексированию больших объемов неструктурированной информации, то, возможно, WAIS окажется адекватным ее решением. Однако, нужно иметь в виду, что свободно распространяемая реализация системы далека от совершенства, что система достаточна сложна для понимания и изучения, и, что хуже всего, практически не развивается. Поддержкой и развитием свободной версии занимались последовательно несколько организаций, но ни одна из них не довела продукт до приемлемого для реальной работы состояния.

 

«Навигация» в сети Internet

 

При обширном информационном богатстве, которое возникало в каждом «углу» InterNet, подобно грибам на лесной поляне, главным требованием к новым инструментальным средствам была эффективность при поиске требуемых сетевых ресурсов.

Ввиду большого многообразия имеющихся ресурсов в сети InterNet, информационный поиск — сложная проблема, особенно с точностью до абсолютного сетевого номера (для примера, имеются сотни сложных баз данных, и десятки тысяч архивных серверов со свободным доступом). Фактически каждый час в сети появляются все новые и новые источники, что и делает обычный поиск практически безнадежным занятием. В настоящее время имеются следующие «навигационные» средства:

— система Archie;

— СУБД для поиска файлов в открытых для доступа архивах;

— Wide Area Information Server, который может использоваться для поиска в большом числе баз данных и документальных архивах.

Имеется также системы типа Gopher с интерфейсом в виде текстовых экранных форм-меню, которые ссылаются на распределенные по сети информационные источники, образуя тем самым «паутину» связей — так называемые Gopher-пространства. Система Veronica предназначена для поиска объектов в этом Gopher-пространстве.

Эти навигационные «прилады» (средства) до сих пор широко используются.

Но, обеспечивая эффективную навигацию по InterNet, они все имеют дело с простым форматом командного файла и манипулируют с ограниченным типом данных.

Стало ясно, что необходимы более совершенные системы с развитыми сервисными функциями и с возможностями обработки более разнообразных

форматов данных. И одним из источников разнообразных данных стала сама Web-сеть, послужившая основой для следующего поколения инструментальных средств InterNet — Web-«навигаторов.

 

Модификация Web

 

Гипертекстовые ссылки системы Web действуют как указатели на другие части единого документа, или на совершенно разные документы, или на другие доступные по сети сервисы. Хотя во многом это кажется несколько абстрактным в теории, на практике — очень эффективно и удобно.

Если Вы когда-либо использовали подсистему Help для Windows, Вы уже имели практические навыки работы с гипертекстом. Любое слово, фраза, или пиктограмма в документе «Help» может быть описана как самостоятельный объект. Когда Вы выбираете этот объект, происходит переход на соответствующую часть документа.

Навигаторы Web расширяют эту идею, обеспечивая связи между документами, размещенными в разных узлах сети, и доступ к разнообразным сервисам типа FTP и Gopher-пространствам.

Для примера, в описании сетей может быть ссылка на Ethernet. Если слово «Ethernet» поддержано гипертекстовой ссылкой, при его выборе, Вы получите переход на описание этой сетевой технологии. В этом описании, в свою очередь, может быть ссылка на документ о поставщиках оборудования Ethernet и выбор какого-то из них обеспечит переход на документ, описывающий все поставляемое им оборудование. Более того, в этом описании может быть список всех драйверов для поставляемых адаптеров сети Ethernet.

О! и Вы обнаружили, что появилась самая последняя версия драйвера именно для той карты, которую Вы уже давно используете. И эту версию можно заполучить простым нажатием клавиши Вашей «мышки» для активации соответствующей гипертекстовой ссылки.

Документы в системе Web могут включать, помимо текстов, указания об используемых шрифтах и форматах, ссылки на графические данные и фотоснимки, ссылки на другие данные, документы и сервисы. Все эти документы формируются по правилам Hypertext Markup Language (HTML).

HTML базируется на промышленном стандарте — Standard General Markup Language (SGML) — для создания машинно-независимых документов, с учетом всего многообразия используемых компьютерных платформ. При этом HTML еще более расширяет определение гипертекстовой ссылки.

HTML документ состоит из текста, который должен быть выдан на дисплей, и описателей — тэгов (tags), которые определяют, как этот техт должен быть представлен, и как другие типы данных — для примера, видео- и аудио- данные — должны извлекаться и форматироваться, и куда ведет каждая гипертекстовая ссылка.

HTML-описатели являются полями в документе, которые размещаются между символами «» и содержат директивы и соответствующие параметрические данные — атрибуты директивы.

Например, в поле <H1> Hello HTML </H1> начальный тэг <H1>указывает на начало заголовка, а директива «H» определяет, что следующий за этим тэгом текст следует разместить в этом заголовке. Следующие за директивой атрибуты доопределяют, что эта директива должна фактически сделать. В нашем примере аргумент «1» указывает, что заголовок должен размещаться на первом уровне. Завершающий тэг </H1>указывает об окончании этого поля.

Имеются специальные тэги для описания гипертекстовых ссылок (так называемых anchors), заголовков, изображений и других объектов.

Базовое понятие в WWW-навигаторах — Унифицированные Указатели Ресурсов (Uniform Resource Locators — URL). URLs используются для идентификации размещения ресурсов, на которые ссылаются в документах. Например, URL для главного индекса (home page) набора документов в Национальном Центре по Прикладным Программам для Суперкомпьютеров (NCSA) задается следующим способом:

http://www.ncsa.uiuc.edu/Genaral/NCSAHome.html

Компонента «http:» определяет метод доступа — через сервер HyperText

Transfer Protocol (HTTP). Этот протокол определяется его создателем Tim Barners-Lee как » … простейший и достаточно быстрый для распределенных и взаимодействующих информационных гипермедиа систем. Это общий объектно-ориентированный протокол, который может использоваться для многих схожих проблем, таких как Name Servers и распределенных объектно-ориентированных систем».

Следующая часть URL — «//www.ncsa.uiuc.edu» — описывает, на каком узле размещены данные. Наконец, компонента «/Genaral/» определяет, где размещается файл с документом «NCSAHome.html».

Для изучения навигации в системе WWW попробуйте начать с главных страниц на серверах в NCSA и CERN. Если Вы размещаетесь в локальной сети типа NetWare, Вы сможете навигировать по всем информационным ресурсам этой сети через Novell’s home page.

А информацию о новостях в сети InterNet можно найти на «странице» NCSA’s Mosaic «What’s New page» (см. прил. N=1) и Навигаторе Глобальной Сети (Global Network Navigator) — прекрасной программной разработке сотрудников издательства O’Reily Press.

Хотя было разработано несколько программ для навигации в сети — например, WWW и Lynx для текстового режима, но только система Mosaic завоевала признательность почти всех пользователей сети InterNet. Она была разработана в NCSA в 1993 году и объединяет на базе единого графического интерфейса как несколько традиционных для сети InterNet инструментальных подсистем, так и возможности новых навигаторов.

Другая альтернативная система Cello в среде Windows была создана на Юридическом факультете Корнельского Университета. Mosaic и Cello обеспечивают эффективную программную среду для успешной навигации любого новичка по информационным «сокровищам» вей глобальной сети InterNet. Используя эти «оболочки», не надо тратить время на изучение всех сложных инструментальных средств первого и второго поколения.

Из-за удобного и эффективного интерфейса и из-за реализации на многих промышленных платформах, системы Mosaic и Cello стали широко использоваться для информационного сервис в рамках больших компаний.

 

 

 

 

 

 

 

 

Поисковые системы

 

Как уже было отмечено, большинство первых приложений, включая FTP и электронную почту, были разработаны исключительно для обмена данными между хост-компьютерами Internet. Другие приложения, такие как Telnet, создавались для того, чтобы пользователь получил возможность доступа не только к информации, но и к рабочим ресурсам удаленной системы. По мере развития Internet (увеличения пользователей и хост-компьютеров) прежние методы обмена данными перестали отвечать возросшим потребностям пользователей. Возникла необходимость разработки новых способов поиска сетевых ресурсов и доступа к ним, которые позволяли бы использовать информацию независимо от ее формата и расположения. Для удовлетворения таких потребностей сначала были созданы поисковая система Archie, решающая задачу локализации ресурсов на FTP-сервере, и система Gopher, упрощающая доступ к различным сетевым ресурсам. Затем были разработаны сетевые информационные системы WWW и WAIS, предлагающие абсолютно новые методы получения информации. Принципы работы этих систем позволяют легко ориентироваться в огромном количестве информационных ресурсов без необходимости предоставления механизмов работы самой сети Internet. Такой подход позволяет говорить уже не просто о ресурсах взаимосвязанных компьютерных систем, а об особых информационных пространствах сети.

Система Gopher была разработана для упрощения процесса локализации FTP-ресурсов Internet и для более удобного представления сведений о содержании хранящихся на FTP-серверах файлов. Система Gopher дает возможность в удобной форме (в виде меню) представлять пользователям об имеющихся файлах и их содержании. Меню Gopher-серверов могут содержать ссылки на другие Gopher- и FTP-серверы. Ссылка на FTP-сервер позволяет как просмотреть его каталоги, так и автоматически получить файл. Таким образом, пользователь получает возможность «путешествовать» по Internet, не обращая внимания на местонахождение интересующих его ресурсов, и получать доступ к этим ресурсам.

Система Veronica используется для поиска информации в Gopher-пространстве по заголовкам пунктов меню. После ввода ключевого слова, система Veronica выясняет, встречается ли оно в меню на каком-либо Gopher-сервере, и в качестве результатов поиска выдает список заголовков пунктов меню, содержащих ключевое слово. Поскольку система Veronica не является автономной поисковой программой, а тесно связана с системой Gopher, она обладает тем же, что и система Gopher, недостатком: далеко не всегда по заголовку можно сказать, что собой представляет тот или иной информационный ресурс. Достоинства системы заключается в том, что нет необходимости узнавать, где расположена найденная информация, достаточно выбрать требуемую запись из списка.

Основой системы WAIS является комплекс глобальных баз данных, в которых содержится индексированная информация о ресурсах сети. Система WAIS обеспечивает распределенный поиск текста в этих базах данных по ключевому слову или строке.

Самым новым и наиболее совершенным средством поиска, получения и отображения информации в Internet является система World Wide Web (WWW).

В системе WWW имеется также доступ к специально разработанным поисковым системам (поисковым машинам), которые выполняют поиск WWW-страниц, содержащих информацию на заданную с помощью ключевых слов тему. Поиск производится среди заранее проиндексированных WWW-страниц множества серверов Internet, и результатом поиска является автоматически сгенерированная новая WWW-страница, содержащая ссылки на найденные документы. Это чрезвычайно мощное средство делает весьма легкой и удобной для пользователей процедуру поиска информации в Internet, а результат поиска позволяет представить в наглядной форме. Наиболее мощными поисковыми машинами на сегодняшний день в мире являются: Alta Vista (www.altavista.digital.com), Yahoo! (www.yahoo.com), Infoseek (www.infoseek.com), GoTo (www.goto.com), FTP search (ftpsearch.ntnu.no – поиск в системе FTP), а также отечественные: Rambler (www.rambler.ru), Yandex (yandex.ru), АПОРТ! (www.aport.ru), Следопыт (www.medialingua.ru/www/wwwsearc.htm), Compass (compass.tsu.ru), Russian FTP
search (ftpsearch.city.ru – поиск в системе FTP). Следует отметить, что результатом поиска могут быть не только HTML-документы, хранящиеся на WWW-серверах, но и другие типы файлов на других типах серверов, если информация об этих документах содержится в соответствующих базах данных поисковых машин.

 

 

 

 

ЛИТЕРАТУРА

 

  1. Фигурнов В.Э. IBM PC для пользователя. Краткий курс. — М.: ИНФРА-М, 2001. — 480 с.
  2. Фигурнов В.Э. IBM PC для пользователя: от начинающего до опытного. – М.:ИНФРА – М, 2000. – 640с.: ил.
  3. Гусева А.И. Работа в локальных сетях Netware 3.12 – 4.1. С.-П.: Питер. – 1999.
  4. Гусева А.И. Технология межсетевых взаимодействий. Netware – Unix – Windows – Internet. C.-П.: Питер. – 1999. .
  5. А.В. Фролов и Г.В. Фролов. ПК шаг за шагом. М.: Диалог МИФИ,1998.
<

Комментирование закрыто.

MAXCACHE: 0.97MB/0.00040 sec

WordPress: 22.58MB | MySQL:124 | 2,028sec