Работа с FTP в среде WWW
Как показывает практика, на сегодняшний день основной услугой Internet является WWW.
Весь мир с замиранием сердца следит за сражениями броузеров, Java, технологий встраивания
multimedia в HTML-страницы. Однако любому человеку понятно - главное, это уметь использовать
уже существующие инструменты. Основой данной главы будет рассмотрение части возможностей
http протокола, а именно - передачи файлов.
Каждый, кто работает с WWW знает, что такое URL, Uniform Resource Locator. На сегодня это
основной способ указания ресурсов Internet. Наиболее подробно об URL можно прочесть в
RFC 1738 и
RFC 1808. Общий формат URL: <scheme>:<scheme-specific-part>. Например, для HTML файла можно
сформировать следующие URL:
http://www.karelia.ru. Для почтовога адреса:
mailto:skyer@mainpgu.karelia.ru.
FTP также является ресурсом Internet. URL для ftp выглядит
так: ftp://<user>:<password>@<host>:<port>/<url-path>,
где user - имя пользователя, password - его пароль, host - доменное имя или IP адрес сервера,
url-path - путь к файлу. На практике наиболее часто используемым вариантом ftp является
анонимный. Как уже было сказано выше, анонимный ftp ничем не отличается от "остального".
Просто в качестве имени пользователя достаточно указать anonymous, а в качестве своего
пароля - свой почтовый адрес. Для анонимного ftp в url сделан упрощенный синтаксис:
ftp://<host>/<url-path>,
то есть при отсутствии имени автоматически будет вставлено anonymous. Порт также обычно не указывается,
а используется стандартный 21.
Примеры адресов ftp в форме url:
ftp://ftp.cdrom.com/pub/music/songs/1996
ftp://ds.internic.net/rfc/rfc1738.txt
В качестве host можно указывать и IP адрес. (118.24.64.24 )
Основное применение url нашли в WWW броузерах. На сегодня это, наверное, самые
популярные программы в Internet. Netscape Navigator, Internet Explorer, Mosaic,
Lynx, Arena. Поэтому если Вы используете их, имеет смысл использовать их и
как ftp клиент. Правила формирования адреса были описаны выше, все остальное
предельно просто. Если в качестве пути указан только путь к некоторому каталогу,
а не сам файл (пример 1), то броузер покажет Вам список файлов в этом каталоге. Если
же путь указан вплоть до имени файла, то вскоре файл с некоторой вероятностью
окажется у Вас на диске. Почему с некоторой вероятностью? Потому, что к сожалению,
http использует для ftp собственную подсистему пересылки файлов. Что не привело к повышению
надежности. Однако об этом чуть позже. Искушенный пользователь WWW заметит, что иногда
адреса файлов в url в качестве scheme содержат http вместо ftp. Это разные, и в то же
время одинаковые вещи. Дело в том, что указывая http, Вы говорите WWW серверу искать
файл в области каталогов, которые отведены HTML файлам. Если ftp, то указываемые
каталоги будут совпадать с теми, которые доступны посредством классического ftp.
Сравнение HTTP и FTP путей
URL | Реально на сервере |
ftp://ftp.karelia.ru/pub/unix | /home/ftp/pub/unix
| http://ftp.karelia.ru/pub/unix | /files/www/pub/unix
|
Хотя реально принципы передачи в обеих случаях одинаковы. На самом деле здесь
кроется одна очень большая проблема. Некоторые организации, имеющие быстрый доступ к
Internet забывают, что не у всех он столь же быстр. Таким пользователям удобно использовать
классический ftp вместо WWW броузера. Дело в том, что реализация ftp в http оставляет
желать много лучшего. Основной предмет критики - отсутствие такой полезной функции как
reget. Это особенно актуально для низкоскоростных российских коммуникаций, где скорость порой
падает до нескольких десятков байт в секунду. При такой скорости разрыв соединения -
очень частое явление. И переслать файл в несколько мегабайт уже является большой проблемой.
При потере соединения Вы воспользуетесь reget в ftp клиенте, однако в среде WWW Вам,
увы, придется начать все сначала. Более того, если Вы работаете с WWW через proxy,
основанном на программном обеспечении от CERN, то есть вероятность, что при обрыве
соединения он решит, что весь файл уже переслан и на все попытки получить его с
удаленного WWW сервера proxy будет выдавать урезанный файл со своего диска. В таком случае
два совета - либо смените proxy сервер, либо вообще отключите его использование.
Однако
имейте в виду, что на сегодня очень популярны так называемые firewall, когда реальный
выход в Internet имеют только proxy и последний совет в таком случае бесполезен. Есть
еще третий совет - подождите несколько дней, пока proxy не позабудет про Ваш файл и
снова обратится в Internet для его пересылки. Однако это, безусловно, не рабочее решение.
Иногда http и ftp каталоги синхронизированы. Хорошим представителем является ftp.cdrom.com.
Там каталоги не только синхронизированы, но и очень красиво оформлены при обращении к
ним из WWW-броузера. Делается это просто, но не каждый соберется так красиво
все оформить.
Кроме всего сказанного, оставшихся оптимистов ожидает еще одна пилюля. Согласно
протоколу http, через который осуществляются коммуникации WWW, после каждого
сеанса связи соединение между компьютерами разрывается. Это означает, что
если Вы решите с удовольствие погулять в броузере по каталогам, то возможно
это не всегда будет так здорово, как кажется. На установление соединения,
регистрацию пользователя уходит несоизмеримо больше времени, чем интерактивная
работа в ftp клиенте. Вот так вот приходится платить за современный модный интерфейс.
Некоторые выводы:
- Преимущества:
- Высокая интеграция в гипертекстовое пространство Internet.
- Современное программное обеспечение.
- Недостатки:
- Отсутствие reget.
- Невысокая надежность соединения на плохих линиях.
- Встречающиеся проблемы при обрыве соединения со включенным proxy
- Невысокая скорость работы из-за закрытия соединения после пересылки.
- Недоступность файлов через ftp, адресуемых через протокол http (хотя это и
не недостаток самого http, это его особенность.)
Как нетрудно заметить, все недостатки компенсируются надежными
и быстрыми линиями связи. Уже достаточно канала в 256k у провайдера, и
основные проблемы исчезают.
Необходимо отметить, что в ближайшем времени http станет основной
системой для пересылки файлов. Большую роль здесь играет развитие
WWW, на которую теперь ориентируются практически все системы в Internet.
Плюс постоянный рост возможностей самих броузеров. Сегодня уже часто оказывается
удобнее воспользоваться ftp-mail. А Netscape Navigator уж сам извлечет файл из
письма, распакует его и приготовит для запуска. Таким образом, служба ftp
сегодня сильно меняется. Сам ftp всегда являлся достаточно актуальной
проблемой, что очень хорошо видно при просмотре документации. Публикации на
эту тему появлялись в Internet регулярно с 1973 года, хотя тогда это еще и не
называлось Internet.
Кроме того, актуальность просто пересылки файлов для рядового пользователя падает.
Если раньше большое количество документации, звуков, изображений лежало мертвым
грузом на ftp, то теперь все чаще ту же информацию можно получить в виде
красиво оформленного, и с большей вероятностью более свежего, html файла.
Однако предсказать дату, когда получение информации не будет выражаться
в виде конкретного файла пока невозможно. И большинство людей так и работает
"по старинке". Все-таки архивы программ ПОКА еще остаются файловыми архивами.
Содержание | FTP-mail | Советы
|