Файловые архивы Internet. Реферат: Файловые архивы Internet

Файловые архивы - это некий файл, созданный с помощью специальной программы, называемой архиватором, и содержащий в себе от одного до нескольких файлов и/или каталогов (папок) в упакованном виде.

Исторический аспект

Наиболее активно такие архивы применялись во времена использования флоппи-дисков, поскольку файловые архивы позволяют сжать некоторые типы файлов (исключая графические и видео) для того, чтобы разместить их на небольшом объеме дискеты. С их исчезновением использование архивов в основном переместилось в Интернет, где они продолжают использоваться преимущественно в файлообменниках и на ftp-серверах.

Классификация архивов

Выделяют следующие виды файловых архивов:

  • обычные - в одном архивном файле расположены несколько файлов и/или папок, сжатых каким-либо методом;
  • самораспаковывающиеся - представляют собой исполняемые файлы с расширением.exe; при запуске необходимо только указать путь распаковки, все остальное выполнит сама программа;
  • многотомные - включает в себя некоторое количество частей архива, которые могут помимо своего собственного расширения иметь добавочное, показывающее номер части: part01...;
  • непрерывные - архивы с максимально возможной степенью сжатия, в которых все файлы и папки представляют собой единое целое; распаковка одного файла (папки) невозможна;
  • защищенные паролем - архивы, требующие для своего открытия ввода пароля.

Расширения файловых архивов

У каждого файла имеются определенные расширения. Не являются исключением и файловые архивы. Это, прежде всего, zip, rar, 7z - наиболее популярные расширения, используемые в операционной системе Windows. Такие расширения в ОС GNU/Linux можно встретить очень редко, в основном от тех пользователей, которые недавно перешли на использование данной ОС после Windows. Здесь наиболее распространенными архивами являются gz, bz2, xz. Работа с данными расширениями обычно сопровождается компрессией tar, в результате чего общее расширение выглядит как tar.gz, tar.bz2, tar.xz. Зачастую tar.bz2 и tar.xz оказываются эффективнее по сжатию, чем zip. Данные форматы не распространены в ОС Windows, однако могут там успешно использоваться во всех распространенных архиваторах.

Лучшей степенью сжатия в наиболее распространенной ОС Windows является 7z, однако проведенные тесты показывают его небольшое превосходство над остальными расширениями файловых архивов. Работа с zip в Windows доступна после установки системы, так же как и в Mac OS X, большинство дистрибутивов GNU/Linux также работает c данным архивом из коробки, поскольку вместе с дистрибутивом устанавливаются архиваторы, которые поддерживают большинство распространенных форматов файловых архивов.

Работа с файловыми архивами

Файловые архивы предполагают наличие специальных программ, которые могли бы их эффективно создавать и распаковывать. Необходимо отметить, что большинство архиваторов под ОС Windows создают соответствующие пункты в контекстном меню, которое вызывается кликом правой кнопкой мыши. Мы рассмотрим файловые архивы для стационарных компьютеров, но существуют таковые и для гаджетов, которые можно найти в соответствующих магазинах.

Рассмотрим наиболее распространенные программы файловых архивов.

WinZip

По умолчанию сохраняет файлы в zip, однако можно сохранить и в других форматах. С помощью данного архиватора можно сжать mp3-файлы, а также jpeg-файлы до 25%, не теряя качества. Метод сжатия выбирается автоматически. Есть функции распечатки файлов, которые сжаты в данный архив, проверки их антивирусом и другие. Последние версии приложения поддерживают открытие файлов 7z, rar и zipx.

По заверениям разработчиков, WinZip обеспечивает защиту, используя шифрование банковского уровня. Помимо этого, последние версии получили возможность подключаться к облакам.

В данной программе как файловые архивы могут быть открыты новые форматы документов MS Office: docx, xlsx и т.д., а также форматы, соответствующие международному стандарту ODF.

Как говорят разработчики, уменьшение размера графических файлов происходит за счет того, что одни форматы заменяются другими.

В случае случайного удаления, копирования, переименования файлы могут быть восстановлены.

WinRAR

Во всем мире лидируют zip-архивы по популярности, но Россия идет своим путем, и у нас самый популярный архиватор - WinRAR. Этот архиватор имеет режим командной строки (именно он используется в средах GNU/Linux), последние версии также научились эффективно сжимать медиаконтент. Имеет собственный поддерживает разнообразные форматы, включая как популярные rar и zip, так и менее популярные gz, tar, bz2, lzma и другие.

В WinRAR можно выбрать время сжатия, при этом необходимо учитывать, что более сильное сжатие приведет к большим затратам времени на процесс архивирования. В настройках данного архиватора можно установить низкий приоритет, что увеличит время загрузки-распаковки, но зато и уменьшит нагрузку на процессор, а можно задействовать все ядра процессоров, что приведет к их более сильной загрузке, но зато сократит время создания архива или распаковки.

PeaZip

Эта программа является кроссплатформенной и может быть установлена во многих операционных системах. Способна открывать более 180 форматов файловых архивов. Это, наверное, рекорд. Здесь поддерживается одновременная работа с несколькими архивами. В последних версиях обеспечена поддержка открытия zipx, rar, включая его пятую версию.

Данное приложение также поддерживает шифрование данных, в нем присутствует возможность конвертации диска в файловую систему NTFS, есть возможность создания ключей, резервных копий файлов. Программа выпускается как для 32-битных платформ, так и для 64-битных.

7-zip

С помощью этого архиватора создаются родные форматы 7z, хотя поддерживается и ряд других, включая популярные форматы в Windows и POSIX-системах, в том числе GNU/Linux и Mac OS X. Он в числе прочих позволяет открывать архивы rar, deb, которые содержат бинарные файлы установщиков программ в ОС GNU/Linux. По заявлениям разработчиков, степень сжатия превосходит WinRAR на 30-70%, а WinZip - на 2-10%.

В отличие от первых двух архиваторов, которые хотят от пользователей получить денежку за их использование, последние два относятся к open source программам и являются бесплатными. В 2007 году данный архиватор проектом SourceForge.net был признан лучшим.

Шифрование реализуется с помощью алгоритма AES-256 для файловых архивов формата 7z и zip. Архивы, упакованные с использованием метода LZMA, распаковываются буквально на лету.

Как и у PeaZip, имеются приложения как для 32-, так и для 64-битных платформ.

Файловые архивы в Интернете

Множество серверов во Всемирной паутине содержат их. Серверы Интернета, содержащие файловые архивы, носит название ftp-серверов. До недавнего времени на этих серверах можно было найти практически все - от музыки до игрушек и программ для различных систем. Борьба с пиратством в нашей стране несколько подкосила данный сегмент, и теперь там в основном размещается свободная продукция.

На ftp-серверах размещаются репозитории ОС GNU/Linux, благодаря чему каждый пользователь этих систем имеет возможность свободной установки программ, подписанных цифровыми ключами, что исключает возможность проникновения вредоносного кода на компьютер пользователя, благодаря чему данные системы славятся отсутствием вирусов.

Ftp-серверы можно просматривать из любого браузера, существуют для них и специальные клиенты.

Обмен данными ftp-сервера с пользователями происходит по каналу TCP. Менеджмент обмена регулируется в стандарте протокола TELNET.

При использовании протокола ftp возможно не только скачивать файлы на локальный компьютер, но и передавать на

Систему файловых архивов посредством использования сервера ftp может любое заинтересованное лицо.

Данные сервера обеспечивают предоставление и получение файловых архивов как анонимными пользователями, так и авторизированными пользователями. Большинство ftp-серверов являются анонимными.

Несмотря на описанные достоинства, ftp-серверы не лишены недостатков. Огромная часть файловых архивов в них представлена без описания, и догадаться, что перед вами, можно только по целенаправленному поиску.

Передача файлов может осуществляться текстовым способом или бинарным. В случае неправильного выбора файл может повредиться.

По ftp-серверам нет универсального поиска. Существует несколько решений, но все они не универсальные.

Наиболее распространенным среди них является сервис Archie. Сервера Archie сильно загружены и работают только с анонимными ftp. Однако данные сервера децентрализованы, поиск осуществляется по не совсем понятному алгоритму, в результате чего, перебрав все сервера (а их около десятка) можно не обнаружить искомую информацию. Помимо этого, необходимо уметь создавать шаблон поиска при использовании данного сервиса.

Помимо использования протокола ftp для доступа к файловым архивам может использоваться протокол http.

В файловых архивах представляют не только открытое программное обеспечение, там можно обнаружить различные тексты, демо-версии проприетарных программ и многое другое.

В заключение

Таким образом, файловые архивы - это необходимая вещь для того, чтобы передать большой объем информации в сжатом виде. Данный архивы могут использоваться как локально - на отдельных компьютерах, так и в глобальной сети Интернет посредством использования специальных ftp- и http-серверов. Наиболее распространенными программами для создания архивов и их распаковки являются WinRAR, WinZip, PeaZip, 7-zip. Последние две программы являются свободными и могут использоваться бесплатно. Большинство архиваторов поддерживает все наиболее распространенные форматы архивов.

МИНЕСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ

МУНИЦИПАЛЬНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ПЕТРЯКСИНСКАЯ СРЕДНЯЯ ОБЩЕОБРАЗОВАТЕЛЬНАЯ ШКОЛА

РЕФЕРАТ

«Файловые архивы»

Выполнила : ученица 10 класса

Ильина Е.Е.

Учитель: Айнетдинова Х.А

Петряксы

Протоколы передачи файлов 4

Режимы обмена данными 6

Специализированные менеджеры загрузки файлов 7

FTP-клиенты 8

Off-line браузеры 9

Список литературы 11

Введение

Архив - файл, содержащий в себе один или несколько других файлов, вместе с метаинформацией. Часто используется для сжатия информации. Является результатом работы программы-архиватора.

Виды архивов:

    Самораспаковывающиеся архивы

    Многотомные архивы

    Непрерывные архивы

Архивы могут сохранять структуру каталогов, иметь средства обнаружения и исправления ошибок (например, контрольные суммы), содержать комментарии, а также шифровать данные при помощи пароля.

Существуют архивы, оформленные в виде программ. Они являются самораспаковывающимися, то есть для их распаковки не требуется иметь совместимый архиватор, установленный на компьютере.

Десятки тысяч серверов Интернета являются серверами файловых архивов, и на них хранятся сотни миллионов файлов различных типов (программы, драйверы устройств, графические и звуковые файлы и так далее). Наличие таких серверов файловых архивов очень удобно для пользователей, так как многие необходимые файлы можно "скачать" непосредственно из Интернета.

Файловые серверы поддерживают многие компании - разработчики программного обеспечения и производители аппаратных компонентов компьютера и периферийных устройств. Размещаемое на таких серверах программное обеспечение является свободно распространяемым (freeware) или условно бесплатным (shareware) и поэтому, "скачивая" тот или иной файл, пользователь не нарушает закон об авторских правах на программное обеспечение.

Протоколы передачи файлов

Протокол передачи файлов - протокол, предназначенный для обеспечения передачи и приема файлов между серверами и клиентами, работающими в сетях, поддерживающих протокол TCP/IP. Протокол передачи файлов поддерживает набор команд, реализующих двунаправленную передачу файлов между компьютерами.

Доступ к файлам на серверах файловых архивов возможен как по протоколу передачи гипертекста HTTP (Hyper Text Transfer Protocol), так и по специальному протоколу передачи файлов FTP (File Transfer Protocol).

FTP (англ. File Transfer Protocol) – протокол передачи файлов, предназначенный для передачи файлов в компьютерных сетях. Он позволяет подключиться к FTP-серверам, просматривать их содержимое и загружать файлы с сервера или наоборот - на сервер. FTP появился в 1971 году, задолго до HTTP и является одним из «взрослых» сетевых протоколов.

В начале 90-х годов на долю FTP приходилось приблизительно половина всего Интернет-трафика.

Для передачи файлов, протокол FTP использует транспортный TCP (Transmission Control Protocol) - протокол. В отличие от множества других протоколов, команды и данные здесь передаются по разным портам: порт 20 используется для передачи данных, порт 21 - для передачи команд

В случае прерывания передачи данных, FTP предоставляет средства для его докачки, что бывает удобно при работе c большими файлами. FTP-серверы используются в качестве архива коммерческого ПО, которое используется в компании - в этом случае этот сервер имеет закрытый или ограниченный доступа к хранящимся ресурсам.

Для работы с FTP-архивами необходимо следующее программное обеспечение: сервер, клиент и поисковая программа. Сервер обеспечивает доступ к ресурсам архива из любой точки сети, клиент обеспечивает доступ пользователя к любому архиву в сети, а поисковая система обеспечивает навигацию во всем множестве архивов сети.

Например, для загрузки с сервера файлового архива ftp.cuteftp.com компании GlobalScape файла cute4232.exe необходимо указать URL-адрес этого файла. При указании URL-адреса файла протокол FTP записывается следующим образом: ftp:// .

В результате универсальный указатель ресурсов принимает вид:

ftp://ftp.cuteftp.com/pub/cuteftp/cute4232.exe и состоит из трех частей:

ftp:// - протокол доступа,

ftp.cuteftp.com - доменное имя сервера файлового архива,

/pub/cuteftp/cute4232.exe - путь к файлу и имя файла.

Протокол HTTP - протокол передачи гипертекста, предназначен для передачи гипертекстов. Гипертекст это текст, содержащий специальные элементы, при обращении к которым выполняется непосредственный переход в другой текст. Эти элементы называются гиперссылками. В настоящее время HTTP наиболее популярный протокол Internet, т.к. обеспечивает простую и эффективную навигацию в сети. Поэтому сегмент Internet, использующий данный протокол называют World Wide Web (Всемирная паутина) или сокращенно WWW.

Необходимо отметить, что существует еще протокол HTTP-S (HTTP Secure) - сетевой протокол защищенной передачи гипертекста.

Наиболее известные протоколы, используемые в сети Интернет:

POP (Post Office Protocol) - это стандартный протокол почтового соединения. Серверы POP обрабатывают входящую почту, а протокол POP предназначен для обработки запросов на получение почты от клиентских почтовых программ.

SMTP (Simple Mail Transfer Protocol) - протокол, который задает набор правил для передачи почты. Сервер SMTP возвращает либо подтверждение о приеме, либо сообщение об ошибке, либо запрашивает дополнительную информацию.

TELNET - это протокол удаленного доступа. TELNET дает возможность абоненту работать на любой ЭВМ сети Интернет, как на своей собственной, то есть запускать программы, менять режим работы и так далее. На практике возможности лимитируются тем уровнем доступа, который задан администратором удаленной машины.

Режимы обмена данными

В протоколе большое внимание уделяется различным способам обмена данными между машинами различных архитектур. Действительно, чего только нет в Internet, от персоналок и Mac"ов до суперкомпьютеров. Все они имеют различную длину слова и многие различный порядок битов в слове. Кроме этого, различные файловые системы работают с разной организацией данных, которая выражается в понятии метода доступа.

В общем случае, с точки зрения FTP, обмен может быть поточный или блоковый , с кодировкой в промежуточные форматы или без нее, текстовый или двоичный.

При текстовом обмене все данные преобразуются в ASCII и в этом виде передаются по сети. Исключение составляют только данные IBM mainframe, которые по умолчанию передаются в EBCDIC, если обе взаимодействующие машины IBM.

Двоичные данные передаются последовательностью битов или подвергаются определенным преобразованиям в процессе сеанса управления.

При поточной передаче данных за одну сессию передается один файл данных, а при блоковом способе за одну сессию можно передать несколько файлов.

Описав в общих чертах протокол обмена, можно перейти к описанию средств обмена по протоколу FTP. Практически для любой платформы и операционной среды существуют как серверы, так и клиенты. Ниже описываются стандартные сервер и клиент Unix-подобных систем.

Специализированные менеджеры загрузки файлов

Для удобства пользователей многие серверы файловых архивов (freeware.ru, www.freesoft.ru, www.download.ru и др.) имеют Web-интерфейс, что позволяет работать с ними с использованием браузеров. Браузеры являются интегрированными системами для работы с различными информационными ресурсами Интернета и поэтому включают в себя менеджеры загрузки файлов.

Однако удобнее для работы с файловыми архивами использовать специализированные менеджеры загрузки файлов (например, FlashGet, GoIZilla, ReGet и др.), которые позволяют продолжить загрузку файла после разрыва соединения с сервером. Менеджеры загрузки файлов предоставляют пользователю подробную информацию в числовом и графическом виде о процессе загрузки файла (объем файла, объем загруженной части, в том числе в процентах, скорость загрузки, прошедшее и оставшееся время загрузки и др.)

По своей сути загрузка файла из Интернета – это копирование с одного компьютера на другой, только компьютер, с которого копируется файл, находится достаточно далеко от того, который этот файл принимает. По большому счету, такое копирование ничем особо не отличается от любого другого копирования, например, с компакт-диска на винчестер). При загрузке файла из Сети есть лишь несколько существенных различий: скорость такого копирования невысока, а его прерывание влечет повторение всего процесса с самого начала. Правда, касается это только загрузки с помощью браузера. Этот факт и привел в свое время к появлению специализированных программ – менеджеров закачек.

Специализированные менеджеры загрузки файлов (GolZilla, ReGet и др.) обладают гораздо большими возможностями по сравнению с менеджерами загрузки файлов, интегрированными в браузеры. В частности, они позволяют продолжить загрузку файла после разрыва соединения с сервером или подключения к Интернету, обеспечивают доступ к файлам как по FTP, так и по HTTP протоколам и т. д.

Filezilla является одним из наиболее удобных и эффективных менеджеров загрузки файлов и обеспечивает:

Загрузку файла, выбранного в браузере;

Поиск выбранного для загрузки файла по серверам файловых архивов и др.

FTP-клиенты

FTP-серверы - это серверы, с которыми может производиться обмен файлами по протоколу FTP. FTP-серверы по своему функциональному назначению могут являться как серверами файловых архивов, так и Web-серверами, на которых размещаются Web-сайты. С серверов файловых архивов производится загрузка файлов (Download) на локальный компьютер, и наоборот, на Web-серверы производится передача файлов (Upload) с локального компьютера в процессе публикации Web-сайтов. Обмен файлами (загрузка и передача) с серверами файловых архивов и Web-серверами производится с помощью специализированных программ - FTP-клиентов (например, FTP-клиент входит в состав файлового менеджера Total Commander).

Частными примерами использования FTP-клиента могут быть:

    публикация страниц сайта на Интернет-сервере Веб-разработчиком;

    скачивание музыки, программ и любых других файлов данных обычным пользователем Интернета.

Данный пример зачастую даже не осознаётся многими пользователями как использование FTP-клиента и протокола, так как многие публичные серверы не запрашивают дополнительных данных для аутентификации пользователей, а Интернет-браузеры (также являющиеся FTP-клиентами) осуществляют скачивание файлов без дополнительных вопросов.

Доступ к серверам файловых архивов для загрузки файлов на локальный компьютер обычно является анонимным и не требует ввода имени пользователя и пароля. Наоборот, доступ к Web-серверам с целью передачи файлов на удаленный сервер в процессе публикации Web-сайта требует идентификации пользователя, т. е. ввода имени пользователя и пароля.

FTP-клиент включает в себя Менеджер сайтов, позволяющий создать список серверов, с которыми планируется работа. Представляет в удобном для пользователя виде каталоги локального и удаленного компьютеров, обеспечивает продолжение загрузки файла после обрыва соединения и др. В процессе передачи файла отображается необходимая информация: процент переданного объема файла, скорость передачи, оставшееся время и др.

Off-line браузеры

Часть браузеров поддерживают, кроме онлайн-режима, когда браузер пытается получить страницы с веб-сервера, офлайн-режим, при котором можно просматривать сохранённые копии ранее посещённых страниц. Офлайн-режим полезен, когда по какой-либо причине нет соединения с Интернетом. Страницы либо неявно сохраняются в кэше браузера при посещении веб-сервера, либо браузер специально настраивается на сохранение и поддержание локальных копий определённых сайтов. Копии обновляются либо при восстановлении соединения, либо по расписанию. В качестве примера распространённого браузера, который поддерживает такую функциональность, можно назвать Internet Explorer. Существуют браузеры, которые специально спроектированы на преимущественную работу в офлайн-режиме - создании локальных копий веб-страниц и сайтов. Их называют офлайн-браузерами.

Все современные офлайн-браузеры, разумеется, поддерживают многопоточное скачивание и докачку после обрыва связи и умеют маскироваться под интернет-браузеры (это необходимо при скачивании информации с сайтов, в которых заблокирован доступ для офлайн-браузеров). Поэтому любое из рассматриваемых решений обеспечивает быстрое и надежное скачивание простых по структуре веб­сайтов. С HTTPS-сайтами сложнее, поскольку поддержка протокола HTTPS предусмотрена не во всех программах. Это же относится и к сайтам, требующим авторизации, - в большинстве офлайн-браузеров предусмотрена поддержка авторизации на базовом уровне, в то время как на сайтах могут быть реализованы более сложные схемы аутентификации (например, проверка подлинности на основе форм).

Еще один нюанс - уровень поддержки программами современных веб­технологий, который в разных офлайн-браузерах заметно различается. На практике это означает, что простые по структуре сайты без проблем закачиваются любым решением.



Список литературы

    Информатика и ИКТ. Базовый уровень: учебник для 10 класса / Н.Д.Угринович.- 7-е изд.- М. : БИНОМ. Лаборатория знаний, 2011.-212 с. : ил.

    Википедия – сводная энциклопедия [Электронный ресурс] // http:// ru.wikipedia.org.

    Школьные учебники - онлайн энциклопедия. Режим доступа: http://txtbooks.ru., свободный. – Загл. с экрана.

    PPt4Web - хостинг презентаций. Режим доступа: http://ppt4web.ru/, свободный. – Загл. с экрана.

    Вики-учебник для подготовки к ЕГЭ - онлайн энциклопедия. Режим доступа: http://indexletopisi.org.,свободный. – Загл. с экрана.

    Сетевые информационные технологии - хостинг презентаций. Режим доступа: http://5klass.net, свободный. – Загл. с экрана.

Серверы файловых архивов в операционной системе Windows.
Десятки тысяч серверов Интернета являются серверами файловых архивов, и на них хранятся сотни миллионов файлов различных типов (программы, драйверы устройств, графические и звуковые файлы и т. д.). Наличие таких серверов файловых архивов очень удобно для пользователей, так как многие необходимые файлы можно «скачать» непосредственно из Интернета.


Файловый архив Rapidshare.com позволяет каждому загрузить на сервер любой файл и получить ссылку для последующей его закачки.

Серверы файловых архивов, а также возможность «скачать» программу поддерживают многие компании - разработчики программного обеспечения и производители аппаратных компонентов компьютера и периферийных устройств. Размещаемое на таких серверах программное обеспечение является свободно распространяемым или условно бесплатным, и поэтому, «скачивая» тот или иной файл, пользователь не нарушает закон об авторских правах на программное обеспечение.

Менеджеры загрузки файлов.
В операционной системе Windows для удобства пользователей многие серверы файловых архивов (freeware.ru, www.freesoft.ru, www.download.ru и др.) имеют Web-интерфейс, что позволяет работать с ними с использованием браузеров. Браузеры являются интегрированными системами для работы с различными информационными ресурсами Интернета и поэтому включают в себя менеджеры загрузки файлов.

Однако удобнее для работы с файловыми архивами использовать специализированные менеджеры загрузки файлов, которые позволяют продолжить загрузку файла после разрыва соединения с сервером. Менеджеры загрузки файлов предоставляют пользователю подробную информацию в числовом и графическом виде о процессе загрузки файла (объем файла, объем загруженной части, в том числе в процентах, скорость загрузки, прошедшее и оставшееся время загрузки и др.).

В некоторых менеджерах загрузки файлов достигается увеличение скорости загрузки за счет разбиения файла на части и одновременной загрузки всех частей. Например, в менеджере загрузки файлов FlashGet процесс загрузки каждой части файла представляется в графической форме в нижней части окна приложения.

Адрес файла на сервере файлового архива.
Доступ к файлам на серверах файловых архивов возможен как по протоколу HTTP, так и по специальному протоколу передачи файлов FTP (File Transfer Protocol). Протокол FTP позволяет не только загружать файлы с удаленных серверов файловых архивов на локальный компьютер, но и наоборот, производить передачу файлов с локального компьютера на удаленный сервер.

Адрес файла включает в себя способ доступа к файлу и имя сервера Интернета, на котором нахо-дится файл.


Если в качестве способа доступа к файлу file.exe, хранящегося на сервере ftp.eict.ru, используется протокол пе-редачи файлов FTP, то адрес файла запишется следующим образом:
ftp://eict.ru/file.exe

Репозитарии программ в операционной системе Linux .
В операционной системе Linux компоненты самой системы и приложения хранятся в виде «пакетов» (расширение rpm), которые каждый пользователь может скачать и установить в своем варианте системы. То есть каждый пользователь компонует свою операционную систему Linux и ее приложения исходя из своих нужд и предпочтений, используя для этого набор пакетов в репозитариях.

В настоящее время, когда популярность World Wide Web достаточно велика, объем трафика передаваемого по сети Internet по протоколу FTP занимает тем не менее первое место, несколько опережая объем трафика по протоколу HTTP. В этом свете организация файловых архивов в рамках технологии TCP/IP является крайне актуальной задачей.

Архивы используют для решения разных задач, однако наиболее популярными в сети являются свободно доступные архивы или такие архивы, доступ к которым разрешен по анонимному идентификатору пользователя. Таким образом эти архивы можно использовать в качестве:

  • коллекции свободно распространяемого программного обеспечения;
  • коллекции программ для бета-тестирования;
  • коллекции нормативных и регламентных документов;
  • и т.п.

FTP-архив можно использовать и в качестве архива коммерческого программного обеспечения, которое используется в компании, только в этом случае такой архив не должен разрешать анонимного доступа к хранящимся в нем ресурсам.

Часто возможность авторизированного FTP-доступа используют и для обмена сообщениями, т.е. в качестве средства коммуникации. Это происходит обычно в том случае, когда система электронной почты по тем или иным причинам не работает.

В настоящее время всю систему взаимодействия компонентов FTP-обмена можно представить в виде схемы представленной на рисунке 4.1.

На этой схеме показано два важных технологических момента: во-первых, доступ к архиву можно осуществлять не только из специализированной программы-клиента, но и из универсального броузера, например Netscape Communicator или Microsoft Internet Explorer, а во-вторых, для поиска информации в FTP-архивах можно воспользоваться программой Archie.

Рис. 4.1. Схема взаимодействия компонентов FTP-обмена

При этом следует четко понимать, что Archie и FTP - это совершенно разные технологии. В большинстве случаев доступ к Archie-серверу пользователи осуществляют из Archie-клиента, который находится на той же машине, что и сервер, т.е. сначала пользователь по Telnet заходит как пользователь Archie, а потом использует программу-клиент (обычно она запускается в качестве оболочки) для доступа к Archie серверу.

Протокол FTP (File Transfer Protocol)

FTP (File Transfer Protocol или "Протокол Передачи Файлов") - один из старейших протоколов в Internet и входит в его стандарты. Обмен данными в FTP проходит по TCP-каналу. Построен обмен по технологии "клиент-сервер". На рисунке 4.2 изображена модель протокола.


Рис. 4.2. Модель протокола

В FTP соединение инициируется интерпретатором протокола пользователя. Управление обменом осуществляется по каналу управления в стандарте протокола TELNET. Команды FTP генерируются интерпретатором протокола пользователя и передаются на сервер. Ответы сервера отправляются пользователю также по каналу управления. В общем случае пользователь имеет возможность установить контакт с интерпретатором протокола сервера и отличными от интерпретатора пользователя средствами.

Команды FTP определяют параметры канала передачи данных и самого процесса передачи. Они также определяют и характер работы с удаленной и локальной файловыми системами.

Сессия управления инициализирует канал передачи данных. При организации канала передачи данных последовательность действий другая, отличная от организации канала управления. В этом случае сервер инициирует обмен данными в соответствии с параметрами, согласованными в сессии управления.

Канал данных устанавливается для того же host"а, что и канал управления, через который ведется настройка канала данных. Канал данных может быть использован как для приема, так и для передачи данных.

Возможна ситуация, когда данные могут передаваться на третью машину. В этом случае пользователь организует канал управления с двумя серверами и организует прямой канал данных между ними. Команды управления идут через пользователя, а данные напрямую между серверами (рисунок 4.3).

Канал управления должен быть открыт при передаче данных между машинами. В случае его закрытия передача данных прекращается.


Рис. 4.3. Соединение с двумя разными серверами и передача данных между ними

. Режимы обмена данными

В протоколе большое внимание уделяется различным способам обмена данными между машинами различных архитектур. Действительно, чего только нет в Internet, от персоналок и Mac"ов до суперкомпьютеров. Все они имеют различную длину слова и многие различный порядок битов в слове. Кроме этого, различные файловые системы работают с разной организацией данных, которая выражается в понятии метода доступа.

В общем случае, с точки зрения FTP, обмен может быть поточный или блоковый, с кодировкой в промежуточные форматы или без нее, текстовый или двоичный. При текстовом обмене все данные преобразуются в ASCII и в этом виде передаются по сети. Исключение составляют только данные IBM mainframe, которые по умолчанию передаются в EBCDIC, если обе взаимодействующие машины IBM. Двоичные данные передаются последовательностью битов или подвергаются определенным преобразованиям в процессе сеанса управления. Обычно, при поточной передаче данных за одну сессию передается один файл данных, а при блоковом способе за одну сессию можно передать несколько файлов.

Описав в общих чертах протокол обмена, можно перейти к описанию средств обмена по протоколу FTP. Практически для любой платформы и операционной среды существуют как серверы, так и клиенты. Ниже описываются стандартные сервер и клиент Unix-подобных систем.

Программное обеспечение доступа к FTP-архивам

Для работы с Ftp-архивами необходимо следующее программное обеспечение: сервер, клиент и поисковая программа. Сервер обеспечивает доступ к ресурсам архива из любой точки сети, клиент обеспечивает доступ пользователя к любому архиву в сети, а поисковая система обеспечивает навигацию во всем множестве архивов сети.

В разных операционных системах эти компоненты Ftp-обмена изменяются как по форме, так и по возможностям, но некоторые общие принципы остаются, кроме этого, программы, ориентированные на интерфейс командной строки, по большей части остаются неизменными в разных операционных средах.

Сервер протокола - программа ftpd

Команда ftpd предназначена для обслуживания запросов на обмен информацией по протоколу FTP. Сервер обычно стартует в момент загрузки компьютера. Синтаксис запуска сервера следующий:

Ftpd [-d] [-1] [-t timeout]

  • d - опция отладки;
  • 1 - опция автоматической идентификации пользователя;
  • t - время пассивного ожидания команд пользователя.

Каждый сервер имеет свое описание команд, которое можно получить по команде help. Автоматическая идентификация пользователей осуществляется при помощи файла /etc/passwd. Пароль пользователя не должен быть пустым.

Существует специальный файл, в котором содержатся запрещенные пользователи, т.е. те, кому обслуживание по протоколу FTP запрещено. Возможен вход в архив по идентификатору пользователя anonimous или ftp. В этом случае сервер принимает меры по ограничению доступа к ресурсам компьютера для данного пользователя. Обычно для таких пользователей создается специальная директория ftp, в которой размещают каталоги bin, etc и pub. В каталоге bin размещаются команды, разрешенные для использования, а в каталоге pub собственно сами файлы. Каталог etc закрыт для просмотра пользователем и в нем размещены файлы идентификации пользователей.

Программа обмена файлами - ftp

FTP - это интерфейс пользователя при обмене файлами по одноименному протоколу. Программа устанавливает канал управления с удаленным сервером и ожидает команд пользователя. Идентификатор удаленного сервера указывается либо аргументом программы, либо в команде интерфейса open.

Если команда ftp работает с пользователем и ожидает его команд, то на экране отображается приглашение "ftp>".

Синтаксис команды:

Ftp [-v][-d][-i][-n]

  • v - подавляет ответы сервера и статистику передачи данных;
  • n - управляет режимом идентификации пользователя. Если указан этот ключ, то сначала проверяется файл.netrc;
  • i - выключает подтверждения передачи файла при массовом копировании файлов;
  • d - включает режим отладки;
  • g - отключает прозрачность передачи имен.

В рамках данного курса нет возможности перечислить все команды ftp, поэтому остановимся только на самых необходимых.

Первой такой командой является команда open . По этой команде открывается сеанс работы с удаленным сервером:

Ftp>open polyn.net.kiae.su

После выдачи такой команды последуют запросы идентификации пользователя. Зарегистрировать пользователя можно и по команде user :

Ftp> user anonymous

В данном примере пользователь не имеет особых прав доступа на удаленном сервере и поэтому регистрируется как аноним. В ответ на запрос идентификации следует в этом случае ввести свой почтовый адрес. Обычно достаточно ввести что-то похожее на почтовый адрес для допуска к ресурсам архива, но бывают и дотошные серверы, которые проверяют наличие такого адреса, поэтому лучше никого не обманывать и честно регистрироваться.

Следующими по важности командами являются команды cd и ls (dir). Назначение этих команд достаточно прозрачно и понятно всем пользователям - навигация по дереву файловой системы и просмотр содержания каталогов. Здесь следует посоветовать пользоваться при просмотре каталогов командой ls с дополнительными параметрами:

Ftp>ls -FC

В этом случае пользователь может получить многоколоночный отчет с указанием типов файлов. Однако не все серверы отрабатывают эту комбинацию.

Архив - это файл, содержащий в себе один или несколько других файлов, а также метаданные . Архивы используются для объединения множества любых файлов в единый файл-контейнер с целью удобства хранения и переноса информации или просто чтобы сжать данные . Для создания архивов и работы с ними используются программы -архиваторы .

В архивах может сохраняться структура каталогов, присутствовать служебная информация для обнаружения и исправления ошибок, комментарии и другая информация. В зависимости от формата архива, данные в нём могут шифроваться с помощью пароля.

Применение

Архивы особенно полезны как способ упаковки данных файловой системы и метаданных в единый файл для его хранения в компьютере или для пересылки по каналам, которые поддерживают только пофайловую передачу, например для пересылки структуры каталогов по электронной почте.

Помимо целей архивирования, архивы часто используются для распространения пакетов программного обеспечения; в этом случае архив нередко называют дистрибутивным пакетом и к нему могут применяться дополнительные условия касательно содержимого (скажем, должен присутствовать файл манифеста). Примеры архивов-дистрибутивов: deb для Debian, JAR для Java, APK для Android.

Функциональные особенности

В зависимости от типа, архивы поддерживают объединение файлов в один, сжатие данных , шифрование , многотомность (архив из нескольких частей), контрольные суммы для проверки целостности содержимого архива, самораспаковку, самоустановку, информацию об исходном томе и носителе, информацию о структуре каталогов, примечания и комментарии, а также другие метаданные. Формат файла-архива определяется по расширению файла и/или по файловому заголовку. Для создания архивов используются программы -архиваторы , ПО для авторинга оптических дисков и программы для работы с образами дисков.

Форматы архивов

Формат архива - это файловый формат архивного файла. Существует множество форматов архивов, но лишь некоторые из них получили широкое признание и поддержку со стороны поставщиков ПО и пользовательских сообществ. Так, к числу наиболее популярных в среде Windows относятся ZIP, RAR, 7z, а в Mac OS - формат SIT.

Типы архивов

  • Только архивирующие форматы выполняют лишь слияние файлов в один (пример: tar).
  • Только сжимающие форматы выполняют лишь сжатие файлов (примеры: gzip , bzip2).
  • Многофункциональные форматы позволяют сливать файлы в один, сжимать их, зашифровывать, создавать информацию для обнаружения и исправления ошибок, оформлять архивы как самораспаковывающиеся для извлечения содержимого без участия дополнительного ПО (примеры: RAR , ZIP , ).
  • Дистрибутивные форматы используются для создания пакетов установки ПО , которые также могут быть самоинсталлируемыми файлами (примеры: JAR , APK , IPA).
  • Форматы дисковых образов используются для создания образов дисков , применяемых как тома хранения информации (примеры: ISO, NRG).

Подвиды архивов

Самораспаковывающиеся архивы

Самораспаковывающиеся архивы часто также называют SFX-архивами (от англ. SelF-eXtracting - самоизвлечение). В отличие от обычного архива, самораспаковывающийся архив имеет формат исполняемого файла (в Windows это файл с расширением.EXE), для извлечения данных из которого (а также нередко для тестирования и показа списка содержимого) не требуется отдельная программа - всё выполняется средствами самого SFX-архива. Иными словами, вы просто запаковываете информацию в SFX-архив, а получателю, которому она предназначена, нужно лишь запустить этот SFX-архив (в аналогичной ОС), чтобы получить разархивированную информацию. Примечание. В действительности SFX-архивы - это обычные архивы, к которым прикреплён небольшой исполняемый модуль-разархиватор, поэтому при необходимости (например, из-за опасения, что этот исполняемый модуль может быть заражен вирусом) для работы с SFX-архивом можно использовать соответствующий внешний архиватор, не запуская сам SFX-файл.

Многотомные архивы

Многотомные архивы - это архивы, состоящие из нескольких частей. Поддерживаются в ряде популярных форматов архивов - в RAR, ZIP, 7z и др. Чтобы создать многотомный архив, нужно при упаковке файлов просто выбирать размер частей, на которые будет разделён результирующий архив. Данная функция особенно удобна при работе с файлами большого размера (например, образами видеодисков), так как позволяет сохранять даже огромные и плохо сжимаемые файлы на носителях меньшего объёма. Некоторые архиваторы (например, RAR) имеют функцию автоматического определения размера каждого тома в зависимости от свободного объема на текущем носителе, используемом для архивирования, что позволяет максимально эффективно использовать многотомные архивы, скажем, для переноса с компьютера на компьютер на нескольких флэш-накопителях разного объёма.

Непрерывные архивы

Непрерывное (англ. - solid) архивирование - это разновидность архивирования, при котором все добавляемые в архив файлы рассматриваются архиватором как один непрерывный поток данных. Благодаря такому подходу удаётся добиться существенного увеличения степени сжатия, особенно при упаковке множества однотипных файлов сравнительно (с величиной «скользящего словаря» архиватора) небольшого размера. Помимо очевидного преимущества (более сильное сжатие) непрерывные архивы имеют и свои недостатки. Так как данные в непрерывном архиве - это один сплошной поток, то чтобы извлечь какой-либо файл, сначала нужно распаковать все файлы, которые находятся в архиве перед этим файлом, поэтому извлечение файлов, расположенных в конце архива, происходит медленнее. Также медленнее, чем в обычном (не solid) архиве, выполняются операции по изменению содержимого архива (добавление и удаление файлов). Кроме того, если архив по какой-то причине окажется повреждённым, то из него удастся извлечь только файлы, идущие до места повреждения, а вся информация после этого места окажется утерянной. Иными словами, непрерывные архивы хороши для упаковки и хранения данных, изменять которые требуется редко.

Метаданные

Архив почти всегда содержит метаданные. К ним относятся:

  • Имена файлов (кроме некоторых программ сжатия одиночных файлов - например, gzip, где имя файла - это имя архива без расширения)
  • Идентификаторы владельцев, групп, и т. п. файлов и их прав
  • Размеры файлов
  • Даты изменения, создания и последнего обращения к файлам
  • Контрольные суммы файлов для проверки правильности распаковки
  • Размер и контрольные суммы архива
  • Избыточные данные для восстановления данных при повреждении
  • Цифровая подпись создателя архива