Http протокол на языке html. Большой размер сообщений. Общая структура сообщений

В «сердце» web находится протокол передачи гипертекста (HTTP), являющийся протоколом прикладного уровня. Описание HTTP можно найти в RFC 1945 и RFC 2616. Протокол HTTP реализуется с помощью двух программ: клиента и сервера, которые, находясь на разных оконечных системах, обмениваются HTTP-сообщениями. Порядок обмена и содержание сообщений описаны в протоколе. Перед тем как углубиться в изучение HTTP, сначала освоим терминологию, используемую в контексте web.

Каждая web-страница, или документ, состоит из объектов. Объект представляет собой обычный файл в формате HTML, изображение в формате JPEG или GIF, Java-апплет, аудиоклип и т. п., то есть единицу, обладающую собственным универсальным указателем ресурса (Uniform Resource Locator, URL). Как правило, web-страницы состоят из базового HTML-файла и объектов, на которые он ссылается. Так, если web-страница включает базовый HTML-файл и пять изображений, то она состоит из шести объектов. Ссылки на объекты, относящиеся к web-странице, представляют собой URL-адреса, включенные в базовый HTML-файл. URL состоит из двух частей: имени хоста сервера, на котором находится объект, и пути к объекту. Так, например, для URL _www.someSchool.edu/someDepartment/picture.gif именем хоста является фрагмент _www.someSchool.edu, а путем к объекту - фрагмент someDepartment/picture.gif.

Браузером называется агент пользователя web; он отображает web-страницы, а также выполняет множество дополнительных служебных функций. Кроме того, браузеры представляют клиентскую сторону протокола HTTP. Таким образом, термины «браузер» и «клиент» в контексте web будут употребляться как эквивалентные. В число наиболее популярных браузеров входят Netscape Navigator и Microsoft Internet Explorer.

Web-сервер содержит объекты, каждый из которых идентифицируется своим URL-адресом. Кроме того, web-серверы представляют серверную сторону протокола HTTP. К наиболее популярными web-серверам следует отнести Apache и Microsoft Internet Information Server.

Протокол HTTP определяет, каким образом клиенты (например, браузеры) запрашивают web-страницы, а серверы осуществляют передачу этих страниц. Более подробный разговор о взаимодействии клиента и сервера мы проведем позднее, однако основную идею можно понять из рис. 2.4. Когда пользователь запрашивает web-страницу (например, совершает щелчок на гиперссылке), браузер посылает серверу HTTP-запрос объектов, составляющих web-страницу. Сервер получает запрос и высылает ответные сообщения, содержащие требуемые объекты. В 1997 году практически все web-браузеры и web-серверы стали поддерживать протокол HTTP версии 1.0, описанный в документе RFC 1945. В 1998 году начался переход к версии 1.1, которая была описана в документе RFC 2616. Версия 1.1 имеет обратную совместимость с версией 1.0, то есть любой сервер или браузер, использующий версию 1.1, может в полной мере взаимодействовать с браузером или сервером, поддерживающим версию 1.0.

Как HTTP 1.0, так и HTTP 1.1 используют TCP в качестве протокола транспортного уровня. HTTP-клиент сначала устанавливает ТСР-соединение с сервером, а после создания соединения клиент и сервер начинают взаимодействовать с протоколом TCP через интерфейс сокетов. Как было сказано ранее, сокеты представляют собой «двери» между процессами и протоколом транспортного уровня.

Клиент посылает запросы и принимает ответы через свой интерфейс сокетов, а сервер использует интерфейс сокетов для получения запросов и их выполнения. После того как web-запрос минует сокет клиента, он оказывается «в руках» протокола TCP. Вспомним, что одной из функций протокола TCP является обеспечение надежной передачи данных; это означает, что каждый запрос, посылаемый клиентом, и каждый ответ сервера доставляются в виде, точно соответствующем отправленному. Здесь проявляется одно из достоинств многоуровневой коммуникационной модели: протоколу HTTP не нужно контролировать надежность передачи и обеспечивать повторную передачу пакетов при искажениях. Вся «черновая» работа будет проделана протоколом TCP и протоколами более низких уровней.

Необходимо отметить, что после завершения обслуживания клиентов сервер не сохраняет о них никакой информации. Если, например, какой-либо клиент сделает два запроса одного и того же ресурса подряд, сервер выполнит их, не выдав клиенту никакого оповещения о дублирующем запросе. Говорят, что протокол HTTP является протоколом без запоминания состояния (stateless protocol) соединения.

Протокол HTTP или HyperText Transfer Protocol это главный прокол (всемирной паутины). Основная задача протокола, обеспечить передачу гипертекста в сети. В протоколе точно описывается формат сообщений, для обмена клиентов и серверов.

Описан протокол HTTP в RFC 2616(HTTP1.1).

Основа протокола обеспечить взаимодействие клиента и сервера по средством одного ASCII-запроса, и следующего на него ответа в стандарте RFC 822 MIME.

На практике протокол HTTP работает на основе порт 80, но можно настроить и по-другому. И хоть TCP/IP не является обязательным, он остается предпочтительным, так как берет на себя разбиение и сборку сообщений на себя и не «напрягает» ни браузер, ни сервер.

Следует отметить, что протокол HTTP может использоваться не только в веб-технологиях, но и других ООП приложениях (объективно-ориентированных).

URL

Основой веб-общения клиент-сервер является запрос. Запрос отправляется при помощи URL– единого указателя ресурсов Интернет. Напомню, что такое URL адрес.

Понятная и простая структура URL состоит из следующих элементов:

Протокол;
Хост;
Порт;
Каталок ресурса;
Метки (Запрос).

Примечание: Протокол http это протокол для простых, не защищенных соединений. Защищенные соединения работают по протоколу https. Он более безопасен для обмена данными.

Методы HTTP запросов

Один из параметров URL, определяет название хоста, с которым мы хотим общаться. Но этого мало. Нужно определить действие, которое нужно совершить. Сделать это можно при помощи метода определенного протоколом HTTP.

Методы HTTP

Метод/Описание
HEAD/Прочитать заголовок веб-страницы
GET/Прочитать веб-страницу
POST/Добавить к веб-странице
PUT/Сохранить веб-страницу
TRACE/Отослать назад запрос
DELETE/Удалить веб-страницу
OPTIONS/Отобразить параметры
CONNECT/Зарезервировано для будущего использования

Разберем методы HTTP подробнее

Метод GET. запрашивает страницу (файл, объект), закодированную по стандарту MIME. Это самый употребляемый метод. Структура метода:
GET имя_файла HTTP/1.1

Метод HEAD. Этот метод запрашивает заголовок сообщения. При этом страница не загружается. Этот метод позволяет узнать время последнего обновления страницы, что нужно для управления КЭШем страниц. Этот метод позволяет проверить работоспособность запрашиваемого URL.

Метод PUT. Этот метод может поместить страницу на сервер. Тело запроса PUT включает размещаемую страницу, которая закодирована по MIME. Это метод требует идентификации клиента.

Метод POST. Этот метод добавляет содержимое к уже имеющейся странице. Используется, как пример, для добавления записи на форум.

Метод DELETE. Этот метод уничтожает страницу. Метод удаления требует подтверждения прав пользователя на удаление.

Метод TRACE. Этот метод отладки. Он указывает серверу отослать запрос назад и позволяет узнать, искажается или нет, запрос клиента, вернувшись от сервера.

Метод CONNECT – метод резерва, не используется.

Метод OPTIONS позволяет запросить свойства сервера и свойства любого файла.

В общении клиента и сервера «запрос-ответ», сервер обязательно генерирует ответ. Это может быть веб-страница или строку состояния с кодом состояния. Код состояния вам хорошо известен. Один из кодов известный код 404 –Страница не найдена.

Группы кодов состояния

1хх: Готовность сервера, Код 100 – сервер готов обрабатывать запросы клиента;

2хх: Успех.

Код 200 – запрос обработан успешно;
Код 204 – Содержимого нет.

3хх: Перенаправление.

Код 301 – Запрашиваемая страница перенесена;
Код 304 – Страница в КЭШе еще актуальна.

4хх: Ошибка клиента.

В эпоху повсеместного использования интернета, особую распространенность получили вирусы, которые устанавливаются в браузер. На нашем ресурсе можно найти несколько статей о таких вредоносных программах, но особо в их ряду выделяется Time to Read. Данный вирус может проникнуть на компьютер невнимательного пользователя и сильно испортить удовольствие от работы с браузером. Пользователь будет видеть рекламу, его начнет постоянно переносить на сайт Time to Read, и возникнут многие другие проблемы, впрочем, обо всем по порядку.

Как и большинство троянских вирусов, Time to Read выполняет простую задачу – показать пользователю максимальное количество рекламы, чтобы создатели программы получили деньги за ее трансляцию, клики по ней и переводы на сайты-партеры. Чаще всего услугами продвижения своих сайтов при помощи вирусов пользуются мошеннические ресурсы или страницы, которые заражены чем-то более серьезным, чем рекламный троян.

Вирус Time to Read после попадания на компьютер проявляет себя следующими «симптомами»:

На сайтах постоянно всплывает дополнительная реклама, в том числе и pop-up баннеры, которые полностью загораживают контент до клика по ним;
Настройки безопасности компьютера подвергаются изменениям, что опасно для компьютера, который имеет постоянное подключение к интернету;
Стартовая страница всех браузеров автоматически меняется на сайт Time to Read, который стремится позиционировать себя в качестве поиска и новостного ресурса;
Автоматическая переадресация на сторонние ресурсы. Важно: с неизвестного сайта, на который пользователь может быть переадресован вирусом Time to Read, велик риск загрузки на компьютер других вирусов.

Если вы заметили на компьютере обозначенные выше симптомы, значит, ваш компьютер заражен вирусом Time to Read. Необходимо его срочно удалить, чтобы избежать более серьезных проблем, к которым он может привести.

Чтобы убрать вирус Time to Read с компьютера, потребуется предварительно загрузить и установить две программы: AdwCleaner и CCleaner. Данные приложения помогут в автоматическом режиме справиться с вирусом, и пользователю останется выполнить лишь самые простые задачи в «ручном» режиме.

Процесс удаления вируса Time to Read с компьютера проходит следующим образом:

Первым делом необходимо удалить с компьютера все временные файлы, чтобы вирусная программа не могла восстановиться после удаления. Для этого перейдите в соответствующие разделы:

На Windows 7: {Системный диск}:\Users\Имя пользователя\AppData\Local\Temp На Windows 10: {Системный диск}:\Users\Администратор\AppData\Local\Temp

Не стоит действовать выборочно, удалить необходимо все файлы, которые содержатся в папке Temp, поскольку каждый из них может быть опасен.

Обратите внимание, что выполнять сброс КЭШа распознавателя необходимо с профиля администратора.

Как установить и правильно настроить CCleaner:

На этом удаление вируса Time to Read с компьютера можно считать завершенным. Рекомендуем до начала работы с браузером перезагрузить компьютер.

Чаще всего вирус Time to Read попадает на компьютер пользователя по его неосторожности. Несколько базовых рекомендаций, которые помогут значительно снизить риск заражения компьютера данным трояном:

Скачивайте программы в интернете только с проверенных сайтов. Если приложение распространяется свободно, лучше загрузить его с сайта разработчиков;
При установке программ следите внимательно за всеми «галочками» в установщике. Часто под «полной установкой программы» ее разработчики понимают инсталляцию приложения с партнерским софтом, который может быть вирусным. Также рекомендуем знакомиться с пользовательским соглашением, в котором может быть обозначено, что по умолчанию на компьютер установится та или иная партнерская программа;
Не загружайте из интернета программы от неизвестных разработчиков, которые обещают невероятную функциональность.

Соблюдая простые правила, описанные выше, можно существенно снизить риск заражения компьютера вирусом Time to Read, который способен доставить массу хлопот.