HTTP协议详解-程序员宅基地

技术标签: Web开发  java  网络  http  


提示:以下是本篇文章正文内容,Java系列学习将会持续更新

一、HTTP工作过程

HTTP (全称为 “超文本传输协议”) 是一种应用非常广泛的应用层协议。

1.基于某个特定的传输层协议(TCP)之上
2.描述业务
3.非OS系统

当我们在浏览器中输入一个 “网址”, 此时浏览器就会给对应的服务器发送一个 HTTP 请求. 对方服务器收到这个请求之后, 经过计算处理, 就会返回一个 HTTP 响应。
在这里插入图片描述
事实上, 当我们访问一个网站的时候, 可能涉及不止一次的 HTTP 请求/响应 的交互过程。

回到目录…

二、HTTP 协议格式

请添加图片描述
注意: 为什么 HTTP 报文中要存在空行呢?

  • 因为 HTTP 协议并没有规定报头部分的键值对有多少个,使用空行就相当于是报文的结束标记或报文和正文之间的分隔符
  • HTTP 在传输层依赖 TCP 协议,TCP 是面向字节流的。如果没有这个空行,就会出现”粘包问题“

回到目录…

2-1 请求(Request)格式

在这里插入图片描述

2-1-1 URL格式

URL (Uniform Resource Locator 统一资源定位符),互联网上的每个文件都有一个唯一的URL,它包含的信息指出文件的位置以及浏览器应该怎么处理它。
请添加图片描述
URL的具体格式:

  1. 资源在哪台主机上——域名 (domain) 或者ip来体现一主机 (host)
  2. 和主机上的哪个进程去获取资源——端口 (port)
  3. 具体定位到是该进程管理的哪个资源——资源路径/路径 (path)
  4. URL设计之处,不仅仅为HTTP协议使用。所以需要标识出本次资源对应的协议(protocol / schema)
  5. 针对本次请求,除了资源本身之外的特殊要求。(查询字符串 query string、文档片段 fragment)

回到目录…

2-1-2 方法(method)

方法 说明 适用版本号
GET 获取资源 HTTP 1.0、HTTP 1.1
POST 传输实体主体 HTTP 1.0、HTTP 1.1
PUT 传输文件 HTTP 1.0、HTTP 1.1
HEAD 获得报文首部 HTTP 1.0、HTTP 1.1
DELETE 删除文件 HTTP 1.0、HTTP 1.1
OPTIONS 访问支持的方法 HTTP 1.1
TRACE 追踪路径 HTTP 1.1
CONNECT 要求用隧道协议连接代理 HTTP 1.1
LINK 建立和资源之间的联系 HTTP 1.1
UNLINE 断开连接关系 HTTP 1.1
2-1-2-1 GET 方法

GET 是最常用的 HTTP 方法,常用于获取服务器上的某个资源。

GET 请求的特点:

  • 首行里面的第一个部分就是 GET
  • URL 里面的 query string 可以为空,也可以不为空 %E8%9B%8B%E7%B3%95
  • GET 请求的 header 有若干个键值对结构
  • GET 请求的 body 一般是空的

GET 请求示例: 搜狗首页请求
在这里插入图片描述

2-1-2-2 POST 方法

POST 方法也是一种常见的方法,多用于提交用户输入的数据给服务器(如登录页面)。

POST 请求的特点:

  • 首行第一个部分就是 POST
  • URL 里面的 query string 一般是空的
  • POST 请求的 header 里面有若干个键值对
  • POST 请求的 body 一般不为空(body 的具体数据格式,由 header 中的 Content-Type 来描述; body 的具体数据长度,由 header 中的 Content-Length 来描述

POST 请求示例: QQ 邮箱登录请求
在这里插入图片描述
回到目录…

2-1-2-3 GET vs POST

我们平时构建发送的 GET/POST请求:

请求方法 构建方式
GET 1.地址栏输入url回车
2. 通过一些标签<img>;、<script><link>
3.还有一些标签<a><form>
4. ajax
5. 重定向(redirect)
POST 1. <form method="post">
2. ajax
3. 重定向(redirect)

面试题:GET 和 POST 的区别

  • GET 和 POST 其实没有本质区别,使用 GET 的场景完全可以使用 POST 代替,使用 POST 的场景一样可以使用 GET 代替。但是在具体的使用上,还是存在一些细节的区别

  • GET 习惯上会把客户端的数据通过 query string 来传输(body 部分是空的);POST 习惯上会把客户端的数据通过 body 来传输(query string 部分是空的)

  • GET 习惯上用于从服务器获取数据;POST 习惯上是客户端给服务器提交数据

  • 一般情况,程序员会把 GET 请求的处理,实现成“幂等”的;对于 POST 请求的处理,不要求实现成“幂等”

  • GET 请求可以被缓存,可以被浏览器保存到收藏夹中;POST 请求不能被缓存

回到目录…

2-1-3 协议头(header)

header 的整体格式是键值对结构,每个键值对占一行,键和值之间使用 冒号+空格 进行分割

key value
Host 表示服务器主机的地址和端口
Content-Length 表示 body 的数据长度,长度单位是字节
Content-Type 表示 body 的数据格式
User-Agent 表示浏览器或者操作系统的属性
Referer 表示这个页面是从哪个页面跳转过来的
Cookie 是浏览器提供的一种让程序员在本地存储数据的能力

Content-Type 有以下三种请求中的数据格式:

  • application/x-www-form-urlencoded

这是 form 表单提交的数据格式,此时 body 的格式就类似于 query string(是键值对的结构,键值对之间使用 & 分割,键与值之间使用 = 分割

  • multipart/form-data

这是 form 表单提交的数据格式(需要在 from 标签上加上 enctyped="multipart/form-data"),通常用于 HTML 提交图片或者文件

  • application/json

此时 body 数据为 json 格式,json 格式就是源自 js 的对象的格式。用一个 { } 括住,里面有多个键值对,键值对之间使用逗号分割,键和值之间使用冒号分割

回到目录…

2-2 响应(Response)格式

在这里插入图片描述

2-2-1 状态码

常见的状态码

常见状态码 说明
200 OK 这是一个最常见的状态码, 表示访问成功。抓包抓到的大部分结果都是 200
404 Not Found 没有找到资源。URL 标识的资源不存在, 那么就会出现 404
403 Forbidden 表示访问被拒绝。有的页面通常需要用户具有一定的权限才能访问(登陆后才能访问).。如果用户没有登陆直接访问, 就容易见到 403
405 Method Not Allowed 我们学习了 HTTP 中所支持的方法, 有 GET, POST, PUT, DELETE 等。但是对方的服务器不一定都支持所有的方法(或者不允许用户使用一些其他的方法).
500 Internal Server Error 服务器出现内部错误. 一般是服务器的代码执行过程中遇到了一些特殊情况(服务器异常崩溃)会产生这个状态码,一般很少见
504 Gateway Timeout 当服务器负载比较大的时候, 服务器处理单条请求的时候消耗的时间就会很长, 就可能会导致出现超时的情况
302 Move temporarily 临时重定向。在登陆页面中经常会见到 302. 用于实现登陆成功后自动跳转到主页
301 Moved Permanently 永久重定向。当浏览器收到这种响应时, 后续的请求都会被自动改成新的地址。301 也是通过 Location 字段来表示要重定向到的新地址

总结

类别 原因短语
1XX Informational (信息性状态码) 接受的请求正在处理
2XX Success (成功状态码) 请求正常处理完毕
3XX Redirection (重定向状态码) 需要进行附加操作以完成请求
4XX Client Error (客户端错误状态码) 服务器无法处理请求
5XX Server Error (服务器错误状态码) 服务器处理请求出错

回到目录…

2-2-2 协议头(header)

响应报头的基本格式和请求报头的格式基本一致。

下面介绍下响应报头的 Content-Type 参数

  • text/html

表示数据格式是 HTML

  • text/css

表示数据格式是 CSS

  • application/javascript

表示数据各式是 JavaScript

  • application/json

表示数据格式是 JSON

回到目录…

三、手写HTTP

3-1 HTTP客户端

import java.io.*;
import java.net.Socket;
// HTTP 客户端
public class HTTPClient {
    
    public static void main(String[] args) throws IOException {
    
        // 1. HTTP 客户端,要发送 HTTP 请求,先建立 TCP 连接
        // 我们当前进程和www.baidu.com主机上绑定 8080 端口的进程使用 TCP 通信(要求 建立 TCP 连接)
        Socket socket = new Socket("localhost", 80);

        OutputStream os = socket.getOutputStream();
        PrintWriter writer = new PrintWriter(new OutputStreamWriter(os, "UTF-8"));

        // 只有请求行,请求头为空,没有请求体
        String request = "GET / HTTP/1.0\r\n\r\n";
        writer.print(request);
        // 冲刷缓冲区
        writer.flush();

        // 读取百度返回的 HTTP 响应
        InputStream is = socket.getInputStream();
        byte[] buf = new byte[10240];    // 我们知道响应不会超过 1024 字节的
        int n = is.read(buf);
        String response = new String(buf, 0, n, "UTF-8");
        System.out.println(response);
    }
}

3-2 HTTP服务端

import java.io.IOException;
import java.io.OutputStream;
import java.io.OutputStreamWriter;
import java.io.PrintWriter;
import java.net.ServerSocket;
import java.net.Socket;
// HTTP 服务端
public class HTTPServer {
    
    public static void main(String[] args) throws IOException {
    
        // 我们使用短连接
        ServerSocket serverSocket = new ServerSocket(80);
        while (true) {
    
            try {
    
                Socket socket = serverSocket.accept();
                // 不管对方发给我们的 请求 是什么,一律使用统一的响应回复对方
                OutputStream os = socket.getOutputStream();
                PrintWriter writer = new PrintWriter(new OutputStreamWriter(os, "UTF-8"));
                String html = "<a href='https://www.baidu.com/'>百度一下</a>";   // 我们的响应体
                byte[] bytes = html.getBytes("UTF-8");
                int contentLength = bytes.length;
                String response = "HTTP/1.0 200 OK\r\n" +
                        "Content-Type: application/octet-stream; charset=utf-8\r\n" +
                        "Content-Length: 49\r\n" +
                        "\r\n" +
                        html;

                writer.print(response);
                writer.flush();

                socket.close();
            } catch (IOException exc) {
    
                exc.printStackTrace();
            }
        }
    }
}

回到目录…


总结:
提示:这里对文章进行总结:
以上就是今天的学习内容,本文是HTTP协议的学习,了解HTTP协议的工作过程,HTTP的请求和响应格式,以及如何手写HTTP服务器。之后的学习内容将持续更新!!!

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/qq15035899256/article/details/126103840

智能推荐

Spring Boot 获取 bean 的 3 种方式!还有谁不会?,Java面试官_springboot2.7获取bean-程序员宅基地

文章浏览阅读1.2k次,点赞35次,收藏18次。AutowiredPostConstruct 注释用于在依赖关系注入完成之后需要执行的方法上,以执行任何初始化。此方法必须在将类放入服务之前调用。支持依赖关系注入的所有类都必须支持此注释。即使类没有请求注入任何资源,用 PostConstruct 注释的方法也必须被调用。只有一个方法可以用此注释进行注释。_springboot2.7获取bean

Logistic Regression Java程序_logisticregression java-程序员宅基地

文章浏览阅读2.1k次。理论介绍 节点定义package logistic;public class Instance { public int label; public double[] x; public Instance(){} public Instance(int label,double[] x){ this.label = label; th_logisticregression java

linux文件误删除该如何恢复?,2024年最新Linux运维开发知识点-程序员宅基地

文章浏览阅读981次,点赞21次,收藏18次。本书是获得了很多读者好评的Linux经典畅销书**《Linux从入门到精通》的第2版**。下面我们来进行文件的恢复,执行下文中的lsof命令,在其返回结果中我们可以看到test-recovery.txt (deleted)被删除了,但是其存在一个进程tail使用它,tail进程的进程编号是1535。我们看到文件名为3的文件,就是我们刚刚“误删除”的文件,所以我们使用下面的cp命令把它恢复回去。命令进入该进程的文件目录下,1535是tail进程的进程id,这个文件目录里包含了若干该进程正在打开使用的文件。

流媒体协议之RTMP详解-程序员宅基地

文章浏览阅读10w+次,点赞12次,收藏72次。RTMP(Real Time Messaging Protocol)实时消息传输协议是Adobe公司提出得一种媒体流传输协议,其提供了一个双向得通道消息服务,意图在通信端之间传递带有时间信息得视频、音频和数据消息流,其通过对不同类型得消息分配不同得优先级,进而在网传能力限制下确定各种消息得传输次序。_rtmp

微型计算机2017年12月下,2017年12月计算机一级MSOffice考试习题(二)-程序员宅基地

文章浏览阅读64次。2017年12月的计算机等级考试将要来临!出国留学网为考生们整理了2017年12月计算机一级MSOffice考试习题,希望能帮到大家,想了解更多计算机等级考试消息,请关注我们,我们会第一时间更新。2017年12月计算机一级MSOffice考试习题(二)一、单选题1). 计算机最主要的工作特点是( )。A.存储程序与自动控制B.高速度与高精度C.可靠性与可用性D.有记忆能力正确答案:A答案解析:计算...

20210415web渗透学习之Mysqludf提权(二)(胃肠炎住院期间转)_the provided input file '/usr/share/metasploit-fra-程序员宅基地

文章浏览阅读356次。在学MYSQL的时候刚刚好看到了这个提权,很久之前用过别人现成的,但是一直时间没去细想, 这次就自己复现学习下。 0x00 UDF 什么是UDF? UDF (user defined function),即用户自定义函数。是通过添加新函数,对MySQL的功能进行扩充,就像使..._the provided input file '/usr/share/metasploit-framework/data/exploits/mysql

随便推点

webService详细-程序员宅基地

文章浏览阅读3.1w次,点赞71次,收藏485次。webService一 WebService概述1.1 WebService是什么WebService是一种跨编程语言和跨操作系统平台的远程调用技术。Web service是一个平台独立的,低耦合的,自包含的、基于可编程的web的应用程序,可使用开放的XML(标准通用标记语言下的一个子集)标准...

Retrofit(2.0)入门小错误 -- Could not locate ResponseBody xxx Tried: * retrofit.BuiltInConverters_已添加addconverterfactory 但是 could not locate respons-程序员宅基地

文章浏览阅读1w次。前言照例给出官网:Retrofit官网其实大家学习的时候,完全可以按照官网Introduction,自己写一个例子来运行。但是百密一疏,官网可能忘记添加了一句非常重要的话,导致你可能出现如下错误:Could not locate ResponseBody converter错误信息:Caused by: java.lang.IllegalArgumentException: Could not l_已添加addconverterfactory 但是 could not locate responsebody converter

一套键鼠控制Windows+Linux——Synergy在Windows10和Ubuntu18.04共控的实践_linux 18.04 synergy-程序员宅基地

文章浏览阅读1k次。一套键鼠控制Windows+Linux——Synergy在Windows10和Ubuntu18.04共控的实践Synergy简介准备工作(重要)Windows服务端配置Ubuntu客户端配置配置开机启动Synergy简介Synergy能够通过IP地址实现一套键鼠对多系统、多终端进行控制,免去了对不同终端操作时频繁切换键鼠的麻烦,可跨平台使用,拥有Linux、MacOS、Windows多个版本。Synergy应用分服务端和客户端,服务端即主控端,Synergy会共享连接服务端的键鼠给客户端终端使用。本文_linux 18.04 synergy

nacos集成seata1.4.0注意事项_seata1.4.0 +nacos 集成-程序员宅基地

文章浏览阅读374次。写demo的时候遇到了很多问题,记录一下。安装nacos1.4.0配置mysql数据库,新建nacos_config数据库,并根据初始化脚本新建表,使配置从数据库读取,可单机模式启动也可以集群模式启动,启动时 ./start.sh -m standaloneapplication.properties 主要是db部分配置## Copyright 1999-2018 Alibaba Group Holding Ltd.## Licensed under the Apache License,_seata1.4.0 +nacos 集成

iperf3常用_iperf客户端指定ip地址-程序员宅基地

文章浏览阅读833次。iperf使用方法详解 iperf3是一款带宽测试工具,它支持调节各种参数,比如通信协议,数据包个数,发送持续时间,测试完会报告网络带宽,丢包率和其他参数。 安装 sudo apt-get install iperf3 iPerf3常用的参数: -c :指定客户端模式。例如:iperf3 -c 192.168.1.100。这将使用客户端模式连接到IP地址为192.16..._iperf客户端指定ip地址

浮点性(float)转化为字符串类型 自定义实现和深入探讨C++内部实现方法_c++浮点数 转 字符串 精度损失最小-程序员宅基地

文章浏览阅读7.4k次。 写这个函数目的不是为了和C/C++库中的函数在性能和安全性上一比高低,只是为了给那些喜欢探讨函数内部实现的网友,提供一种从浮点性到字符串转换的一种途径。 浮点数是有精度限制的,所以即使我们在使用C/C++中的sprintf或者cout 限制,当然这个精度限制是可以修改的。比方在C++中,我们可以cout.precision(10),不过这样设置的整个输出字符长度为10,而不是特定的小数点后1_c++浮点数 转 字符串 精度损失最小

推荐文章

热门文章

相关标签