Linux:httpd服务(一)_httpd 静态文件-程序员宅基地

技术标签: Linux服务  httpd  

Socket套接字:IP和端口的组合

HTTP

  • http:Hyper text transfer protocol 超文本(包含连接的文件,点击地址会跳转到令一个资源)传输协议
    端口:80/TCP 主要传输html编码的数据
    http是应用层协议,基于传输层的tcp协议传输
  • html:Hyper text markup language 超文本标记语言,编程语言
    html示例
    <html>
     <head>
          <title>html语言</title>
     </head>
     </body>
          <img src="http://www.dushan.com/bixin/2018101017/dadda.png">
          <h1>欢迎</h1>
          <p><a href=http://www.dushan.com>达达</a>哈哈</p>
     </body>
    </html>
    
  • CSS:Cascading Style Sheet 层叠样式表
  • js :JavaScript引擎,为浏览器的一部分,广泛用于客户端的脚本语言,用来给HTML网页增加动态功能。

static:客户端请求什么,服务端发送什么
dynamic:客户端请求什么,服务端代码运行一遍,把发送结果

了解:RESTful API

HTTP协议介绍

  • http/0.9 1991原型版本
    只有一个命令GET,GET /index.html ,服务器只能回应HTML格式字符串,不能回应别的格式

  • http/1.0 1996年5月 支持cache,MIME,method
    1、每个TCP连接只能发送一个请求,发送数据完毕,连接关闭,再发送其他资源,重新建立新链接。
    2、引用了POST命令和HEAD命令
    3、头信息是ASCII码,后面数据可为任何格式,服务器回应是会告诉客户端,数据是什么格式,即content-type字段作用,这些数据类型总称为MIME多用途互联网邮件扩展,每个值包括一级类型和二级类型,预定义的类型,也可自定义类型,常见的major/minor;text/xml,text/html;images/jpg,images/png。可传输图片音频多媒体信息。
    例:数据+元数据(表示类型)
    123数值表示 7位二进制可以表示
    123字符串表示 3个8位需24位表示

  • http/1.1 1997年1月
    1、引入持久连接,不用声明connection:keep-alive,对于同一域名,大多数浏览器运输同时建立6个持久连接。
    2、引入管道机制,同一个TCP连接里,客户端可以同时发送多个请求。
    3、新增方法PUT、PATCH、OPTIONS、DELETE
    4、同一个TCP连接里,所有的数据通信是按次序进行的。服务器只能顺序处理回应,前面的回应慢,会有许多请求排队,造成"队头堵塞"(Head-of-line blocking)
    5、为避免上述问题,两种方法:一是减少请求数,二是同时多开持久连接。网页优化技巧,如合并脚本和样式表、将图片嵌入CSS代码、域名分片(domain sharding)等
    6、HTTP 协议不带有状态,每次请求都必须附上所有信息。请求的很多字段都是重复的,浪费带宽,影响速度

  • http/2.0:2015年
    Spdy:2009年,谷歌研发,解决HTTP/1.1 效率不高问题
    1、头信息和数据体都是二进制,称为头信息帧和数据帧
    复用TCP连接,在一个连接里,客户端和浏览器都可以同时发送多个请求或回应,且不用按顺序一一对应,避免了“队头堵塞“,此双向的实时通信称为多工(Multiplexing)
    2、引入头信息压缩机制(header compression),头信息使用gzip或compress压缩后再发送;客户端和服务器同时维护一张头信息表,所有字段都会存入这个表,生成一个索引号,不发送同样字段,只发送索引号,提高速度
    3、HTTP/2 允许服务器未经请求,主动向客户端发送资源,即服务器推送(server push)

HTTP工作机制

  • 工作机制:
    http请求:http request
    http响应:http response
    一次http事务:请求<-->响应

  • Web资源:web resource(Web Resource-URI-URL每个资源都需要单独请求)
    一个网页由多个资源构成,打开一个页面,会有多个资源展示出来,但是每个资源都要单独请求。因此,一个“Web 页面”通常并不是单个资源,而是一组资源的集合
    1、静态文件:无需服务端做出额外处理
    文件后缀:.html, .txt, .jpg, .js, .css, .mp3, .avi
    2、动态文件:服务端执行程序,返回执行的结果
    文件后缀:.php, .jsp,.asp

  • 提高HTTP连接性能
    1、并行连接:通过多条TCP连接发起并发的HTTP请求 1.1支持
    2、持久连接:keep-alive,长连接,重用TCP连接,以消除连接和关闭的时延,以事务个数和时间来决定是否关闭连接 1.1支持
    3、管道化连接:通过共享TCP连接发起并发的HTTP请求 2.0支持
    4、复用的连接:交替传送请求和响应报文(实验阶段) 2.0支持

URI

  • URI: Uniform Resource Identifier 统一资源标识,分为URL和URN
    1、URN: Uniform Resource Naming,统一资源命名
    示例:P2P下载使用的磁力链接是URN的一种实现
    magnet:?xt=urn:btih:660557A6890EF888666
    2、URL: Uniform ResorceLocator,统一资源定位符,用于描述某服务器某特定资源位置
    3、两者区别:URN如同一个人的名称,而URL代表一个人的住址。换言之,URN定义某事物的身份,而URL提供查找该事物的方法。URN仅用于命名,而不指定地址

  • URL组成

    <scheme>://<user>:<password>@<host>:<port>/<path>;<params>?<query>#<frag>
    

    1、scheme:方案,访问服务器以获取资源时要使用哪种协议

    2、user:用户,某些方案访问资源时需要的用户名

    3、password:密码,用户对应的密码,中间用:分隔

    4、Host:主机,资源宿主服务器的主机名或IP地址

    5、port:端口,资源宿主服务器正在监听的端口号,很多方案有默认端口号

    6、path:路径,服务器资源的本地名,由一个/将其与前面的URL组件分隔 (docroot)

    7、params:参数,指定输入的参数,参数为名/值对,多个参数,用;分隔

    8、query:查询,传递参数给程序,如数据库,用?分隔,多个查询用&分隔

    9、frag:片段,一小片或一部分资源的名字,此组件在客户端使用,用#分隔

网站访问量

  • IP(独立IP):即Internet Protocol,指独立IP数。一天内来自相同客户机IP地址只计算一次,记录远程客户机IP地址的计算机访问网站的次数,是衡量网站流量的重要指标

  • PV(访问量):即Page View, 页面浏览量或点击量,用户每次刷新即被计算一次,PV反映的是浏览某网站的页面数,PV与来访者的数量成正比,PV并不是页面的来访者数量,而是网站被访问的页面数量

  • UV(独立访客):即Unique Visitor,访问网站的一台电脑为一个访客。一天内相同的客户端只被计算一次。可以理解成访问某网站的电脑的数量。网站判断来访电脑的身份是通过来访电脑的cookies实现的。如果更换了IP后但不清除cookies,再访问相同网站,该网站的统计中UV数是不变的

  • 网站统计:http://www.alexa.cn/rank/

  • QPS:request per second,每秒请求数

  • PV,QPS,并发连接数换算公式

    1、QPS= PV* 页⾯衍⽣连接次数/ 统计时间(86400)
    2、并发连接数=QPS* http平均响应时间
    3、峰值时间:每天80%的访问集中在20%的时间里,这20%时间为峰值时间
    4、峰值时间每秒请求数(QPS)=( 总PV数*页面衍生连接次数)*80% ) / ( 每天秒数* 20% )
    

一次完整的HTTP请求处理过程

1、建立连接
接收或拒绝连接请求

2、接收请求
接收客户端请求报文中对某资源的一次请求的过程
Web访问响应模型(Web I/O)

单进程I/O模型:启动一个进程处理用户请求,而且一次只处理一个,多个请求被串行响应
多进程I/O模型:并行启动多个进程,每个进程响应一个连接请求
复用I/O结构:启动一个进程,同时响应N个连接请求
实现方法:多线程模型和事件驱动
多线程模型:一个进程生成N个线程,每线程响应一个连接请求
事件驱动:一个进程处理N个请求
复用的多进程I/O模型:启动M个进程,每个进程响应N个连接请求,同时接收M*N个请求

3、处理请求
服务器对请求报文进行解析,并获取请求的资源及请求方法等相关信息,根据方法,资源,首部和可选的主体部分对请求进行处理
元数据:请求报文首部

请求报文分三部分
第一部分star line: 客户端用什么方式(GET、POST、HEAD、PUT、DELETE、TRACE、OPTIONS)请求哪个资源,并且http是哪个版本
第二部分HEADERS:格式name:value
第三部分body:

4、访问资源
服务器获取请求报文中请求的资源web服务器,即存放了web资源的服务器,负责向请求者提供对方请求的静态资源,或动态运行后生成的资源
资源放置于本地文件系统特定的路径:DocRoot
DocRoot>/var/www/html
/var/www/html/images/logo.jpg

web服务器资源路径映射方式:
(a) docroot
(b) alias
(c) 虚拟主机docroot
(d) 用户家目录docroot

5、构建响应报文:
一旦Web服务器识别除了资源,就执行请求方法中描述的动作,并返回响应报文。响应报文中包含有响应状态码、响应首部,如果生成了响应主体的话,还包括响应主体

1)响应实体:如果事务处理产生了响应主体,就将内容放在响应报文中回送过去。响应报文中通常包括:
描述了响应主体MIME类型的Content-Type首部
描述了响应主体长度的Content-Length
实际报文的主体内容
2)URL重定向:web服务构建的响应并非客户端请求的资源,而是资源另外一个访问路径
永久重定向:http://www.360buy.com
临时重定向:http://www.taobao.com
3)MIME类型:
Web服务器要负责确定响应主体的MIME类型。多种配置服务器的方法可将MIME类型与资源管理起来
魔法分类:Apache web服务器可以扫描每个资源的内容,并将其与一个已知模式表(被称为魔法文件)进行匹配,以决定每个文件的MIME类型。这样做可能比较慢,但很方便,尤其是文件没有标准扩展名时
显式分类:可以对Web服务器进行配置,使其不考虑文件的扩展名或内容,强制特定文件或目录内容拥有某个MIME类型
类型协商:有些Web服务器经过配置,可以以多种文档格式来存储资源。在这种情况下,可以配置Web服务器,使其可以通过与用户的协商来决定使用哪种格式(及相关的MIME类型)"最好"

6、发送响应报文
Web服务器通过连接发送数据时也会面临与接收数据一样的问题。服务器可能有很多条到各个客户端的连接,有些是空闲的,有些在向服务器发送数据,还有一些在向客户端回送响应数据。服务器要记录连接的状态,还要特别注意对持久连接的处理。对非持久连接而言,服务器应该在发送了整条报文之后,关闭自己这一端的连接。对持久连接来说,连接可能仍保持打开状态,在这种情况下,服务器要正确地计算Content-Length首部,不然客户端就无法知道响应什么时候结束了

7、记录日志
最后,当事务结束时,Web服务器会在日志文件中添加一个条目,来描述已执行的事务

HTTP服务器应用

  • http服务器程序
    1、httpd apache
    2、nginx 现也已支持lua
    3、lighttpd 最早支持lua脚本动态引擎配置

  • 应用程序服务器
    1、IIS .asp
    2、tomcat .jsp
    3、jetty 开源的servlet容器,基于Java的web容器
    4、Resin CAUCHO公司,支持servlets和jsp的引擎
    5、webshpere(IBM), weblogic(BEA), jboss,oc4j(Oracle)

  • 市场占有率统计 www.netcraft.com

Httpd介绍

  • httpd (d:doemon守护进程)
    20世纪90年代初,国家超级计算机应用中心NCSA开发
    1995年开源社区发布apache(后解散由社区等人维护 a patchy server,有bug就打补丁,所以叫充满补丁的服务)
    ASF: apache software foundation apache软件基金会
    FSF:Free Software Foundation 自由软件基金会

  • 特性:
    1、高度模块化:core + modules
    2、DSO: Dynamic Shared Object 动态加/卸载
    3、MPM:multi-processing module多路处理模块

MPM工作模式

1、prefork:多进程I/O模型,每个进程响应一个请求,默认模型
一个主进程:生成和回收n个子进程,创建套接字,不响应请求
多个子进程:工作work进程,每个子进程处理一个请求;系统初始时,预先生成多个空闲进程,等待请求,最大不超过1024个

2、worker:复用的多进程I/O模型,多进程多线程,IIS使用此模型
一个主进程:生成m个子进程,每个子进程负责生个n个线程,每个线程响应一个请求,并发响应请求:m*n

3、event:事件驱动模型(worker模型的变种)
一个主进程:生成m个子进程,每个进程直接响应n个请求,并发响应请求:m*n,有专门的线程来管理这些keep-alive类型的线程,当有真实请求时,将请求传递给服务线程,执行完毕后,又允许释放。这样增强了高并发场景下的请求处理能力

httpd功能特性

1、虚拟主机 (每一个站点靠一个主机来服务)
支持三种类型主机:
IP(不同的IP服务于不同的站点)
Port(不同的端口服务于不同的站点)
FQDN(不同的主机名来映射不同的站点)

2、CGI:Common Gateway Interface,通用网关接口

3、反向代理

4、负载均衡

5、路径别名

6、丰富的用户认证机制
basic 要素
digest 摘要

7、支持第三方模块

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/weixin_40001704/article/details/83155680

智能推荐

攻防世界_难度8_happy_puzzle_攻防世界困难模式攻略图文-程序员宅基地

文章浏览阅读645次。这个肯定是末尾的IDAT了,因为IDAT必须要满了才会开始一下个IDAT,这个明显就是末尾的IDAT了。,对应下面的create_head()代码。,对应下面的create_tail()代码。不要考虑爆破,我已经试了一下,太多情况了。题目来源:UNCTF。_攻防世界困难模式攻略图文

达梦数据库的导出(备份)、导入_达梦数据库导入导出-程序员宅基地

文章浏览阅读2.9k次,点赞3次,收藏10次。偶尔会用到,记录、分享。1. 数据库导出1.1 切换到dmdba用户su - dmdba1.2 进入达梦数据库安装路径的bin目录,执行导库操作  导出语句:./dexp cwy_init/[email protected]:5236 file=cwy_init.dmp log=cwy_init_exp.log 注释:   cwy_init/init_123..._达梦数据库导入导出

js引入kindeditor富文本编辑器的使用_kindeditor.js-程序员宅基地

文章浏览阅读1.9k次。1. 在官网上下载KindEditor文件,可以删掉不需要要到的jsp,asp,asp.net和php文件夹。接着把文件夹放到项目文件目录下。2. 修改html文件,在页面引入js文件:<script type="text/javascript" src="./kindeditor/kindeditor-all.js"></script><script type="text/javascript" src="./kindeditor/lang/zh-CN.js"_kindeditor.js

STM32学习过程记录11——基于STM32G431CBU6硬件SPI+DMA的高效WS2812B控制方法-程序员宅基地

文章浏览阅读2.3k次,点赞6次,收藏14次。SPI的详情简介不必赘述。假设我们通过SPI发送0xAA,我们的数据线就会变为10101010,通过修改不同的内容,即可修改SPI中0和1的持续时间。比如0xF0即为前半周期为高电平,后半周期为低电平的状态。在SPI的通信模式中,CPHA配置会影响该实验,下图展示了不同采样位置的SPI时序图[1]。CPOL = 0,CPHA = 1:CLK空闲状态 = 低电平,数据在下降沿采样,并在上升沿移出CPOL = 0,CPHA = 0:CLK空闲状态 = 低电平,数据在上升沿采样,并在下降沿移出。_stm32g431cbu6

计算机网络-数据链路层_接收方收到链路层数据后,使用crc检验后,余数为0,说明链路层的传输时可靠传输-程序员宅基地

文章浏览阅读1.2k次,点赞2次,收藏8次。数据链路层习题自测问题1.数据链路(即逻辑链路)与链路(即物理链路)有何区别?“电路接通了”与”数据链路接通了”的区别何在?2.数据链路层中的链路控制包括哪些功能?试讨论数据链路层做成可靠的链路层有哪些优点和缺点。3.网络适配器的作用是什么?网络适配器工作在哪一层?4.数据链路层的三个基本问题(帧定界、透明传输和差错检测)为什么都必须加以解决?5.如果在数据链路层不进行帧定界,会发生什么问题?6.PPP协议的主要特点是什么?为什么PPP不使用帧的编号?PPP适用于什么情况?为什么PPP协议不_接收方收到链路层数据后,使用crc检验后,余数为0,说明链路层的传输时可靠传输

软件测试工程师移民加拿大_无证移民,未受过软件工程师的教育(第1部分)-程序员宅基地

文章浏览阅读587次。软件测试工程师移民加拿大 无证移民,未受过软件工程师的教育(第1部分) (Undocumented Immigrant With No Education to Software Engineer(Part 1))Before I start, I want you to please bear with me on the way I write, I have very little gen...

随便推点

Thinkpad X250 secure boot failed 启动失败问题解决_安装完系统提示secureboot failure-程序员宅基地

文章浏览阅读304次。Thinkpad X250笔记本电脑,装的是FreeBSD,进入BIOS修改虚拟化配置(其后可能是误设置了安全开机),保存退出后系统无法启动,显示:secure boot failed ,把自己惊出一身冷汗,因为这台笔记本刚好还没开始做备份.....根据错误提示,到bios里面去找相关配置,在Security里面找到了Secure Boot选项,发现果然被设置为Enabled,将其修改为Disabled ,再开机,终于正常启动了。_安装完系统提示secureboot failure

C++如何做字符串分割(5种方法)_c++ 字符串分割-程序员宅基地

文章浏览阅读10w+次,点赞93次,收藏352次。1、用strtok函数进行字符串分割原型: char *strtok(char *str, const char *delim);功能:分解字符串为一组字符串。参数说明:str为要分解的字符串,delim为分隔符字符串。返回值:从str开头开始的一个个被分割的串。当没有被分割的串时则返回NULL。其它:strtok函数线程不安全,可以使用strtok_r替代。示例://借助strtok实现split#include <string.h>#include <stdio.h&_c++ 字符串分割

2013第四届蓝桥杯 C/C++本科A组 真题答案解析_2013年第四届c a组蓝桥杯省赛真题解答-程序员宅基地

文章浏览阅读2.3k次。1 .高斯日记 大数学家高斯有个好习惯:无论如何都要记日记。他的日记有个与众不同的地方,他从不注明年月日,而是用一个整数代替,比如:4210后来人们知道,那个整数就是日期,它表示那一天是高斯出生后的第几天。这或许也是个好习惯,它时时刻刻提醒着主人:日子又过去一天,还有多少时光可以用于浪费呢?高斯出生于:1777年4月30日。在高斯发现的一个重要定理的日记_2013年第四届c a组蓝桥杯省赛真题解答

基于供需算法优化的核极限学习机(KELM)分类算法-程序员宅基地

文章浏览阅读851次,点赞17次,收藏22次。摘要:本文利用供需算法对核极限学习机(KELM)进行优化,并用于分类。

metasploitable2渗透测试_metasploitable2怎么进入-程序员宅基地

文章浏览阅读1.1k次。一、系统弱密码登录1、在kali上执行命令行telnet 192.168.26.1292、Login和password都输入msfadmin3、登录成功,进入系统4、测试如下:二、MySQL弱密码登录:1、在kali上执行mysql –h 192.168.26.129 –u root2、登录成功,进入MySQL系统3、测试效果:三、PostgreSQL弱密码登录1、在Kali上执行psql -h 192.168.26.129 –U post..._metasploitable2怎么进入

Python学习之路:从入门到精通的指南_python人工智能开发从入门到精通pdf-程序员宅基地

文章浏览阅读257次。本文将为初学者提供Python学习的详细指南,从Python的历史、基础语法和数据类型到面向对象编程、模块和库的使用。通过本文,您将能够掌握Python编程的核心概念,为今后的编程学习和实践打下坚实基础。_python人工智能开发从入门到精通pdf

推荐文章

热门文章

相关标签