WEB应用是使Internet在当时从众多网络中脱颖而出的重要倚仗,该功能可以说直接使Internet成为现在几乎唯一的网络,。
该应用的构成即网页的相互链接,每个网页又包含多个对象比如HTML文件,图片和动态脚本等。
引入概念:URl统一资源定位器,在RFC1738中可找到详细定义。
具体方法是:
scheme协议://host域名:port端口号/path路径
该方法使得互联网上所有对象都有唯一的标识符,与进程的寻址类似。
超文本传输协议,c/s结构,客户端即浏览器端,发送请求给服务器,接受并展示web对象;服务器端响应客户请求,发送客户请求的对象,Apache是目前事实上的标准。
思考:爬虫大概也是采用这种方法,通过代码手动构造请求,再接受服务器的响应对象。
http协议采取无状态,因为有状态的协议耿复杂,需要维护服务器和客户的状态一致,档两者任意一个失效时会产生状态的不一致,解决的代价很高。