FTP
协议是File Transfer Protocol (文件传输协议)
的缩写,用来从一台计算机将文件传送到另一台计算机,它与这两台计算机所处的位置、联接的方式、甚至是是否使用相同的操作系统无关。相比于HTTP,FTP协议要复杂得多,因为FTP协议要用到两个TCP连接——一个是命令链路,用来在FTP客户端与服务器之间传递命令;另一个是数据链路,用来上传或下载数据。TCP/IP协议中,FTP标准命令TCP端口号为21,Port方式数据端口为20。FTP在每种操作系统的使用上有某一些细微差别,但是每种协议基本的命令结构是相同的。
此处只给出粗略介绍,更详细的可看这篇博客中的“FTP的工作方式”章节。
是指 FTP的客户端发送 PORT 命令到FTP服务器——客户端先向服务器的FTP端口(默认是21)发送连接请求,服务器接受连接,建立一条命令链路。当需要传送数据时,客户端在命令链路上用PORT命令告诉服务器:“我打开了XXXX端口,你过来连接我”。于是服务器从20端口向客户端的XXXX端口发送连接请求,建立一条数据链路来传送数据。如上图所示,客户端通过指令端口10021连接到服务器后,客户端提供一个数据连接端口(默认是指令端口+1):10022,服务端主动通过客户端的10022端口发送数据给客户端。
限制:客户端的10022端口必须是开放的,如果未开放,则可以连接,无法传递数据。
是指FTP的客户端发送 PASV命令到 FTP服务器——客户端向服务器的FTP端口(默认是21)发送连接请求,服务器接受连接,建立一条命令链路。当需要传送数据时,服务器在命令链路上用PASV命令告诉客户端:“我打开了XXXX端口,你过来连接我”。于是客户端向服务器的XXXX端口发送连接请求,建立一条数据链路来传送数据。如上图所示,通过 指令端口10021 连接到服务器后,服务端提供一个数据连接端口10022,告知客户端请通过我提供的数据端口发送/下载数据。
限制:服务端需要开放数据端口10022,并设置为pasv模式,端口限制在10022。
如果用户拷贝的文件包含简单的ASCII码文本,远程机器上的操作系统也不是UNIX的情况下,使用ftp协议传输文件时通常会自动地调整文件的内容以便于把文件解释成另外那台计算机存储文本文件的格式。
但如果用户正在传输的文件包含的不是文本文件,而是程序,数据库,压缩文件或者字处理文件(尽管字处理文件包含的大部分是文本,其中也包含有指示页尺寸,字库等信息的非打印字符)。在拷贝任何非文本文件之前,需要用binary 命令(如下所示)告诉ftp逐字拷贝,不要对这些文件进行处理,这也是下一小节要提到的二进制传输模式。
在二进制传输中,保存文件的位序,以便原始和拷贝的是逐位一一对应的。即使目的地机器上包含位序列的文件是没意义的。例如,macintosh以二进制方式传送可执行文件到Windows系统,在对方系统上,此文件不能执行。
如果你在ASCII方式下传输二进制文件,即使不需要也仍会转译。这会使传输稍微变慢 ,也会损坏数据,使文件变得不能用。(在大多数计算机上,ASCII方式一般假设每一字符的第一有效位无意义,因为ASCII字符组合不使用它。如果你传输二进制文件,所有的位都是重要的。)如果你知道这两台机器是同样的,则二进制方式对文本文件和数据文件都是有效的。