http协议进阶之Transfer-Encoding和HttpCore实现详解
作者:海鸟 发布时间:2023-11-03 14:22:05
Transfer-Encoding简介
transfer-eccoding所描述的是消息请求(request)和响应(response)所附带的实体对象(entity)的传输形式,规范定义格式如下:
Transfer-Encoding = "Transfer-Encoding" ":" 1#transfer-coding
举个例子:Transfer-Encoding: chunked
transfer-encoding的可选值有:chunked,identity ;
transfer-encoding的可选值有:chunked,identity,从字面意义可以理解,前者指把要发送传输的数据切割成一系列的块数据传输,后者指传输时不做任何处理,自身的本质数据形式传输。举个例子,如果我们要传输一本“红楼梦”小说到服务器,chunked方式就会先把这本小说分成一章一章的,然后逐个章节上传,而identity方式则是从小说的第一个字按顺序传输到最后一个字结束。
相关的头定义
Content-Encoding : content-encoding和transfer-encoding所作用的对象不同,行为目标也不同,前者是对数据内容采用什么样的编码方式,后者是对数据传输采用什么样的编码。前者通常是对数据内容进行一些压缩编码操作,后者通常是对传传输采用分块策略之类的。
Content-length : content-length头的作用是指定待传输的内容的字节长度。比如上面举的例子中,我们要上传一本红楼梦小说,则可以指定其长度大小,如:content-length:731017。细心的读者可能会有疑惑,它和transfer-encoding又有什么关系呢?如果想知道它们的关系,只要反过来问下自己,为什么transfer-encoding会有identity和chunked两种,各在什么上下文情景中要用到。比如chunked方式,把数据分块传输在很多地方就非常有用,如服务端在处理一个复杂的问题时,其返回结果是阶段性的产出,不能一次性知道最终的返回的总长度(content-lenght值),所以这时候返回头中就不能有content-lenght头信息,有也要忽略处理。所以你可以这样理解,transfer-encoding在不能一次性确定消息实体(entity)内容时自定义一些传输协议,如果能确定的话,则可以在消息头中加入content-length头信息指示其长度,可以把transfer-encoding和content-length看成互斥性的两种头。
transfer-encoding详解
chunked格式(rfc2616 3.6.1):
Chunked-Body = *chunk
last-chunk
trailer
CRLF
chunk = chunk-size [ chunk-extension ] CRLF
chunk-data CRLF
chunk-size = 1*HEX
last-chunk = 1*("0") [ chunk-extension ] CRLF
chunk-extension= *( ";" chunk-ext-name [ "=" chunk-ext-val ] )
chunk-ext-name = token
chunk-ext-val = token | quoted-string
chunk-data = chunk-size(OCTET)
trailer = *(entity-header CRLF)
还是以上传“红楼梦”这本书举例:
24E5是指第一个块数据长度为24E5(16进制格式字符串表示),CRLF为换行控制符。紧接着是第一个块数据内容,其长度就是上面定义的24E5,以CRLF标志结束。3485是指第二块数据长度为3485,CRLF结束,然后后面是第二块的数据内容......,以这样的格式直到所有的块数据结束。最后以“0”CRLF结束,表示数据传输完成(这里对比rfc规范内容,省略了chunk-extension和trailer的东西,因为这并不重要)。
public class Main {
/**
* @param args
*/
public static final int CR = 13; // <US-ASCII CR, carriage return (13)>
public static final int LF = 10; // <US-ASCII LF, linefeed (10)>
public static void main(String[] args) throws Exception{
Socket socket = new Socket("localhost",8080);
OutputStream out = socket.getOutputStream();
InputStream in = socket.getInputStream();
//send requestline
out.write("POST /web/Hello HTTP/1.1".getBytes());
out.write(CR & 0xFF);
out.write(LF & 0xFF);
//send request header
out.write("Host:localhost:8080".getBytes());
out.write(CR & 0xFF);
out.write(LF & 0xFF);
out.write("Accept-Encoding:gzip,deflate".getBytes());
out.write(CR & 0xFF);
out.write(LF & 0xFF);
out.write("Transfer-Encoding:chunked".getBytes());// 指定transfer-encodeing为chunked方式
out.write(CR & 0xFF);
out.write(LF & 0xFF);
out.write("Content-Type:application/x-www-form-urlencoded;charset=utf-8".getBytes());
out.write(CR & 0xFF);
out.write(LF & 0xFF);
// CRLF between headers and entity
out.write(CR & 0xFF);
out.write(LF & 0xFF);
/*
* send chunked data
*/
//send the first chunked data:hello,world
//the first chunked data's size : 11
out.write("B".getBytes());
out.write(CR & 0xFF);
out.write(LF & 0xFF);
//the first chunked data's content : hello,world
out.write("hello,world".getBytes());
out.write(CR & 0xFF);
out.write(LF & 0xFF);
//send the second chunked data:tony
//the first chunked data's size : 4
out.write("4".getBytes());
out.write(CR & 0xFF);
out.write(LF & 0xFF);
//the first chunked data's content : hello,world
out.write("tony".getBytes());
out.write(CR & 0xFF);
out.write(LF & 0xFF);
//send the chunked data end flag
out.write("0".getBytes());
out.write(CR & 0xFF);
out.write(LF & 0xFF);
//send CRLF
out.write(CR & 0xFF);
out.write(LF & 0xFF);
out.flush();
//
byte[] buffer = new byte[512];
ByteArrayOutputStream bufferStream = new ByteArrayOutputStream();
int len = -1;
while((len = in.read(buffer)) != -1){
bufferStream.write(buffer,0,len);
}
System.out.println(new String(bufferStream.toByteArray()));
socket.close();
}
上面这段代码发了两块数据,第一块是“hello,world”这11个字节长度的字符,第二块发送了“tony”四个字长的数据块。在服务端将收到“hello,worldtony”这个字符串.
HttpCore对transfer-encoding的实现
所以不管是对输入流(InputStream),还是输出流(OutputStream),httpcore都有三种实现:contentlength,identity,chunked。这是完全按照http规范实现的。这里再重复总结下这三种这间的关系。
当指定了"content-length"头信息时,说明已经确定消息体(entity)的长度大小,其值必需为非负整数。反之,如果有“transfer-encoding”头信息时,其值为“chunked”或者“identity”,说明不确定消息体的大小,这时应该不存在“content-length”头。
来源:http://www.cnblogs.com/jcli/archive/2012/10/19/2730440.html
猜你喜欢
- 概述在Winform中从后台添加控件相对比较容易,但是在WPF中,我们知道界面是通过XAML编写的,如何把后台写好的控件动态添加到前台呢?本
- 传播行为定义关于客户端和被调用方法的事务边界。Spring定义了7种截然不同的传播行为。1,PROPAGATION_MANDATORY,表示
- HttpClient是一个客户端的HTTP通信实现库。HttpClient的目标是发送和接收HTTP报文。Http协议的重要性相信不用我多说
- 操作符就是为了解决对Observable对象的变换的问题,操作符用于在Observable和最终的Subscriber之间修改Observa
- Struct的理论看过好一些,可是工作上基本没有应用过,Class倒处处都有。难道Struct就没有什么使用价值吗?搜了一下如何在类和结构中
- 异步log4j2的location信息打印问题背景:项目改造过程中将log4j2改成异步,发现行号没有打印,于是扒了下官方文档,大概陈述下:
- 一、ehcahe的介绍EhCache 是一个纯Java的进程内缓存框架,具有高速、精干等特点,是Hibernate中默认的CacheProv
- java中初始化MediaRecorder实现代码:private boolean initializeVideo() { &
- 1、采用MapperScannerConfigurer,它将会查找类路径下的映射器并自动将它们创建成MapperFactoryBean。sp
- 概述ConcurrentHashMap(CHM)是日常开发中使用频率非常高的一种数据结构,想对于普通的HashMap,CHM提供了线程安全的
- 一、递归的思路一个方法在执行时,调用自身被称为“递归”。递归相当于数学归纳法,有一个起始条件,有一个递推公式。递归可以分为:单路递归和多路递
- 一、什么是ImportBeanDefinitionRegistrarImportBeanDefinitionRegistrar接口是也是sp
- 前言java有八个基本数据类型,每个都有对应的一个包装类,比如int对应的Integer。 Integer 是int的包装类型,数据类型是类
- 本文实例为大家分享了ftp实现文件上传下载的具体代码,供大家参考,具体内容如下package getUrlPic;import java.i
- 缘起工作时使用java开发服务器后台,用Jersey写Restful接口,发现有一个Post方法始终获取不到参数,查了半天,发现时获取参数的
- 最近一段时间,大家在用 Spring Security OAuth2 时可能发现有很多类过期了。大家在选择 OAuth2 依赖的时候,可能也
- 目录前言解决方案前言我们在开发Spring应用时可能会不小心注入两个相同类型的Bean,比如实现了两个相同Service接口的类,示例伪代码
- 介绍本文实现的功能有:1、播放音乐2、自定义流星数量、飞行速度、光晕大小、流星大小3、自定义表白话语 运用到的知识点有:GUI:j
- 1 前言Stream 是 java8 中处理集合的抽象概念,可以执行非常复杂的查询、过滤和映射数据等操作。Stream API 提供了一种高
- jar包就指第三方提供的开源的API,这些API不属于JDK的,需要通过导入才能使用。添加和导入的区别注意:本文里的 导入 和 添加 jar