Node.js中使用Buffer编码、解码二进制数据详解

2024-04-09 07:41:03 97

JavaScript很擅长处理字符串，但是因为它最初的设计是用来处理HTML文档，因此它并不太擅长处理二进制数据。JavaScript没有byte类型，没有结构化的类型（structuredtypes），甚至没有字节数组，只有数字和字符串。（原文：JavaScriptdoesn'thaveabytetype—itjusthasnumbers—orstructuredtypes,orhttp://skylitecellars.com/evenbytearrays:Itjusthasstrings.）

因为Node基于JavaScript，它自然可以处理类似HTTP这样的文本协议，但是你也可以用它来跟数据库交互，处理图片或文件上传等，可以想象，如果仅仅用字符串来做这些事得有多困难。早些时候，Node通过将byte编码成文本字符来处理二进制数据，但这种方式后来被证明并不可行，既浪费资源，又缓慢，又不灵活，而且难以维护。

Node有一个二进制缓冲实现Buffer，这个伪类（pseudo-class）提供了一系列处理二进制数据的API，简化了那些需要处理二进制数据的任务。缓冲的长度由字节数据的长度决定，而且你可以随机的设置和获取缓冲内的字节数据。

注意：Buffer类有一个特殊的地方，缓冲内的字节数据所占用的内存不是分配在JavaScrp

ItVM内存堆上的，也就是说这些对象不会被JavaScript的垃圾回收算法处理，取而代之的是一个不会被修改的永久内存地址，这也避免了因缓冲内容的内存复制所造成的CPU浪费。

创建缓冲

你可以用一个UTF-8字符串创建缓冲，像这样：


varbuf=newBuffer(‘HelloWorld!');

也可以用指定编码的字符串创建缓冲：


varbuf=newBuffer('8b76fde713ce','base64');

可接受的字符编码和标识如下：

1.ascii——ASCI，仅适用于ASCII字符集。
2.utf8——UTF-8，这种可变宽编码适用于Unicode字符集的任何字符，它已经成了Web世界的首选编码，也是Node的默认编码类型。
3.base64——Base64，这种编码基于64个可打印ASCII字符来表示二进制数据，Base64通常用于在字符文档内嵌入可以被转化成字符串的二进制数据，在需要时又可以完整无损的转换回原来的二进制格式。

如果没有数据来初始化缓冲，可以用指定的容量大小来创建一个空缓冲：


varbuf=newBuffer(1024);//创建一个1024字节的缓冲

获取和设置缓冲数据

创建或接收一个缓冲对象后，你可能要查看或者修改它的内容，可以通过[]操作符来访问缓冲的某个字节：


varbuf=newBuffer('mybuffercontent');

//访问缓冲内第10个字节

console.log(buf[10]);//->99

注意：当你（使用缓冲容量大小来）创建一个已初始化的缓冲时，一定要注意，缓冲的数据并没有被初始化成0，而是随机数据。


varbuf=newBuffer(1024);

console.log(buf[100]);//->5(某个随机值)

Node.js中使用Buffer编码、解码二进制数据详解

热门推荐

随机推荐