最近在项目中的soket通信时,遇到了大小字节序问题和网络传输时的字节序问题,现在给大家整理一下,希望大家对字节序有个比较深入的了解,其实理解了就很简单的。
开始遇到的问题:
1、本地的数据通过网络传输然后在目的地解析网络上的数据,字节序是如何统一的
2、字节序不同,数据(如0xFF00)存入内存地址中位置不同(大字节序:FF--低地址位 00--高地址位 ;小字节序: 00--低地址位 FF--高地址位),为什么读出的值都是0xFF00
下面让我们带着问题来理解:
大字节序:大端有效 ,高位数据先放入低地址内存 , 低位数据放入高地址内存
小字节序:小端有效,低位数据先放入低地址内存 , 高位数据再放入高地址内存
注意:描述的是将数据(肉眼看到的)放入内存中的地址(计算机的硬盘内存中)
然后看一下图示吧:
相信大家对遇到的第二个问题已经知道结果了吧,现在再来看看第一个问题。
网络字节序:是大字节序,在把数据进行网络传输时,要保证自己传输到网络上的数据时大字节序。
再来看看图示吧:
1号线路:发数据和接收数据都不需要转序,因为自己是和网络都是大字节序
2号线路:发数据和接收数据都需要转序,因为自己是小字节序,网络都是大字节序,才能保证自己本系统的数据永远都是小字节序。可能高级语言(java、C#屏蔽了字节序,大家感受不到,那是因为高级语言内存进行封装和处理了)。
补充一下:如果发端和收端都是小字节序,可以不转序,但是这样做可扩展不高,如果收端是大字节序的话,人家默认为发过来的数据都是网络字节序(大字节序),这样处理就很混乱了。
好了,现在大家对第一个问题也清楚了吧。
鉴定大小字节序的C/C++语言程序
最后让我们来看看鉴定大小字节序的C/C++语言程序吧
#include <stdlib.h>
#include <string.h>
int main()
{
/*将结合体的整型值赋值为1,如果是小字节序,小端有效,低地址写入的就是1,读出字符ch就是1
如果是大字节序,大端有效,低地址写入的就是0,读出字符ch就是0*/
data.i = 1;
if(data.ch)
{
printf("this system is small-endian\n");
}
else
{
printf("this system is big-endian\n");
}
return 0;
}
原因:将结合体的整型值赋值为1,如果是小字节序,小端有效,低地址写入的就是1,读出字符ch就是1
如果是大字节序,大端有效,低地址写入的就是0,读出字符ch就是0
检验大小字节序的方法很多,本人认为这个方法比较简单,容易理解。
字节序转化函数htons、htonl、ntohs、ntohl应用
重要>>>字节序转化,只是针对二字节、四字节的数据类型,对于单字节和数据区(本质也是单字节的数组)不需要转化。
注意:在使用转序函数时,函数内部会去判断本机字节序,决定要不要转
#include <iostream>
using namespace std;
/*windows下的头文件;linux下是#include <arpa/inet.h>*/
#include<Winsock2.h>
int main(int argc,char *argv[])
{
/*常用方法(注意,在使用转序函数时,内部会去判断本机字节序,决定要不要转)
****** host(本地)-->net(网络):
uint32_t htonl(uint32_t hostlong);
uint16_t htons(uint16_t hostshort);
****** net(网络) -->host(本地):
uint32_t ntohl(uint32_t netlong);
uint16_t ntohs(uint16_t netshort);
*/
unsigned int srcNum = 0xff;
unsigned int netNum = htonl(srcNum);
printf("src-->net: srcNum=0x%x netNum=0x%x\n",srcNum,netNum);
unsigned int toNum = ntohl(netNum);
printf("net-->to : netNum=0x%x srcNum=0x%x \n",netNum,toNum);
system("pause");
return 0;
}
此代码是在windows环境下编译,如果编译报错:error LNK2019: 无法解析的外部符号 _ntohl@4,原因是没有引入ws2_32.lib库,只要在 项目->属性->配置属性->链接器->输入 然后在附件依赖项添加ws2_32.lib
巩固练习--IP的存放
1、 IP(无符号整型,如0x80702101)在大、小字节序的系统中的内存是怎么存放的(把这个IP看成4字节的数组unsigned char arry[4],则数组中每个元素各是多少呢?)提示:数组的下标越大,地址就越大。
小字节:arr[0]=0x01 arr[1]=0x21 arr[2]=0x70 arr[4]=0x80
大字节:arr[0]=0x80 arr[1]=0x70 arr[2]=0x21 arr[4]=0x01
最后希望能对大家有帮助,有什么问题请留言,谢谢。
来源:oschina
链接:https://my.oschina.net/u/1783725/blog/647973