通信協定中的大小端究竟是什麼？

2024.04.06

在通信協定中，必須明確指定使用哪種位元組序，以確保發送方和接收方能夠正確地解釋數據。否則，如果發送方使用大端而接收方使用小端（或反之），那麼在數據傳輸過程中就可能會出現混亂。

在物聯網應用開發中，從嵌入式工程拿到的通信協議中經常會看到標明大小端模式，那麼大小端究竟是什麼？

大小端序

在通信協定中，大小端（Endian）是一個重要的概念，涉及到多位元組數據（如整數、浮點數等）在記憶體中的存儲方式。大小端序決定了數據的高位位元組（Most Significant Byte，MSB）和低位位元組（Least Significant Byte，LSB）在記憶體位址中的排列順序。對於跨平臺通信和數據交換至關重要，因為不同的硬體平臺可能採用不同的位元組序。

「大端（Big Endian）」：高位位元組存儲在記憶體的低位址處，低位位元組存儲在記憶體的高位址處。例如，一個16位的整數0x1234在大端模式下，在記憶體中的表示是0x12 0x34。
「小端（Little Endian）」：低位位元組存儲在記憶體的低位址處，高位位元組存儲在記憶體的高地址處。對於同一個16位的整數0x1234，在小端模式下，在記憶體中的表示是0x34 0x12。

圖片

一種常見的做法是在通信協議中明確指定位元組序，無論發送方和接收方的軟體硬體平臺如何，都可以確保數據的正確解釋。也可能需要在通信協定中添加一些特定的標記或元數據，來指示數據的位元組序，接收方就可以根據這些標記來動態地調整其位元組序解釋方式。

圖片

例如，許多網路協定（如TCP/IP）使用大端序，而x86和x86_64等Intel架構則採用小端序。當進行跨平臺通信時，位元組序的不匹配可能會導致問題，通常需要在發送和接收數據時轉換位元組序。

在程式設計中，有時需要編寫特定的代碼來處理位元組序的轉換，以確保數據的正確解釋。例如，在C語言中，可以使用htonl、ntohl、htons、ntohs等函數來處理網路位元組序和主機位元組序之間的轉換。這些函數名稱中的“h”代表host（主機），“n”代表network（網络），“s”代表short（短整型），“l”代表long（長整型）。

端序轉換

在Java中，進行端序轉換可以直接使用ByteBuffer類。 ByteBuffer支援大端序（Big Endian）和小端序（Little Endian），並且可以在運行時動態地改變位元組序。

對於整數類型（如int、short等），可以使用ByteBuffer的order（）方法來設置位元節序，然後使用putInt（）、getShort（）等方法來讀寫數據。

import java.nio.ByteBuffer;
import java.nio.ByteOrder;

public class EndianConversion {
    public static void main(String[] args) {
        int data1 = 0x12345678;
        short data2 = 0x1234;

        // 使用ByteBuffer进行端序转换
        ByteBuffer buffer1 = ByteBuffer.allocate(6); // 分配足够的空间
        ByteBuffer buffer2 = ByteBuffer.allocate(6);
        // 设置为小端序并写入数据
        buffer1.order(ByteOrder.LITTLE_ENDIAN);
        buffer1.putInt(data1);
        
        buffer2.order(ByteOrder.LITTLE_ENDIAN);
        buffer2.putShort(data2);

        // 翻转到大端序并读取数据
        buffer1.flip(); // 准备从缓冲区读取数据
        buffer1.order(ByteOrder.BIG_ENDIAN);
        int bigEndian1 = buffer1.getInt();
        
        buffer2.flip();
        buffer2.order(ByteOrder.BIG_ENDIAN);
        short bigEndian2 = buffer.getShort();

        System.out.println("原int值: " + Integer.toHexString(data1));
        System.out.println("大端模式int值: " + Integer.toHexString(bigEndian1));
        System.out.println("原short值: " + Integer.toHexString(data2 & 0xFFFF));
        System.out.println("大端模式short值: " + Integer.toHexString(bigEndian2 & 0xFFFF));
    }
}1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.

對於浮點類型（如float、double），同樣可以使用ByteBuffer進行端序轉換。

import java.nio.ByteBuffer;
import java.nio.ByteOrder;

public class FloatEndianConversion {
    public static void main(String[] args) {
        float data = 123.45f;

        // 使用ByteBuffer进行端序转换
        ByteBuffer buffer = ByteBuffer.allocate(4); // 分配足够的空间

        // 设置为小端序并写入数据
        buffer.order(ByteOrder.LITTLE_ENDIAN);
        buffer.putFloat(data);

        // 翻转到大端序并读取数据
        buffer.flip(); // 准备从缓冲区读取数据
        buffer.order(ByteOrder.BIG_ENDIAN);
        float bigEndian = buffer.getFloat();

        System.out.println("原float值: " + data);
        System.out.println("大端模式float值: " + bigEndian);
    }
}1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.

浮點數的端序轉換，實際上並不需要改變其內部位的順序，IEEE 754標準定義了浮點數的格式，無論在哪個平臺上，只要按照該標準解釋，其值都是一致的。如果需要將浮點數以位元組的形式存儲或傳輸，並希望接收方以不同的位元組序解釋這些位元組，那麼就需要使用ByteBuffer進行轉換。

在C語言中，對於端序轉換，通常使用標準的庫函數，這些函數允許開發者在網路位元組序（大端序）和主機位元組序之間進行轉換。網路位元組序是大端序，而主機位元組序則取決於具體的硬體架構（可能是大端序或小端序）。

對於16位和32位整數，可以使用htons（host to network short）、ntohs（network to host short）、htonl（host to network long）和ntohl（network to host long）函數進行轉換。

#include <stdio.h>
#include <arpa/inet.h>

int main() {
    uint16_t short_host_order = 0x1234;
    uint32_t long_host_order = 0x12345678;

    // 转换到网络字节序（大端序）
    uint16_t short_net_order = htons(short_host_order);
    uint32_t long_net_order = htonl(long_host_order);

    // 转换回主机字节序
    uint16_t short_back_to_host = ntohs(short_net_order);
    uint32_t long_back_to_host = ntohl(long_net_order);

    printf("Host order short: %04x\n", short_host_order);
    printf("Network order short: %04x\n", short_net_order);
    printf("Back to host order short: %04x\n", short_back_to_host);

    printf("Host order long: %08x\n", long_host_order);
    printf("Network order long: %08x\n", long_net_order);
    printf("Back to host order long: %08x\n", long_back_to_host);

    return 0;
}1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.

對於浮點數，沒有直接的端序轉換函數，因為浮點數的表示包括指數和尾數部分，這些部分在記憶體中的存儲方式複雜。通常，一種解決方案是將浮點數轉換為整數類型（如uint32_t），然後進行端序轉換，再轉回浮點數。

#include <stdio.h>
#include <string.h>
#include <arpa/inet.h>

int main() {
    float f = 123.45f;
    uint32_t *int_ptr;
    uint32_t int_val;
    float f_net, f_back;

    // 将浮点数转换为整数
    memcpy(&int_val, &f, sizeof(f));

    // 转换到网络字节序
    int_val = htonl(int_val);

    // 将整数转换回浮点数
    memcpy(&f_net, &int_val, sizeof(f_net));

    // 转换回主机字节序
    int_val = ntohl(int_val);
    memcpy(&f_back, &int_val, sizeof(f_back));

    printf("Original float: %f\n", f);
    printf("Network order float: %f\n", f_net);
    printf("Back to host order float: %f\n", f_back);

    return 0;
}1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.

範例中預設位元組序是小端序。在實際應用中，可以通過__BYTE_ORDER__宏在GCC中檢查位元組序，在需要時才進行端序轉換。對於浮點數的端序轉換，需要注意IEEE 754標準對浮點數表示的影響，以及不同平臺和編譯器可能產生的差異。

新聞

通信協定中的大小端究竟是什麼？

大小端序

端序轉換

什么是VXLAN（虚拟可扩展局域网）？

MySQL 主從AUTO_INCREMENT 不一致問題分析