国产一区二区三区免费观,富二代短视频app下载安装,欧美v在线看

C語言中威力最大的指針底層原理和使用技巧講解

2021-03-05 09:40

道哥分享

關(guān)注

這是道哥的第014篇原創(chuàng)

一、前言

二、變量與指針的本質(zhì)

三、指針的幾個相關(guān)概念

四、指向不同數(shù)據(jù)類型的指針

五、總結(jié)

一、前言

如果問C語言中最重要、威力最大的概念是什么，答案必將是指針！威力大，意味著使用方便、高效，同時也意味著語法復(fù)雜、容易出錯。指針用的好，可以極大的提高代碼執(zhí)行效率、節(jié)約系統(tǒng)資源；如果用的不好，程序中將會充滿陷阱、漏洞。

這篇文章，我們就來聊聊指針。從最底層的內(nèi)存存儲空間開始，一直到應(yīng)用層的各種指針使用技巧，循序漸進(jìn)、抽絲剝繭，以最直白的語言進(jìn)行講解，讓你一次看過癮。

說明：為了方便講解和理解，文中配圖的內(nèi)存空間的地址是隨便寫的，在實(shí)際計算機(jī)中是要遵循地址對齊方式的。

二、變量與指針的本質(zhì)

1．內(nèi)存地址

我們編寫一個程序源文件之后，編譯得到的二進(jìn)制可執(zhí)行文件存放在電腦的硬盤上，此時它是一個靜態(tài)的文件，一般稱之為程序。

當(dāng)這個程序被啟動的時候，操作系統(tǒng)將會做下面幾件事情：

把程序的內(nèi)容（代碼段、數(shù)據(jù)段）從硬盤復(fù)制到內(nèi)存中；創(chuàng)建一個數(shù)據(jù)結(jié)構(gòu)PCB（進(jìn)程控制塊），來描述這個程序的各種信息（例如：使用的資源，打開的文件描述符．．．）；在代碼段中定位到入口函數(shù)的地址，讓CPU從這個地址開始執(zhí)行。

當(dāng)程序開始被執(zhí)行時，就變成一個動態(tài)的狀態(tài)，一般稱之為進(jìn)程。

內(nèi)存分為：物理內(nèi)存和虛擬內(nèi)存。操作系統(tǒng)對物理內(nèi)存進(jìn)行管理、包裝，我們開發(fā)者面對的是操作系統(tǒng)提供的虛擬內(nèi)存。
這2個概念不妨礙文章的理解，因此就統(tǒng)一稱之為內(nèi)存。

在我們的程序中，通過一個變量名來定義變量、使用變量。變量本身是一個確確實(shí)實(shí)存在的東西，變量名是一個抽象的概念，用來代表這個變量。就比如：我是一個實(shí)實(shí)在在的人，是客觀存在與這個地球上的，道哥是我給自己起的一個名字，這個名字是任意取得，只要自己覺得好聽就行，如果我愿意還可以起名叫：鳥哥、龍哥等等。

那么，我們定義一個變量之后，這個變量放在哪里呢？那就是內(nèi)存的數(shù)據(jù)區(qū)。內(nèi)存是一個很大的存儲區(qū)域，被操作系統(tǒng)劃分為一個一個的小空間，操作系統(tǒng)通過地址來管理內(nèi)存。

內(nèi)存中的最小存儲單位是字節(jié)（8個bit），一個內(nèi)存的完整空間就是由這一個一個的字節(jié)連續(xù)組成的。在上圖中，每一個小格子代表一個字節(jié)，但是好像大家在書籍中沒有這么來畫內(nèi)存模型的，更常見的是下面這樣的畫法：

也就是把連續(xù)的4個字節(jié)的空間畫在一起，這樣就便于表述和理解，特別是深入到代碼對齊相關(guān)知識時更容易理解。（我認(rèn)為根本原因應(yīng)該是：大家都這么畫，已經(jīng)看順眼了～～）

2． 32位與64位系統(tǒng)

我們平時所說的計算機(jī)是32位、64位，指的是計算機(jī)的CPU中寄存器的最大存儲長度，如果寄存器中最大存儲32bit的數(shù)據(jù)，就稱之為32位系統(tǒng)。

在計算機(jī)中，數(shù)據(jù)一般都是在硬盤、內(nèi)存和寄存器之間進(jìn)行來回存取。CPU通過3種總線把各組成部分聯(lián)系在一起：地址總線、數(shù)據(jù)總線和控制總線。地址總線的寬度決定了CPU的尋址能力，也就是CPU能達(dá)到的最大地址范圍。

剛才說了，內(nèi)存是通過地址來管理的，那么CPU想從內(nèi)存中的某個地址空間上存取一個數(shù)據(jù)，那么CPU就需要在地址總線上輸出這個存儲單元的地址。假如地址總線的寬度是8位，能表示的最大地址空間就是256個字節(jié)，能找到內(nèi)存中最大的存儲單元是255這個格子（從0開始）。即使內(nèi)存條的實(shí)際空間是2G字節(jié)，CPU也沒法使用后面的內(nèi)存地址空間。如果地址總線的寬度是32位，那么能表示的最大地址就是2的32次方，也就是4G字節(jié)的空間。

【注意】：這里只是描述地址總線的概念，實(shí)際的計算機(jī)中地址計算方式要復(fù)雜的多，比如：虛擬內(nèi)存中采用分段、分頁、偏移量來定位實(shí)際的物理內(nèi)存，在分頁中還有大頁、小頁之分，感興趣的同學(xué)可以自己查一下相關(guān)資料。

3．變量

我們在C程序中使用變量來“代表”一個數(shù)據(jù)，使用函數(shù)名來“代表”一個函數(shù)，變量名和函數(shù)名是程序員使用的助記符。變量和函數(shù)最終是要放到內(nèi)存中才能被CPU使用的，而內(nèi)存中所有的信息（代碼和數(shù)據(jù)）都是以二進(jìn)制的形式來存儲的，計算機(jī)根據(jù)就不會從格式上來區(qū)分哪些是代碼、哪些是數(shù)據(jù)。CPU在訪問內(nèi)存的時候需要的是地址，而不是變量名、函數(shù)名。

問題來了：在程序代碼中使用變量名來指代變量，而變量在內(nèi)存中是根據(jù)地址來存放的，這二者之間如何映射（關(guān)聯(lián)）起來的？

答案是：編譯器！編譯器在編譯文本格式的C程序文件時，會根據(jù)目標(biāo)運(yùn)行平臺（就是編譯出的二進(jìn)制程序運(yùn)行在哪里？是x86平臺的電腦？還是ARM平臺的開發(fā)板？）來安排程序中的各種地址，例如：加載到內(nèi)存中的地址、代碼段的入口地址等等，同時編譯器也會把程序中的所有變量名，轉(zhuǎn)成該變量在內(nèi)存中的存儲地址。

變量有2個重要屬性：變量的類型和變量的值。

示例：代碼中定義了一個變量

int a ＝ 20；

類型是int型，值是20。這個變量在內(nèi)存中的存儲模型為：

我們在代碼中使用變量名a，在程序執(zhí)行的時候就表示使用0x11223344地址所對應(yīng)的那個存儲單元中的數(shù)據(jù)。因此，可以理解為變量名a就等價于這個地址0x11223344。換句話說，如果我們可以提前知道編譯器把變量a安排在地址0x11223344這個單元格中，我們就可以在程序中直接用這個地址值來操作這個變量。

在上圖中，變量a的值為20，在內(nèi)存中占據(jù)了4個格子的空間，也就是4個字節(jié)。為什么是4個字節(jié)呢？在C標(biāo)準(zhǔn)中并沒有規(guī)定每種數(shù)據(jù)類型的變量一定要占用幾個字節(jié)，這是與具體的機(jī)器、編譯器有關(guān)。

比如：32位的編譯器中：

char： 1個字節(jié)；
short int： 2個字節(jié)；
int： 4個字節(jié)；
long： 4個字節(jié)。

比如：64位的編譯器中：

char： 1個字節(jié)；
short int： 2個字節(jié)；
int： 4個字節(jié)；
long： 8個字節(jié)。

為了方便描述，下面都以32位為例，也就是int型變量在內(nèi)存中占據(jù)4個字節(jié)。

另外，0x11223344，0x11223345，0x11223346，0x11223347這連續(xù)的、從低地址到高地址的4個字節(jié)用來存儲變量a的數(shù)值20。在圖示中，使用十六進(jìn)制來表示，十進(jìn)制數(shù)值20轉(zhuǎn)成16進(jìn)制就是：0x00000014，所以從開始地址依次存放0x00、0x00、0x00、0x14這4個字節(jié)（存儲順序涉及到大小端的問題，不影響文本理解）。

根據(jù)這個圖示，如果在程序中想知道變量a存儲在內(nèi)存中的什么位置，可以使用取地址操作符＆，如下：

printf（＂＆a ＝ 0x％x ＂，＆a）；

這句話將會打印出：＆a ＝ 0x11223344。

考慮一下，在32位系統(tǒng)中：指針變量占用幾個字節(jié)？

4．指針變量

指針變量可以分2個層次來理解：

指針變量首先是一個變量，所以它擁有變量的所有屬性：類型和值。它的類型就是指針，它的值是其他變量的地址。既然是一個變量，那么在內(nèi)存中就需要為這個變量分配一個存儲空間。在這個存儲空間中，存放著其他變量的地址。指針變量所指向的數(shù)據(jù)類型，這是在定義指針變量的時候就確定的。例如：int ＊p；意味著指針指向的是一個int型的數(shù)據(jù)。

首先回答一下剛才那個問題，在32位系統(tǒng)中，一個指針變量在內(nèi)存中占據(jù)4個字節(jié)的空間。因為CPU對內(nèi)存空間尋址時，使用的是32位地址空間（4個字節(jié)），也就是用4個字節(jié)就能存儲一個內(nèi)存單元的地址。而指針變量中的值存儲的就是地址，所以需要4個字節(jié)的空間來存儲一個指針變量的值。

示例：

int a ＝ 20；
int ＊pa；
pa ＝＆a；
printf（＂value ＝％d ＂，＊pa）；

在內(nèi)存中的存儲模型如下：

對于指針變量pa來說，首先它是一個變量，因此在內(nèi)存中需要有一個空間來存儲這個變量，這個空間的地址就是0x11223348；

其次，這個內(nèi)存空間中存儲的內(nèi)容是變量a的地址，而a的地址為0x11223344，所以指針變量pa的地址空間中，就存儲了0x11223344這個值。

這里對兩個操作符＆和＊進(jìn)行說明：

＆：取地址操作符，用來獲取一個變量的地址。上面代碼中＆a就是用來獲取變量a在內(nèi)存中的存儲地址，也就是0x11223344。

＊：這個操作符用在2個場景中：定義一個指針的時候，獲取一個指針?biāo)赶虻淖兞恐档臅r候。

int ＊pa；這個語句中的表示定義的變量pa是一個指針，前面的int表示pa這個指針指向的是一個int類型的變量。不過此時我們沒有給pa進(jìn)行賦值，也就是說此刻pa對應(yīng)的存儲單元中的4個字節(jié)里的值是沒有初始化的，可能是0x00000000，也可能是其他任意的數(shù)字，不確定；

printf語句中的＊表示獲取pa指向的那個int類型變量的值，學(xué)名叫解引用，我們只要記住是獲取指向的變量的值就可以了。

1 2 3 下一頁>