在我們教學的時候,常常會碰到學生問:老師,數組和指針有沒有區別,是不是數組就是指針,如果有區別,區別在哪里?為此我寫了這篇文章,希望能有點啟發給學生。
先從簡單的說起,一維數組和指針。
平常我們操作數組都是通過數組名加下標的方式,那么這個數組名到底代表什么含義?其實數組名它是一個指針常量,它是一個地址,這個地址是數組的首地址,也就是數組第一個元素的地址。例如:
int a[10];
你可以去看一下,a, &a, &a[0]它都是同一個值,都是數組的首地址。
那么這個指針常量它的類型的是什么呢,如果數組元素的類型是int類型的,那么這個指針常量的類型就是int*,像這里就是int*類型。還有要注意的是這個指針是一個常量,不能修改這個值,但是有兩種情況下數組名不被當作一個指針常量看待,一個是&運算,另一個是sizeof,一個常量肯定是沒有地址的,所以&運算是取得數組的首地址,而sizeof是返回整個數組的長度,而不是返回的指針長度。
所以數組和指針是如此的相似,以至于它們可以互換使用。例如,數組元素除了使用下標方式操作外,還可以使用指針的方式:
*(a + 1)代表第二個元素, *(a + 2)代表第三個元素。
數組可以當作指針來使用,指針同樣也可以當作數組來使用。
雖然數組和指針有如此相似地方,但是它們還是有區別的。
(1) 數組名這個指針它是一個指針常量,也就是你不能對它進行算數運算,例如a++這是錯誤的操作。但是我們定義的指針它卻是一個變量。
(2) 我們定義一個數組,它就分配了相應大小的空間,但是定義指針,它只是分配4字節大小空間,它只能指向其它存儲空間,否則,它沒有任何意義。
既然數組和指針有如此多的相似之處,那我們到底是使用數組還是指針呢,這要看具體的上下環境,如果是數組,那么使用數組的下標形式更讓人理解,讓人一看就知道這是一個數組,如果是指針,那就直接使用指針的方式操作,這樣也不會混淆程序的其它閱讀者。
一維數組作為函數參數
當我們將一個數組作為參數傳遞給函數時,實際上是將數組的首地址傳給了子函數。那么這個函數參數該怎么去定義呢,有兩種寫法,例如:
int strlen(char string[]);
int strlen(char* string);
這兩種寫法都是正確的,但是哪種寫法更好呢,當然是使用指針的寫法更好,因為我們的的確確是傳遞的一個指針給函數。
上面是簡單的介紹,接下來是具體的解釋:
數組是什么?什么是左值和右值?
筆者引用《C專家編程》中的一段話:
出現在賦值符左邊的符號有時被稱為左值,出現在賦值符右邊的符號有時被稱為右值。編譯器為每個變量分配一個地址(左值)。這個地址在編譯時可知,而且該變 量在運行時一直保存于這個地址。相反,存儲于變量中的值(它的右值)只有在運行時才可知。如果需要用到變量中存儲的值,編譯器就發出指令從指定地址讀入變 量值并將它存于寄存器中
我對左值的理解和書上有些區別,我把這里的“符號”稱為“對象”,每一個符號都代表一個對象,對象與地址是一一對應的。即如果聲明了 int a,那么 a 作為一個左值時,a 即代表這個保存在某個特定的地址的對象,對這個對象賦值即為把值放在這個特定的地址;a 作為右值時即代表 a 的內容,就是一個單純的值,而不是對象。一個值是不能作為左值的,比如一個常數 1, 1 = a 這樣的賦值語句是無法編譯通過的。在我看來,“左值”義同“對象”,“右值”義同“值”,所以下面“左值”和“對象”指的是相同的東西。但是“左值”又有 一個子集:“可修改的左值”,只有這個子集中的東西才能放在賦值號左邊,因此我認為將引用中的第一句話修改為“出現在賦值符左邊的符號有時被稱為可修改的 左值”更能表達其實際的意思。為什么要引出這個子集,為的就是要把數組分出來,數組是左值,但并不是可修改的左值,因此你也不能直接把數組名放在等號左邊進行賦值。
數組就是數組!
我先把結論放在這里,然后在進行分析:數組就是數組,一個數組名就代表一個數組對象,這個對象內可以有一個或多個元素,每個元素類型都相同;正如 int 就是 int,一個 int 變量名就代表一個 int 類型對象?吹竭@里,你可能要笑了,這不是什么都沒說嗎,誰不知道數組是這個意思啊,我想知道數組和指針什么關系。其實對數組的認識就是這樣一個返璞歸真過程,看我來慢慢解釋。
以下是代碼:
1 /* 1.c */
2 int main()
3 {
4 int foo[] = {1};
5 int bar = 1;
6 return 0;
7 }
使用 gcc 將其匯編并以 intel 格式輸出匯編語言文件:
1 gcc –S –masm=intel 1.c
關鍵部分:
1 mov DWORD PTR [esp+8], 1
2 mov DWORD PTR [esp+12], 1
esp+8 位置就是那個 int foo[],esp+12 位置就是那個 int bar?梢,給 int 數組的賦值時就像給一個 int 變量賦值一樣,并沒用指針來進行間接訪問,這個 int 數組對象 foo 的內存地址在編譯時就確定了,是 esp+8;正如那個 int 對象 bar 一樣,它的內存地址在編譯時也確定了,是esp+12。
以示區別,我將下面代碼同樣以匯編語言輸出:
1 /* 2.c */
2 #include
3 int main()
4 {
5 int *foo = (int *)malloc(sizeof (int));
6 *foo = 1;
7 return 0;
8 }
匯編的關鍵部分:
1 mov DWORD PTR [esp], 4
2 call _malloc
3 mov DWORD PTR [esp+28], eax
4 mov eax, DWORD PTR [esp+28]
5 mov DWORD PTR [eax], 1
前兩句為 foo分配內存空間,第三句將分配的內存空間地址值賦給 foo,foo 的地址為 esp+28,編譯時已知。下面是賦值部分,首先從 foo 那里得到地址值,然后向這個地址賦值,這里可以看出和給數組賦值的差別,給數組賦值時是將值直接賦到了數組中,而不用從哪里得到數組的地址。
由上面可以看出,數組更像一個普通的變量,編譯時就知道了其地址,可以直接賦值。
數組作為左值
數組不能放在賦值號左邊,但數組仍可以作為一個左值或者說對象出現在語句中,一個重要的例子就是取地址操作:&。取地址操作 &的操作數必須是一個左值,而不能是一個右值。比如一個變量int a = 1,&a 就可以得到 a 的地址,但 &1是非法的,一個單純的數值是沒有地址的。那么對于一個int foo[],&foo 會返回一個什么樣的值呢?自然是一個指向數組的指針咯,下面的程序可以看出來:
1 int main()
2 {
3 int foo[1];
4 int bar[1];
5 bar = &foo; //故意觸發一個 error
6 return 0;
7 }
那個賦值語句一定會觸發錯誤,我們可以根據編譯輸出來確定它們的類型,錯誤為:
1 error: incompatible types when assigning to type 'int[1]' from type 'int (*)[1]'
沒錯,&foo 返回數據類型為 int (*)[1],就是一個指向數組的指針。指向數組?指向數組的哪里呢?指向數組對象首地址,正如一個指向 int 對象的指針指向那個 int 對象占有的兩個或四個內存單元的首地址一樣。
把 &foo 賦給一個普通的指針是可以的,不過會觸發一個 warning,因為int * 與 int (*)[1] 并不相容。賦值后普通指針的值與 &foo 的值是相同的,都是數組對象的首地址,只是普通指針把這塊內存當做 int 對象處理而已。
由于 C 語言是弱類型語言,你把 &foo 賦給int **********bar 或者 int *baz都是可以的,都不會導致 error,只會導致 warning,此時你打印出 *bar 或者 *baz 的值都是 foo 中第一個整數的值(前提是指針和數組占用空間大小相等)。正如文章開頭的代碼那樣,以這個整數的值作為一個地址值進行間接訪問(*(*bar))就會導致 非法訪問的錯誤。
數組作為右值
數組作為右值時會發生什么?返回數組對象內的所有值自然不可能,因此 C 語言中采取的方法是數組作為右值時返回對象中元素類型的指針,指針指向第一個元素,類似上一個例子:
1 int main()
2 {
3 int foo[1];
4 int bar[1];
5 bar = foo; //故意觸發一個 error
6 return 0;
7 }
出錯信息為:
1 error: incompatible types when assigning to type 'int[1]' from type 'int *'
數組作為左值和數組作為右值時的區別造成了無數人的困惑與誤解:foo 作為右值時確實等價于一個指針,因為數組無法像普通對象那樣返回它的值,它的元素可能有成百上千個,但作為一個右值時——比如作為取地址操作符的操作數 時,數組就是作為一個數組對象而出現的,而不是指針,取地址返回一個指向數組的指針,而不是指向指針的指針。
接下來再分析下數組指針和指針數組的區別:
數組指針(也稱行指針)
定義 int (*p)[n];
()優先級高,首先說明p是一個指針,指向一個整型的一維數組,這個一維數組的長度是n,也可以說是p的步長。也就是說執行p+1時,p要跨過n個整型數據的長度。
如要將二維數組賦給一指針,應這樣賦值:
int a[3][4];
int (*p)[4]; //該語句是定義一個數組指針,指向含4個元素的一維數組。
p=a; //將該二維數組的首地址賦給p,也就是a[0]或&a[0][0]
p++; //該語句執行過后,也就是p=p+1;p跨過行a[0][]指向了行a[1][]
所以數組指針也稱指向一維數組的指針,亦稱行指針。
指針數組
定義 int *p[n];
[]優先級高,先與p結合成為一個數組,再由int*說明這是一個整型指針數組,它有n個指針 類型的數組元素。這里執行p+1是錯誤的,這樣賦值也是錯誤的:p=a;因為p是個不可知的表示,只存在p[0]、p[1]、p[2]...p[n- 1],而且它們分別是指針變量可以用來存放變量地址。但可以這樣 *p=a; 這里*p表示指針數組第一個元素的值,a的首地址的值。
如要將二維數組賦給一指針數組:
int *p[3];
int a[3][4];
for(i=0;i<3;i++)
p[i]=a[i];
這里int *p[3] 表示一個一維數組內存放著三個指針變量,分別是p[0]、p[1]、p[2],所以要分別賦值。
這樣兩者的區別就豁然開朗了,數組指針只是一個指針變量,似乎是C語言里專門用來指向二維數組的,它占有內存中一個指針的存儲空間。指針數組是多個指針變量,以數組形式存在內存當中,占有多個指針的存儲空間。
還需要說明的一點就是,同時用來指向二維數組時,其引用和用數組名引用都是一樣的。
比如要表示數組中i行j列一個元素:
*(p[i]+j)、*(*(p+i)+j)、(*(p+i))[j]、p[i][j]
綜上所述一句話就是:數組就是數組,有著自己的特性。