以下是我看Olve Maudal 的投影片:Deep C 的心得
(為了了解內容我有參考wiki跟jserv大的C語言講座)
本文只有提到C的部份,C++的部份會另外寫。
投影片連結:
http://slideshare.net/olvemaudal/deep-c
1. 指出以下程式碼的結果與缺失
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
int main() | |
{ | |
int a = 42; | |
printf("%d\n", a); | |
} |
- 需 #include <stdio.h> 以明確宣告printf函式
- 若使用C++編譯器編譯會失敗,因為C++編譯器需要明確(explicit)宣告使用函式。
- 一般的C編譯器在函式未宣告的情況下會自動新增implicit宣告函式。
- 當連結(link)到標準函式庫,編譯器會找到prinf這個函式
- main為int型態卻沒有回傳值(return 0)
- C99或更新的版本,main的回傳值為執行的成功(0)與否
- 但是ANSI C或K&R C,在這種情況下回傳值為未定義(undefined)
- 有可能是3(因為printf的回傳值為輸出的char數)
- 標準C應該要用main(void) (void表示不需要額外參數)
- 標準C表示程式碼必須以一個空行做結。
- static變數和global(全域)變數(被宣告在main外面)被宣告時自動被預設為0,非static變數(在{}之內時被自動設為auto)宣告時預設值為undefined,這是因為
- "預設變數為0"這個動作是要額外消耗CPU的,而C語言是非常在乎程式效能的,所以在不需要的情況下不會刻意去做這種消耗CPU的事。
- static跟global變數是被存在Data(有初始值)或BSS(無初始值)內,這兩個區塊中的變數都是在編譯期就會固定住變數的位址,所以被預設為0不會影響到執行的效率。此兩種變數的生命期跟程式的執行期一樣長
- 而auto變數是被儲存在stack裏面,其位址並沒有被固定住。此種變數的生命期只限於宣告位置前後的{}。
- static變數的影響力只限宣告該變數的檔案,global變數的影響力括及其他的obj檔案。
- 但是在C++的情況下,static變數是被預設成"某個預設值"(naive的情況就是0)
- 使用malloc/calloc/realloc宣告的某pointer空間,其生命期截止於free該pointer的時候
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
#include <stdio.h> | |
void foo(void) | |
{ | |
int a; | |
++a; | |
printf("%d\n", a); | |
} | |
int main(void) | |
{ | |
foo(); | |
foo(); | |
foo(); | |
} |
- a預設值為undefined
- 但在除錯模式的情況下,執行期有可能代為執行memset使得預設值為0
- 依本程式來看,a宣告的時候有可能都出現在stack內同樣的address中,所以本程式的執行結果可能會顯示出3個連續的數列(ex: 1,2,3 or 0,1,2 or 22,23,24),不過這視編譯最佳化的結果而定。
預測以下程式碼的結果並解釋原因
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
#include <stdio.h> | |
void foo(void) | |
{ | |
int a; | |
printf("%d\n", a); | |
} | |
void bar(void) | |
{ | |
int a=42; | |
} | |
int main(void) | |
{ | |
bar(); | |
foo(); | |
} |
- 沒最佳化的情況會是42
- 有最佳化的可能情況:
- 省去bar(),反正沒影響
- foo會變成main內的inline函式(反正沒其他函式會呼叫,這樣節省函式調用時間)
- 所以結果可能會變成某個奇怪的數字(undefined)
- 平常儘可能用最佳化參數,以發現潛在的問題。
順序點是副作用發生與否的分界點,在順序點左邊的表示已經發生,右邊的還未發生。在兩個順序點之間變量只能改變一次,不然結果會是undefined。ex: (i=i++; 在分號前i的值改變兩次,結果會是undefined)。C/C++裡的順序點其實不多,大致如下:
- &&, ||, 或?(三元運算符)
ex: (*a++ != 0 && *b++ != 0) -> 會先算出*a++ != 0,再算出*b++ != 0,然後比較&& - 完整表達式(用;當然這有點廢話)
- 以逗號分開的變數初始化
ex: int a[3] = {b++,c--,d(101)}; int x=a++, y=a++; 一定是從左到右(好像是從C++11開始?) - 函式的進入點
ex: f(i++) + g(j++) + h(k++), 進入函式f/g/h的是增加過後的i/j/k,不過f/g/h哪個函式先開始呼叫並沒有指定(unspecified behavior)。 - 涉及到I/O
ex: printf("Bug %n %d", &a, 11); 在printf %d前會先執行%n(類似fprintf出多少char)的動作(這裡有爭議)
- 此為size_t變數,在32bit的機器上通常為unsigned int,而在64bit的機器上通常為unsigned long
- 所以printf的時候有時會出問題,不能都用%u或%lu。C99以後可以用%zu代表size_t的變數
預測以下程式碼的結果並說明原因(假設為64bit機器):
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
#include <stdio.h> | |
Struct X {int a; char b; int c;}; | |
int main(void) { | |
printf("%zd\n", sizeof(int)); | |
printf("%zd\n", sizeof(char)); | |
printf("%zd\n", sizeof(struct X)); | |
} |
- 若有類似gcc中-fpack-struct的參數去收緊struct大小,結果會是4,1,9(不做alignment)
- 有word alignment的情況下會是4,1,12
- 若是在struct X中多加一個char d;
- 如果char d;在int c;後面,可能會變成4,1,16
- 如果char d;在char b;後面,可能會維持4,1,12
- 結論是看最佳化的演算法而定
- 若是在struct X中多加一個char* d;
- 以alignment的結果而定,有可能會是4,1,20或4,1,24
- C/C++編譯器並不會以紀錄struct內變數成員的方法去做最佳化
- 相信coder的能力
- 語言本身儘可能設計得簡單扼要
- 只允許單一方法完成一個動作
- 執行起來愈快愈好,就算要讓程式本身大一點
- 維護起來簡單
- 不會阻止coder去做必須要做的事(因為相信coder)