編譯器結構

介紹

作為系統軟體，編譯器的設計與實現是非常複雜的。對於一個相對複雜的系統，通常的解決方法是將系統分解成若干較小且便於處理的小系統，分別實現後將其組織成一個完整的複雜系統，這就是"分治法"的思想。實際上，計算機科學家正是運用這種思想來設計與實現編譯器、作業系統、網路通信協定等複雜的大型系統軟體的。

工作過程

編譯器的翻譯過程是非常複雜的，但就過程本身而言，與自然語言翻譯卻有不少相近之處。例如，把英語句子翻譯為漢語句子時，通常需要經過下列幾個步驟：

1）對句子中的每個英語單詞進行識別。

2）對句子的語法結構進行分析。

3）分析句子的基本含義，進行初步翻譯。

4）修飾譯文，使之更加符合漢語的表達習慣。

5）將譯文整理書寫記錄。

編譯器的工作過程與自然語言翻譯過程比較類似，亦可劃分為五個階段：詞法分析、語法分析、語義分析與中間表示生成、代碼最佳化、代碼生成。

1．詞法分析

詞法分析的任務就是對輸入的源程式進行掃描分析，識別出一個個的單詞（Token），並進行歸類。這裡的"單詞"可以理解為源程式中具有獨立含義的不可分割的字元序列，與自然語言中的單詞概念有一定區別。一般而言，根據程式設計語言的特點，單詞可以分為五類：關鍵字、標識符、常量、運算符、界符。以一個C語言的條件語句為例：

if(aa&&10==0)aa=100;

詞法分析的結果是識別出如下的單詞符號：

關鍵字	界符	標識符	運算符	常量	運算符
if	(	aa	&&	10	==
常量	界符	標識符	運算符	常量	界符
0	)	aa	=	100	;

2．語法分析

語法分析的任務就是在詞法分析的基礎上，根據程式設計語言的語法規則（文法），把單詞流分解成各類語法單位（語法範疇），如"語句"、"表達式"等。理論上講，通過語法分析，編譯器可以準確無誤地判斷輸入源程式是否滿足語言的語法規則。例如，語法分析可以判斷如下語句是錯誤的。

ifaa%%10==9aa=100; for(i<0)i++;

不過，實際情況並非完全如此，這主要與文法定義的細化程度有直接的關係。當程式設計語言的設計人員把文法定義得比較寬泛時，也就意味著依據此語法規則，編譯器不能在語法分析階段發現所有的語法錯誤，只能將錯誤遺留給後續階段處理。表面上看，語法分析並不像詞法分析有直觀的輸出結果，而僅僅完成了輸入源程式的語法判定工作。實際上，語法分析是編譯器前面三個階段（合稱為前端）的主控模組。

3．語義分析與中間表示生成

語義分析與中間表示生成的任務就是在語法分析的基礎上，分析各語法單位的含義，並進行初步的翻譯，即生成中間表示形式。有時，這兩個任務是密不可分的，故通常將其合併為一個階段討論。語義分析主要是檢查輸入源程式的語義是否正確，例如，變數使用前是否定義、同一作用域內變數是否重名等。中間表示生成將根據輸入源程式的語義生成語義等價中間表示形式。中間表示是一種由編譯器設計人員定義、使用的形式，對於用戶是完全透明的。中間表示形式的定義是值得深入研究的，因為它直接決定了編譯器前、後端的設計複雜度，也決定了編譯器前端與目標語言之間的耦合程度。中間表示的形式也非常多，包括四元組、三元組、語法樹、DAG圖等，並不一定是讀者理解的通常的代碼形式。例如，lcc的中間表示就是一種DAG的形式。當然，近似於彙編指令形式的四元組、三元組可能是最為常見的中間表示形式。

編譯器結構

基本介紹

介紹

工作過程

端

語言

相關詞條

熱門詞條