散列查找

基本概念

散列函式

在進行查找時，在記錄的存儲位置與它的關鍵字之間建立一個確定的對應關係h,以線性表中每個元素的關鍵字K為自變數，通過函式h(K)計算出該元素的存儲位置，我們將h函式稱為散列函式或哈希函式。h(K)的值稱為散列地址或哈希地址。例：

假定一個線性表為A=(18,75,60,43,54,90,46)，選取散列函式為：

h(K)=K%m 取m=13

則得每個元素散列地址：

h(18)=18 % 13=5 h(75)=75 % 13=10 h(60)=60 % 13=8 h(43)=43 % 13=4

h(54)=54 % 13=2 h(90)=90 % 13=12 h(46)=46 % 13=7

根據散列地址，實現元素的存儲映象H[m]：

	0	1	2	3	4	5	6	7	8	9	10	11	12
H			54		43	18		46	60		75		90

衝突：在實際套用中，通常可能出現一個待插入元素的散列地址單元已被占用情況，使得該元素無法直接存入此單元，這種情況稱為衝突。

同義詞：具有不同關鍵字而具有相同散列地址的元素稱為同義詞，即key1≠key2，但h(key1)=h(key2)。由同義詞引起的衝突稱作同義詞衝突。

例：如向下表中再插入元素70時，70%13=5，則出現了衝突

	0	1	2	3	4	5	6	7	8	9	10	11	12
H			54		43	18		46	60		75		90

裝填因子(α)：指散列表中已存入的元素數n與散列表空間大小m的比值,即：α=n/m。當α越小時，衝突可能性就越小，但同時，存儲空間利用率就越低。

散列表：根據設定的哈希函式及處理衝突的方法將一組關鍵字映象到一個有限的連續的地址集上，即把記錄存放在表中映象的位置上，這種表便稱為散列表(哈希表)。

一個散列表的好壞與三個因素有關：

1.裝填因子 2、所採用的散列函式 3、解決衝突的方法

散列函式

構造散列函式的目標是使散列地址儘可能均勻分布在散列空間上，同時使計算儘可能簡單，以節省計算時間。

直接定址法

以關鍵字K本身或關鍵字加上某個數值常量C作為散列地址的方法，對應的散列函式：

h(K)=K+C (C為常數)

例：有一個解放後出生的人口調查表，關鍵字是年份，h(K)=K+(-1948)，如表所示：

地址 01 02 03 … 22 …
年份	1949 1950 1951 … 1970 …
人數	… … … 15000 ...

除留餘數法

以關鍵字K除以散列長度m所得餘數作為散列地址的方法，對應的散列函式：

h(K)=K%m

m為散列表長，取m=13,得散列表：

	0	1	2	3	4	5	6	7	8	9	10	11	12
H			54		43	18		46	60		75		90

key		Hash(key)
319426	102032968476	29
718309 629443 758615 919697 310329	515967819481 396198480249 572938783923 287438470282 239849810284	78 12 34 55 32

key	f*key	n((fkey)的小數部分)	Hash(key)
319426	32929.29313	29.89241	29
718309 629443 758615 919697 310329	49348.24351 73829.99024 89008.22413 68940.52641 90872.13715	24.98313 99.52341 22.98301 53.23949 14.39491	78 12 34 55 32

散列查找

基本介紹

基本概念

散列函式

直接定址法

除留餘數法

數字分析法

平方取中法

摺疊法：

隨機乘數法：

基數轉換法：

處理衝突的方法

開放定址法

鍊表地址法

散列表的運算

相關詞條

熱門詞條