درهمسازی کامل پویا
در علم کامپیوتر، درهم سازی پویای کامل، تکنیکی است برای از بین بردن تصادم در یک داده ساختار جدول درهم سازی. این تکنیک برای پرسمانهای سریع، درج و حذف روی مقادیر زیادی از داده کاربرد دارد.
جزئیات
در این روش، ورودیهایی که به یک خانه از جدول نظیر میشوند، مانند یک جدول درهم سازی سطح دوم جدا سازماندهی میشوند. اگر k ورودی در مجموعه S داشته باشیم، برای جدول درهم سازی ثانویه، k خانه اختصاص میدهیم و تابع درهم سازی آن، از توابع جهانی درهم سازی به صورت تصادفی به گونهای انتخاب میشوند که عاری از تصادم باشد (برای مثال، تابع درهم سازی کامل). بنابراین هزینه جستجو مطمئناً در بدترین حالت از (1)O خواهد شد.
function Locate(x) is
j = h(x);
if (position hj(x) of subtable Tj contains x (not deleted))
return (x is in S);
end if
else
return (x is not in S);
end else
end
با اینکه هر جدول سطح دوم، به یک فضای درجه دوم نیاز دارد، اگر کلیدهای وارد شده به جدول سطح اول دارای توزیع یکنواخت باشند، کل ساختار از فضای (O(n خواهد بود؛ زیرا سایز سطل به احتمال زیاد، کم است.
در طول درج ورودی جدید x در مکان j اُم، شمارنده جهانی دستورها، count، یک واحد افزایش مییابد. اگر x در j وجود داشته باشد اما به عنوان یک عضو حذف شده برچسب خورده باشد، برچسب آن برداشته میشود. اگر x در j یا زیرجدول Tj وجود داشته باشد و به عنوان یک عضو حذف شده برجسب نخورده باشد، پس یک تصادم روی داده و خانه j اُم سطل جدول سطح دوم Tj دوباره با انتخاب تصادفی تابع درهم سازی hj ساخته میشود. زیرا ضریب بارگذاری جدول سطح دوم، کم نگه داشته میشود. بازسازی کم صورت گرفته و هزینه سرشکن درجها، از (1)O خواهد شد.
function Insert(x) is
count = count + 1;
if (count> M)
FullRehash(x);
end if
else
j = h(x);
if (Position hj(x) of subtable Tj contains x)
if (x is marked deleted)
remove the delete marker;
end if
end if
else
bj = bj + 1;
if (bj <= mj)
if position hj(x) of Tj is empty
store x in position hj(x) of Tj;
end if
else
Put all unmarked elements of Tj in list Lj;
Append x to list Lj;
bj = length of Lj;
repeat
hj = randomly chosen function in Hsj;
until hj is injective on the elements of Lj;
for all y on list Lj
store y in position hj(y) of Tj;
end for
end else
end if
else
mj = ۲ * max{1, mj};
sj = ۲ * mj * (mj - 1);
if the sum total of all sj ≤ ۳۲ * M / s(M) + 4 * M
Allocate sj cells for Tj;
Put all unmarked elements of Tj in list Lj;
Append x to list Lj;
bj = length of Lj;
repeat
hj = randomly chosen function in Hsj;
until hj is injective on the elements of Lj;
for all y on list Lj
store y in position hj(y) of Tj;
end for
end if
else
FullRehash(x);
end else
end else
end else
end else
end
حذف عنصر xبه سادگی بدون اینکه واقعاً آن را حذف کند یا count را زیاد کند، آن را به عنوان یک عضو حذف شده علامتگذاری میکند. در صورت انجام هردو عمل حذف و درج، اگر count به آستانه M برسد، کل جدول بازسازی میشود. M در ابتدای یک فاز جدید، یک مقدار مشخص و چند برابر سایز S است. در اینجا فاز به معنای زمان بین بازسازیهای کامل است. هزینه سرشکن حذف برابر (O(1 است. توجه کنید که در اینجا، مقدار -۱ در تابع "(Delete(x" بیانگر یک مقداری است که در مقادیر ممکن Uنیست.
function Delete(x) is
count = count + 1;
j = h(x);
if position h(x) of subtable Tj contains x
mark x as deleted;
end if
else
return (x is not a member of S);
end else
if (count>= M)
FullRehash(-1);
end if
end
یک بازسازی کامل از جدولS، با پاک کردن تمام اعضای برچسب خورده شروع شده و با مقدار دهی آستانه بعدی M در یک ثابت که چند برابر سایز S است ادامه پیدا میکند. یک تابع درهم سازی، که S را به چند زیرمجموعه(s(M تقسیم میکند (که سایز زیرمجموعه j برابر sj است) آنقدر به صورت تصادفی انتخاب میشود تا:
در نهایت، برای هر زیرجدول Tj، یک تابع درهم سازی hj به صورت تصادفی آنقدر از Hsj انتخاب میشود تا hj روی Tjیک به یک باشد. زمان پیشبینی شده برای بازسازی کامل جدولS با سایزn برابر (O(n خواهد شد.
function FullRehash(x) is
Put all unmarked elements of T in list L;
if (x is in U)
append x to L;
end if
count = length of list L;
M = (1 + c) * max{count, 4};
repeat
h = randomly chosen function in Hs(M);
for all j <s(M)
form a list Lj for h(x) = j;
bj = length of Lj;
mj = ۲ * bj;
sj = ۲ * mj * (mj - 1);
end for
until the sum total of all sj ≤ ۳۲ * M / s(M) + 4 * M
for all j <s(M)
Allocate space sj for subtable Tj;
repeat
hj = randomly chosen function in Hsj;
until hj is injective on the elements of list Lj;
end for
for all x on list Lj
store x in position hj(x) of Tj;
end for
end
جستارهای وابسته
منابع
- ↑ Fredman, M. L. , Komlós, J. , and Szemerédi, E. 1984. Storing a Sparse Table with 0(1) Worst Case Access Time. J. ACM 31, 3 (Jun. 1984), 538-544 http://portal.acm.org/citation.cfm?id=1884#
- ↑ Dietzfelbinger, M. , Karlin, A. , Mehlhorn, K. , Meyer auf der Heide, F. , Rohnert, H. , and Tarjan, R. E. 1994. Dynamic Perfect Hashing: Upper and Lower Bounds. SIAM J. Comput. 23, 4 (Aug. 1994), 738-761. http://portal.acm.org/citation.cfm?id=182370#
- ↑ Erik Demaine, Jeff Lind. 6.897: Advanced Data Structures. MIT Computer Science and Artificial Intelligence Laboratory. Spring 2003. http://courses.csail.mit.edu/6.897/spring03/scribe_notes/L2/lecture2.pdf