حساب کاربری
​
زمان تقریبی مطالعه: 9 دقیقه
لینک کوتاه

تئوری کارانن-لوف

قضیهٔ کارهونِن-لُواِو (به انگلیسی: Karhunen-Loève Theorem)، یک فرایند تصادفی در یک بازهٔ کران‌دار را با ترکیب خطی نامحدودی از توابع متعامد نمایش می‌دهد.

این قضیه به افتخار کاری کارهونِن و میشل لُواِو نامیده شده‌است، و به آن قضیه Kosambi-Karhunen-Loève هم گفته می‌شود.

این تبدیل هم‌چنین به تبدیل هُتِلینگ و تبدیل بردار ویژه نیز شناخته می‌شود و با تحلیل مولفه اصلی (به انگلیسی: Principal Component Analysis, PCA) مرتبط است که در پردازش تصویر و آنالیز داده‌ها، فراوان استفاده می‌شود.

در مقایسه با تبدیل فوریه، که ضرایب آن اعداد معیّن (deterministic)، و پایه‌های آن، توابع سینوسی هستند، ضرایب تبدیل کارهونن-لُواِو، متغیرهای تصادفی هستند و پایه‌های آن، بستگی به فرایند دارند. می‌توان گفت این تبدیل به‌گونه‌ای با فرایند تصادفی سازگار می‌شود که به بهترین پایه‌ها برای آن فرایند می‌انجامد.

برای یک فرایند تصادفی متمرکز {Xt}t ∈ [a, b] (E[Xt] = 0، t ∈ [a, b]) می‌نویسیم:

X t = ∑ k = 1 ∞ Z k c k ( t ) {\displaystyle X_{t}=\sum _{k=1}^{\infty }Z_{k}c_{k}(t)}

که در آن Z k {\displaystyle Z_{k}}

ها متغیرهای تصادفی، و دوبه‌دو ناهمبسته هستند و c k {\displaystyle c_{k}}
ها، توابع پیوسته حقیقی در بازهٔ [a, b] و دوبه‌دو در L([a, b]) متعامد هستند. فرایندی که متمرکز نیست را می‌توان با Xt − E[Xt] متمرکز کرد.

اگر فرایند گاوسی باشد، Z k {\displaystyle Z_{k}}

ها گاوسی، و مستقل آماری هستند. یک مثال از یک فرایند متمرکز در بازهٔ [0, 1]، فرایند وینر است.

فهرست

  • ۱ فرمول
  • ۲ بیانی از قضیه
  • ۳ اثبات
  • ۴ مشخصات تبدیل کارهونن-لُواِو
    • ۴.۱ حالت خاص: توزیع گاوسی
    • ۴.۲ بسط کارهونِن-لُواِو فرایند را ناهمبسته می‌کند
    • ۴.۳ بسط کارهونِن-لُواِو مقدار خطای میانگین مربعات را به حداقل می‌رساند
    • ۴.۴ یافتن واریانس
  • ۵ منابع

فرمول

  • Xt یک فرایند تصادفی با میانگین صفر و انتگرال پذیر برای مربع آن در فضای احتمال (Ω, F, P) تعریف می‌شود و نمایه آن در بازهٔ بستهٔ [a, b] با تابع کوواریانس KX(s, t). به این ترتیب:
∀ t ∈ [ a , b ] X t ∈ L 2 ( Ω , F , P ) , {\displaystyle \forall t\in [a,b]\qquad X_{t}\in L^{2}(\Omega ,F,\mathbf {P} ),}
∀ t ∈ [ a , b ] E [ X t ] = 0 , {\displaystyle \forall t\in [a,b]\qquad \mathbf {E} [X_{t}]=0,}
∀ t , s ∈ [ a , b ] K X ( s , t ) = E [ X s X t ] . {\displaystyle \forall t,s\in [a,b]\qquad K_{X}(s,t)=\mathbf {E} [X_{s}X_{t}].}
  • یک عملگر خطی TKX را در KX اعمال می‌کنیم. TKX به این صورت تعریف می‌شود:
T K X : L 2 ( [ a , b ] ) → L 2 ( [ a , b ] ) : f ↦ T K X f = ∫ a b K X ( s , ⋅ ) f ( s ) d s {\displaystyle T_{K_{X}}:L^{2}([a,b])\to L^{2}([a,b]):f\mapsto T_{K_{X}}f=\int _{a}^{b}K_{X}(s,\cdot )f(s)ds}
ازآنجاکه TKX یک عمل‌گر خطی‌ست، مقدار ویژه λk و تابع ویژه ek دارد، که در معادله‌ انتگرالی زیر، به هم مربوط می‌شوند:
∫ a b K X ( s , t ) e k ( s ) d s = λ k e k ( t ) {\displaystyle \int _{a}^{b}K_{X}(s,t)e_{k}(s)\,ds=\lambda _{k}e_{k}(t)}

بیانی از قضیه

قضیه. Xt را یک فرایند تصادفی با میانگین صفر و انتگرال پذیر برای مربع آن در فضای احتمال (Ω, F, P) و نمایه آن در بازهٔ بستهٔ [a, b] با تابع کوواریانس پیوستهٔ KX(s, t) در نظر می‌گیریم.

حال KX(s, t) یک هسته ی Mercer است و ek را یک پایهٔ متعامد بر روی L([a, b]) می‌گیریم که از توابع ویژهٔ TKX دارای مقدار ویژهٔ λk تشکیل شده‌است. می‌توان Xt را به صورت زیر بیان کرد

X t = ∑ k = 1 ∞ Z k e k ( t ) {\displaystyle X_{t}=\sum _{k=1}^{\infty }Z_{k}e_{k}(t)}

که در L هم‌گراست و

Z k = ∫ a b X t e k ( t ) d t {\displaystyle Z_{k}=\int _{a}^{b}X_{t}e_{k}(t)\,dt}

همچنین متغیرهای تصادفی Zk دارای میانگین صفر، ناهم‌بسته و دارای واریانس λk هستند

E [ Z k ] = 0 ,   ∀ k ∈ N and E [ Z i Z j ] = δ i j λ j ,   ∀ i , j ∈ N {\displaystyle \mathbf {E} [Z_{k}]=0,~\forall k\in \mathbb {N} \qquad {\mbox{and}}\qquad \mathbf {E} [Z_{i}Z_{j}]=\delta _{ij}\lambda _{j},~\forall i,j\in \mathbb {N} }

اثبات

  • تابع کوواریانس KX شرایط تعریف هسته‌ی Mercer را داراست. طبق تئوری Mercer، یک مجموعهٔ {λk, ek(t)} وجود دارد که از مقدار ویژه‌ها و توابع ویژهٔ TKX، یک مجموعه متعامد از L([a,b]) تشکیل می‌دهند و KX را نیز می‌توان به صورت زیر نمایش داد:
K X ( s , t ) = ∑ k = 1 ∞ λ k e k ( s ) e k ( t ) {\displaystyle K_{X}(s,t)=\sum _{k=1}^{\infty }\lambda _{k}e_{k}(s)e_{k}(t)}
  • فرایند Xt می‌تواند به صورت تابعی از ekها به صورت زیر بسط پیدا کند:
X t = ∑ k = 1 ∞ Z k e k ( t ) {\displaystyle X_{t}=\sum _{k=1}^{\infty }Z_{k}e_{k}(t)}

که در آن ضرایب (متغیرهای تصادفی) Zk به صورت زیر به دست می‌آیند:

Z k = ∫ a b X t e k ( t ) d t {\displaystyle Z_{k}=\int _{a}^{b}X_{t}e_{k}(t)\,dt}
  • حال خواهیم داشت:
E [ Z k ] = E [ ∫ a b X t e k ( t ) d t ] = ∫ a b E [ X t ] e k ( t ) d t = 0 E [ Z i Z j ] = E [ ∫ a b ∫ a b X t X s e j ( t ) e i ( s ) d t d s ] = ∫ a b ∫ a b E [ X t X s ] e j ( t ) e i ( s ) d t d s = ∫ a b ∫ a b K X ( s , t ) e j ( t ) e i ( s ) d t d s = ∫ a b e i ( s ) ( ∫ a b K X ( s , t ) e j ( t ) d t ) d s = λ j ∫ a b e i ( s ) e j ( s ) d s = δ i j λ j {\displaystyle {\begin{aligned}\mathbf {E} [Z_{k}]&=\mathbf {E} \left[\int _{a}^{b}X_{t}e_{k}(t)\,dt\right]=\int _{a}^{b}\mathbf {E} [X_{t}]e_{k}(t)dt=0\\[8pt]\mathbf {E} [Z_{i}Z_{j}]&=\mathbf {E} \left[\int _{a}^{b}\int _{a}^{b}X_{t}X_{s}e_{j}(t)e_{i}(s)dt\,ds\right]\\&=\int _{a}^{b}\int _{a}^{b}\mathbf {E} \left[X_{t}X_{s}\right]e_{j}(t)e_{i}(s)dt\,ds\\&=\int _{a}^{b}\int _{a}^{b}K_{X}(s,t)e_{j}(t)e_{i}(s)dt\,ds\\&=\int _{a}^{b}e_{i}(s)\left(\int _{a}^{b}K_{X}(s,t)e_{j}(t)dt\right)ds\\&=\lambda _{j}\int _{a}^{b}e_{i}(s)e_{j}(s)ds\\&=\delta _{ij}\lambda _{j}\end{aligned}}}
که در آن از این نکته استفاده شده است که ekها توابع ویژهٔ TKX بوده و متعامد هستند.
  • حال نشان می‌دهیم که همگرایی در L است. فرض می‌کنیم
S N = ∑ k = 1 N Z k e k ( t ) . {\displaystyle S_{N}=\sum _{k=1}^{N}Z_{k}e_{k}(t).}
آنگاه:
E [ | X t − S N | 2 ] = E [ X t 2 ] + E [ S N 2 ] − 2 E [ X t S N ] = K X ( t , t ) + E [ ∑ k = 1 N ∑ l = 1 N Z k Z l e k ( t ) e l ( t ) ] − 2 E [ X t ∑ k = 1 N Z k e k ( t ) ] = K X ( t , t ) + ∑ k = 1 N λ k e k ( t ) 2 − 2 E [ ∑ k = 1 N ∫ a b X t X s e k ( s ) e k ( t ) d s ] = K X ( t , t ) − ∑ k = 1 N λ k e k ( t ) 2 {\displaystyle {\begin{aligned}\mathbf {E} \left[\left|X_{t}-S_{N}\right|^{2}\right]&=\mathbf {E} \left[X_{t}^{2}\right]+\mathbf {E} \left[S_{N}^{2}\right]-2\mathbf {E} \left[X_{t}S_{N}\right]\\&=K_{X}(t,t)+\mathbf {E} \left[\sum _{k=1}^{N}\sum _{l=1}^{N}Z_{k}Z_{l}e_{k}(t)e_{l}(t)\right]-2\mathbf {E} \left[X_{t}\sum _{k=1}^{N}Z_{k}e_{k}(t)\right]\\&=K_{X}(t,t)+\sum _{k=1}^{N}\lambda _{k}e_{k}(t)^{2}-2\mathbf {E} \left[\sum _{k=1}^{N}\int _{a}^{b}X_{t}X_{s}e_{k}(s)e_{k}(t)ds\right]\\&=K_{X}(t,t)-\sum _{k=1}^{N}\lambda _{k}e_{k}(t)^{2}\end{aligned}}}
که طبق قضیهٔ Mercer به صفر میل می‌کند.

مشخصات تبدیل کارهونن-لُواِو

حالت خاص: توزیع گاوسی

ازآنجاکه حد امید ریاضی متغیرهای تصادفی مشترکاً گاوسی، خود مشترکاً گاوسی هستند و متغیرهای تصادفی گاوسی مستقل هستند اگر و فقط اگر متعامد باشند، می‌توان نتیجه گرفت: قضیه. متغیر تصادفی Zi دارای توزیع مشترک گاوسی است و به‌طور تصادفی مستقل است اگر فرایند اولیه {Xt}t گاوسی باشد.

در این حالت (گاوسی بودن)، از آنجایی که Ziها مستقل هستند، می‌توان گفت:

lim N → ∞ ∑ i = 1 N e i ( t ) Z i ( ω ) = X t ( ω ) {\displaystyle \lim _{N\to \infty }\sum _{i=1}^{N}e_{i}(t)Z_{i}(\omega )=X_{t}(\omega )}

almost surely.

بسط کارهونِن-لُواِو فرایند را ناهمبسته می‌کند

این نتیجه از استقلال Zk حاصل می‌شود.

بسط کارهونِن-لُواِو مقدار خطای میانگین مربعات را به حداقل می‌رساند

در بخش معرفی، بیان کردیم که بسط خلاصه شدهٔ کارهونِن-لُواِو بهترین تخمین برای یک فرایند است به طوری که خطای میانگین مربعات حداقل شود. به خاطر همین خصوصیت است که بیان می‌شود این تبدیل به‌طور بهینه انرژی را فشرده (ذخیره) می‌کنند. به‌طور دقیق تر، برای هر پایهٔ متعامد {fk} از فضای L([a, b])، می‌توان فرایند Xt را به صورت زیر تجزیه کرد:

X t ( ω ) = ∑ k = 1 ∞ A k ( ω ) f k ( t ) {\displaystyle X_{t}(\omega )=\sum _{k=1}^{\infty }A_{k}(\omega )f_{k}(t)}

که در آن

A k ( ω ) = ∫ a b X t ( ω ) f k ( t ) d t {\displaystyle A_{k}(\omega )=\int _{a}^{b}X_{t}(\omega )f_{k}(t)\,dt}

و می‌توان Xt را با جمع متناهی زیر برای هر عدد صحیح 'N به صورت زیر تخمین زد

X ^ t ( ω ) = ∑ k = 1 N A k ( ω ) f k ( t ) {\displaystyle {\hat {X}}_{t}(\omega )=\sum _{k=1}^{N}A_{k}(\omega )f_{k}(t)}

یافتن واریانس

یک نتیجهٔ مهم این تبدیل را می‌توان این مورد در نظر گرفت که از آنجایی که Zkها در تبدیل کارهونِن-لُواِو ناهمبسته هستند، Bienaymé formula نتیجه می‌دهد که Xt برابر است با جمع واریانس جملات جمع، داریم:

Var [ X t ] = ∑ k = 0 ∞ e k ( t ) 2 Var [ Z k ] = ∑ k = 1 ∞ λ k e k ( t ) 2 {\displaystyle {\mbox{Var}}[X_{t}]=\sum _{k=0}^{\infty }e_{k}(t)^{2}{\mbox{Var}}[Z_{k}]=\sum _{k=1}^{\infty }\lambda _{k}e_{k}(t)^{2}}

تعریف شده روی [a, b] و استفاده از این مسئله که ekها متعامد هستند، نتیجه می‌گیریم که واریانس کل فرایند برابر است با:

∫ a b Var [ X t ] d t = ∑ k = 1 ∞ λ k {\displaystyle \int _{a}^{b}{\mbox{Var}}[X_{t}]dt=\sum _{k=1}^{\infty }\lambda _{k}}

منابع

  1. ↑ Sapatnekar, Sachin (2011), "Overcoming variations in nanometer-scale technologies", IEEE Journal on Emerging and Selected Topics in Circuits and Systems, 1 (1): 5–18, doi:10.1109/jetcas.2011.2138250
  2. ↑ Ghoman, Satyajit; Wang, Zhicun; Chen, PC; Kapania, Rakesh (2012), A POD-based Reduced Order Design Scheme for Shape Optimization of Air Vehicles {{}}: Unknown parameter |book-title= ignored (help)
  3. ↑ Karhunen-Loeve Transform (KLT) بایگانی‌شده در ۲۸ نوامبر ۲۰۱۶ توسط Wayback Machine, Computer Image Processing and Analysis (E161) lectures, Harvey Mudd College
آخرین نظرات
کلیه حقوق این تارنما متعلق به فرا دانشنامه ویکی بین است.