पीडीएलपी के लिए गणितीय बैकग्राउंड

इस पेज पर, डेवलपर और पीडीपी के ज़्यादा जानकारी रखने वाले उपयोगकर्ताओं के लिए, गणित के विषय का बैकग्राउंड मौजूद है. यह OR-टूल में उपलब्ध लीनियर और क्वाड्रेटिक प्रोग्रामिंग सॉल्वर है. यह कोड के कुछ हिस्सों के लिए रेफ़रंस के तौर पर काम करता है, न कि सिर्फ़ पढ़ने के लिए. दिलचस्पी रखने वाले लोगों को सबसे पहले "प्रैक्टिकल लार्ज-स्केल लीनियर प्रोग्रामिंग इस्तेमाल करके प्राइमल-ड्यूअल हाइब्रिड ग्रेडिएंट" पेपर के बारे में पढ़ना चाहिए. इसके बाद, कोड को देखें और जब कोड इसका रेफ़रंस दे, तो इस दस्तावेज़ पर वापस आएं.

प्राइमल

पीडीपी, इन कन्वेक्स क्वाड्रेटिक प्रोग्रामिंग समस्या को ध्यान में रखता है,

min

जहां A एक m \times n मैट्रिक्स है और Q, डाइगनल नॉन-नेगेटिव n \times n मैट्रिक्स1 है. अपर बाउंड वेक्टर u^{c} और u^{v} की एंट्री \mathbb{R} \cup \{ \infty\} में हैं, और लोअर बाउंड वेक्टर l^{c} और l^{v} में एंट्री हैं \math\b{R} \cup \cup \yl. ${ ^ $.

Dual

a \in \mathbb{R}. मान लें कि [a]_+ इसका पॉज़िटिव पार्ट दिखाता है और [a]_- इसका नेगेटिव हिस्सा दिखाता है, यानी a = [a]_+ - [a]_-. किसी वेक्टर पर लागू करने पर, पॉज़िटिव और नेगेटिव पार्ट का आकलन, एलिमेंट के हिसाब से किया जाता है.

पहले की मूल समस्या का ड्यूअल, x \in \mathbb{R}^n, y \in \mathbb{R}^m, और r \in \mathbb{R}^n से ज़्यादा है. वेक्टर y में लीनियर\वेक्टर (l^{c} \le Axresd) पर ड्यूअल मल्टीप्लायर शामिल हैं, ^${redus}.

\begin{align} \max_{x, y, r} & \, -\frac{1}{2}x^TQx + \left((l^{c})^T[y]_+ - (u^{c})^T[y]_- \right) + \left((l^{v})^T[r]_+ - (u^{v})^T[r]_- \right) \\ \text{s.t.}\; & Qx + c - A^Ty = r \end{align}

Q = 0 होने पर, x को डुअल से हटाया जा सकता है, जिससे LP द्वैता वापस मिल जाता है.

ड्यूअल वैरिएबल बाउंड

हम कहते हैं कि y ड्यूअल वैरिएबल सीमाओं को पूरा करता है. ऐसा तब होता है, जब मकसद में y-term सीमित हो, यानी कि:

y_i \geq 0 \qquad \text{if }u^c_i = \infty, \\ y_i \leq 0 \qquad \text{if }l^c_i = -\infty.

संयुग्मी द्वैत का इस्तेमाल करके व्युत्पन्न करना

प्रारंभिक दौर

a \in \mathbb{R} \cup \{-\infty\} और b \in \mathbb{R} \cup \{\infty\} को b \ge a के साथ स्वीकार करें और अंतराल $[a, b] \subseteq \mathbb{R} \cup $yft.

\mathcal{I}_{[a, b]} : \mathbb{R} \to \mathbb{R} \cup \{ \infty\} यह देखें कि इंटरवल का इंडिकेटर फ़ंक्शन है, यानी \mathcal{I}_{[a, b]}(x) जब x b]}(x) में शून्य होगा और ऐसा नहीं होगा

p(y; a, b): \mathbb{R} \to \mathbb{R} \cup \{\infty\} को इस रूप में परिभाषित करें:

p(y; a, b) = \begin{cases} ay & \text{ if } y < 0 \\ 0 & \text{ if } y = 0 \\ by & \text{ if } y > 0 \end{cases}.

जब a या b अनंत हो, तो स्टैंडर्ड एक्सटेंडेड रीयल अंकगणित अपनाएं.

बुनियादी नतीजा: p(y; a, b) = (\mathcal{I}_{[a, b]})^*(y) जहां (\cdot)^* उद्धरण संयुग्मी को दिखाता है.

l \subseteq (\mathbb{R} \cup \{-\infty\})^n और u \subseteq (\mathbb{R} \cup \{\infty\})^n, सूचक \mathcal\जैसा}_{[l,u]} :

पहले से मौजूद रचना पर आधारित काम

पेश हैं सहायक वैरिएबल \tilde a \in \mathbb{R}^m और \tilde x \in \mathbb{R}^n, हम शुरुआती समस्या को इस तरह बताते हैं:

\begin{align} \min_{x, \tilde x, \tilde a} & \, c^Tx + \frac{1}{2}x^TQx + \mathcal{I}_{[l^c,u^c]}(\tilde a) + \mathcal{I}_{[l^v,u^v]}(\tilde x) \\ \text{s.t.}\; & \tilde a = Ax \\ & \tilde x = x \end{align}

समानता की पाबंदियों को दोहराते हुए, हमें ये फ़ायदे मिले:

\min_{x, \tilde x, \tilde a} \max_{y, r} c^Tx + \frac{1}{2}x^TQx + y^T\tilde a - y^TAx + r^T\tilde x - r^Tx + \mathcal{I}_{[l^c,u^c]}(\tilde a) + \mathcal{I}_{[l^v,u^v]}(\tilde x)

कम से कम वैल्यू को ज़्यादा से ज़्यादा और फिर से ग्रुप में बांटने के साथ:

\max_{y, r} \min_{x, \tilde x, \tilde a} c^Tx + \frac{1}{2}x^TQx - y^TAx - r^Tx + \left( \mathcal{I}_{[l^c,u^c]}(\tilde a) + y^T\tilde a \right) + \left(\mathcal{I}_{[l^v,u^v]}(\tilde x) + r^T\tilde x \right)

x, \tilde x, और \tilde a को डिकंपोज़ किया जाने से जुड़ा जाइंट मिनिमाइज़ेशन. x के लिए हम देखते हैं कि छोटा करने वाला अगर मौजूद है, तो Qx + c - A^Ty = r संतुष्ट होता है. इस स्थिति में कम से कम वैल्यू -\frac{1}{2} x^TQx है. \tilde x और \tilde a के लिए हम, संकेतों के लिए मामूली अडजस्टमेंट के साथ कन्वर्ज़न की परिभाषा लागू करते हैं.

इससे ड्यूअल मिलती है:

\begin{align} \max_{x, y, r} & \, -\frac{1}{2}x^TQx - p(-y, l^c, u^c) - p(-r, l^v, u^v) \\ \text{s.t.}\; & Qx + c - A^Ty = r \end{align}

p की परिभाषा को बड़ा करने पर, हमें सबसे ऊपर ड्यूअल हैंडजैट मिलते हैं.

सैडल-पॉइंट फ़ॉर्म्यूलेशन

प्राइमल-ड्यूअल हाइब्रिड ग्रेडिएंट (चैंबोल और पॉक देखें) इस फ़ॉर्म की एक अहम समस्या को टारगेट करता है

\begin{align} \min_x f(x) + g(x) + h(Kx) \end{align}

जो संयुग्मी द्वैत (डुअलिटी) से सैडल-पॉइंट समस्या के बराबर होता है

\begin{align} \min_x \max_y f(x) + g(x) + y^TKx - h^*(y) \end{align}

पीडीपी, कन्वर्ज़न की क्वाड्रेटिक प्रोग्रामिंग समस्या को इस फ़ॉर्म में सुलझाने के लिए, नीचे दी गई सेटिंग लागू करता है:

  • f(x) = 0
  • g(x) = c^T x + \frac{1}{2} x^T Q x + \mathcal{I}_{[l^v, u^v]}(x)
  • h(a) = \mathcal{I}_{[-u^c,-l^c]}(a)
  • K = -A

जैसा कि पहले बताया गया है, h^*(y) = p(y; -u^c,-l^c) एक पीस वाइज लीनियर कन्वर्ज़न फ़ंक्शन है. g और h^*, दोनों में असीमित वैल्यू का इस्तेमाल किया जा सकता है, जो कि x और y के डोमेन को सीधे तौर पर सीमित कर देता है.

ध्यान दें कि पीडीपी के मुताबिक g का प्रॉक्सिमल ऑपरेटर, क्लोज़्ड फ़ॉर्म में कंप्यूट किया जा सकता है. यह अनुमान लगाया गया है कि Q डायगनल है. ऐसा इसलिए, क्योंकि g को अलग किया जा सकता है. f_1, f_2 किसी भी फ़ंक्शन के लिए दी गई आगे दी गई प्रॉपर्टी f_1, f_2 है:

f_2(t) = f_1(t) + \frac{\mu}{2} t^2 \Rightarrow \mathrm{prox}_{\lambda f_2}(t) = \mathrm{prox}_{\frac{\lambda}{1 + \lambda \mu} f_1}\left( \frac{t}{1 + \lambda \mu} \right).

इस तथ्य को बेहतर तरीके से समझने के लिए, ऑप्टिमाइज़ेशन के लिए पहले से ऑर्डर करने के तरीके सेक्शन में थ्योरम 6.13 देखें. नतीजे के तौर पर मिलने वाला एक्सप्रेशन,

\begin{equation} \mathrm{prox}_{\lambda g}(x) = \mathrm{proj}_{[l^v, u^v]}\left( (I + \lambda Q)^{-1} (x - \lambda c) \right) \end{equation}

कम की गई कीमत, दोहराव के बारे में जानकारी, और सही किए गए दोहरा मकसद

सैडल पॉइंट फ़ॉर्मूला सिर्फ़ (x,y) के साथ काम करता है. कम लागत r का मतलब साफ़ तौर पर नहीं है. काजल-बिंदु के फ़ॉर्मूले को हल करते समय (x,y,r) पाने के लिए, हम r को r = Qx + c - A^Ty के रूप में परिभाषित करते हैं. सही दो मकसद, दोहरा सवाल का वास्तविक मकसद है. यह घटी हुई वास्तविक वैल्यू के लिए हमेशा एक निचली सीमा देता है, लेकिन कोई गैर-शून्य लागत होने पर -\infty होता है.

पीडीपी की ओर से रिपोर्ट की गई कम लागत और दो मकसद को OR-टूल के वर्शन 9.7 और 9.8 में बदल दिया गया था. यह जानने के लिए कि कौनसा वर्शन लागू होता है, primal_dual_hybrid_gradient.h में SolverResult::reduced_costs के बारे में बताने वाली टिप्पणी देखें और देखें कि क्या उसमें वर्शन 9.8 का ज़िक्र है.

वर्शन 9.7 और उससे पहले के वर्शन

सही किए गए डुअल वैल्यू -\infty होने पर, ज़्यादा काम की ड्यूअल वैल्यू पाने के लिए, हम एक ड्यूअल मकसद भी रिपोर्ट करते हैं जो मकसद की वैल्यू में मौजूद अनंत शब्दों को अनदेखा करता है. ड्यूअल रेज़िड्यूअल का मतलब, इनफ़ाइनाइट टर्म में तय किए गए 'इनफ़ाइनाइट टर्म' की वैल्यू के तौर पर r है. अन्य कॉम्पोनेंट में इसकी वैल्यू 0 है और पीडीएलपी की वजह से हुई कम की गई लागत, दोनों कॉम्पोनेंट में तय की गई शर्तों के लिए r की वैल्यू है. अन्य कॉम्पोनेंट में यह वैल्यू 0 होती है, यानी कि $r = \mbox{residuals} + \ resided.

वर्शन 9.8 और उसके बाद के वर्शन

सही किए गए डुअल वैल्यू -\infty होने पर ज़्यादा सही ड्यूअल वैल्यू पाने के लिए, हम एक ड्यूअल मकसद भी रिपोर्ट करते हैं जो मकसद की वैल्यू में इनफ़ाइनाइट टर्म को सीमित मानों से बदल देता है: अगर एक बाउंड सीमा है, तो इंफ़ाइनाइट की जगह वह बाउंड इस्तेमाल किया जाता है; नहीं तो, बाउंड के लिए शून्य का इस्तेमाल किया जाता है. यह विकल्प दो मकसद की बारीकी को बनाए रखता है, लेकिन यह ज़रूरी नहीं है कि मकसद की वैल्यू की सीमा को कम रखा जाए. ड्यूअल रिज़िड्यूअल, सही किए गए ड्यूअल मकसद में अनंत शब्दों से r की वैल्यू हैं. पीडीएलपी की मदद से, लौटाए गए पैसों में कमी r होती है.

कुछ वैरिएबल बाउंड का इनफ़ाइनाइट के तौर पर इलाज

दोनों वर्शन में, अगर सॉल्वर विकल्प handle_some_primal_gradients_on_finite_bounds_as_residuals, true (डिफ़ॉल्ट तौर पर) है, तो ड्यूअल उद्देश्य और ड्यूअल रेज़िड्यूअल की गणना करते समय, अतिरिक्त वैरिएबल बाउंड को अनंत माना जा सकता है. खास तौर पर, अगर |x_i - l^v_i| > |x_i|, l^v_i को अनंत वैल्यू की तरह माना जाता है. इसी तरह, अगर |x_i - u^v_i| > |x_i|, u^v_i को अनंत मान लिया जाता है.

ध्यान दें कि handle_some_primal_gradients_on_finite_bounds_as_residuals के दिए गए फ़ॉर्मूला के आधार पर, उसके आकलन पर असर नहीं पड़ता है. इससे, सिर्फ़ दो मकसद और पहले से रिपोर्ट किए गए आंकड़ों पर असर पड़ता है.

स्केलिंग

मान लें कि हमें एक विकर्ण (कॉलम) का रीस्केलिंग मैट्रिक्स C और एक विकर्ण (पंक्ति) रीस्केलिंग मैट्रिक्स R दिया गया है, जिसमें विकर्ण पर पॉज़िटिव एंट्री हैं. ShardedQuadraticProgram::RescaleQuadraticProgram की तरह स्केलिंग को लागू करने पर, हमें ये बदलती समस्याएं मिलती हैं:

\begin{align} \min_{\tilde x} & \, (Cc)^T{\tilde x} + \frac{1}{2}{\tilde x}^T(CQC){\tilde x} \\ \text{s.t.}\; & Rl^{c} \le RAC\tilde x \le Ru^{c} \\ & C^{-1}l^{v} \le \tilde x \le C^{-1}u^{v} \end{align}

मूल समस्या का समाधान x = C\tilde x के रूप में फिर से हासिल किया गया है. अगर \tilde y एक दोहरा समाधान है और रूपांतरित समस्या के लिए \tilde r कम लागत दे रहा है, तो y = R\tilde y एक दोहरा समाधान है और मूल समस्या के लिए r = C^{-1}\tilde r कम की गई लागत होती है (हटाई गई).

जोखिम की आशंका की पहचान

प्राइमल इंफ़सिबिलिटी का सर्टिफ़िकेट, पॉइंट (y, r) \in \mathbb{R}^m \times \mathbb{R}^n को संतुष्ट करता है:

\begin{equation} \left((l^{c})^T[y]_+ - (u^{c})^T[y]_- \right) + \left((l^{v})^T[r]_+ - (u^{v})^T[r]_- \right) > 0 \\ -A^T y = r . \end{equation}

ऐसे बिंदु के मौजूद होने का मतलब है कि इस शुरुआती समस्या में कोई समाधान नहीं होता.

इसी तरह, दोहरी अक्षमता का प्रमाणपत्र एक पॉइंट x \in \mathbb{R}^n है, जैसे:

\begin{equation} Qx = 0 \\ c^T x < 0 \\ (Ax)_i \begin{cases} = 0 & \text{if }l^c_i , u^c_i \in \mathbb{R}, \\ \geq 0 & \text{if }l^c_i \in \mathbb{R}, u^c_i = \infty, \\ \leq 0 & \text{if }l^c_i = -\infty, u^c_i \in \mathbb{R}, \end{cases} \\ x_i \begin{cases} = 0 & \text{if }l^v_i , u^v_i \in \mathbb{R}, \\ \geq 0 & \text{if }l^v_i \in \mathbb{R}, u^v_i = \infty, \\ \leq 0 & \text{if }l^v_i = -\infty, u^v_i \in \mathbb{R}. \end{cases} \end{equation}

ध्यान दें कि लीनियर प्रोग्राम के सर्टिफ़िकेट Q=0 को सेट करके पाए जा सकते हैं.


  1. S को S = R^T R (उदाहरण के लिए, कोलेस्की फ़ैक्टराइज़ेशन के तौर पर फ़ैक्टराइज़ेशन) के तौर पर, सिमेट्रिक पॉज़िटिव सेमीडेफ़िनिट ऑब्जेक्ट मैट्रिक्स S को इस फ़ॉर्म में बदला जा सकता है. R x - z = 0, कंस्ट्रेंट R x - z = 0 के हिसाब से तय किए गए अतिरिक्त वैरिएबल z पेश किए जा रहे हैं, ताकि $x^T S x = z^