इस पेज पर, डेवलपर और पीडीपी के ज़्यादा जानकारी रखने वाले उपयोगकर्ताओं के लिए, गणित के विषय का बैकग्राउंड मौजूद है. यह OR-टूल में उपलब्ध लीनियर और क्वाड्रेटिक प्रोग्रामिंग सॉल्वर है. यह कोड के कुछ हिस्सों के लिए रेफ़रंस के तौर पर काम करता है, न कि सिर्फ़ पढ़ने के लिए. दिलचस्पी रखने वाले लोगों को सबसे पहले "प्रैक्टिकल लार्ज-स्केल लीनियर प्रोग्रामिंग इस्तेमाल करके प्राइमल-ड्यूअल हाइब्रिड ग्रेडिएंट" पेपर के बारे में पढ़ना चाहिए. इसके बाद, कोड को देखें और जब कोड इसका रेफ़रंस दे, तो इस दस्तावेज़ पर वापस आएं.
प्राइमल
पीडीपी, इन कन्वेक्स क्वाड्रेटिक प्रोग्रामिंग समस्या को ध्यान में रखता है,
जहां $A$ एक $m \times n$ मैट्रिक्स है और $Q$, डाइगनल नॉन-नेगेटिव $n \times n$ मैट्रिक्स1 है. अपर बाउंड वेक्टर $u^{c}$ और $u^{v}$ की एंट्री $\mathbb{R} \cup \{ \infty\}$ में हैं, और लोअर बाउंड वेक्टर $l^{c}$ और $l^{v}$ में एंट्री हैं $\math\b${R} \cup \cup \yl. ${ ^$ $$.
Dual
$a \in \mathbb{R}$. मान लें कि $[a]_+$ इसका पॉज़िटिव पार्ट दिखाता है और $[a]_-$ इसका नेगेटिव हिस्सा दिखाता है, यानी $a = [a]_+ - [a]_-$. किसी वेक्टर पर लागू करने पर, पॉज़िटिव और नेगेटिव पार्ट का आकलन, एलिमेंट के हिसाब से किया जाता है.
पहले की मूल समस्या का ड्यूअल, $x \in \mathbb{R}^n$, $y \in \mathbb{R}^m$, और $r \in \mathbb{R}^n$ से ज़्यादा है. वेक्टर $y$ में लीनियर\वेक्टर ($l^{c} \le Ax$resd) पर ड्यूअल मल्टीप्लायर शामिल हैं, ^${redus}.
$Q = 0$ होने पर, $x$ को डुअल से हटाया जा सकता है, जिससे LP द्वैता वापस मिल जाता है.
ड्यूअल वैरिएबल बाउंड
हम कहते हैं कि $y$ ड्यूअल वैरिएबल सीमाओं को पूरा करता है. ऐसा तब होता है, जब मकसद में $y$-term सीमित हो, यानी कि:
संयुग्मी द्वैत का इस्तेमाल करके व्युत्पन्न करना
प्रारंभिक दौर
$a \in \mathbb{R} \cup \{-\infty\}$ और $b \in \mathbb{R} \cup \{\infty\}$ को $b \ge a$ के साथ स्वीकार करें और अंतराल $[a, b] \subseteq \mathbb{R} \cup \$yft.
$\mathcal{I}_{[a, b]} : \mathbb{R} \to \mathbb{R} \cup \{ \infty\}$ यह देखें कि इंटरवल का इंडिकेटर फ़ंक्शन है, यानी $\mathcal{I}_{[a, b]}(x)$ जब $x b]}(x)$ में शून्य होगा और ऐसा नहीं होगा
$p(y; a, b): \mathbb{R} \to \mathbb{R} \cup \{\infty\}$ को इस रूप में परिभाषित करें:
जब $a$ या $b$ अनंत हो, तो स्टैंडर्ड एक्सटेंडेड रीयल अंकगणित अपनाएं.
बुनियादी नतीजा: $p(y; a, b) = (\mathcal{I}_{[a, b]})^*(y)$ जहां $(\cdot)^*$ उद्धरण संयुग्मी को दिखाता है.
$l \subseteq (\mathbb{R} \cup \{-\infty\})^n$ और $u \subseteq (\mathbb{R} \cup \{\infty\})^n$, सूचक \mathcal\जैसा}_{[l,u]} :
पहले से मौजूद रचना पर आधारित काम
पेश हैं सहायक वैरिएबल $\tilde a \in \mathbb{R}^m$ और $\tilde x \in \mathbb{R}^n$, हम शुरुआती समस्या को इस तरह बताते हैं:
समानता की पाबंदियों को दोहराते हुए, हमें ये फ़ायदे मिले:
कम से कम वैल्यू को ज़्यादा से ज़्यादा और फिर से ग्रुप में बांटने के साथ:
$x$, $\tilde x$, और $\tilde a$ को डिकंपोज़ किया जाने से जुड़ा जाइंट मिनिमाइज़ेशन. $x$ के लिए हम देखते हैं कि छोटा करने वाला अगर मौजूद है, तो $Qx + c - A^Ty = r$ संतुष्ट होता है. इस स्थिति में कम से कम वैल्यू $-\frac{1}{2} x^TQx$ है. $\tilde x$ और $\tilde a$ के लिए हम, संकेतों के लिए मामूली अडजस्टमेंट के साथ कन्वर्ज़न की परिभाषा लागू करते हैं.
इससे ड्यूअल मिलती है:
$p$ की परिभाषा को बड़ा करने पर, हमें सबसे ऊपर ड्यूअल हैंडजैट मिलते हैं.
सैडल-पॉइंट फ़ॉर्म्यूलेशन
प्राइमल-ड्यूअल हाइब्रिड ग्रेडिएंट (चैंबोल और पॉक देखें) इस फ़ॉर्म की एक अहम समस्या को टारगेट करता है
जो संयुग्मी द्वैत (डुअलिटी) से सैडल-पॉइंट समस्या के बराबर होता है
पीडीपी, कन्वर्ज़न की क्वाड्रेटिक प्रोग्रामिंग समस्या को इस फ़ॉर्म में सुलझाने के लिए, नीचे दी गई सेटिंग लागू करता है:
- $f(x) = 0$
- $g(x) = c^T x + \frac{1}{2} x^T Q x + \mathcal{I}_{[l^v, u^v]}(x)$
- $h(a) = \mathcal{I}_{[-u^c,-l^c]}(a)$
- $K = -A$
जैसा कि पहले बताया गया है, $h^*(y) = p(y; -u^c,-l^c)$ एक पीस वाइज लीनियर कन्वर्ज़न फ़ंक्शन है. $g$ और $h^*$, दोनों में असीमित वैल्यू का इस्तेमाल किया जा सकता है, जो कि $x$ और $y$ के डोमेन को सीधे तौर पर सीमित कर देता है.
ध्यान दें कि पीडीपी के मुताबिक $g$ का प्रॉक्सिमल ऑपरेटर, क्लोज़्ड फ़ॉर्म में कंप्यूट किया जा सकता है. यह अनुमान लगाया गया है कि $Q$ डायगनल है. ऐसा इसलिए, क्योंकि $g$ को अलग किया जा सकता है. $f_1, f_2$ किसी भी फ़ंक्शन के लिए दी गई आगे दी गई प्रॉपर्टी $f_1, f_2$ है:
इस तथ्य को बेहतर तरीके से समझने के लिए, ऑप्टिमाइज़ेशन के लिए पहले से ऑर्डर करने के तरीके सेक्शन में थ्योरम 6.13 देखें. नतीजे के तौर पर मिलने वाला एक्सप्रेशन,
कम की गई कीमत, दोहराव के बारे में जानकारी, और सही किए गए दोहरा मकसद
सैडल पॉइंट फ़ॉर्मूला सिर्फ़ $(x,y)$ के साथ काम करता है. कम लागत $r$ का मतलब साफ़ तौर पर नहीं है. काजल-बिंदु के फ़ॉर्मूले को हल करते समय $(x,y,r)$ पाने के लिए, हम $r$ को $r = Qx + c - A^Ty$ के रूप में परिभाषित करते हैं. सही दो मकसद, दोहरा सवाल का वास्तविक मकसद है. यह घटी हुई वास्तविक वैल्यू के लिए हमेशा एक निचली सीमा देता है, लेकिन कोई गैर-शून्य लागत होने पर $-\infty$ होता है.
पीडीपी की ओर से रिपोर्ट की गई कम लागत और दो मकसद को
OR-टूल के वर्शन 9.7 और 9.8 में बदल दिया गया था. यह जानने के लिए कि कौनसा वर्शन लागू होता है, primal_dual_hybrid_gradient.h
में SolverResult::reduced_costs
के बारे में बताने वाली टिप्पणी देखें और देखें कि क्या उसमें वर्शन 9.8 का ज़िक्र है.
वर्शन 9.7 और उससे पहले के वर्शन
सही किए गए डुअल वैल्यू $-\infty$ होने पर, ज़्यादा काम की ड्यूअल वैल्यू पाने के लिए, हम एक ड्यूअल मकसद भी रिपोर्ट करते हैं जो मकसद की वैल्यू में मौजूद अनंत शब्दों को अनदेखा करता है. ड्यूअल रेज़िड्यूअल का मतलब, इनफ़ाइनाइट टर्म में तय किए गए 'इनफ़ाइनाइट टर्म' की वैल्यू के तौर पर $r$ है. अन्य कॉम्पोनेंट में इसकी वैल्यू 0 है और पीडीएलपी की वजह से हुई कम की गई लागत, दोनों कॉम्पोनेंट में तय की गई शर्तों के लिए $r$ की वैल्यू है. अन्य कॉम्पोनेंट में यह वैल्यू 0 होती है, यानी कि $r = \mbox{residuals} + \ resided.
वर्शन 9.8 और उसके बाद के वर्शन
सही किए गए डुअल वैल्यू $-\infty$ होने पर ज़्यादा सही ड्यूअल वैल्यू पाने के लिए, हम एक ड्यूअल मकसद भी रिपोर्ट करते हैं जो मकसद की वैल्यू में इनफ़ाइनाइट टर्म को सीमित मानों से बदल देता है: अगर एक बाउंड सीमा है, तो इंफ़ाइनाइट की जगह वह बाउंड इस्तेमाल किया जाता है; नहीं तो, बाउंड के लिए शून्य का इस्तेमाल किया जाता है. यह विकल्प दो मकसद की बारीकी को बनाए रखता है, लेकिन यह ज़रूरी नहीं है कि मकसद की वैल्यू की सीमा को कम रखा जाए. ड्यूअल रिज़िड्यूअल, सही किए गए ड्यूअल मकसद में अनंत शब्दों से $r$ की वैल्यू हैं. पीडीएलपी की मदद से, लौटाए गए पैसों में कमी $r$ होती है.
कुछ वैरिएबल बाउंड का इनफ़ाइनाइट के तौर पर इलाज
दोनों वर्शन में, अगर सॉल्वर विकल्प
handle_some_primal_gradients_on_finite_bounds_as_residuals
, true
(डिफ़ॉल्ट तौर पर) है, तो ड्यूअल उद्देश्य और ड्यूअल रेज़िड्यूअल की गणना करते समय, अतिरिक्त वैरिएबल बाउंड को अनंत
माना जा सकता है. खास तौर पर, अगर $|x_i - l^v_i| >
|x_i|$, $l^v_i$ को अनंत वैल्यू की तरह माना जाता है. इसी तरह, अगर $|x_i -
u^v_i| > |x_i|$, $u^v_i$ को अनंत मान लिया जाता है.
ध्यान दें कि handle_some_primal_gradients_on_finite_bounds_as_residuals
के दिए गए फ़ॉर्मूला के आधार पर, उसके आकलन पर असर नहीं पड़ता है. इससे, सिर्फ़ दो मकसद और पहले से रिपोर्ट किए गए आंकड़ों पर असर पड़ता है.
स्केलिंग
मान लें कि हमें एक विकर्ण (कॉलम) का रीस्केलिंग मैट्रिक्स $C$ और एक विकर्ण
(पंक्ति) रीस्केलिंग मैट्रिक्स $R$ दिया गया है, जिसमें विकर्ण पर पॉज़िटिव एंट्री हैं. ShardedQuadraticProgram::RescaleQuadraticProgram
की तरह स्केलिंग को लागू करने पर, हमें ये बदलती समस्याएं मिलती हैं:
मूल समस्या का समाधान $x = C\tilde x$ के रूप में फिर से हासिल किया गया है. अगर $\tilde y$ एक दोहरा समाधान है और रूपांतरित समस्या के लिए $\tilde r$ कम लागत दे रहा है, तो $y = R\tilde y$ एक दोहरा समाधान है और मूल समस्या के लिए $r = C^{-1}\tilde r$ कम की गई लागत होती है (हटाई गई).
जोखिम की आशंका की पहचान
प्राइमल इंफ़सिबिलिटी का सर्टिफ़िकेट, पॉइंट $(y, r) \in \mathbb{R}^m \times \mathbb{R}^n$ को संतुष्ट करता है:
ऐसे बिंदु के मौजूद होने का मतलब है कि इस शुरुआती समस्या में कोई समाधान नहीं होता.
इसी तरह, दोहरी अक्षमता का प्रमाणपत्र एक पॉइंट $x \in \mathbb{R}^n$ है, जैसे:
ध्यान दें कि लीनियर प्रोग्राम के सर्टिफ़िकेट $Q=0$ को सेट करके पाए जा सकते हैं.
-
$S$ को $S = R^T R$ (उदाहरण के लिए, कोलेस्की फ़ैक्टराइज़ेशन के तौर पर फ़ैक्टराइज़ेशन) के तौर पर, सिमेट्रिक पॉज़िटिव सेमीडेफ़िनिट ऑब्जेक्ट मैट्रिक्स $S$ को इस फ़ॉर्म में बदला जा सकता है. $R x - z = 0$, कंस्ट्रेंट $R x - z = 0$ के हिसाब से तय किए गए अतिरिक्त वैरिएबल $z$ पेश किए जा रहे हैं, ताकि $x^T S x = z^↩