मेसेज भेजें

समाचार

March 11, 2021

डोमेन-विशिष्ट मेमोरी

डोमेन-विशिष्ट कंप्यूटिंग सभी क्रोध हो सकता है, लेकिन यह वास्तविक समस्या से बच रहा है।

बड़ी चिंता यह है कि प्रोसेसर के प्रदर्शन को कम करने वाली यादें अधिक शक्ति का उपभोग करती हैं, और सबसे चिप क्षेत्र को ले जाती हैं।मौजूदा सॉफ्टवेयर द्वारा पसंद की गई कठोर संरचनाओं से मुक्त होने के लिए स्मृतियों को तोड़ना होगा।जब एल्गोरिदम और मेमोरी को एक साथ डिज़ाइन किया जाता है, तो प्रदर्शन में सुधार महत्वपूर्ण होता है और प्रसंस्करण को अनुकूलित किया जा सकता है।

जॉन हेनेसी और डेविड पैटरसन द्वारा 2018 ट्यूरिंग व्याख्यान, "कंप्यूटर वास्तुकला के लिए एक नया स्वर्ण युग," डोमेन-विशिष्ट प्रसंस्करण को लोकप्रिय बनाया गया था।लेकिन प्रोसेसर दशकों से स्मृति द्वारा विवश हैं।स्मृति और मेमोरी पदानुक्रमों के पुनर्विचार के बिना प्रसंस्करण को बदलना, अमदहल के कानून की उपेक्षा करता है, जो किसी सिस्टम के लिए गति-अप के बीच गणितीय संबंध प्रदान करता है जब उस प्रणाली के कुछ टुकड़े सुधर जाते हैं।यह मूल रूप से कहता है कि आपको कम रिटर्न मिलता है यदि आप केवल सिस्टम को एक पूरे के रूप में देखने के बजाय सिस्टम के एक टुकड़े पर ध्यान केंद्रित करते हैं।

तो अड़चन पर ध्यान क्यों नहीं?Synopsys में उत्पाद विपणन निदेशक प्रसाद सग्गुरती कहते हैं, "डोमेन-विशिष्ट मेमोरी एक नया शब्द है, लेकिन आर्किटेक्ट इस प्रकार के अनुकूलन लंबे समय से कर रहे हैं।""और अगर वे नहीं करते हैं, तो वे एक चाल याद कर रहे हैं क्योंकि ज्यादातर लोग इसे कर रहे हैं।"

दूसरे सहमत हैं।"वीडियो यादें याद रखें - DRAM बिल्ट-इन शिफ्ट रजिस्टर के साथ?"आर्टरी आईपी पर साथी और सिस्टम आर्किटेक्ट माइकल फ्रैंक से पूछता है।"शायद GDDR [1-5], विशेष कैश टैग यादें, या TTL के दिनों में सहयोगी यादें?इनमें से बहुत कुछ वास्तव में नहीं बचा है क्योंकि उनकी कार्यक्षमता बहुत विशिष्ट थी।उन्होंने एक अनोखी डिवाइस को निशाना बनाया।आपको एक बड़े डोमेन की आवश्यकता है, और आप आज के DRAM की कम लागत के खिलाफ लड़ रहे हैं, जिसमें उच्च मात्रा और बड़े पैमाने पर निर्माण का लाभ है। "

कभी-कभी इससे भी गहरा हो जाता है।"आप एक ROM में कुछ सख्त कर सकते हैं," सिनॉप्सिस की सग्गुरती कहते हैं।“हम जो देख रहे हैं, वह आज लोगों की ठीक-ठाक स्मृति है।उदाहरण के लिए, फूरियर ट्रांसफॉर्म या Z ट्रांसफॉर्म के साथ, लोग कोड को इस तरह से लिखेंगे कि आप एक निश्चित क्रम में गुणांक को स्टोर कर सकते हैं।जब आप एक मैट्रिक्स गुणा कर रहे हैं, तो आप एक निश्चित क्रम में गुणांक को संग्रहीत कर सकते हैं ताकि इसे पढ़ना तेजी से हो।आप डेटा को एक मेमोरी में स्टोर नहीं कर सकते हैं, इसके बजाय, इसे तीन या चार अलग-अलग यादों में डाल सकते हैं ताकि आप कई डेटा पथों के माध्यम से चीजों को पढ़ सकें।इस तरह की बातें हाल ही में हुई हैं। ”

परिवर्तन कठिन है।"चुनौती यह है कि अतीत में, लोगों के पास कंप्यूटिंग सिस्टम के बारे में सोचने के लिए एक अच्छा, सार मॉडल था," रामबस के साथी और प्रतिष्ठित आविष्कारक स्टीवन वू कहते हैं।“उन्हें वास्तव में स्मृति के बारे में कभी नहीं सोचना था।यह मुफ़्त में आया और प्रोग्रामिंग मॉडल ने इसे ऐसा बना दिया कि जब आपने मेमोरी का संदर्भ दिया, तो यह बस हुआ।आपको कभी स्पष्ट नहीं होना चाहिए कि आप क्या कर रहे थे। ”

सामान्य मेमोरी प्रदर्शन में प्रगति की जा रही है।"आज के मेमोरी कंट्रोलर्स और उन्नत इंटरफ़ेस मानकों ने नाटकीय रूप से सुधार किया है जो आप उन्नत सिलिकॉन प्रौद्योगिकी से निकाल सकते हैं," आर्टेरिस फ्रैंक कहते हैं।“यह गहरी कतारों और उन्नत अनुसूचियों को सक्षम करता है।उच्च-मेमोरी मेमोरी (HBM), और स्टैक्ड डाई सपोर्ट बैंडविथ्स जैसी उन्नत मेमोरी तकनीकें जिन्हें हमने एक दशक पहले हासिल करना असंभव समझा था।फिर भी यह सस्ता नहीं है।उप -10 एनएम प्रौद्योगिकियां बड़े कैश को भी सक्षम बनाती हैं, इसलिए शायद हम इस गरीब व्यक्ति की डोमेन-विशिष्ट मेमोरी कह सकते हैं। ”

लेकिन ये सभी छोटे वृद्धिशील परिवर्तनों के उदाहरण हैं।आर्म के रिसर्च एंड डेवलपमेंट ग्रुप के सीनियर प्रिंसिपल रिसर्च मैट मैट हॉर्नेल कहते हैं, "आर्किटेक्चरिंग मेमोरी सबसिस्टम, जिसमें कंप्यूटर की गणना मुख्य रूप से होती है, आसपास के अन्य तरीकों के बजाय डेटा का अनुसरण करता है।“डेटा पर संचालन की आज की विशिष्ट सूची से, विस्तृत रूप में संगणना इकाइयों और डेटा मदों के बीच सापेक्ष दूरी की कुछ धारणा को एन्कैप्सुलेट करने वाले प्रोग्रामिंग एब्सट्रैक्शन को बढ़ाने का एक अवसर है।जब एल्गोरिदम तेजी से विकसित हो रहे हों, तो इस तरह के अमूर्त आवश्यक रूप से अधिक विशिष्ट रूप से लक्ष्य डोमेन विशिष्ट यादों को सक्षम कर सकते हैं। "

चालक की सीट में डेटा केंद्र
डेटा केंद्र आज कई प्रौद्योगिकी रुझानों के लिए ड्राइवर हैं।मोबिविल के सीईओ रवि थुमारुकुडी कहते हैं, "कंप्यूट के लिए सबसे तेजी से बढ़ते अनुप्रयोगों में से एक डेटा केंद्रों में है जहां सॉफ्टवेयर अनुप्रयोग अधिक मेमोरी क्षमता, कम विलंबता पर बैंडविड्थ की लालसा रखते हैं।"“नवीनतम उद्योग मानक, कंप्यूट एक्सप्रेस लिंक (सीएक्सएल) के आगमन के साथ, सिस्टम आर्किटेक्ट DDRn DIMMS में मुख्य मेमोरी और CXL- आधारित DDRn या नई लगातार यादों के बीच आवश्यक मेमोरी को टियर कर सकते हैं।यादों के इन स्तरों की विलंबता और आर्थिक विशेषताएं अलग-अलग हैं, और इससे वास्तुकारों को अपनी आवश्यकताओं के अनुरूप यादों को मिलाने और मिलान करने के विकल्प मिलते हैं। ”

यह विरासत मेमोरी आर्किटेक्चर का एक सिलसिला है।Synopsys के प्रिंसिपल एप्लीकेशन इंजीनियर टिम कोगेल कहते हैं, "कई ओईएम और सिस्टम हाउस सिलिकॉन को कस्टमाइज़ करने के लिए अपने खुद के SoCs डिजाइन कर रहे हैं।"“प्रदर्शन और शक्ति लाभ के लिए सबसे बड़ा अवसर सहायक पदानुक्रम आर्किटेक्चर के साथ मेमोरी पदानुक्रम की विशेषज्ञता है।

शक्ति पर विचार करें।"वर्तमान आर्किटेक्चर में, AI वर्कलोड के लिए 90% ऊर्जा का उपयोग डेटा मूवमेंट द्वारा किया जाता है, बाहरी मेमोरी, ऑन-चिप कैश और अंत में कंप्यूटिंग एलिमेंट (आंकड़ा 1 देखें) के बीच वज़न और सक्रियता को स्थानांतरित करता है," अरुण रेनेंगार के सीईओ, अनटेडर ए.आई."केवल अनुमान त्वरण की जरूरतों पर ध्यान केंद्रित करके और बिजली दक्षता को अधिकतम करने से हम अभूतपूर्व कम्प्यूटेशनल प्रदर्शन देने में सक्षम हैं।"

मेमोरी ऑप्टिमाइज़ेशन एक सिस्टम-स्तरीय समस्या है जो डिज़ाइन के सभी पहलुओं को छूती है - हार्डवेयर, सॉफ्टवेयर और टूल।"मेमोरी का अनुकूलन करने के लिए रणनीतियाँ विविध हैं और एप्लिकेशन डोमेन पर निर्भर करती हैं," कोगेल कहते हैं।“सबसे अच्छी रणनीति पूरी तरह से ऑफ-चिप मेमोरी एक्सेस से बचने के लिए है।डोमेन-विशिष्ट आर्किटेक्चर के लिए, यह आमतौर पर उपलब्ध चिप मेमोरी को बढ़ाकर प्राप्त किया जा सकता है, या तो कैश या एप्लिकेशन प्रबंधित मेमोरी के रूप में।विशेष रूप से गहरी सीखने के त्वरक के क्षेत्र में, उपलब्ध ऑन-चिप मेमोरी एक निर्णायक डिजाइन पैरामीटर है जो यह भी प्रभावित करती है कि लक्ष्य हार्डवेयर पर तंत्रिका नेटवर्क अनुप्रयोग कैसे संकलित किया जाता है - उदाहरण के लिए, कन्वर्टर ऑपरेटर की टाइलिंग। "

कई डिजाइन इस से आगे जाने के लिए देख रहे हैं।आर्म के हॉर्सनेल कहते हैं, "स्थानिक गणना डोमेन में डोमेन-विशिष्ट मेमोरी अवधारणाओं का पता लगाया जा रहा है।"“एक उदाहरण के रूप में, डीएसपी वितरित यादों का एक पूल प्रदान करते हैं, जो अक्सर सीधे सॉफ़्टवेयर में प्रबंधित होते हैं, जो पारंपरिक साझा-मेमोरी सिस्टम की तुलना में बैंडविड्थ अनुप्रयोगों और विशेष अनुप्रयोगों के एक्सेस पैटर्न के लिए बेहतर फिट हो सकते हैं।फिक्स्ड-फंक्शन ASIC के साथ दक्षता अंतर को पाटने के लिए, ये प्रोसेसर अक्सर विशिष्ट एक्सेस पैटर्न (जैसे एन-बफरिंग, एफआईएफओ, लाइन बफ़र्स, कम्प्रेशन, आदि) के लिए प्रत्यक्ष समर्थन प्रदान करके मेमोरी स्पेशलाइजेशन के कुछ रूप प्रदान करते हैं।इन प्रणालियों के भीतर ऑर्केस्ट्रेशन का एक महत्वपूर्ण पहलू, और उन्हें डिजाइन करने में एक चुनौती, डेटा एक्सेस के लिए सही ग्रैन्युलैरिटी का निर्धारण करना है, जो एक ही समय में कॉनसीर को अधिकतम करते हुए संचार और सिंक्रनाइज़ेशन ओवरहेड्स को कम कर सकता है।प्रोग्रामिंग, जुटना, तुल्यकालन और अनुवाद सहित अन्य चुनौतियां बनी रहती हैं, जो सॉफ्टवेयर जटिलता को जोड़ती हैं।हालाँकि, एक संभावित मार्ग डोमेन-विशिष्ट भाषाओं (डीएसएल) पर भरोसा करने के लिए है, जो ऐप्स के डेटा प्रवाह को और अधिक स्पष्ट करके कंपाइलरों को विशेष मेमोरी एक्सेस पैटर्न की पहचान करने और उन्हें हार्डवेयर पर अधिक प्रभावी ढंग से मैप करने में सक्षम कर सकता है। "

यह यादों को खुद भी करीब से देखने की अदा करता है।"हाइपर-कस्टमाइज़ेशन वह ट्रेंड है जिसे हम यादों के साथ देखते हैं।"“इसका मतलब विभिन्न अंत अनुप्रयोगों के लिए उद्देश्य-निर्मित यादें हैं।यहां तक ​​कि एआई जैसे किसी विशेष अंतिम अनुप्रयोग में भी यादों की अलग-अलग जरूरतें होती हैं, जैसे कि प्रशिक्षण या अनुमान लगाने के लिए, सर्वरों में अनुमान लगाने के लिए, या दूर के किनारे में अनुमान लगाने के लिए।इनमें से प्रत्येक एप्लिकेशन की अलग-अलग आवश्यकताएं हैं, और इसका मतलब है कि आपको यादों को अनुकूलित करना होगा।इस अनुकूलन का अर्थ है कि आप अब यादों को वस्तुओं या शेल्फ उत्पादों के रूप में नहीं देख सकते हैं।आपको इसे किसी विशेष एप्लिकेशन के लिए बनाना होगा।यही वह जगह है जहाँ गुप्त चटनी अंदर जाती है। "

कई मामलों में मेमोरी और इंटरकनेक्ट को कसकर युग्मित किया जाता है।"कुछ भी हो जाता है जब यह मेमोरी और इंटरकनेक्ट तकनीकों के संयोजन की बात आती है, तो एप्लिकेशन वर्कलोड की डेटा एक्सेस आवश्यकताओं को पूरा करने के लिए प्रौद्योगिकियों को इंटरकनेक्ट करता है - उदाहरण के लिए, डेटा-फ्लो अनुप्रयोगों, या विशाल मल्टी में स्थानीयता का लाभ लेने के लिए स्थानीय मेमोरी के साथ संयोजन संयोजन के कई स्तर। CNN एक्सेलेरेटर के फ़ीचर मैप्स को बफ़र / मल्टी-पोर्टेड ऑन-चिप SRAMs, और डेटा सेंटर वर्कलोड के गुनगुने वर्किंग सेट को कम करने के लिए परिष्कृत सुसंगतता प्रोटोकॉल के साथ गहरी कैश पदानुक्रम। "

छोटे बदलाव बड़े परिणाम दे सकते हैं।फ्रैंक कहते हैं, "बस थोड़ा सा चमत्कार देखिए जो Apple ने M1 के साथ किया है।""उन्होंने पता लगाया कि कैसे एक मेमोरी सबसिस्टम को आर्किटेक्ट किया जाता है जो बुद्धिमान कैशिंग रणनीति और एक विशाल, बहु-स्तरीय कैश पदानुक्रम का उपयोग करते हुए कई विषम मास्टर्स को अच्छी तरह से पेश करता है।"

जैसा कि अक्सर होता है, सॉफ्टवेयर जड़त्वीय लंगर है।सागरगति कहती हैं, "आमतौर पर जो होता है वह एक एल्गोरिथ्म होता है, और हम इसे ऑप्टिमाइज़ करने, मेमोरी को ऑप्टिमाइज़ करने का एक तरीका देखते हैं, ताकि एल्गोरिथ्म को बेहतर तरीके से लागू किया जा सके"“दूसरी तरफ, हमारे पास इन विभिन्न प्रकार की मेमोरी है।क्या आप इन नए प्रकार की यादों का उपयोग करने के लिए अपना एल्गोरिथ्म बदल सकते हैं?अतीत में, टीसीएएम का उपयोग ज्यादातर आईपी पते को देखने के लिए एक नेटवर्किंग डोमेन निर्माण था।हाल ही में, प्रशिक्षण इंजन TCAMs का उपयोग करना शुरू कर रहे हैं, और यह एक अलग दृष्टिकोण है।यह उपलब्ध यादों के प्रकारों के आधार पर सॉफ्टवेयर या फर्मवेयर को बदलने की आवश्यकता है।लेकिन ज्यादातर समय, सॉफ्टवेयर स्थिर रहता है और परिणामी कार्यान्वयन को बेहतर बनाने के लिए मेमोरी में बदलाव होता है। ”

थ्रूपुट जागरूकता
इन दिनों कृत्रिम बुद्धिमत्ता में बहुत समय और पैसा लगाया जा रहा है।कस्टम चिप्स थ्रूपुट द्वारा विवश हैं, और यह मेमोरी और इंटरकनेक्ट पर स्पॉटलाइट डाल रहा है।

"ऐतिहासिक रूप से, मेमोरी और इंटरकनेक्ट आर्किटेक्चर को स्थिर स्प्रेडशीट या रूफलाइन प्रदर्शन मॉडल जैसे सरल विश्लेषणात्मक मॉडल के आधार पर डिज़ाइन किया गया है," कोगेल कहते हैं।“अत्याधुनिक अनुप्रयोगों के लिए, यह बहुत जटिल हो जाता है।उदाहरण के लिए, CNN में प्रत्येक परत की स्मृति आवश्यकताओं की भविष्यवाणी करने के लिए टाइलिंग और परत संलयन जैसे संकलक अनुकूलन के विचार की आवश्यकता होती है।विविध आईपी उप-प्रणालियों और गतिशील अनुप्रयोग परिदृश्यों के साथ SoC- स्तर वर्कलोड की भविष्यवाणी और अनुकूलन के लिए ये स्थिर तरीके अनुचित रूप से जटिल और गलत हो जाते हैं।दूसरी ओर, हार्डवेयर इम्यूलेशन या एक प्रोटोटाइप सिस्टम के शीर्ष पर एप्लिकेशन चलाना डेवलपमेंट प्रोसेस में बहुत तेज बदलाव या मेमोरी डिजाइन के प्रमुख अनुकूलन के लिए बहुत देर से होता है। "

यह इच्छित कार्यभार पर ध्यान केंद्रित करता है।"कुशल मेमोरी सबसिस्टम की कुंजी आपके कार्यभार का ज्ञान है," फ्रैंक कहते हैं।“यह समझना कि यह कैसे व्यवहार करता है, शायद इसे इस तरह से आकार देना भी है जो इसे आपकी मेमोरी पदानुक्रम की सीमा के साथ अधिक संगत बनाता है, यह वह जगह है जहाँ वास्तुकला को चुनौती दी जाती है।डोमेन विशिष्ट त्वरक को ट्यून किए गए मेमोरी सिस्टम की आवश्यकता होती है - और ट्रांसफ़ॉर्मेशन इंजन के निर्माण की कला जो 'प्रतिबाधा' उत्पन्न द्रव्यमान से मेल खाती है, पृष्ठ व्यवस्थित, बर्फ़ीली पहुंच DRAM और इंजन के एक्सेस पैटर्न के लिए सिस्टम व्यवहार, मॉडलिंग टूल और बहुत से कार्यभार में अंतर्दृष्टि की आवश्यकता होती है साथ खेलने के लिए।कभी-कभी यह उस तरह से बदलाव करता है जिस तरह से कार्यभार डेटा को संसाधित करता है ताकि समग्र प्रणाली को बेहतर बनाया जा सके।एक अच्छा उदाहरण GPU में टाइल आधारित प्रसंस्करण के लिए 'प्रत्यक्ष' प्रतिपादन से संक्रमण था। "

यह सब मॉडलिंग और सिमुलेशन के लिए आता है।कोगेल कहते हैं, "हम वर्चुअल प्रोटोटाइपिंग टूल का उपयोग इंटरकनेक्ट और मेमोरी आर्किटेक्चर के सटीक लेन-देन-स्तर मॉडल के साथ-साथ एप्लिकेशन वर्कलोड को मॉडल करने के लिए करते हैं।"“यह मात्रात्मक This आर्किटेक्चर फर्स्ट’ दृष्टिकोण शुरुआती ट्रेडऑफ़ विश्लेषण की अनुमति देता है, जिसके परिणामस्वरूप एक विश्वसनीय कार्यान्वयन विनिर्देश है।अतिरिक्त मॉडलिंग और सिमुलेशन प्रयास की कीमत पर, लाभ को लापता प्रदर्शन और शक्ति लक्ष्यों के जोखिम को कम किया जाता है, या हार्डवेयर को सुरक्षित करने के लिए अतिव्यापी होने की लागत को कम किया जाता है।मूर के कानून से कम रिटर्न के युग में, अवसर अधिक अनुकूलित और विभेदित उत्पाद के साथ आने का है। ”

यह एल्गोरिथम परिवर्तनों के प्रभाव को देखने की अनुमति देता है, साथ ही साथ।थिरुवेंगदम कहते हैं, '' वापस जाने और एल्गोरिदम को फिर से डिज़ाइन करने की ज़रूरत है।"वे पारंपरिक विरासत मेमोरी आर्किटेक्चर के लिए नया स्वरूप दे सकते हैं, या उन्हें नए आर्किटेक्चर, नई यादें शैलियों, नए मेमोरी फ्लेवर के लिए फिर से डिजाइन किया जा सकता है।प्रदर्शन स्केलिंग, लागत स्केलिंग और विभिन्न अनुप्रयोगों के लिए ट्रेडऑफ़ को संतुलित करने में सक्षम होने के लिए यह लगातार धक्का है।यह अनिवार्य रूप से यही कारण है कि आप MRAMs और FeRAMs के निरंतर विकास को देख रहे हैं।वे कम से कम एक जोड़े के लिए एक मीठा स्थान खोजने की कोशिश कर रहे हैं, अगर सभी चर नहीं।मेमोरी आर्किटेक्चर के साथ-साथ एल्गोरिदम को फिर से डिज़ाइन करने की आवश्यकता निश्चित रूप से महत्वपूर्ण होती जा रही है। ”

संतुलन आवश्यक है।"आपको कम्प्यूटेशनल इंटेंसिटी की अवधारणा और शामिल किए गए कार्यों के प्रकार के बारे में सोचने की ज़रूरत है," फ्रैंक कहते हैं।"कुछ एल्गोरिदम के पास अतुलनीय बैंडविड्थ की आवश्यकताएं होती हैं, जबकि अन्य केवल अपेक्षाकृत कम मात्रा में डेटा को स्थानांतरित करते हैं लेकिन इस पर हजारों ऑपरेशन करते हैं।SIMD- प्रकार प्रसंस्करण के लिए इन-मेमोरी ऑपरेशन अच्छी तरह से काम कर सकता है, जहां निर्देश बैंडविड्थ डेटा बैंडविड्थ के सापेक्ष छोटा है और कई तत्वों को एक ही नुस्खा का उपयोग करके संसाधित किया जाता है।लेकिन जैसे ही डेटा स्ट्रीम या अनियमित डेटाफ़्लो में अनुक्रमिक निर्भरताएँ होती हैं, डोमेन विशिष्ट मेमोरी सिकुड़ जाती है। ”

कस्टम मेमोरी
जबकि वास्तु परिवर्तन बड़े परिणाम दे सकते हैं, यादों का अनुकूलन भी लाभ प्रदान कर सकता है।"आज के एक्सेलेरेटर की शक्ति और क्षेत्र का एक बड़ा हिस्सा मेमोरी पर उपयोग किया जाता है," हॉर्सनेल कहते हैं।"तो नई स्मृति प्रौद्योगिकियों द्वारा प्राप्त किसी भी विलंबता / घनत्व / ऊर्जा में सुधार का नाटकीय प्रभाव हो सकता है।"

कस्टम यादें बड़ी व्यवसाय बन रही हैं।सग्गुरती कहती हैं, "आप इन-मेमोरी गणना, निकट-मेमोरी कंप्यूट, विशिष्ट यादें जो लिखना-ऑल-जीरो मेमोरी हो सकती हैं - कुछ प्रकार के ऑपरेशनों के लिए अनुकूलित की जाने वाली यादें देखने लगती हैं।""हम देख रहे हैं कि बहुत से ग्राहक हमें MRAM के बारे में पूछते हैं, SRAMs, TCAMs के और भी अधिक अनुकूलन, और TCAMs के लिए कुछ ट्वीक।"

हालांकि मुश्किलें बनी हुई हैं।"मुझे कस्टम मेमोरी डिज़ाइनों के बारे में बहुत सारी चर्चाएँ हुई हैं, जहाँ मेमोरी डाई पर प्रसंस्करण एक 'आदर्श' वास्तुकला होता।""यह उच्च बैंडविड्थ, कम विलंबता, आदि प्रदान करेगा। सब कुछ सही था, इस तथ्य को छोड़कर, कि स्मृति प्रक्रिया सीमित थी कि तर्क क्या एकीकृत किया जा सकता है - तीन या चार धातु परतें, कम-शक्ति, लेकिन धीमी ट्रांजिस्टर।इसका मतलब था कि कंप्यूट इंजन के लिए अक्षमता।घड़ी की गति और सर्किट जटिलता का त्याग करके अचानक गणना इंजन के एकीकरण को इतना अच्छा विकल्प नहीं बनाया गया। ”

लेकिन इनमें से कुछ बदलाव जरूरी हो जाएंगे।"लोग चिप पर फ्लैश लाना चाहते हैं और इसे एक एम्बेडेड फ्लैश बनाते हैं," सगुरुति कहते हैं।"फिर सवाल बन जाता है, 'क्या यह भी संभव है?"28nm पर आप एम्बेडेड फ़्लैश करने में सक्षम हो सकते हैं, लेकिन लोग 22nm पर MRAM जैसी चीजों के बारे में सोचना शुरू कर देते हैं। ”

फिर भी, समस्या को देखने के अन्य तरीके हैं।"एक वफ़र भर में और मरने के दौरान, और यहां तक ​​कि समय के साथ स्मृति परिवर्तन की प्रक्रिया परिवर्तनशीलता," सग्गुरती कहते हैं।"जब आप एक मेमोरी, एक साधारण SRAM डिजाइन करते हैं, तो आप केस के लिए डिज़ाइन करते हैं जब बिट सेल एक तरह से - धीमा - और परिधि दूसरे तरीके से जाता है - तेज़।यदि आप उसके लिए डिज़ाइन करते हैं, और यदि आपके सिलिकॉन का अधिकांश भाग विशिष्ट है, तो आप मेज पर बहुत अधिक प्रदर्शन और शक्ति छोड़ रहे हैं।यदि आप समझते हैं कि आप प्रक्रिया सीमा में कहां हैं और चिप डिजाइनर को उस जानकारी पर कार्य करने में सक्षम बनाते हैं, तो आप समय के अनुसार समायोजित कर सकते हैं।आपका डिजाइन अधिक इष्टतम हो सकता है, और आपको सबसे खराब स्थिति के लिए डिजाइन करने की आवश्यकता नहीं है। "

निष्कर्ष
जबकि मेमोरी हमेशा एक डिज़ाइन ट्रेडऑफ़ रही है, इसे कभी भी प्रसंस्करण के रूप में समान स्तर का ध्यान नहीं मिला है, भले ही यह बैंडविड्थ, शक्ति और क्षेत्र के मामले में प्रदर्शन लिमिटर है।एआई लोगों को मेमोरी आर्किटेक्चर को आवश्यकता से बाहर करने के लिए प्रेरित कर रहा है, लेकिन इसके साथ ही अतिरिक्त ध्यान देने के लिए, डिज़ाइन टीम कुछ ऐसे सॉफ़्टवेयर और एल्गोरिदम को भी पुनर्विचार कर सकती है, जो विरासत मेमोरी सिस्टम के लिए अनुकूलित थे।ऐसी दुनिया में जहां हर 18 महीने में प्रदर्शन लाभ मुफ्त में नहीं मिलता है, उत्पादों को कमोडिटीज बनने से रोकने के लिए अधिक चरम उपाय एकमात्र तरीका बन रहे हैं। (ब्रायन बेली से)

सम्पर्क करने का विवरण