لیکوالان:
(۱) تیاني کوی، د واشنګټن پوهنتون ([email protected])؛
(2) Chenxingyu Zhao، د واشنګټن پوهنتون ([email protected])؛
(3) وی ژانګ، مایکروسافټ ([email protected])؛
(4) Kaiyuan Zhang، د واشنګټن پوهنتون ([email protected]).
د مدیر یادښت: دا د یوې مطالعې د ۶ برخې لومړۍ برخه ده چې د طبقې-۷ بار توازن غوره کولو هڅو په اړه توضیحات ورکوي. پاتې برخه لاندې ولولئ.
۴.۲ له پیل څخه تر پایه پورې تروپټ
۴.۳ له پیل څخه تر پایه ځنډ
۴.۴ د مهمو تخنیکونو د ګټو ارزونه
۴.۵ د حقیقي نړۍ کاري بار
د بار توازن کوونکي په پراخه کچه د نن ورځې په بادلونو کې کارول کیږي ترڅو د ډیټا سینټر سرورونو کې د شبکې غوښتنې په پراخه کچه توزیع کړي. د بار توازن کوونکي او د دوی اړوند عملیاتي لګښتونو ته په پام سره، ډیری هڅې د کرنل دننه د Layer-4 بار توازن کوونکي منطق پلي کولو یا د هارډویر سرعت کارولو له لارې د دوی موثریت ښه کولو باندې تمرکز کړی دی. دا کار دا څیړي چې ایا ډیر پیچلي او د اتصال پر بنسټ Layer-7 بار توازن کوونکي وړتیا هم د هارډویر سرعت څخه ګټه پورته کولی شي. په ځانګړې توګه، موږ د پروګرام وړ SmartNICs باندې د بار توازن کوونکي وړتیا آفلوډ کول په نښه کوو. موږ د دریو کلیدي نظرونو په کارولو سره د SmartNICs لګښت او انرژي موثریت په بشپړ ډول ګټه پورته کوو. لومړی، موږ استدلال کوو چې د Layer-7 بار توازن کوونکي لپاره بشپړ او پیچلي TCP/IP سټیک ته اړتیا نشته او پرځای یې په SmartNIC کې د سپک وزن فارورډینګ اجنټ وړاندیز کوو. دوهم، موږ د څو کور SmartNICs کې اجرا کولو پرمهال د لږترلږه همغږۍ سره د لوړې درجې همغږۍ سره د اتصال مدیریت ډیټا جوړښتونه رامینځته کوو. په پای کې، موږ تشریح کوو چې څنګه د بار توازن کوونکي منطق په SmartNICs کې د ګمرکي پیکټ پروسس کوونکي سرعت کونکو په کارولو سره ګړندی کیدی شي. موږ د لاکونیک پروټوټایپ په دوه ډوله سمارټ این آی سي هارډویر کې کوو، په بلو فیلډ-۲ کې د ټولو کورونو په کارولو سره له ۱۵۰ ګیګابټس څخه ډیر تروپټ ترلاسه کوو، پداسې حال کې چې یو واحد سمارټ این آی سي کور په یو واحد x۸۶ کور کې د نګینکس سره د پرتلې وړ ځنډ او ۸۰ ځله لوړ تروپټ ترلاسه کوي.
د بار توازن کوونکي د معلوماتو مرکزونو لپاره یو بنسټیز جوړښت دی ځکه چې دوی د غوښتنلیک سرورونو ټولګه کې د خدماتو بار متوازن کوي [38، 45، 46]. د بار توازن کوونکي په پیل کې د ځانګړي هارډویر وسایلو په توګه جوړ شوي وو مګر اوس معمولا د اجناسو سرورونو یا VMs کې د چلولو سافټویر په توګه ځای په ځای کیږي. دا د ځای پرځای کولو ماډل د زړو هارډویر پر بنسټ ډیزاینونو په پرتله د تنظیم کولو او تطبیق لوړه کچه چمتو کوي، مګر دا د کلاوډ چمتو کونکو او غوښتنلیک خدماتو لپاره د لوړ لګښتونو پایله هم کولی شي، د پیرود لګښتونو او د عمومي هدف سرورونو د انرژۍ مصرف په پام کې نیولو سره [8]. د غوښتنلیک خدمات ډیری وختونه د مطلوب لګښت سپمولو ترلاسه کولو لپاره د بار توازن کوونکي کارولو یوځای کولو او کمولو لپاره لوی حد ته ځي [2، 4، 5].
د بار توازن کوونکو پراخه کارونې او لګښت ته په پام سره، ډیری هڅې د دوی د موثریت ښه کولو باندې تمرکز کړی دی، په ځانګړي توګه د پرت-4 (L4) بار توازن کوونکي، د بار توازن کوونکي منطق په ټیټ، احتمالي هارډویر-ګړندي، پرت کې د ځای په ځای کولو سره. کټران [16] د لینکس کرنل دننه د eBPF کوډ په کارولو سره ګړندی کیږي، پدې توګه د کرنل دننه د پیکټونو مداخله او پروسس کول او د کارونکي کچې بار توازن کوډ ته د لیږدونو شمیر کمول. ClickNP [32] د FPGA فعال شوي سمارټ NIC کې د L4 بار توازن کوونکي منطق (په ځانګړي توګه د NAT په څیر وړتیاوې) ځینې اړخونه حل کوي او د FPGA وسیلو موازي پروسس کولو وړتیاوې کاروي. SilkRoad [38] د L4 بار توازن کوونکو سره تړلي حالت ذخیره کولو او د سویچ پایپ لاین دننه د بار توازن عملیاتو پورې اړوند ډیټاپلین بدلونونو ترسره کولو لپاره د پروګرام وړ سویچ او پای کوربه ترکیب کاروي.
که څه هم دې هڅو د L4 بار توازن غوره کولو کې د پام وړ لاسته راوړنې ترلاسه کړې دي چې د شبکې پرت کې ترافیک متوازن کوي، د معلوماتو مرکز خدمات ډیری وختونه د غوښتنلیک پرت بار توازن وړتیاو باندې تکیه کوي چې یوازې په پرت-7 (L7) بار توازن کونکو کې موندل کیږي. په ځانګړي توګه، خدمات غواړي د مراجعینو غوښتنې ځانګړتیاو پراساس جریانونه روټ کړي، د مراجعینو غوښتنو لپاره د سیشن تړاو وساتي، د لاسرسي کنټرول چمتو کړي، او داسې نور [7]. مګر، دا ځانګړتیاوې د L7 بار توازن کونکو لپاره د هارډویر سرعت تخنیکونو غوره کول ستونزمن کوي چې د L4 بار توازن کونکو لپاره کارول کیږي. یوه بنسټیزه ننګونه دا ده چې د L7 بار توازن عملیات د اتصال پر بنسټ ټرانسپورټ پروتوکولونو کې ځای پر ځای شوي معلوماتو پراساس دي، پدې توګه داسې ښکاري چې د TCP/HTTP اتصالاتو اداره کولو لپاره په بار توازن کونکي کې د بشپړ سټیک شبکې پروسس کولو اجنټ ته اړتیا لري. په پایله کې، د نن ورځې L7 بار توازن کونکي عمومي سافټویر حلونه دي چې د توکو سرورونو کې د پروسس کولو لوړ لګښتونه لري.
په دې کار کې، موږ معاینه کوو چې ایا موږ کولی شو د L7 بار توازن کونکو موثریت د پروګرام وړ شبکې هارډویر په کارولو سره ښه کړو. موږ په سمارټ این آی سي تمرکز کوو چې د پیکټ پروسس کولو هارډویر سره د عمومي هدف کمپیوټري کورونه چمتو کوي. سمارټ این آی سي په ځانګړي ډول زړه راښکونکي هدفونه دي ځکه چې د دوی کمپیوټري کورونه کولی شي د خپل سري پروتوکول منطق کوربه توب وکړي پداسې حال کې چې د دوی د پیکټ پروسس کولو سرعت کونکي کولی شي د ډیټا پلین بدلونونه په مؤثره توګه ترسره کړي. پدې توګه سمارټ این آی سي د دودیز کوربه کمپیوټري وړتیاوې د پروګرام وړ سویچونو د راڅرګندیدونکي وړتیاو سره یوځای کوي او د L7 بار توازن کونکو لپاره مناسب هدف دی. زموږ کار هم په جزوي ډول د شبکې دندو لپاره د لګښت مؤثره او انرژي موثره کمپیوټري سبسټریټ په توګه د ډیټا مرکزونو کې د سمارټ این آی سي د زیاتیدونکي ځای پرځای کولو لخوا هڅول کیږي.
سمارټ این آی سي ته د بار توازن فعالیت آفلوډ کولو کې ډیری ننګونې باید حل شي. لومړی، د سمارټ این آی سي کورونه کمزوري دي، محدود حافظه لري، او د عمومي هدف محاسبې چلولو کې بې کفایته دي. تر هغه چې امکان ولري، موږ باید د عمومي، بشپړ فعالیت سټیکونو پرځای د سپک وزن شبکې سټیکونه وکاروو چې د OS کرنلونو دننه شتون لري. دوهم، په سمارټ این آی سي کې مؤثر ملټي کور پروسس کول د هممهاله معلوماتو جوړښتونو ته د لاسرسي لپاره د سپک وزن همغږي فرض کوي، او دا په ځانګړي ډول اړونده ده ځکه چې موږ د شبکې پروسس کولو منطق کموو. دریم، د پیکټونو بدلونونو لپاره د سرعت کونکو مؤثره کارول د سمارټ این آی سي کمپیوټري وړتیا لوړولو لپاره اړین دي.
موږ لاکونیک ډیزاین او پلي کوو، یو سمارټ این آی سي- افلوډ شوی بار بیلانسر چې پورته پورته شوي ننګونې حل کوي. زموږ د سیسټم یوه مهمه برخه د سپک وزن لرونکي شبکې سټیک دی چې د غوښتنلیک پرت بار بیلانس منطق د ټرانسپورټ پرت دندو سره ګډ ډیزاین استازیتوب کوي. دا سپک وزن لرونکي شبکې سټیک یوازې د بار بیلانسر له لارې لیږدول شوي پیکټونو په فرعي سیټ کې پیچلي پیکټونه پروسس کوي. د پاتې پیکټونو لپاره، د شبکې سټیک د پیکټونو ساده بیا لیکل ترسره کوي او په مراجعینو او سرور تکیه کوي ترڅو د پای څخه تر پایه اعتبار او د ګڼې ګوڼې کنټرول چمتو کړي. د سمارټ این آی سي لپاره د پیکټونو پروسس کولو سرعت کونکو سره، دا ډیزاین ډیری پیکټونه د هارډویر پر بنسټ د جریان پروسس کولو انجنونو په کارولو سره پروسس کولو ته اجازه ورکوي، پدې توګه د پام وړ موثریت لاسته راوړنې چمتو کوي. موږ د اتصال مدیریت ډیټا جوړښتونه هم رامینځته کوو چې خورا همغږي دي او د ګران متقابل اخراج عملیات کموي. موږ یادونه کوو چې زموږ ځینې ډیزاین ونډې د عمومي سرور پر بنسټ ډیزاین باندې هم پلي کیږي، مګر دوی په سمارټ این آی سي باندې ضرب اغیز لري د ګړندي لارې فکتور کولو سره چې د هارډویر پیکټ انجنونو کې اجرا کیدی شي.
موږ لایکونیک جوړ کړ او دا مو د سمارټ این آی سي دوه مختلفو ډولونو سره سم تنظیم کړ: مارویل لیکویډ آی او ۳ او اینویډیا بلو فیلډ-۲. لایکونیک دواړه لایر-۴ او لایر-۷ فعالیت چمتو کوي او د بیک انډ خدماتو سره د اړیکو توازن لپاره په عام ډول کارول شوي لایر-۷ انټرپوزیشن منطق پلي کوي. د لویو پیغامونو لپاره، لایکونیک په بلو فیلډ-۲ کې د یو واحد ARM کور سره چلول کولی شي د پراخه کارول شوي Nginx په پرتله چې په ډیر پیاوړي x86 کور کې چلول کیږي تر 8.7x پورې لوړ تروپټ ترلاسه کړي. د کوچنیو پیغامونو لپاره، په بلو فیلډ-۲ کې لایکونیک کولی شي د Nginx په پرتله د پرتلې وړ یا حتی ټیټ ځنډ سره لوړ تروپټ ترلاسه کړي. په LiquidIO۳ کې، د لایکونیک تروپټ د x86 نګینکس په پرتله 4.5x لوړ دی. موږ د ریښتیني نړۍ کاري بار سره د لایکونیک فعالیت هم ښیو او د کلیدي نظرونو ګټو په اړه مفصل مایکرو بینچ مارکونه وړاندې کوو.
دا مقاله د CC BY-NC-ND 4.0 DEED جواز لاندې په arxiv کې شتون لري .