چکیده
انجام تجزیه و تحلیل یا تولید تصویری همزمان با شبیهسازی با کارایی بالا میتواند مزایای زیادی در مقایسه با دادههای پس پردازش داشته باشد. نوشتن و خواندن حجم زیادی از دادهها را میتوان کاهش داد یا حذف کرد در نتیجه باعث صرفهجویی در هزینه I / O میشود. یکی از این روشها برای شبیهسازی همزمان و تجزیه و تحلیل دادههای جاری در حال انتقال از منابع اجرای شبیهسازی به یک منبع جداگانه در حال اجرای تحلیل است. در تجزیه و تحلیل حمل و نقل میتواند سودمند باشد، زیرا منابع محاسباتی ممکن است منابع مشخصی برای تجسم و تجزیه و تحلیل (مانند GPU ها) و برای کاهش تاثیر انجام کارهای تجزیه و تحلیل به زمان اجرای شبیه سازی نداشته باشند. در هنگام ارسال و دریافت دادهها در هنگام انتقال، مکانیزمهای توزیع داده به منظور پشتیبانی از چیدمانهای دادههای ناهمگن به کار گرفته میشوند که ممکن است توسط برنامههای شبیهسازی و آنالیز مورد نیاز باشد.
کاری که در این مقاله شرح داده شد، دو مکانیزم برای توزیع مجدد داده در هنگام پخش دادهها به موازات دو کاربرد حافظه توزیعشده را مقایسه میکند. نتایج ما نشان میدهد که این امر اغلب برای دادههای جریان در همان چیدمان به عنوان فرستنده و توزیع مجدد دادهها در فرآیند دریافت به جای دادههای جریان در چیدمان نهایی مورد نیاز گیرنده، مفید است.
معرفی
شبیهسازیها و آنالیز بر روی منابع محاسباتی با عملکرد بالا در حال هدایت دانش و مهندسی در مقیاس بزرگ هستند. برنامههایی که روی این مقادیر بسیار موازی کار میکنند، سیستمهای حافظه توزیعشده باید دادهها و محاسبه را بین فرآیندهای محاسبه انفرادی تقسیم کنند. یافته های کلیدی در 2014 DOE Performance Computing Operational Review بیان میکند که تجسم و تجزیه و تحلیل در محل و در حمل و نقل بیشتر رایج خواهد شد و باید به عنوان شهروندان درجه اول همراه با شبیه سازی HPC رفتار شود. همچنین گزارش میدهد که به علت محدودیت ورودی/خروجی ذخیره دادهها به دیسک، محاسبات به صورت ناگهانی افزایش مییابد.
در این مقاله، ما در حال بررسی تحقیقات در مورد بهبود عملکرد جریان موازی برای تجزیه و تحلیل ترانزیت بین دو برنامه کاربردی توزیع شده با توزیع دادههای ناهمگن هستیم. تحقیقات ما با تمایل به جریان دادههای شبیهسازی از مراکز کامپیوتری با عملکرد بالا به یک سیستم محلی پژوهشگر برای آنالیز سایت (مانند تصویر visualizations با رزولوشن بالا)که بر روی یک صفحه نمایش کاشی شده مشاهده میشود، برانگیخته شد.. پس از برجسته سازی آثار مرتبط که پژوهش ما را تحریک می کنند، ما دو تکنیک برای جریان سازی و سازماندهی مجدد اطلاعات بین دو خوشه از راه دور را مورد بحث قرار می دهیم. اولین تکنیک وضعیت فعلی است و شامل شبیهسازی با دانستن طرحبندی موردنظر برای درخواست تجزیه و تحلیل دریافت و ارسال قطعات مربوط به دادهها به طور مستقیم به گره تجزیه و تحلیل مناسب است. تکنیک دوم، نقطه اوج تحقیق ما است و شامل هر گره در شبیهسازی است که تمام اطلاعات آن را به یک گره تجزیه و تحلیل در یک بار محاسبه شده ارسال میکند و پس از آن، برنامه تجزیه و تحلیل دادهها را به صورت محلی توزیع میکند تا آن را در طرح مورد نظر به پایان برساند. از آنجاییکه توزیع مجدد داده های محلی یک چالش به خودی خود است، پس ما در مورد توسعهمان از کتابخانه دینامیکی اطلاعات توزیع (DDR) بحث خواهیم کرد. کتابخانه DDR محاسبه میکند که چه دادههایی باید با هر فرآیند رد و بدل شود و روال MPI را خلاصه کند تا برنامههای HPC را مجددا در توزیع دادهها بین فرآیندها را تعریف کند. توسعهدهندگان برنامه باید به سادگی آنچه را که هر فرآیند در حال حاضر مالک است و دادههای هر فرآیند را با توجه به دامنه کلی داده است را مشخص کنند.
جریان موازی با صفحهبندی دادههای ناهمگون
توزیع مجدد داده پویا
______________________________________
برای دانلود و مطالعه کامل مقاله اینجا کلیک کنید.