@article { author = {akbarzadeh, pooria and Mahmoodi Darian, Hossein and Nazari, Mohsen and Souri, Milad}, title = {Parallel Thomas Approach in Computational Fluid Dynamics with GPUs- Lid-driven Cavity}, journal = {Journal Of Applied and Computational Sciences in Mechanics}, volume = {28}, number = {2}, pages = {152-164}, year = {2017}, publisher = {Ferdowsi University of Mashhad}, issn = {2008-918X}, eissn = {2423-6519}, doi = {10.22067/fum-mech.v28i2.48399}, abstract = {In this paper three algorithms of Cyclic-Reduction, Parallel-Cyclic-Reduction and Parallel-Thomas are introduced to solve the Tridiagonal system of equations using GPUs and the effect of coalesced-memory-access and uncoalesced-memory-access to global memory are studied. To assess the ability of these algorithms, as a case-study the simulation of the lid-driven cavity flow have been compared to the results of Runtimes and physical parameters of the classical Thomas algorithm, executed on CPU. The maximum speed-up of these algorithms against CPU runtime is about 4.4x, 5.2x and 38.5x, respectively. Also, approximately a 2x speed-up achieved in coalesced-memory access on GPU.}, keywords = {Parallel Thomas approach,Parallel Processing,Tridiagonal system of equations,Graphic Processor,Cyclic Reduction algorithm}, title_fa = {رهیافت توماس موازی در دینامیک سیالات محاسباتی به‌کمک پردازنده‌های‌گرافیکی – جریان درون حفره}, abstract_fa = {در این مقاله سه الگوریتم کاهش‌متناوب، کاهش‌متناوب موازی و رهیافت توماس ‌موازی برای حل دستگاه معادلات سه‌‌قطری به‌کمک پردازنده‌های گرافیکی معرفی و اثر دسترسی هم‌مکان و غیرهم‌مکان به حافظۀ سراسری مورد بحث قرار گرفته‌است. برای ارزیابی توانایی این الگوریتم‌ها، نتایج شبیه‌سازی جریان درون حفره (یک مورد مطالعاتی) با نتایج الگوریتم توماس‌کلاسیک اجراشده روی پردازندۀ مرکزی مقایسه شده‌است. بیشینه افزایش سرعت مشاهده‌شده در سه الگوریتم مذکور (پردازنده‌گرافیکی) در برابر الگوریتم توماس کلاسیک (پردازندۀ مرکزی) به‌ترتیب حدود 4/4، 2/5 و 45/38 می‌باشد. هم‌چنین نشان داده شده است که با دسترسی هم‌مکان، افزایش سرعت حدوداً دوبرابری برای پردازندۀ گرافیکی حاصل می‌شود.}, keywords_fa = {رهیافت توماس موازی,پردازش موازی,دستگاه معادلات سه‌قطری,پردازندۀ گرافیکی,الگوریتم کاهش متناوب}, url = {https://mechanic-ferdowsi.um.ac.ir/article_32284.html}, eprint = {https://mechanic-ferdowsi.um.ac.ir/article_32284_da01e9049d3319b6f778199082c1a829.pdf} }