A wrapper around parallel MUMPS solver to reduce its memory usage and execution time for finite element method computations
PBN-AR
Instytucja
Wydział Informatyki, Elektroniki i Telekomunikacji (Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie)
Informacje podstawowe
Główny język publikacji
EN
Czasopismo
Procedia Computer Science
ISSN
EISSN
1877-0509
Wydawca
Elsevier
DOI
Rok publikacji
2017
Numer zeszytu
Strony od-do
838--847
Numer tomu
108
Link do pełnego tekstu
Identyfikator DOI
Liczba arkuszy
0.71
Autorzy
(liczba autorów: 2)
Pozostali autorzy
+ 1
Słowa kluczowe
EN
parallel direct solver
wrapper
memory minimization
Konferencja
Indeksowana w Scopus
tak
Indeksowana w Web of Science Core Collection
tak
Liczba cytowań z Web of Science Core Collection
Nazwa konferencji (skrócona)
ICCS 2017
Nazwa konferencji
The International Conference of Computational Science
Początek konferencji
2017-06-12
Koniec konferencji
2017-06-14
Lokalizacja konferencji
Zurich
Kraj konferencji
CH
Lista innych baz czasopism i abstraktów w których była indeksowana
Streszczenia
Język
EN
Treść
In this paper, we present a wrapper around MUMPS solver, called Hierarchical Solver Wrapper (HSW), that is tailored to domain decomposition-based parallel finite element method computations on distributed memory systems. It offers the same interface as parallel MUMPS with matrix entries in coordinate format provided in a distributed fashion among multiple processors. The algorithm implemented by the wrapper utilizes multiple sequential instances of MUMPS solver to compute Schur complements over subdomains. Next, it deallocates sequential MUMPS solvers and LU factors, and it calls the parallel MUMPS solver feeded with the Schur complements, stored in distributed manner. In the backward substitution stage it recomputes the local LU factors before solving the local problems. The wrapper has been tested with three-dimensional isogeometric analysis computations, and we show it reduces both the memory usage and the execution time, in comparison with a single parallel MUMPS call.
Cechy publikacji
original article
peer-reviewed
Inne
System-identifier
idp:106959
CrossrefMetadata from Crossref logo
Cytowania
Liczba prac cytujących tę pracę
Brak danych
Referencje
Liczba prac cytowanych przez tę pracę
Brak danych