WO2020174536A1 - 数値計算方法および数値計算プログラム - Google Patents

数値計算方法および数値計算プログラム Download PDF

Info

Publication number
WO2020174536A1
WO2020174536A1 PCT/JP2019/007071 JP2019007071W WO2020174536A1 WO 2020174536 A1 WO2020174536 A1 WO 2020174536A1 JP 2019007071 W JP2019007071 W JP 2019007071W WO 2020174536 A1 WO2020174536 A1 WO 2020174536A1
Authority
WO
WIPO (PCT)
Prior art keywords
time
fluid
equation
numerical calculation
physical quantity
Prior art date
Application number
PCT/JP2019/007071
Other languages
English (en)
French (fr)
Inventor
宏樹 深川
Original Assignee
国立大学法人九州大学
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 国立大学法人九州大学 filed Critical 国立大学法人九州大学
Priority to PCT/JP2019/007071 priority Critical patent/WO2020174536A1/ja
Priority to JP2021501394A priority patent/JP7262844B2/ja
Publication of WO2020174536A1 publication Critical patent/WO2020174536A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/28Design optimisation, verification or simulation using fluid dynamics, e.g. using Navier-Stokes equations or computational fluid dynamics [CFD]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/23Design optimisation, verification or simulation using finite element methods [FEM] or finite difference methods [FDM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2111/00Details relating to CAD techniques
    • G06F2111/06Multi-objective optimisation, e.g. Pareto optimisation using simulated annealing [SA], ant colony algorithms or genetic algorithms [GA]

Definitions

  • FIG. 1 is a diagram showing the concept of a shared memory type hierarchical structure.
  • FIG. 2 is a diagram showing the concept of a distributed memory type hierarchical structure.
  • FIG. 3 is a diagram showing the concept of the explicit method with high locality of reference.
  • FIG. 4 is a schematic view of a fluid bearing used in the example.
  • FIG. 5 is a schematic diagram showing coordinate conversion from the natural coordinate system to the spatial coordinate system.
  • FIG. 6 is a graph showing the calculation result of the pressure distribution.
  • FIG. 7 is a graph showing the calculation result of the density distribution.
  • FIG. 8 is a graph showing comparison of calculation results of pressure distribution.
  • FIG. 9 is a graph showing comparison of calculation results.
  • FIG. 10 is a graph showing the verification result of the parallel performance.
  • FIG. 1 is a diagram showing a concept of a shared memory type hierarchical structure
  • FIG. 2 is a diagram showing a concept of a distributed memory type hierarchical structure.
  • the numerical calculation method and the numerical calculation program according to the embodiments of the present invention are preferably implemented in a computer having a plurality of arithmetic units and a hierarchical storage device for storing data used by these arithmetic units. Therefore, a calculation process in a computer including a plurality of arithmetic units and a hierarchical storage device will be described with reference to FIGS. 1 and 2.
  • a computer including a plurality of arithmetic units is also called a parallel computer or a parallel computer, and the calculation processing on this parallel computer is also called parallel processing or parallel computing.
  • the fluid structure coupled analysis using the iterative method is not suitable for the architecture of the current mainstream computer. This is because the fluid structure coupled analysis using the iterative method needs to compare the errors in the solutions of the separately solved equations, and the locality of reference is low. Therefore, the numerical calculation method and the numerical calculation program according to the embodiment of the present invention perform fluid structure coupled analysis using the explicit method.
  • the explicit method will be described below.
  • FIG. 3 is a diagram showing the concept of the explicit method with high locality of reference. It should be noted that in FIG. 3, the position and the time are represented by the same index. As shown in FIG. 3, the equation shown in the above equation (3) is to obtain ⁇ (l,m+1) of the position l at the time m+1 when obtaining ⁇ (l,m+1) of the position l at the time m+1.
  • Expressions (4) and (5) have the form of Expression (1) to which the explicit method with high locality can be applied. Therefore, the explicit method can be applied to the equations (4) and (5) to calculate the time evolution of * ⁇ and u.
  • the physical quantity * ⁇ and u of the fluid at the second time t+ ⁇ t which is a short time after the physical quantity * ⁇ and u of the fluid at the first time t, are calculated as above ( 4) Calculate using (5).
  • Expressions (8) and (11) have the form of Expression (1) to which the explicit method with high locality can be applied. Therefore, the explicit method can be applied to the equations (8) and (11) to calculate the time evolution of the velocity field u.
  • the numerical calculation method and the numerical calculation program according to the embodiment of the present invention calculate the physical quantity u of the structure at the second time t+ ⁇ t, which is a short time after the physical quantity u of the structure at the first time t, by using the above formula (8) ( Calculate using 11).
  • the number of structural lattices in the shaft 21 and the bearing 22 is 100 in the circumferential direction, 5 in the axial direction, and 5 in the radial direction.
  • the number of structural exercises in the lubricating oil 23 is the same as in the case of the shaft 21 and the bearing 22 except that there is one layer in the radial direction.
  • the size of the structured grid is made small in the narrowest part of the gap where the pressure changes drastically.
  • FIG. 5 is a schematic diagram showing coordinate conversion from the natural coordinate system to the spatial coordinate system.
  • FIG. 10 is a graph showing the verification result of the parallel performance.
  • the numerical calculation program according to the embodiment of the present invention is suitable as a command for a distributed memory type parallel computer as shown in FIG. 2, and the numerical calculation method according to the embodiment of the present invention is shown in FIG. It is suitable as a process in a distributed memory type parallel computer.
  • GPU is a computing device for image processing, but it is a technology that applies it to purposes other than image processing.
  • the GPU cannot perform calculation processing by itself, but can also perform numerical calculation by a command from a separate CPU.
  • the GPU substantially functions as a shared memory type parallel computer as shown in FIG.
  • the GPU has a larger number of arithmetic units and a larger memory bandwidth than the CPU. Therefore, GPGPU is often used as an alternative to a parallel computer.
  • the numerical calculation method and the numerical calculation program according to the embodiment of the present invention do not need to solve simultaneous equations.
  • it is necessary to calculate the metric tensor g which has a relatively high calculation load.
  • the simultaneous equations are solved by the conjugate gradient method (iteration method)
  • SpMV occupies most of the whole calculation.
  • SpMV has a high B/F value and cannot utilize the computing performance of the GPU. Therefore, the GPGPU to which the numerical calculation method and the numerical calculation program according to the embodiments of the present invention are applied can effectively utilize the performance of the GPU as compared with the conventional processing that needs to solve simultaneous equations, and the calculation speed is improved. ing.

Abstract

本発明の数値計算方法および数値計算プログラムは、第1時刻のみにおける流体の物理量から第2時刻における流体の物理量を流体の支配方程式を用いて計算する処理と、第1時刻のみにおける構造体の物理量から第2時刻における構造体の物理量を構造体の支配方程式を用いて計算する処理と、第1時刻のみにおける流体の圧力と構造体の応力を対応させて、第2時刻における流体と構造体との境界面の位置を境界面の支配方程式を用いて計算する処理とを含む。

Description

数値計算方法および数値計算プログラム
 本発明は、数値計算方法および数値計算プログラムに関する。
 現在の製品設計ではCAD(Computer-Aided Design)が一般的に用いられている。さらに、製品設計で作成されるCADデータを研究・開発工程におけるエンジニアリングにも用いる、いわゆるCAE(Computer-Aided engineering)も実用化されてきた。CADデータを用いてシミュレーションを行うことで製品性能の事前検証ができれば研究・開発工程を高速化できるからである。
 工業製品の検証では流体構造連成解析が必要とされる。流体構造連成解析とは、流体の流動と構造体の変形の相互作用を考慮した解析であり、例えば軸受の事前検証では、潤滑油の流れで生じる力で軸受が変形する様子を解析する必要がある。この相互作用に関し、従来の流体構造連成解析では、流体と構造体で別個に方程式を解き、境界面を修正して解を収束させる反復法が用いられてきた(例えば特許文献1参照)。
特開2006-72566号公報
 しかしながら、反復法を用いた流体構造連成解析で解を収束させるためには、流体と構造体の方程式を反復して計算する必要がある。一方、現在のコンピュータの主流は、複数の演算器(コア)と階層構造のメモリを採用しており、メモリバンド幅が演算性能に比べて低い(Byte/Flopが低い)。このような構成のコンピュータの演算性能を引き出すにはレジスタやキャッシュメモリを有効に使い、メモリにおけるデータ通信量を抑えることができる参照の局所性が高い計算方法を用いる必要がある。この観点からは、反復法を用いた流体構造連成解析は、別個に解いた方程式の解における誤差を比較する必要があり、現在の主流となっている計算機のアーキテクチャに適するものではない。
 本発明は、上記に鑑みてなされたものであり、その目的は、参照の局所性が高い流体構造連成解析の数値計算方法および数値計算プログラムを提供することである。
 上記課題を解決するために、本発明の一態様にかかる数値計算方法は、複数の演算器と前記演算器が演算に用いるデータを記憶するための階層型の記憶装置とを有するコンピュータを用いて、前記階層型の記憶装置に記憶されている第1時刻における流体および構造体の物理量から微小時間後の第2時刻における前記流体および前記構造体の物理量を連成解析する数値計算方法であって、前記第1時刻のみにおける流体の物理量から前記第2時刻における前記流体の物理量を流体の支配方程式を用いて計算する処理と、前記第1時刻のみにおける構造体の物理量から前記第2時刻における前記構造体の物理量を構造体の支配方程式を用いて計算する処理と、前記第1時刻のみにおける流体の圧力と構造体の応力を対応させて、前記第2時刻における流体と構造体との境界面の位置を境界面の支配方程式を用いて計算する処理と、を含むことを特徴とする。
 また、本発明の一態様にかかる数値計算プログラムは、複数の演算器と前記演算器が演算に用いるデータを記憶するための階層型の記憶装置とを有するコンピュータに対して、前記階層型の記憶装置に記憶されている第1時刻における流体および構造体の物理量から微小時間後の第2時刻における前記流体および前記構造体の物理量を連成解析する数値計算を指令する数値計算プログラムであって、前記第1時刻のみにおける流体の物理量から前記第2時刻における前記流体の物理量を流体の支配方程式を用いて計算する処理と、前記第1時刻のみにおける構造体の物理量から前記第2時刻における前記構造体の物理量を構造体の支配方程式を用いて計算する処理と、前記第1時刻のみにおける流体の圧力と構造体の応力を対応させて、前記第2時刻における流体と構造体との境界面の位置を境界面の支配方程式を用いて計算する処理と、を含むことを特徴とする。
 本発明によれば、参照の局所性が高い流体構造連成解析の数値計算方法および数値計算プログラムを提供することができる。
図1は、共有メモリ型の階層構造の概念を示す図である。 図2は、分散メモリ型の階層構造の概念を示す図である。 図3は、参照の局所性が高い陽解法の概念を示す図である。 図4は、実施例に用いる流体軸受の模式図である。 図5は、自然座標系から空間座標系への座標変換を示す模式図である。 図6は、圧度分布の計算結果を示すグラフである。 図7は、密度分布の計算結果を示すグラフである。 図8は、圧力分布の計算結果の比較を示すグラフである。 図9は、計算結果の比較を示すグラフである。 図10は、並列性能の検証結果を示すグラフである。
 以下、図面を参照しながら、本発明の実施形態にかかる数値計算方法および数値計算プログラムを詳細に説明する。ただし、以下の説明で参照される図面は模式的なものであり、寸法またはその比率が実際のものとは異なる場合がある。
〔装置構成〕
 図1は、共有メモリ型の階層構造の概念を示す図であり、図2は、分散メモリ型の階層構造の概念を示す図である。本発明の実施形態にかかる数値計算方法および数値計算プログラムは、複数の演算器とこれらが演算に用いるデータを記憶するための階層型の記憶装置とを有するコンピュータにおいて好適に実施される。そこで、図1および図2を参照しながら、複数の演算器と階層構造の記憶装置を備えるコンピュータにおける計算処理について説明する。なお、複数の演算器を備えるコンピュータは並列計算機や並列コンピュータとも呼ばれ、この並列計算機上の計算処理は並列処理や並列コンピューティングとも呼ばれる。
 図1に示される概念図には、複数の演算器10~10とこれらが演算に用いるデータを記憶するための階層型の記憶装置11とを備える並列計算機100が記載されている。階層型の記憶装置11とは、各演算器10~10と主記憶装置12との間に階層化された記憶装置を配したものである。図1に示される例では、演算器10~10から順に、レジスタ13~13、L1キャッシュメモリ14~14、L2キャッシュメモリ15~15、主記憶装置12の構成を有している。なお、図1に示される構成は、一つの例であり、階層型の記憶装置11の構成はこれに限定されるものではなく、階層の程度としても、L2キャッシュメモリ15~15と主記憶装置12との間にL3キャッシュメモリを備えるなどの変形例がある。
 これらの記憶装置の処理速度は、主記憶装置12、L2キャッシュメモリ15~15、L1キャッシュメモリ14~14、レジスタ13~13の順で高速であり、メモリのデータ転送能力であるメモリバンド幅は、演算器10~10の演算性能に比べて低い(Byte/Flopが低い)。このような特性から、参照の局所性を高めることが演算性能を発揮させるために重要となる。
 なお、参照の局所性が高い状態とは、一度参照されたデータが再度参照されることや当該データに近いアドレスのデータが参照される可能性が高いという状態である。言い換えると、演算器10~10がレジスタ13~13またはL1キャッシュメモリ14~14もしくはL2キャッシュメモリ15~15など上位の記憶装置に記憶されているデータを用いて計算を行うことができる状態である。
 逆に言えば、演算器10~10が主記憶装置12に記憶されているデータを用いなければいけない状況を少なくする戦略が必要である。例えば、そのような状況は、演算器10が計算した結果を用いて演算器10が計算をしなければいけないときに起きる。また、演算器10が計算した結果を用いて演算器10が計算をしなければいけない場合には、演算器10の計算が終わらなければ演算器10の計算を開始することができず、待ち時間が発生してしまうという問題も発生してしまう。
 図2は、分散メモリ型の階層構造の概念を示す図であり、大型計算機システムなどで採用されている。図2に示される並列計算機200では、各ノード16~16が複数の演算器とこれらが演算に用いるデータを記憶するための階層型の記憶装置とを備えており、さらに、各ノード16~16における主記憶装置12~12がネットワーク17を介して互いに共有されている。ここで、主記憶装置12~12の共有とは、主記憶装置12~12に単一のアドレスを付与することで、各ノード16~16の演算器が、主記憶装置12~12に記憶されているデータを相互に参照することができることをいう。
 上記のような構成のコンピュータでも、参照の局所性を高めることが演算性能を発揮させるために重要となる。特に、あるノード16~16の演算器が、他のノード16~16の主記憶装置12~12に記憶されているデータを参照するような状況を可能な限り少なくすることが重要である。
 上記観点から、反復法を用いた流体構造連成解析は、現在の主流となっている計算機のアーキテクチャに適するものではない。反復法を用いた流体構造連成解析は、別個に解いた方程式の解における誤差を比較する必要があり、参照の局所性が低いからである。そこで、本発明の実施形態にかかる数値計算方法および数値計算プログラムは、陽解法を用いた流体構造連成解析を行う。以下、陽解法に関する説明を行う。
〔陽解法〕
 陽解法とは、第1時刻tにおける状態量のみから微小時間後の第2時刻t+Δtにおける位置xの状態量を計算する方法である。一方、陰解法は、第2時刻t+Δtにおける位置xの状態量を計算するために、第2時刻t+Δtにおける他の位置xiの状態量も用いる方法である。端的には、陰解法は、第2時刻t+Δtにおける位置xの状態量を計算するために、第2時刻t+Δtにおける他の位置xiの状態量も含んだ連立方程式を解く必要があり、陽解法では、このような連立方程式を解く必要がない。
 このように、陽解法では、連立方程式を解く必要がないので、時間ステップ当たりの計算量およびメモリ転送量が少ない。さらに、第2時刻t+Δtにおける位置xの状態量を計算するために、第1時刻tにおける位置xの近傍のみの状態量から計算するようにすれば、より一層、参照の局所性が高まる。そこで、以下で参照の局所性が高い陽解法を適用し得る条件について説明する。
 結論としては、ある領域の場φ(n,t)の時間発展が、以下の式(1)に示すように、場φ(n,t)と当該場の空間に関する一階微分φ′(n,t)と二階微分φ″(n,t)の関数fで表現することができればよい。なお、位置をn=(n1,n2,n3)とし、時刻をtとしている。
Figure JPOXMLDOC01-appb-M000002
 上記式(1)のように表現される場φ(n,t)を時刻および位置に関して離散化する。時刻tの離散化は、自然数mを用いてt(m+1)=t(m)+Δtとする。位置nの離散化は、自然数lから位置n=(n1,n2,n3)への関数n(l)とする。そして、自然数lに対応した位置n(l)の周辺の点を自然数の組(l,j)から自然数への関数k(l,j)を用いてn(k(l,j))と表す。
 すると、離散化された場の一階微分φ′(n(l),t(m))と二階微分φ″(n(l),t(m))は、位置n(l)の周辺の点における場φ(n(k(l,j)),t(m))の関数で近似できる。したがって、f(φ(n,t),φ′(n,t),φ″(n,t))を離散化したものは、F(φ(n(k(l,j)),t(m)))と近似できる。
 結果、上記式(1)は、以下のように離散化される。
Figure JPOXMLDOC01-appb-M000003
 また、上記式(2)における位置n(l)と時間t(m)を離散化に用いたインデックス(l,m)で同一すれば、以下のように表現される。なお、j(l)は、これはインデックスlの位置n(l)の周辺の点に割り振られたインデックスである。
Figure JPOXMLDOC01-appb-M000004
 上記式(3)から解るように、φ(l,m+1)がφ(l,m)とφ(j(l),m)で定まる。ここで重要なことは、式(3)の右辺には、m+1が含まれないことである。このことは、第1時刻t(m)における状態量のみから微小時間後の第2時刻t(m+1)における位置n(l)の状態量を計算することができることを意味している。
 また、式(3)の右辺には、j(l)が含まれているが、これはインデックスlの位置n(l)の周辺の点に割り振られたインデックスとしたのだから、φ(j(l),m)は、第1時刻t(m)における位置n(l)の周辺の点の場φの値である。図3は、参照の局所性が高い陽解法の概念を示す図である。なお、図3では、位置および時間をインデックスで同一視して表記している。上記式(3)に示される方程式は、図3に示されるように、時刻m+1における位置lのφ(l,m+1)を求める際に、時刻mにおける位置lのφ(l,m)とその近傍の位置j-1(l),j+1(l)等におけるφ(j(l),m)を用いるだけでよいことを意味している。インデックスlは、φの値をメモリに記憶する際のアドレスの近さに対応するので、φ(l,m+1)の計算に際し、φ(l,m)とφ(j(l),m)という参照の局所性が高いデータを用いていることになる。
 以上の議論から解るように、上記式(1)のように表現できる場合、参照の局所性が高い陽解法を用いることができる。したがって、陽解法を用いた流体構造連成解析を行うためには、流体の支配方程式、構造体の支配方程式、および流体と構造体の境界面の支配方程式を上記式(1)のように表現することが次の目標となる。
〔流体の支配方程式〕
 流体の支配方程式には、連続の式とナビエ・ストークス方程式を用いる。連続の式は、下記式(4)のように表現され、ナビエ・ストークス方程式は下記式(5)のように表現される。
Figure JPOXMLDOC01-appb-M000005
Figure JPOXMLDOC01-appb-M000006
 ここで、ρは流体内の質量密度であり、*ρは、その双対ホッジであり、要素内の総質量を表す。速度場u#に関するLie微分をLu#と書く。計量テンソルをg( , )とし、u:=g(u#, )と定める。圧力Pは質量密度ρの関数とする。なお、Δはホッジラプラシアンとし、すなわちΔ=d*d*-*d*dである。
 上記式(4)(5)と式(1)を比較すると解るように、式(4)(5)は、局所性が高い陽解法を適用し得る式(1)の形を有している。したがって、式(4)(5)に陽解法を適用し、*ρとuの時間発展を計算することができる。本発明の実施形態にかかる数値計算方法および数値計算プログラムは、第1時刻tにおける流体の物理量*ρおよびuから微小時間後の第2時刻t+Δtにおける流体の物理量*ρおよびuを上記(4)(5)を用いて計算する。
〔構造体の支配方程式〕
 構造体の時間発展を記述するためには、構造体の変形に伴う体積素片の位置を追跡する。このとき、初期時刻における体積素片の位置を示す座標値を用いて各体積素片をラベル付けすることができる。このように構造体の体積素片に固定された座標(t,n1,n2,n3)をラグランジュ座標もしくは自然座標という。一方、空間に固定された通常の空間座標(t,x1,x2,x3)はオイラー座標といわれる。ラグランジュ座標の各座標を時刻ごとにオイラー座標に変換する関数Xi(t,n)は、構造体の時間発展を一意に定める。
 ラグランジュ座標における計量をg=gijdni×dnjとすると、構造体の歪みの時間変化はラグランジュ座標における計量テンソルgijの時間変化を用いて下記式(6)で表すことができる。なお、構造体の応力テンソルki jは、ei j:=gjkekjの関数となる。
Figure JPOXMLDOC01-appb-M000007
 オイラー座標におけるMusical isomorphismをオイラー座標における計量δijdxi×dxjを用いて行う。すなわち、Xi:=δijXjである。
 構造体の支配方程式では、ナビエ・ストークス方程式に対応する速度場として下記式(7)を用いる。
Figure JPOXMLDOC01-appb-M000008
 この速度場に関する構造体の支配方程式は、下記式(8)のように表現される。ただし、下式におけるsは変位ベクトルsiij(Xj-nj)である。
Figure JPOXMLDOC01-appb-M000009
 ここで、上記式(8)における圧力Pは、構造体の歪みeを用いて以下のように計算できる。
Figure JPOXMLDOC01-appb-M000010
 ここで、ラメ定数λとμは、ヤング率Eとポアソン比νを用いて、それぞれ以下のように表すことができる。
Figure JPOXMLDOC01-appb-M000011
 なお、上記式(7)を座標表示した場合は下記式(11)のように表現される。
Figure JPOXMLDOC01-appb-M000012
Figure JPOXMLDOC01-appb-M000013
 上記式(8)(11)と式(1)を比較すると解るように、式(8)(11)は、局所性が高い陽解法を適用し得る式(1)の形を有している。したがって、式(8)(11)に陽解法を適用し、速度場uの時間発展を計算することができる。本発明の実施形態にかかる数値計算方法および数値計算プログラムは、第1時刻tにおける構造体の物理量uから微小時間後の第2時刻t+Δtにおける構造体の物理量uを上記式(8)(11)を用いて計算する。
〔境界面の支配方程式〕
 流体と構造体の境界面では、境界面の位置の速度場uが下記式(13)に従うとする。
Figure JPOXMLDOC01-appb-M000014
 ただし、流体側のPは、流体の密度の関数としての流体の圧力を用い、構造体側のPは、先述の式(9)で表される歪みeの関数としての圧力を用いる。
 上記式(13)と式(1)を比較すると解るように、式(13)は、局所性が高い陽解法を適用し得る式の形(1)を有している。したがって、式(13)に陽解法を適用し、境界面の位置の速度場uの時間発展を計算することができる。本発明の実施形態にかかる数値計算方法および数値計算プログラムは、第1時刻tにおける流体の圧力と構造体の応力を対応させて、微小時間後の第2時刻t+Δtにおける流体と構造体との境界面の位置を境界面の位置を、上記式(13)を用いて計算する。
 以上説明したように、本発明の実施形態にかかる数値計算方法および数値計算プログラムが用いる、流体の支配方程式、構造体の支配方程式、および境界面の支配方程式は、局所性が高い陽解法を適用し得る式(1)の形を有している。したがって、複数の演算器と演算器が演算に用いるデータを記憶するための階層型の記憶装置とを有するコンピュータを用いて、階層型の記憶装置に記憶されている第1時刻における流体および構造体の物理量から微小時間後の第2時刻における流体および構造体の物理量を連成解析する際に、図3に示したような局所性が高い陽解法を適用し得る。
 また、本発明の実施形態にかかる数値計算方法および数値計算プログラムでは、流体の支配方程式、構造体の支配方程式、および境界面の支配方程式の全てが式(1)の形を有しているので、これらを時刻および位置で離散化した方程式は、式(3)の形をしている。したがって、並列計算機における演算器にとっては、流体の支配方程式と構造体の支配方程式と境界面の支配方程式とを区別することなく均等に処理することができる。例えば、MPIを使って並列計算する場合には、解析モデルを等分に領域分割することで、ロードバランスをよくできる。
〔流体軸受の流体構造連成解析における実施例〕
 以下、上記説明した数値計算方法を用いた流体軸受の流体構造連成解析の実施例について説明する。
 図4は、実施例に用いる流体軸受の模式図である。図4に示されるように、流体軸受20は、中心に軸21を配し、軸21の外側に軸受22を配し、軸21と軸受22との隙間に潤滑油23を充填した構成を有する。当該構成を有ることにより流体軸受20は、潤滑油23の流動によって軸21と軸受22との関係が自在に回転可能となっている。
 本実施例に用いる流体軸受20の具体的な寸法は、軸21の半径が30mmであり、軸受22の厚さが30mmであり、軸方向の長さが10mmであり、軸21と軸受22との隙間が30μmである。また、軸21と軸受22との軸心の偏心量は、1.5μmであり、軸21と軸受22との隙間と偏心量との比である偏心率は0.95である。なお、図4では、各構成の配置が見やすいように軸21と軸受22との隙間における潤滑油23の膜厚を実際の比率よりも大きく表示してある。
 軸21および軸受22における構造格子の個数は、円周方向に100個であり、軸方向に5個であり、径方向に5個である。潤滑油23における構造行使の個数は、径方向に1層であることの他、軸21および軸受22の場合と同じである。なお、計算精度を向上させるために、圧力変化が激しい隙間の最狭部では構造格子の大きさを小さくしている。
 潤滑油23の特性は、大気圧下での密度ρが1000kg/mであり、粘度ηが10mPa・sである。軸21の回転数は1000rpmであり、軸21と潤滑油23との境界面の移動速度uは3.14m/sである。
 次に、上記のように設定された軸21と軸受22と潤滑油23の構造格子を、図5に示すように座標変換する。図5は、自然座標系から空間座標系への座標変換を示す模式図である。
 図5のように自然座標系(n1,n2,n3)から空間座標系(x1,x2,x3)への座標変換を考えると、各格子の自然座標nから空間座標xへの写像は、形状関数Nα(n)を用いてxi(n)=xi αNα(n)で与えられる。ここでxi αは、節点番号αの節点の空間座標におけるi成分の値である。
 6面体の2次要素では節点が20個ある。表1は要素の中心点を原点にした場合の節点番号と自然座標との対応を表している。
Figure JPOXMLDOC01-appb-T000015
Figure JPOXMLDOC01-appb-T000016
 ただし、上記表2に記載の関数l(r),m(r)は以下で与えられる。
Figure JPOXMLDOC01-appb-M000017
Figure JPOXMLDOC01-appb-M000018
 構造格子の各要素の形状の情報は、自然座標上の計量テンソルgに集約される。この計量テンソルの成分をgijとすると、体積要素は以下のように計算できる。
Figure JPOXMLDOC01-appb-M000019
 一方、計量テンソルgijは、空間座標上の計量テンソルδklから以下のように計算できる。なお、空間座標がカルテシアン座標の場合にはδklがクロネッカーデルタになる。
Figure JPOXMLDOC01-appb-M000020
 上記計量テンソルgijを用いて、流体の支配方程式(式(4)(5))を表現すると以下のようになる。
Figure JPOXMLDOC01-appb-M000021
Figure JPOXMLDOC01-appb-M000022
〔第1の検証〕
 以上のような設定の下、本発明の実施形態にかかる数値計算方法の検証を行う。第1の検証では、軸21および軸受22が剛体であると仮定し、潤滑油23の圧力分布と密度分布の計算を行う。
 時間刻みを0.1μsとし、自然座標系での空間刻みを2.0として、流体の支配方程式(式(4)(5)すなわち式(18)(19))を離散化して陽解法を適用して潤滑油23の圧力分布と密度分布の計算を行った。図6は、圧度分布の計算結果を示すグラフであり、図7は、密度分布の計算結果を示すグラフである。
 図6および図7のいずれも、潤滑油23の軸方向中央部の値を記載している。また、横軸のθは、周方向の角度であり、隙間が最も狭くなる位置を0とし、最も広くなる位置を±πとしている。なお、潤滑油23は、θの正方向に流れているとして、周方向の境界条件を周期的境界条件としている。
 図6および図7に示されるグラフから解るように、大気圧下では1000kg/mであった質量密度が低圧領域では300kg/mまで下がっている。これは、低圧領域では気泡が発生し、平均質量密度が大きく下がっていることを示している。
 この計算結果の精度を検証するために、本発明の実施形態にかかる数値計算方法の計算結果とレイノルズ方程式をガウス=ザイデル法の計算結果とを比較する。レイノルズ方程式とは、質量保存の式とナビエ・ストークス方程式から導出される式であり、次式で与えられる。
Figure JPOXMLDOC01-appb-M000023
 ここでhは潤滑油23の膜厚であり、uは潤滑油23を挟む境界面の移動速度の平均値である。潤滑油23内の圧力Pの分布はρ,h,uの分布から計算できる。ガウス=ザイデル法では、式(20)の質量密度ρを定数として圧力Pを計算する。そして、計算された圧力Pから質量密度ρを計算する。その後、計算された質量密度ρを式(20)に再代入して圧力Pを再計算する。この操作を解が収束するまで繰り返す。
 キャビテーションを含めるには圧力Pが負圧になるとゼロに置き換える操作をする。この方法ではキャビテーションが発生する箇所で連続の式が満たされないので、一般には正しい圧力分布が得られない。しかし、θ=±πでP=0となる境界条件下では、正しい圧力分布を得ることができることが知られている。
 このように圧力分布を計算した結果と本発明の実施形態にかかる数値計算方法で圧力分布を計算した結果とを比較する。図8は、圧力分布の計算結果の比較を示すグラフである。図8に示されるグラフから解るように、レイノルズ方程式にガウス=ザイデル法を用いて計算した圧力分布(-印)とナビエ・ストークス方程式に本発明の実施形態にかかる数値計算方法を用いて計算した圧力分布(+印)は一致している。
〔第2の検証〕
 次に、軸受22が弾性体であるとし、潤滑油23の圧力分布の計算を行う。上記第1の検証の結果でも解るように、流体軸受では、軸の回転時に潤滑油23の膜厚の狭小部では圧力が高くなる。結果、弾性体である軸受22も変形を受ける。しかも、軸受22の変形は潤滑油23の膜厚にも影響を与えるので、膜厚の狭小部における潤滑油23の圧力にも影響を与える。ここでは、軸受22が剛体であると仮定した場合と弾性体であるとした場合の計算結果を比較する。
 図9は、計算結果の比較を示すグラフである。図9に示されるグラフには、軸受22が剛体であると仮定した場合の圧力分布が+印で記載され、軸受22が弾性体であるとした場合の圧力分布が-印で記載されている。また、図9に示されるグラフには、軸受22の変形量が●印で併記されている。
 図9から解るように、軸受22が弾性体であるとした場合、潤滑油23の高圧領域では、軸受22が押し広げられるので、軸受22が剛体であると仮定した計算結果よりも潤滑油23の圧力が低くなっている。このことは、本発明の実施形態にかかる数値計算方法が流体と構造体の相互作用を正しく反映させて連成解析を行っていることを示している。
〔並列計算機における性能検証〕
 次に、本発明の実施形態にかかる数値計算方法を並列計算機に対する指令として実施した場合、すなわち本発明の実施形態にかかる数値計算プログラムの性能を検証する。
 既述したように、現在主流のコンピュータは、複数の演算器と階層構造のメモリを採用しており、メモリバンド幅が演算性能に比べて低い。このような構成のコンピュータの演算性能を引き出すにはレジスタやキャッシュメモリを有効に使い、メモリにおけるデータ通信量を抑えることができる参照の局所性が高い計算方法を用いる必要がある。
 本発明の実施形態にかかる数値計算プログラムは、複数の演算器と階層構造のメモリを採用している並列計算機に対して第1時刻における流体および構造体の物理量から微小時間後の第2時刻における流体および構造体の物理量を連成解析する数値計算の指令であって、第1時刻における流体および構造体の物理量のみから第2時刻における流体および構造体の物理量を計算する陽解法を利用している。したがって、他の演算器が第2時刻における流体および構造体の物理量を計算し終えることを待たずに複数の演算器の各々が第2時刻における流体および構造体の物理量を計算することができる。つまり、いわゆる待ち時間が発生しない。
 また、本発明の実施形態にかかる数値計算プログラムは、用いる支配方程式の各々は、場の時間微分を、前記場および前記場の一階空間微分ならびに二階空間微分で表現したものであるので、これらを時刻および位置で離散化した場合、先述の式(3)のような形で表現されるので、第1時刻における流体および構造体の物理量のみから第2時刻における流体および構造体の物理量を計算することができるのみならず、離散化した一致のインデックスがメモリのアドレスに対応するので、参照の局所性が高い。つまり、階層構造のメモリにおいて、レジスタやキャッシュを有効に活用することができる。
 さらに、本発明の実施形態にかかる数値計算プログラムは、離散化した支配方程式がすべて先述の式(3)のような形で表現されるので、並列度が高い。すなわち、離散化した支配方程式を複数の演算器に割り当てて並列処理することで、演算器の処理能力を余すことなく活用することができる。
 本発明の実施形態にかかる数値計算方法および数値計算プログラムの並列性能の検証では、上記特性が確認される。検証に用いた並列計算機は、九州大学情報基盤研究開発センターのPIMERGY CX400であり、先述の図2に示される分散メモリ型の並列計算機である。
 このような分散メモリ型の並列計算機を用いて、本発明の実施形態にかかる数値計算プログラムで処理を行う数値計算問題を固定して、処理に用いる演算器の個数を増やしながら処理能力の測定を行う、いわゆる強スケーリングでの並列性能を測定する。図10は、並列性能の検証結果を示すグラフである。
 図10に示されるグラフから解るように、本発明の実施形態にかかる数値計算方法および数値計算プログラムでは、演算器の個数に比例して処理能力が理想的に増加している。なお、本発明の実施形態にかかる数値計算方法および数値計算プログラムでは、23616並列を用いた場合に1600億自由度の計算をすることができる。
 したがって、本発明の実施形態にかかる数値計算プログラムは、図2に示されるような分散メモリ型の並列計算機に対する指令として好適であり、本発明の実施形態にかかる数値計算方法は、図2に示されるような分散メモリ型の並列計算機における処理として好適である。
 さらに、本発明の実施形態にかかる数値計算方法および数値計算プログラムのGPGPU(General-purpose computing on graphics processing units)への適合性を検証する。
 GPGPUとは、GPUは画像処理のための演算装置であるが、これを画像処理以外の目的にも応用する技術である。GPUは、単体では計算処理を行うことはできないが、別途のCPUからの指令によって数値計算をすることも可能である。このとき、GPUは、実質的に図1に示されるような共有メモリ型の並列計算機として機能する。しかも、GPUは、CPUよりも演算器の個数が多く、メモリバンド幅も大きい。そこで、GPGPUが並列計算機の代替として活用されることも多い。
 本検証で使用するGPUはNVIDIA TESLA P100 for NVLink―Optimized Serversであり、Byte/Flopは0.138(B/F)=0.732(TByte/s)/5.3(TFlop/s)である。したがって、疎行列・ベクトル積(SpMV)が10(B/F)であることを考慮すると、GPU一枚あたりのSpMVの計算速度は、高々73.2(GFlop/s)=0.732(TByte)/10(Byte/Flop)にしかならない。
 一方、本発明の実施形態にかかる数値計算方法および数値計算プログラムを適用したGPGPUでは、計量テンソルgのGPU一枚あたりの計算速度は337(GFlop/s)である。このことは、以下のことを意味する。
 先述したように、本発明の実施形態にかかる数値計算方法および数値計算プログラムでは、連立方程式を解く必要がない。一方、比較的計算負荷が高い計量テンソルgの計算をする必要がある。連立方程式を共役勾配法(反復法)で解くと、SpMVが全体の計算における殆どを占める。SpMVは、上述したように、B/F値が高く、GPUの演算性能を活かせない。したがって、本発明の実施形態にかかる数値計算方法および数値計算プログラムを適用したGPGPUは、連立方程式を解く必要がある従来の処理よりもGPUの性能を有効活用することができ、計算速度が向上している。
 以上のように、本発明の実施形態にかかる数値計算プログラムは、図1に示されるような共有メモリ型の並列計算機に対する指令として好適であり、本発明の実施形態にかかる数値計算方法は、図1に示されるような共有メモリ型の並列計算機における処理として好適である。また、図2に示されるような分散メモリ型の並列計算機における各ノードが共有メモリ型の並列計算機として構成されている、共有分散メモリ型の並列計算機に対しても、本発明の実施形態にかかる数値計算方法および数値計算プログラムが有効であることは言うまでもない。
 以上、図面を参照しながら本発明を実施形態に基づいて説明してきたが、本発明は上記の実施形態よって限定されるものではない。上記説明した数値計算方法は、適切に数値計算プログラムとして実装することができ、逆に上記説明した数値計算プログラムの実行は、数値計算方法の実施とみなし得る。また、上記説明した数値計算プログラムは、コンピュータが読み取り可能な媒体に記録された状態で生産等の実施を行うことができる。
 100,200 並列計算機
 10~10 演算器
 11 階層型の記憶装置
 12 主記憶装置
 13~13 レジスタ
 14~14 L1キャッシュメモリ
 15~15 L2キャッシュメモリ
 16~16 ノード
 17 ネットワーク
 20 流体軸受
 21 軸
 22 軸受
 23 潤滑油

 

Claims (8)

  1.  複数の演算器と前記演算器が演算に用いるデータを記憶するための階層型の記憶装置とを有するコンピュータを用いて、前記階層型の記憶装置に記憶されている第1時刻における流体および構造体の物理量から微小時間後の第2時刻における前記流体および前記構造体の物理量を連成解析する数値計算方法であって、
     前記第1時刻のみにおける流体の物理量から前記第2時刻における前記流体の物理量を流体の支配方程式を用いて計算する処理と、
     前記第1時刻のみにおける構造体の物理量から前記第2時刻における前記構造体の物理量を構造体の支配方程式を用いて計算する処理と、
     前記第1時刻のみにおける流体の圧力と構造体の応力を対応させて、前記第2時刻における流体と構造体との境界面の位置を境界面の支配方程式を用いて計算する処理と、
     を含むことを特徴とする数値計算方法。
  2.  前記流体の支配方程式は、ナビエ・ストークス方程式および連続の方程式であることを特徴とする請求項1に記載の数値計算方法。
  3.  前記構造体の支配方程式は、応力と歪の関係を表す構成方程式であることを特徴とする請求項1または請求項2に記載の数値計算方法。
  4.  前記境界面の支配方程式は、速度場の時間微分と前記流体の圧力および前記構造体の応力の釣り合いとの関係を表す方程式であることを特徴とする請求項1から請求項3のいずれか1項に記載の数値計算方法。
  5.  複数の演算器と前記演算器が演算に用いるデータを記憶するための階層型の記憶装置とを有するコンピュータに対して、前記階層型の記憶装置に記憶されている第1時刻における流体および構造体の物理量から微小時間後の第2時刻における前記流体および前記構造体の物理量を連成解析する数値計算を指令する数値計算プログラムであって、
     前記第1時刻のみにおける流体の物理量から前記第2時刻における前記流体の物理量を流体の支配方程式を用いて計算する処理と、
     前記第1時刻のみにおける構造体の物理量から前記第2時刻における前記構造体の物理量を構造体の支配方程式を用いて計算する処理と、
     前記第1時刻のみにおける流体の圧力と構造体の応力を対応させて、前記第2時刻における流体と構造体との境界面の位置を境界面の支配方程式を用いて計算する処理と、
     を含むことを特徴とする数値計算プログラム。
  6.  前記支配方程式の全てが、場の時間微分を、前記場および前記場の一階空間微分ならびに二階空間微分で表現したものであり、前記支配方程式の全てを時刻および位置で離散化した方程式を用いて処理をすることを特徴とする請求項5に記載の数値計算プログラム。
  7.  前記離散化した方程式を前記複数の演算器に割り当てて並列処理することを特徴とする請求項6に記載の数値計算プログラム。
  8.  前記離散化した方程式は、適切な関数Fを用いて下記式の形で表現されることを特徴とする請求項7に記載の数値計算プログラム。ただし、mは時刻の離散化のインデックスであり、lは位置の離散化のインデックスであり、j(l)はインデックスlの位置の周辺の点に割り振られたインデックスとしたときに、φ(l,m)は、インデックスlの位置におけるインデックスmの時刻の場を表す。
    Figure JPOXMLDOC01-appb-M000001

     
PCT/JP2019/007071 2019-02-25 2019-02-25 数値計算方法および数値計算プログラム WO2020174536A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
PCT/JP2019/007071 WO2020174536A1 (ja) 2019-02-25 2019-02-25 数値計算方法および数値計算プログラム
JP2021501394A JP7262844B2 (ja) 2019-02-25 2019-02-25 数値計算方法および数値計算プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2019/007071 WO2020174536A1 (ja) 2019-02-25 2019-02-25 数値計算方法および数値計算プログラム

Publications (1)

Publication Number Publication Date
WO2020174536A1 true WO2020174536A1 (ja) 2020-09-03

Family

ID=72238276

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2019/007071 WO2020174536A1 (ja) 2019-02-25 2019-02-25 数値計算方法および数値計算プログラム

Country Status (2)

Country Link
JP (1) JP7262844B2 (ja)
WO (1) WO2020174536A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112507453A (zh) * 2020-12-03 2021-03-16 中国空气动力研究与发展中心计算空气动力研究所 一种以气动为核心的多学科耦合分析系统及方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005339492A (ja) * 2004-04-28 2005-12-08 Canon Inc 計算方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005339492A (ja) * 2004-04-28 2005-12-08 Canon Inc 計算方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
FUKAGAWA, HIROKI: "Fluid Structure Coupling Analysis of Bearings Using Explicit Methods", July 2018 (2018-07-01), Retrieved from the Internet <URL:https://jhpcn-kyoten.itc.u-tokyo.ac.jp/sympo/10th/Intro/EX17320_Poster.pdf> [retrieved on 20190510] *
FUKAGAWA,HIROKI: "Fluid Structure Coupling Analysis of Bearings Using Explicit Methods", SUPER COMPUTING NEWS, vol. 20, no. 2, August 2018 (2018-08-01), pages 4 - 9, XP055734232, ISSN: 1344-9567, Retrieved from the Internet <URL:https://www.cc.u-tokyo.ac.jp/public/VOL20/special2/02.201808SP-1_3.pdf> *
YAGI, KAZUYUKI: "Innovative Combustion Technology", 19 February 2019 (2019-02-19), XP055734223, Retrieved from the Internet <URL:https://www.jst.go.jp/sip/dl/k01/sympoend/04s_13.pdf> [retrieved on 20190510] *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112507453A (zh) * 2020-12-03 2021-03-16 中国空气动力研究与发展中心计算空气动力研究所 一种以气动为核心的多学科耦合分析系统及方法
CN112507453B (zh) * 2020-12-03 2022-10-18 中国空气动力研究与发展中心计算空气动力研究所 一种以气动为核心的多学科耦合分析系统及方法

Also Published As

Publication number Publication date
JPWO2020174536A1 (ja) 2021-12-23
JP7262844B2 (ja) 2023-04-24

Similar Documents

Publication Publication Date Title
Brandvik et al. An accelerated 3D Navier–Stokes solver for flows in turbomachines
Lacasta et al. An optimized GPU implementation of a 2D free surface simulation model on unstructured meshes
Asouti et al. Unsteady CFD computations using vertex‐centered finite volumes for unstructured grids on graphics processing units
Teng et al. Structural damage detection using convolutional neural networks combining strain energy and dynamic response
Biancolini et al. Static aeroelastic analysis of an aircraft wind-tunnel model by means of modal RBF mesh updating
Duvigneau et al. Kriging‐based optimization applied to flow control
CN116245049B (zh) 节点式非结构网格的边界修正方法、装置、设备及介质
Wei et al. A study on basis functions of the parameterized level set method for topology optimization of continuums
Chen et al. Towards high-accuracy deep learning inference of compressible flows over aerofoils
Gang et al. Mesh deformation on 3D complex configurations using multistep radial basis functions interpolation
US9361413B1 (en) Systems and methods for simulating contact between physical objects
Xia et al. OpenACC acceleration of an unstructured CFD solver based on a reconstructed discontinuous Galerkin method for compressible flows
Zhang et al. A pressure-correction method and its applications on an unstructured Chimera grid
Fan et al. A novel numerical manifold method with derivative degrees of freedom and without linear dependence
Pazouki et al. A high performance computing approach to the simulation of fluid-solid interaction problems with rigid and flexible components
Pandya et al. Accuracy, Scalability, and Efficiency of Mixed-Element USM3D for Benchmark Three-Dimensional Flows
Chen et al. Towards high-accuracy deep learning inference of compressible turbulent flows over aerofoils
Ramanuj et al. High order anchoring and reinitialization of level set function for simulating interface motion
Gottschalk et al. Shape gradients for the failure probability of a mechanic component under cyclic loading: a discrete adjoint approach
WO2020174536A1 (ja) 数値計算方法および数値計算プログラム
Tsui et al. A finite-volume-based approach for dynamic fluid-structure interaction
Gao A sliding-mesh interface method for three dimensional high order spectral difference solver
Ciznicki et al. Elliptic solver performance evaluation on modern hardware architectures
Xiong et al. A novel stencil selection method for the gradient reconstruction on unstructured grid based on OpenFOAM
US10878147B1 (en) Systems and methods for simulating contact between physical objects

Legal Events

Date Code Title Description
ENP Entry into the national phase

Ref document number: 2021501394

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 19917063

Country of ref document: EP

Kind code of ref document: A1