<div dir="ltr">Hi Everyone,<div><br></div><div>I tested the updated implementation of the viennacl bindings in petsc-dev/next and I get rather poor performance when using viennacl on either cpu or gpu. I am using the TS module (type:theta) with a simple advection equation in 2D with resolution 256x256 and 8 variables. I tested with the following cases:</div>
<div><br></div><div>1) Single cpu with petsc's old aij mat and vec implementation</div><div>2) Viennacl mat and vec and using VecViennaCLGetArrayRead/Write in the residual evaluation function on an intel cpu with intel's opencl.</div>
<div>3) Viennacl mat and vec and using VecViennaCLGetArrayRead/Write in the residual evaluation function on an nvidia gpu.</div><div><br></div><div>The first case is the fastest and the other cases are 2-3 times slower. Attached are the log summaries for each cases and the code I used to test with. I am running using the following command:</div>
<div><br></div><div>time ./petsc_opencl -ts_monitor -snes_monitor -ts_dt 0.01 -ts_max_steps 10 -ts_type theta -log_summary<br></div><div><br></div><div>Cheers,</div><div>Mani</div></div>