<div dir="ltr">So how do I declare <div><br></div><div>struct myMat {<div> PetscScalar *a;</div><div> PetscInt        *i, *j, nrows;</div><div>}</div><div><br></div><div>so that I can use, or give me an alternative idiom, </div><div><br></div><div>struct myMat h_mat, *d_mat;<br></div><div>....</div><div>cudaMemcpy(          d_mat,   &h_mat,  sizeof(myMat),  cudaMemcpyHostToDevice))<br></div><div><br></div><div>And what is PetscKokkosReal*? I guess this is in the default execution space in Kokkos. I guess that is fine.</div><div><br></div><div>But I guess I don't understand what a "code reader" is. If it's a person or a compiler you could do what I do is have a variable naming convention like h_ and d_. </div><div><br></div><div>Junchao used _d and _h in aijkokkosimpl.hpp, and these are typed for device and host. He had to type them to get it into the Kokkos API, which does type checking so I think it would catch having KokkosReal be a double and PetscReal be a float.</div><div><br></div><div><br></div></div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Sat, Dec 12, 2020 at 5:42 PM Barry Smith <<a href="mailto:bsmith@petsc.dev">bsmith@petsc.dev</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div style="overflow-wrap: break-word;"><br><div><br><blockquote type="cite"><div>On Dec 12, 2020, at 4:23 PM, Mark Adams <<a href="mailto:mfadams@lbl.gov" target="_blank">mfadams@lbl.gov</a>> wrote:</div><br><div><div dir="ltr"><div dir="ltr"><br></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Sat, Dec 12, 2020 at 10:44 AM Barry Smith <<a href="mailto:bsmith@petsc.dev" target="_blank">bsmith@petsc.dev</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><br>
   Currently we use PetscScalar and PetscScalar * to refer to variables that could be in any memory space. On the CPU, on the GPU, in Kokkos, etc.<br>
<br>
   Would it make sense to use typedef to indicate at each location the true type of the memory location when possible? <br></blockquote><div><br></div><div>No. Absolutely not.</div><div><br></div><div>Because Cuda is simple C code (eg, printf is provided but few standard libs are provided and you can't call non-device functions from the device), you can put kernels in a header file and include it in the .cu file to get Cuda code. You need to #define things like the device declaration syntax (eg __device__) and things like atomicAdd. This is how MatSetValuesDevice works.</div><div><br></div><div>The way I do deep copies in Cuda I declare a host a device struct, like:</div><div><br></div><div>Mat h_mat, *d_mat.</div><div><br></div><div>Then do cuda mallocs into pointers in h_mat, then a cuda malloc on to get d_mat. Then a cuda copy-to-device to put any data (cuda malloced) or metadata (eg, array size, dim, etc) from h_mat into d_mat. I don't know how I could do this if h_mat and d_mat are not the same without even more gymnastics.</div></div></div></div></blockquote><div><br></div>Oh, you would not need to change your code at all, the only difference is in certain places you would have variables declared as PetscKokkosReal that point to Kokkos memory instead of declared as PetscReal.  It is, as Jed notes, just for readers/maintainers of the code ease.</div><div><br><blockquote type="cite"><div><div dir="ltr"><div class="gmail_quote"><div><br></div><div>The Kokkos people have been working with this for a long time and I think they have probably learned the hard way what works. I would look at what they do. If they or SYCL does it I would take a look.</div></div></div></div></blockquote><div><br></div>   CUDA has always had the same syntax for pointers to GPU memory and CPU memory; this seemed odd to me because it means each code reader has to find out some other way which pointers actually refer to host memory and which point to GPU memory instead of just directly saying it.  Kokkos seems to have just inherited this approach.  Of course with unified memory there is no distinguishing so maybe no reason to have different names.<br><blockquote type="cite"><div><div dir="ltr"><div class="gmail_quote"><div><br></div><div> </div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">
<br>
   typedef PetscReal PetscKokkosReal   means the variable is in the Kokkos memory space<br></blockquote><div><br></div><div>There is no such thing. THere is the default execution space, default host space, Cuda memory space, etc.</div><div> </div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">
   typedef PetscReal PetscCUDAReal<br>
   typedef PetscReal PetscNVSHEMReal<br>
<br>
   etc. <br>
<br>
  Then one could write things like <br>
<br>
  struct {<br>
     ...<br>
     PetscNVSHEMReal *values;<br>
  }<br>
<br>
  Similarly inside kernels one would use the type type associated with the kernel, cuda with cuda etc. <br>
<br>
  I think the resulting code will be much clearer and easier to dive into, then having to first figure out where each variable lives.<br>
<br>
  I find the current code confusing because one cannot immediately see a variable declaration and know where it lives, even though it does live somewhere in particular..<br>
<br>
  Barry<br>
<br>
<br>
<br>
<br>
<br>
</blockquote></div></div>
</div></blockquote></div><br></div></blockquote></div>