如题。
为了加速taichi程序,我进行了profile,
arch=CPU x64,
[Taichi] version 1.0.0, llvm 10.0.0, commit 6a15da85, win, python 3.7.0
在结果中看到这两个kernel占用了主要时间,想请问一下要如何知道这两个kernel具体对应的是什么语句呢?然后进行针对性的优化
[ 18.59% 0.064 s 2x | 31.477 32.204 32.931 ms] fill_tensor_c0_1_kernel_0_range_for
[ 11.30% 0.039 s 228640x | 0.000 0.000 0.037 ms] snode_reader_12_kernel_0_serial