高级稀疏存储结构与常规field定义方式的运行速度差异

为什么我用了系数存储之后运行速度降低了很多?
rho = ti.field(ti.f32,shape=(Nx,Ny))

rho = ti.field(ti.f32)
ti.root.pointer(ti.ij, (100//3+1,100//3+1)).dense(ti.ij, (3,3)).place(rho)