使用ti.gpu比ti.cpu运行速度更慢

参考这篇文章https://zhuanlan.zhihu.com/p/145222094,试了一下代码,发现使用ti.cpu耗时3.1秒,使用ti.gpu耗时11秒,理论上使用gpu应该速度更快,不知道这是什么情况?

大概已经发现问题了,可能是使用metal的原因。