有没有可能让程序中同时存在多个ti.init生成的runtime?

一个很自然例子:我用taichi写了很多jit优化的kernel,并且我希望它们总是在cpu上运行。那我还有可能在ti.init(arch=ti.gpu)环境下使用它们吗?它们可能是一些公共的预处理之类的函数。

如果ti.init能够返回一个runtime实例,而ti.xxx默认调用一个全局的runtime,同时允许存在多个runtime,这样似乎就能达到目标了。

如果进一步的让init能支持指定设备,那可玩性就更高了,多GPU程序也更好写了。

搜了一下issue,我觉得AOT对Python的支持也能满足我的需求。