隐式有限元提速求助!

隐式有限元最难最慢的两部分就是组装和求解
对于模型点数较多的情况,直接组装整体刚度矩阵从空间和速度来说似乎都不太现实,有没有办法可以提速呢?
已经尝试过example中matrix free的方法但是似乎结果不太对,只能使用example提供的本构模型,修改就错了
能不能考虑用scipy求解再传入taichi,或者用c++编译一个基于eigen的组装求解器再传入taichi?

我在求解矩阵就是用scipy做的(taichi的矩阵求解在条件数比较大的时候似乎结果不太对),用三个field变量来记录稀疏阵每个元素的行、列和数值,然后field to_numpy,构建scipy稀疏阵去求解,结果在传回taichi field,不过效率确实不太高