异步强化学习的秘密:解锁大规模LLM训练的16个开源库与前沿洞察 | Nano Banana Blog | Nano Banana 2