top of page

リリース「疑似GRPO/PPOアプローチで短時間・低コストでの日本語LLM性能を向上」

2025年4月15日

疑似GRPO/PPOアプローチで短時間・低コストでの日本語LLM性能を向上


独自トレーニングシーケンスを用いて、短時間・低コストでベースモデルの特化性能向上を達成


独自研究による疑似GRPO/PPOアプローチを活用し、短時間かつ低コストで日本語LLMの性能向上を実現しました。今回、その成果をもとにしたオープンウェイトモデル「EZO2.5-gemma-3-12b-it-Preview」を公開しました。

bottom of page