ホーム
会社概要
NEWS
More
2025年4月15日
疑似GRPO/PPOアプローチで短時間・低コストでの日本語LLM性能を向上
独自トレーニングシーケンスを用いて、短時間・低コストでベースモデルの特化性能向上を達成
独自研究による疑似GRPO/PPOアプローチを活用し、短時間かつ低コストで日本語LLMの性能向上を実現しました。今回、その成果をもとにしたオープンウェイトモデル「EZO2.5-gemma-3-12b-it-Preview」を公開しました。