GPT-5.4 vs Grok 4.20 レビュー
OpenAIは3月3日にGPT-5.3 Instantをリリースし、2日後にGPT-5.4を出荷しました。Grok 4.20はベータ版でSuperGrok加入者が利用可能であり、HTML5ゲームタスクの達成速度はGrok 4.20の方がほぼ2倍速かったです。同じタスクに対しGPT-5.4はより時間がかかり、構築中にコンテキストウィンドウの警告が出て、ゲームの安定性を確保するために追加のバグ修正が必要でした。
GPT-5.4 vs Grok 4.20 レビューのパフォーマンス詳細
ゲーム開発におけるGrok 4.20の使用では、記者の検出ゾーンの配置に関わるレベル生成の問題が顕著で、これが一部のゲームレイアウトをプレイ不可能にしていました。それにもかかわらず、Grok 4.20は対戦相手よりほぼ2倍速くタスクを実行しました。一方、GPT-5.4は同様のタスクを完了するのにより時間がかかり、その過程でコンテキストウィンドウ警告に遭遇し、ゲームの安定性を達成するために追加のバグ修正が必要でした。処理時間は長かったものの、GPT-5.4はよりクリーンなユーザーインターフェースと洗練された出力を提供する点で優れていました。ただし、この品質向上はトークンコストの増加を伴い、洗練されエラーのないコードに重点を置いていることを反映しています。
GPT-5.4 vs Grok 4.20 レビュー — ストーリーと信頼性
GPT-5.4はJose Lanzのプロンプトに対してより優れたタイムトラベルのストーリーを生成し、その散文はコントロールされた雰囲気があり、一貫した物語のトーンで出力全体が表現されていました。このモデルはコードの正確さが重要な場面でより安全な選択とみなされました。プロンプトと完全な応答はGithubリポジトリで入手可能です。これらのリポジトリエントリには元のプロンプトとレビューで使用された完全な生成出力が含まれています。
比較では、Grok 4.20が実行速度を優先し、GPT-5.4が信頼性と出力の洗練さを重視していることが示されました。Grok 4.20はSuperGrokの購読者向けベータ版として提供され、より速いタスク完了を実証しました。一方、GPT-5.4はより洗練されたインターフェースとコード出力を生成し、コードの正確さにおいてより安全な選択肢と見なされました。レビューのプロンプトと完全な応答は、参考のためにGithubリポジトリで公開されています。


