「12 Days of OpenAI」にて、「o1-preview」「o1-mini-preview」の改良モデルである「o1」「o1mini」が公開されました。
推論に特化したLLMとなっており、複雑な数学問題やコード生成などにおいて力を発揮するとのことです。
下表は、OpenAIは公表している「GPT-4o」「o1-preview」「o1」の性能比較を行ったものになります。
左から順に「数学的問題」「コード生成」「博士レベルの質問」に対する回答精度を測った結果となっています。

また、「o1 Pro mode」を利用することのできる「ChatGPT Proプラン」も発表されました。
Proプランは月額200ドル(約3万円)で、o1への無制限アクセスや、o1-Proへのアクセスが可能となります。
(「ChatGPT Plus」「ChatGPT team」ではo1の利用に制限があるようです)
o1-Proの性能は図1の通りとなっています。o1-Proは精度が上がっただけでなく、複数回質問した際に精度が一定に保たれるといった強みも持っています。


なかなか使い道が難しそうな「o1」ですが、実用的な面での使い方としては、「ある事柄に対する選択肢を網羅的に出してもらい、実行優先度をつけてもらう」といったことが考えられそうです。
例えば、「基幹システムリプレースにおいて必要な段取り・作業をすべてリストアップし、背景情報を検討した上で、それらに優先度をつけてください」という指示をだすだけで、背景情報に応じた「やることリスト」がすぐに作成できます。
有料版であれば「o1」にはアクセスできますので、ぜひ一度触れてみてください。

