9/12に発表されたOpenAI o1。

GPT-o1じゃありません。OpenAI o1なんですね。

OpenAI曰く、

「複雑な推論を行うために強化学習で訓練された新しい大規模言語モデル」

なのだそうです。

ChatGPTとして使うときには、

(2024年9月14日現在、まだpreview版とmini版のみですが)有料版"ChatGPT plus"上で使用可能に。

本番の"ChatGPT-o1"はさらに高い性能を示すだろうとのこと。

以下、今のところの"ChatGPT-o1 preview"のカンタンなまとめと、少し使ってみた感想です。

1.　"GPT-4o"までとの違いは？

OpenAI o1の性能を理解する上でのキーワードは「推論」と「推論に時間をかけさせる」と「思考の連鎖(Chain of Thought: CoT)」

思考の連鎖(CoT)はこれまでも、AIへの指示文のコツ(プロンプトエンジニアリング)である程度可能だったのですが、これがOpenAI o1では内部に組み込まれた様子。

AIに、じっくり、深く考えさせることでより良い回答が可能になった、ということのようです。

"4"から"4o"になったときは、「同等の出力をより早く」が注目されましたが、

今回は

「時間をかけてじっくり推論することで、今までよりもさらに"深い"が可能になった」ということのようです。

2.　学習から推論へ　計算資源の重心を転換したOpenAI o1

データセットのサイズ、トレーニングに使用される計算量が増えるほど、より高い性能を発揮できる、という「スケーリング則」という考えがあります。

これまでは、より多くのデータで学習すれば性能向上が期待できました。

しかし、最近になり、生成AIの性能が飽和し、単純な学習拡大では性能向上が困難に。

そこで方針を転換、学習ではなく計算資源を拡大し、「なるべく早い回答」から「回答する前に数十秒の考える時間を設け、より精緻な回答を供給する」へと、転換したわけです。

※ただ、日常文章の精度は必ずしも4oに優れるものではない、というOpenAIからの公式発表もあるようで。

"o1"を使用するのは、あくまで複雑な推論を必要とするタスクに限定した方が良いのかもしれません。

3.　プログラムコーディング精度が格段に上がったらしい

今まで、コードを書いてもらっても、うまく実行されず、何度かやり直しを命じざるを得ないことがしばしばでした。

コーディング精度が上がるのであれば、これは助かりますね（軽量版o1 miniでも問題ないらしい）

4.　高度な推論に真価を発揮

OpenAIからは、物理・生物・化学の問題で人間のPhDレベル、つまり博士レベルを超える精度を発揮すると発表されています。

※医療×ChatGPT、ということで「エクソソームにおけるがん発症リスク」について聞いてみました。4oでもそれらしい文章は生成されるものの、「細胞微小環境や転移の形成」についても触れているあたりに”o1”の強さを見た気がします。

OpenAI公式動画（https://youtu.be/50W4YeQdnSg?si=Y9Tny12uLDjJxQyW）を確認すると、理系の専門性の高いタスクについてのデモが目立ちます。これを実際に活用できる専門知識が、指示を行う人間側にも必要だと思うと、扱う人間側にも高度な知識や専門性が問われそうです。

＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝

最後4「高度な推論」について、もう少し考察を。

正直、こちらが使いこなせてない歯がゆい感が少なくありません。

だってPhDレベルの人間と会話したいと思ったら、、学部卒レベル、修士レベルでは十分使いこなせない、ということになるのですから、さもありなん。

"o1"を十分に使いこなすには、自分の知的レベルを上げないといけない。

AIの進化スピードを考えると、これはとてつもないプレッシャーでもありますが、非常にエキサイティングでもある。

走り始めた新幹線に、競走を申し出るようなものなのかもしれませんが。。。

オラ、ﾂｴえやつ見るとわくわくすっぞ！

ということにしておきます笑。

～OpenAI o1についてのまとめと、触ってみて感じたこと～

～ChatGPT-o1 previewをシフト表作成(仮想)に使ってみた～

VBA経由でパソコンを操る ーChatGPTのさらなる活用法ー

VBA経由でパソコンを操る　ーChatGPTのさらなる活用法ー