～OpenAIの発表について、ChatGPT o1にしゃべってまとめてもらってみた～

Dec 11

Written By Youichi Machida

#1　Day1-4

ChatGPTを擁するOpenAI社が、12日連続の新機能発表を行っています。

今回はその1-4日目の発表について、ChatGPT o1に頼んで、会話文形式にまとめてもらいました。

よろしければ、参考にしてください＾＾。

===============================

Day1:

「高度思考型モデル『o1』正式リリース＆チャットGPT Proプラン登場～より賢く、より速い、次世代のAIアシスタント体験を提供～」

A: Day1は何が発表されたんですか？

B: 一言で言うと、ChatGPTがもっと賢く、もっと便利になるアップデートが来ました。主なポイントは二つあります。

新モデル「o1」の正式公開：今まで「o1 preview」というテスト版モデルがありましたが、それが正式版になって、さらに性能がアップしました。

「ChatGPT Pro」プランの提供開始：パワーユーザー向けの新しい料金プランで、o1をさらに強化した「o1 Proモード」も使えるようになります。

A: 新モデル「o1」は、これまで使っていたGPT-4や他のモデルと比べて何が良くなったの？

B: 「o1」モデルは、「考えてから答える」ことができるようになっていて、とても難しい問題でも正確に回答しやすくなっています。以下がポイントです：

高度な推論力：数学の難問や複雑なプログラミング問題、専門的な技術課題にも強くなった。

応答速度の改善：簡単な質問にはサクッと回答するし、難しい問題にはちゃんと時間をかけて深く考える。

画像理解対応：画像をアップロードして、その内容を踏まえた分析・推論が可能。「この画像を見て問題を解いて」みたいな指示ができるんです。

A: 画像が使えるって具体的にはどう便利なの？

B: 例えば、手書きの数学問題やスケッチをアップロードして、「この図から問題を解いて」というと、モデルがそれを理解して計算することができます。

また、何かの図解（エネルギー効率の計算や科学実験の模式図など）を見せて「この図を元に必要な値を求めて」などの高度な指示もOKです。

A: それは便利ですね。ところで「ChatGPT Pro」って何が違うんですか？

B: ChatGPT Proは、月200ドルの上位プランで、ヘビーユーザー向けです。以下の特典があります：

無制限のアクセス：より多くのクエリを高性能モデルに対して実行可能

o1 Proモード：o1モデルでも特に難易度が高い問題に対して、さらに「深く考える」モードを使えます。通常のo1より精度と信頼性が向上します。

Advanced Voice Modeなどの追加機能も利用可能（例えば、音声入力や応答の改善）

A: 普通のユーザーがProにするメリットはある？

B: 一般的なユーザーの場合、o1モデルが標準で使えるので多くのタスクは十分こなせます。

Proは、例えば以下のような人に向いています：

毎日大量にChatGPTを使っていて、モデルの高負荷環境でも常にサクサク動いて欲しい人

研究や開発で非常に難易度の高い数理問題やプログラミング課題を解かせたい人

厳格な精度や安定性が求められる、専門領域の業務ユーザー

A: o1 Proモードはどんな場面で違いを感じるんですか？

B: 通常のo1でもかなり賢いんですが、o1 Proモードでは、本当に難しい問題への回答成功率が更にアップします。例えば、大学院レベルの数学証明、複雑な化学反応機構の特定、特殊な法律の事例分析など、専門家が使うような分野でより正確な答えが期待できます。また、「答えをじっくり考える」ための計算資源が増えるので、回答までに数分かかるかもしれないけど、そのぶん回答精度が上がる場面で威力を発揮します。

A: なるほど。モデルの速度や品質が改善されたと聞いたけど、遅い問題はもうないの？

B: 以前のo1 previewモデルは、簡単な挨拶にも無駄に時間をかけてしまうことがあったんです。新しいo1では、そのあたりが改善されました。

簡単な質問：「こんにちは！」⇒ほぼ即時回答

難しい質問：数分考える場合もあるけれど、それは本当に難しい問題を解くためのプロセスとして必要な時間

A: じゃあDay1は、「o1モデル」本格始動と「ChatGPT Pro」開始が大きなニュースってことですね？

B: その通りです！これで一般ユーザーもより高度な質問に対応可能なo1にアクセスできますし、さらに上を目指すプロユーザー向けにはProプランが用意され、o1 Proモードで難問にも挑戦できます。これがDay1の大きなポイントです。

===============================

Day2:

「強化学習によるモデル最適化『RFT』プレビュー公開～自社データで専門性を強化し、独自用途に特化したAIを構築可能に～」

A: Day2では何が発表されたんですか？

B: 「RFT（強化学習ファインチューニング）」という新しいカスタマイズ手法が発表されました。これは、ユーザーが独自のデータを使って、モデルの思考プロセスをさらに最適化できる仕組みです。

A: 普通の「ファインチューニング」とは何が違うの？

B: 通常のファインチューニング（SFT）は、モデルに例題を見せて「こういう答え方をしてね」と教える感じでした。しかしRFTは、モデルが出した答えに点数を付けて「正解に近い思考パターン」を強化する仕組みなんです。これにより、モデルがただ模倣するのではなく、独自の判断力を養うことができます。

A: RFTは、ChatGPTの画面上で使えるんですか？

B: いえ、RFTはChatGPTの通常のUI上では使えません。開発者や企業、研究機関がAPI経由でモデルをカスタマイズする際に利用できる機能です。つまり、一般ユーザーがChatGPT画面でボタン一つでRFTをかける、というわけではありません。

A: なるほど。じゃあ普通のユーザーには関係ないの？

B: 現段階ではRFTは、主に専門性の高い企業や研究者、開発者向けです。例えば自分たちの分野専用の問題集やデータセットを用意して、モデルがその分野の専門家レベルの推論を身につけられるようにできます。これで特定業界向けの超専門的アシスタントが作りやすくなるわけです。

A: 一般ユーザーにはどんな影響があるの？

B: 将来的にRFTが広く公開され、開発者が多用すれば、より専門性の高いカスタムモデルが市場に出てくる可能性が高まります。そうなると、特定の領域（医療、法律、金融、研究）に特化した優秀なAIツールが増え、一般ユーザーもそれらの恩恵を間接的に受けられるでしょう。

ただ、すぐにChatGPTの画面で「RFT使おう！」とはならないので、現時点で一般ユーザーが直接操作する機能ではありません。

A: RFTはいつ頃使えるようになるんですか？

B: 一般公開は2025年初頭を予定しています。現在は一部の研究機関や企業で先行テストが行われる段階で、一般ユーザー向けには少し先の話ですね。

A: 具体的な利用例とかあるの？

B: 動画では、研究者がレア疾患の原因遺伝子を特定するタスクへの適用例が紹介されていました。モデルに専門的な医学・生物学データを学習させ、正答に近づく推論を強化することで、既存のモデルよりも正確に原因遺伝子を推定できるようになったそうです。

こういった応用例が増えれば、他の専門分野でも同様のカスタムAIが作れます。

A: 要するにDay2は、「RFT」という新手法で開発者がモデルを強化学習的に教育できるようになった、でもまだ一般ユーザー向けじゃない、ってことですね？

B: そのとおりです。Day2のキーワードは「RFT（強化学習ファインチューニング）」。専門家や開発者向けのテクニックで、独自データとAPIアクセスを通じて、モデルを自分たちの望む方向に賢く進化させられます。一般ユーザーにはすぐ使えませんが、将来のより高度で特化したAIへの道を開く技術です。

===============================

Day3:

「AI映像生成ツール『Sora』登場～テキストから動画制作まで、クリエイティブ表現の新たな地平を拓く～」

A: Day3では何が発表されたんですか？

B: Day3は「Sora」という新しい動画生成ツールの公開がありました(https://openai.com/sora/)。ChatGPTでテキストを入力すると、AIが動画を作ってくれるんです。単に文字で答えるだけじゃなく、映像を生成できるようになりました。

A: テキストから動画が作れるって、どんな感じなんですか？

B: 「○○な雰囲気のクリスマスストーリー映像を作って」みたいに指示すると、Soraがそのイメージに合った短い動画クリップを生成してくれます。また、一枚の画像から動画風の映像に拡張したり、既存の映像を別のスタイルに変えたり（リミックス）、複数シーンをつなげてストーリーボードで演出したりできます。いわば「AI映像編集室」が手の中にあるイメージですね。

A: 普通のユーザーでも使えますか？

B: SoraはChatGPTのPlusまたはProユーザーなら追加料金なしで利用できます。無料プランでは利用できないようですが、Plus以上を契約していれば誰でも触れられるようになっています。ただし、地域によってはまだ利用できない場所もあるようです。

A: 難しい専門知識がないと使いこなせない？

B: 全然そんなことありません！使い方は基本的に「自然言語で指示」するだけ。

たとえば、「夕焼けのビーチで波が打ち寄せている雰囲気の5秒動画を作って」と書けば、Soraがそれに近い動画を生成します。さらに「もう少し暖色系の色合いで、サーファーが画面の端に映っていて」といった細かな指示も可能。

テキストベースの操作なので、普段ChatGPTに質問するのと同じ感覚で使えます。

A: 「ストーリーボード機能」って何ですか？

B: ストーリーボード機能は、動画の流れをシーンごとに指示できる機能です。

例えば、

最初5秒：主人公が森を歩いている

次の5秒：森から抜けて海辺に出る

最後5秒：夕日に向かって走る

みたいに、複数のシーンをつなげて映像を作れます。言葉でシーン構成を指定する感じですね。

A: 既存の動画をアレンジすることもできる？

B: はい。「リミックス」や「ブレンド」という機能があって、既に生成した動画に新しい要素を加えたり、2つの動画を組み合わせて新しい映像に仕上げたりできます。

また「ループ」機能では、映像の始まりと終わりを自然につなげて、エンドレスに続くような動画も作成可能です。

A: 普段ChatGPTを使っているユーザーは、どう活用できますか？

B: 例えば、

SNS投稿用動画：簡単なキーワードやコンセプトを入力して短いクリップを生成。

プレゼン資料：スライドに載せる簡易的な映像やイメージの動画版を作成。

クリエイティブなアイデア出し：自分で映像が作れなくても、Soraでざっくりとしたイメージ動画を生成し、そこからインスピレーションを得ることができます。

A: Day3は要するに、ChatGPTを「映像クリエイター」的に進化させるSoraが使えるようになった、という感じですね？

B: その通り。Day3のテーマは「テキストから動画へ」という大きな進化。PlusやProユーザーは、ChatGPTを通じて、新たな映像生成ツールSoraを活用できるようになり、言葉で指示するだけでオリジナルの映像クリップを作り出せます。これは、これまで文章と画像生成に慣れてきたユーザーにとっても、映像の世界へ踏み出す大きな一歩になるでしょう。

===============================

Day4:

「コラボ編集機能『Canvas』実装～ChatGPT上での文書・コード共同作業を加速し、生産性を大幅向上～」

※順次機能が追加される予定だそうです(私のIDではまだ利用できませんでした[2024年12月11日現在])

A: Day4では何が発表されたんですか？

B: Day4は「Canvas」という新機能が公開されました。これまでChatGPTはテキストでやり取りする「チャット形式」がメインでしたが、Canvasを使うと横にエディターエリアが現れて、文書やコードを実際に編集したり、一緒に仕上げたりできるようになります。

A: 普通のチャットと何が違うんですか？

B: 従来はChatGPTが生成したテキストは、チャットログにずらっと並ぶだけでしたよね。Canvasを使うと、その生成物を横に置いて「一つの文書」や「一つのコードファイル」として扱えるんです。

例えば、小説や論文を書きたい場合、Canvas上で段落を修正したり、GPTに特定部分を直させたりしながら、完成度の高いドキュメントを一緒に作っていくことができます。

A: コードにも使えるって聞いたけど、具体的にどういうこと？

B: Canvas上ではPythonコードを書いて、その場で実行できます。

例えば、「このコードを改良して」「バグを修正して」「このデータをグラフ化して」という指示を出すと、Canvas上でGPTがコードを編集し、実行結果（テキストやグラフ）をすぐに確認できます。自分で修正もできるし、GPTに提案させて自動で修正してもらうことも可能です。

プログラミング初心者が学びながらコードを書くときや、データサイエンス的なタスクをChatGPTと一緒に行うときに便利です。

A: 文書編集ではどんなメリットがあるの？

B: 大きなメリットは「共同編集」感覚でドキュメントを仕上げられる点です。

コメント機能：GPTが文書中の特定箇所にコメントを入れ、「ここをこう直すといいよ」と提案してくれる。

自動校正や表現調整：英語エッセイなどで誤字脱字チェックや文体改善をする際、Canvas上でGPTが直接修正。

スタイル変換：難解な文章をシンプルにしたり、子供向けにわかりやすく書き直したりといった作業も、Canvasでスムーズに行えます。

A: Custom GPTとも組み合わせられるんですか？

B: はい、CanvasはCustom GPT（独自の専門指示や知識を与えた特化モデル）とも組み合わせられます。

例えば、「法律文書専門のCustom GPT」を作っておけば、そのカスタムモデルとCanvasで法律文書を書き直したり、注釈を入れたりといったことが簡単にできます。

A: 一般ユーザーにも有益ですか？

B: 非常に有益です！特別な知識がなくても、

レポートやブログ記事の作成・リライト

英作文のチェックや改善

簡単なコード作成やバグ修正

など、日常的な「文書・コード作業」をChatGPTとリアルタイムで協力しながら行えます。

これまで「テキスト生成後に別ツールで編集」という流れが多かった人にとっては、ChatGPT上ですべて完結できるので効率が大幅にアップします。

A: Day4は要するに、ChatGPTが「文章エディター＋ペアプログラマー」的な存在になった、という感じですね？

B: その通りです。Day4のCanvas発表で、ChatGPTは会話botからさらに進化して、「一緒に文書やコードを編集しつつ成長させるコラボレーションツール」になりました。これでテキスト生成だけでなく、その後の加工・修正・実行まで一貫してサポートできます。

Youichi Machida

～OpenAIの発表について、ChatGPT o1にしゃべってまとめてもらってみた～

～どっちがいい？ ChatGPTとGemini の比較 (2024年12月版)～

～北米放射線学会RSNA2024参加レポート～

～どっちがいい？　ChatGPTとGemini の比較　(2024年12月版)～