GPT-3.5 VS GPT-4: AI ボットの比較

OpenAI は最近、世界を席巻したチャットボットの新しく改良されたバージョンである GPT-4 を発表しました。GPT-4 とその前身である GPT-3.5 の違いは何でしょうか? GPT-3.5 と GPT-4 を比較し、実際にどれだけ賢くなっているかを見てみましょう。

実際的な違い

ただし、パフォーマンスの違いを説明する前に、まず 2 つの実際的な違いについて説明します。まず、インターネット接続があれば誰でもオンラインにアクセスして GPT-3.5 を利用できますが、GPT-4 をいじれるのは OpenAI の有料プラン (ChatGPT Plus と呼ばれる) を選択した人だけです。 

有料プランは月額 20 ドル (税抜) で、GPT-4 にアクセスできるだけでなく、古いバージョンの負荷が高い場合に優先的に利用できます。また、GPT-3.5 による回答も高速になります。私たちは、より速くという意味もあります。一度支払いをすると、もう止められないように思えました。

ただし、お金を払ったとしても、GPT-3.5 のように GPT-4 に無制限にアクセスできるわけではありません。代わりに、設定された数のプロンプトのみを尋ねることができます。現在、3 時間あたり 25 件のプロンプトが表示されますが、この制限は常に変更されているため、これを読んでいる頃にはこれらの制限が解消されている可能性があります。

また、GPT-4 は GPT-3.5 よりも応答がはるかに遅いことにも注意してください。これは今後数か月以内に変更される可能性がありますが、現時点ではボットが答えを見つけるまでに時間がかかるため、ボットで何かをすぐに実行できることは期待しないでください。

GPT-4 はさらに賢くなっています

アップグレードから予想されるように、GPT-4 は GPT-3.5 よりもはるかに賢くなっています。これは、より創造的で、ユーザーが望むものをよりよく理解できることを意味します。その言語モデルは、私たちがコミュニケーションする方法と私たちが使用する言葉として再考してください。ほんの光年先を進んでいます。これは、ニュアンスのあるプロンプトを入力するとわかります。

この例では、このReddit スレッドに触発されて、比較的単純なプロンプトを決定し、ChatGPT に「光合成に関する短い作文が 10 歳の子供によって書かれた場合にどのようになるかの例を作成する」ように依頼しました。作家が犯すであろう間違いを組み込んでください。」結果は驚くべきものでした。GPT-3.5 の見解は次のとおりです。

それほど悪くはありません。子供じみた言葉遣いにはかなり説得力がありますが、ところどころにいくつかの欠点があります。これを書いたのはかなり賢い10歳でしょう。次に GPT-4 を確認してください。

これはまったく異なる釜の飯です。スペルミスや文法上の問題がいくつかありますが、全体的には言語の使用がはるかに説得力があります。完璧ではありませんが、一見すると、甥っ子がこれを書くだろうと信じられるでしょう。

これらの変更は、GPT-4 に与えられる可能性のあるすべてのプロンプトに反映されています。GPT-4 の言語使用は単純に優れており、人間の音声を含む人間の音声のニュアンスを捉えるのがはるかに優れています。プロンプトの表現方法に注意する必要はありますが、少ない作業ではるかに優れた出力が期待できます。

より良い事実

GPT-4 は、より創造性が高いだけでなく、GPT-3.5 よりも信頼性も少し高くなります。GPT は、最初に登場したとき、不正確な統計を発表したり、歴史的な年表を台無しにするなど、全く意味不明な内容を自信を持って吐き出す傾向で有名になりました。

AI が単にもっともらしく聞こえるものをでっち上げる場合、それは幻覚と呼ばれます。それは、学校でテストがあって勉強しなかったときのようなもので、少なくとも一部は真実であることを期待して、適当なことを書き留め始めたときのようなものです。

公平に見て、人々が GPT-3.5 を使用し、GPT-3.5 がより賢くなり、より知識が豊富になったため、これらの問題は改善されました。それでも、特にニッチなテーマの場合は、誤った情報をオウム返しにしていることがわかります。特に、物理学、数学、コンピューター プログラミングの高度な概念が台無しになる傾向があります。

ただし、GPT-4 はさらに先を行っています。技術レポート によると、この点では GPT-4 は GPT-3.5 よりも約 20% 優れています。当然のことながら、GPT-4 が言うことすべてを盲目的に信じるべきだという意味ではありません。GPT-4 は依然として物事をでっち上げている場合もあります。たとえば、学校で使用する場合は、事実を確認して確認する必要があるかもしれません。

コンテキストウィンドウを広げる

GPT-4 は、よりスマートであることに加えて、GPT-3.5 よりも優れた「メモリ」を備えています。「記憶」を引用符で囲っているのは、実際には物事を覚えているのではなく、以前に尋ねた内容のコンテキストにプロンプ​​トを挿入するためです。これはコンテキスト ウィンドウと呼ばれ、生成 AI が以前のプロンプトからの情報を新しいプロンプトにどの程度うまく使用できるかを示します。

GPT-3.5はこの点があまり得意ではありませんでした。プロンプトを入力し、得られた出力に基づいて新しいプロンプトを入力すると、通常は機能しますが、それは 1 回か 2 回だけです。元のプロンプトから数ステップ以上離れると、ボットがリセットされ、プロンプトにパラメータを再度入力する必要があります。

GPT-4 のコンテキスト ウィンドウははるかに大きく、より多くのことをより長く「記憶」します。物事を複雑にすればするほど、以前に尋ねたことを思い出すのが難しくなりますが、少し試してみた後、全体的には、プロンプトに対して非常によく反応したと言わざるを得ません。これにより、集中的に使用するユーザーの時間が大幅に節約されると予想されます。

GPT-4 がより多くの入力 (プロンプトごとに最大 3,000 語) を処理できることも役立ちそうです。これは、作業対象のサンプル テキストを入力する場合に最適であり、拡張されたコンテキスト ウィンドウと組み合わせてうまく機能します。

安全性

最後に、すべての改良により、GPT-4 は GPT-3.5 よりもはるかに「安全」になっています。より安全とは、いわゆる有害な反応、つまり不快な人種差別的または性差別的な意見を含む回答を受け取る可能性が大幅に低いことを意味します。 

この点に関して、言語モデルのパフォーマンスはかなり劣っています。たとえば、2016 年には、Microsoft の Tay チャットボットは、インターネットのあまり良くない要素によってかなり厄介なことを教えられた後、わずか数時間でオフラインにされなければなりませんでした。テイが白人至上主義者の論点をオウム返しにし、9/11攻撃についてナンセンスを吐き始めた後、その栓は抜かれた。

GPT-3.5 は、極右のスローガンでユーザーを興奮させることはありませんが、それでも夕食の席では持ち出さないいくつかの主張を、少なくとも丁寧な表現ではないという点で大幅に改善しました。会社。おそらくこれは、言語モデルが数か月にわたってトレーニングされた方法が原因であると考えられます。

GPT-4 では有害な結果がさらに減少し、有害として分類される応答はわずか約 1 パーセントとなったため、OpenAI はトレーニングにおいてさらに優れているようです。これにより、GPT-4 は全体的により信頼できるリソースになります。

GPT 3.5 と GPT-4 を使用する必要があるのはどのような場合ですか?

GPT-4 はあらゆる点ではるかに優れていますが、速度が遅いことと、使用量に上限があるという 2 つのボトルネックがあります。そのため、多くの入力が必要で微妙な答えが必要な、重要なプロンプトにのみ使用することをお勧めします。

それ以外の点では、GPT-3.5 のほうが優れた選択肢である可能性があります。回答は迅速に提供され、事実確認をもう少し行う必要があるかもしれませんが、ほとんどの単純なタスクには十分な信頼性があります。最終的には、両方のバージョンを組み合わせて一致させると、比較的少ない労力で素晴らしい結果が得られるでしょう。

Leave a Comment

Instagramとは何ですか?

Instagramとは何ですか?

Instagramは、たくさんの機能を備えたソーシャルネットワークです。Instagramについてもっと詳しく知りたい方は、こちらの包括的な記事でInstagramのすべてを学んでください。

コンピュータを購入する際に考慮すべき10のこと

コンピュータを購入する際に考慮すべき10のこと

PCを購入する際に考慮すべき重要なポイントをご紹介します。購入を決める前に、ニーズに合った機能を見つけましょう。

削除されたTwitterメッセージ/ツイートを復元する

削除されたTwitterメッセージ/ツイートを復元する

長いツイートを書いて、間違えて消してしまったことはありませんか?もう一度ツイートを書くのが面倒な場合は、Tweleted がおすすめです。つまり、

EFuseはMotorola Droid Xのルート化を極めて困難にする

EFuseはMotorola Droid Xのルート化を極めて困難にする

Motorola Droid Xは明日上場される予定で、この端末は間違いなく優れたハイエンドAndroidデバイスです。Motorola Droid Xは

Google Meet の時間制限を理解する: 無料プランと有料プラン

Google Meet の時間制限を理解する: 無料プランと有料プラン

Google Meetには時間制限がありますか?無料のグループ通話は60分ですが、1対1の通話はそれより長く続く場合があります。有料プランでは、会議時間を延長できます。

HTC Windows MobileデバイスにAndroid 2.2 Froyoを簡単にインストールする

HTC Windows MobileデバイスにAndroid 2.2 Froyoを簡単にインストールする

Windows Phone 7 は、Blackstone、Diamond、Raphael などの古い携帯電話では修復できないかもしれませんが、これらの携帯電話に関してはそれで世界が終わるわけではありません。

Instagramで自動フォローするスパムアカウントを修正する方法

Instagramで自動フォローするスパムアカウントを修正する方法

Instagramで自動フォローするスパムアカウントを修正する方法

2025年にTikTokで誰かをブロックする方法

2025年にTikTokで誰かをブロックする方法

シンプルなステップバイステップガイドで、TikTokでユーザーをブロックする方法を学びましょう。不要なユーザーがあなたのコンテンツを閲覧したり、インタラクトしたりするのを防ぎましょう。

Instagramから承認されたアプリを削除する方法

Instagramから承認されたアプリを削除する方法

Instagramから承認されたアプリを削除する方法

Starlinkインターネットレビュー:パフォーマンスと価格の正直な評価

Starlinkインターネットレビュー:パフォーマンスと価格の正直な評価

Starlinkインターネットの真実を、詳細なレビューでご覧ください。プラン、設定、顧客満足度を分析します。