GPT-3.5 VS GPT-4: AI ボットの比較

OpenAI は最近、世界を席巻したチャットボットの新しく改良されたバージョンである GPT-4 を発表しました。GPT-4 とその前身である GPT-3.5 の違いは何でしょうか? GPT-3.5 と GPT-4 を比較し、実際にどれだけ賢くなっているかを見てみましょう。

実際的な違い

ただし、パフォーマンスの違いを説明する前に、まず 2 つの実際的な違いについて説明します。まず、インターネット接続があれば誰でもオンラインにアクセスして GPT-3.5 を利用できますが、GPT-4 をいじれるのは OpenAI の有料プラン (ChatGPT Plus と呼ばれる) を選択した人だけです。 

有料プランは月額 20 ドル (税抜) で、GPT-4 にアクセスできるだけでなく、古いバージョンの負荷が高い場合に優先的に利用できます。また、GPT-3.5 による回答も高速になります。私たちは、より速くという意味もあります。一度支払いをすると、もう止められないように思えました。

ただし、お金を払ったとしても、GPT-3.5 のように GPT-4 に無制限にアクセスできるわけではありません。代わりに、設定された数のプロンプトのみを尋ねることができます。現在、3 時間あたり 25 件のプロンプトが表示されますが、この制限は常に変更されているため、これを読んでいる頃にはこれらの制限が解消されている可能性があります。

また、GPT-4 は GPT-3.5 よりも応答がはるかに遅いことにも注意してください。これは今後数か月以内に変更される可能性がありますが、現時点ではボットが答えを見つけるまでに時間がかかるため、ボットで何かをすぐに実行できることは期待しないでください。

GPT-4 はさらに賢くなっています

アップグレードから予想されるように、GPT-4 は GPT-3.5 よりもはるかに賢くなっています。これは、より創造的で、ユーザーが望むものをよりよく理解できることを意味します。その言語モデルは、私たちがコミュニケーションする方法と私たちが使用する言葉として再考してください。ほんの光年先を進んでいます。これは、ニュアンスのあるプロンプトを入力するとわかります。

この例では、このReddit スレッドに触発されて、比較的単純なプロンプトを決定し、ChatGPT に「光合成に関する短い作文が 10 歳の子供によって書かれた場合にどのようになるかの例を作成する」ように依頼しました。作家が犯すであろう間違いを組み込んでください。」結果は驚くべきものでした。GPT-3.5 の見解は次のとおりです。

それほど悪くはありません。子供じみた言葉遣いにはかなり説得力がありますが、ところどころにいくつかの欠点があります。これを書いたのはかなり賢い10歳でしょう。次に GPT-4 を確認してください。

これはまったく異なる釜の飯です。スペルミスや文法上の問題がいくつかありますが、全体的には言語の使用がはるかに説得力があります。完璧ではありませんが、一見すると、甥っ子がこれを書くだろうと信じられるでしょう。

これらの変更は、GPT-4 に与えられる可能性のあるすべてのプロンプトに反映されています。GPT-4 の言語使用は単純に優れており、人間の音声を含む人間の音声のニュアンスを捉えるのがはるかに優れています。プロンプトの表現方法に注意する必要はありますが、少ない作業ではるかに優れた出力が期待できます。

より良い事実

GPT-4 は、より創造性が高いだけでなく、GPT-3.5 よりも信頼性も少し高くなります。GPT は、最初に登場したとき、不正確な統計を発表したり、歴史的な年表を台無しにするなど、全く意味不明な内容を自信を持って吐き出す傾向で有名になりました。

AI が単にもっともらしく聞こえるものをでっち上げる場合、それは幻覚と呼ばれます。それは、学校でテストがあって勉強しなかったときのようなもので、少なくとも一部は真実であることを期待して、適当なことを書き留め始めたときのようなものです。

公平に見て、人々が GPT-3.5 を使用し、GPT-3.5 がより賢くなり、より知識が豊富になったため、これらの問題は改善されました。それでも、特にニッチなテーマの場合は、誤った情報をオウム返しにしていることがわかります。特に、物理学、数学、コンピューター プログラミングの高度な概念が台無しになる傾向があります。

ただし、GPT-4 はさらに先を行っています。技術レポート によると、この点では GPT-4 は GPT-3.5 よりも約 20% 優れています。当然のことながら、GPT-4 が言うことすべてを盲目的に信じるべきだという意味ではありません。GPT-4 は依然として物事をでっち上げている場合もあります。たとえば、学校で使用する場合は、事実を確認して確認する必要があるかもしれません。

コンテキストウィンドウを広げる

GPT-4 は、よりスマートであることに加えて、GPT-3.5 よりも優れた「メモリ」を備えています。「記憶」を引用符で囲っているのは、実際には物事を覚えているのではなく、以前に尋ねた内容のコンテキストにプロンプ​​トを挿入するためです。これはコンテキスト ウィンドウと呼ばれ、生成 AI が以前のプロンプトからの情報を新しいプロンプトにどの程度うまく使用できるかを示します。

GPT-3.5はこの点があまり得意ではありませんでした。プロンプトを入力し、得られた出力に基づいて新しいプロンプトを入力すると、通常は機能しますが、それは 1 回か 2 回だけです。元のプロンプトから数ステップ以上離れると、ボットがリセットされ、プロンプトにパラメータを再度入力する必要があります。

GPT-4 のコンテキスト ウィンドウははるかに大きく、より多くのことをより長く「記憶」します。物事を複雑にすればするほど、以前に尋ねたことを思い出すのが難しくなりますが、少し試してみた後、全体的には、プロンプトに対して非常によく反応したと言わざるを得ません。これにより、集中的に使用するユーザーの時間が大幅に節約されると予想されます。

GPT-4 がより多くの入力 (プロンプトごとに最大 3,000 語) を処理できることも役立ちそうです。これは、作業対象のサンプル テキストを入力する場合に最適であり、拡張されたコンテキスト ウィンドウと組み合わせてうまく機能します。

安全性

最後に、すべての改良により、GPT-4 は GPT-3.5 よりもはるかに「安全」になっています。より安全とは、いわゆる有害な反応、つまり不快な人種差別的または性差別的な意見を含む回答を受け取る可能性が大幅に低いことを意味します。 

この点に関して、言語モデルのパフォーマンスはかなり劣っています。たとえば、2016 年には、Microsoft の Tay チャットボットは、インターネットのあまり良くない要素によってかなり厄介なことを教えられた後、わずか数時間でオフラインにされなければなりませんでした。テイが白人至上主義者の論点をオウム返しにし、9/11攻撃についてナンセンスを吐き始めた後、その栓は抜かれた。

GPT-3.5 は、極右のスローガンでユーザーを興奮させることはありませんが、それでも夕食の席では持ち出さないいくつかの主張を、少なくとも丁寧な表現ではないという点で大幅に改善しました。会社。おそらくこれは、言語モデルが数か月にわたってトレーニングされた方法が原因であると考えられます。

GPT-4 では有害な結果がさらに減少し、有害として分類される応答はわずか約 1 パーセントとなったため、OpenAI はトレーニングにおいてさらに優れているようです。これにより、GPT-4 は全体的により信頼できるリソースになります。

GPT 3.5 と GPT-4 を使用する必要があるのはどのような場合ですか?

GPT-4 はあらゆる点ではるかに優れていますが、速度が遅いことと、使用量に上限があるという 2 つのボトルネックがあります。そのため、多くの入力が必要で微妙な答えが必要な、重要なプロンプトにのみ使用することをお勧めします。

それ以外の点では、GPT-3.5 のほうが優れた選択肢である可能性があります。回答は迅速に提供され、事実確認をもう少し行う必要があるかもしれませんが、ほとんどの単純なタスクには十分な信頼性があります。最終的には、両方のバージョンを組み合わせて一致させると、比較的少ない労力で素晴らしい結果が得られるでしょう。


Microsoft Teams マシン全体のインストーラーを入手する方法

Microsoft Teams マシン全体のインストーラーを入手する方法

Microsoft Teamsは、個人と組織が業務を円滑に進めるための強力なツールです。この記事では、Microsoft Teamsのインストール方法を詳しく解説します。

Adobe Acrobat Reader DCでハイライトカラーを変更する方法

Adobe Acrobat Reader DCでハイライトカラーを変更する方法

PDF ファイル内の特定のテキストを強調する必要がありますか? Adobe Reader でハイライトの色を変更して、興味深いコンテンツをマークする方法を学びます。

Teams で不在を設定する方法 (完全ガイド)

Teams で不在を設定する方法 (完全ガイド)

Teams で不在を設定して同僚に自分がいないことを知らせる簡単な方法が 2 つあります。

Chrome で「ダウンロードに失敗したネットワーク エラー」を修正する方法?

Chrome で「ダウンロードに失敗したネットワーク エラー」を修正する方法?

Chrome でダウンロードに失敗したネットワーク エラーに対処するのに苦労していますか? 問題を解決するための 8 つの簡単な手順をご紹介します。

ファビコンとは何ですか? ウェブサイトデザイナーのための究極のガイド

ファビコンとは何ですか? ウェブサイトデザイナーのための究極のガイド

あなたはブランド価値を高めたいと考えているサイト所有者またはデザイナーですか? 始めるには、ファビコンとは何かについてのこの究極のガイドを読む必要があります。

AI を使用して文章を改善する方法

AI を使用して文章を改善する方法

ChatGPT を使用して、ライターとしての誠実さを損なうことなく、自分のライティング スキルを向上させる 5 つの主な方法を紹介します。

RGB とは何の略で、どのように機能するのか

RGB とは何の略で、どのように機能するのか

デザイナーのゲーマーであれば、RGB という言葉をよく目にするかもしれません。RGB が何を表すのかを知るには、このブログを読んでください。

Gmailでメールの送信を取り消す方法

Gmailでメールの送信を取り消す方法

Gmail で誤ってメールを送信してしまったので、取り消したいですか? この簡潔な記事を読んで、Gmail でメールの送信を取り消す方法を学ぶ必要があります。

スナップ スコアの仕組み: 機能の仕組みを理解する

スナップ スコアの仕組み: 機能の仕組みを理解する

Snapchat ユーザーであれば、スナップ スコアとその操作方法について知っておく必要があります。このブログを読んで、スナップ スコアがどのように機能するかを理解してください。

AI を活用した UX テスト: 利点とベスト プラクティス

AI を活用した UX テスト: 利点とベスト プラクティス

あなたは UX スペシャリストで、AI を活用した UX テストの利点とベスト プラクティスを学ぼうとしていますか? この記事をチェックしてください