GPT-3.5 VS GPT-4:比較 AI 機器人

OpenAI 最近推出了 GPT-4,這是席捲全球的聊天機器人的新改進版本。那麼 GPT-4 和它的前身 GPT-3.5 有什麼區別呢?讓我們比較一下 GPT-3.5 和 GPT-4,看看它到底聰明了多少。

實際差異

不過,在討論性能差異之前,首先讓我們回顧一下兩者之間的一些實際差異。首先,雖然任何有互聯網連接的人都可以上網並使用 GPT-3.5,但只有選擇 OpenAI 付費計劃(稱為 ChatGPT Plus)的人才能使用 GPT-4。 

付費計劃為每月 20 美元(稅前),不僅可以讓您訪問 GPT-4,如果舊版本負載過重,它還可以為您提供優先權。它還使得 GPT-3.5 的答案更快。我們的意思也確實是更快:一旦我們付了錢,就好像沒有辦法阻止它!

但是,即使您付費,您也無法像使用 GPT-3.5 那樣無限制地訪問 GPT-4。相反,您只需詢問它一定數量的提示。目前,您每三小時會收到 25 條提示,但由於此限制不斷變化,因此當您閱讀本文時,這些限制可能已經消失。

另請注意,GPT-4 的響應速度比 GPT-3.5 慢很多。儘管這種情況可能會在未來幾個月內發生變化,但目前機器人需要一段時間才能得出答案,因此不要指望用它做任何事情太快。

GPT-4 更智能

正如您對升級所期望的那樣,GPT-4 只是比 GPT-3.5 聰明得多。我們的意思是它更有創意,更能理解你想要什麼。它的語言模型——將其重新思考為我們交流的方式和我們使用的詞語——僅領先數光年。當您向它提供有一些細微差別的提示時,您可以看到這一點。

對於這個例子,我們決定使用一個相對簡單的提示,受到這個Reddit 帖子的啟發,要求 ChatGPT “創建一個例子,說明如果一篇關於光合作用的短文是由一個 10 歲的孩子寫的,它會是什麼樣子。納入作者可能犯的錯誤。” 結果很瘋狂。這是 GPT-3.5 的看法。

這還不錯,幼稚的語言使用相當令人信服,但這裡那裡也有一些贈品。寫這句話的人一定是一個非常聰明的 10 歲孩子。現在查看 GPT-4:

這是完全不同的情況:存在拼寫錯誤,一些語法問題,總體而言語言的使用更有說服力。雖然它並不完美,但乍一看你會相信你的侄子會寫這個。

這些變化反映在你可能給 GPT-4 的每一個提示中:它的語言使用明顯更好,並且更能更好地捕捉人類語音的細微差別,包括你的語音。雖然您仍然需要小心如何表達提示,但您可以期望以更少的工作獲得更好的輸出。

更好的事實

除了更具創造力之外,GPT-4 也比 GPT-3.5 更值得信賴。當它第一次問世時,GPT 因其自信地吐出完全胡言亂語的傾向而聞名,比如給出不正確的統計數據或搞亂歷史時間線。

當人工智能只是編造一些聽起來似乎合理的東西時,這被稱為幻覺。這就像當你在學校參加考試時,你沒有學習,所以你只是開始隨機寫下一些東西,希望至少其中一些是真實的。

平心而論,隨著人們使用了 GPT-3.5,這些問題已經變得更好了,而且它變得更聰明、更有知識了。儘管如此,你還是會發現它重複了不正確的信息,尤其是當它是一個小眾主題時。它特別容易搞亂物理、數學或計算機編程的高級概念。

不過,GPT-4 甚至更領先。根據技術報告,GPT-4 在這方面比 GPT-3.5 的表現好大約 20%。當然,這並不意味著您應該盲目相信 GPT-4 所說的一切,因為它有時仍然會編造事實。例如,如果您要將其用於學校,您可能需要對其進行事實核查以確保。

拓寬上下文窗口

除了更智能之外,GPT-4 還比 GPT-3.5 擁有更好的“記憶力”。我們將“記憶”放在引號中,因為它並不真正記住事情,而是將提示放入您之前詢問過的內容中。這稱為上下文窗口,即生成式人工智能如何將早期提示中的信息運用到新提示中。

GPT-3.5 在這方面不太擅長。如果您輸入一個提示,然後根據您得到的輸出輸入一個新的提示,它通常會起作用,但只能運行一兩次。距離原始提示多幾步,機器人就會重置,您必須在提示中再次輸入參數。

GPT-4 的上下文窗口要大得多,“記住”更多、時間更長。你把事情搞得越複雜,回憶起你之前問過的問題就越糟糕,但總的來說,在玩了一段時間後,我們不得不說它對我們的提示反應得很好。我們預測它將為頻繁使用它的人們節省大量時間。

可能還有幫助的是,GPT-4 可以處理更多的輸入,每個提示最多 3,000 個單詞。如果您想為其提供示例文本以供使用,並且與擴展的上下文窗口配合使用,那麼這是完美的選擇。

安全

最後,由於其所有改進,GPT-4 比 GPT-3.5“安全”得多。我們所說的更安全是指出現所謂的毒性反應的可能性要小得多,因此涉及令人討厭的種族主義或性別歧視觀點的答案。 

語言模型在這方面的表現相當糟糕:例如,2016 年,微軟的 Tay 聊天機器人在被互聯網不那麼有益的元素教授了一些相當討厭的東西後,在短短幾個小時內就不得不下線。在 Tay 開始鸚鵡學舌地重複白人至上主義的言論並胡言亂語地談論 9/11 襲擊後,這個項目就被取消了。

GPT-3.5 在這方面是一個很大的進步,因為它不會用極端右翼的口號來取悅用戶,但仍然會提出一些你不會在餐桌上提出的主張——至少不會出於禮貌公司。這可能是因為語言模型在幾個月的時間裡訓練的方式。

OpenAI 似乎在訓練方面做得更好,因為 GPT-4 的有毒結果進一步降低,只有大約百分之一的反應被歸類為有毒。這應該使 GPT-4 成為整體上更值得信賴的資源。

什麼時候應該使用 GPT 3.5 與 GPT-4?

雖然 GPT-4 在各方面都更好,但它有兩個瓶頸:它速度較慢,而且它的使用量也有限制。因此,您可能最好只將其用於繁重的提示,即需要大量輸入並因此得出細緻入微的答案的提示。

對於其他一切,GPT-3.5 可能是更好的選擇:答案很快,儘管您可能需要進行更多的事實檢查,但它對於大多數簡單的任務來說足夠可靠。最後,混合和匹配這兩個版本可能會以相對較少的努力為您帶來一些驚人的結果。

Leave a Comment

2025 年十大最佳免費公共 DNS 伺服器

2025 年十大最佳免費公共 DNS 伺服器

發現最佳 DNS 伺服器並了解它們如何透過提供更快、更安全的連線來增強您的瀏覽體驗。

如何:Root Motorola i1(ADB 方法)

如何:Root Motorola i1(ADB 方法)

最後,對於摩托羅拉 i1 用戶來說,好消息來了。 CyanogenMod 論壇的 GotHeart 已經通過

從 Gmail 安裝 Android 應用程式

從 Gmail 安裝 Android 應用程式

您是否收到郵件裡的 APK 文件,卻因為無法直接安裝而不知如何處理?許多開發者

如何變更地圖視圖 - Google 地圖

如何變更地圖視圖 - Google 地圖

Google 地圖提供了多種不同的視圖。對於許多用戶來說,簡化的地圖視圖在導航方面是最好的,但額外的疊加層

線上使用 Skype,無需桌面用戶端

線上使用 Skype,無需桌面用戶端

最近我需要在 Skype 上與一位朋友語音聊天,但又不想下載桌面用戶端。在某些情況下,你

如何:Root T-Mobile HTC G2

如何:Root T-Mobile HTC G2

Root 手機對用戶總是有益的,因為它允許他們完全控制設備的每個角落。據我們所知

如何辨別圖片真偽?使用影像錯誤等級分析器

如何辨別圖片真偽?使用影像錯誤等級分析器

很多時候,當我們面對圖片時,會糾結於它是真品還是經過 Photoshop 處理的假貨。影像錯誤等級分析器(簡稱 ELA)是一款

如何在磁碟模式下自動備份Android手機

如何在磁碟模式下自動備份Android手機

你想讓你的安卓手機在連接電腦時自動備份到本地硬碟嗎?市面上有像 Drive 這樣的工具

最佳 Omegle 替代品:您的新聊天天堂

最佳 Omegle 替代品:您的新聊天天堂

探索 2025 年最佳的 Omegle 替代品,享受安全、有趣和匿名的聊天。透過影片或文字與世界任何地方的新朋友聯繫。

使用 Flash 遊戲播放器在 Android 上玩任何 Flash 遊戲

使用 Flash 遊戲播放器在 Android 上玩任何 Flash 遊戲

你是否曾經想過在 Android 手機上玩 Flash 遊戲,但卻因為手機不支援某些控製而無法實現?現在,你終於可以了。