GPT-3.5 VS GPT-4:比較 AI 機器人

OpenAI 最近推出了 GPT-4,這是席捲全球的聊天機器人的新改進版本。那麼 GPT-4 和它的前身 GPT-3.5 有什麼區別呢?讓我們比較一下 GPT-3.5 和 GPT-4,看看它到底聰明了多少。

實際差異

不過,在討論性能差異之前,首先讓我們回顧一下兩者之間的一些實際差異。首先,雖然任何有互聯網連接的人都可以上網並使用 GPT-3.5,但只有選擇 OpenAI 付費計劃(稱為 ChatGPT Plus)的人才能使用 GPT-4。 

付費計劃為每月 20 美元(稅前),不僅可以讓您訪問 GPT-4,如果舊版本負載過重,它還可以為您提供優先權。它還使得 GPT-3.5 的答案更快。我們的意思也確實是更快:一旦我們付了錢,就好像沒有辦法阻止它!

但是,即使您付費,您也無法像使用 GPT-3.5 那樣無限制地訪問 GPT-4。相反,您只需詢問它一定數量的提示。目前,您每三小時會收到 25 條提示,但由於此限制不斷變化,因此當您閱讀本文時,這些限制可能已經消失。

另請注意,GPT-4 的響應速度比 GPT-3.5 慢很多。儘管這種情況可能會在未來幾個月內發生變化,但目前機器人需要一段時間才能得出答案,因此不要指望用它做任何事情太快。

GPT-4 更智能

正如您對升級所期望的那樣,GPT-4 只是比 GPT-3.5 聰明得多。我們的意思是它更有創意,更能理解你想要什麼。它的語言模型——將其重新思考為我們交流的方式和我們使用的詞語——僅領先數光年。當您向它提供有一些細微差別的提示時,您可以看到這一點。

對於這個例子,我們決定使用一個相對簡單的提示,受到這個Reddit 帖子的啟發,要求 ChatGPT “創建一個例子,說明如果一篇關於光合作用的短文是由一個 10 歲的孩子寫的,它會是什麼樣子。納入作者可能犯的錯誤。” 結果很瘋狂。這是 GPT-3.5 的看法。

這還不錯,幼稚的語言使用相當令人信服,但這裡那裡也有一些贈品。寫這句話的人一定是一個非常聰明的 10 歲孩子。現在查看 GPT-4:

這是完全不同的情況:存在拼寫錯誤,一些語法問題,總體而言語言的使用更有說服力。雖然它並不完美,但乍一看你會相信你的侄子會寫這個。

這些變化反映在你可能給 GPT-4 的每一個提示中:它的語言使用明顯更好,並且更能更好地捕捉人類語音的細微差別,包括你的語音。雖然您仍然需要小心如何表達提示,但您可以期望以更少的工作獲得更好的輸出。

更好的事實

除了更具創造力之外,GPT-4 也比 GPT-3.5 更值得信賴。當它第一次問世時,GPT 因其自信地吐出完全胡言亂語的傾向而聞名,比如給出不正確的統計數據或搞亂歷史時間線。

當人工智能只是編造一些聽起來似乎合理的東西時,這被稱為幻覺。這就像當你在學校參加考試時,你沒有學習,所以你只是開始隨機寫下一些東西,希望至少其中一些是真實的。

平心而論,隨著人們使用了 GPT-3.5,這些問題已經變得更好了,而且它變得更聰明、更有知識了。儘管如此,你還是會發現它重複了不正確的信息,尤其是當它是一個小眾主題時。它特別容易搞亂物理、數學或計算機編程的高級概念。

不過,GPT-4 甚至更領先。根據技術報告,GPT-4 在這方面比 GPT-3.5 的表現好大約 20%。當然,這並不意味著您應該盲目相信 GPT-4 所說的一切,因為它有時仍然會編造事實。例如,如果您要將其用於學校,您可能需要對其進行事實核查以確保。

拓寬上下文窗口

除了更智能之外,GPT-4 還比 GPT-3.5 擁有更好的“記憶力”。我們將“記憶”放在引號中,因為它並不真正記住事情,而是將提示放入您之前詢問過的內容中。這稱為上下文窗口,即生成式人工智能如何將早期提示中的信息運用到新提示中。

GPT-3.5 在這方面不太擅長。如果您輸入一個提示,然後根據您得到的輸出輸入一個新的提示,它通常會起作用,但只能運行一兩次。距離原始提示多幾步,機器人就會重置,您必須在提示中再次輸入參數。

GPT-4 的上下文窗口要大得多,“記住”更多、時間更長。你把事情搞得越複雜,回憶起你之前問過的問題就越糟糕,但總的來說,在玩了一段時間後,我們不得不說它對我們的提示反應得很好。我們預測它將為頻繁使用它的人們節省大量時間。

可能還有幫助的是,GPT-4 可以處理更多的輸入,每個提示最多 3,000 個單詞。如果您想為其提供示例文本以供使用,並且與擴展的上下文窗口配合使用,那麼這是完美的選擇。

安全

最後,由於其所有改進,GPT-4 比 GPT-3.5“安全”得多。我們所說的更安全是指出現所謂的毒性反應的可能性要小得多,因此涉及令人討厭的種族主義或性別歧視觀點的答案。 

語言模型在這方面的表現相當糟糕:例如,2016 年,微軟的 Tay 聊天機器人在被互聯網不那麼有益的元素教授了一些相當討厭的東西後,在短短幾個小時內就不得不下線。在 Tay 開始鸚鵡學舌地重複白人至上主義的言論並胡言亂語地談論 9/11 襲擊後,這個項目就被取消了。

GPT-3.5 在這方面是一個很大的進步,因為它不會用極端右翼的口號來取悅用戶,但仍然會提出一些你不會在餐桌上提出的主張——至少不會出於禮貌公司。這可能是因為語言模型在幾個月的時間裡訓練的方式。

OpenAI 似乎在訓練方面做得更好,因為 GPT-4 的有毒結果進一步降低,只有大約百分之一的反應被歸類為有毒。這應該使 GPT-4 成為整體上更值得信賴的資源。

什麼時候應該使用 GPT 3.5 與 GPT-4?

雖然 GPT-4 在各方面都更好,但它有兩個瓶頸:它速度較慢,而且它的使用量也有限制。因此,您可能最好只將其用於繁重的提示,即需要大量輸入並因此得出細緻入微的答案的提示。

對於其他一切,GPT-3.5 可能是更好的選擇:答案很快,儘管您可能需要進行更多的事實檢查,但它對於大多數簡單的任務來說足夠可靠。最後,混合和匹配這兩個版本可能會以相對較少的努力為您帶來一些驚人的結果。

Leave a Comment

易趣安全嗎?15 種 eBay 詐騙以及如何避免

易趣安全嗎?15 種 eBay 詐騙以及如何避免

eBay 是美國最受歡迎的電子商務公司。這也恰好是詐騙者最喜歡的地方。學習如何保護自己!

如何使用 CapCut 3D Zoom 在您的照片中添加 TikTok 3D 趨勢

如何使用 CapCut 3D Zoom 在您的照片中添加 TikTok 3D 趨勢

TikTok 3D 照片效果正在流行。如果您也想將相同的內容添加到 TikTok 內容中,您需要學習 CapCut 3D 縮放樣式。

2023 年免費電影下載的 7 個最值得信賴的網站

2023 年免費電影下載的 7 個最值得信賴的網站

想要安全地免費下載和流媒體電影嗎?我們找到了 7 個值得信賴的合法網站供您免費觀看電影。無需擔心惡意軟件或病毒

RGB 代表什麼及其工作原理

RGB 代表什麼及其工作原理

如果你是一名設計師玩家,你可能經常會遇到RGB這個詞。閱讀此博客了解 RGB 代表什麼。

什麼是運動潮?

什麼是運動潮?

Sportsurge 為世界各地的球迷提供了觀看他們喜愛的球隊和球員在各種聯賽和比賽中比賽的機會。以下是如何使用 Sportsurge,看看它是否真的合法,以及它與其他平台的比較。

如何在 Reddit 上獲得 Karma

如何在 Reddit 上獲得 Karma

如果你想提高 Reddit 上的聲譽,你的個人資料上需要有很多業力點。了解在 Reddit 上獲取 Karma 的簡單方法。

如何在 Android 或 iPhone 上更改 Snapchat 用戶名

如何在 Android 或 iPhone 上更改 Snapchat 用戶名

您想知道如何更改 Snapchat 用戶名嗎?閱讀這篇文章,了解在 Snapchat 上更改用戶名的具體方法。

清除緩存有什麼作用?

清除緩存有什麼作用?

清除緩存會刪除臨時數據,例如您的輸入、圖像、字體等。但這樣做的作用還不止於此。在這裡檢查原因

如何獲取 Microsoft Teams 計算機範圍的安裝程序

如何獲取 Microsoft Teams 計算機範圍的安裝程序

Microsoft Teams 可供個人免費使用。然而,它最常被組織使用。一個

如何在團隊中離開辦公室(完整指南)

如何在團隊中離開辦公室(完整指南)

有 2 種簡單的方法可以讓您離開 Teams 辦公室,以便您的同事知道您不在。一種是通過點擊您的個人資料圖片