GPT-3.5 VS GPT-4: เปรียบเทียบบอท AI

OpenAI เพิ่งเปิดตัว GPT-4 ซึ่งเป็น chatbot เวอร์ชันใหม่และปรับปรุงที่ทำให้โลกต้องตกตะลึง อะไรคือความแตกต่างระหว่าง GPT-4 และ GPT-3.5 รุ่นก่อน? ลองเปรียบเทียบ GPT-3.5 กับ GPT-4 แล้วดูว่าจริง ๆ แล้วฉลาดกว่ากันแค่ไหน

ความแตกต่างในทางปฏิบัติ

ก่อนที่เราจะพูดถึงความแตกต่างของประสิทธิภาพ ก่อนอื่นเรามาพูดถึงความแตกต่างที่ใช้งานได้จริงระหว่างสองสิ่งนี้กันก่อน ก่อนอื่น ในขณะที่ทุกคนที่มีการเชื่อมต่ออินเทอร์เน็ตสามารถออนไลน์และใช้ GPT-3.5 ได้ เฉพาะผู้ที่เลือกใช้แผนแบบชำระเงินของ OpenAI (เรียกว่า ChatGPT Plus) เท่านั้นที่จะยุ่งกับ GPT-4 

แผนแบบชำระเงินคือ $20 ต่อเดือน (ก่อนหักภาษี) และไม่เพียงแต่ให้คุณเข้าถึง GPT-4 เท่านั้น แต่ยังให้ลำดับความสำคัญแก่คุณหากเวอร์ชันเก่าประสบปัญหาการโหลดจำนวนมาก นอกจากนี้ยังทำให้คำตอบด้วย GPT-3.5 เร็วขึ้นอีกด้วย เราหมายถึง เร็วกว่า มากเช่นกัน: เมื่อเราชำระเงินแล้วดูเหมือนว่าจะไม่มีการหยุด!

อย่างไรก็ตาม แม้ว่าคุณจะชำระเงิน คุณจะไม่สามารถเข้าถึง GPT-4 ได้ไม่จำกัดเหมือนที่ทำกับ GPT-3.5 แต่คุณจะต้องถามตามจำนวนที่กำหนดเท่านั้น ปัจจุบัน คุณได้รับข้อความแจ้ง 25 ครั้งต่อสามชั่วโมง แต่เนื่องจากข้อจำกัดนี้เปลี่ยนแปลงตลอดเวลา อาจเป็นเพราะเมื่อคุณอ่านข้อความนี้ ข้อจำกัดเหล่านั้นจะหายไป

โปรดทราบว่า GPT-4 ตอบสนองช้ากว่า GPT-3.5 มาก แม้ว่าสิ่งนี้จะมีการเปลี่ยนแปลงในอีกไม่กี่เดือนข้างหน้า แต่ตอนนี้บอทยังต้องใช้เวลาสักพักในการหาคำตอบ ดังนั้นอย่าคาดหวังว่าจะทำอะไรกับมันเร็วเกินไป

GPT-4 ฉลาดขึ้น

ตามที่คุณคาดหวังจากการอัปเกรด GPT-4 นั้นฉลาดกว่า GPT-3.5 มาก จากนี้เราหมายความว่ามันมีความคิดสร้างสรรค์มากขึ้นและเข้าใจสิ่งที่คุณต้องการได้ดีขึ้น รูปแบบภาษา - คิดใหม่ว่าเป็นวิธีการสื่อสารและคำที่เราใช้ - เป็นเพียงปีแสงข้างหน้า คุณสามารถดูสิ่งนี้ได้เมื่อคุณป้อนข้อความแจ้งที่มีความแตกต่างเล็กน้อย

สำหรับตัวอย่างนี้ เราตัดสินใจใช้ข้อความแจ้งที่ค่อนข้างเรียบง่ายซึ่งได้รับแรงบันดาลใจจากเธรด Redditนี้ โดยขอให้ ChatGPT "สร้างตัวอย่างว่าเรียงความสั้นๆ เกี่ยวกับการสังเคราะห์ด้วยแสงจะมีลักษณะอย่างไร หากเขียนโดยเด็กอายุ 10 ขวบ รวมข้อผิดพลาดที่ผู้เขียนจะทำ” ผลลัพธ์เป็นป่า นี่คือสิ่งที่ GPT-3.5 นำมาใช้

มันไม่ได้แย่เกินไป การใช้ภาษาแบบเด็กๆ นั้นค่อนข้างน่าเชื่อ แต่มีของแจกเล็กน้อยที่นี่และที่นั่น น่าจะเป็นเด็ก 10 ขวบที่ฉลาดทีเดียวที่เขียนแบบนั้น ตรวจสอบ GPT-4:

นี่คือหม้อต้มปลาที่แตกต่างไปจากเดิมอย่างสิ้นเชิง: มีการสะกดผิด มีปัญหาด้านไวยากรณ์ และการใช้ภาษาโดยรวมมีความน่าเชื่อถือกว่ามาก แม้จะไม่สมบูรณ์แบบ แต่แวบแรกคุณก็เชื่อว่าหลานชายของคุณจะเขียนสิ่งนี้

การเปลี่ยนแปลงเหล่านี้สะท้อนให้เห็นในทุกข้อความแจ้งที่คุณอาจให้ GPT-4 ได้: การใช้ภาษานั้นค่อนข้างเรียบง่ายและดีกว่ามากในการจับความแตกต่างของคำพูดของมนุษย์ รวมถึงของคุณด้วย ในขณะที่คุณยังต้องระวังวิธีการแสดงข้อความของคุณคุณสามารถคาดหวังผลลัพธ์ที่ดีขึ้นมากโดยทำงานน้อยลง

ข้อเท็จจริงที่ดีกว่า

นอกจากความคิดสร้างสรรค์ที่มากขึ้นแล้ว GPT-4 ยังน่าเชื่อถือกว่า GPT-3.5 เล็กน้อยอีกด้วย เมื่อเปิดตัวครั้งแรก GPT มีชื่อเสียงจากแนวโน้มที่จะพูดพล่อยๆ ด้วยความมั่นใจ เช่น การให้สถิติที่ไม่ถูกต้องหรือทำให้เส้นเวลาในอดีตยุ่งเหยิง

เมื่อ AI สร้างสิ่งที่ฟังดูน่าเชื่อถือขึ้นมาได้ ก็เรียกว่าภาพหลอน มันเหมือนกับเวลาที่คุณสอบในโรงเรียนโดยที่คุณไม่ได้เรียนมา ดังนั้นคุณจึงเริ่มเขียนแบบสุ่มโดยหวังว่าอย่างน้อยบางส่วนจะเป็นจริง

พูดตามตรง ปัญหาเหล่านี้ดีขึ้นเมื่อผู้คนใช้ GPT-3.5 และมันฉลาดขึ้นและมีความรู้มากขึ้น ถึงกระนั้นคุณจะพบว่ามันนกแก้วให้ข้อมูลที่ไม่ถูกต้องโดยเฉพาะอย่างยิ่งหากเป็นเรื่องเฉพาะ โดยเฉพาะอย่างยิ่งมีแนวโน้มที่จะทำให้แนวคิดขั้นสูงจากฟิสิกส์ คณิตศาสตร์ หรือการเขียนโปรแกรมคอมพิวเตอร์สับสน

แม้ว่า GPT-4 จะล้ำหน้าไปกว่านั้น ตามรายงานทางเทคนิค GPT-4 ทำได้ดีกว่า GPT-3.5 ประมาณ 20 เปอร์เซ็นต์ในเรื่องนี้ โดยธรรมชาติแล้ว นี่ไม่ได้หมายความว่าคุณควรเชื่อทุกอย่างที่ GPT-4 พูดอย่างสุ่มสี่สุ่มห้า เพราะบางครั้งมันก็ยังสร้างปัญหาได้ หากคุณกำลังจะนำไปใช้ในโรงเรียนเช่น คุณอาจต้องการตรวจสอบข้อเท็จจริงเพื่อให้แน่ใจ

การขยายหน้าต่างบริบท

นอกจากจะฉลาดกว่าแล้ว GPT-4 ยังมี "หน่วยความจำ" ที่ดีกว่า GPT-3.5 เราใส่คำว่า “memory” ไว้ในเครื่องหมายคำพูดเพราะมันจำสิ่งต่างๆ ไม่ได้จริงๆ แต่ใส่ข้อความแจ้งในบริบทของสิ่งที่คุณถามก่อนหน้านี้ สิ่งนี้เรียกว่าหน้าต่างบริบท ดังนั้น AI เชิงกำเนิดจึงสามารถใช้ข้อมูลจากพรอมต์ก่อนหน้าไปสู่สิ่งใหม่ได้ดีเพียงใด

GPT-3.5 ทำได้ไม่ดีนักในเรื่องนี้ หากคุณป้อนพรอมต์แล้วป้อนใหม่ตามผลลัพธ์ที่คุณได้รับ โดยปกติจะใช้ได้ แต่เพียงครั้งหรือสองครั้งเท่านั้น มากกว่าสองสามขั้นตอนจากข้อความแจ้งเดิม บอทจะรีเซ็ตและคุณจะต้องป้อนพารามิเตอร์อีกครั้งในข้อความแจ้ง

หน้าต่างบริบทของ GPT-4 มีขนาดใหญ่กว่ามาก "จดจำ" ได้มากขึ้นและนานขึ้น ยิ่งคุณทำสิ่งต่าง ๆ ซับซ้อนมากเท่าไหร่ การเรียกคืนสิ่งที่คุณถามก่อนหน้านี้ก็จะยิ่งแย่ลงเท่านั้น แต่โดยรวมแล้วหลังจากลองเล่นไปสักระยะ เราต้องบอกว่ามันตอบสนองต่อคำสั่งของเราได้ค่อนข้างดี เราคาดการณ์ว่าจะช่วยประหยัดเวลาให้กับผู้ที่ใช้งานอย่างหนัก

สิ่งที่น่าจะช่วยได้ก็คือ GPT-4 สามารถจัดการอินพุตได้มากขึ้น มากถึง 3,000 คำต่อพรอมต์ เหมาะอย่างยิ่งหากคุณต้องการป้อนข้อความตัวอย่างเพื่อใช้งานและทำงานร่วมกับหน้าต่างบริบทที่กว้างขึ้น

ความปลอดภัย

สุดท้าย เนื่องจากการปรับปรุงทั้งหมด GPT-4 จึง "ปลอดภัย" กว่า GPT-3.5 มาก ถ้าปลอดภัยกว่า เราหมายความว่ามีโอกาสน้อยลงมากที่จะได้รับการตอบกลับที่เป็นพิษ ดังนั้นคำตอบที่เกี่ยวข้องกับความคิดเห็นเหยียดผิวหรือเหยียดเพศที่น่ารังเกียจ 

แบบจำลองภาษามีประสิทธิภาพที่ค่อนข้างแย่ในเรื่องนี้ เช่น ในปี 2559 แชทบอท Tay ของ Microsoft ต้องออฟไลน์ในเวลาไม่กี่ชั่วโมงหลังจากได้รับการสอนสิ่งที่น่ารังเกียจบางอย่างจากองค์ประกอบที่มีประโยชน์น้อยกว่าของอินเทอร์เน็ต ปลั๊กถูกดึงออกหลังจากที่เทย์เริ่มพูดพล่ามประเด็นคนผิวขาวที่มีอำนาจสูงสุดและพูดเรื่องไร้สาระเกี่ยวกับการโจมตี 9/11

GPT-3.5 เป็นการปรับปรุงครั้งใหญ่ในเรื่องนี้ เนื่องจากจะไม่สร้างความตื่นเต้นให้กับผู้ใช้ด้วยคำขวัญฝ่ายขวาสุดโต่ง แต่ก็ยังมีข้ออ้างว่าคุณไม่ควรหยิบยกขึ้นมาร่วมโต๊ะอาหารค่ำ อย่างน้อยที่สุดก็ไม่สุภาพ บริษัท. อาจเป็นเพราะวิธีการฝึกโมเดลภาษาในช่วงหลายเดือน

ดูเหมือนว่า OpenAI จะทำได้ดียิ่งขึ้นในการฝึกอบรม เนื่องจากผลลัพธ์ที่เป็นพิษของ GPT-4 นั้นลดลงไปอีก โดยมีเพียง 1 เปอร์เซ็นต์ของการตอบสนองเท่านั้นที่ถูกจัดประเภทว่าเป็นพิษ สิ่งนี้น่าจะทำให้ GPT-4 เป็นทรัพยากรโดยรวมที่น่าเชื่อถือมากขึ้น

เมื่อใดที่คุณควรใช้ GPT 3.5 กับ GPT-4

แม้ว่า GPT-4 จะดีกว่ามากในทุกๆ ด้าน แต่ก็มาพร้อมกับคอขวด 2 อัน: ช้ากว่าและยังมีขีดจำกัดว่าคุณจะใช้มันได้มากแค่ไหน ด้วยเหตุนี้ คุณน่าจะเหมาะที่สุดที่จะใช้เฉพาะกับข้อความแจ้งที่ใช้งานหนัก ซึ่งเป็นข้อความที่ต้องใช้ข้อมูลจำนวนมาก และด้วยเหตุนี้จึงได้คำตอบที่เหมาะสมยิ่ง

สำหรับอย่างอื่น GPT-3.5 น่าจะเป็นตัวเลือกที่ดีกว่า: คำตอบมาอย่างรวดเร็วและแม้ว่าคุณอาจต้องทำการตรวจสอบข้อเท็จจริงอีกเล็กน้อย แต่ก็เชื่อถือได้เพียงพอสำหรับงานง่ายๆ ส่วนใหญ่ ท้ายที่สุดแล้ว การมิกซ์แอนด์แมตช์ทั้งสองเวอร์ชันอาจทำให้คุณได้ผลลัพธ์ที่น่าทึ่งโดยใช้ความพยายามเพียงเล็กน้อย

Leave a Comment

Google Docs คืออะไร & วิธีใช้ประโยชน์สูงสุดจากมัน

Google Docs คืออะไร & วิธีใช้ประโยชน์สูงสุดจากมัน

Google เอกสารคืออะไร โปรแกรมประมวลผลคำออนไลน์ฟรีนี้เหมาะสำหรับการใช้งานส่วนตัวและเพื่อธุรกิจ การทำงานร่วมกันแบบเรียลไทม์ทำให้แอปนี้แตกต่างจากแอปอื่นๆ ทั้งหมด

วิธีเปลี่ยนชื่อบน Zoom จากเว็บ พีซี และโทรศัพท์

วิธีเปลี่ยนชื่อบน Zoom จากเว็บ พีซี และโทรศัพท์

อ่านโพสต์นี้เพื่อเรียนรู้วิธีการเปลี่ยนชื่อใน Zoom บนเว็บ เดสก์ท็อป และอุปกรณ์เคลื่อนที่

วิธีเปิดโหมดไม่ระบุตัวตนใน Chrome, Edge, Firefox, Safari และ Opera

วิธีเปิดโหมดไม่ระบุตัวตนใน Chrome, Edge, Firefox, Safari และ Opera

โหมดไม่ระบุตัวตนป้องกันไม่ให้เบราว์เซอร์บันทึกข้อมูลเซสชัน เรียนรู้วิธีเปิดโหมดไม่ระบุตัวตนใน Chrome, Edge, Firefox, Safari และ Opera

วิธีเปลี่ยนสีไฮไลท์ใน Adobe Acrobat Reader DC

วิธีเปลี่ยนสีไฮไลท์ใน Adobe Acrobat Reader DC

คุณจำเป็นต้องเน้นข้อความบางข้อความในไฟล์ PDF หรือไม่? เรียนรู้วิธีเปลี่ยนสีไฮไลท์ใน Adobe Reader เพื่อทำเครื่องหมายเนื้อหาที่น่าสนใจ

Favicon คืออะไร? คู่มือขั้นสูงสำหรับนักออกแบบเว็บไซต์

Favicon คืออะไร? คู่มือขั้นสูงสำหรับนักออกแบบเว็บไซต์

คุณเป็นเจ้าของไซต์หรือนักออกแบบที่ต้องการเพิ่มมูลค่าแบรนด์หรือไม่? คุณต้องอ่านคำแนะนำที่ดีที่สุดนี้เกี่ยวกับสิ่งที่เป็น favicon เพื่อเริ่มต้นใช้งาน

คุณสามารถใช้ AI เพื่อปรับปรุงการเขียนของคุณได้อย่างไร

คุณสามารถใช้ AI เพื่อปรับปรุงการเขียนของคุณได้อย่างไร

เราแสดงให้คุณเห็น 5 วิธีหลักๆ ที่คุณสามารถใช้ ChatGPT เพื่อพัฒนาทักษะการเขียนของคุณเองโดยไม่ลดทอนความซื่อสัตย์ในฐานะนักเขียน

RGB หมายถึงอะไรและทำงานอย่างไร

RGB หมายถึงอะไรและทำงานอย่างไร

หากคุณเป็นเกมเมอร์สายดีไซน์เนอร์ คุณอาจเจอคำว่า RGB อยู่บ่อยครั้ง อ่านบล็อกนี้เพื่อทราบว่า RGB ย่อมาจากอะไร

วิธียกเลิกการส่งอีเมลใน Gmail

วิธียกเลิกการส่งอีเมลใน Gmail

ส่งอีเมลผิดพลาดใน Gmail และต้องการเรียกคืนหรือไม่ คุณต้องเรียนรู้วิธียกเลิกการส่งอีเมลใน Gmail โดยอ่านบทความสั้นๆ นี้

Snap Score ทำงานอย่างไร: รู้ว่าฟีเจอร์นี้ทำงา��อย่างไร

Snap Score ทำงานอย่างไร: รู้ว่าฟีเจอร์นี้ทำงา��อย่างไร

หากคุณเป็นผู้ใช้ Snapchat คุณควรทราบเกี่ยวกับคะแนนสแน็ปและวิธีการทำงาน รู้ว่า snap score ทำงานอย่างไรโดยอ่านบล็อกนี้

การทดสอบ UX ที่ขับเคลื่อนด้วย AI: ประโยชน์และแนวทางปฏิบัติที่ดีที่สุด

การทดสอบ UX ที่ขับเคลื่อนด้วย AI: ประโยชน์และแนวทางปฏิบัติที่ดีที่สุด

คุณเป็นผู้เชี่ยวชาญ UX และพยายามเรียนรู้ประโยชน์การทดสอบ UX ที่ขับเคลื่อนด้วย AI และแนวทางปฏิบัติที่ดีที่สุดหรือไม่? ตรวจสอบบทความนี้