ส่งอีเมลถึงผู้เขียน
You can use this page to email Afshine Amidi, Shervine Amidi, Charin และ Bodin Ponvilawan about Super Study Guide: ตัวแปลงและแบบจำลองภาษาขนาดใหญ่.
เกี่ยวกับหนังสือ
หนังสือเล่มนี้เป็นคู่มือฉบับกระชับพร้อมภาพประกอบ สำหรับผู้ที่อยากเข้าใจการทำงานภายในของแบบจำลองภาษาขนาดใหญ่ ในบริบทการสัมภาษณ์ ทำโครงการ หรือเพื่อสนองตอบความใคร่รู้ของตนเอง
หนังสือเล่มนี้แบ่งออกเป็น 5 ส่วน:
- พื้นฐาน: ปูพื้นฐานเรื่องโครงข่ายประสาท และแนวคิดสำคัญต่างๆเกี่ยวกับการเรียนรู้เชิงลึก สำหรับการฝึก ประเมิน และทดสอบ
- การฝังตัว: ขั้นตอนวิธีตัดโทเคนแบบต่างๆ, การฝังคำ (word2vec), และการฝังประโยค (RNN, LSTM, GRU)
- ตัวแปลง: แรงจูงใจเบื้องหลังกลไกเพ่งตนของตัวแปลง, ภาพรวมอย่างละเอียดของสถาปัตยกรรมแบบตัวเข้ารหัส-ตัวถอดรหัส, และแบบจำลองระดับหมุดหมายสำคัญต่างๆที่เกี่ยวข้อง เช่น BERT, GPT, และ T5
- แบบจำลองภาษาขนาดใหญ่: แบบจำลองอิงตัวแปลงต่างๆที่บรรลุผลระดับแนวหน้า, เคล็ดลับด้านวิศวกรรมคำบอก รวมถึงวิธีปรับแบบจำลองเหล่านั้นด้วยการปรับละเอียด (SFT, PEFT) และการปรับความประสงค์ (RLHF, DPO)
- การประยุกต์ใช้: การสกัดความรู้สึก, การแปลด้วยเครื่อง, การสรุปความ, การสร้างแบบเสริมค้นคืน และอื่นๆอีกมาก
เกี่ยวกับผู้เขียน
Afshine Amidi is currently teaching the Transformers & Large Language Models workshop at Stanford and is also leading LLM efforts at Netflix. Previously, he worked on the Gemini team at Google and used NLP techniques to solve complex queries. Before that, he worked at Uber Eats to improve the quality of the search and recommendation systems. On the side, Afshine published a few papers at the intersection of deep learning and computational biology. He holds a Bachelor’s and a Master’s Degree from École Centrale Paris and a Master’s Degree from MIT.
Shervine Amidi is currently teaching the Transformers & Large Language Models workshop at Stanford and is also working on the Gemini team at Google to leverage LLMs for action-based queries. Previously, he worked on applied machine learning problems for recommender systems at Uber Eats where he focused on representation learning to better surface dish recommendations. On the side, Shervine published a few papers at the intersection of deep learning and computational biology. He holds a Bachelor’s and a Master’s Degree from École Centrale Paris and a Master’s Degree from Stanford University.